import requests
from bs4 import BeautifulSoup
url = "https://play.google.com/store/movies/top"
# 구글 무비 접속 시 해당 국가에 따라 다른 정보가 보여지므로 아래와 같이 헤더 정보에 국가 정보를 넣어 준다.
headers = {
"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.135 Safari/537.36"
,"Accept-Language":"ko-KR,ko"
}
res = requests.get(url, headers = headers)
res.raise_for_status()
soup = BeautifulSoup(res.text, "lxml")
movies = soup.find_all("div", attrs={"class":"ImZGtf mpg5gc"})
print(len(movies))
# with open("movie.html", "w", encoding="utf8") as f:
# f.write(res.text)
# f.write(soup.prettify()) # html 문서를 예쁘게 출력
for movie in movies:
title = movie.find("div", attrs={"class":"WsMG1c nnK0zc"}).get_text()
print(title)
10
반도
강철비2 정상회담
베놈 Venom
날씨의 아이 (자막)
1917
기생충
어벤져스 : 엔드게임 (자막판)
#살아있다
겨울왕국 2 (자막판)
블러드샷
[파이썬 웹 스크래핑] Headless 정보 처리 - 13 (0) | 2020.09.11 |
---|---|
[파이썬 웹 스크래핑] 구글 무비 (반응형 스크롤) - 12 (0) | 2020.09.10 |
[파이썬 웹 스크래핑] selenium - 네이버 항공권 예매 - 10 (1) | 2020.09.08 |
[파이썬 웹 스크래핑] selenium - 네이버 로그인 - 9 (0) | 2020.09.07 |
[파이썬 웹 스크래핑] selenium 명령어 TERMINAL 창에서 실행 - 8 (0) | 2020.09.06 |
댓글 영역