상세 컨텐츠

본문 제목

[파이썬 웹 스크래핑] 구글 무비 (동적 랭귀지) - 11

프로그래밍 언어/웹 스크래핑

by 별을 보는 사람 2020. 9. 9. 07:00

본문

반응형
import requests
from bs4 import BeautifulSoup

url = "https://play.google.com/store/movies/top"

 # 구글 무비 접속 시 해당 국가에 따라 다른 정보가 보여지므로 아래와 같이 헤더 정보에 국가 정보를 넣어 준다.
headers = {
            "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.135 Safari/537.36"
           ,"Accept-Language":"ko-KR,ko"
            }

res = requests.get(url, headers = headers)
res.raise_for_status()
soup = BeautifulSoup(res.text, "lxml")

movies = soup.find_all("div", attrs={"class":"ImZGtf mpg5gc"})
print(len(movies))

# with open("movie.html", "w", encoding="utf8") as f:
    # f.write(res.text)
    # f.write(soup.prettify()) # html 문서를 예쁘게 출력

for movie in movies:
    title = movie.find("div", attrs={"class":"WsMG1c nnK0zc"}).get_text()
    print(title)

 

10
반도
강철비2 정상회담
베놈   Venom
날씨의 아이 (자막)
1917
기생충
어벤져스 : 엔드게임 (자막판)
#살아있다
겨울왕국 2 (자막판)
블러드샷

 

반응형

관련글 더보기

댓글 영역