from selenium import webdriver
browser = webdriver.Chrome()
browser.maximize_window()
# 페이지 이동
url = "https://play.google.com/store/movies/top"
browser.get(url)
# 스크롤 내리기
# 모니터(해상도) 높이인 1440 위치로 스크롤 내리기
# browser.execute_script("window.scrollTo(0, 1440)") # 2560 X 1440
# browser.execute_script("window.scrollTo(0, 2880)") # 2560 X 1440
# 화면 가장 아래로 스크롤 내리기
browser.execute_script("window.scrollTo(0, document.body.scrollHeight)")
import time
interval = 2 # 2초에 한번씩 스크롤 내림
# 현재 문서 높이를 가져와서 저장
prev_height = browser.execute_script("return document.body.scrollheght")
# 반복 수행
while True:
# 스크롤을 가장 아래로 내림
browser.execute_script("window.scrollTo(0, document.body.scrollHeight)")
# 페이지 로딩 대기
time.sleep(interval)
# 현재 문서 높이를 가져와서 저장
curr_height = browser.execute_script("return document.body.scrollheght")
if curr_height == prev_height:
break
prev_height = curr_height
print("스크롤 완료")
import requests
from bs4 import BeautifulSoup
soup = BeautifulSoup(browser.page_source, "lxml")
# movies = soup.find_all("div", attrs={"class":["ImZGtf mpg5gc", "Vpfmgd"]})
movies = soup.find_all("div", attrs={"class":"Vpfmgd"})
print(len(movies))
for movie in movies:
title = movie.find("div", attrs={"class":"WsMG1c nnK0zc"}).get_text()
# 활인 전 가격
original_price = movie.find("span", attrs={"class":"SUZt4c djCuy"})
if original_price:
original_price = original_price.get_text()
else:
# print(title, "활인되지 않은 영화 제외")
continue
# 활인된 가격
price = movie.find("span", attrs={"class", "VfPpfd ZdBevf i5DZme"}).get_text()
# 링크
link = movie.find("a", attrs={"class":"JC71ub"})["href"]
# "https://play.google.com" + link
print(f"제목 : {title}")
print(f"할인 전 가격 : {original_price}")
print(f"할인 후 가격 : {price}")
print("링크 : " + "https://play.google.com" + link)
print("-" * 100)
browser.quit()
제목 : 베놈 Venom
할인 전 가격 : ₩1,800
할인 후 가격 : ₩900
링크 : https://play.google.com/store/movies/details/%EB%B2%A0%EB%86%88_Venom?id=uEv-FGwTDEw
----------------------------------------------------------------------------------------------------
제목 : 블러드샷
할인 전 가격 : ₩3,500
할인 후 가격 : ₩1,800
링크 : https://play.google.com/store/movies/details/%EB%B8%94%EB%9F%AC%EB%93%9C%EC%83%B7?id=xu4ldemoFN4.P
----------------------------------------------------------------------------------------------------
제목 : 온워드: 단 하루의 기적
할인 전 가격 : ₩20,900
할인 후 가격 : ₩10,900
링크 : https://play.google.com/store/movies/details/%EC%98%A8%EC%9B%8C%EB%93%9C_%EB%8B%A8_%ED%95%98%EB%A3%A8%EC%9D%98_%EA%B8%B0%EC%A0%81?id=fCwq2DL1fDY.P
----------------------------------------------------------------------------------------------------
할인 전 가격 : ₩1,800
할인 후 가격 : ₩1,000
링크 : https://play.google.com/store/movies/details/%EB%8B%A5%ED%84%B0_%EB%91%90%EB%A6%AC%ED%8B%80?id=LrHBeN3LMgw.P
----------------------------------------------------------------------------------------------------
제목 : 콜 오브 와일드
할인 전 가격 : ₩4,500
할인 후 가격 : ₩2,500
링크 : https://play.google.com/store/movies/details/%EC%BD%9C_%EC%98%A4%EB%B8%8C_%EC%99%80%EC%9D%BC%EB%93%9C?id=SjyZR7ruUGw.P
----------------------------------------------------------------------------------------------------
제목 : 밤쉘: 세상을 바꾼 폭탄선언
할인 전 가격 : ₩10,000
----------------------------------------------------------------------------------------------------
제목 : 조조 래빗 A%BE%BC_%ED%8F%AD%ED%83%84%EC%84%A0%EC%96%B8?id=pAKn6PuNY4M.P
할인 전 가격 : ₩4,500
할인 후 가격 : ₩2,500
링크 : https://play.google.com/store/movies/details/%EC%A1%B0%EC%A1%B0_%EB%9E%98%EB%B9%97?id=gMv4o5poB1o.P
----------------------------------------------------------------------------------------------------
제목 : 장난스런 키스
할인 전 가격 : ₩2,500
할인 후 가격 : ₩1,200
링크 : https://play.google.com/store/movies/details/%EC%9E%A5%EB%82%9C%EC%8A%A4%EB%9F%B0_%ED%82%A4%EC%8A%A4?id=MiR3ISA2PX8.P
---------------------------------------------------------------------------------------------------- =MiR3ISA2PX8.P
제목 : 바이스
할인 전 가격 : ₩2,500
할인 후 가격 : ₩1,000
링크 : https://play.google.com/store/movies/details/%EB%B0%94%EC%9D%B4%EC%8A%A4?id=hxddvtCgplw.P
[파이썬 웹 스크래핑] 다음에서 부동산 매물 정보 받아오기 - 13 (0) | 2020.09.12 |
---|---|
[파이썬 웹 스크래핑] Headless 정보 처리 - 13 (0) | 2020.09.11 |
[파이썬 웹 스크래핑] 구글 무비 (동적 랭귀지) - 11 (0) | 2020.09.09 |
[파이썬 웹 스크래핑] selenium - 네이버 항공권 예매 - 10 (1) | 2020.09.08 |
[파이썬 웹 스크래핑] selenium - 네이버 로그인 - 9 (0) | 2020.09.07 |
댓글 영역