상세 컨텐츠

본문 제목

[파이썬 웹 스크래핑] Beautifulsoup4 (네이버 웹툰) - 4

프로그래밍 언어/웹 스크래핑

by 별을 보는 사람 2020. 9. 2. 07:00

본문

반응형
# beautifulsoup4 설치 : pip install beautifulsoup4
# lxml 설치 : pip install lxml
# beautifulsoup 참고 사이트 : https://www.crummy.com/software/BeautifulSoup/bs4/doc.ko/

import requests
from bs4 import BeautifulSoup

# url = "https://comic.naver.com/webtoon/weekday.nhn"
url = "https://comic.naver.com/webtoon/list.nhn?titleId=733766&weekday=mon"
res = requests.get(url)
res.raise_for_status()

soup = BeautifulSoup(res.text, "lxml")

 

 

# cartoons = soup.find_all("td", attrs={"class":"title"})
# title = cartoons[0].a.get_text()
# link = cartoons[0].a["href"]
# print(title)
# print("https://comic.naver.com" + link)

# 만화 제목 + 링크 가져오기
# for cartoon in cartoons:
#     title = cartoon.a.get_text()
#     link = "https://comic.naver.com" + cartoon.a["href"]
#     print(title, link)

 

# 평점 구하기
# total_rates = 0
# cartoons = soup.find_all("div", attrs={"class":"rating_type"})
# for cartoon in cartoons:
#     rate = cartoon.find("strong").get_text()
#     print(rate)
#     total_rates += float(rate)
# print("전체 점수 : ", total_rates)
# print("평균 점수 : ", total_rates / len(cartoons))
반응형

관련글 더보기

댓글 영역