상세 컨텐츠

본문 제목

[파이썬 웹 스크래핑] Beautifulsoup4 (네이버 웹툰) - 1

프로그래밍 언어/웹 스크래핑

by 별을 보는 사람 2020. 8. 29. 07:00

본문

반응형
# beautifulsoup4 설치 : pip install beautifulsoup4
# lxml 설치 : pip install lxml

import requests
from bs4 import BeautifulSoup

url = "https://comic.naver.com/webtoon/weekday.nhn"
res = requests.get(url)
res.raise_for_status()

soup = BeautifulSoup(res.text, "lxml")
# print(soup.title)
# print(soup.title.get_text())
# print(soup.a) # soup 객체에서 처음 발견되는 a element 출력
# print(soup.a.attrs) # a element 의 속성 정보를 출력
# print(soup.a["href"]) # a element 의 href 속성 '값' 정보를 출력

# print(soup.find("a", attrs={"class":"Nbtn_upload"})) # class="Nbtn_uplaod" 인 a element 를 찾아줘
# print(soup.find(attrs={"class":"Nbtn_upload"})) # class="Nbtn_uplaod" 인 어떤 element 를 찾아줘

# print(soup.find("li", attrs={"class":"rank01"}))
rank1 = soup.find("li", attrs={"class":"rank01"})
print(rank1.a)
반응형

관련글 더보기

댓글 영역