[파이썬 웹 스크래핑] Beautifulsoup4 (네이버 웹툰)

[파이썬 웹 스크래핑] Beautifulsoup4 (네이버 웹툰) - 1

프로그래밍 언어/웹 스크래핑

by 별을 보는 사람 2020. 8. 29. 07:00

# beautifulsoup4 설치 : pip install beautifulsoup4
# lxml 설치 : pip install lxml

import requests
from bs4 import BeautifulSoup

url = "https://comic.naver.com/webtoon/weekday.nhn"
res = requests.get(url)
res.raise_for_status()

soup = BeautifulSoup(res.text, "lxml")
# print(soup.title)
# print(soup.title.get_text())
# print(soup.a) # soup 객체에서 처음 발견되는 a element 출력
# print(soup.a.attrs) # a element 의 속성 정보를 출력
# print(soup.a["href"]) # a element 의 href 속성 '값' 정보를 출력

# print(soup.find("a", attrs={"class":"Nbtn_upload"})) # class="Nbtn_uplaod" 인 a element 를 찾아줘
# print(soup.find(attrs={"class":"Nbtn_upload"})) # class="Nbtn_uplaod" 인 어떤 element 를 찾아줘

# print(soup.find("li", attrs={"class":"rank01"}))
rank1 = soup.find("li", attrs={"class":"rank01"})
print(rank1.a)

'프로그래밍 언어 > 웹 스크래핑' 카테고리의 다른 글

[파이썬 웹 스크래핑] Beautifulsoup4 (네이버 웹툰) - 3 (0)	2020.09.01
[파이썬 웹 스크래핑] Beautifulsoup4 (네이버 웹툰) - 2 (0)	2020.08.31
[파이썬 웹 스크래핑] User Agent (0)	2020.08.28
[파이썬 웹 스크래핑] request 모듈 (0)	2020.08.26
[파이썬 웹 스크래핑] 기본 정규식 (0)	2020.08.26