import requests
from bs4 import BeautifulSoup
def create_soup(url):
res = requests.get(url)
res.raise_for_status()
soup = BeautifulSoup(res.text, "lxml")
return soup
def scrape_headline_news():
print("[헤드라인 뉴스]")
url = "https://news.naver.com/"
soup = create_soup(url)
news_list = soup.find("ul", attrs={"class":"hdline_article_list"}).find_all("li", limit=3)
for index, news in enumerate(news_list):
title = news.find("a").get_text().strip()
link = url + news.find("a")["href"]
print("{}. {}".format(index + 1, title))
print(" (링크 : {}".format(link))
print()
if __name__ == "__main__":
scrape_headline_news() # 네이버 헤드라인 뉴스 3개 가져오기
<결과값>
[헤드라인 뉴스]
1. "트럼프, 북한과 전쟁 직전 갔었다…ICBM 발사시 큰 문제"(종합)
(링크 : https://news.naver.com//main/read.nhn?mode=LSD&mid=shm&sid1=100&oid=001&aid=0011878499
2. 한·미 훈련 취소 안 해 매우 불쾌…한국군, 우리 상대 안 돼
(링크 : https://news.naver.com//main/read.nhn?mode=LSD&mid=shm&sid1=100&oid=032&aid=0003032169
3. 의대 본과 4학년 “단체행동 잠정 유보”…정부 “국시 추가 응시 불가”
(링크 : https://news.naver.com//main/read.nhn?mode=LSD&mid=shm&sid1=102&oid=032&aid=0003032173
[파이썬 웹 스크래핑] 해커스 어학원 오늘의 회화 가져오기 - 17 (0) | 2020.09.16 |
---|---|
[파이썬 웹 스크래핑] 네이버 IT 뉴스 가져오기 - 16 (0) | 2020.09.15 |
[파이썬 웹 스크래핑] 네이버 날씨 정보 가져오기 - 14 (0) | 2020.09.13 |
[파이썬 웹 스크래핑] 다음에서 부동산 매물 정보 받아오기 - 13 (0) | 2020.09.12 |
[파이썬 웹 스크래핑] Headless 정보 처리 - 13 (0) | 2020.09.11 |
댓글 영역