상세 컨텐츠

본문 제목

[파이썬 웹 스크래핑] 네이버 헤드 라인 뉴스 가져오기 - 15

프로그래밍 언어/웹 스크래핑

by 별을 보는 사람 2020. 9. 14. 07:00

본문

반응형
import requests
from bs4 import BeautifulSoup

def create_soup(url):
    res = requests.get(url)
    res.raise_for_status()
    soup = BeautifulSoup(res.text, "lxml")
    return soup

 

 

def scrape_headline_news():
    print("[헤드라인 뉴스]")
    url = "https://news.naver.com/"
    soup = create_soup(url)
    news_list = soup.find("ul", attrs={"class":"hdline_article_list"}).find_all("li", limit=3)
    for index, news in enumerate(news_list):
        title = news.find("a").get_text().strip()
        link = url + news.find("a")["href"]
        print("{}. {}".format(index + 1, title))
        print("  (링크 : {}".format(link))
    print()
    
    if __name__ == "__main__":
    scrape_headline_news() # 네이버 헤드라인 뉴스 3개 가져오기

 

<결과값>

[헤드라인 뉴스]
1. "트럼프, 북한과 전쟁 직전 갔었다…ICBM 발사시 큰 문제"(종합)
  (링크 : https://news.naver.com//main/read.nhn?mode=LSD&mid=shm&sid1=100&oid=001&aid=0011878499
2. 한·미 훈련 취소 안 해 매우 불쾌…한국군, 우리 상대 안 돼
  (링크 : https://news.naver.com//main/read.nhn?mode=LSD&mid=shm&sid1=100&oid=032&aid=0003032169
3. 의대 본과 4학년 “단체행동 잠정 유보”…정부 “국시 추가 응시 불가”
  (링크 : https://news.naver.com//main/read.nhn?mode=LSD&mid=shm&sid1=102&oid=032&aid=0003032173
반응형

관련글 더보기

댓글 영역