[파이썬 웹 스크래핑] 네이버 헤드 라인 뉴스 가져오기

[파이썬 웹 스크래핑] 네이버 헤드 라인 뉴스 가져오기 - 15

프로그래밍 언어/웹 스크래핑

by 별을 보는 사람 2020. 9. 14. 07:00

import requests
from bs4 import BeautifulSoup

def create_soup(url):
    res = requests.get(url)
    res.raise_for_status()
    soup = BeautifulSoup(res.text, "lxml")
    return soup

def scrape_headline_news():
    print("[헤드라인 뉴스]")
    url = "https://news.naver.com/"
    soup = create_soup(url)
    news_list = soup.find("ul", attrs={"class":"hdline_article_list"}).find_all("li", limit=3)
    for index, news in enumerate(news_list):
        title = news.find("a").get_text().strip()
        link = url + news.find("a")["href"]
        print("{}. {}".format(index + 1, title))
        print("  (링크 : {}".format(link))
    print()
    
    if __name__ == "__main__":
    scrape_headline_news() # 네이버 헤드라인 뉴스 3개 가져오기

<결과값>

[헤드라인 뉴스]
1. "트럼프, 북한과 전쟁 직전 갔었다…ICBM 발사시 큰 문제"(종합)
  (링크 : https://news.naver.com//main/read.nhn?mode=LSD&mid=shm&sid1=100&oid=001&aid=0011878499
2. 한·미 훈련 취소 안 해 매우 불쾌…한국군, 우리 상대 안 돼
  (링크 : https://news.naver.com//main/read.nhn?mode=LSD&mid=shm&sid1=100&oid=032&aid=0003032169
3. 의대 본과 4학년 “단체행동 잠정 유보”…정부 “국시 추가 응시 불가”
  (링크 : https://news.naver.com//main/read.nhn?mode=LSD&mid=shm&sid1=102&oid=032&aid=0003032173

'프로그래밍 언어 > 웹 스크래핑' 카테고리의 다른 글

[파이썬 웹 스크래핑] 해커스 어학원 오늘의 회화 가져오기 - 17 (0)	2020.09.16
[파이썬 웹 스크래핑] 네이버 IT 뉴스 가져오기 - 16 (0)	2020.09.15
[파이썬 웹 스크래핑] 네이버 날씨 정보 가져오기 - 14 (0)	2020.09.13
[파이썬 웹 스크래핑] 다음에서 부동산 매물 정보 받아오기 - 13 (0)	2020.09.12
[파이썬 웹 스크래핑] Headless 정보 처리 - 13 (0)	2020.09.11

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

지금 이 순간을 살아라

고정 헤더 영역

메뉴 레이어

메뉴 리스트

검색 레이어

검색 영역

상세 컨텐츠

본문 제목

본문

'프로그래밍 언어 > 웹 스크래핑' 카테고리의 다른 글

관련글 더보기

댓글 영역

추가 정보

인기글

최신글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역