상세 컨텐츠

본문 제목

[파이썬 웹 스크래핑] 해커스 어학원 오늘의 회화 가져오기 - 17

프로그래밍 언어/웹 스크래핑

by 별을 보는 사람 2020. 9. 16. 07:00

본문

반응형
import requests
from bs4 import BeautifulSoup
import re

def create_soup(url):
    res = requests.get(url)
    res.raise_for_status()
    soup = BeautifulSoup(res.text, "lxml")
    return soup

def print_news(index, title, link):
    print("{}. {}".format(index + 1, title))
    print("  (링크 : {}".format(link))

 

영어 지문 HTML

 

 

한글 지문 HTML

 

def scrape_english():
    print("[오늘의 영어 회화]")
    url = "https://www.hackers.co.kr/?c=s_eng/eng_contents/I_others_english&keywd=haceng_submain_lnb_eng_I_others_english&logger_kw=haceng_submain_lnb_eng_I_others_english"
    soup = create_soup(url)
    sentences = soup.find_all("div", attrs={"id":re.compile("^conv_kor_t")})
    print("(영어 지문)")
    for sentence in sentences[len(sentences)//2:]: # 8문장이 있다고 가정할 때, index 기준 4~7 까지 잘라서 가져옴
        print(sentence.get_text().strip())

    print()
    print("(한글 지문)")
    for sentence in sentences[:len(sentences)//2]: # 8문장이 있다고 가정할 때, index 기준 0~3 까지 잘라서 가져옴
        print(sentence.get_text().strip())

    print()
    
    
if __name__ == "__main__":
    scrape_english() # 오늘의 영어 회화 가져오기

 

 

<결과값>

[오늘의 영어 회화]
(영어 지문)
Rob: Danielle, were there any deliveries for me this morning? I'm expecting several packages.
Danielle: As a matter of fact, Rob, I put them on your desk this morning.
Rob: Oh, good. Thanks very much. I'm going to bring them with me on my business trip.
Danielle: Great.

(한글 지문)
Rob: Danielle, 오늘 아침 저에게 온 배달물이 없나요? 저는 몇 개의 소포를 기다리고 있어요.
Danielle: 사실 Rob, 제가 오늘 아침에 그것들을 당신의 책상 위에 올려놨어요.
Rob: 오, 좋아요. 정말 고마워요. 저는 출장 갈 때 그것들을 가지고 갈 거예요.
Danielle: 잘 됐네요.

 

 

반응형

관련글 더보기

댓글 영역