파이썬 라이브러리 시리즈 ⑦ — BeautifulSoup(bs4) 완벽 이해

BeautifulSoup은 HTML 문서를 파싱해서 원하는 요소(제목, 본문, 링크 등)를 쉽게 추출할 수 있게 해주는 라이브러리입니다.웹 크롤링의 핵심이라고 할 수 있습니다. ✔ 왜 필요한가? requests는 HTML 문서를 “가져오는” 역할이고,BeautifulSoup는 HTML 문서를 “해석해서 필요한 부분만 추출”하는 역할입니다. ✔ 이런 사람에게 필수! 블로그 제목·본문을 수집하고 싶은 사람 뉴스 기사 목록을 자동으로 가져오고 싶은 사람 특정 태그(class, id)를 정교하게 … 더 읽기