Scientia Conditorium

[혼공단] 혼자 공부하는 데이터 분석 / 혼공단 10기 - 2주차 본문

서평/IT-책

[혼공단] 혼자 공부하는 데이터 분석 / 혼공단 10기 - 2주차

크썸 2023. 7. 15. 17:14

[기본 미션]  p.150의 확인 문제 1번 풀고 인증하기

 

웹 페이지나 웹 기반 API를 호출하는데 requests 패키지를 많이 사용

HTML 안에 있는 내용을 찾을 때는 뷰티플수프(Beautiful Soup) 사용

find() : 첫 번째 매개변수에는 찾을 태그 이름을 지정하고, attrs 매개변수에는 찾으려는 태그의 속성을 딕셔너리 지정

find_all() : 테이블 태그를 리스트로 가져오기, 특정 HTML 태그를 모두 찾아서 리스트로 반

 

[선택 미션] p.137~138 손코딩 실습으로 원하는 도서의 페이지 수를 추출하고 화면 캡쳐하기

실습하면서 나왔던 오류들

1. requests 사용하기 전에 'import requests'해주기

2. requests와 request, 뒤쪽 s 스펠링 주의

3. prd_detail = soup.find() 수행하고 결과가 아무것도 없는상태에서 pre_detail.find_all() 하면 에러 발생

→ AttributeError: 'NoneType' object has no attribute 'find_all'