목록코랩 (3)
Scientia Conditorium
[기본 미션] p.344의 손코딩(맷플롯립의 컬러맵으로 산점도 그리기)을 코랩에서 그래프 출력하고 화면 캡쳐하기 단순하게 산점도 API만 호출하면 한글 글씨들은 깨져서 나오지 않는다. 따라서 책 p.331~332에 나와있는대로 네이버 나눔 글꼴을 설치해야 한다. [선택 미션] p.356~359의 스택 영역 그래프를 그리는 과정을 정리하기 1. pivot_table() 메서드로 각 '발행년도' 열의 값을 열로 바꾸기 2. '발행년도' 열을 리스트 형태로 바꾸기 3. stackplot() 메서드로스택 영역 그래프 그리기
[기본 미션] p.182의 확인 문제 2번 풀고 인증하기 데이터 정제 : 수집된데이터에서 잘못된 부분을 고치거나 제거하여 필요한 데이터를 준비하는 과정 데이터가 올바르게 정제되지 못하면 분석된 결과를 왜곡시킬 수 있으며 잘못된 의사 결정을 초래하기도 함 데이터 랭글링(데이터 먼징) : 데이터를 정제하는 과정과 분석 및 머신러닝에 적합한 형태로 데이터를 변환하는 과정 원소별 비교 : 판다스의 데이터프레임과 인덱스를 하나의 값과 비교하면 데이터프레임과 인덱스에 있는 모든 원소와 비교. 비교한 결과는 True 또는 False로 이루어진 불리언 배열로 반환 넘파이(Numpy) : 파이썬의 대표적인 다차원 배열. 판다스의 데이터프레임과 달리 한 종류의 데이터만 담을 수 있지만 매우 효율적이고 성능이 높음. 파이썬..
[기본 미션] p.150의 확인 문제 1번 풀고 인증하기 웹 페이지나 웹 기반 API를 호출하는데 requests 패키지를 많이 사용 HTML 안에 있는 내용을 찾을 때는 뷰티플수프(Beautiful Soup) 사용 find() : 첫 번째 매개변수에는 찾을 태그 이름을 지정하고, attrs 매개변수에는 찾으려는 태그의 속성을 딕셔너리 지정 find_all() : 테이블 태그를 리스트로 가져오기, 특정 HTML 태그를 모두 찾아서 리스트로 반 [선택 미션] p.137~138 손코딩 실습으로 원하는 도서의 페이지 수를 추출하고 화면 캡쳐하기 실습하면서 나왔던 오류들 1. requests 사용하기 전에 'import requests'해주기 2. requests와 request, 뒤쪽 s 스펠링 주의 3. p..