일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 혼공학습단
- 한빛미디어
- tutorial
- 혼공컴운
- 혼자공부하는네트워크
- 혼공스
- 혼자공부하는C언어
- 혼공네트
- 네트워크
- 제이펍
- 데이터분석
- 머신러닝
- OpenGL
- 나는리뷰어다
- 파이썬
- 혼공단5기
- C++
- 혼공
- 불칸
- vulkan
- 딥러닝
- 혼공머신
- 혼공S
- 혼공C
- 리뷰리뷰
- 벌칸
- 혼공단
- 컴퓨터그래픽스
- 책리뷰
- 자바스크립트
- Today
- Total
목록데이터분석 (5)
Scientia Conditorium
[책리뷰] 파이썬 시계열 예측 분석Time Series Forecasting in Python제가 지금까지 읽어봤던 모든 시계열 관련 데이터 분석 책 중에서시계열 모델 사용에 대한 기준을 가장 확실하게 짚어주고 있습니다.한상곤(부산대학교) 전반적인 소감 및 마음에 드는 부분데이터 분석에 대해 하나도 모르는 상태로 이 책을 접했다. 시계열이라는 단어는 자주 접했지만 정확히 그 의미가 무엇인지 전혀 알지 못했다. 이 책을 통해서 적어도 시계열 예측이 어떤 것인지 대략적인 감을 알 수 있게 되었다. 이 책에서 가장 마음에 드는 부분은 2가지다. 먼저 쓸데없는 파이썬 문법 페이지가 전혀 없다. 철저하게 시계열 예측 분석에 초점이 맞춰져있다. 즉, 최소한 파이썬을 사용할 줄 알아야 이 책을 제대로 볼 수 있다. ..
[기본 미션] p.344의 손코딩(맷플롯립의 컬러맵으로 산점도 그리기)을 코랩에서 그래프 출력하고 화면 캡쳐하기 단순하게 산점도 API만 호출하면 한글 글씨들은 깨져서 나오지 않는다. 따라서 책 p.331~332에 나와있는대로 네이버 나눔 글꼴을 설치해야 한다. [선택 미션] p.356~359의 스택 영역 그래프를 그리는 과정을 정리하기 1. pivot_table() 메서드로 각 '발행년도' 열의 값을 열로 바꾸기 2. '발행년도' 열을 리스트 형태로 바꾸기 3. stackplot() 메서드로스택 영역 그래프 그리기
[기본 미션] p.182의 확인 문제 2번 풀고 인증하기 데이터 정제 : 수집된데이터에서 잘못된 부분을 고치거나 제거하여 필요한 데이터를 준비하는 과정 데이터가 올바르게 정제되지 못하면 분석된 결과를 왜곡시킬 수 있으며 잘못된 의사 결정을 초래하기도 함 데이터 랭글링(데이터 먼징) : 데이터를 정제하는 과정과 분석 및 머신러닝에 적합한 형태로 데이터를 변환하는 과정 원소별 비교 : 판다스의 데이터프레임과 인덱스를 하나의 값과 비교하면 데이터프레임과 인덱스에 있는 모든 원소와 비교. 비교한 결과는 True 또는 False로 이루어진 불리언 배열로 반환 넘파이(Numpy) : 파이썬의 대표적인 다차원 배열. 판다스의 데이터프레임과 달리 한 종류의 데이터만 담을 수 있지만 매우 효율적이고 성능이 높음. 파이썬..
[기본 미션] p.150의 확인 문제 1번 풀고 인증하기 웹 페이지나 웹 기반 API를 호출하는데 requests 패키지를 많이 사용 HTML 안에 있는 내용을 찾을 때는 뷰티플수프(Beautiful Soup) 사용 find() : 첫 번째 매개변수에는 찾을 태그 이름을 지정하고, attrs 매개변수에는 찾으려는 태그의 속성을 딕셔너리 지정 find_all() : 테이블 태그를 리스트로 가져오기, 특정 HTML 태그를 모두 찾아서 리스트로 반 [선택 미션] p.137~138 손코딩 실습으로 원하는 도서의 페이지 수를 추출하고 화면 캡쳐하기 실습하면서 나왔던 오류들 1. requests 사용하기 전에 'import requests'해주기 2. requests와 request, 뒤쪽 s 스펠링 주의 3. p..
[기본 미션] p.81의 확인 문제 4번 풀고 인증하기 CSV(Comma-separated values) : 콤마(,)로 구분된 텍스트 파일 한 줄이 하나의 레코드이며 레코드는 콤마로 구분된 여러 필드로 구성 데이터는 엑셀처럼 표 형태여야 하기 때문에 레코드에 있는 필드 개수는 모두 동일 read_csv() : 판다스 패키지를 이용하여 csv 파일을 읽을 때 사용 to_csv() : 판다스의 데이터프레임을 csv로 저장할 때 사용, 기본적으로 UTF-8 형식으로 저장 [선택 미션] p.71~73 남산 도서관 데이터를 코랩에서 데이터프레임으로 출력하고 화면 캡쳐하기