일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- loess
- 짧은 시계열 # 금융시계열
- pandas # 월말 날짜 # 마지막 주 # 날짜계산 # 시계열 # 마지막 주 금요일
- timeseries decomposition
- 확률
- 이수역 양식집
- 리눅스개념
- 년월일 데이터
- 날짜파싱
- pandas
- 시계열시각화
- 시계열 #reindex #인덱스 확장 #datetime index #index extention # 데이터전처리
- adf_test
- 플로틀리
- 시계열분해
- 시계열데이터셋
- 시계열모듈
- np.split
- 오제이튜브
- 응용이 보이는 선형대수
- 파이프라인전처리
- 음수값 #전처리 #선형보간 #pandas #데이터 #데이터분석
- Python
- seaborn # kdeplot # 데이터분석
- 시간형식
- stl
- 크롤링자동화
- 시계열
- 빈 데이터프레임 #pandas #데이터전처리
- 시간형식변환
- Today
- Total
목록데이터분석 (20)
먼지뭉치 Data Analysis
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/brq3tc/btrUXpjlXAo/KmR1eUel3M6YSdj4dXgbMk/img.png)
seaborn에 이어서 plotly를 통해 시각화를 진행해보려고 합니다. seaborn과 마찬가지로 matplotlib보다 쉽고 보기 좋게 시각화를 할 수 있습니다. 시계열에서 중요한 일별, 월별, 연도별 그래프를 쉽게 그릴 수 있는 점이 특히 좋은 것 같습니다. 이번 데이터는 darts 데이터셋에 미국 gasoline데이터 입니다. import pandas as pd import numpy as np import matplotlib.pyplot as plt import plotly.express as px from darts.datasets import USGasolineDataset df_gasoline = USGasolineDataset().load().pd_dataframe() df_gasolin..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/b2Ca1L/btrUTJothZ3/atmJDip8Fdc6kr1rmYPPY0/img.png)
계절성을 비롯한 시계열 데이터 특성을 눈으로 확인하기 위해서는 시각화가 중요하다고 생각합니다. matplotlib으로 그릴수도 있지만 좀 더 화려한 시각화를 하기 위해..! seaborn을 써서 기본적인 시계열 데이터 시각화를 정리해보려 합니다. 시각화 데이터는 월별 데이터입니다. 언뜻 보기엔 패턴이 있는거 같기도 하고 없는 거 같기도 하네요 계절적 특성이 있는 확인하기 위해 년도, 월 컬럼을 생성해 주겠습니다. import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns # 계절성 확인을 위해 년도, 월 컬럼 생성 df['year'] = df.index.year df['month'] = df.ind..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/cw2MFf/btrUM4UiNOf/qoTCSwkHiVC5Lt841gShc0/img.png)
예전에 프로젝트를 하다가 전염병 관련 데이터를 모았던 일이 있습니다. url 이 변하지 않아 selenium을 써야 했고 직접 한페이지 한페이지 넘기면서 데이터를 가져왔어야 했습니다. 다음페이지 버튼을 클릭해가며 끝까지 크롤링하는 부분이 생각보다 쉽지 않아 정리해보려 합니다. 가져왔던 페이지는 국가가축방역통합시스템이고 가축전염병이 발생했던 날짜와 장소를 나타낸 데이터입니다. https://home.kahis.go.kr/home/lkntscrinfo/selectLkntsOccrrncList.do 국가가축방역통합시스템 > 가축전염병 발생정보 > 국내현황 > 법정가축전염병 발생현황 법정가축전염병 발생현황 home.kahis.go.kr 크롤링을 하기 위해 셀레늄 드라이버를 부르고 import pandas as ..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/Ugiq3/btrUInfac4t/gu0szRfH2TGabO172vmTY0/img.png)
시계열 데이터 분석을 하다 보니 여러 종류의 데이터가 필요했습니다. 어떨때는 계절성이 있는 데이터를 분석하고 싶기도 하고 때로는 다변량 시계열 데이터가 분석하고 싶기도 한데 할때마다 검색해서 다운받기가 귀찮더라고요 이를 위해 darts라는 시계열 모듈을 사용해보려 합니다! darts는 시계열 데이터 분석을 위한 모듈로 여러가지 함수와 informer를 비롯한 최신 알고리즘까지 구현이 되어있습니다. darts 모듈 dataset엔 20가지 정도의 시계열 데이터가 있는데 10가지 정도의 데이터를 살펴보도록 하겠습니다. import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns plt.style.use(..