일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- 시계열 #reindex #인덱스 확장 #datetime index #index extention # 데이터전처리
- 시계열시각화
- 시계열
- 빈 데이터프레임 #pandas #데이터전처리
- 이수역 양식집
- 오제이튜브
- 응용이 보이는 선형대수
- Python
- 음수값 #전처리 #선형보간 #pandas #데이터 #데이터분석
- 시간형식
- 시계열데이터셋
- timeseries decomposition
- 플로틀리
- pandas
- 크롤링자동화
- seaborn # kdeplot # 데이터분석
- pandas # 월말 날짜 # 마지막 주 # 날짜계산 # 시계열 # 마지막 주 금요일
- 날짜파싱
- adf_test
- 리눅스개념
- 시간형식변환
- 시계열모듈
- stl
- 확률
- 년월일 데이터
- np.split
- 짧은 시계열 # 금융시계열
- 파이프라인전처리
- 시계열분해
- loess
- Today
- Total
목록AI(시계열) (20)
데이터분석과 개발
가상환경을 10번 이상 만들다보니 익숙해져서 이제 방법을 정리해보려 합니다. (아나콘다는 기본적으로 깔려있어야 합니다!) 커널 설정같은 경우 vscode나 jupyterlab을 사용하면 마우스 클릭으로 바로 고를 수 있지만 jupyter notebook의 경우 직접 ipykernel에 설치를 해줘야 하므로 한단계 더 필요합니다. vscode, jupyterlab 모두 사용해봤지만 개인적 용도로는 jupyter notebook이 좋아서 이 과정을 정리해보겠습니다. 1. 가상환경 생성 conda create -n 가상환경이름 python==버젼 입니다. 설치 전 파이썬 버전을 꼭 설정해주세요! 저는 tf2.5_py3.8 이라는 가상환경을 만들려고 합니다. 예시) (base) conda create -n tf..
* 공부한 것을 정리한 글이므로 틀린 내용이 있을 수 있습니다. * 더 좋은 방법 또는 틀린부분이 발견될 시 계속 수정하며 업데이트 할 예정입니다. 학사인 저는 채용공고를 볼때마다 논문 구현을 보면 막막했습니다. 석사는 물론이고 대학교 초반부터 데이터 사이언스를 준비한 친구들과 경쟁해서 이길 수 있을까 참 고민이 많았네요. 주변에 이런 고민을 들어줄 사람도 얼마 없어서 더 힘들었지만 지금 입사한 지 거의 1년차가 되어가는 시점에 같은 고민을 하시는 분들에게 도움이 될 수 있을까 싶어 글을 쓰게 되었습니다. (참고로, 저는 시계열 데이터를 다루는 사람입니다.) 저의 가장 큰 고민은 채용공고에 나온 "논문 구현 가능하신 분" 에서 어느 정도까지 구현을 할 수 있어야 하냐 가 가장 큰 고민이자 문제였습니다. ..
* 공부한 것을 정리한 글이므로 틀린 내용이 있을 수 있습니다. * 더 좋은 방법 또는 틀린부분이 발견될 시 계속 수정하며 업데이트 할 예정입니다. 시계열 데이터를 다루다 보면 한달 전 , 한달 후, 두달 후 또는 마지막 주 금요일과 같이 특정 날짜를 구해야 할 때가 있습니다. 인덱스가 날짜다 보니 정확히 같은 날짜여야 제대로 된 분석, 예측이 가능하기에 그런 것 같습니다 제가 해결하려고 용썼던 결과들을 간단하게 정리해보도록 하겠습니다. 기준 날짜는 2022년 11월 30일로 하겠습니다. import pandas as pd date = pd.to_datetime("2022-11-30") date (1) 한달 전 날짜 구하기 dateutil 모듈의 relativedelta 함수를 사용하면 편리합니다. re..
* 공부한 것을 정리한 글이므로 틀린 내용이 있을 수 있습니다. * 더 좋은 방법 또는 틀린부분이 발견될 시 계속 수정하며 업데이트 할 예정입니다. 어떤 큰 데이터 프레임에서 for 문을 사용해서 각각의 데이터프레임을 확인해야 했던 경험이 있습니다. 예를 들면 과일 리스트 '사과','포도','딸기' 중에서 등급이 'A등급','B등급','C등급' 이 각각 있던 데이터프레임에 날짜별 수확량 데이터가 있어 수확량의 추이를 보고 싶었습니다. 그냥 보면 괜찮았을텐데 일별 데이터를 월별 데이터로 바꿨을 때 문제가 생겼습니다. C등급의 과일 데이터가 없는 경우가 있어서 resample할 데이터가 없어서 에러가 나서 for문이 돌아가질 않았습니다. (조건에 맞는 에러가 나는 데이터셋을 만들어보다가 ... 시간이 너무 ..