일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 음수값 #전처리 #선형보간 #pandas #데이터 #데이터분석
- 이수역 양식집
- 빈 데이터프레임 #pandas #데이터전처리
- 날짜파싱
- loess
- 시계열시각화
- 시계열 #reindex #인덱스 확장 #datetime index #index extention # 데이터전처리
- 시간형식
- 응용이 보이는 선형대수
- timeseries decomposition
- adf_test
- seaborn # kdeplot # 데이터분석
- 년월일 데이터
- pandas # 월말 날짜 # 마지막 주 # 날짜계산 # 시계열 # 마지막 주 금요일
- Python
- 시계열모듈
- 시간형식변환
- 확률
- 플로틀리
- 시계열
- 크롤링자동화
- 시계열데이터셋
- 짧은 시계열 # 금융시계열
- 파이프라인전처리
- 오제이튜브
- stl
- 시계열분해
- 리눅스개념
- np.split
- pandas
- Today
- Total
목록데이터분석 (20)
먼지뭉치 Data Analysis
안녕하세요 오랜만에 다시 블로그를 쓰는 것 같습니다.힘든 일을 비롯해 많은 일들이 있었지만 다시 마음을 다 잡고 공부하는 내용들을 정리해보려 합니다. 제가 데이터 분석을 하는건지 데이터사이언스를 하는건지 저조차도 많이 헷갈렸었는데 데이터분석가를 하기로 결정하였습니다. 본론으로 돌아와 데이터분석의 기본 GA를 설치해 행동추적, 이탈률 측정 등을 하기 위해선 홈페이지가 필요합니다. 저 또한 프로젝트를 준비하는 과정에서 어떤 걸 써야 할지 고민이 참 많았는데 했던 과정들을 정리해보겠습니다. 홈페이지를 구축하려 했던 이유그럼 먼저 왜 티스토리 블로그로 하지 않고 홈페이지를 구축해야 하는가에 대한 물음에 답해야 합니다. 첫째, 티스토리는 회원가입 기능이 없습니다.회원가입을 해야 내 홈페이지에 리텐션 분석을 할..
가상환경을 10번 이상 만들다보니 익숙해져서 이제 방법을 정리해보려 합니다. (아나콘다는 기본적으로 깔려있어야 합니다!) 커널 설정같은 경우 vscode나 jupyterlab을 사용하면 마우스 클릭으로 바로 고를 수 있지만 jupyter notebook의 경우 직접 ipykernel에 설치를 해줘야 하므로 한단계 더 필요합니다. vscode, jupyterlab 모두 사용해봤지만 개인적 용도로는 jupyter notebook이 좋아서 이 과정을 정리해보겠습니다. 1. 가상환경 생성 conda create -n 가상환경이름 python==버젼 입니다. 설치 전 파이썬 버전을 꼭 설정해주세요! 저는 tf2.5_py3.8 이라는 가상환경을 만들려고 합니다. 예시) (base) conda create -n tf..
* 공부한 것을 정리한 글이므로 틀린 내용이 있을 수 있습니다. * 더 좋은 방법 또는 틀린부분이 발견될 시 계속 수정하며 업데이트 할 예정입니다. 시계열 데이터를 다루다 보면 한달 전 , 한달 후, 두달 후 또는 마지막 주 금요일과 같이 특정 날짜를 구해야 할 때가 있습니다. 인덱스가 날짜다 보니 정확히 같은 날짜여야 제대로 된 분석, 예측이 가능하기에 그런 것 같습니다 제가 해결하려고 용썼던 결과들을 간단하게 정리해보도록 하겠습니다. 기준 날짜는 2022년 11월 30일로 하겠습니다. import pandas as pd date = pd.to_datetime("2022-11-30") date (1) 한달 전 날짜 구하기 dateutil 모듈의 relativedelta 함수를 사용하면 편리합니다. re..
* 공부한 것을 정리한 글이므로 틀린 내용이 있을 수 있습니다. * 더 좋은 방법 또는 틀린부분이 발견될 시 계속 수정하며 업데이트 할 예정입니다. 어떤 큰 데이터 프레임에서 for 문을 사용해서 각각의 데이터프레임을 확인해야 했던 경험이 있습니다. 예를 들면 과일 리스트 '사과','포도','딸기' 중에서 등급이 'A등급','B등급','C등급' 이 각각 있던 데이터프레임에 날짜별 수확량 데이터가 있어 수확량의 추이를 보고 싶었습니다. 그냥 보면 괜찮았을텐데 일별 데이터를 월별 데이터로 바꿨을 때 문제가 생겼습니다. C등급의 과일 데이터가 없는 경우가 있어서 resample할 데이터가 없어서 에러가 나서 for문이 돌아가질 않았습니다. (조건에 맞는 에러가 나는 데이터셋을 만들어보다가 ... 시간이 너무 ..