일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 시계열데이터셋
- 시계열시각화
- 짧은 시계열 # 금융시계열
- 플로틀리
- adf_test
- 리눅스개념
- 크롤링자동화
- 시계열분해
- 이수역 양식집
- 날짜파싱
- seaborn # kdeplot # 데이터분석
- 시간형식변환
- pandas
- 년월일 데이터
- 시계열 #reindex #인덱스 확장 #datetime index #index extention # 데이터전처리
- 음수값 #전처리 #선형보간 #pandas #데이터 #데이터분석
- 확률
- 시간형식
- timeseries decomposition
- 파이프라인전처리
- Python
- 응용이 보이는 선형대수
- 오제이튜브
- 시계열모듈
- stl
- 빈 데이터프레임 #pandas #데이터전처리
- np.split
- loess
- 시계열
- pandas # 월말 날짜 # 마지막 주 # 날짜계산 # 시계열 # 마지막 주 금요일
- Today
- Total
목록분류 전체보기 (34)
먼지뭉치 Data Analysis
* 포스팅 날짜를 확인해주세요 * 특히 이수역의 경우 없어지는 가게가 많습니다. * 이수역에 25년 넘게 거주하고 있습니다. 사실 맛집을 좋아하고 하는데 코딩으로 매일 하나씩 포스팅 하는건 무리여서 맛집 포스팅을 시작하게 되었습니다..! 당연히 내돈 내산이고 이수사당에 20년 넘게 산 주민으로서 괜찮은 집들을 소개하려고 합니다. 앞으로 사진을 많이 찍어서 포스팅을 해보도록 하겠습니다.(더 추가하도록 해보겠습니다) 오늘 소개드리는 집은 '쿠킨스테이크 하우스' 입니다. 제가 초등학교 다닐 때도 있었던 집이니 한 20년 다 되어가는집인 것 같네요. 사실 어릴적엔 별로 안좋아했던 집인데 요즘생각하면 이런집도 없는거 같기도 하고 아무튼! 이수역에 소중한 양식집입니다. 천천히 특징을 적어보도록 하겠습니다! 1. 위..
* 공부한 것을 정리한 글이므로 틀린 내용이 있을 수 있습니다. * 더 좋은 방법 또는 틀린부분이 발견될 시 계속 수정하며 업데이트 할 예정입니다. * 수정사항 ---------------------------------------2023/01/12---------------------------------------- Airflow 스케줄러를 통한 크롤링 자동화는 실패한 상황입니다 한 평생 윈도우만 쓰다가 리눅스를 사용하게 되었습니다...! 사용하게 된 계기는 Airflow의 스케줄러를 사용하려고 설치하는 과정에서 리눅스를 사용하게 되었네요. Airflow 로 성공적으로 크롤링 스케줄러를 만들게 되면 정리를 해보도록 하겠습니다. 말로만 듣던 리눅스 해보면서도 왜 이걸 사용하지 싶었는데 유투브에 너무 정..
* 공부한 것을 정리한 글이므로 틀린 내용이 있을 수 있습니다. * 더 좋은 방법 또는 틀린부분이 발견될 시 계속 수정하며 업데이트 할 예정입니다. 데이터를 읽어올 때 인덱스에 한번에 시간을 datetime형식으로 넣어주고 싶을때가 많습니다. 특히 시계열이라면 더욱 그렇겠죠. 그래서 시간 성분이 나눠진 데이터셋 (ex. 년 / 월 / 일..) 을 바로 datetime형식으로 인덱스에 넣어주는 전처리를 정리해보려 합니다. 사용할 데이터는 UCI 사이트의 베이징 대기오염 데이터셋입니다. https://archive.ics.uci.edu/ml/datasets/Beijing+PM2.5+Data UCI Machine Learning Repository: Beijing PM2.5 Data Data Set Beiji..
* 공부한 것을 정리한 글이므로 틀린 내용이 있을 수 있습니다. * 더 좋은 방법 또는 틀린부분이 발견될 시 계속 수정하며 업데이트 할 예정입니다. 안녕하세요 오늘은 전처리 파이프라인에 대해 정리해보려 합니다. 정제되지 않은 데이터 파일을 받았을 경우 전처리를 해줘야 하는데 이런 파일들이 계속 들어오게 된다면 매번 전처리하기 성가시고 힘들게 됩니다. 그래서 모든 전처리 과정을 하나의 파이프라인으로 만들어 데이터를 이 파이프라인에 넣어주게 되면 모델 돌리기에 적합한 형태의 형식의 데이터로 나올 수 있게 만들어 줄 수 있습니다. 이번에 다뤄볼 데이터는 seaborn에 있는 'diamond' 데이터 셋입니다. # 데이터셋 df = sns.load_dataset('diamonds') df Nan값은 없었고 데이..