Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 날짜파싱
- 음수값 #전처리 #선형보간 #pandas #데이터 #데이터분석
- 확률
- 이수역 양식집
- 시계열 #reindex #인덱스 확장 #datetime index #index extention # 데이터전처리
- np.split
- loess
- 시계열데이터셋
- 년월일 데이터
- stl
- Python
- 응용이 보이는 선형대수
- timeseries decomposition
- pandas
- 오제이튜브
- 시계열분해
- 짧은 시계열 # 금융시계열
- 플로틀리
- 빈 데이터프레임 #pandas #데이터전처리
- 리눅스개념
- 시간형식
- 시계열
- 크롤링자동화
- 시계열시각화
- seaborn # kdeplot # 데이터분석
- adf_test
- 시계열모듈
- 시간형식변환
- 파이프라인전처리
- pandas # 월말 날짜 # 마지막 주 # 날짜계산 # 시계열 # 마지막 주 금요일
Archives
- Today
- Total
목록PIPELINE (1)
데이터분석과 개발
[전처리] 전처리 파이프라인 구축하기(1)
* 공부한 것을 정리한 글이므로 틀린 내용이 있을 수 있습니다. * 더 좋은 방법 또는 틀린부분이 발견될 시 계속 수정하며 업데이트 할 예정입니다. 안녕하세요 오늘은 전처리 파이프라인에 대해 정리해보려 합니다. 정제되지 않은 데이터 파일을 받았을 경우 전처리를 해줘야 하는데 이런 파일들이 계속 들어오게 된다면 매번 전처리하기 성가시고 힘들게 됩니다. 그래서 모든 전처리 과정을 하나의 파이프라인으로 만들어 데이터를 이 파이프라인에 넣어주게 되면 모델 돌리기에 적합한 형태의 형식의 데이터로 나올 수 있게 만들어 줄 수 있습니다. 이번에 다뤄볼 데이터는 seaborn에 있는 'diamond' 데이터 셋입니다. # 데이터셋 df = sns.load_dataset('diamonds') df Nan값은 없었고 데이..
AI(시계열)/데이터 전처리
2023. 1. 7. 23:53