일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 오제이튜브
- 시계열시각화
- 이수역 양식집
- timeseries decomposition
- 응용이 보이는 선형대수
- 리눅스개념
- seaborn # kdeplot # 데이터분석
- 파이프라인전처리
- loess
- 시간형식변환
- adf_test
- pandas # 월말 날짜 # 마지막 주 # 날짜계산 # 시계열 # 마지막 주 금요일
- 날짜파싱
- stl
- 시간형식
- 시계열
- 음수값 #전처리 #선형보간 #pandas #데이터 #데이터분석
- 시계열 #reindex #인덱스 확장 #datetime index #index extention # 데이터전처리
- Python
- 확률
- 시계열분해
- 년월일 데이터
- 플로틀리
- pandas
- 시계열모듈
- 빈 데이터프레임 #pandas #데이터전처리
- 짧은 시계열 # 금융시계열
- 시계열데이터셋
- 크롤링자동화
- np.split
- Today
- Total
목록전체 글 (33)
데이터분석과 개발
* 공부한 것을 정리한 글이므로 틀린 내용이 있을 수 있습니다. * 더 좋은 방법 또는 틀린부분이 발견될 시 계속 수정하며 업데이트 할 예정입니다. 다른 두 개의 시계열 데이터를 비교하려 할때 날짜의 시작 끝이 달라서 어떻게 맞춰줄 지 많이 고민했었습니다. 기준 시계열의 경우 월데이터 2022년 1월~ 2023년 2월 데이터였고 비교할 시계열의 경우 월데이터 2022년 1월~ 2023년 1월까지 밖에 없던 상황입니다. seaborn 모듈의 'flights'데이터셋을 사용하여 보겠습니다. import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns df = sns.load_dataset("flights..
* 공부한 것을 정리한 글이므로 틀린 내용이 있을 수 있습니다. * 더 좋은 방법 또는 틀린부분이 발견될 시 계속 수정하며 업데이트 할 예정입니다. 처음보는 데이터의 분포가 궁금할때 시각화를 통해 전체적인 분포를 보고 싶을때가 있습니다. seaborn의 경우 데이터프레임안에서 카테고리별로 시각화를 시킬 수 있어서 특히 좋은 것 같습니다. seaborn 모듈의 penguins 데이터 셋을 사용하여 kdeplot을 사용해 보겠습니다. import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns df = sns.load_dataset('penguins') df.head() penguins 데이터 셋은 'A..
* 공부한 것을 정리한 글이므로 틀린 내용이 있을 수 있습니다. * 더 좋은 방법 또는 틀린부분이 발견될 시 계속 수정하며 업데이트 할 예정입니다. 오늘 정리해볼 전처리는 데이터의 음수값을 없애고 간단한 선형 보간법으로 데이터를 채워넣는 과정입니다. 일단 제가 10분동안 요리조리 만든 월단위 매출 2년 데이터입니다. import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns # 2년치 매출 데이터 sales_list = [50,60,55,45,60,75,90, 120,110,-5,-5,45,50, 60,40,50,70,130,140, 110,-5,-5,40,50] # 월별 2년 date = pd.d..
이번 문제를 풀고 파이썬 딕셔너리에 관한 함수를 정리하려함 1157번 단어공부 문제 : 알파벳 대소문자로 된 단어가 주어지면, 이 단어에서 가장 많이 사용된 알파벳이 무엇인지 알아내는 프로그램을 작성하시오. 단, 대문자와 소문자를 구분하지 않는다. 가장 많이 사용된 알파벳이 유일하지 않으면 "?" 출력 * 어려웠던 점 (1) 딕셔너리에서 value 값이 최대인 key 값을 뽑는 법 (2) 딕셔너리에서 value 값이 최대인 값이 여러개일때 여러개의 key값을 모두 뽑는 법 * 구글링 결과 # d = 딕셔너리 # k = key, v= value # (1) 최댓값인 value의 key뽑기 max(d, key=d.get) # (2) value 최댓값인 key값 뽑기 [k for k,v in d.items() ..