일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 년월일 데이터
- 플로틀리
- 시계열 #reindex #인덱스 확장 #datetime index #index extention # 데이터전처리
- pandas
- 시간형식
- 응용이 보이는 선형대수
- 이수역 양식집
- pandas # 월말 날짜 # 마지막 주 # 날짜계산 # 시계열 # 마지막 주 금요일
- timeseries decomposition
- 시계열
- Python
- loess
- 시간형식변환
- np.split
- 빈 데이터프레임 #pandas #데이터전처리
- 시계열모듈
- 시계열데이터셋
- 시계열시각화
- 시계열분해
- 날짜파싱
- seaborn # kdeplot # 데이터분석
- 파이프라인전처리
- adf_test
- 리눅스개념
- stl
- 오제이튜브
- 크롤링자동화
- 짧은 시계열 # 금융시계열
- 확률
- 음수값 #전처리 #선형보간 #pandas #데이터 #데이터분석
- Today
- Total
목록전체 글 (33)
데이터분석과 개발
가상환경을 10번 이상 만들다보니 익숙해져서 이제 방법을 정리해보려 합니다. (아나콘다는 기본적으로 깔려있어야 합니다!) 커널 설정같은 경우 vscode나 jupyterlab을 사용하면 마우스 클릭으로 바로 고를 수 있지만 jupyter notebook의 경우 직접 ipykernel에 설치를 해줘야 하므로 한단계 더 필요합니다. vscode, jupyterlab 모두 사용해봤지만 개인적 용도로는 jupyter notebook이 좋아서 이 과정을 정리해보겠습니다. 1. 가상환경 생성 conda create -n 가상환경이름 python==버젼 입니다. 설치 전 파이썬 버전을 꼭 설정해주세요! 저는 tf2.5_py3.8 이라는 가상환경을 만들려고 합니다. 예시) (base) conda create -n tf..
* 공부한 것을 정리한 글이므로 틀린 내용이 있을 수 있습니다. * 더 좋은 방법 또는 틀린부분이 발견될 시 계속 수정하며 업데이트 할 예정입니다. 안녕하세요! 오늘은 확률 변수에 대한 포스팅을 먼저 진행하려 합니다. 고등학교때부터 확률변수를 설정해서 확률을 구하는 문제를 많이 풀었지만 막상 확률변수가 뭐야?라고 했을때 대답하기가 어려운 것 같습니다. 확률변수를 사용하는 이유는 실험을 했을 시에 각각의 사건보다 어떤 함수에만 관심이 있을 때 사용합니다. 이렇게 말하면 당연히 이해가 안가니 예시를 들어보겠습니다! 주사위 2개를 던질 때 단순히 (3,3)이 나오는 사건의 확률을 구하고 싶을 수도 있지만 주사위 2개를 던졌을 때 두수의 합이 6이 나오는 확률을 구하고 싶을 수 있습니다. 데이트를 나가야 해서 ..
* 공부한 것을 정리한 글이므로 틀린 내용이 있을 수 있습니다. * 더 좋은 방법 또는 틀린부분이 발견될 시 계속 수정하며 업데이트 할 예정입니다. 안녕하세요 오늘은 확률의 기초 표본공간과 사건에 대해 정리해보려 합니다. 최근 모델들을 보면 정확한 예측값을 도출하는 결정론적(Deterministic)한 방식에서 시계열의 확률분포를 추정하여 해당분포에서 예측값을 도출하는 방식을 많이 사용하고 있습니다. 이를 위해 데이터분포에 대한 포스팅을 하기 전 확률 공리에 대한 기본개념을 정리해보려고 합니다! 표본공간의 개념에 대해 알고 나면 확률변수,확률분포를 이해할 때 좋은 것 같습니다. *표본공간(S) 표본공간은 어떤 실험에서 나올 수 있는 모든 사건의 집합을 의미합니다. 예를 들어 동전을 한번 던지면 앞면(H)..
* 공부한 것을 정리한 글이므로 틀린 내용이 있을 수 있습니다. * 더 좋은 방법 또는 틀린부분이 발견될 시 계속 수정하며 업데이트 할 예정입니다. 학사인 저는 채용공고를 볼때마다 논문 구현을 보면 막막했습니다. 석사는 물론이고 대학교 초반부터 데이터 사이언스를 준비한 친구들과 경쟁해서 이길 수 있을까 참 고민이 많았네요. 주변에 이런 고민을 들어줄 사람도 얼마 없어서 더 힘들었지만 지금 입사한 지 거의 1년차가 되어가는 시점에 같은 고민을 하시는 분들에게 도움이 될 수 있을까 싶어 글을 쓰게 되었습니다. (참고로, 저는 시계열 데이터를 다루는 사람입니다.) 저의 가장 큰 고민은 채용공고에 나온 "논문 구현 가능하신 분" 에서 어느 정도까지 구현을 할 수 있어야 하냐 가 가장 큰 고민이자 문제였습니다. ..