일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- pandas # 월말 날짜 # 마지막 주 # 날짜계산 # 시계열 # 마지막 주 금요일
- loess
- 시간형식
- 크롤링자동화
- np.split
- 시계열시각화
- 시계열분해
- 시계열모듈
- 음수값 #전처리 #선형보간 #pandas #데이터 #데이터분석
- 리눅스개념
- 빈 데이터프레임 #pandas #데이터전처리
- 플로틀리
- 시계열
- Python
- stl
- pandas
- 시계열데이터셋
- adf_test
- seaborn # kdeplot # 데이터분석
- 짧은 시계열 # 금융시계열
- 응용이 보이는 선형대수
- 년월일 데이터
- 시간형식변환
- 시계열 #reindex #인덱스 확장 #datetime index #index extention # 데이터전처리
- 오제이튜브
- 확률
- 이수역 양식집
- timeseries decomposition
- 날짜파싱
- 파이프라인전처리
- Today
- Total
목록분류 전체보기 (35)
먼지뭉치 Data Analysis
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/mzQoV/btsL7FhbH8q/dKwYhmAXklMZ15ERz4ceMk/img.png)
안녕하세요. 오늘은 리텐션 기본문제를 정리해보려고 합니다.코딩테스트 사이트 문제만 풀어보다가 직접 리텐션 문제를 풀어보니 꽤나 낯설더라고요. 아래는 문제와 샘플 데이터 입니다. Q. signup 후 login까지 소요된 평균일 수를 계산하시오.데이터 테이블: user_activityusser_idactivity_dateaction12023-01-01signup12023-01-02login12023-01-05login12023-01-07purchase22023-01-01signup22023-01-04login22023-01-06login 처음 시도접근: action = 'signup' , action='login' 날짜를 뽑아 DATEDIFF함수에 넣어야지근데 action에 따른 날짜를 어떻게 뽑지?하나의..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/cazZID/btsLZkq0VBw/92dge2SgoNWQer6kFwiW2K/img.png)
오늘은 풀었던 SQL 쿼리문제를 정리해보려 합니다.가끔 기본문제 같은데 헷갈리는 문제들이 있어 정리를 꾸준히 해놔야겠다고 생각이 들었습니다.기본문제의 경우 ChatGpt로 풀고 있는데 몰랐던 부분들을 바로바로 질문할 수 있어서 좋은 것 같습니다. Q. 각 직원의 이름과 그 직원이 속한 전체 부서의 평균 급여를 함께 출력하라. 데이터는 아래와 같습니다.처음 접근.1. 평균 급여가 필요하니 group by를 사용해야 하는데.2. Department를 기준으로 group by 하게 되면 각각의 employeeID를 출력할 수가 없음.3. 그래서 group by로 department 컬럼 뿐만 아니라 employeeID, Name 까지 해서 출력해 보았습니다.# 처음 시도SELECT Name, ..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/DCUM7/btsLUF31Jo3/3PekR0GKviD3YvCheaKJf1/img.png)
안녕하세요 오랜만에 다시 블로그를 쓰는 것 같습니다.힘든 일을 비롯해 많은 일들이 있었지만 다시 마음을 다 잡고 공부하는 내용들을 정리해보려 합니다. 제가 데이터 분석을 하는건지 데이터사이언스를 하는건지 저조차도 많이 헷갈렸었는데 데이터분석가를 하기로 결정하였습니다. 본론으로 돌아와 데이터분석의 기본 GA를 설치해 행동추적, 이탈률 측정 등을 하기 위해선 홈페이지가 필요합니다. 저 또한 프로젝트를 준비하는 과정에서 어떤 걸 써야 할지 고민이 참 많았는데 했던 과정들을 정리해보겠습니다. 홈페이지를 구축하려 했던 이유그럼 먼저 왜 티스토리 블로그로 하지 않고 홈페이지를 구축해야 하는가에 대한 물음에 답해야 합니다. 첫째, 티스토리는 회원가입 기능이 없습니다.회원가입을 해야 내 홈페이지에 리텐션 분석을 할..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/Rzc3g/btsjkibctAi/K6AmCLTXXcr9FEKBLwWz20/img.png)
가상환경을 10번 이상 만들다보니 익숙해져서 이제 방법을 정리해보려 합니다. (아나콘다는 기본적으로 깔려있어야 합니다!) 커널 설정같은 경우 vscode나 jupyterlab을 사용하면 마우스 클릭으로 바로 고를 수 있지만 jupyter notebook의 경우 직접 ipykernel에 설치를 해줘야 하므로 한단계 더 필요합니다. vscode, jupyterlab 모두 사용해봤지만 개인적 용도로는 jupyter notebook이 좋아서 이 과정을 정리해보겠습니다. 1. 가상환경 생성 conda create -n 가상환경이름 python==버젼 입니다. 설치 전 파이썬 버전을 꼭 설정해주세요! 저는 tf2.5_py3.8 이라는 가상환경을 만들려고 합니다. 예시) (base) conda create -n tf..