일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
Tags
- 정답코드
- 스펨메일 분류
- 코딩
- 27448
- 아니메컵
- dp
- 샤논 엔트로피
- 정렬
- T tree
- 17070
- 실질적 약수
- 파이썬
- 백준
- C
- 힙 정렬
- 코테
- 2247
- 코복장
- 다이나믹 프로그래밍
- dfs
- 구현
- 부분수열의 합2
- ps
- 코딩테스트
- BFS
- populating next right pointers in each node
- 딥러닝
- lgb
- python
- 모두의 꿈
Archives
- Today
- Total
목록데이터 분석 (1)
코딩복습장

오늘은 kobis의 2015~2023년 영화 데이터를 분석해보려고 한다. column의 개수는 총 19개이고 데이터의 개수는 14301개이다. Data preprocessing missing value에 대한 graph를 뽑아보았다. (데이터의 분포 확인) 다음과 같이 나오는 것을 확인할 수 있는데 여기서 알 수 있는 점은 영화의 제작사와 수입사 column에 null데이터가 굉장히 많다는 것 이었다. 따라서 제작사와 수입사 column을 제거시켜주었고 영화 유형과 영화 형태 column의 경우 동일한 데이터가 굉장히 많아 제거시켜주었다. 영화 등급 column preprocessing 영화 등급의 개수 그래프를 출력해보았다. 여기서 청소년관람불가, 15세이상관람가, 12세이상관람가, 전체관람가를 제외한..
데이터 분석
2023. 6. 23. 20:11