목록pandas (1)
코딩복습장
영화 관객 수 데이터분석
오늘은 kobis의 2015~2023년 영화 데이터를 분석해보려고 한다. column의 개수는 총 19개이고 데이터의 개수는 14301개이다. Data preprocessing missing value에 대한 graph를 뽑아보았다. (데이터의 분포 확인) 다음과 같이 나오는 것을 확인할 수 있는데 여기서 알 수 있는 점은 영화의 제작사와 수입사 column에 null데이터가 굉장히 많다는 것 이었다. 따라서 제작사와 수입사 column을 제거시켜주었고 영화 유형과 영화 형태 column의 경우 동일한 데이터가 굉장히 많아 제거시켜주었다. 영화 등급 column preprocessing 영화 등급의 개수 그래프를 출력해보았다. 여기서 청소년관람불가, 15세이상관람가, 12세이상관람가, 전체관람가를 제외한..
데이터 분석
2023. 6. 23. 20:11