목록분류 전체보기 (31)
코딩복습장
오늘은 kobis의 2015~2023년 영화 데이터를 분석해보려고 한다. column의 개수는 총 19개이고 데이터의 개수는 14301개이다. Data preprocessing missing value에 대한 graph를 뽑아보았다. (데이터의 분포 확인) 다음과 같이 나오는 것을 확인할 수 있는데 여기서 알 수 있는 점은 영화의 제작사와 수입사 column에 null데이터가 굉장히 많다는 것 이었다. 따라서 제작사와 수입사 column을 제거시켜주었고 영화 유형과 영화 형태 column의 경우 동일한 데이터가 굉장히 많아 제거시켜주었다. 영화 등급 column preprocessing 영화 등급의 개수 그래프를 출력해보았다. 여기서 청소년관람불가, 15세이상관람가, 12세이상관람가, 전체관람가를 제외한..
오늘 소개할 자료구조는 T tree입니다. T 트리는 AVL 트리의 이진 탐색 특성 및 높이 균형과 B 트리의 업데이트, 저장효율 장점을 모두 취한 MMDB(Main-Memory Database) 최적화 트리이다. Background AVL 트리의 공간 낭비와 잦은 회전 연산을 개선하기 위해 만들어짐 AVL 트리가 하나의 노드에 데이터 한개만을 가지는 대신 T 트리는 하나의 노드가 n개의 데이터를 가질 수 있도록 개선한 구조임 장점 B트리의 엔트리가 해당 레코드를 포함하는 데이터 페이지를 가리키고 있는데 반해 T 트리의 각각의 엔트리가 해당 레코드의 메모리 주소를 직접 포인팅하고 있기 때문에 T트리 인덱스는 논리적 주소를 물리적 주소로 변환하는 작업 없이 원하는 레코드에 빠르게 접근할 수 있다. T트리는..
문제 링크: https://www.acmicpc.net/problem/1010 1010번: 다리 놓기 입력의 첫 줄에는 테스트 케이스의 개수 T가 주어진다. 그 다음 줄부터 각각의 테스트케이스에 대해 강의 서쪽과 동쪽에 있는 사이트의 개수 정수 N, M (0 < N ≤ M < 30)이 주어진다. www.acmicpc.net 시간 제한 메모리 제한 제출 정답 맞힌 사람 정답 비율 0.5 초 (추가 시간 없음) 128 MB 72400 33908 27589 48.606% 문제 재원이는 한 도시의 시장이 되었다. 이 도시에는 도시를 동쪽과 서쪽으로 나누는 큰 일직선 모양의 강이 흐르고 있다. 하지만 재원이는 다리가 없어서 시민들이 강을 건너는데 큰 불편을 겪고 있음을 알고 다리를 짓기로 결심하였다. 강 주변에서..
문제링크: https://www.acmicpc.net/problem/5052 5052번: 전화번호 목록 첫째 줄에 테스트 케이스의 개수 t가 주어진다. (1 ≤ t ≤ 50) 각 테스트 케이스의 첫째 줄에는 전화번호의 수 n이 주어진다. (1 ≤ n ≤ 10000) 다음 n개의 줄에는 목록에 포함되어 있는 전화번호가 www.acmicpc.net 시간 제한 메모리 제한 제출 정답 맞힌 사람 정답 비율 1 초 256 MB 37304 11821 7261 29.904% 문제 전화번호 목록이 주어진다. 이때, 이 목록이 일관성이 있는지 없는지를 구하는 프로그램을 작성하시오. 전화번호 목록이 일관성을 유지하려면, 한 번호가 다른 번호의 접두어인 경우가 없어야 한다. 예를 들어, 전화번호 목록이 아래와 같은 경우를 ..