목록스펨메일 분류 (1)
코딩복습장
LSTM을 이용한 spam 메일 분류하기 ( Pytorch )
이번에는 lstm을 사용해서 스팸메일을 분류해보려고 한다. 데이터의 정보를 불러오자 dataframe의 shape는 (5572, 5)라는 것을 알 수 있다. 여기서 Unnamed: 2, Unnamed: 3, Unnamed: 4 는 모두 삭제해야될 column들이다. v1의 ham은 스펨메일이 아님 spam은 스팸메일이라는 뜻이다. 우선 lstm에 데이터를 넣기 전에 data를 분류해야 된다. 나는 train_data, val_data, test_data(훈련 데이터, 검증 데이터, 테스트 데이터) 이렇게 3가지로 데이터를 나눌 것이다. import pandas as pd import numpy as np import torch from torch.utils.data import Dataset, DataL..
딥러닝
2023. 8. 25. 17:49