서울아파트실거래가 썸네일형 리스트형 머신러닝 경진대회 1 | 데이터 탐색 EDA 2024.09.02 - [프로젝트] - 머신러닝 경진대회 1 | 데이터 분석 EDA 혼자 해보기지난 포스팅보다 좀 더 본격적으로, EDA를 책을 보며 따라가봤다. 먼저 데이터 탐색을 위해 복사본을 생성한다.traindata = pd.read_csv('/data/ephemeral/home/data/train.csv')traindata_copy=traindata.copy() 각 피쳐의 특징을 조사해보자info() 메서드를 사용해 데이터에 대해 간략한 개요를 확인한다. 확인할 수 있는 주요 정보는, 52개의 컬럼(피쳐)과 1118822개의 행(row)가 있다는 사실, 인덱스의 범위는 0부터 1118821까지이며, 각 컬럼의 이름과 컬럼의 데이터 특성을 알 수 있다. 숫자 아니면 object인데 object에 .. 더보기 이전 1 다음