[CV 문서 분류 대회] 셋째 날 정리: 임밸런스 데이터 맞춰주기
대회 셋째 날은 10월의 마지막 주 금요일이였고, 다른 일정이 많은 바쁜 날이였다. 이날 했던 건, 임밸런스한 이미지 데이터의 밸런스를 맞춰주는 것. 그리고 그걸로 다시 어그멘테이션을 해서 학습 데이터셋을 만들어 모델을 한번 더 돌려보는 것이였다. 대회에서 주어진 이미지 데이터셋은 총 1570장. 테스트 데이터셋은 3140장. 이미지는 총 17개의 클래스로 분류되는데, 트레인 데이터셋을 클래스별로 분류해보면, 1번, 13번, 14번 클래스의 이미지 데이터셋이 부족한 것을 볼 수 있다. 나머지는 모두 100개씩 있지만, 1번은 46개, 13번은 74개, 15번은 50개의 이미지만 있다. 아래 그림은 같은 팀원인 J님이 만드신 그림! 사실 이전까지는 데이터 임밸런스 감수하고, 그냥 각 이미지 * 10배로..
더보기