칼바람 조합 승률을 예측해보자 - 3
주피터 노트북에서 돌렸다.
처음에는 칼바람에서는 승률 높은 챔피언과 낮은 챔피언을 특징으로 생각해 2가지 팀을 나눠 모델을
X -히든레이어(30)-히든레이어(30)-히든레이어(2)-Y
이런 식으로 했었다. 하지만 정확도가 70 주변을 머물렀고 학습을 많이 시켜도 개선되지 않았다.
히든레이어가 많으면 어떻게 되나 보니 갑자기 정확도가 떡상했다. 이때부터 적당한 모델 찾기 노가다가 시작되었다.
80만 개 정도의 매치로 하기엔 시간이 오래 걸려 12만 개의 데이터를 이용해 적합한 모델을 찾으려 했다.
모델을 찾는 중 여러 가지 문제가 있었다.
하나는 같은 모델이어도 샘플에 따라 다른 결과를 보인다는 것이다.
위의 2개의 이미지는 똑같은 모델로 돌렸으나 결과가 매우 차이 났다.
또
BatchNormalization을 하면 정확도가 올라가고 학습이 잘못되는 것을 막아 준다고 해서 넣었는데 test값이 떨리는 현상이나 학습과 동떨어지게 나왔다.
왜인지는 모르겠다. 나중에 생각해보자.
나름 괜찮은 모델을 찾았다 생각해 모든 데이터를 넣고 돌렸다.
그런데
이때 무언가 잘못됐음을 느꼈다. 지금 생각해보니 배치 정규화를 하면 좋아질 느낌이다.
한 학습에 4분씩 걸리고 위에 좋은 모델들은 로그함수처럼 초반에 금방 올라가니
20번씩 돌리면서 감을 잡아보려 한다.
구글에서 자동으로 적합한 모델 찾아주는 게 나왔다는데 생각이 나면 적용시켜보면 좋을 듯이다.