baseline 1.0에서 모델의 학습이 원활하게 이루어지지 않은 점을 해결하였습니다.
baseline 1.0에서 validation 정확도가 약 8% 정도가 나왔는데, 학습이 되지 않은 것이라고 판단하였습니다. 관련하여 모델이 잘 학습할 수 있도록 베이스라인을 수정하였습니다.
horovod를 활용한 분산 처리 대응
성능을 높이기 위한 여러 학습 테크닉(gradient-accumulation, additional layer 등) 추가 구현
변경 전 후 비교