미팅내용
원하는 방향
- 이미지와 자연어 간 매칭이 안되는 메뉴 → 어떤 패턴을 갖는지 (anomaly detection)
- detection → matching → 📌 기억이 안남
음식 학습데이터
- AI hub 를 조금 정제 및 추가
- 음식 데이터 features 만드는거 진행 중
- 전체데이터 수: 46만 8천 (AI hub), 82만개 (real)
- class 갯수를 말씀하시는거면,미정제 19000개 정도 였던거 같습니다
- 배식 받기전, 먹고 난 후 → 구분하기 쉽지 않음
- 파일 형식 → CoCo 데이터셋과 같음
- 기존과 음식데이터와 다른점
- 식판이나, 정형화된 데이터
- 한 이미지안에 여러개의 음식들이 들어있음
음식 데이터를 어떻게 처리하고 있는지
누비랩에서 구축한 푸드사전이 어떻게 되어있는지
- ko-nlpy, BPE 같은 토크나이저를 쓰면
- 음식 데이터에 비효과적
- 음식은 합성어이기 때문
지코실에 바라는 점
- 모델개선은 크게 매력없음
- 데이터를 깊게 이해
- 실제로 어느 메뉴가 잘 안 될까를 탐색과 고민