1. WebtoonMe / 10:00
    • 웹툰 모델 개발: 생성 모델의 트랜드를 읽고 적용 Trend: Model Centric -> Data-Centric StyleGAN 기반 모델 데이터를 “잘” 만든 다음 -> 간단한 모델을 학습 StyleGAN은 추론 속도가 느려서 프로덕트로 사용하기 어려움
  • 어떻게 데이터를 만들었나 독자적인 데이터 생성 프로세스 구축 V2 모델 사용 SoTA 모델 활용 사람 얼굴 / 사람 전신 / 배경으로 구분해서 각각 프로세싱 얼굴 데포르메를 대응하기 위한 Warping
  • Stable Diffusion: 머리카락 처리
  • Data set: FFHQ, LSUN, SHHQ.
  • Robustness(논문의 CutFace)
  • TensorRT, impulse
  • 개발 방법론: 추상화 높은 방법론으로 최대한 빠른 결과로 작지만 유의미한 성공을 보여주고, 이를 바탕으로 전문가를 섭외해서 추상화를 낮추자
  1. 이해, 생성, 효율: 세 마리 토끼 다 잡는 Seq2Seq HyperCLOVA 코퍼스 -> Pre-Training -> 언어모델 -> Instruct-Tuning -> Insturct-언어모델 -> Fine-Tuning -> NLP 도구
    • Compute-Optimality, Domain Adaptation
    • FP16 -> BF16. 자료형도 중요하다!
    • 대화 특화 사전학습 Objective
    • 다음 발화 예측 (Next utterance prediction)
    • 발화 순서 맞추기 (Utterance order reconstruction)
    • 단일 발화 마스킹 (Single utterance masking)
  2. Noir: 메일검색 서버를 반의 반으로 줄여준 신규 검색엔진 제작기 이창현/신우진,NAVER Search
    • 역색인: 검색에서 가장 보편적인 방법(terms -> document id 매칭)
    • full scan: document -> 시퀀스 탐색하며 terms 검색. 볼륨이 크지 않다면 더 우월할 수 있다.
    • I/O 비용이 cpu 비용보다 비싸므로 압축이 시간 감소에 도움이 될 수 있다.(tradeoff 실증 필요)
    • 검색에 파이프라이닝을 적용해서 병렬 처리하면 시간을 줄일 수 있다.
  3. 축산 현장에서의 Deep-tech: 터프하지만 매력적인 이 산업에서의 공대생 생존기 코코 데이터 셋, YOLO MS에서 산업 동물에 대한 데이터 셋이 없음 목측 전문가: 눈으로 동물의 체중을 잼 => AI로 대체