- WebtoonMe / 10:00
- 웹툰 모델 개발: 생성 모델의 트랜드를 읽고 적용
Trend: Model Centric -> Data-Centric
StyleGAN 기반 모델
데이터를 “잘” 만든 다음 -> 간단한 모델을 학습
StyleGAN은 추론 속도가 느려서 프로덕트로 사용하기 어려움
- 어떻게 데이터를 만들었나
독자적인 데이터 생성 프로세스 구축
V2 모델 사용
SoTA 모델 활용
사람 얼굴 / 사람 전신 / 배경으로 구분해서 각각 프로세싱
얼굴 데포르메를 대응하기 위한 Warping
- Stable Diffusion: 머리카락 처리
- Data set: FFHQ, LSUN, SHHQ.
- Robustness(논문의 CutFace)
- TensorRT, impulse
- 개발 방법론: 추상화 높은 방법론으로 최대한 빠른 결과로 작지만 유의미한 성공을 보여주고, 이를 바탕으로 전문가를 섭외해서 추상화를 낮추자
- 이해, 생성, 효율: 세 마리 토끼 다 잡는 Seq2Seq HyperCLOVA
코퍼스 -> Pre-Training -> 언어모델 -> Instruct-Tuning -> Insturct-언어모델 -> Fine-Tuning -> NLP 도구
- Compute-Optimality, Domain Adaptation
- FP16 -> BF16. 자료형도 중요하다!
- 대화 특화 사전학습 Objective
- 다음 발화 예측 (Next utterance prediction)
- 발화 순서 맞추기 (Utterance order reconstruction)
- 단일 발화 마스킹 (Single utterance masking)
- Noir: 메일검색 서버를 반의 반으로 줄여준 신규 검색엔진 제작기
이창현/신우진,NAVER Search
- 역색인: 검색에서 가장 보편적인 방법(terms -> document id 매칭)
- full scan: document -> 시퀀스 탐색하며 terms 검색. 볼륨이 크지 않다면 더 우월할 수 있다.
- I/O 비용이 cpu 비용보다 비싸므로 압축이 시간 감소에 도움이 될 수 있다.(tradeoff 실증 필요)
- 검색에 파이프라이닝을 적용해서 병렬 처리하면 시간을 줄일 수 있다.
- 축산 현장에서의 Deep-tech: 터프하지만 매력적인 이 산업에서의 공대생 생존기
코코 데이터 셋, YOLO
MS에서 산업 동물에 대한 데이터 셋이 없음
목측 전문가: 눈으로 동물의 체중을 잼 => AI로 대체