Categories

data-engineering

software-engineering

study/ai-engineering

App

Counter
Apr 1, 2022
Cashwalk Answer
Aug 11, 2022
Clock
Oct 3, 2023
Knight's Tour
May 20, 2025
Dev Hunter 3D
Jun 23, 2025
Random Number Generator
Jun 17, 2022
Spider!
Jun 26, 2022
Sketch Pad
Aug 15, 2022
Tetris
Oct 28, 2022
Minesweeper
Sep 23, 2024
Supaplex
Oct 18, 2024
Omok
Jun 17, 2025
Saju
Jul 1, 2025

←

life

Deview 2023 review

Feb 13, 2023 · 1 min

WebtoonMe / 10:00
- 웹툰 모델 개발: 생성 모델의 트랜드를 읽고 적용 Trend: Model Centric -> Data-Centric StyleGAN 기반 모델 데이터를 “잘” 만든 다음 -> 간단한 모델을 학습 StyleGAN은 추론 속도가 느려서 프로덕트로 사용하기 어려움

어떻게 데이터를 만들었나 독자적인 데이터 생성 프로세스 구축 V2 모델 사용 SoTA 모델 활용 사람 얼굴 / 사람 전신 / 배경으로 구분해서 각각 프로세싱 얼굴 데포르메를 대응하기 위한 Warping
Stable Diffusion: 머리카락 처리
Data set: FFHQ, LSUN, SHHQ.
Robustness(논문의 CutFace)
TensorRT, impulse
개발 방법론: 추상화 높은 방법론으로 최대한 빠른 결과로 작지만 유의미한 성공을 보여주고, 이를 바탕으로 전문가를 섭외해서 추상화를 낮추자

이해, 생성, 효율: 세 마리 토끼 다 잡는 Seq2Seq HyperCLOVA 코퍼스 -> Pre-Training -> 언어모델 -> Instruct-Tuning -> Insturct-언어모델 -> Fine-Tuning -> NLP 도구
- Compute-Optimality, Domain Adaptation
- FP16 -> BF16. 자료형도 중요하다!
- 대화 특화 사전학습 Objective
- 다음 발화 예측 (Next utterance prediction)
- 발화 순서 맞추기 (Utterance order reconstruction)
- 단일 발화 마스킹 (Single utterance masking)
Noir: 메일검색 서버를 반의 반으로 줄여준 신규 검색엔진 제작기 이창현/신우진,NAVER Search
- 역색인: 검색에서 가장 보편적인 방법(terms -> document id 매칭)
- full scan: document -> 시퀀스 탐색하며 terms 검색. 볼륨이 크지 않다면 더 우월할 수 있다.
- I/O 비용이 cpu 비용보다 비싸므로 압축이 시간 감소에 도움이 될 수 있다.(tradeoff 실증 필요)
- 검색에 파이프라이닝을 적용해서 병렬 처리하면 시간을 줄일 수 있다.
축산 현장에서의 Deep-tech: 터프하지만 매력적인 이 산업에서의 공대생 생존기 코코 데이터 셋, YOLO MS에서 산업 동물에 대한 데이터 셋이 없음 목측 전문가: 눈으로 동물의 체중을 잼 => AI로 대체