AI Engineering: Chapter 9, 10
AI Engineering by Chip Huyen
Chapter 9
추론 최적화: Inference Optimization
모델을 더 나은 성능으로, 더 저렴하게, 더 빠르게 만드는 것은 항상 중요
추론 최적화는 모델, 하드웨어, 서비스 레벨에서 가능
AI 추론의 병목과 이를 극복하기 위한 기술 설명
종종 모델을 빠르게 만드는 건...
study / ai-engineering · 2025-03-16 · 11 min