Search

LLM을 칩 위에 ‘인쇄’하는 Taalas의 방식

URL
날짜
2026/02/23
생성 일시
2026/02/22 17:20
태그
GeekNews
Taalas는 Llama 3.1 8B 모델을 ASIC 칩에 직접 새겨 넣어 초당 17,000토큰 추론 속도를 달성한 스타트업임 GPU 기반 시스템보다 10배 저렴하고, 10배 적은 전력, 그리고 10배 빠른 추론 성능을 주장함 ... ||