link 세부 정보
정보 바로가기 : 화웨이 "자체 칩으로 엔비디아 칩 효율 능가"…새로운 데이터센터 아키...
화웨이 "자체 칩으로 엔비디아 칩 효율 능가"…새로운 데이터센터 아키...[카테고리 설정이 아직되어 있지 않습니다.]
이런 아키텍처는 특히 대규모 전문가 혼합(MoE) 모델의 병렬 처리나 분산 키-값(KV) 캐시 접근과 같은... 같은 MoE 모델을 위한 차세대 AI 서비스 구조를 제시했다. ▲프리필(prefill), 디코드(decode), 캐싱(caching)을...