Logo

회원가입로그인 ENGLISH naver youtube  
search 

IP명 고성능 Fused Multiply-Add(FMA)를 사용한 AI 가속기 설계
Category Digital Application AI 가속기
실설계면적 4㎛ X 4㎛ 공급 전압 1.8V
IP유형 Hard IP 동작속도 1Hz
검증단계 Silicon 참여공정 SF28-2401
IP개요 본 연구는 booth radix 4와 wallace-tree를 이용하여 FP32 FMA 연산기를 구현한다. FMA로 구성된 SYSTOLIC_ARRAY는 곱셈과 덧셈을 동시에 함으로 CLOCK TIMING을 최소화 할수 있고 이외의 SPECIAL FUNCTION들도 최적화 하여 DEEP LEARNING에 필요한 행렬 연산과 SPECTIAL FUNCTION들을 가속화 한다. MNIST dataset을 이 칩을 통해 TRANSFORMER architecture 연산을 수행함으로서 추론 속도를 즉정한다.
- 레이아웃 사진 -