Logo

회원가입로그인 ENGLISH naver youtube  
search 

IP명 DPIM: 2T1C eDRAM Transformer-in-Memory Chip with Sparsity-Aware Quantization and Heterogeneous Dense-Sparse Core
Category Digital Application 자연어 처리
실설계면적 4㎛ X 4㎛ 공급 전압 1.1V
IP유형 Hard IP 동작속도 333Hz
검증단계 Silicon 참여공정 SF28-2402
IP개요 최근 트랜스포머 모델이 뛰어난 성능을 보이면서 사람들에게 주목받고 있다. 그러나 모델의 크기가 커지고, 광범위한 행렬 연산이 요구됨에 따라 빈번한 데이터 이동과 높은 오버헤드 문제가 발생한다. 이에 대해, 2T1C eDRAM Transformer-in-Memory Chip인 DPIM을 제안한다. 해당 칩은 모델에 대한 연산의 효율을 높이고자 고밀도 eDRAM 셀을 사용하여 대용량 처리 PIM macro를 탑재함으로써 외부 메모리 접근을 줄이고 칩 내 데이터 재사용을 향상시킨다. 또한, 모델을 가속하면서 정확도 저하를 막는 새로운 quantization 기법을 도입한다. 더 나아가, 새로운 양자화 기법을 지원하면서 트랜스포머 모델의 연산을 효율적으로 처리한다.
- 레이아웃 사진 -