
IP명 | DPIM: 2T1C eDRAM Transformer-in-Memory Chip with Sparsity-Aware Quantization and Heterogeneous Dense-Sparse Core | ||
---|---|---|---|
Category | Digital | Application | 자연어 처리 |
실설계면적 | 4㎛ X 4㎛ | 공급 전압 | 1.1V |
IP유형 | Hard IP | 동작속도 | 333Hz |
검증단계 | Silicon | 참여공정 | SF28-2402 |
IP개요 | 최근 트랜스포머 모델이 뛰어난 성능을 보이면서 사람들에게 주목받고 있다. 그러나 모델의 크기가 커지고, 광범위한 행렬 연산이 요구됨에 따라 빈번한 데이터 이동과 높은 오버헤드 문제가 발생한다. 이에 대해, 2T1C eDRAM Transformer-in-Memory Chip인 DPIM을 제안한다. 해당 칩은 모델에 대한 연산의 효율을 높이고자 고밀도 eDRAM 셀을 사용하여 대용량 처리 PIM macro를 탑재함으로써 외부 메모리 접근을 줄이고 칩 내 데이터 재사용을 향상시킨다. 또한, 모델을 가속하면서 정확도 저하를 막는 새로운 quantization 기법을 도입한다. 더 나아가, 새로운 양자화 기법을 지원하면서 트랜스포머 모델의 연산을 효율적으로 처리한다. | ||
- 레이아웃 사진 -
![]() |