FERMI-ML: Гибкий и ресурсоэффективный макроблок памяти в оперативном ОЗУ для ускорения TinyML

2025-11-18 05:00:00

Краткое содержание

arXiv:2511.12544v1 Тип анонса: cross Аннотация: Растущий спрос на выполнение выводов TinyML с низким энергопотреблением и высокой площадной эффективностью на устройствах AIoT требует таких архитектур памяти, которые минимизируют перемещение данных, сохраняя при этом высокую вычислительную эффективность. В данной статье представлена FERMI-ML — гибкий и ресурсоэффективный макрос SRAM с архитектурой Memory-In-Situ (MIS), разработанный для ускорения TinyML. Предлагаемая XNOR-ячейка RX9T на 9 транзисторах интегрирует 5T ячейку хранения с 4T XNOR вычислительным блоком, что позволяет выполнять операции MAC и CAM с переменной точностью в пределах одного массива. Аккумулятор на базе компрессорного дерева C22T на 22 транзисторах обеспечивает логарифмическое вычисление MAC с разрядностью от 1 до 64 бит с уменьшенной задержкой и энергопотреблением по сравнению с традиционными деревьями сумматоров. Макрос объемом 4 КБ обладает двойной функциональностью для in-situ вычислений и CAM-операций поиска, поддерживая точность Posit-4 или FP-4. Результаты пост-топологического моделирования в 65 нм техпроцессе показывают работу на частоте 350 МГц при напряжении 0,9 В, обеспечивая пропускную способность 1,93 TOPS и энергоэффективность 364 TOPS/Вт.

Полный текст статьи пока не загружен.

Читать оригинал статьи