Обложка канала

Robotics Channel

Новости робототехники и искусственного разума. Присоединяйтесь и будете в первом ряду наблюдать как роботы захватывают мир.

Robotics Channel

6 лет назад
Открыть в
«Мифический» AI-ускоритель c рекордными параметрами

Молодая американская компания Mythic утверждает, что создала первый в отрасли аналоговый матричный процессор для нейросетей.

Чип M1108 AMP предназначен для высокопроизводительных приложений искусственного интеллекта, включая AR / VR и беспилотники.

По мнению разработчиков, он устанавливает новый эталон высокой производительности и низкого энергопотребления в одном экономичном устройстве.

В названии чипа отражено 108 блоков параллельных вычислений — AMP (Accelerated Massive Parallelism) tiles. Также он содержит АЦП, 32-битный процессор RISC-V, векторные ускорители для набора инструкций SIMD, массив ячеек флэш-памяти и встроенную память SRAM, плюс высокопроизводительный маршрутизатор Network-on-Chip (NOC).

Пиковая теоретическая производительность M1108 обеспечивает до 35 триллионов операций в секунду (TOPS). Это чуть больше, чем у AI Nvidia Xavier AGX (32 TOPS).

При этом во время работы моделей AI с максимальной пропускной способностью энергопотребление M1108 составляет около 4 Вт (ускоритель от Nvidia — от 10 до 30 Вт).

Новый чип обеспечивает энергоэффективное выполнение сложных моделей ИИ, таких как ResNet-50, YOLOv3 и OpenPose Body25. Например, остаточная свёрточная нейросеть ResNet-50 классифицирует на нём изображения со скоростью до 870 кадров в секунду.

M1108 совместима с широким спектром хост-процессоров, включая Intel x86, NXP iMX8, NVIDIA Jetson и Qualcomm RB5.

На уровне софта поддерживаются стандартные среды, включая PyTorch, TensorFlow 2.0 и Caffe. Заявлена работа M1108 в Ubuntu, NVIDIA Linux4Tegra (L4T), а в будущей версии планируется добавить поддержку Windows 10.

Помимо отдельных микросхем, M1108 также поставляется в виде плат форм-фактора M.2 и карт расширения с интерфейсом PCIe.

Платы M.2 предлагаются в первую очередь для систем, выполняющих обработку моделей глубоких нейронных сетей (DNN), особенно если нужно одновременно запустить несколько DNN на системе компактного формата.

Источник: EE Times