TechSparks(@techsparks). Разработчики Гугла опубликовали красивую и сильную работу, в которой отстаивают одно свое не очень в

Разработчики Гугла опубликовали красивую и сильную работу, в которой отстаивают одно свое не очень видимое снаружи преимущество перед прочими мощными системами машинного обучения. В отличие от остальных, полагающихся на чипы от Nvidia, Гугл создает собственные чипы серии Tensor Processing Unit (TPU). Более 90% ИИ-вычислений в датацентрах компании ведется именно с помощью этих чипов, и вот представлено и описано четвертое их поколение в статье с вкусным названием TPU v4: An Optically Reconfigurable Supercomputer for Machine Learning with Hardware Support for Embeddings. Свежие суперкомпьютеры Гугла используют по 4096 таких процессоров. Масштабы ресурсов для обучения языковых моделей выглядят так: Google's PaLM model - its largest publicly disclosed language model to date - was trained by splitting it across two of the 4,000-chip supercomputers over 50 days. Причем утверждается, что система в эксплуатации с 2020 года, и что MidJourney использовала как раз ее. В общем, серьезная заявка на еще одно соревнование техногигатов: не только в софте, но и в железе. www.reuters.com/technol…23-04-05 Оригинал статьи - https://arxiv.org/pdf/2304.01433.pdf