Обложка канала

NeuroHive - Нейронные сети

3406 @neurohive

Канал про нейронные сети и новые методы решения задач в машинном обучении

NeuroHive - Нейронные сети

3 года назад
Открыть в
Inflection-1: большая языковая модель, превосходящая GPT-3.5 в решении логических задач Стартап Inflection официально представил Inflection-1 - большую языковую модель, на которой основан чат-бот Pi. Размер и возможности модели сопоставимы с GPT-3.5 (на которой основан ChatGPT), а обучение проводилось "на тысячах" GPU Nvidia H100. Inflection-1 конкурентоспособна или даже превосходит GPT-3.5, LLaMA и PaLM-540B в решении экзаменационных и логических задач. Inflection-1 в среднем достигает средней оценки 72.7% по всем 57 задачам и точности более 90% на 5 задачах, 85% на 15 задачах. Для сравнения, эксперт-человек набирает в среднем 89.8%, в то время как средний человеческий оценщик показывает результат 34.5%. Результаты свидетельствуют о хорошей производительности Inflection-1 в решении экзаменов средней и старшей школы и логических задач, например, "если Ваня бросил мяч на крышу, а Женя кинул его обратно, где находится мяч?". #AppliedDS #StateoftheArt