Обложка канала

Умный программист: it, программирование, hi-tech

Легендарный Гарвардский курс по основам программирования в закрепе канала! Поможем научиться программировать бесплатно

Умный программист: it, программирование, hi-tech

3 года назад
Открыть в
Специалисты из OpenAI опубликовали исследование, в котором описали, как при помощи языковой модели GPT-4 они пытались объяснить работу нейронов её предшественницы, GPT-2. Сейчас разработчики компании стремятся продвинуться в «интерпретируемости» нейросетей и понять, почему те создают именно тот контент, который мы получаем. Одно из объяснений этой неудачи, предложенное в OpenAI, заключается в том, что нейроны могут быть «полисемантичными», что означает, что типичный нейрон в контексте исследования может иметь несколько значений или быть связанным с несколькими понятиями. Кроме того, языковые модели могут содержать «чуждые понятия», для которых у людей просто нет слов.