Google DeepMind сообщила, что благодаря использующей обучение с подкреплением системе ИИ AlphaDev, удалось разработать усовершенствованные алгоритмы сортировки. В компании отмечают, что в отличие от общепринятых подходов, разработка велась с нуля при помощи игры, основанной на ассемблерных кодах.
Делая ход, AlhpaDev оценивала сгенерированный ей алгоритм и информацию в процессоре, а затем выбирала очередную инструкцию, которую добавляла при новом ходе.
В DeepMind отмечают, что игра получилась невероятно сложной за счет огромного количества возможных комбинаций, число которых аналогично количеству частиц во вселенной или количеству возможных комбинаций ходов шахматах (10^120). При этом всего один неверный ход мог привести к порче всего алгоритма.