Как-то давно наткнулся на довоенный датасет тиндера в Москве — кто-то играл в дейтинг в промышленных масштабах и спарсил все женские анкеты какие были в радиусе Мск, включая самое интересное — биографии (там много персонального, так что выкладывать его не буду).
Давно собирался поковырять этот датасет и тут как раз на днях в ChatGPT добавили поддержку исполнителя кода прямо в процессе генерации.
В общем, то что у меня в прошлый раз заняло часов 5 (и мне стало лень и я забил), теперь я получил минут за 10 промптинга нового режима.
Внутри «Code Interpreter» (по моим ощущениям) все та же GPT4, но возможно с расширенным контекстом и каким-то адаптером который умеет вызывать исполнение кода и ждать его завершения.
Включается новый режим исполнения кода в настройках профиля, там где beta, и только если у вас платный аккаунт.
Вот вам облако популярных слов и фраз из этого датасета, чем больше фраза — тем чаще она встречается.
Всего в датасете 30 000 записей, и только 1/3 из них заполненные bio, вы чего, люди 🫠
~2.4% девушки любят аниме настолько, что указали его в bio, так что анимешники – не унывайте 👍