NeuroHive - Нейронные сети все посты канала

NeuroHive - Нейронные сети

Нейросети, улучшающие качество фото: обзор бесплатных онлайн сервисов В обзоре рассмотрим онлайн сервисы на основе нейросетей, которые улучшают качество фото бесплатно. Улучшение качества предполагает увеличение разрешения фото без потери качества до 4к и 8к, повышение четкости, устранение шума и размытости. Для проверки результатов работы будем использовать одну и ту же фотографию в разных онлайн сервисах. Лимит на бесплатную обработку в среднем варьируется от 5 попыток всего до нескольких каждый день. Если вы хотите бесплатно обрабатывать множество фотографий, то запустите нейросеть локально и платите только за электричество, например, попробуйте open source модель Upscaуl. #AppliedDS #AIApps

NeuroHive - Нейронные сети

Audiocraft — это открытая PyTorch-библиотека для генерации музыки и звуков по текстовой подсказке. Разработчики предоставили код двух state-of-the-art моделей: MusicGen и AudioGen. Обновленная версия кодека Encodec обеспечивает еще более высокое качество генерации музыки с минимальным количеством артефактов. Audiocraft открывает новые перспективы в области создания аудио-контента, способного удовлетворить самые взыскательные потребности. Важно подчеркнуть, что Audiocraft — это не только библиотека моделей. Авторы активно поддерживают открытый код, предоставили веса моделей и обучающий код, чтобы подпитать исследотелей и разработчиков в области генерации аудио. #Development #StateoftheArt

NeuroHive - Нейронные сети

Вот есть задача: сделать так, чтобы пользователи вводили текст быстро и без ошибок. Для этого клавиатура должна уметь предугадывать опечатки и помогать их исправлять. Как этого добиться? Этой задаче посвящена статья на Хабре, в которой разработчик Яндекса описал опыт создания новой нейроязыковой модели. Какие были предпосылки, как выглядит современная архитектура языковой модели, какое у неё качество и производительность. Внутри цифры и советы: например, вы узнаете, почему пословной языковой модели может не хватать и требуется так же побуквенная, и стоит ли использовать LSTM-энкодер в 2023 году. Подробности на Хабре: habr.com/ru/comp…s/751598 #StateoftheArt

NeuroHive - Нейронные сети

Исследователи MIT представили PIGINet – нейросеть для обучения роботов, которая по описанию задачи, изображению сцены и текущему состоянию перебирает возможные варианты действий и выбирает их наиболее оптимальную последовательность. PIGINet нацелен на ускорение решения роботами бытовых задач путем предварительного выбора правильного плана и, как следствие, сокращения количества ошибочных действий. Модель обучалась на небольшом относительно других алгоритмов количестве задач – около 500. Измерив время, затраченное на решение задач, исследователи сравнили PIGINet с предыдущими подходами: нейросеть сократила время планирования задач и движения робота на 50-80%. #StateoftheArt

NeuroHive - Нейронные сети

Как решить проблему нехватки качественных данных для обучения ML-моделей? Качественная разметка данных требует экспертной оценки и анализа, большого количества рабочего времени и ресурсов. Размеченные данные должны быть точными и достоверными. Погрешности и неточности могут значительно влиять на эффективность обучения нейросетей. Одним из решений этой проблемы является использование наборов данных, которые уже размечены, дополнительно проверены и обогащены экспертами для требуемой задачи. Компания Annotate специализируется на разметке различных типов данных, включая изображения, тексты и видео. Разметчики компании обладают большим опытом и обеспечивают точную и качественную разметку. Сосредоточьтесь на проектировании и разработке, а разметку данных предоставьте Annotate. 🌐 Оставить заявку: https://annotate.ru/start 📞 Связаться по почте: [email protected] 📞 Позвонить: +7 495 120-90-14

NeuroHive - Нейронные сети

⚡️ Stability AI объявила о выпуске Stable Diffusion SDXL 1.0, новой версии популярной модели для генерации изображений. SDXL 1.0 представляет собой базовую модель с 3,5 миллиарда параметров и пайплайн с ансамблем моделей из 6,6 миллиарда параметров. Модель уже доступна на GitHub, Amazon Bedrock, через Stability AI API и в пользовательских приложениях Clipdrop и DreamStudio. Stability AI заявляет, что благодаря обновленной архитектуре модели и процессу обучения стало меньше артефактов и искажений, изображения точнее соответствуют подсказкам, модель более точно копирует стили отрисовки. Скорость работы при этом возросла. Для дообучения модели под конкретные задачи с помощью Stability API будет требоваться всего пять изображений. Сейчас эта функция находится в ограниченном тестировании с несколькими партнерами, и будет выпущена в ближайшие недели. #StateoftheArt

NeuroHive - Нейронные сети

Сервис для создания сайтов Wix анонсировал запуск чат-бота Wix AI, позволяющего создавать и изменять сайты с помощью запросов на естественном языке. Помимо этого, инструмент будет предоставлять персонализированные стратегии по улучшению сайтов. Пользователю требуется описать чат-боту Wix AI тему и предназначение планируемого сайта. Бот задаст несколько уточняющих вопросов и сгенерирует сайт, включая домашнюю страницу и все внутренние страницы с текстом и изображениями. Чат-бот автоматически настроит интеграцию сайта с бизнес-приложениями Wix, позволяя на лету создавать интернет-магазины, системы бронирования отелей и записи на мероприятия. #AppliedDS

NeuroHive - Нейронные сети

Вышло новое поколение языковых моделей Llama - модели Llama 2 7B, 13B, 34B и 70B, и дообученные для ведения диалогов модели Llama-2-Chat 7B, 13B и 70B. Модели 7B, 13B и 70B доступны open source для исследовательских и коммерческих целей. Ответы моделей оценивались по двум показателям: полезность и безопасность, и результаты превзошли все state-of-the-art модели с открытым исходным кодом. В сравнении с ChatGPT результаты Llama-2-Chat 70B находятся в пределах доверительного интервала отклонения. Модели были опубликованы 18 июля, и в первые часы после релиза количество запросов к серверам превысило ожидания и на данный момент для загрузки модели необходимо оставить заявку и дождаться своей очереди. #StateoftheArt

NeuroHive - Нейронные сети

Google обновила языковую модель Bard – теперь она работает на 46 языках в более чем 200 странах. Новые функции включают работу с изображениями, каталогизацию диалогов и управление стилем ответов модели. В обновленный Bard интегрирована платформа Google Lens, что позволяет обрабатывать мультимодальные запросы: в модель можно отправить изображение вместе с текстовым заданием, и Bard выполнит его. Также пользователи могут изменить тон и стиль ответов модели, выбирая из пяти вариантов: простой, длинный, краткий, профессиональный или повседневный. #StateoftheArt

NeuroHive - Нейронные сети

Stability AI представила нейросеть для создания детализированных рисунков из набросков Stable Doodle. Пользователь подает на вход набросок изображения, вводит краткое описание финального результата, выбирает стиль и нейросеть за считанные секунды создает 3 варианта изображения. Если результат не устроил, попытку можно повторить неограниченное число раз. Stable Doodle объединяет в себе модель Stable Diffusion XL с сетью T2I-Adapter, которая позволяет подавать на вход дополнительные условия для контроля финального результата: наброски, карты сегментации или ключевые позы. #AppliedDS

NeuroHive - Нейронные сети

LONGLLaMA: языковая модель, способная обрабатывать длинные контексты из 256 000 токенов Модель LONGLLAMA-3B достигла точности 94,5% при 100 тысячах токенов и 73% при 256 тысячах токенов, в то время как базовая модель OpenLLAMA не способна обрабатывать контексты, превышающие ее длину обучения в 2 тысячи токенов. Модель дообучалась по методу Focused Transformer (FOT) для расширения эффективного понимания контекста. FOT использует подход на основе контрастного обучения, при котором модель обучается как на позитивных, так и на негативных примерах.

NeuroHive - Нейронные сети

🔥 Плагин Code Interpreter для ChatGPT стал доступен всем пользователям платной версии. Code Interpreter умеет работать не только с кодом. С новым плагином пользователи могут выполнять эти задачи в одном интерфейсе: 1. Визуализировать данные, рисовать красивые диаграммы и графики на основе данных; 2. Обрабатывать изображения: обрезать, конвертировать, улучшать разрешение, настраивать яркость и контрастность, доставать метаданные; 3. Создавать простые игры за несколько минут из графических моделей; 4. Искать инсайты в данных; 5. Конвертировать GIF в MP4 и добавлять эффекты; 6. Выполнять технический анализ финансовых активов; 7. Создавать HTML сайты с визуализацией; 8. Анализировать музыкальные предпочтения; 9. Распознавать текст на изображении; 10. Обрабатывать неструктурированные данные. Включить плагин можно в настройках аккаунта, если куплена версия Plus. #AppliedDS

NeuroHive - Нейронные сети

Инфоцыганей станет больше? IT-специалисты из Дубай создали конструктор онлайн-курсов MetaMinder на основе AI (Искусственного интеллекта) 🛑Нейросеть может создать автору полноценный онлайн-курс с нуля для автора всего за 10 минут. Доступен русский язык. Методологи уже не будут нужны? Мы собрали для вас подбородный фото-тьюториал по тому, как работает конструктор: 1. Определяем название, аудиторию, концепцию и продолжительность курса 2. Конструктор сам определяет темы уроков, а также у вас есть возможность сгенерировать план занятия 3. После чего создать урок с подробным описанием 4. Вам остаётся только завершить и сохранить PDF вашего курса Для первых 1000 пользователей конструктор полностью БЕСПЛАТНЫЙ. ⚡️Протестировать ⚡️

NeuroHive - Нейронные сети

Израильский стартап Deepdub анонсировал Deepdub Go – сервис автоматического дубляжа видео на 65 языков. Целевая аудитория платформы – студии разработки игр, рекламные агентства, платформы онлайн-обучения и другие авторы контента. Сервис осуществляет сквозной процесс дубляжа, включающий автоматическую транскрипцию, перевод, генерацию голоса и микширование аудио. Особенностью Deepdub Go является точный учет контекста оригинальной аудиодорожки, включая воспроизведение эмоций говорящего и корректный перевод шуток и идиом. #AppliedDS

NeuroHive - Нейронные сети

Исследователи Университета Висконсин-Мэдисон представили text-to-image диффузную модель PACGen (Personalized and Controllable Text-to-Image Generation) для переноса объекта с изображения на новую сцену, сгенерированную по текстовой подсказке. Для этого требуется подать на вход несколько изображений объекта, текстовую подсказку с описанием новой сцены и выделить область, в которую следует поместить объект. Исследователи объединили две open source модели, построенных на архитектуре Stable Diffusion. В результате получилась новая модель, точно контролирующая расположение и размер выбранного объекта на новой сцене. Метод регионально-управляемой выборки обеспечил сохранение качества и достоверности сгенерированных изображений на выходе. PACGen обучилась разделять идентичность объекта и пространственную информацию для создания персонализированных изображений. Потенциал модели огромен, например, дизайнеры рекламы могут размещать свою продукцию в любом желаемом месте на рекламном баннере. #StateoftheArt

NeuroHive - Нейронные сети

🔴Марковский Процесс Принятия Решений и Метод Монте-Карло 11 июля 20.00 (мск) погружаемся в мир Reinforcement Lerning на открытом уроке одноименного курса в OTUS и разберем Марковский процесс принятия решений (MDP) и управления Монте-Карло (MCC). Данные методы используются в областях робототехники, медицины, управления, экономики, а специалисты Reinforcement Lerning становятся сегодня одними из самых уникальных на рынке труда в IT. ✅В процессе вебинара на простых примерах познакомимся с формальными математическими определениями MDP и применим эти знания к более комплексным задачам. Разберем, как работает метод Монте-Карло для поиска оптимальных стратегий.Занятие завершится обзором доступных пакетов с открытым исходным кодом бенчмарками алгоритмов RL. ▶️Регистрация для участия https://otus.pw/OgBe/ Вебинар состоится в рамках онлайн-курса «Reinforcement Learning» для DS/ML/DL специалистов, IT-специалистов, которые хотят погрузиться в обучение с подкреплением. Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963. 2RanykSya8Q

NeuroHive - Нейронные сети

DragGAN: open source модель для манипуляции созданными GAN изображениями Исследователи из Института Макса Планка, MIT и Google представили подход DragGAN для манипуляции содержимым изображений, созданных с помощью GAN. Достаточно расставить несколько опорных и целевых точек на изображении, и модель переместит опорные точки для соответствия целевым точкам. При желании можно использовать бинарную маску, чтобы оставить часть изображения неизменным. DragGAN деформирует изображение с точным контролем смещения пикселей, позволяя менять позу, форму, выражение лица и композицию объектов: животных, автомобилей, людей, природных явлений. Авторы также показали, как можно манипулировать реальными (не сгенерированными нейросетью) изображениями. Для этого сперва производится инверсия GAN для отображения его в латентном пространстве StyleGAN, после чего изображение редактируется. #StateoftheArt

NeuroHive - Нейронные сети

Исследовательская лаборатория AI Foundation запустила AI.XYZ – платформу для создания личных AI-ассистентов. Компания заявляет, что AI.XYZ является первой в мире платформой для управления жизнью с использованием AI, позволяющей решать как личные, так и профессиональные задачи. Каждый ассистент уникален и может помочь с такими задачами, как ведение заметок, написание сообщений, мозговой штурм, обсуждение разных точек зрения и приоритезация задач. Пользователи могут расширить базу знаний своего ассистента, отправляя ему документы, ссылки и заметки, а также предоставив доступ к своей почте, мессенджеру, календарю и списку дел. #AppliedDS