Machinelearning. Страница 5

19282 @ai_machinelearning_big_data

Открыть

Технологии . программирование , нейронные сети . канал с самой свежей и актуальной информацией из мира it

Machinelearning

3 года назад

💬 3D-Speaker: A Large-Scale Multi-Device, Multi-Distance, and Multi-Dialect Corpus for Speech Representation Disentanglement A large-scale speech corpus to facilitate the research of speech representation disentanglement. 3D-Speaker - это набор инструментов с открытым исходным кодом и крупномасштабный корпус речи, для мультимодальной проверки дикторов, распознавания дикторов и разделение дикторов. 3D-Speaker содержит более 10 000 дикторов, каждый из которых одновременно записывается несколькими устройствами, расположенными на разных расстояниях, а некоторые дикторы говорят на нескольких диалектах. 🖥 Github: github.com/alibaba…-Speaker 📕 Paper: https://arxiv.org/abs/2306.15354v1 🔗Dataset: https://3dspeaker.github.io/ ai_machinelearning_big_data

Читать дальше
Machinelearning

3 года назад

А вы знаете, что такое пирамида признаков? А трансформеры (нет, мы не про фильм)? Это термины, которые используют инженеры, работающие с нейронными сетями! Мы их нашли в канале ИТ-компании «Криптонит» — подписывайтесь на ребят! У них выходят материалы и про ML, и про роботов, и про программирование. А ниже мы выбрали несколько терминов из их нейрословаря🟡 📍Explaining Away — эффект редукции причины как упрощённая схема рассуждений. 📍Инференс (inference) — с точки зрения разработчика это третий этап жизненного цикла искусственной нейронной сети (после её обучения и развёртывания). 📍Многослойный перцептрон (MLP) — это одна из элементарных архитектур, с которой часто начинают освоение нейронных сетей и принципов их обучения. 📍Пирамида признаков (FPN, Feature Pyramid Net) — это вычислительная архитектура, используемая в машинном зрении для обработки изображений без привязки к их разрешению. 📍Трансформеры (transformers) — это не только роботы, но и прогрессивное семейство архитектур нейросетей от Google.

Читать дальше
Machinelearning

3 года назад

🖥 Free Courses on Large Language Models Крутые бесплатные курсы по большим языковым моделям. ▪ChatGPT Prompt Engineering for Developers ▪LangChain for LLM Application Development ▪Building Systems with the ChatGPT API ▪Google Cloud Generative AI Learning Path ▪Introduction to Large Language Models with Google Cloud ▪LLM University ▪Full Stack LLM Bootcamp ai_machinelearning_big_data
Реклама

Рекламный пост
Machinelearning

3 года назад

Объектно-ориентированный подход чаще всего применяют в крупных проектах, где над одним приложением работают много разработчиков. Так как каждый программист работает над своей отдельной частью программы, сокращается количество ошибок и ускоряется процесс. На курсе Яндекс Практикума «Базовый UML» вы за 2 месяца пройдёте все этапы работы над моделированием системы: от описания пользовательских требований до структурного и поведенческого моделирования. А ещё: • изучите основные диаграммы в нотации UML, описывающие бизнес-процессы; • получите представление о применении UML для моделирования систем; • научитесь работать в Draw.io, StarUML, Plant UML. Все студенты получат реальные кейсы, сопровождение от специалистов и работающие проекты в портфолио. Карьерный центр поможет с поиском работы: 69% студентов уже работают по специальности. Занимайтесь онлайн в любое время, в своём темпе.

Читать дальше
Machinelearning

3 года назад

🚶‍♂️ MotionGPT: Human Motion as Foreign Language MotionGPT consists of a motion tokenizer responsible for converting raw motion data into discrete motion tokens, as well as a motion-aware language model that learns to understand the motion tokens from large language pre-training models by corresponding textual descriptions. MotionGPT, унифицированная, универсальная и удобная модель языка движения для решения множества задач, связанных с движением. ⏩ Project: https://motion-gpt.github.io/ 🖥 Github: https://github.com/openmotionlab/motiongpt 📕 Paper: https://arxiv.org/pdf/2306.14795.pdf 🔗Dataset: https://paperswithcode.com/dataset/amass ai_machinelearning_big_data

Читать дальше
Machinelearning

3 года назад

Зачем Data-инженеру Spark В Почте Mail.ru работают со стеком Hadoop, Hive, Clickhouse, Spark. В данной статье на Хабре Data-инженер из команды Почты Mail.Ru остановился на некоторых аспектах работы с данными в Spark. Он ответил на следующие вопросы: как превратить 7 петабайт в 0,5 петабайт, что позволило сэкономить годовой бюджет по закупке серверов и построить своё классное хранилище без последующей переделки. Также в статье: архитектурные паттерны в хранилище Почты, эффективное хранилище данных, форматы хранения данных, параллельная обработка данных в Spark, запись колоночных файлов, запросы к данным в Spark и др. Хабр: habr.com/ru/comp…s/742084 ai_machinelearning_big_data

Читать дальше
Machinelearning

3 года назад

⚡ LightGlue. Local Feature Matching at Light Speed LightGlue a lightweight feature matcher with high accuracy and adaptive pruning techniques, both in the width and depth of the network, for blazing fast inference. LightGlue, глубокая нейронная сеть, которая учится сопоставлять локальные фичи на изображениях. git clone https://github.com/cvg/LightGlue.git && cd LightGlue python -m pip install -e . 🖥 Github: https://github.com/cvg/lightglue 📕 Paper: https://arxiv.org/abs/2306.13643v1 🔗Dataset: https://paperswithcode.com/dataset/hpatches ai_machinelearning_big_data

Читать дальше
Machinelearning

3 года назад

Data Science | Machinelearning - самый большой русскоязычный канал с полезными материалами на такие темы как, Machine Learning, Data Science, Алгоритмы, Python. Так же часто публикуются крутые 🔥 вакансии. 👉 Вам сюда: @devsp А любителям читать статьи в оригинале вот сюда: 👉 @ds_international Добро пожаловать!
Machinelearning

3 года назад

🔥 Awesome-Multimodal-Large-Language-Models Latest Papers and Datasets on Multimodal Large Language Models, and Their Evaluation. Огромный, упорядоченный список новейших статей, датасетов и кода по мультимодальным большим языковым моделям. 🖥 Github: github.com/bradyfu…e-models 📕 Paper: https://arxiv.org/abs/2306.13394v1 🔗Dataset: https://paperswithcode.com/dataset/coco ai_machinelearning_big_data
Machinelearning

3 года назад

🦾 Rofunc: The Full Process Python Package for Robot Learning from Demonstration and Robot Manipulation A pre-trained soft object manipulation skill learning model, namely SoftGPT, that is trained using large amounts of exploration data, consisting of a three-dimensional heterogeneous graph representation and a GPT-based dynamics model. Полный набор инструментов Python для обучения роботов на основе имитационного обучения и обучения роботов путем демонстрации. pip install rofunc import rofunc as rf import numpy as np from isaacgym import gymutil from importlib_resources import files # Demo raw_demo_l = np.load(files('rofunc.data.RAW_DEMO').joinpath('taichi_raw_l.npy')) raw_demo_r = np.load(files('rofunc.data.RAW_DEMO').joinpath('taichi_raw_r.npy')) demos_x_l = [raw_demo_l[300:435, :], raw_demo_l[435:570, :], raw_demo_l[570:705, :]] demos_x_r = [raw_demo_r[300:435, :], raw_demo_r[435:570, :], raw_demo_r[570:705, :]] rf.lqt.plot_3d_bi(demos_x_l, demos_x_r, ori=False, save=False) # TP-GMM show_demo_idx = 1 _, _, gmm_rep_l, gmm_rep_r = rf.tpgmm.bi(demos_x_l, demos_x_r, show_demo_idx=show_demo_idx, plot=True) 🖥 Github: https://github.com/skylark0924/rofunc 📕 Paper: https://arxiv.org/abs/2306.12677v1 🔗Dataset: https://paperswithcode.com/dataset/plasticinelab ai_machinelearning_big_data

Читать дальше
Machinelearning

3 года назад

⭐️ LMFlow: An Extensible Toolkit for Finetuning and Inference of Large Foundation Models Extensible and lightweight toolkit, LMFlow, which aims to simplify the finetuning and inference of general large foundation models. Расширяемый, удобный и эффективный инструментарий для тонкой настройки больших моделей машинного обучения, разработанный как удобный, быстрый, надежный инструент для работы с большими моделями. 🖥 Github: https://github.com/optimalscale/lmflow ⭐️ Demo: https://lmflow.com/ 📕 Paper: https://arxiv.org/abs/2306.12420v1 🔗Dataset: https://paperswithcode.com/dataset/pubmedqa ai_machinelearning_big_data

Читать дальше
Machinelearning

3 года назад

Продолжается прием научных статей по искусственному интеллекту и машинному обучению на конкурс международной конференции AI Journey 2023 За лучшую статью автор получит 1 миллион рублей. Наиболее интересные работы будут опубликованы в научном журнале «Доклады Российской академии наук. Математика, информатика, процессы управления» и его англоязычной версии Doklady Mathematics. Издание индексируется в крупнейших библиографических базах данных научного цитирования. Авторы также смогут выступить с докладами на международной конференции AI Journey 2023. Свою работу можно подать на сайте AI Journey до 31.07. Важно, чтобы статья была написана на русском или английском языке, содержала ранее не опубликованные материалы и была оформлена по правилам конкурса. Не упустите шанс проявить себя в научной сфере и участвуйте в конкурсе. Еще не поздно!

Читать дальше
Machinelearning

3 года назад

🚀 Fast Segment Anything Fast Segment Anything Model reaches comparable performance with the SAM method at 50 times higher run-time speed. Fast Segment Anything Model (FastSAM) - это модель CNN Segment Anything Model, обученная всего на 2% набора данных SA-1B, опубликованного авторами SAM. FastSAM достигает сравнимой с методом SAM производительности при 50-кратном увеличении скорости выполнения. git clone https://github.com/CASIA-IVA-Lab/FastSAM.git 🖥 Github: https://github.com/casia-iva-lab/fastsam ⭐️ Demo:https://huggingface.co/spaces/An-619/FastSAM 📕 Paper: https://arxiv.org/pdf/2306.12156.pdf 🔗Dataset: https://paperswithcode.com/dataset/sa-1b ai_machinelearning_big_data

Читать дальше
Machinelearning

3 года назад

Какую альтернативу Vendor-Lock использовать для клиентской аналитики? Это один из главных вопросов, которые встали перед командой X5 Tech в 2022 году. О том, как IT-компания, которая обеспечивает цифровые нужды ритейлера, нашла и быстро внедрила новое решение для предоставления клиентской аналитики в режиме реального времени на базе open-source технологий Clickhouse и Redis, команда расскажет на митапе 27 июня. 🔹 В онлайн формате выступят спикеры компании: Ермаченков Владимир, менеджер направления клиентской аналитики в цифровых каналах Бассай Сергей, архитектор данных Гундилович Александр, старший разработчик 🔔 Старт в 18:00 Регистрация и подробности тут Участие бесплатное

Читать дальше
Machinelearning

3 года назад

Fine-tuning MMS Adapter Models for Multi-Lingual ASR MMS' Adapter training is both more memory efficient, more robust and yields better performance for low-resource languages. Пример с кодом по настройке адаптера, при котором достигается поразительно низкий уровень ошибок в словах всего за 10-20 минут файнтюнинга. Обучение адаптера MMS является более экономичным, более надежным и обеспечивает высокую производительность. 🤗 Post: https://huggingface.co/blog/mms_adapters 🖥 Colab: colab.research.google.com/github/…ce.ipynb 🖥 Github: github.com/faceboo…/mms/asr ⭐️ Demo: https://huggingface.co/spaces/facebook/MMS 📕 Paper: https://huggingface.co/papers/2305.13516 ai_machinelearning_big_data

Читать дальше
Реклама

Рекламный пост
Machinelearning

3 года назад

Multi-Modality Arena Multi-Modality Arena is an evaluation platform for large multi-modality models. Multi-Modality Arena - это платформа для оценки больших мультимодальных моделей. Multi-Modality Arena позволяет проводить сравнительный анализ моделей, данных, используя изображения в качестве входных данных. Поддерживает MiniGPT-4, LLaMA-Adapter V2, LLaVA, BLIP-2 и многие другие! 🖥 Github: github.com/opengvl…ty-arena ⭐️ Demo: http://vlarena.opengvlab.com/ 📕 Paper: https://arxiv.org/abs/2306.09265v1 🔗Dataset: https://paperswithcode.com/dataset/vsr ai_machinelearning_big_data

Читать дальше
Machinelearning

3 года назад

Хотите принять участие в создании лучшей системы безопасности? 👨‍💻 Тогда приходите на One Day Offer для Data Scientists и Machine Learning Engineers 24 июня и за один день станьте частью команды, которая развивает систему форд-мониторинга для защиты клиентов Сбера везде: от онлайн-покупок до визитов в офисы. Чем предстоит заниматься, если вы успешно пройдете отбор: ✔️ Создавать real-time, look-alike и графовые модели выявления транзакций, устройств и связей мошенников и мошеннических групп. ✔️ Строить модели обработки, классификации и суммаризации обращений по мошенничеству. ✔️ Внедрять модели и мониторить эффективность их работы. ✔️ Развивать внутренние ML-pipelines. Наша система безопасности уже признана одной из лучших в мире, но мы абсолютно уверены, что с вами она станет еще круче. Скорее переходите по ссылке, регистрируйтесь на One Day Offer и будьте готовы пройти все этапы отбора за один день! 👌

Читать дальше
Machinelearning

3 года назад

REBEL: Relation Extraction By End-to-end Language generation REBEL is a seq2seq model that simplifies Relation Extraction. Модель, позволяющая извлекать триплеты из данных с аннотированной бд, охватывающуей 18 языков 40 миллионов экземпляров триплетов. 🖥 Github: https://github.com/Babelscape/rebel ⭐️Demo: huggingface.co/spaces/…bel-demo ⭐️ Hugging face: https://huggingface.co/Babelscape/rebel-large 📕 Paper: https://arxiv.org/abs/2306.09802v1 🔗Dataset: https://huggingface.co/Babelscape/rebel-large ai_machinelearning_big_data

Читать дальше