💬 3D-Speaker: A Large-Scale Multi-Device, Multi-Distance, and Multi-Dialect Corpus for Speech Representation DisentanglementA large-scale speech corpus to facilitate the research of speech representation disentanglement.
3D-Speaker - это набор инструментов с открытым исходным кодом и крупномасштабный корпус речи, для мультимодальной проверки дикторов, распознавания дикторов и разделение дикторов.3D-Speaker содержит более 10 000 дикторов, каждый из которых одновременно записывается несколькими устройствами, расположенными на разных расстояниях, а некоторые дикторы говорят на нескольких диалектах.
🖥 Github: github.com/alibaba…-Speaker
📕 Paper: https://arxiv.org/abs/2306.15354v1
🔗Dataset: https://3dspeaker.github.io/ai_machinelearning_big_data
А вы знаете, что такое пирамида признаков? А трансформеры (нет, мы не про фильм)?
Это термины, которые используют инженеры, работающие с нейронными сетями! Мы их нашли в канале ИТ-компании «Криптонит» — подписывайтесь на ребят! У них выходят материалы и про ML, и про роботов, и про программирование.
А ниже мы выбрали несколько терминов из их нейрословаря🟡
📍Explaining Away— эффект редукции причины как упрощённая схема рассуждений.
📍Инференс (inference) — с точки зрения разработчика это третий этап жизненного цикла искусственной нейронной сети (после её обучения и развёртывания).
📍Многослойный перцептрон (MLP) — это одна из элементарных архитектур, с которой часто начинают освоение нейронных сетей и принципов их обучения.
📍Пирамида признаков (FPN, Feature Pyramid Net) — это вычислительная архитектура, используемая в машинном зрении для обработки изображений без привязки к их разрешению.
📍Трансформеры (transformers)— это не только роботы, но и прогрессивное семейство архитектур нейросетей от Google.
Объектно-ориентированный подход чаще всего применяют в крупных проектах, где над одним приложением работают много разработчиков. Так как каждый программист работает над своей отдельной частью программы, сокращается количество ошибок и ускоряется процесс.
На курсе Яндекс Практикума «Базовый UML» вы за 2 месяца пройдёте все этапы работы над моделированием системы: от описания пользовательских требований до структурного и поведенческого моделирования. А ещё:
• изучите основные диаграммы в нотации UML, описывающие бизнес-процессы;
• получите представление о применении UML для моделирования систем;
• научитесь работать в Draw.io, StarUML, Plant UML.
Все студенты получат реальные кейсы, сопровождение от специалистов и работающие проекты в портфолио. Карьерный центр поможет с поиском работы: 69% студентов уже работают по специальности.
Занимайтесь онлайн в любое время, в своём темпе.
Зачем Data-инженеру Spark
В Почте Mail.ru работают со стеком Hadoop, Hive, Clickhouse, Spark. В данной статье на Хабре Data-инженер из команды Почты Mail.Ru остановился на некоторых аспектах работы с данными в Spark.
Он ответил на следующие вопросы: как превратить 7 петабайт в 0,5 петабайт, что позволило сэкономить годовой бюджет по закупке серверов и построить своё классное хранилище без последующей переделки.
Также в статье: архитектурные паттерны в хранилище Почты, эффективное хранилище данных, форматы хранения данных, параллельная обработка данных в Spark, запись колоночных файлов, запросы к данным в Spark и др.
Хабр:habr.com/ru/comp…s/742084ai_machinelearning_big_data
⚡ LightGlue. Local Feature Matching at LightSpeedLightGlue a lightweight feature matcher with high accuracy and adaptive pruning techniques, both in the width and depth of the network, for blazing fast inference.LightGlue, глубокая нейронная сеть, которая учится сопоставлять локальные фичи на изображениях.
git clone https://github.com/cvg/LightGlue.git && cd LightGlue
python -m pip install -e .
🖥 Github: https://github.com/cvg/lightglue
📕 Paper: https://arxiv.org/abs/2306.13643v1
🔗Dataset: https://paperswithcode.com/dataset/hpatchesai_machinelearning_big_data
Data Science | Machinelearning - самый большой русскоязычный канал с полезными материалами на такие темы как, Machine Learning, Data Science, Алгоритмы, Python. Так же часто публикуются крутые 🔥 вакансии.
👉 Вам сюда: @devsp
А любителям читать статьи в оригинале вот сюда:
👉 @ds_internationalДобро пожаловать!
🦾 Rofunc: The Full Process Python Package for Robot Learning from Demonstration and Robot ManipulationA pre-trained soft object manipulation skill learning model, namely SoftGPT, that is trained using large amounts of exploration data, consisting of a three-dimensional heterogeneous graph representation and a GPT-based dynamics model.
Полный набор инструментов Python для обучения роботов на основе имитационного обучения и обучения роботов путем демонстрации.
pip install rofuncimport rofunc as rf
import numpy as np
from isaacgym import gymutil
from importlib_resources import files
# Demo
raw_demo_l = np.load(files('rofunc.data.RAW_DEMO').joinpath('taichi_raw_l.npy'))
raw_demo_r = np.load(files('rofunc.data.RAW_DEMO').joinpath('taichi_raw_r.npy'))
demos_x_l = [raw_demo_l[300:435, :], raw_demo_l[435:570, :], raw_demo_l[570:705, :]]
demos_x_r = [raw_demo_r[300:435, :], raw_demo_r[435:570, :], raw_demo_r[570:705, :]]
rf.lqt.plot_3d_bi(demos_x_l, demos_x_r, ori=False, save=False)
# TP-GMM
show_demo_idx = 1
_, _, gmm_rep_l, gmm_rep_r = rf.tpgmm.bi(demos_x_l, demos_x_r, show_demo_idx=show_demo_idx, plot=True)
🖥 Github: https://github.com/skylark0924/rofunc
📕 Paper: https://arxiv.org/abs/2306.12677v1
🔗Dataset: https://paperswithcode.com/dataset/plasticinelabai_machinelearning_big_data
Продолжается прием научных статей по искусственному интеллекту и машинному обучению на конкурс международной конференции AI Journey 2023
За лучшую статью автор получит 1 миллион рублей. Наиболее интересные работы будут опубликованы в научном журнале «Доклады Российской академии наук. Математика, информатика, процессы управления» и его англоязычной версии Doklady Mathematics. Издание индексируется в крупнейших библиографических базах данных научного цитирования.
Авторы также смогут выступить с докладами на международной конференции AI Journey 2023.
Свою работу можно подать на сайте AI Journeyдо 31.07. Важно, чтобы статья была написана на русском или английском языке, содержала ранее не опубликованные материалы и была оформлена по правилам конкурса.
Не упустите шанс проявить себя в научной сфере и участвуйте в конкурсе. Еще не поздно!
Какую альтернативу Vendor-Lock использовать для клиентской аналитики?
Это один из главных вопросов, которые встали перед командой X5 Tech в 2022 году.
О том, как IT-компания, которая обеспечивает цифровые нужды ритейлера, нашла и быстро внедрила новое решение для предоставления клиентской аналитики в режиме реального времени на базе open-source технологий Clickhouse и Redis, команда расскажет на митапе 27 июня.
🔹 В онлайн формате выступят спикеры компании:
Ермаченков Владимир, менеджер направления клиентской аналитики в цифровых каналах
Бассай Сергей, архитектор данных
Гундилович Александр, старший разработчик
🔔 Старт в 18:00
Регистрация и подробности тут
Участие бесплатное
Хотите принять участие в создании лучшей системы безопасности? 👨💻
Тогда приходите на One Day Offer для Data Scientists и Machine Learning Engineers 24 июня и за один день станьте частью команды, которая развивает систему форд-мониторинга для защиты клиентов Сбера везде: от онлайн-покупок до визитов в офисы.
Чем предстоит заниматься, если вы успешно пройдете отбор:
✔️ Создавать real-time, look-alike и графовые модели выявления транзакций, устройств и связей мошенников и мошеннических групп.
✔️ Строить модели обработки, классификации и суммаризации обращений по мошенничеству.
✔️ Внедрять модели и мониторить эффективность их работы.
✔️ Развивать внутренние ML-pipelines.
Наша система безопасности уже признана одной из лучших в мире, но мы абсолютно уверены, что с вами она станет еще круче.
Скорее переходите по ссылке, регистрируйтесь на One Day Offer и будьте готовы пройти все этапы отбора за один день! 👌