Обложка канала

Spark in me - Internet, data science, math, deep learning, philosophy. Страница 13

2440 @snakers4

Канал про интересные мне темы - интернет - статистика - наука о данных Без рекламы и буллшита.

  • Spark in me - Internet, data science, math, deep learning, philosophy

    Наш публичный детектор голоса стал лучше

    Мы очень подробно рассказывали про наш детектор голоса на Хабре тут и тут . Не вижу смысла повторяться, просто очень кратко опишу, что стало лучше : В некоторых сценариях он стал до 2-3 раз быстрее....

    Хабр
  • Spark in me - Internet, data science, math, deep learning, philosophy

    Silero VAD V4 📌 Major improvements: - Major quality improvements; - Improved performance (2-3x faster under some scenarios); - Added ONNX support both for 8 kHz and 16 kHz;
    Quality Metrics

    Silero VAD: pre-trained enterprise-grade Voice Activity Detector, Language Classifier and Spoken Number Detector - Quality Metrics · snakers4/silero-vad Wiki

    GitHub
  • Spark in me - Internet, data science, math, deep learning, philosophy

    Caliptra – First Open-Source Silicon Going Into All Datacenter Chips www.semianalysis.com/p/calip…-silicon The first instance of the open-source revolution finally coming to silicon ... I like the first comment: > This seems very anti-open-source if it's meant to stop the owners of hardware from running their own code on it, which appears to be the case. Earlier versions of that are why the GPLv3 was written
    Caliptra – First Open-Source Silicon Going Into All Datacenter Chips

    Every chip from Microsoft, Google, AMD, and Nvidia

    SemiAnalysis
  • Реклама

  • Spark in me - Internet, data science, math, deep learning, philosophy

    AMD HPC Vendor Lock up Forgot to drop 3 lines about AMD. Having an R&D budget about 10% of Nvidia or Intel's, in 2018-2020 they managed to win the CPU market of PC power users (with their ThreadRippers) - ML / CG / VFX etc Then they proceeded with ThreadRipper PRO, which was a buggy fail, while their enterprise EPYC line was a great success. And as usual with success comes vendor lock up. New ML hardware platforms from SuperMicro for AMD EPYC processors ... are sold only assembled with A100 or H100 GPUs. Why? Because you can charge 2-3x markup on "assembled" + trade wars. Sad but true. Capitalism never changes. They always ride the wave of "enthusiasts and power users" to ultimately betray them and charge 10x for basically the same hardware.
  • Spark in me - Internet, data science, math, deep learning, philosophy

    My Lazy Take on State of AI Report 2022 Each consecutive issue of the State of AI Report is obviously becoming more and more skewed into narrative building, framing, politics and justifying the actions of its "sponsors". But this is just how capitalism works, no surprise here. This is more of a cheeky ramble than a very structured essay, so keep calm and read on: telegra.ph/My-Take…22-10-20
    My Lazy Take on State of AI Report 2022

    What is This? A widely cited and praised annual "AI" report and its 2022 executive summary: (you will have to open images in a new tab, sorry) (also sorry for the image spam, but there is no way to fold images here) It is inevitable that if you operate within a certain system you will be affected by it. In simpler terms - "AI" investors are intrinsically interested in inflating the AI hype. Each consecutive issue of the State of AI Report is obviously becoming more and more skewed into narrative building,…

    Telegraph
  • Spark in me - Internet, data science, math, deep learning, philosophy

    Meta disbands its core AI group I heard about PyTorch being passed to the Linux foundations, but this? Also did not find anything in Google. Anyone heard about it? Seems strange that after "solving" NMT they disband their research group.

    image_2022-10-21_08-41-31.png

    image/png
  • Spark in me - Internet, data science, math, deep learning, philosophy

    State of AI Report 2022 - https://www.stateof.ai/2022-report-launch.html У меня есть некоторые интересные мысли про коллизию этого отчета с реальностью, в частности падение tech капитализаций на 50-80% и сокращение VC рынка в 2 раза, self-driving meltdown и прочее, но надо сначала прочитать внимательно.
    State of AI Report 2022

    The State of AI Report analyses the most interesting developments in AI. Read and download here.

    www.stateof.ai
  • Spark in me - Internet, data science, math, deep learning, philosophy

    Quotes: Since the Rome CPU launch in late 2019, AMD’s market share in servers has increased rapidly. More importantly, their average sales price went from below Intel’s to well above it due to superior TCO. In 2 years, AMD more than doubled its market share. Going forward, we expect AMD’s share of x86 server units to increase from 13.9% in Q2 2022 to 21.2% in Q4 2023. ... Under this oversimplified model, upgrading to a 2-socket Genoa-based server from 4 existing 2-socket Skylake/Cascade Lake-based servers (2 CPUs vs 8 CPUs) is a net present value positive transaction. The payback period for Capex spent is roughly ~18 months. The payback period for a Rome/Milan server upgrade would still be ~4 years. The improvements are even more significant when you start considering new features related to security, CXL, and AVX512.
  • Spark in me - Internet, data science, math, deep learning, philosophy

  • Spark in me - Internet, data science, math, deep learning, philosophy

    А вы, друзья, как ни садитесь...

    Любой, кто хоть раз обучал нейронки, знает, что принято на каждой эпохе шаффлить датасет, чтобы не повторялся порядок батчей. А зачем это делать? Обычно это объясняют тем, что шаффлинг улучшает генерализацию сетей, делает точнее эстимейт градиента на батчах и уменьшает вероятность застревания SGD в локальных минимумах. Здесь можно посмотреть визуализацию поведения градиентов батчей с шаффлингом и без шаффлинга. Ну и самый простой и традиционный для ML аргумент - наши эксперименты подтверждают, что отключение…

    Telegraph
  • Spark in me - Internet, data science, math, deep learning, philosophy

    I like how this guy equally is ripping on Elon and Putin at the same time) This is at least something I can relate to, like Roger Waters' position.
  • Spark in me - Internet, data science, math, deep learning, philosophy

    Elon Musk, War Profiteer!!!?

    You can support this channel directly through patreon: https://patreon.com/Thunderf00t or at my amazon affiliate store: https://www.amazon.com/shop/thunderf00t or my other channel: https://www.youtube.com/channel/UCUrdmVprSahXaPKqr04VfgQ

    YouTube
  • Spark in me - Internet, data science, math, deep learning, philosophy

    Crossmodal-3600 — Multilingual Reference Captions for Geographically Diverse Images Once again, looks like that image captioning is ripe. Now the public is entertained only with a public validation set, albeit a formidable one. The more ripe something is, the less will be shared. History is highly cyclical. Just look at something like FAIR's massive NMT efforts. At first they created fairseq (to counter OpenNMT which was in Tensorflow maybe), then CCMatrix. And now when their NMT dataset reached a critical scale of being competitive with off-the-shelf products, they did not share it, which makes total sense.
    Crossmodal-3600 — Multilingual Reference Captions for Geographically Diverse Images

    Posted by Ashish Thapliyal, Software Engineer, and Jordi Pont-Tuset, Research Scientist, Google Research Image captioning is the machine...

    Google AI Blog
  • Spark in me - Internet, data science, math, deep learning, philosophy

    Про дипфейки и reality collapse Читая очередной раз про "Кодекс этики для AI" у нас и "AI Bill of Rights" у них, памятую про целые отделы, посвященные gender studies или AI-этике я немного недоумеваю (в том числе на фоне противоречия действий "подписавших" такие кодексы компаний этим кодексам). Да, с одной стороны нейросетки и GAN-ы творят чудеса. Фото / видео дипфейки в каких-то сценариях можно генерировать даже "почти" автоматически. Генеративные сетки конечно никого и близко не заменят, но даже чеки US$600k на тренировку Stable Diffusion в принципе уже не кажутся полным абсурдом (осталось снизить уже только в 10-100 раз, лол). Но (как и все наблюдательные соотечественники) я был зрителем беспрецедентной кампании по очернению нашей страны, вооруженных сил, национальности, экономики, итд итп. "Стыдно быть русским", "cancel Russia", сотни и тысячи кампаний информационной атаки. Не буду останавливаться на всем этом, список такого я даже не собирал. Чего только стоят обложки свежие западных СМИ использующих фото взорванного крымского моста. Да что тут лукавить, 24 - 25 февраля даже YouTube (!) показывал фейковые ролики на весь экран с низкокачественными вбросами (обычно это прерогатива тизерных сетей и желтых СМИ и политика запрещена в рекламе YouTube). К чему я это пишу? Недавно я видел как какая-то компания по VFX сделала 3D модель президента Украины. До этого было много шума на тему очевидных артефактов хромакея на его выступлениях. Были еще постановочные видео и классический рефрейминг и использование "левых" кадров. И это в принципе все проявления "технологии", которые я видел в современной неприкрытой информационной войне. А где же reality collapse? Где тугая струя фото, аудио и видео фейков? А они просто не нужны или экономически нецелесообразны. Были бы целесообразны - мы бы уже увидели что-то кроме хромакея. AI сингулярность нужна только для совсем отбитых кейсов типа порно с Гретой Тунберг, для массового производства "высококачественного" контента (а то вдруг фильмы про супергероев скоро надоест смотреть) и для раскачивания хайпа в духе "AGI" близко, нужно быть первым и / или проинвестировать US$1bn в AI [вставить нужное] studies. Ну и наверное дорогие студии VFX тоже сильно радуются. Вторая гипотеза (на фоне суда на Алексом Джонсом) - может конечно не все медиа-системы построены вокруг упоротого сенсационализма и бреда, но что-то не особо верится.
  • Spark in me - Internet, data science, math, deep learning, philosophy

    Не понимаю ...

    image_2022-10-13_19-34-47.png

    image/png
  • Реклама

  • Spark in me - Internet, data science, math, deep learning, philosophy

    Про нормальные docker образы Astra Linux На Хабре кто-то заметил - https://habr.com/ru/post/693176/ Ни в коем случае НЕ КАЧАЙТЕ базовый образ ОС не с оф. сайта / аккаунта разработчиков ОС! Оказывается что есть уже просто папка с докер-образами Astra Linux тут - https://vault.astralinux.ru/images/ И базовый образ можно сделать вот так у себя в registry:
    docker import $BASE_URL$IMAGE_FILE $CI_REGISTRY_IMAGE:$TAG
    
    
    Причем там есть и платная версия ОС. И версии, которые они давали разным вендорам хостинга 🤷‍♂️. И что интересно, ссылки на этот vault в оф. документации нет. Не понимаю логику, честно говоря. Если кто-то понимает - поясните пожалуйста.
    Человеческие docker-образы AstraLinux

    В 100% последних проектов мы используем docker и kubernetes, поэтому, повстречавшись с "особым" путем использования базовых docker-образов AstraLinux, мы решили упростить жизнь себе и другим...

    Хабр
  • Spark in me - Internet, data science, math, deep learning, philosophy

    От меня тут давно ничего не было, потому что переезжал в другую страну (начал ещё в мае и только сейчас всё устаканилось). Долго думал о чём бы написать пост, но так как сейчас на работе пишу библиотеку для метрик лёрнинга, а о такой задаче знает не очень много людей, про неё и будет пост. #Миша #обзор #CV
    GitHub - OML-Team/open-metric-learning: Library for metric learning pipelines

    Library for metric learning pipelines. Contribute to OML-Team/open-metric-learning development by creating an account on GitHub.

    GitHub
  • Spark in me - Internet, data science, math, deep learning, philosophy

    Send message as ... is premium only now Looks like this feature is now enabled only for premium users. I saw lots of bots and spam using this feature last week.

    image_2022-10-12_19-36-31.png

    image/png