Обложка канала

Spark in me - Internet, data science, math, deep learning, philosophy. Страница 8

2440 @snakers4

Канал про интересные мне темы - интернет - статистика - наука о данных Без рекламы и буллшита.

  • Spark in me - Internet, data science, math, deep learning, philosophy

  • Spark in me - Internet, data science, math, deep learning, philosophy

    Обыкновенный Практикум но теперь и с поддержкой МинЦифры? У МинЦифры есть программа обучения школьников программированию. По официальной информации - порядка 130к школьников 8-11 классов туда записались (или записались 200к, а начали учиться 130к, не суть, много в общем). У Яндекса есть Яндекс Практикум. У Яндекс Практикума есть сотрудники. У сотрудников есть интересные достижения. Раз и два и три. Наверное вы уже догадались, кто является там одним из провайдеров услуг? Однако, интересный у МинЦифры получается код для нашего будущего!
    Минцифры России

    🧑‍💻 Открыт донабор на курсы программирования для школьников «Код будущего» Отличная новость для тех, кто не успел попасть на курсы «Код будущего»: мы открываем дополнительный набор на отдельные программы и площадки. Новые участники смогут присоединиться к групповым занятиям, начиная со второго модуля. Успейте подать заявку, количество мест в группах ограничено. 🔹 «Код будущего» — уникальный образовательный проект. В нём ученики 8-11 классов могут бесплатно изучить современные языки программирования. Проект стартовал осенью 2022 года и быстро набрал популярность: за это время записались на курсы и начали учиться уже 130 тысяч детей. Как записаться на курс: 1. Выберите курс и подайте заявление на Госуслугах 2. Пройдите вступительное испытание 3. Самостоятельно изучите материалы 1-го модуля и пройдите тест по его итогам 4. Приступайте к обучению в группе со 2-го модуля Уточнить наличие мест на отдельных курсах и площадках можно на странице проекта «Код будущего». О проекте На курсах «Код будущего» изучают Python, Java, C++, C#, 1С, SQL, JavaScript и другие современные языки программирования. Продолжительность обучения — 144 академических часа. Для записи доступны более 50 курсов от 21 образовательной организации, среди которых крупнейшие ИТ-платформы и ведущие ИТ-университеты. Обучение проходит на площадках образовательных организаций в регионах России, а также в онлайн формате. Записаться можно только на один курс. 👉 Записаться на курс @mintsifry

    Telegram
  • Spark in me - Internet, data science, math, deep learning, philosophy

    Инструменты модерации в телеграме Попробовал с десяток разных. В итоге ничего лучше @MissRose_bot даже на километр нет. Был нормальный антимат бот, но умер. Да и встроенные возможности догоняют понемногу, в принципе их уже на 95% хватает, особенно с последним релизом.
  • Реклама

  • Spark in me - Internet, data science, math, deep learning, philosophy

    😱 How Nvidia’s CUDA Monopoly In Machine Learning Is Breaking - OpenAI Triton And PyTorch 2.0 - www.semianalysis.com/p/nvidi…npytorch TLDR - Nvidia's dominant position in this field, mainly due to its software moat, is being disrupted; - PyTorch won the hearts of researchers and small / large firms; - Nvidia’s FLOPS have increased multiple orders of magnitude by leveraging Moore’s Law, but primarily architectural changes such as the tensor core and lower precision floating point formats. In contrast, memory has not followed the same path; - The next step down in the memory hierarchy is tightly coupled off-chip memory, DRAM. DRAM followed the path of Moore’s Law for many decades. Since ~2012 though, the cost of DRAM has barely improved; - Comparing Nvidia’s 2016 P100 GPU to their 2022 H100 GPU that is just starting to ship, there is a 5x increase in memory capacity (16GB -> 80GB) but a 46x increase in FP16 performance (21.2 TFLOPS -> 989.5 TFLOPS). - From the current generation A100 to the next generation H100, the FLOPS grow by more than 6X, but memory bandwidth only grows by 1.65x; - One of the principal optimization methods for a model executed in Eager mode is called operator fusion, this optimization often involves writing custom CUDA kernels; - The growth in operators and position as the default has helped Nvidia as each operator was quickly optimized for their architecture but not for any other hardware. If an AI hardware startup wanted to fully implement PyTorch, that meant supporting the growing list of 2,000 operators natively with high performance; - PyTorch 2.0 brings many changes, but the primary difference is that it adds a compiled solution that supports a graph execution model; - OpenAI’s Triton is very disruptive angle to Nvidia’s closed-source software moat for machine learning. Triton takes in Python directly or feeds through the PyTorch Inductor stack. The latter will be the most common use case. Triton then converts the input to an LLVM intermediate representation and then generates code. In the case of Nvidia GPUs, it directly generates PTX code, skipping Nvidia’s closed-source CUDA libraries, such as cuBLAS, in favor of open-source libraries, such as cutlass. The Triton kernels themselves are quite legible to the typical ML researcher which is huge for usability;
    How Nvidia’s CUDA Monopoly In Machine Learning Is Breaking - OpenAI Triton And PyTorch 2.0

    Over the last decade, the landscape of machine learning software development has undergone significant changes. Many frameworks have come and gone, but most have relied heavily on leveraging Nvidia's CUDA and performed best on Nvidia GPUs. However, with the arrival of PyTorch 2.0 and OpenAI's Triton, Nvidia's dominant position in this field, mainly due to its software moat, is being disrupted.

    Semianalysis
  • Spark in me - Internet, data science, math, deep learning, philosophy

    An interesting perspective here. What if LLMs are viewed though the lens of Microsoft willing to take some part of the search market? Trends in the dollar training cost of machine learning systems - epochai.org/blog/tr…-systems The Inference Cost Of Search Disruption – Large Language Model Cost Analysis - www.semianalysis.com/p/the-i…sruption The AI Brick Wall – A Practical Limit For Scaling Dense Transformer Models, and How GPT 4 Will Break Past It - www.semianalysis.com/p/the-a…al-limit Training Compute-Optimal Large Language Models - https://arxiv.org/pdf/2203.15556.pdf
    Trends in the dollar training cost of machine learning systems

    I combine training compute and GPU price-performance data to estimate the cost of compute in US dollars for the final training run of 124 machine learning systems published between 2009 and 2022, and find that the cost has grown by approximately 0.5 orders of magnitude per year.

    Epoch
  • Spark in me - Internet, data science, math, deep learning, philosophy

    О человеке судят по его друзьям Интересное подтверждение тезиса про "о человеке судят по его друзьям". Несколько лет подряд я подавал наши публичные статьи про синтез на конкурсы Хабра. И ... самая годная статья с 200+ рейтинга ... по словам админов Хабра просто случайно оттуда пропала! Ну ... это был не бан. Она просто случайно пропала. Верьте нам! Мне даже не надо преувеличивать. При этом в тот раз, когда она пропала, лучшая статья в этой категории конечно была про шёпот Алисы, ага. Сейчас Хабр вроде разродился экспертами из комьюнити на каждую категорию, но ... первый в списке там это человек, публично призывавший донатить Медузе, а второй - пишущий длинные опусы про смерть нашей науки и почему студенты в лабах не должны получать нормально денег. Много, много чудных совпадений! Хотя что я. Хабр теперь это иностранное СМИ с редакцией в несколько десятков человек и плавно снижающимися показателями. Странно было бы, если бы они гребли в обратную сторону. Вопрос только в том, насколько далеко они зайдут.
    Небольшая ретроспектива по статистике статей Хабра

    Хабр недавно написал статью про итоги ушедшего 2022 года. В комментариях у меня и нескольких пользователей возник вопрос, что мол статистика как-то странно подана, мол люди перемешаны с конями,...

    Хабр
  • Spark in me - Internet, data science, math, deep learning, philosophy

    You Are Lied to Every Day

    We are constantly being lied to by people online. These people are not your friends. Do not trust someone just because they claim to belong to your political "team". The lying has become endemic. By design it has caused us to hate, fear, and fragment. ▼DARKMATTER2525 ▼ ►PATREON - https://www.patreon.com/darkmatter2525 ►YOUTUBE MEMBERSHIP - https://www.youtube.com/channel/UCLhtZqdkjshgq8TqwIjMdCQ/join ►SUBSCRIBESTAR - https://www.subscribestar.com/darkmatter2525 ►MERCH - https://darkmatter.myspreadshop.com/ ▼Citations for this video ▼ ►How many adults use the internet in 1996 and 2021: https://www.pewresearch.org/internet/2007/06/21/the-internet-circa-1998/ https://www.pewresearch.org/fact-tank/2021/03/26/about-three-in-ten-u-s-adults-say-they-are-almost-constantly-online/ ►Anger Online Study: https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0110184 ►Lies Spread Faster Than Truth Study: https://www.science.org/doi/10.1126/science.aap9559 ►Why your brain loves feeling outraged: https://www.youtube.com/watch?v=3z3UoO8JdOo ►Kate Moss on working in the Calvin Klein Ad: https://www.wonderwall.com/celebrity/kate-moss-recalls-bad-experience-shooting-iconic-calvin-klein-ads-with-macho-mark-wahlberg-as-a-teen-plus-more-news-629199.gallery https://www.yourtango.com/entertainment/why-kate-moss-scared-calvin-klein-mark-wahlberg ►Calvin Klein Pride Month Campaign: https://www.thepinknews.com/2022/05/24/calvin-klein-pride-collection-2022-jockstrap/ ►Frequency Illusion: https://news.ucdenver.edu/what-is-the-frequency-illusion/ ►How covid statistics can mislead: https://www.scientificamerican.com/article/how-to-compare-covid-deaths-for-vaccinated-and-unvaccinated-people/ ►Bogus article that lies with statistics about England covid deaths: https://expose-news.com/2022/03/30/distracted-russia-will-smith-uk-gov-data-92-percent-covid-deaths-vaccinated/ ►Official England data citied in bogus article: https://assets.publishing.service.gov.uk/government/uploads/system/uploads/attachment_data/file/1032859/Vaccine_surveillance_report_-_week_45.pdf ►Bogus article about everyone in Germany and the UK getting AIDS by Jan. 2021: https://expose-news.com/2022/01/02/german-gov-data-suggests-fully-vaccinated-developing-ade/ ►Bogus article that incorrectly compares pre-covid and post-covid athlete deaths: https://goodsciencing.com/covid/athletes-suffer-cardiac-arrest-die-after-covid-shot/ ►A doctor explaining why the article is bad and wrong: https://twitter.com/dr_jon_l/status/1614362750784008192 ►Pre-covid article, a student athelete dies from cardiac arrest every 3 days: https://www.phillyvoice.com/preventing-sudden-cardiac-death-student-athletes-tragedy/ ►Sudden Cardiac Death in the Athlete study from 2012: https://www.ahajournals.org/doi/10.1161/circulationaha.111.023861 ►Child & Infant mortality of 2017 (first 4 columns of the graph): https://ourworldindata.org/child-mortality ►The media - not the science - got global cooling wrong: https://longreads.com/2017/04/13/in-1975-newsweek-predicted-a-new-ice-age-were-still-living-with-the-consequences/ ►Fake Time Magazine Cover, & scientific consensus of warming in the 70s: https://skepticalscience.com/trump-mcfarland-fox-news-70s-ice-age-myth.html https://apnews.com/article/fact-check-time-magazine-global-climate-fabricated-cover-944714514495 ►Sky News bogus outrage story about 1 tweet with 55 likes: https://www.skynews.com.au/opinion/outsiders/aretha-franklin-song-natural-woman-deemed-offensive/video/b3dfad7d32a71ba4380701e4e9879f85 ►Articles about men becoming more feminine: https://twitter.com/paulisci/status/1572713537910476801 ►How we fixed the ozone hole: https://www.unep.org/news-and-stories/story/rebuilding-ozone-layer-how-world-came-together-ultimate-repair-job ►Y2K was a problem, but it was solved: https://time.com/5752129/y2k-bug-history/ ►Fake Headline: https://www.usatoday.com/story/news/factcheck/2023/01/20/fact-check-cnn-headline-altered-reference-hamlin-covid-19-vaccine/11083770002/ ►Cherry Picking: https://www.logicallyfallacious.com/logicalfallacies/Cherry-Picking ►Nut Picking:…

    YouTube
  • Spark in me - Internet, data science, math, deep learning, philosophy

    If you have not lived in Russia, in some cities bureaucrats, cashiers, bank clerks are not necessary for 90% of mundane operations (which gives people more time to attend to the rest 10% of operations). We simply have best online banking and online government services. In some supermarkets there are even self-checkout machines ... and they just work without sophisticated tracking and 10x cameras and tags. It just works on honour system and just regular surveillance. Especially I was shocked when I found them in a lame-ass supermarket in my home town. Of course there were people to monitor the process and help, but it was 1-2 people per 10 self-checkout machines.
    Spark in me

    Пропаганда не соответствует реальности, причем теперь уже обе пропаганды 🙈 Наблюдаю странную вещь. Если смотреть самую базовую макро-статистику (ВВП по ППС на душу), то у нас с 2014 года всё хуже чем по больнице в мире ⡂ ⢤ ⠑⡈⡐⠉⠨⠤ ⢢⠦ ⡊⢤⠸⠣⠇⡰ ⡰⠚⡊⠡⠙ ⢑⠱⢡⣀⠦⢒⡢ ⢡⠒⠣⠲⠣ ⠃ ⢅⡘⠊⢰ ⢑⠖⠖⠜⢐⣈ ⠎⡌⡂. 🤷‍♂️ Помню в "тучные" годы, когда я еще был студентом я из года в год проклинал отсутствие строительства метро, ужасные новые вагоны и адекватные тому времени, но уже видавшие виды советские вагоны. Электрички тогда были ... просто ужасными. 📉 Приезжая из Москвы домой из года в года, я не видел прогресса. То же отсутствие местами светофоров, освещения и асфальта (наш район с краю города). Отсутствие вообще какой-либо новой инфраструктуры, банальных кафешек и хотя бы новых магазинов с продуктами (или банально реинвестиций в старые). В центре города даже в "хипстерском" квартале, всё явно держалось на инвестициях начала нулевых, паре местных сетей (я годами думал кстати что Travellers это такое же говно как Шоколадница, но ошибался)…

    Telegram
  • Spark in me - Internet, data science, math, deep learning, philosophy

    AI Psychosis - blog.piekniewski.info/2023/02…sychosis
    Software engineers. GPT can write code. This is somewhat exciting and in a sweet salty fast food news fashion the media and the tech bros interpreted that as the end of software engineering profession. So I asked it two write some code. And in all but the very rudimentary functions it was littered with bugs and in more than half of the cases wasn't even in the right vicinity. There might be some uses, e.g. GPT seems to be pretty decent at generating docstrings, but as with all these examples above "replacing software engineers" is a pipe dream hyperbole. It's worth recalling here that when four color theorem was solved in the late 70's using a computer, people were in similar fashion fearing that mathematicians are about to become irrelevant, and now, some 50 years later we can easily see how that ended.
    
    
    I am too so fed up with this shit. Though merging 2 images for an article art is a godsend.
    AI psychosis

    For some reason, people love to be scared. People also love to spook other people, that gives them the sense of advantage, power. And in the hyper-stimulated era of social media and numerous dopamine shots

    Piekniewski's blog
  • Spark in me - Internet, data science, math, deep learning, philosophy

    Digest 2023-01 https://telegra.ph/Digest-2023-01-02-01 #digest
    Digest 2023-01

    ____________________________________________________________________________ # ML Ускорение инференса модели BERT с помощью ONNX и ONNX Runtime на примере решения задачи классификации текста - https://habr.com/ru/company/rostelecom/blog/704844/ New and Improved Embedding Model - https://openai.com/blog/new-and-improved-embedding-model/ Point-E: A System for Generating 3D Point Clouds from Complex Prompts - https://github.com/openai/point-e ChatGPT and the Imagenet moment - https://www.ben-evans.com/benedic…

    Telegraph
  • Spark in me - Internet, data science, math, deep learning, philosophy

    Имейте в виду 2. Предоставление или сбор средств либо оказание финансовых услуг, заведомо предназначенных для обеспечения деятельности иностранной или международной неправительственной организации, в отношении которой принято решение о признании нежелательной на территории Российской Федерации ее деятельности в соответствии с законодательством Российской Федерации, - наказывается обязательными работами на срок до трехсот шестидесяти часов, либо принудительными работами на срок до четырех лет с ограничением свободы на срок до двух лет или без такового, либо лишением свободы на срок от одного года до пяти лет с лишением права занимать определенные должности или заниматься определенной деятельностью на срок до десяти лет или без такового. Дискас?
  • Spark in me - Internet, data science, math, deep learning, philosophy

    Ох, я помню, как-то определенные МЛ каналы призывали донатить Медузе как некоторой "проксе". Закон обратной силы конечно не имеет, но кажется рекурсия начала закрываться понемногу.
  • Spark in me - Internet, data science, math, deep learning, philosophy

    Алиса - рэп на злобу дня
  • Spark in me - Internet, data science, math, deep learning, philosophy

    🙈 Тут конечно напрашивается некоторая теория заговора: Смотрим на "дату" файлов в сливе. Смотрим есть ли там сервисы "израильского" "Яндекса". Достаточно ли правдоподобно и кто кого слил - я естественно не знаю.
  • Spark in me - Internet, data science, math, deep learning, philosophy

    Если вы хотели попросить Алису замолчать, но не знали как. То на этих запросах пользователей она точно обучена :) @ciso_on_fire

    Алиса Хватит.txt

    text/plain
  • Реклама

  • Spark in me - Internet, data science, math, deep learning, philosophy

    Карим Валиев (ex VK) делится мыслями по утечке кодов "Яндекса": 4. Очень много самописных внутренних инструментов, много документации. Интересно для изучения, чтобы понимать как работают большие компании и их IT-инфраструктура. Кажется, что в Яндексе есть сильный перевес в пользу "напишем сами" даже тогда, когда другие компании обошлись бы опенсорсом. 5. Конечно, интересен репозиторий security 🙂 Там тоже внутренние инструменты, всевозможные сканеры, разбиралки тикетов, все на достаточно продвинутом уровне. 6. Дальше еще интереснее. Яндекс массово использует Телеграм в качестве рабочего мессенджера. В файлах есть куча ссылок на чатики в телеграме, по которым можно было прийти и вступить. Сразу после новости о сливе большую часть из них подчистили, но не все. Использование Телеграма - большая проблема и боль для безопасности. Правильный выход - это конечно использование корпоративного мессенджера с полным запретом личных. Но у них тоже есть свои недостатки, телеграм просто очень удобный. В Яндексе используют специального телеграм-бота, которого добавляют в чатики и он следит, чтобы там не было чужаков. Но понятно, что работает это только в тех чатиках, куда бота не забыли добавить. 7. В репозитории Алисы тоже много интересного. Именно самой говорящей модели Алисы вроде нет, но есть много разных скриптов для ее обучения, фрагментов обучающих данных и т.п. Есть выборки реальных (анонимных) запросов пользователей к Алисе, очень интересные. На скриншоте фрагмент файла с реальными призывами к Алисе замолчать. Его можно растащить на мемы буквально целиком 8. В репозитории Почты есть код, который занимается разметкой данных из писем. В том числе анализируются письма с подписками на разные онлайн-сервисы, письма с чеками. Зачем именно - неясно, возможно Яндекс так мониторит конкурентов по рынку?
  • Spark in me - Internet, data science, math, deep learning, philosophy

  • Spark in me - Internet, data science, math, deep learning, philosophy

    С весны твержу, что IT-крупняк в Штатах и вообще Pax Americana посыпется по финансам (это неизбежное следствие роста стоимости фондированя в долларах и эрозии концепции однополярного мира и соответствующего снижения бюджетов IT-решений для всего мира. Глобализация многих IT-сервисов отменяется) и первое что крупняк будет при этом делать — сокращать людей Microsoft увольняет, Amazon увольняет, Netflix увольняет, Facebook увольняет, ну и Google не стал стоять в сторонке и тоже уволит 6% сотрудников, это 12 000 человек, на секундочку Отлично понимаю, что я со своими взглядами несимпатичен дикому множеству людей, но при переезде хотя бы свою голову уже включайте. Более-менее понятен переезд куда-нибудь в Азию, где есть своё IT, в Европу, где социализм такой, что фиг кого-то уволишь, но уезжать в Штаты для работы по найму на рядовой, пусть и квалифицированной позиции — архистранное решение.
    Синодов пишет

    Ещё в апреле о ситуации с рынком найма и вообще доходами в глобальном крупняке я написал следующее: Проблема с отписками на Netflix это маркер более серьёзных изменений в отрасли, которые шаг за шагом проявятся: 1. Есть предел пользовательского спроса. Нельзя рассчитывать на то, что люди будут подписываться одновременно на кабельное, YouTube, Hulu, Apple TV+, Netflix, Disney. Даже с учётом эксклюзивов. 2. Попытки минфина США озвучить вариант мироустройства, при котором создаётся клуб хороших стран и все остальные (возможно, с какими-то подкритериямя), означают, что те компании, которые считали себя мировыми, теперь становятся ограниченными, в лучшем случае — регионом NA+EU и Океании немножко. Капитализация Netflix упала на 20% не из-за потерь сегодняшних, а из-за ужаса перед потерями компании в будущем. 3. Раз компании становятся не мировыми, а региональными, то платить за цифровую конницу из разработчиков, которая позволяла вторгаться цифровыми путями во вражеские государства и забирать их доходы…

    Telegram