Обложка канала

Лингвистика на коленке. Страница 2

Я лингвист-дилетант, изучаю романские языки, а также адепт самообучения

  • Лингвистика на коленке

    Статья о том, как у эмигрантов происходит «языковая регрессия» или «языковая эрозия», хочется процитировать сразу все:

    Когда носитель русского языка пополняет понятийный аппарат, русифицируя американские реалии («даунтаун», «апойнтмент»), можно говорить не об утрате языка, а о его обогащении. Регрессией станет замена термина, например, калькой из второго языка: «эмоциональная помощь» («emotional help») вместо «поддержка».

    <...>

    Ошибки касаются вида и спряжения глаголов: «Она ходится по улице», «Он сидел на эту скамейку», «Начали мчаться за собакой» (вместо «помчались»), «Олень начал куда-то бегать» (вместо «побежал»); очевидно влияние английских конструкций: «Мальчик будет идет домой» (калька с «will walk home»), «В август я иду в Сиэтл» («I go to Seattle») и очаровательное «Собака уронила гнездо с пчелами, и все вышли» («came out»).

    Страдает и подбор предлогов: «пошла на мосте» от «walk on the bridge», «заходила через дверь» от «enter through the door». Английская падежная система устроена проще русской, что способствует утрате навыка склонения: «она села в кресле», «он ее начинает не нравиться», «фотоаппарат следовал… какую-то девушку» («followed some girl»), «похоже на Москве», «сел к нее», «выходит из комната».

    Сближение языковых систем ведет к их взаимопроникновению и замещению некоторых категорий первой категориями второй — например, под влиянием иврита неисчисляемое «evidence» становится исчисляемым в речи англичан, долго время живущих в Израиле. Билингвам, живущим за рубежом, могут казаться правильными неграмотные языковые конструкции («Я выбрала учиться на лингвиста», тогда как правильнее будет сказать «Я решила учиться на лингвиста» или «Я выбрала факультет лингвистики»). Они более склонны попадать в ловушки «ложных друзей переводчика» и нарушать правила сочетаемости. Участники израильского исследования не распознали 40% намеренно некорректно составленных русских выражений вроде «Я закрыл телевизор», ведь в иврите как раз «закрывают телевизор/телефон».

    https://theoryandpractice.ru/posts/17420-uzhe-ne-znayu-kak-po-russki-skazat-chto-takoe-yazykovaya-regressiya
  • Лингвистика на коленке

    Трижды чемпион мира по скрабблу на английском потратил 2 месяца на то, чтобы изучить французский словарь, и выиграл чемпионат мира по скрабблу на французском. По-французски он по-прежнему не говорит.

    https://twitter.com/eugenewei/status/1120458717911293953?s=21

    Савант, наверное.
  • Лингвистика на коленке

    В Zalandoresearch сделали совершенно потрясающую NLP библиотеку для NER, POS, desambiguation, классификации, работы с embeddings (Glove, FastText, BERT и их собственные). Работает на базе Pytorch и очень-очень простая в использовании, так что даже лингвисты теперь могут тренировать свои модели, используя нейросети. Не нужно знать математику, Numpy и подробную теорию дип-ленинга. Достаточно знаний о параметрах, чем они отличаются и как найти наиболее подходящие. 


    Другой вопрос, что пока что на моем корпусе нейросети уступают в точности и F-score простому Support vector machine. Надеюсь, мои преподаватели объяснят мне этот феномен. 


    Собственно, библиотека: 


    https://github.com/zalandoresearch/flair  


    Понятный туториал как сделать классификационную модель: 

    https://towardsdatascience.com/text-classification-with-state-of-the-art-nlp-library-flair-b541d7add21f  


    И вообще весь этот блог очень хороший, я много полезного из него взяла для упражнений. 
  • Реклама

  • Лингвистика на коленке

    Так получилось, что я долго не писала.

    Весной прошлого года устроилась на очень интересную работу, и так совпало, что внезапно охладела к рассказам о личном. Про работу рассказывать не могла по понятным причинам, а про языки и их изучение абстрактно много не напишешь: читателю нужно именно личное, делиться наблюдениями и внутренней борьбой со сложным, и именно желание, импульс это делать пропало. Часто ловила себя на том, что отмечала какие-то смешные моменты, факты, особенности своего мультиязыкового существования, а приносить их в канал больше не хотелось.

    Отвыкла писать про себя. К этому нужна привычка, особая линза, сквозь которую проходит любое отстраненное наблюдение собственной жизни. Надо гореть тем, что каждое размышление и ощущение может представлять интерес, и смотреть на происходящее именно с этой стороны. А я почему-то решила, что все, что происходит со мной лично, не имеет значения. По сравнению с работой, наверное. Все, что происходило на работе, очень сильно меня увлекало. Но если личное не рассказывать, то зачем тогда блог?

    Очень жаль, что наш маленький, но гордый стартап не выдержал испытания реальностью, но жизнь продолжается, и я почувствовала, что желание писать в канал ко мне снова вернулось.

    Если разрешат основатели, постараюсь рассказать поподробнее, чем мы занимались и что успели сделать, это тесно связано с лингвистикой, обучением языкам и немного связано с обработкой естественного языка – всеми теми темами, которые я стараюсь освещать на этом канале.

    У меня небольшой затык с темами, но я сейчас снова много читаю книг по лингвистике (последний год в основном читала статьи, книги и материалы курсов по обработке естественного языка), возможно, темы появятся оттуда.

    Поныть про свои беды жизни на 4 языках, которые я знаю не очень хорошо, но как-то с трудом справляюсь, тоже бывает полезно.

    Простите, пожалуйста, все те, кому не отвечала на вопросы, в ближайшее время постараюсь ответить по крайней мере на недавние.

    Я по вам скучала, дорогие читатели.
  • Лингвистика на коленке

    Вы спросите меня, зачем я читаю все эти книги? Не знаю, я уже давно не ищу волшебный Грааль (его нет), мне просто интересно, как люди еще могут извернуться, чтобы учить языки.

    Основной секрет давно всем известен, надо просто учить их каждый день не по 10 минут, а минимум по полчаса, тогда сработает. Но может еще что-то придумают.
  • Лингвистика на коленке

  • Лингвистика на коленке

    Офигенно!
  • Лингвистика на коленке

    Есть во французском невинное выражение du coup.

    Оно означает: вот почему, и поэтому, в результате — такая причинно-следственная связка.

    J'ai tombé malade et du coup je suis resté à la maison. — Заболел и в результате остался дома.

    Выражение это очень разговорное и крайне популярное: когда смотрим французские каналы, то считаем, сколько раз говорящий повторил du coup — некоторые вставляют его в каждую фразу! Это такой языковой тик, слово-паразит — чаще всего встречается в речи менее образованных людей и молодежи.

    Когда в четверг смотрели La Grande Librairie по France 5, мою любимую французскую программу про новинки литературы, в беседе четырех писателей за час это выражение прозвучало всего пару раз.

    Я его не использую, потому что его причинно-следственная коннотация у меня полностью вытесняется другим словарным значением — внезапно, вдруг; французы же для этого используют другое, очень похожее на du coup выражение -— tout d'un coup.

    Хотите сойти за своего в компании молодых французов? Вставляйте периодически в своем монологе в ключевые места du coup — не ошибетесь.
  • Лингвистика на коленке

    Сколько до сих пор испытываю сложностей, когда пытаюсь общаться на неродном языке! Вопрос, идти ли за решением этих проблем к преподавателю, или к кому-то еще?

    Очень сложно избавиться от внутреннего критика, который разносит тебя в пух и прах, как только ты открываешь рот. Ты вообще видела как ты формулируешь? А то, что ты делаешь с артиклями в французском, ты видела? А акцент? Лишний раз рот открывать не хочется, и я молчу. Молчу — значит, упускаю возможность развивать язык, говоря на нем.

    И эта привычка бесконечно себя со всеми сравнивать. Я ухитряюсь сравнивать себя с носителями языка. С людьми, которые живут в стране "моего" языка десятилетиями, замужем/женаты на носителях, работают на этом языке. Но если я не могу говорить настолько чисто, разнообразно и правильно, как они, я снова молчу и рот не открываю. Перфекционизм — это болезнь.

    Хуже всего сравнивать себя с любимым человеком. П. свободно, чисто, разнообразно и правильно говорит на 5 языках. Внезапно мы совместно обнаружили, что как только он заходит в помещение, я закрываю рот и больше не открываю, а с людьми разговариваю только в его отсутствие. Это связано не только с языком, но и с тем, что я чувствую себя не настолько эрудированной, образованной и свободно говорящей, как П. и другие мои собеседники.

    Беседа между носителями мчится с такой скоростью, прыгает с темы на тему, что как только ты сформулируешь что-то интересное и соберешься прыгнуть внутрь, как в холодную воду, она уже унеслась в непредсказуемом направлении. Но это совершенно точно не язык, это мои внутренние комплексы, которые мешают перебивать, останавливать, просить вернуться на знакомую почву.

    Нет, это очень часто так: когда у меня проблемы с общением на определенном языке, проблема тут не в языке, а моих внутренних барьерах, в препятствиях к самому акту коммуникации, на каком бы языке он не происходил.

    Многие вещи, которые не получаются с языками, надо прорабатывать не со своим преподавателем, а со своим психотерапевтом. Я работаю над собой каждую неделю, и специалист у меня прекрасный, когнитивно-поведенческая психотерапия рулит, но от некоторых вещей избавиться до сих пор сложно.
  • Лингвистика на коленке

    Недавно прочитала La maravillosa historia del español, написанную Francisco Moreno Fernandez, академическим директором Института Сервантеса – в общем, история испанского языка на испанском и от испанцев.

    Возможно, моя проблема в том, что я еще не очень хорошо знаю испанский, конечно, но мне эта книга показалась слабой и плохо отредактированной. Мало фактического материала, мало интересных примеров из истории языка, много абстрактных, достаточно претенциозных рассуждений на тему того, как была устроено интеллектуальное общество в Испании и Латинской Америке в ту или иную эпоху. Более всего мне не понравился язык книги, он замудренный, тяжелый и плохо согласованный. От начала до конца предложения часто было сложно добраться: это одна из тех книг, которые я заставила себя читать и сейчас все равно с трудом помню, что в ней было написано.

    Испанский язык был языком Испанской империи, в которой никогда не заходило солнце, но такого распространения как французский язык или английский в Европе он не получил. Европейцы всегда смотрели на испанцев слегка свысока, даже на пике их могущества в XVII-XVIII вв. Испанский – язык Латинской Америки, как и любой язык колонизатора, получивший распространение, прежде всего, потому, что обладал огромным престижем, а, во-вторых, послужил объединяющим языком для континента, где локальных языков было великое множество. Очень интересно было читать про то, как Real Academia Española провела регуляризацию написания и грамматики языка, но про это мало было написано. Вообще, после прочтения книги вспоминаются, в основном, какие-то общие места, повторюсь, интересных частностей мало.

    Не рекомендовала бы, но историй испанского языка вообще очень мало, так что можно прочитать ее хотя бы для общего развития.
  • Лингвистика на коленке

  • Лингвистика на коленке

    Обзор учебников итальянского языка

    Все, кто проходил поток в Language Heroes, знают, насколько важно иметь хороший учебник. Преимущество и одновременно недостаток итальянского – это то, что он очень популярен, и существует огромное количество учебников и дополнительных пособий.

    В этом море учебников очень легко потеряться, поэтому в статье я хочу порекомендовать вам учебники, полюбившиеся мне, и те, по которым я была бы рада поучиться сама.

    http://petitepolyglot.com/review-of-italian-textbooks/

    #LanguageBloggersClub
  • Лингвистика на коленке

    Неплохой обзор (учитывая то, что по учебникам я не занимаюсь и даже не представляю, как это можно делать в одиночку). Пользуюсь одной из грамматик, нравится.
  • Лингвистика на коленке

    На языки энергии не остается совсем. Я очень много читаю, совсем не читаю по-русски и по-английски, по-французски, испански и итальянски читаю много. Особенно много по-испански, перечитала «Американские боги» на испанском, например, 1491 (это монументальный труд Чарльза Манна про американских индейцев).

    Смотрю сериалы по-испански, посмотрела Narcos Mexico, Fariña (это Наркос в Галисии), посмотрела Алатристе и еще какие-то дурацкие испанские фильмы.

    Но на целенаправленное изучение языков сил нет.

    Нетфликс, Prime и Movistar — постоянный источник контента, конечно. Попозже напишу, что могу посоветовать посмотреть там по-испански.
  • Лингвистика на коленке

    Что такое язык и является ли он неотъемлемым свойством человека? Почему люди создают и разрушают языки? Как связан язык с мышлением и культурой? Как видят эту связь лингвисты и представители других наук? Способна ли лингвистика обсуждать «глубокие истины»?

    На эти и другие вопросы 12 ноября ответит заведующий лабораторией лингвистической конфликтологии и современных коммуникативных практик ВШЭ Максим Кронгауз. Его лекция «Рожденный говорить» открывает бесплатный курс InLiberty «Природа человека». Полная программа и регистрация на встречу:

    https://www.inliberty.ru/courses/
  • Реклама

  • Лингвистика на коленке

    Что читать современному лингвисту/филологу?

    Телеграм стал площадкой для нишевых сообществ с уникальным контентом. Мы будем рассказывать о каналах, которые читаем сами. В нашем первом обзоре — четыре канала о лингвистике, четыре канала о литературе и два — о цифровых гуманитарных исследованиях.

    @linguistique_sur_un_genouЛингвистика на коленке
    "Лингвист-дилетант" Ксения пишет, в основном, о компьютерной лингвистике и романских языках. Но здесь не только обзоры лучших курсов по NLP и интересные лингвистические факты, здесь ещё и истории из жизни о собеседованиях на иностранном языке, переводах и французском лингвистическом быте.

    @linguisticmadnessLinguistic Madness
    Канал о лингвистике и языках: ссылки, статьи, мнения, факты. Что если переделать "Иронию судьбы" на бандитский манер? Как выглядят граффити для незрячих? Что такое ирландский перфект в английском? Кто говорит на аэрском? И прочие лингвистические безумства.

    @vooioxуЩербы
    Увлекательные рассказы о том, откуда взялось слово "чувак", что такое гражданский брак и можно ли говорить звОнит. В общем, вся правда о русском языке, которую скрывали от нас в школе.

    @word4powerWord4Power
    Канал убежденного последователя святого Иеронима о переводах и лингвистике. Будни синхрониста, полезные переводчику книжки и статьи, лингвистические откровения о русском, украинском, английском и французском. Где еще вы узнаете, как делаются субтитры к фильмам и театральным постановкам и в чем разница между Yob's comma и Oxford comma?

    @theodstavecО литературе и около неё
    Команда этого проекта, название которого в переводе с чешского означает "абзац", делает переводы статей, эссе, рецензий и заметок мировых ресурсов о литературе, чтобы они стали доступнее русскоязычному читателю. А ещё там можно опубликовать свою литературоведческую статью.

    @bookngrillКниги жарь
    Канал студента первой магистратуры Creative Writing в России. Новости современной литературы, советы начинающим писателям, литературоведческий ликбез и просто образец хорошего текста.

    @sashaandleoСаша и Лев
    Дайджест литературных новостей со всего мира — о книжных фестивалях, экранизациях, встречах с писателями, литературных премиях.

    @words_and_moneyСлова и деньги
    Про книги из электронов и из бумаги, деньги из книг, книги без денег и всякое прочее. Издательства, книжные ярмарки, нелитературная сторона мира литературы. По мотивам «Слов и денег» Андре Шиффрина.

    @Sense_catcherБиблиотечная крыса
    Авторский канал о книгах и чтении в цифровую эпоху, "чердак цифрового литературоведа". Здесь и рассуждения о судьбах литературы и ее исследователей, и размышления о современном книгоиздании, и личные впечаления от выездных школ и курсов по Digital Humanities, и рассказы об интересных проектах в современной филологии.

    @sysblokСистемный Блокъ
    Канал о переходе культуры в цифру и применении технологий в гуманитарных науках и искусстве. Как лингвисты ловят маньяков и какие сны снятся нейросетям? Что скрывают от нас соцсети персонажей? Может ли искусственный интеллект залипнуть у телевизора? Системный Блокъ — это современный Вергилий, который проведет вас через девять кругов Big Data.

    Хотите рассказать нам о своем любимом сообществе? Мы уже собираем продолжение. Пишите.
  • Лингвистика на коленке

  • Лингвистика на коленке

    Лаборатория нейронных сетей и глубокого обучения МФТИ открывает курс Deep Learning in Natural Language Processing. Он стартует 4 октября и будет проходить каждый четверг в 19:00 в 105 БК.

    Курс проходит в формате "inverse classroom". Перед каждым семинаром нужно просмотреть лекцию и ответить на квиз. В основе программы — аналогичный курс Стэнфордского университета (cs224n). Обучение будет состоять из просмотра лекций, ответов на квизы, выполнения домашних заданий и проекта. Семинары будут посвящены обсуждению сложных моментов в лекциях, разбору квизов и домашних заданий, а также консультациям по проектам. Проведут их сотрудники лаборатории нейронных сетей и глубокого обучения Владислав Лялин и Алексей Сорокин.

    Занятия будут проводиться в следующем порядке:

    1. Введение в обработку естесственного языка и глубокое обучение, введение в векторные представления слов
    2. Векторные представления слов: Word2vec, GloVe, FastText
    3. Языковые модели, softmax crossentropy loss, однослойные нейронные сети
    4. Нейронные сети и обратное распространение ошибки, методы оптимизации
    5. Практические советы: проверки на градиент, переобучение, регуляризация, функции активации
    6. Рекуррентные нейронные сети в применении к моделированию языка и другим задачам
    7. GRU и LSTM, введение в машинный перевод
    8. Сверточные нейронные сети в применении к классфикации текстов
    9. Машинный перевод, attention
    10. Сети с динамической памятью, контекстуальные векторные представления слов, будущее NLP

    Длительность курса — 10 занятий. Курс открыт для всех желающих углубить свои знания в Deep Learning и Natural Language Processing. Занятия также будут транслироваться в режиме онлайн на Youtube-канале лаборатории (https://www.youtube.com/channel/UCJ-6K2HGA0hpQytlSM7FBVQ).

    Для записи на курс необходимо заполнить форму (https://goo.gl/forms/BbUng7k3KbHK8s1t2). Оперативную информацию можно отслеживать в Телеграм-канале (https://t.me/joinchat/AAAAAEbQgIbzmzfKmMRlVw).

    (Подсмотрено в слаке ODS.)
    Видео недоступно для просмотра
    ОТКРЫТЬ В TELEGRAM
    Deep Hack

    The official channel of Laboratory of Neural Systems and Deep Learning at Moscow Institute of Physics and Technology

    YouTube