Обложка канала

Глазарий языка

5476 @glazslov

Все важное и неважное о русском языке и русском мире

Глазарий языка

7 лет назад
Открыть в
​​О РОЛИ ГЛАСНЫХ

Студенты, которые изучают статистику по всему миру, наверняка знакомы с таблицей, содержащей сведения о пассажирах «Титаника». Она хороша тем, что позволяет практиковаться в разных методах работы с данными, поскольу, во-первых, довольно велика (1313 записей), а во-вторых, включает разные типы переменных: имя пассажира, его пол, возраст, класс каюты, а также информацию о том, выжил он при катастрофе или погиб. Возможно, этически это и сомнительно, но дидактически очень удобно.

Как использовать этот ужасно-прекрасный материал для лингвистических целей?

Мы решили узнать, влияет ли как-то количество гласных в имени человека на его шансы выжить при кораблекрушении.

Возможно, это покажется вам удивительным (и клянемся чем угодно, что не врем), но построенная нами модель бинарной логистической регрессии оказалась не только статистически значимой (Pr(> chi2) <0.0001), но и способной объяснить более 70 % всего объема варьирования!

Итак, внимание: каждая дополнительная гласная в имени пассажира увеличивает шансы его спасения в Атлантическом океане в 1.35 раза. Только посмотрите на прикрепленный график.

В общем, если бы на «Титанике» оказались одновременно Дмитрий Николаевич Овсянико-Куликовский и, скажем, Лев Владимирович Щерба, первый практически наверняка бы выжил, а второй — гарантированно утонул.

Задать вопрос @UchenyjBot