Целее зубы — мягче звуки

Лингвисты отчитались о главных словах ушедшего года, ими стали — протест, пытки, предпенсионеры, транзит, автозак.


© СС0 Public Domain

Лингвистика или языкознание — наука тихая, которая сенсаций преподносит мало (особенно если не идет речь о нецензурной лексике или о запрете русского языка в сопредельных государствах).  О том, как развиваются дела на лингвистической ниве, рассказал на днях в клубе «Архэ» доцент Института лингвистики РГГУ Александр Пиперский.

По словам ученого, одно из исследований, завершенных в 2019 году, касалось «соотношения прикуса и звуков в разных языках». Это естественно: с такими разделами анатомии, как устройство зубов и носоглотки, лингвистика соприкасается плотно. Новизна же состояла вот в чем: ученые пытались понять или проследить, зависело ли произношение согласных звуков от условий жизни народов и, в особенности, от их питания.

«У нас принято считать, что правильный прикус — это когда верхние зубы перекрывают нижние, — заметил лектор. — И люди обычно рождаются с таким прикусом. Но если вы едите много жесткой пищи, у вас изнашиваются зубы. И вы переходите к прямому прикусу. Вам трудно произносить губно-зубные звуки типа «в» и «ф».

«Прямой прикус» — положение, когда верхние зубы находятся прямо над нижними. Действительно, поскольку «в» и «ф» («губно-зубные») звуки создаются прижатием нижней губы к верхним зубам, с прямым прикусом их произносить труднее.

Отсюда ученые сделали вывод, что губно-зубных звуков было меньше в языках тех обществ, что жили охотой и собирательством. Мясо, особенно без всяких кулинарных изысков, с костра, не говоря уж о сыром, — довольно жесткое, а коренья и подавно. Понятно, что в наши дни племена охотников-собирателей не очень-то найдешь. Но в истории кое-какие тенденции проследить можно.

Ученые установили, что примерно 6-8 тысяч лет назад в индоевропейских языках губно-зубных звуков было меньше, а губно-губных («п» и «б») — больше. Так, в греческом языке, путь развития которого очень хорошо изучен, за последние три тысячи лет во многих словах «п» и «б» сменились на «в» и «ф»: можно привести такие слова, как «философос» или «автос». 

В русском языке мы озвончаем глухие согласные перед звонкими («от больницы» звучит как «одбольницы»). Но не всегда так: в слове «отважный» перед «в» произносится явное «т». «Перед «в» мы умеем говорить и «т», и «д», — отметил Пиперский. — Потому что две тысячи лет назад это было не «в». Было вроде «у».

Вот этот «прирост губно-зубных согласных в ряде языков» лингвисты и связывают ориентировочно с питанием. Со временем люди все больше переходили на каши и рубленые котлеты.

Другое лингвистическое исследование минувшего года изучает связи «порядка слов в языках мира с рабочей памятью человека». Так, группа ученых путем несложных опытов с носителями разных языков, установила, что носители ряда языков, например, японского, корейского или аварского, лучше запоминают начало предложения.

Это естественно: данные языки относятся к языкам «левого ветвления», в которых фраза строится не привычным для русского или английского языков: «Дай мне книгу, которая лежит на столе», а примерно так: «Стола поверхность находящуюся книгу дай». Зависимые слова уходят влево от главного. Поскольку для японца, корейца или аварца особенно важно начало фразы, он ее и запоминает лучше.

Такие исследования относятся к фундаментальной лингвистике. Что касается лингвистики прикладной, то, по словам Пиперского, минувший год обошелся «без потрясающих прорывов».

Ну, это смотря кого что потрясает. То, что японец лучше запоминает начало фразы, большинство из нас вряд ли «потрясет». А вот то, что в 2019 году в мире аж в восемь раз подскочили продажи «умных колонок» с элементами искусственного интеллекта (около 320 тысяч, тогда как в 2018 году всего 40 тысяч) — «потрясает» обывателя куда больше. Переводчиков же, вероятно, может «потрясти» неуклонное повышение качества машинного перевода.

Как рассказал Александр Пиперский, в последние годы он следил за развитием машинного перевода и, в частности, ежегодно загонял в Google Translate несколько одних и тех же цитат из речи знаменитого лингвиста, академика Андрея Зализняка. И каждый год перевод оказывался все лучше. В 2019-м ученый «сдался», признав машинный перевод совершенством.

Неуклонно растет и число языков, вовлеченных в этот прогресс. Правда, большинство языков по-прежнему переводится на русский и с русского через язык-посредник — английский. «Но сейчас эта проблема стала менее чудовищной, — рассказал Пиперский, — поскольку в каждой отдельной паре языков перевод становится все лучше». По данным ученого, теряется уже не 30% смысла на каждый язык, а всего около 10%. Разница принципиальная.

Одно из важнейших исследований 2019 года в области компьютерной лингвистики было посвящено «автоматическому извлечению импликаций». «Компьютеру, чтобы с нами взаимодействовать, надо нас понимать. Ему надо извлекать информацию из текста, — отметил лектор. — Между тем «предложения естественного языка» сообщают больше, чем можно вывести из них на первый взгляд».

В качестве примера лектор привел знаменитый вопрос: «Вы уже перестали пить коньяк по утрам?» Для «непосвященного», каковым является компьютер, вопрос звучит вполне серьезно. Тогда как это издевка. «Мы это понимаем очень легко, — отметил Пиперский. — Как научить компьютер?»

Здесь прогресс достаточно медленный. Пиперский привел еще одну простейшую фразу: «Петя забыл, что Вася ищет новую работу». И вместо слова «забыл» подставил много других слов: «заподозрил», «не заподозрил», «с какой-то стати заподозрил» и т. д. В каждом варианте вероятность того, что Вася действительно ищет новую работу, довольно разная.

Ученые пытались действовать, в частности, «правиловым» методом: составляли список каких-то глаголов, по-разному взаимодействующих с отрицанием («знать», «доказать», «врать», «согласиться» и т. д.), которые загоняли в компьютер. Пробовали и метод самообучения по принципу нейронной сети.

На сегодняшний день установлено, что «правиловый метод» лучше работает с отрицаниями, нейросетевой — с модальными глаголами типа «может» и «должен». С условными конструкциями типа «Если бы Петя мог заподозрить…» пока что оба метода работают плохо. Ничего, время есть.

Александр Пиперский также сообщил, что «русскими словами 2019 года» экспертный совет при Центре творческого развития русского языка под руководством Михаила Эпштейна избрал такие слова, как «протест, пытки, предпенсионеры, транзит, автозак, клоачный», глаголы «допускай» и «прокачай». Признав, правда, что подлинный «алгоритм частотного выделения слов» еще ждет создателя.

Леонид Смирнов