Лорел — Йенни

Наткнулась на интересную штуку в начале лета, а потом еще в Людвигочатике меня об этом спросили. Наконец руки дошли рассказать о любопытном эффекте «Лорел — Йенни» (руки дошли рассказать — смеюсь :)).

Итак, в интернете появилась трехсекундная запись, на которой мужчина произносит одно слово. Половина народу слышит слово как Lorel, а вторая половина — как Yenny. (История с бело-золотым и синим платьем повторяется.)

Рассказываю, почему так происходит.

Каждый звук языка, который мы произносим, прежде всего является колебанием воздуха, как и любой другой звук (долгий «донннн» от удара металлической палкой по трубе или противный скрежет, когда вот гвоздем по стеклу). Воздух выталкивается из легких и проходит через речевой тракт — это все полезное для речепроизводства, что есть у нас в горле и во рту. Для разных звуков мы меняем форму горла, используем язык, смыкаем губы, прижимаем губы к зубам и делаем еще много всякого. По дороге иногда добавляется тон (то есть голос — у гласных он есть и у звонких согласных).

Все эти штуки влияют на физические свойства звука. Чтобы ясно их представить, звук переводят в визуальное изображение и получают веселые картинки — спектрограммы. На них обычно видны форманты — резонансные частоты, наиболее сильные для речевого тракта данной формы. Идет звук с определенными частотами из легких, гортань начинает колебаться. Совпадающие частоты усиливаются, получается резонанс — готова форманта. Форманты на спектрограммах — очевидные такие полоски. Они нумеруются от самой нижней вверх — первая, вторая, третья и так далее.

Так вот, наш мозг отличает один звук от другого в том числе по формантным частотам.

Форманты на спектрограмме похожи на перекладины шведской стенки. Даже если на двух стенках перекладины располагаются на разной высоте, отличить одну от другой бывает сложно

Но засада в том, что у некоторых звуков эти отличительные признаки, форманты, очень похожи. Например, [l] и [j] имеют третью форманту в районе 2500 Гц, а вторую — где-то около 700 Гц или ниже. У [o] и [e] высота формант разная (400 и 800 Гц против 400 и 1800 Гц), но она может меняться из-за того, что в речи мы произносим звуки слитно. Это называется коартикуляцией. Из-за коартикуляции форманты могут сливаться, съезжать — и то, как воспримет звук наш мозг, зависит от того, какие форманты он посчитает первой и второй. Так же похожи звуки, обозначаемые r и n. Первый — не согласный, а особый американский [o] с дополнительной артикуляцией, [n] — носовой, тоже близкий к гласным звук. А с [i] та же история, что и с [l] и [j].

Как это выглядит на реальных спектрограммах для Lorel и Yenny

То, как мы слышим это слово, зависит от тренировки слуха (в распознавании разных частот) и особенностей восприятия звуков мозгом (перцепции). Потренировать слух и научиться управлять слуховым восприятием (реально работает!) можно вот тут.

Также спасибо за материал N + 1.

Поделиться
Отправить
Запинить
2018  
1 комментарий
MichaelTooke

ЗАКАЖИ СЕЙЧАС УМНЫЕ ЧАСЫ СО СКИДКОЙ!
http://c.twnt.ru/qaNn — цена часов smartwatch
http://c.twnt.ru/qaNn
Умные часы SmartWatch SW007
Smart Watch SW007
Инновационные Умные часы с широчайшими возможностями
http://c.twnt.ru/qaNn
Оплата часов после получения на руки
http://c.twnt.ru/qaNn — обзор часов smartwatch

Ваш комментарий
адрес не будет опубликован

ХТМЛ не работает

Ctrl + Enter
Популярное