МОДЕЛЬ РЕАКЦИИ БАЗИЛЯРНОЙ МЕМБРАНЫ ВНУТРЕННЕГО УХА ЧЕЛОВЕКА НА ТОНАЛЬНЫЕ АКУСТИЧЕСКИЕ ВОЗДЕЙСТВИЯ


Цитировать

Полный текст

Аннотация

Слуховая система человека играет ведущую роль в его жизнедеятельности и прежде всего в процессах информационного обмена на основе звуковых сигналов, особенно устной речи. В связи с этим во многих странах проводятся исследования особенностей восприятия звуков человеком на основе создания различного вида моделей. Это необходимо для совершенствования слуховых аппаратов, разработки систем автоматического распознавания устной речи в системах искусственного интеллекта, оптимизации технологий обработки речевых сигналов при хранении и передаче речевых сообщений. В рамках данной работы получены соотношения, позволяющие воспроизвести результаты эмпирических исследований, в том числе психоакустических, реакций слуховой системы человека на тональные воздействия.

Полный текст

Введение Процессы восприятия звука человеком до- статочно интенсивно исследуются с различных позиций, среди которых прежде всего следует отметить физиологию слуха, включая медицин- ские аспекты [1]. Еще одно направление связано с разработкой и использованием компьютерных технологий воспроизведения звуков, например с помощью музыкальных инструментов или элек- тронных средств [2]. Другое важное направление связано с созданием компьютерных технологий обработки записей устной речи и музыкальных записей, включая различные манипуляции с це- лью улучшения их звучания и сжатие данных при хранении и передаче. Особое значение приобретает разработка технологий автоматического рас- познавания устной речи, что относится к области искусственного интеллекта. Представляется верным предположение о том, что в процессе обучения речевому информацион- ному обмену каким-то образом в мозгу человека формируются коды, отражающие словные типы акустических воздействий на слуховую системы. Ясно, однако, что эти коды формируются при фиксировании реакций гидромеханических про- цессов во внутреннем ухе. Поэтому разработка модели распространения волн во внутреннем ухе актуальна и с позиций описания процессов обу- чения восприятию слов. Легко понять, что так или иначе возникает не- обходимость прогнозирования реакции слуховой «Infokommunikacionnye tehnologii» 2021, Vol. 19, No. 2, pp. 145-151 системы человека на создаваемые акустические воздействия. Восприятие звуков, особенно эле- ментов устной речи или музыкальных образов, тесно сопряжено с мозговой деятельностью (ин- теллектуальная часть слуховой системы челове- ка). Поэтому область исследования возникающих эффектов принято именовать психоакустикой [2-4], и ее развитию посвящено много работ. Сле- дует отметить, что психоакустические исследо- вания, как правило, имеют качественный характер сравнений с некоторыми опорными ситуациями. Такими, например, являются результаты исследо- ваний восприятий высоты или громкости тональ- ных воздействий [4; 5], а также так называемых критических полос слуха. Качественный харак- тер результатов психоакустических исследова- ний до определенной степени затрудняет осу- ществление количественного прогноза реакции слуховой системы на акустические воздействия, в том числе сформированные специально. Вместе с тем не вызывает сомнений целесо- образность создания математических основ для количественного прогнозирования таких реак- ций, особенно в целях диагностики слуховой си- стемы, включая оценку индивидуальных свойств исследуемого. Кроме того, это может служить основой моделирования восприятия звуков, осо- бенно при распознавании устной речи. Ясно, что адекватное количественное моде- лирование возможно только для физических си- стем, реакции которых при одних и тех же усло- виях в том или ином смысле идентичны. В случае слуховой системы человека такими элементами являются гидромеханическая часть уха человека и прежде всего так называемое внутреннее ухо. Как известно [1; 3; 4; 6], с точки зрения восприя- тия звуков основным элементом внутреннего уха является так называемая базилярная мембрана (БМ), погруженная в несжимаемую жидкость, в которой и распространяются бегущие волны. Отметим, что бегущие волны были зафиксиро- ваны Бекеши по движениям составляющих БМ тонких ленточек при тональных входных воз- действиях. Число этих ленточек составляет по- рядка 3500 [4]. Именно размах их колебаний принимается за реакцию БМ в некоторой точке на воздействие определенной частоты и имену- ется амплитудно-частотной характеристикой [3]. В свою очередь, совокупность этих максимумов вдоль БМ при воздействии тонального сигнала определенной частоты естественно именовать координатно-частотной характеристикой. Представляется, что именно наличие матема- тических зависимостей, описывающих эти характеристики, может позволить на основе фик- сирования психоакустических эффектов решать обратные задачи исследований физиологии слуха конкретного испытуемого либо определять ус- ловия достижения качественного звучания пре- образованных акустических воздействий. Кроме того, появляется возможность моделирования процессов распознавания устной речи человеком, например объяснение эффектов распознавания слов при их произнесении дикторами с разными манерами, например тембрами голосов, частота- ми основного тона и т. п. Возможно, что имеют- ся некоторые групповые операции для реакций участков БМ, которые с позиций интеллекту- альной части слуховой системы воспринимают- ся как симметрии. Исследование этих аспектов функционирования слуховой системы представ- ляет несомненный интерес. В настоящее время в результате эксперимен- тальных исследований накоплено достаточно много эмпирических данных, характеризующих свойства слуховых систем не только человека, но и некоторых животных (морских свинок, марты- шек). Вместе с тем, кроме некоторых частных ре- зультатов аппроксимации эмпирических данных, например построения мел-шкалы или кривых равной громкости, не существует математиче- ских зависимостей, которые позволяют воспро- извести эмпирически установленные проявления реакции БМ на тональные воздействия, в том числе психоакустические эффекты. В данной работе предпринята попытка по- строения такой модели на основе достаточно об- щих физических принципов. Основные факты эмпирических исследований слуховой системы с помощью тональных воздействий Во многих источниках [1-12] отмечаются сле- дующие проявления реакций слуховых систем на тональные воздействия различных частот. Пространственные проявления. При то- нальных воздействиях во внутреннем ухе рас- пространяются бегущие волны нарастающей до некоторой координаты (расстояния от овального окна) амплитуды, после которой они быстро за- тухают, причем чем выше частота воздействия, тем меньшее расстояние проходит волна. Фазо- вые скорости волн монотонно уменьшаются с увеличением расстояний от овального окна. Оги- бающие бегущих волн естественно именовать координатно-частной характеристикой (КЧХ) БМ. Амплитудно-частотные проявления. Диапа- зон частот воспринимаемых тональных воздей- ствий удовлетворяет неравенству 20 f 20000 Гц. (1) lm (z) L - lnah ln(z / z0 ), (4) Амплитуда колебательной реакции в некотогде lm (z) - отсчитанная от овального окна кооррой точке БМ на тональные воздействия различной частоты (амплитудно-частотная характери- стика - АЧХ элемента БМ) нарастает с ростом частоты воздействия до некоторой характерной дината максимума волны, которой соответствует резонансная частота z поперечных колебаний элемента БМ для этой точки величины, а затем достаточно z0 50 Гц. (5) быстро спадает. Соответствующую максимуму Параметр lnah можно трактовать как коордиамплитуды реакции частоту воздействия пред- ставляется естественным называть резонансной частотой. нату первого от овального окна максимума (наивысшая резонансная частота). В [7] на основе эм- пирических данных получена следующая оценка: Скорость нарастания АЧХ вблизи максимума lnah 4,84. (6) гораздо меньше, чем скорость спада. Психоакустические эффекты. Восприни- маемая (оцениваемая) человеком высота сину- соидального воздействия является нелинейной функцией его частоты. Увеличение интенсивно- Очевидно, что соотношение (4) можно обра- тить в зависимость резонансной частоты от коор- динаты элемента БМ, где должен возникать мак- симум бегущей волны сти воздействий приводит к уменьшению восz(l) z0 exp((L - l) / lnah ). (7) принимаемой высоты низкочастотных воздей- ствий и увеличению высоты высокочастотных (выше 5000 Гц); В свою очередь, в работе [8] показано, что зависимость ширины БМ от координаты описыва- ется соотношением Наблюдается свойство группировки слуховых s(l) smax exp((l - L) / 4lnah ), (8) ощущений, что принято отмечать как наличие критических полос слуха, когда два воздействия воспринимаются как одно, если разность их чакоторому соответствуют следующие значения максимальной и минимальной ширины БМ: стот не превосходит определенных величин (шиsmax 0,55; smin 0, 09. (9) рина критической полосы). Целью дальнейшего исследования является по- строение математических соотношений, позволя- ющих в количественном виде воспроизвести неко- торые экспериментально установленные свойства АЧХ элементов БМ и КЧХ на основе задания только доступных для измерения параметров то- нальных воздействий (частоты и интенсивности). Отметим, что они несколько отличаются от указанных в (5) значений, которые являются ре- зультами измерений, и вполне могут варьиро- ваться. Комбинирование (7) и (8) позволяет получить следующее соотношение между ширинами БМ и резонансными частотами: 4 Представляется естественным именовать такую z(l1 )/ z(l2 ) (s(l2 )/ s(l1 )) . (10) модель феноменологической. При этом в основе построения используются следующие эмпириче- ские данные о геометрических характеристиках БМ. В развернутом состоянии БМ представляет собой трапециевидную фигуру длиной порядка L 35 мм. (2) и нарастающей от овального окна шириной 0,1 s 0,5 мм. (3) Некоторые элементы математического моделирования распространяющихся вдоль БМ волн Таким образом, частоты резонансов обратно пропорциональны четвертым степеням ширины БМ в соответствующей координате. Основные общие аспекты математического моделирования АЧХ элементов БМ и ее КЧХ Рассмотрим теперь задачу построения мате- матической модели амплитудно-частотной харак- теристики некоторой координаты БМ. Предпола- гаем, что резонансные поперечные колебания в этой точке описываются соотношением y(t) b sin(2 zt), (11) Важной задачей является установление связи между частотами резонансов и координатами БМ, где возникают максимумы возбуждаемых бегущих волн. Она достаточно подробно исслегде z - резонансная частота, в Гц; t - текущее время. В свою очередь, пусть тональные воздей- ствия описываются соотношением дована в работе [7], где на основе прозрачных x(t) a sin(2 ft ), (12) физических соображений получено искомое со- отношение где - некоторая фаза. Для АЧХ введем обозначение H (z, f , w), имея в виду также зависимость от характеристики интенсивности воздействия w. Способ определения этой характеристики будет уточнен позже. Представляет интерес определение достаточ- Представляется справедливой гипотеза о том, что при определении высоты звучания этого воздействия интеллектуальная часть слуховой системы ориентируется на усредненное с весом но общих свойств модели АЧХ. H 2 (z, f , w) значение резонансных частот. Ины- 1. Легко понять, что величина отклонения ленточек БМ зависит от величины кинетической энергии возмущающих сил в сравнении с кине- тической энергией, необходимой для создания ми словами, с помощью соотношения V ( f , w) d zH 2 (z, f , w)dz, 0 (20) колебаний с максимальной амплитудой. Кинети- ческие энергии этих движений пропорциональ- ны квадратам первых производных функций (11) и (12), которые определяют скорости колебаний. Поэтому представляется обоснованным считать, что искомая АЧХ зависит от отношения где d - положительный нормирующий коэффи- циент, можно воспроизвести зависимость вос- принимаемой высоты тонального воздействия от соответствующей частоты. Это предположение назовем психоакустиче- ской гипотезой. где x wf / z, w b / a. (13) (14) 4. После подстановки (7) в выражение для АЧХ должна получаться модель огибающей бе- гущей волны, которая возникает при тональном Пусть теперь воздействие g(t) имеет трансвоздействии соответствующей частоты. Иными форманту Фурье G( ). Тогда на основе предпословами, в соответствии с (13) КЧХ БМ является ложения о линейности фильтрации получаем, что энергия отклика в рассматриваемой точке БМ функцией отношения u wf / z0 exp((l - L) / lnah ). (21) определяется соотношением || v(z) ||2 c G2 ( f )H 2 (z, f , w)df , - (15) Отметим, что получаемая модель КЧХ должна адекватно соответствовать приведенным в лите- ратуре графикам эмпирических КЧХ. В частно- сти, в [6] отмечается, что тональное воздействие где c - некоторый положительный коэффициент. При финитной области распределения спектраль- ной плотности воздействия с частотой 200 Гц вызывает максимум бегущей волны примерно на расстоянии l(200) 28,5 мм. (22) f (-F , F ), (16) вне которой она равна нулю, а внутри постоянна и равна Модель АЧХ / КЧХ Ввиду сложностей учета множества особен- D || g ||2 /2F , (17) ностей внутреннего уха дать физическое обосоотношение (14) дает представление для затрат энергии на создание выходного колебания F снование математическому описанию распро- страняющихся вдоль БМ в перилимфе волн не представляется возможным. Об этом свидетель- || v(z) ||2 cD H 2 (z, f , w)df . - F (18) ствуют приведенные в различных источниках, например в [6], примеры. В этих условиях есте- Видится естественным представление о том, что в этих условиях для всех точек БМ затраты энергии на создание выходного колебания долж- ны быть одинаковыми. Иными словами, для всех резонансных точек БМ должно выполняться ра- венство F ственно использовать эвристическое описание, которое позволяет воспроизвести установленные экспериментально важные свойства слуховой си- стемы. Такие модели принято именовать феноме- нологическими. В рамках данной работы для квадрата АЧХ предлагается следующая модель: z : H 2 (z, f , w)df const. - F (19) H 2 (z, f , w) H 2 (x, w) (23) Ясно, что правая часть здесь зависит в том числе от энергии воздействия. Эмпирические данные свидетельствуют о том, что одно и то же тональное воздействие воз- wcx2 exp(-(cx2 (1 - x2 ))2 ) / z, где c - коэффициент, конкретное значение кото- рого буждает много точек БМ, которые характеризуют- ся соответствующими резонансными частотами. c ln(10) 2,3026, удовлетворяет условию (24) Рисунок 1. График зависимости нормированной высоты восприятия тональных воздействий, частота которых отложена по оси абцисс Рисунок 2. График КЧХ при тональном воздействии частотой 200Гц, по оси абсцисс - расстояние от овального окна когда Zmax 0 wcx2 exp(-(cx2 (1 - x2 ))2 )dz / z 1, (25) вести результаты эмпирических исследований ре- акции слуховой системы человека на тональные воздействия, включая такие психоакустические эффекты, как восприятие высоты воздействий. w 1; Zmax 16000 Ãö; (26) Важно отметить, что, используя соотношение 50 f 16000 Ãö. Отметим, что это свойство отвечает требова- нию (19), и в соответствии с определением (13) вида (27), можно вычислить импульсные характеристики фильтров, которые описывают реак- ции элементов БМ во времени: w / z dx / df . На рисунке 1 приведен вычисленный соp(t,l) P( f ,l) cos(2 tf )df / . 0 (28) гласно (20) график зависимости высоты вос- принимаемых тональных воздействий. График нормирован, так что воздействию тысячи герц со- ответствует воспринимаемая высота в тысячу мел. Отметим, что график на рисунке 1 хорошо со- впадает с приведенной в работе [5] аппроксима- цией эмпирических данных, которая также, как и здесь, получена при одинаковой интенсивности воздействий. Таким образом, сформулированная в пункте 4 раздела 5 гипотеза подтверждается. Осуществляя в (23) замену переменных в со- ответсвии с (7) и (21), получаем соотношение для квадрата КЧР (огибающей бегущих волн): P2 ( f ,l, w) P2 (u, w) Эти фильтры предлагается именовать психо- акустическими. Совокупность последовательных реакций психоакустических фильтров на некоторое воз- действие, определяемая звуками произносимого слова, представляет собой код этого слова, кото- рый формируется в процессе обучения челове- ка речевому обмену. Следовательно, для любых слов можно такие коды зафиксировать на основе специального обучения и затем использовать, на- пример, в процедурах распознавания ключевых слов. wcu2 exp(-(cu2 (1 - u2 ))2 ) exp((l - L) / lnah ) / z0 . (27)
×

Об авторах

Е. Г Жиляков

Белгородский государственный национальный исследовательский университет

Email: zhilyakov@bsu.edu.ru
Белгород, РФ

С. П Белов

Белгородский университет кооперации экономики и права

Email: belovssergei@gmail.com
Белгород, РФ

А. С Белов

Белгородский университет кооперации экономики и права

Email: belov_as@bsu.edu.ru
Белгород, РФ

Е. И Прохоренко

Белгородский государственный национальный исследовательский университет

Email: prokhorenko@bsu.edu.ru
Белгород, РФ

Список литературы

  1. Альтман Я.А. Слуховая система. Л.: Наука, 1990. 620 с.
  2. Алдошина И. Основы психоакустики. Часть 1 // Звукорежиссер. 1999. № 6. С. 1-14
  3. Молчанов А.П., Бабкина Л.Н. Электрические модели улитки органа слуха. Л.: Наука, 1978. 181 с.
  4. Цвикер Э., Фельдкеллер Р. Ухо как приемник информации / пер. с нем. под ред. Б.Г. Белкина. М.: Связь, 1971. 255 с.
  5. Stevens S.S., Volkman J., Newman E.B. A scale for the measurement of the psychological magnitude pitch // The Journal of the Acoustical Society of America. 1936. Vol. 8, no. 3. DOI: https://doi.org/10.1121/1.1915893
  6. Шредер М.Р. Модели слуха // Proceedings of the IEEE. 1975. Vol. 63, no. 9. P. 1332-1350.
  7. Модель взаимосвязи координат максимумов огибающих бегущих вдоль базилярной мембраны волн с частотами их возбуждения / Е.Г. Жиляков [и др.] // Информационные системы и технологии. 2020. № 4. С. 5-10.
  8. О скорости распространения возмущений вдоль базилярной мембраны слуховой системы человека / Е.Г. Жиляков [и др.] // Инфокоммуникационные технологии. 2020. Т. 18, № 2. С. 188-194.
  9. Гельфанд С.А. Слух: введение в психол. и физиол. акустику / пер. с англ. О.К. Федоровой, О.П. Токарева. М.: Медицина, 1984. 350 с.
  10. Алдошина И. Основы психоакустики. Слух и речь. Часть 1 // Звукорежиссер. 2002. № 1. С. 38-44.
  11. Алдошина И. Основы психоакустики. Слух и речь. Часть 2 // Звукорежиссер. 2002. № 3. С. 54-58.
  12. Алдошина И. Основы психоакустики. Слух и речь. Часть 3 // Звукорежиссер. 2002. № 4. С. 38-44.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

© Жиляков Е.Г., Белов С.П., Белов А.С., Прохоренко Е.И., 2021

Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

Данный сайт использует cookie-файлы

Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта.

О куки-файлах