A MODEL OF THE RESPONSE OF THE BASILARY MEMBRANE OF THE HUMAN’S INNER EAR TO TONE ACOUSTIC IMPACT


Cite item

Full Text

Abstract

The human auditory system plays a leading role in his life and primarily in the processes of information exchange based on sound signals, especially oral speech. In this regard, in many countries, studies of the features of the perception of sounds by a person are carried out on the basis of the creation of various types of models. This is necessary to improve hearing aids, develop systems for automatic speech recognition in artificial intelligence systems, optimize speech signal processing technologies for storing and transmitting speech messages. Within the framework of this work, relationships have been obtained that make it possible to reproduce the results of empirical studies, including psychoacoustic, reactions of the human auditory system to tonal influences.

Full Text

Введение Процессы восприятия звука человеком до- статочно интенсивно исследуются с различных позиций, среди которых прежде всего следует отметить физиологию слуха, включая медицин- ские аспекты [1]. Еще одно направление связано с разработкой и использованием компьютерных технологий воспроизведения звуков, например с помощью музыкальных инструментов или элек- тронных средств [2]. Другое важное направление связано с созданием компьютерных технологий обработки записей устной речи и музыкальных записей, включая различные манипуляции с це- лью улучшения их звучания и сжатие данных при хранении и передаче. Особое значение приобретает разработка технологий автоматического рас- познавания устной речи, что относится к области искусственного интеллекта. Представляется верным предположение о том, что в процессе обучения речевому информацион- ному обмену каким-то образом в мозгу человека формируются коды, отражающие словные типы акустических воздействий на слуховую системы. Ясно, однако, что эти коды формируются при фиксировании реакций гидромеханических про- цессов во внутреннем ухе. Поэтому разработка модели распространения волн во внутреннем ухе актуальна и с позиций описания процессов обу- чения восприятию слов. Легко понять, что так или иначе возникает не- обходимость прогнозирования реакции слуховой «Infokommunikacionnye tehnologii» 2021, Vol. 19, No. 2, pp. 145-151 системы человека на создаваемые акустические воздействия. Восприятие звуков, особенно эле- ментов устной речи или музыкальных образов, тесно сопряжено с мозговой деятельностью (ин- теллектуальная часть слуховой системы челове- ка). Поэтому область исследования возникающих эффектов принято именовать психоакустикой [2-4], и ее развитию посвящено много работ. Сле- дует отметить, что психоакустические исследо- вания, как правило, имеют качественный характер сравнений с некоторыми опорными ситуациями. Такими, например, являются результаты исследо- ваний восприятий высоты или громкости тональ- ных воздействий [4; 5], а также так называемых критических полос слуха. Качественный харак- тер результатов психоакустических исследова- ний до определенной степени затрудняет осу- ществление количественного прогноза реакции слуховой системы на акустические воздействия, в том числе сформированные специально. Вместе с тем не вызывает сомнений целесо- образность создания математических основ для количественного прогнозирования таких реак- ций, особенно в целях диагностики слуховой си- стемы, включая оценку индивидуальных свойств исследуемого. Кроме того, это может служить основой моделирования восприятия звуков, осо- бенно при распознавании устной речи. Ясно, что адекватное количественное моде- лирование возможно только для физических си- стем, реакции которых при одних и тех же усло- виях в том или ином смысле идентичны. В случае слуховой системы человека такими элементами являются гидромеханическая часть уха человека и прежде всего так называемое внутреннее ухо. Как известно [1; 3; 4; 6], с точки зрения восприя- тия звуков основным элементом внутреннего уха является так называемая базилярная мембрана (БМ), погруженная в несжимаемую жидкость, в которой и распространяются бегущие волны. Отметим, что бегущие волны были зафиксиро- ваны Бекеши по движениям составляющих БМ тонких ленточек при тональных входных воз- действиях. Число этих ленточек составляет по- рядка 3500 [4]. Именно размах их колебаний принимается за реакцию БМ в некоторой точке на воздействие определенной частоты и имену- ется амплитудно-частотной характеристикой [3]. В свою очередь, совокупность этих максимумов вдоль БМ при воздействии тонального сигнала определенной частоты естественно именовать координатно-частотной характеристикой. Представляется, что именно наличие матема- тических зависимостей, описывающих эти характеристики, может позволить на основе фик- сирования психоакустических эффектов решать обратные задачи исследований физиологии слуха конкретного испытуемого либо определять ус- ловия достижения качественного звучания пре- образованных акустических воздействий. Кроме того, появляется возможность моделирования процессов распознавания устной речи человеком, например объяснение эффектов распознавания слов при их произнесении дикторами с разными манерами, например тембрами голосов, частота- ми основного тона и т. п. Возможно, что имеют- ся некоторые групповые операции для реакций участков БМ, которые с позиций интеллекту- альной части слуховой системы воспринимают- ся как симметрии. Исследование этих аспектов функционирования слуховой системы представ- ляет несомненный интерес. В настоящее время в результате эксперимен- тальных исследований накоплено достаточно много эмпирических данных, характеризующих свойства слуховых систем не только человека, но и некоторых животных (морских свинок, марты- шек). Вместе с тем, кроме некоторых частных ре- зультатов аппроксимации эмпирических данных, например построения мел-шкалы или кривых равной громкости, не существует математиче- ских зависимостей, которые позволяют воспро- извести эмпирически установленные проявления реакции БМ на тональные воздействия, в том числе психоакустические эффекты. В данной работе предпринята попытка по- строения такой модели на основе достаточно об- щих физических принципов. Основные факты эмпирических исследований слуховой системы с помощью тональных воздействий Во многих источниках [1-12] отмечаются сле- дующие проявления реакций слуховых систем на тональные воздействия различных частот. Пространственные проявления. При то- нальных воздействиях во внутреннем ухе рас- пространяются бегущие волны нарастающей до некоторой координаты (расстояния от овального окна) амплитуды, после которой они быстро за- тухают, причем чем выше частота воздействия, тем меньшее расстояние проходит волна. Фазо- вые скорости волн монотонно уменьшаются с увеличением расстояний от овального окна. Оги- бающие бегущих волн естественно именовать координатно-частной характеристикой (КЧХ) БМ. Амплитудно-частотные проявления. Диапа- зон частот воспринимаемых тональных воздей- ствий удовлетворяет неравенству 20 f 20000 Гц. (1) lm (z) L - lnah ln(z / z0 ), (4) Амплитуда колебательной реакции в некотогде lm (z) - отсчитанная от овального окна кооррой точке БМ на тональные воздействия различной частоты (амплитудно-частотная характери- стика - АЧХ элемента БМ) нарастает с ростом частоты воздействия до некоторой характерной дината максимума волны, которой соответствует резонансная частота z поперечных колебаний элемента БМ для этой точки величины, а затем достаточно z0 50 Гц. (5) быстро спадает. Соответствующую максимуму Параметр lnah можно трактовать как коордиамплитуды реакции частоту воздействия пред- ставляется естественным называть резонансной частотой. нату первого от овального окна максимума (наивысшая резонансная частота). В [7] на основе эм- пирических данных получена следующая оценка: Скорость нарастания АЧХ вблизи максимума lnah 4,84. (6) гораздо меньше, чем скорость спада. Психоакустические эффекты. Восприни- маемая (оцениваемая) человеком высота сину- соидального воздействия является нелинейной функцией его частоты. Увеличение интенсивно- Очевидно, что соотношение (4) можно обра- тить в зависимость резонансной частоты от коор- динаты элемента БМ, где должен возникать мак- симум бегущей волны сти воздействий приводит к уменьшению восz(l) z0 exp((L - l) / lnah ). (7) принимаемой высоты низкочастотных воздей- ствий и увеличению высоты высокочастотных (выше 5000 Гц); В свою очередь, в работе [8] показано, что зависимость ширины БМ от координаты описыва- ется соотношением Наблюдается свойство группировки слуховых s(l) smax exp((l - L) / 4lnah ), (8) ощущений, что принято отмечать как наличие критических полос слуха, когда два воздействия воспринимаются как одно, если разность их чакоторому соответствуют следующие значения максимальной и минимальной ширины БМ: стот не превосходит определенных величин (шиsmax 0,55; smin 0, 09. (9) рина критической полосы). Целью дальнейшего исследования является по- строение математических соотношений, позволя- ющих в количественном виде воспроизвести неко- торые экспериментально установленные свойства АЧХ элементов БМ и КЧХ на основе задания только доступных для измерения параметров то- нальных воздействий (частоты и интенсивности). Отметим, что они несколько отличаются от указанных в (5) значений, которые являются ре- зультами измерений, и вполне могут варьиро- ваться. Комбинирование (7) и (8) позволяет получить следующее соотношение между ширинами БМ и резонансными частотами: 4 Представляется естественным именовать такую z(l1 )/ z(l2 ) (s(l2 )/ s(l1 )) . (10) модель феноменологической. При этом в основе построения используются следующие эмпириче- ские данные о геометрических характеристиках БМ. В развернутом состоянии БМ представляет собой трапециевидную фигуру длиной порядка L 35 мм. (2) и нарастающей от овального окна шириной 0,1 s 0,5 мм. (3) Некоторые элементы математического моделирования распространяющихся вдоль БМ волн Таким образом, частоты резонансов обратно пропорциональны четвертым степеням ширины БМ в соответствующей координате. Основные общие аспекты математического моделирования АЧХ элементов БМ и ее КЧХ Рассмотрим теперь задачу построения мате- матической модели амплитудно-частотной харак- теристики некоторой координаты БМ. Предпола- гаем, что резонансные поперечные колебания в этой точке описываются соотношением y(t) b sin(2 zt), (11) Важной задачей является установление связи между частотами резонансов и координатами БМ, где возникают максимумы возбуждаемых бегущих волн. Она достаточно подробно исслегде z - резонансная частота, в Гц; t - текущее время. В свою очередь, пусть тональные воздей- ствия описываются соотношением дована в работе [7], где на основе прозрачных x(t) a sin(2 ft ), (12) физических соображений получено искомое со- отношение где - некоторая фаза. Для АЧХ введем обозначение H (z, f , w), имея в виду также зависимость от характеристики интенсивности воздействия w. Способ определения этой характеристики будет уточнен позже. Представляет интерес определение достаточ- Представляется справедливой гипотеза о том, что при определении высоты звучания этого воздействия интеллектуальная часть слуховой системы ориентируется на усредненное с весом но общих свойств модели АЧХ. H 2 (z, f , w) значение резонансных частот. Ины- 1. Легко понять, что величина отклонения ленточек БМ зависит от величины кинетической энергии возмущающих сил в сравнении с кине- тической энергией, необходимой для создания ми словами, с помощью соотношения V ( f , w) d zH 2 (z, f , w)dz, 0 (20) колебаний с максимальной амплитудой. Кинети- ческие энергии этих движений пропорциональ- ны квадратам первых производных функций (11) и (12), которые определяют скорости колебаний. Поэтому представляется обоснованным считать, что искомая АЧХ зависит от отношения где d - положительный нормирующий коэффи- циент, можно воспроизвести зависимость вос- принимаемой высоты тонального воздействия от соответствующей частоты. Это предположение назовем психоакустиче- ской гипотезой. где x wf / z, w b / a. (13) (14) 4. После подстановки (7) в выражение для АЧХ должна получаться модель огибающей бе- гущей волны, которая возникает при тональном Пусть теперь воздействие g(t) имеет трансвоздействии соответствующей частоты. Иными форманту Фурье G( ). Тогда на основе предпословами, в соответствии с (13) КЧХ БМ является ложения о линейности фильтрации получаем, что энергия отклика в рассматриваемой точке БМ функцией отношения u wf / z0 exp((l - L) / lnah ). (21) определяется соотношением || v(z) ||2 c G2 ( f )H 2 (z, f , w)df , - (15) Отметим, что получаемая модель КЧХ должна адекватно соответствовать приведенным в лите- ратуре графикам эмпирических КЧХ. В частно- сти, в [6] отмечается, что тональное воздействие где c - некоторый положительный коэффициент. При финитной области распределения спектраль- ной плотности воздействия с частотой 200 Гц вызывает максимум бегущей волны примерно на расстоянии l(200) 28,5 мм. (22) f (-F , F ), (16) вне которой она равна нулю, а внутри постоянна и равна Модель АЧХ / КЧХ Ввиду сложностей учета множества особен- D || g ||2 /2F , (17) ностей внутреннего уха дать физическое обосоотношение (14) дает представление для затрат энергии на создание выходного колебания F снование математическому описанию распро- страняющихся вдоль БМ в перилимфе волн не представляется возможным. Об этом свидетель- || v(z) ||2 cD H 2 (z, f , w)df . - F (18) ствуют приведенные в различных источниках, например в [6], примеры. В этих условиях есте- Видится естественным представление о том, что в этих условиях для всех точек БМ затраты энергии на создание выходного колебания долж- ны быть одинаковыми. Иными словами, для всех резонансных точек БМ должно выполняться ра- венство F ственно использовать эвристическое описание, которое позволяет воспроизвести установленные экспериментально важные свойства слуховой си- стемы. Такие модели принято именовать феноме- нологическими. В рамках данной работы для квадрата АЧХ предлагается следующая модель: z : H 2 (z, f , w)df const. - F (19) H 2 (z, f , w) H 2 (x, w) (23) Ясно, что правая часть здесь зависит в том числе от энергии воздействия. Эмпирические данные свидетельствуют о том, что одно и то же тональное воздействие воз- wcx2 exp(-(cx2 (1 - x2 ))2 ) / z, где c - коэффициент, конкретное значение кото- рого буждает много точек БМ, которые характеризуют- ся соответствующими резонансными частотами. c ln(10) 2,3026, удовлетворяет условию (24) Рисунок 1. График зависимости нормированной высоты восприятия тональных воздействий, частота которых отложена по оси абцисс Рисунок 2. График КЧХ при тональном воздействии частотой 200Гц, по оси абсцисс - расстояние от овального окна когда Zmax 0 wcx2 exp(-(cx2 (1 - x2 ))2 )dz / z 1, (25) вести результаты эмпирических исследований ре- акции слуховой системы человека на тональные воздействия, включая такие психоакустические эффекты, как восприятие высоты воздействий. w 1; Zmax 16000 Ãö; (26) Важно отметить, что, используя соотношение 50 f 16000 Ãö. Отметим, что это свойство отвечает требова- нию (19), и в соответствии с определением (13) вида (27), можно вычислить импульсные характеристики фильтров, которые описывают реак- ции элементов БМ во времени: w / z dx / df . На рисунке 1 приведен вычисленный соp(t,l) P( f ,l) cos(2 tf )df / . 0 (28) гласно (20) график зависимости высоты вос- принимаемых тональных воздействий. График нормирован, так что воздействию тысячи герц со- ответствует воспринимаемая высота в тысячу мел. Отметим, что график на рисунке 1 хорошо со- впадает с приведенной в работе [5] аппроксима- цией эмпирических данных, которая также, как и здесь, получена при одинаковой интенсивности воздействий. Таким образом, сформулированная в пункте 4 раздела 5 гипотеза подтверждается. Осуществляя в (23) замену переменных в со- ответсвии с (7) и (21), получаем соотношение для квадрата КЧР (огибающей бегущих волн): P2 ( f ,l, w) P2 (u, w) Эти фильтры предлагается именовать психо- акустическими. Совокупность последовательных реакций психоакустических фильтров на некоторое воз- действие, определяемая звуками произносимого слова, представляет собой код этого слова, кото- рый формируется в процессе обучения челове- ка речевому обмену. Следовательно, для любых слов можно такие коды зафиксировать на основе специального обучения и затем использовать, на- пример, в процедурах распознавания ключевых слов. wcu2 exp(-(cu2 (1 - u2 ))2 ) exp((l - L) / lnah ) / z0 . (27)
×

About the authors

E. G Zhilyakov

Belgorod State National Research University

Email: zhilyakov@bsu.edu.ru
Belgorod, Russian Federation

S. P Belov

Belgorod University of Cooperation of Economics and Law

Email: belovssergei@gmail.com
Belgorod, Russian Federation

A. S Belov

Belgorod University of Cooperation of Economics and Law

Email: belov_as@bsu.edu.ru
Belgorod, Russian Federation

E. I Prokhorenko

Belgorod State National Research University

Email: prokhorenko@bsu.edu.ru
Belgorod, Russian Federation

References

  1. Альтман Я.А. Слуховая система. Л.: Наука, 1990. 620 с.
  2. Алдошина И. Основы психоакустики. Часть 1 // Звукорежиссер. 1999. № 6. С. 1-14
  3. Молчанов А.П., Бабкина Л.Н. Электрические модели улитки органа слуха. Л.: Наука, 1978. 181 с.
  4. Цвикер Э., Фельдкеллер Р. Ухо как приемник информации / пер. с нем. под ред. Б.Г. Белкина. М.: Связь, 1971. 255 с.
  5. Stevens S.S., Volkman J., Newman E.B. A scale for the measurement of the psychological magnitude pitch // The Journal of the Acoustical Society of America. 1936. Vol. 8, no. 3. DOI: https://doi.org/10.1121/1.1915893
  6. Шредер М.Р. Модели слуха // Proceedings of the IEEE. 1975. Vol. 63, no. 9. P. 1332-1350.
  7. Модель взаимосвязи координат максимумов огибающих бегущих вдоль базилярной мембраны волн с частотами их возбуждения / Е.Г. Жиляков [и др.] // Информационные системы и технологии. 2020. № 4. С. 5-10.
  8. О скорости распространения возмущений вдоль базилярной мембраны слуховой системы человека / Е.Г. Жиляков [и др.] // Инфокоммуникационные технологии. 2020. Т. 18, № 2. С. 188-194.
  9. Гельфанд С.А. Слух: введение в психол. и физиол. акустику / пер. с англ. О.К. Федоровой, О.П. Токарева. М.: Медицина, 1984. 350 с.
  10. Алдошина И. Основы психоакустики. Слух и речь. Часть 1 // Звукорежиссер. 2002. № 1. С. 38-44.
  11. Алдошина И. Основы психоакустики. Слух и речь. Часть 2 // Звукорежиссер. 2002. № 3. С. 54-58.
  12. Алдошина И. Основы психоакустики. Слух и речь. Часть 3 // Звукорежиссер. 2002. № 4. С. 38-44.

Supplementary files

Supplementary Files
Action
1. JATS XML

Copyright (c) 2021 Zhilyakov E.G., Belov S.P., Belov A.S., Prokhorenko E.I.

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

This website uses cookies

You consent to our cookies if you continue to use our website.

About Cookies