Звуковые колебания, чистые тона и восприятие высоты звука 162 3. Звуковые волны, акустическая энергия и восприятие громкости

Мы слышим звук, когда наша барабанная перепонка приводится в движение определенного типа — колебания. Эти колебания вызываются малыми изменениями давления воздуха в слуховом канале, связанном с приходящей звуковой волной. В этом разделе мы сначала обсудим основные свойства периодического колебательного движения вообще, а затем сосредоточимся на колебаниях барабанной перепонки и их роли в нашем восприятии звука. На этом этапе мы не будем интересоваться тем, каким образом барабанная перепонка приводится в движение. Для этого представим, что мы надели наушники и слушаем создаваемые ими звуки. В области низких частот барабанная перепонка точно следует за колебаниями диафрагм наушников. Такой подход к предмету несколько необычен. Однако он позволит нам непосредственно перейти к изучению некоторых основных понятий, связанных со звуковыми колебаниями и восприятием звука, не тратя много времени на изучение звуковых волн и генерации звука. С практической точки зрения, этот подход имеет один недостаток: в экспериментах, которые мы будем описывать и анализировать в этом разделе, генерация звука должна осуществляться с помощью электронных устройств, а не производиться естественным образом с участием реальных музыкальных инструментов. Однако по возможности мы будем указывать, как данный эксперимент можно было бы провести с использованием реальных инструментов.

2.1. Движение и колебания

Под движением понимается изменение положения данного тела по отношению к некоторому другому телу, принятому за начало отсчета. Если движущееся тело очень мало по сравнению с телом отсчета или по сравнению с размерами области пространства, проходимой телом при движении, так что форма тела практически несущественна, задача сводится к описанию движения точки в пространстве. Поэтому такое малое тело часто называют материальной точкой, или частицей. Если же тело не столь мало, но мы заранее знаем, что в данных условиях все точки тела вынуждены двигаться вдоль прямых линий, параллельных между собой (это называется прямолинейным переносом), то этого также достаточно, чтобы рассматривать движение всего одной данной точки тела. Это случай одномерного движения, при котором положение данной точки (и, следовательно, всего тела) полностью определяется всего одним числом — расстоянием до неподвижной точки отсчета.

В этой книге мы будем иметь дело лишь с одномерными движениями. Предположим, что наша материальная точка двигается вдоль вертикальной прямой (рис. 3). Обозначим точку отсчета на этой прямой буквой О. Точкой отсчета может служить любая неподвижная точка, хотя для удобства мы иногда будем выбирать вполне определенную точку (например, положение равновесия для данного колебательного движения). Положение материальной точки Р определяется ее расстоянием у от точки отсчета О (рис. 3); величину у называют также смещением точки Р относительно точки О, или координатой точки Р. При этом мы должны использовать как положительные, так и отрицательные числа, чтобы различать две стороны относительно точки О [1].

Материальная точка Р находится в движении относительно точки О, когда ее положение у изменяется с течением времени. Будем обозначать время буквой t. Оно измеряется с помощью часов и также требует задания «момента начала отсчета» t = 0. Движение можно математически описывать двумя способами — аналитически, с использованием так называемых функциональных соотношений, и геометрически, применяя графическое представление. Мы будем пользоваться только геометрическим методом. Чтобы графически изобразить одномерное движение, возьмем две взаимно перпендикулярные оси, одна из которых представляет время t, другая — ко

н Положительное направление

Отрицательное н направление

Рис. 3. Мгновенные положения точки, движущейся по прямой линии, у — координата, О — неподвижная точка отсчета

ординату у (рис. 4). Для обеих осей мы должны указать масштаб, т. е. единичные интервалы (соответственно времени и смещения). Движение можно изобразить, указав мгновенное значение расстояния у для каждого момента времени t. Каждой точке получающейся при этом кривой отвечает положение частицы в соответствующий момент времени, например, точка Si на рис. 4 сообщает нам, что в момент времени t = ii частица Р находится на расстоянии yi от точки О, т. е. в положении Р^. Следует особо подчеркнуть, что на этом графике материальная точка отнюдь не движется вдоль кривой, образуемой точками S! Эта кривая есть всего лишь искусственное построение, помогающее нам определить положение частицы у на вертикальной оси в произвольный момент времени t.

График, показанный на рис. 4, дает также информацию о скорости материальной точки, т. е. о быстроте изменения ее положения. Она определяется наклоном кривой на графике. В момент ii частица движется с некоторой скоростью вверх, в момент is — с меньшей скоростью вниз, в момент она на мгновение останавливается, меняя направление движения.

Существует определенный класс движений, при которых материальная точка следует некоторому временному закону, повторяющемуся снова и снова. Это называется периодическим движением, или колебаниями. Движение такого типа имеет наибольшее значение для музыки. Чтобы получить подлинно периодическое движение, тело не просто должно периодически возвращаться в прежнее положение — оно должно делать это через точно одинаковые промежутки времени и точно повторять один и тот же вид движения между этими моментами возвращения. Интервал времени, после

Графическое представление движения точки

Рис. 4. Графическое представление движения точки. Сплошная кривая — это не траектория! Она определяет положения точки в различные моменты времени t, когда она движется вдоль прямой линии (координаты представлены точками оси у)

которого картина движения повторяется, называется периодом (рис. 5). Мы будем обозначать период греческой буквой «тау» (г). В течение одного периода движение может быть как очень простым (рис. 5, а), так и довольно сложным (рис. 5, б)[2]. Элемент картины движения, который осуществляется в течение одного периода и повторяется снова и снова, называется циклом.

Имеются механические и электронные устройства, которые могут автоматически строить график периодического движения. В самописце перо воспроизводит в направлении у описываемое периодическое движение и оставляет след на бумажной ленте, которая движется с постоянной скоростью в направлении, перпендикулярном к оси у. Поскольку эта скорость нам известна, мы можем приписать шкалу времени оси, направленной вдоль бумажной ленты. Полученная кривая является графическим представлением движения. Однако для регистрации звуковых колебаний этот метод непригоден. Они имеют столь короткие периоды, что для воспроизведения таких колебаний перо должно перемещаться с такой скоростью, которую невозможно реализовать. Для этой цели служит электронный прибор, называемый осциллографом. В нем очень тонкий пучок электронов (элементарных частиц с отрицательным электрическим зарядом), попадая на телевизионный экран, создает на нем ясно видимое световое пятно. Этот пучок можно отклонять в вертикальном и горизонтальном направлениях.

Графическое представление простого а и сложного б периодического движения (т — период)

Рис. 5. Графическое представление простого а и сложного б периодического движения (т — период)

Вертикальное движение управляется сигналом, пропорциональным колебанию, которое мы хотим отобразить (например, колебанию диафрагмы микрофона). Горизонтальное движение представляет непрерывную развертку вправо с постоянной скоростью, подобное перемещению бумажной ленты в самописце, оно задает шкалу времени. Таким образом, светящаяся точка на экране описывает график движения за один период развертки. Если изображение светящейся точки сохраняется достаточно долго, оно воспринимается как сплошная кривая на экране. Поскольку экран имеет ограниченный размер, горизонтальное движение мгновенно возвращается к началу каждый раз, когда пучок достигает правого края экрана, после чего развертка начинается снова. Чтобы изобразить периодическое движение, развертка должна быть синхронизована с периодом т или с кратной ему величиной.

2.2. Простое гармоническое движение

Возникает вопрос: каков простейший вид периодического движения? Имеется много известных примеров: колебания взад-вперед маятника, движение вверх-вниз пружины, колебания молекул и т. д. Все эти движения имеют нечто общее: их можно представить как проекцию равномерного кругового движения на один из диаметров окружности (рис. 6)[3]. Когда точка R равномерно вращается с периодом т (т. е. совершает полный оборот за т с), ее проекция, точка Р, двигается вверх и вниз вдоль оси у, совершая так называемое простое гармоническое движение (см. график в правой части рис. 6). Такое движение называют также синусоидальным (поскольку изменение величины у аналитически описывается тригонометрической функцией под названием «синус»).

Простое гармоническое, или синусоидальное, движение

Рис. 6. Простое гармоническое, или синусоидальное, движение (представлено на правом графике), получающееся при проектировании точки, совершающей равномерное движение по окружности, на диаметр окружности (99 — фаза, А — амплитуда, т — период)

Заметим, что простое гармоническое движение представляет колебания, симметричные относительно точки О, которая называется положением равновесия. Максимальное смещение (вверх или вниз) А называется амплитудой, т — период гармонического движения. Имеется еще один параметр, характеризующий простое гармоническое движение, который несколько более труден для понимания. Взгляните на рис. 6: в начальный момент t = О частица (проекция вращающейся точки R) находится в положении Р. Мы можем представить себе другой случай гармонического движения с тем же периодом т и той же амплитудой А, но с другим положением Q, из которого частица начинает движение (рис. 7). Такое движение, очевидно, будет отличаться от предыдущего, но не формой или характером, а «сдвигом во времени». В самом деле, как видно из рис. 7, две частицы будут проходить

через определенное положение (например, начало отсчета О) в разные моменты времени (ti, t^). И наоборот, две частицы в общем случае будут находиться в разных положениях в один и тот же момент времени (например, Р и Q в момент t — 0). Если опять-таки представить движение второй частицы Q в виде проекции равномерного кругового движения (рис. 7), мы увидим, что двум рассматриваемым случаям отвечают разные угловые положения фазой простого гармонического движения; разность — <р2 (рис. 7), которая в данном примере остается постоянной, называется разностью фаз двух гармонических движений[4].

Графическое представление гармонического движения двух точек с одинаковой амплитудой и частотой, но с различными фазами и

Рис. 7. Графическое представление гармонического движения двух точек с одинаковой амплитудой и частотой, но с различными фазами и

Таким образом, «чистое», или гармоническое, колебательное движение характеризуется значениями трех параметров: периода т, амплитуды А и фазы <р (рис. 6). Все они, особенно первые два, играют ключевую роль в восприятии музыкальных звуков.

Простые гармонические движения — достаточно распространенные явления и происходят во всей вселенной. Колебания составных частей атомов, атомов как целого в кристалле, упругих тел и т. д. в первом приближении могут быть описаны как простые гармонические движения. Но есть и другая, еще более основательная причина рассматривать простое гармоническое движение как наиболее важное из всех периодических движений:

можно математически показать, что любое сколь угодно сложное периодическое движение можно представить в виде суммы простых гармонических движений. Подробнее мы рассмотрим это фундаментальное свойство позднее (в разд. 4). Для музыки оно имеет первостепенное значение.

2.3. Звуковые колебания и восприятие чистых тонов

Когда барабанная перепонка приводится в периодическое движение, ее механические колебания преобразуются во внутреннем ухе в электрические нервные импульсы, которые передают сигналы в мозг и интерпретируются как звук, при условии, что период и амплитуда колебаний находятся в определенных пределах. Ухо представляет крайне чувствительный прибор, оно может воспринимать колебания барабанной перепонки с амплитудой всего 10-7 см и периодом 7 х 10-5 с [5].

Введем теперь величину, которая используется чаще, чем период т, и называется частотой'.

f = 1 А- (1)

Физически частота / представляет число повторений картины колебаний, или циклов, в единичный отрезок времени. Причина, по которой предпочитают применять f вместо т, состоит в том, что при увеличении частоты звуковых колебаний мы ощущаем повышение тона. Если период т измерять в секундах, то частота f будет выражаться в циклах в секунду. Эта единица носит название герц (Гц) в честь знаменитого немецкого физика Генриха Герца. Колебания давления воздуха в интервале 20-15 000 Гц средним человеком воспринимаются как звук. Нижний и особенно верхний пределы зависят от громкости звука и различны у разных людей, а также меняются с возрастом.

Когда звук вызывает простое гармоническое движение барабанной перепонки с постоянными характеристиками (частотой, амплитудой и фазой), мы слышим так называемый чистый тон. Чистые тона звучат однообразно, и музыка не строится из одиночных чистых тонов. Однако, как было отмечено во введении к этому разделу, для лучшего понимания сложных звуков желательно начать с изучения чистых, или простых, тонов. Чистые тона должны создаваться электронными генераторами, не существует музыкальных инструментов, которые производят такие тона (и даже в случае электронной генерации чистых тонов нет гарантии, что они останутся та-

ковыми к тому времени, когда достигнут уха). Флейта представляет инструмент, звук которого ближе к чистому синусоидальному тону, чем у любого другого инструмента, особенно в верхнем регистре, поэтому некоторые (но не все) эксперименты, упоминаемые в этом разделе, можно провести в домашних условиях, используя флейту, а лучше две (желательно в профессиональном исполнении!).

Когда мы слышим чистый тон, частоту и амплитуду которого можно изменять по желанию, мы имеем возможность проверить соответствие между высотой тона и частотой, а также между громкостью и амплитудой. В данном разделе мы ограничимся высотой тона.

Простые гармонические колебания барабанной перепонки передаются цепочкой из трех крошечных косточек в среднем ухе, которые носят названия «молоточек», «наковальня» и «стремечко» (или, на ученом языке, malleus, incus и stapes, что означает то же самое на латыни), ко входу (овальному окну) собственно внутреннего уха (рис. 8, а). Так называемая улитка миллиметрового размера представляет собой туннель, закручивающийся наподобие раковины улитки-моллюска и проходящий через височную кость. Эта полость, показанная в сильно упрощенном и растянутом виде на рис. 8, б, разделена на два канала, именуемые вестибулярной лестницей и барабанной лестницей, которые заполнены несжимаемой жидкостью — перилимфой, представляющей собой фильтрат спинномозговой жидкости. Оба канала ведут себя как единая гидродинамическая система, поскольку на дальнем конце (в «вершине») они связаны небольшим отверстием — ге-ликотремой', нижний отдел закрыт упругой мембраной на овальном окне (рис. 8,6). Перегородка, разделяющая две «лестницы», сама представляет сильно структурированный проток треугольного сечения (называемый также средней лестницей (рис. 9)), который заполнен другой жидкостью — эндолимфой. Границами протока служат базилярная мембрана, содержащая собственно сенсорный орган (орган Корти), мембрана Рейсснера, отделяющая эндолимфу от перилимфы, и жесткая боковая стенка улитки.

Упругость базилярной мембраны определяет основные гидромеханические свойства улитки. У взрослого человека длина этой мембраны от основания (входного конца) до вершины составляет 34 мм. Из-за постепенного изменения ширины и толщины жесткость мембраны убывает от основания к вершине в 10 000 раз, что обеспечивает возможность анализа частот. Колебания, передаваемые цепочкой слуховых косточек к овальному окну, преобразуются в колебания давления перилимфы в вестибулярной лестнице. Возникающий при этом перепад давлений на перегородке улитки между двумя лестницами изгибает базилярную мембрану вверх и вниз, сообщая ей движение, подобное колыханию флага на ветру. По мере того как это волно-

Овальное окно

Цепочка косточек

11H1U

Барабанная перепонка (тимпан)

Вестибулярная лестница

- Базилярная мембрана

Геликотрема

Барабанная лестница---------

Вершина

тг / . Основание ____________...

Круглое J ----———---— х

окно 1 Линейное расстояние вдоль

базилярной мембраны

(б)

Рис. 8. (ц) Схематическое изображение уха (не в масштабе) [43]. (б) Улитка (в сильно упрощенном, растянутом виде) образное движение распространяется к вершине, его амплитуда возрастает до максимума в некотором месте, зависящем от входной частоты, а затем быстро спадает к вершине. При этом мембрана закручивается в поперечном направлении весьма сложным образом, что, по-видимому, играет основную роль в гидромеханической стимуляции приблизительно 16 000 рецепторных единиц — волосковых клеток, расположенных в виде одного «внутреннего» ряда и трех «наружных» рядов вдоль базилярной мембраны. Эти клетки

(б)

(я) Поперечное сечение органа Корти [31]

Рис. 9. (я) Поперечное сечение органа Корти [31]. (б) Полученное с помощью сканирующего электронного микроскопа [20] изображение стереоцилий внутренних (сверху) и одного из трех внешних (снизу) рядов волосковых клеток на базилярной мембране морской свинки. (Эти животные, а также шиншиллы и кошки, имеют периферическую слуховую систему, очень похожую на человеческую, и чаще всего используются в качестве лабораторных животных при изучении слуха.) улавливают движения базилярной мембраны и передают сигналы контактирующим с ними нервным клеткам — нейронам. Название «волосная клетка» связано с тем, что на такой клетке находится связка из 20-300 тонких волосков — стереоцилий («ресничек») (рис. 9, б), прорастающих в эндолимфатическую жидкость, отклонение которых запускает в волосной клетке и ее окружении цепочку электрохимических процессов, которые заканчиваются генерацией электрических сигналов в слуховом нерве. Текториалъная мембрана представляет желатиновую ткань, взвешенную в эндолимфе над органом Корти (рис. 9, а), в которую входят стереоцилии наружных волосных клеток; мембрана играет важную роль в стимуляции их движения. Работу улитки мы рассмотрим подробнее в разд. 2.8 и 3.6.

Замечательный факт состоит в том, что для чистого тона данной частоты максимальные колебания базилярной мембраны происходят лишь в ограниченной ее области, положение которой зависит от частоты тона. Другими словами, для каждой частоты имеется область максимальной стимуляции, или «резонансная область», на базилярной мембране. Чем ниже частота тона, тем ближе к вершине (рис. 8, б) находится область активированных волосных клеток (где мембрана наиболее гибка). Чем выше частота, тем ближе эта область ко входу (овальному окну), где мембрана наиболее жестка. Пространственное положение х вдоль базилярной мембраны (рис. 8,6) соответствующих волосных клеток и связанных с ними нейронов определяет первичное ощущение высоты тона. Изменение частоты чистого тона вызывает сдвиг положения активированной области, и этот сдвиг затем интерпретируется как изменение высоты тона. Мы говорим, что первичная информация частоты тона кодируется сенсорным образом на базилярной мембране в форме пространственного положения активированных нейронов. В зависимости от того, какая группа нервных волокон активируется, тон воспринимается нами как низкий или высокий.

На рис. 10 показано, как зависит от частоты чистого синусоидального тона расстояние х от основания (см. рис. 8,6) до области наибольшей чувствительности у среднего взрослого человека [171]. Отсюда следуют несколько важных выводов. Прежде всего заметим, что область частот, наиболее важных в музыкальном отношении (приблизительно 20-4 000 Гц), охватывает примерно две трети длины базилярной мембраны (12-35 мм от основания). Остальная часть частотного диапазона (4 000-16 000 Гц, область частот выше 5 000 Гц на рис. 10 не показана) сжимается в оставшуюся треть длины. Отметим далее, что при удвоении частоты звука, т. е. при повышении тона на октаву, соответствующая резонансная область смещается примерно на одно и то же расстояние 3,5-4 мм независимо от того, происходит это повышение частоты от 220 до 440 Гц, от 1 760 до 3 520 Гц или от 5 000 до 10 000 Гц. И вообще, всякий раз, когда частота f умножается на некоторый коэффициент, положение х резонансной области просто сдвигается на некоторое расстояние. Другими словами, смещение резонансной области вдоль базилярной мембраны определяется не разностью частот, а их отношением. Зависимость такого рода называется логарифмической (см. разд. 3.4).

Положение резонансного максимума на базилярной мембране [171] для чистого тона частоты / (используются линейные шкалы)

Рис. 10. Положение резонансного максимума на базилярной мембране [171] для чистого тона частоты / (используются линейные шкалы)

Изложенные результаты были получены при физиологических измерениях на мертвых (но хорошо сохранившихся) животных [171]. Сегодня такие измерения можно проводить на живых улитках с использованием микроскопических лазерных лучей или эффекта Мёссбауэра, когда микроскопическое количество радиоактивного вещества (кобальта-57) помещается на базилярную мембрану. При этом ничтожные смещения мембраны могут быть обнаружены путем измерения сдвига частоты отраженного лазерного луча (эффекта Доплера) или гамма-лучей, испускаемых радиоактивным веществом. Подробнее об этом будет рассказано в разд. 3.6.

Рассмотрим теперь психофизическую величину — высоту воспринимаемого звука, соответствующую частоте чистого тона /. В разд. 1.4 мы упоминали, что психофизическая величина не может быть измерена таким же количественным образом, как физическая величина, например, частота. Можно оценить лишь соотношение между двумя ощущениями одного и того же рода, создаваемыми у испытуемого непосредственно одно за другим. Для некоторых ощущений количественные оценки возможны лишь после некоторой тренировки мозга к проведению необходимых операций (например, после обучения ребенка умению оценивать размеры наблюдаемых предметов).

В соответствии с изложенным, первичная функция внутреннего уха (улитки) состоит в преобразовании временной картины колебаний (движения барабанной перепонки внутрь и наружу) в пространственную картину (движение вверх-вниз вдоль базилярной мембраны), а последнюю, в свою очередь, в пространственную картину активности нейронов (распределение электрических сигналов по слуховому нерву).

Рассмотрим способность индивидуума оценивать относительную высоту двух чистых тонов одной и той же интенсивности, предъявляемых один за другим. Существует естественный предел: когда разность частот двух тонов мала, меньше некоторого значения, оба тона оцениваются как имеющие одну и ту же высоту. Это относится к оценкам всех психофизических величин: если изменение первоначального физического стимула не превышает некоторого дифференциального порога чувствительности (ДПЧ), или минимально обнаружимого различия, новое ощущение оценивается как «точно такое же»; коль скоро изменение превышает ДПЧ, обнаруживается изменение ощущения. Заметим, что ДПЧ связан с некоторой физической величиной (стимулом) и потому выражается некоторым числом[6].

Степень чувствительности первичного механизма восприятия изменений высоты тона, или способность к разрешению частот, зависит от частоты, интенсивности и продолжительности данного тона, а также от степени внезапности изменения. Она сильно меняется от одного человека к другому и зависит от музыкальной подготовки; к сожалению, она значительно зависит также от используемого метода измерения. На рис. 11 показан средний ДПЧ для частоты чистых тонов постоянной интенсивности (80 де

цибел, см. разд. 3.4), частота которых медленно и непрерывно повышается и понижается [180]. Из этого графика, например, видно, что для тона частотой 2 000 Гц обнаруживается уже изменение в 10 Гц, т. е. всего на 0,5 %. Это очень малая доля полутона! Внезапные изменения частоты обнаруживаются с еще меньшим ДПЧ — до 30 раз меньшим показанного на рис. 11 [131]. Разрешение частот становится хуже на низких частотах (например, 3% при 100 Гц на рис. 11). Оно ухудшается также при уменьшении длительности звучания тона, когда последняя становится меньше одной десятой секунды. В то же время разрешение частот почти не зависит от амплитуды (громкости). Более подробное обсуждение ДПЧ можно найти в книгах [61,163,179].

И. Дифференциальный порог чувствительности

Рис. И. Дифференциальный порог чувствительности (или «минимально обнару-жимое различие») для чистого тона частоты Д (линейные шкалы), определяемый при использовании сигнала с медленно модулируемой частотой [ 180]

С самого начала развития психофизики психологи были склонны рассматривать минимально обнаружимое различие в ощущениях, вызываемое минимально различимыми стимулами, в качестве естественной единицы измерения соответствующей психофизической величины. Минимально об-наружимое изменение высоты тона использовалось для построения «субъективной шкалы высот» [158]. Однако далее мы увидим, что поскольку главным претендентом на роль естественной единицы измерения интервала является октава и поскольку все музыкальные гаммы появились совершенно независимо от попыток создания субъективной шкалы высот, указанная величина не нашла практического применения в музыке (см. разд. 5.4).

2.4. Суперпозиция чистых тонов. Биения первого порядка и критическая полоса

Мы уже упоминали, что одиночные чистые тона звучат монотонно. Звучание становится несколько более живым, когда мы заставляем звучать одновременно два чистых тона. В этом разделе мы будем анализировать основные характеристики наложения (суперпозиции) двух чистых тонов. При этом мы столкнемся с несколькими фундаментальными понятиями физики музыки и психоакустики.

Можно выделить два вида эффектов суперпозиции в зависимости от того места, где они обрабатываются слуховой системой человека. Если обработка носит механический характер и происходит в кохлеарной жидкости и вдоль базилярной мембраны, мы называем их эффектами суперпозиции первого порядка, поскольку они легко различимы и доступны для психоакустического экспериментирования. Эффекты суперпозиции второго порядка являются результатом нейронной обработки, и они более сложны для обнаружения, описания и объективного измерения. В этом разделе мы ограничимся эффектами первого порядка.

Обсудим сначала физический смысл «суперпозиции звука». Барабанная перепонка движется внутрь и наружу под действием изменений давления воздуха в слуховом канале. Если она вынуждена совершать чисто гармоническое движение заданной частоты и амплитуды, мы слышим чистый тон определенной высоты и громкости. Если же одновременно звучат два чистых тона с различными характеристиками (например, мы слышим одновременно два независимых источника звука), то барабанная перепонка реагирует так, как если бы она одновременно подчинялась двум независимым командам, по одной для каждого чистого тона. Результирующее движение представляет собой сумму отдельных движений, которые возникали бы, если бы каждый чистый звук присутствовал в одиночестве, в отсутствие другого. Так ведет себя не только барабанная перепонка, но и среда, и все другие колеблющиеся компоненты (это, однако, перестает быть спра ведливым при очень больших амплитудах). Указанный эффект называется линейной суперпозицией двух колебаний. Этот термин означает «мирное сосуществование»: каждая составляющая колебательного процесса не мешает другой, и результирующая суперпозиция просто следует велениям каждой из компонент независимым образом. При нелинейной суперпозиции воздействие каждой компоненты зависит от того, что предписывает другая компонента.

Начнем обсуждение с анализа суперпозиции двух простых гармонических движений одинаковой частоты и с одинаковой фазой (т. е. с нулевой разностью фаз, см. разд. 2.2). Можно показать как графически (рис. 12), так и аналитически, что в этом случае мы снова получим простое гармоническое движение той же частоты, с той же фазой, но с амплитудой, равной сумме амплитуд двух колебаний. Если же две компоненты колебаний данной частоты имеют разную фазу, то их суперпозиция по-прежнему остается простым гармоническим движением той же частоты, но амплитуда теперь уже не будет равна сумме амплитуд двух компонент. В частности, если амплитуды компонент одинаковы, а их разность фаз р составляет 180°, колебания будут гасить друг друга, и не будет слышно никакого звука. Это явление, называемое деструктивной интерференцией, играет важную роль в акустике помещений. В общем случае, когда барабанной перепонки достигают два чистых тона одинаковой частоты, мы воспринимаем лишь один тон определенной высоты (соответствующей частоте указанных тонов) и громкости (определяемой амплитудами этих тонов и их разностью фаз).

Суперпозиция двух синусоидальных колебаний с одинаковой фазой и частотой

Рис. 12. Суперпозиция двух синусоидальных колебаний с одинаковой фазой и частотой

Теперь рассмотрим суперпозицию двух простых тонов одинаковой амплитуды, но со слегка различающимися частотами J и /2 = /1 + А/.

Разность частот Д/ предполагается малой и положительной (тон, соответствующий частоте fa, несколько выше тона частоты fa). Картина колебаний барабанной перепонки будет определяться суммой таковых для каждого тона в отдельности (рис. 13). Результатом наложения (жирная кривая на рис. 13) будут колебания с частотой, промежуточной между частотами /х и /2, и медленно меняющейся амплитудой. Отметим, что разность фаз двух компонент у и ?/2 на рис. 13 медленно меняется: колебания в момент времени t = 0 начинаются в одной фазе (разность фаз равна нулю, как на рис. 12), затем компонента ?/2 начинает опережать по фазе (обгонять) компоненту yi, пока компоненты не окажутся в противофазе (с разностью фаз 180°) в момент С. Далее разность фаз продолжает возрастать, пока не достигнет величины 360° = 0° в момент тв. Этот непрерывный медленный сдвиг фазы ответствен за изменение амплитуды результирующего колебания: прерывистые кривые на рис. 13 представляют огибающую амплитуды результирующего колебания (см. также рис. 19, а).

Суперпозиция двух синусоидальных колебаний со слегка различающимися периодами п и т, соответствующими частотам Д и /

Рис. 13. Суперпозиция двух синусоидальных колебаний со слегка различающимися периодами п и т2, соответствующими частотам Д и /2

Каким в этом случае будет ощущение тона? Прежде всего обратим внимание на то, что барабанная перепонка будет совершать колебания, описываемые жирной кривой на рис. 13. Барабанная перепонка «не знает» и «не принимает во внимание», что картина колебания в действительности представляет результат сложения двух других колебаний. Для нее это просто одна картина колебаний с переменной амплитудой. Наиболее интересное происходит в кохлеарной жидкости: эта довольно сложная, но единая картина колебаний, подаваемая на овальное окно, приводит к возбуждению двух резонансных областей на базилярной мембране. Если разность частот Af достаточно велика, соответствующие резонансные области будут доста точно отделены одна от другой, каждая будет совершать колебания с частотой, соответствующей одной из компонент (тонкие кривые на рис. 13), и мы будем слышать два отдельных тона постоянной громкости, высота которых соответствует исходным тонам. Это свойство улитки распутывать сложную картину колебаний, создаваемую наложением тонов, разлагая ее на исходные чистые тона, называется дискриминацией частот. Это механический процесс, определяемый гидродинамическими и упругими свойствами составных частей внутреннего уха. Если же разность частот Af меньше некоторой величины, резонансные области перекрываются, и мы слышим только один тон промежуточной высоты с модулированной громкостью — «биения». В этом случае область перекрытия резонансных областей базилярной мембраны образует картину колебаний, совпадающую с таковой для барабанной перепонки (жирная кривая на рис. 13). Модуляция амплитуды колебаний (огибающая на рис. 13) воспринимается как модуляция громкости. Это явление называется биениями первого порядка — обычные биения, знакомые каждому музыканту.

Частота результирующей картины колебаний двух тонов с очень близкими частотами Д и Д равна среднему значению:

Л + h , м д/

Интервал времени тв (рис. 13), после которого результирующая амплитуда принимает начальное значение, называется периодом биений. Частота биений /в = 1/тв (число изменений амплитуды за одну секунду) оказывается равной разности частот:

/в = /2-/1= Ь/. (3)

Не имеет значения, больше или меньше Д, чем Д. Биения будут слышны в любом случае, и их частота всегда будет равна разности частот компонент (в соотношении (3) следует брать абсолютное значение, т. е. положительную величину). Чем ближе между собой частоты Д и Д, тем более «медленные» биения будут возникать. Если частота Д становится равной частоте Д, биения полностью исчезают — оба тона звучат в унисон.

Проследим, как меняется восприятие тона, создаваемого наложением двух чистых тонов одинаковой амплитуды с частотами Д и Д = Д + + ДД Предположим, что мы зафиксировали частоту Д и медленно повышаем частоту Д от Д (унисон, Д/ = 0) до более высоких значений. (Качественно ничего не изменилось бы, если бы мы понижали частоту Д.)

Унисон воспринимается нами как один тон высоты, соответствующей частоте /1, громкость которого зависит от разности фаз двух простых тонов. При небольшом повышении частоты /2 мы продолжаем слышать один тон, но несколько более высокий, соответствующий частоте f — /1 + Д//2 (см. (2))[7]. Громкость этого тона будет совершать биения с частотой /в = = Д/ (см. (3)). Частота этих биений повышается при удалении /2 от fi (при увеличении Д/). Пока разность Д/ не превышает 10 Гц, биения воспринимаются вполне четко. Если разность частот Д/ становится больше, скажем, 15 Гц, ощущение биений исчезает, создавая ощущение неприятного «шероховатого» тона. Когда разность Д/ превосходит так называемый предел дискриминации частот Afo (не путать с дифференциальным порогом чувствительности (рис. 11)!), мы внезапно начинаем различать два отдельных тона, высоты которых соответствуют частотам f и /2. В этот момент резонансные области на базилярной мембране отделяются одна от другой достаточно, чтобы создать два отдельных сигнала. Однако «шероховатость» все еще сохраняется, особенно в области низких тонов. Когда разность частот превышает еще большее значение А/св, называемое критической полосой, неприятное ощущение исчезает, и оба чистых тона звучат ровно и приятно. Этот переход от «шероховатости» к «гладкости» реально происходит постепенно, так что критическая полоса представляет лишь приблизительное значение разности частот, при котором происходит переход.

Все эти результаты легко проверить, используя два электронных генератора синусоидальных волн регулируемой частоты, комбинация сигналов которых подается на каждое ухо в отдельности с помощью наушников. Однако проверка, по крайней мере качественная, возможна и при помощи двух флейт, на которых опытные исполнители играют одновременно в верхнем регистре. Если один флейтист исполняет заданную ноту (строго выдерживая нужный тон), а другой — ту же написанную ноту, но не в тон (например, периодически втягивая или выталкивая мундштук), можно достаточно хорошо воспроизвести биения, «шероховатость» и дискриминацию тонов.

На рис. 14 предпринята попытка представить изложенные результаты (не в масштабе). Жирными линиями показаны частоты тонов (или биений), которые мы действительно слышим. Частота фиксирована, частота /2 постепенно изменяется (повышается или понижается). «Объединенный» тон соответствует восприятию одного тона (промежуточной частоты), пока частота /2 лежит ниже предела дискриминации частоты Д. Отметим рас

ширение критической полосы в обе стороны от унисона (А/ = 0). Необходимо снова подчеркнуть, что этот переход от «шероховатости» к гладкости происходит совсем не внезапно, как может показаться из рис. 14, а довольно постепенно. Подробное и гораздо более строгое обсуждение можно найти в книге [179].

Частота

воспринимаемого тона Критическая

полоса

Тон /2 (изменяемая частота)

«Объединенный» ( /' — 1 + 2 тон

1 Ощущение I | родного тонгГкХ

Тон /1 (смешанная частота)

10 Гц

о-1

I/! ! 1

1 «Шероховатость»^

Гладкость

Биения Г

Гладкость

Частота биений

-А/

L<______>1 |

|д7о! !

+Л/

Разность частот А/ = Л - А

Рис. 14. Схематическое представление частоты (жирные линии), соответствующие ощущению тона, вызываемого наложением двух чистых тонов с близкими частотами /1 и /2 = А + Л/

Предел для дискриминации частот и критической полосы сильно зависит от средней частоты двух тонов (Д + /2)/2 (называемой центральной частотой стимула, состоящего из двух тонов). Этот предел слабо зависит от амплитуды, но может сильно различаться у разных людей. Критическая полоса связана с несколькими другими психоакустическими явлениями, и существует множество способов ее определения (разд. 3.4). На рис. 15 показана зависимость дискриминации частот Л/р [119] и критической полосы AfcB [180] от центральной частоты компонент. Прерывистыми линиями показаны разности частот, соответствующие музыкальным интервалам — полутону, целому тону и малой терции. Например, два тона в окрестности 2 000 Гц должны быть разнесены по меньшей мере на 200 Гц, чтобы их можно было различить, и более чем на 300 Гц для гладкого звучания. Отметим замечательный факт: на очень высоких и очень низких частотах предел дискриминации частот больше полутона[8] и даже целого тона. Заметим также, что в области высоких частот критическая полоса лежит между разностью частот, соответствующей интервалу в один тон (который квалифицируется как диссонанс), и разностью, соответствующей малой терции (которая считается консонансом), т. е. охватывает приблизительно треть октавы. На низких частотах имеет место важное отличие: дискриминация частот и критическая полоса превышают малую (и даже большую) терцию. Вот почему терции обычно не используются в дальнем басовом регистре!

Сравним рис. 15 с рис. 11. Предел дискриминации частот Afp приблизительно в 30 раз больше ДПЧ для разрешения частот. Другими словами, мы можем обнаруживать очень малые изменения частоты одного-единственного чистого тона, однако требуется более значительная разность частот, чтобы два чистых тона, звучащих одновременно, были слышны как 25 отдельные компоненты .

Центральная частота

Рис. 15. Критическая полоса Д./св [180] и предел дискриминации частот [119] в зависимости от центральной частоты стимула, состоящего из двух тонов (линейные шкалы). Для сравнения показана разность частот, соответствующая трем музыкальным интервалам

Как применить эти результаты к теории слуха? Существование конечного предела для дискриминации тонов указывает на то, что активированная область на базилярной мембране, соответствующая чистому тону, должна иметь конечную пространственную протяженность. В противном случае, если бы эта область была «точечной», суперпозиция двух тонов различной частоты всегда воспринималась бы как два отдельных тона при сколь угодно малой разности частот, и ощущения биений никогда бы не возникало. На самом деле тот факт, что «шероховатые» ощущения сохраняются даже за пределом дискриминации, показывает, что две активированные области все еще в некоторой степени перекрываются или взаи модействуют между собой, по крайней мере пока не будет достигнута разность частот, равная критической полосе. Это иллюстрирует следующий эксперимент. Если два тона Д и Д подаются в наушники на два разных уха человека, первичные биения или ощущение «шероховатости» сразу исчезают, два тона различаются, даже если разность их частот меньше Д/о, и их комбинация все время звучит гладко! Когда звуки подаются на одно ухо, появляются биения и «шероховатость» звучания. Разумеется, дело здесь в том, что в первом случае на каждой базилярной мембране имеется лишь одна активированная область, так что не возникает перекрывающихся сигналов в улитке[9], а следовательно, и биений первого порядка и «шероховатости».

Здесь читатель вправе задать вопрос: если область, активированная на базилярной мембране одним тоном одной частоты, имеет некоторую пространственную протяженность, занимая конечную область Д.т, как получается, что мы слышим лишь один тон, а не «мешанину» из всех тонов, соответствующих различным активированным положениям внутри области Дх? К сожалению, мы вынуждены отослать за ответом к следующим разделам (см. разд. 3.6). Здесь лишь отметим, что имеет место процесс так называемого «заострения», при котором активность, распределенная по области Дгг, «фокусируется» на гораздо более ограниченном числе соответствующих нейронов. Явление биений играет важную роль в музыке. При возникновении биений они обрабатываются мозгом, создавая ощущение, варьирующее от раздражающего до приятного («гладкого») в зависимости от частоты биений и общей музыкальной обстановки. Своеобразный неприятный звук, создаваемый инструментом, настроенным не в тон с аккомпанементом, вызывается именно биениями. Противное звучание расстроенных струнных инструментов в посредственном школьном оркестре неприятно, в частности, из-за биений, а «забавный» звук пианино в салуне обусловлен биениями между умышленно расстроенными парами или тройками струн в среднем и верхнем регистрах. Тот факт, что биения полностью исчезают, когда два тона имеют точно одинаковую частоту (Д — Д), играет основную роль в процессе настройки инструмента. Если мы хотим настроить частоту данного тона точно на частоту данного эталона (например, камертона), мы делаем это, слушая биения и подстраивая частоту до полного исчезновения биений.

Критическая полоса также играет важную роль в восприятии музыки. В последующих разделах мы обсудим это понятие подробнее. Пока заметим лишь, что критическая полоса представляет своего рода «набор информации и единицу интеграции» на базилярной мембране. Тот экспериментальный факт, что частотная протяженность критической полосы AfcB почти не зависит от амплитуды, или громкости, звука, убедительно доказывает, что критическая полоса должна быть связана с некоторым свойством структуры чувствительного органа на базилярной мембране, а не с формой волны в кохлеарной жидкости. Действительно, если, используя рис. 10, преобразовать частотную протяженность Afcs, показанную на рис. 15, в пространственную протяженность вдоль базилярной мембраны, мы получим для критической полосы почти постоянное значение 1,2 мм. Еще более существен следующий результат: критическая полоса соответствует на базилярной мембране области, «обслуживаемой» приблизительно постоянным числом рецепторных клеток — около 1 300 из их полного числа на мембране, равному 16 000 [182] — независимо от положения на мембране соответствующей центральной частоты. Сложный звуковой стимул (например, от двух чистых тонов), компоненты которого имеют частоты, лежащие внутри критической полосы, вызывают субъективное ощущение (например, «шероховатость» в нашем примере), которое обычно совершенно отлично от такового, когда разность частот превышает протяженность критической полосы (гладкость в примере с двумя тонами). Это справедливо и для ряда других явлений. Этот эффект играет важную роль в восприятии качества звучания (разд. 4.8) и лежит в основе теории консонанса и диссонанса музыкальных интервалов (разд. 5.2).

2.5. Другие эффекты первого порядка. Комбинационные гона и слуховые гармоники

До сих пор мы рассматривали эффекты наложения двух чистых тонов, частоты которых не слишком различаются между собой (рис. 14). Каковы будут наши ощущения, когда частота варьируемого тона /2 будет повышаться за пределами критической полосы, а частота Д оставаться постоянной? Возникающие при этом эффекты можно разделить на две категории в зависимости от того, возникают они в ухе или в нервной системе. В этом разделе мы сосредоточимся на явлении, относящемся к первой категории, — на восприятии комбинационных тонов. Эти тона создают дополнительные слуховые ощущения при одновременном звучании двух чистых тонов с частотами Д и Д [10]; они наиболее заметны, когда последние имеют

высокую интенсивность, и соответствуют частотам, отличным от и Д, как было установлено в экспериментах по согласованию и взаимному гашению тонов [52]. Они не присутствуют в исходных звуковых стимулах — они появляются в результате так называемого нелинейного искажения акустического сигнала в ухе.

Повторим эксперимент с наложением двух чистых тонов, соответствующий рис. 14, но теперь значительно увеличим громкость и будем медленно повышать и понижать частоту /2 от унисона Д до удвоенной частоты (октавы) 2/1 и обратно. При этом будем внимательно следить за возникающими слуховыми ощущениями. Конечно, мы будем слышать тон постоянной высоты, соответствующей частоте Д, и тон варьируемой частоты Д. Но кроме этого мы будем ясно различать один или несколько тонов более низкой частоты, повышающейся и понижающейся в соответствии с тем, как мы меняем частоту Д. В частности, когда частота Д повышается относительно частоты fi, мы слышим тон, повышающийся от очень низкого. Когда частота /2 понижается от октавного /2 = 2Д, мы также слышим повышение тона от очень низкого. Слушая еще внимательнее, можно различить несколько низких тонов, звучащих одновременно. Эти тона, отсутствовавшие в исходном звуке, называются комбинационными тонами.

Вероятно, легче всего различается комбинационный тон, частота которого равна разности частот компонент, имеющих высокую интенсивность:

fci = Д - h- (4)

Он называется также разностным тоном. Заметим, что при значениях Д, очень близких к Д, частота fci есть не что иное, как частота биений (3). Чтобы был слышен дополнительный тон, частота fci должна составлять по крайней мере 20-30 Гц. При повышении частоты Д частота fci также возрастает. Когда частота Д на октаву выше Д, разностная частота 2Д —

  • fi = fi совпадает с частотой нижней компоненты Д. Если частота Д находится посредине между Д и 2Д, т. е. Д = ЗД/2 (такой музыкальный интервал называется квинтой), разностный тон имеет частоту fci =
  • — ЗД/2 — fi — fi/2, высота этого тона на октаву ниже тона с частотой Д.

Два других комбинационных тона [120], наиболее легко различимых даже при низкой интенсивности исходных тонов, соответствуют частотам

/С2 = 2/1 - /2) (5)

/сз = 3/1 - 2/2. (6)

Оба тона fc2 и fcs понижаются при повышении частоты Д от унисона до квинты, и их легче всего слышать, когда частота Д лежит между 1,1 Д и 1,3/1. При высокой интенсивности исходных тонов они также легко различимы в виде низкочастотных звуков, соответственно, вблизи октавы и квинты. Заметим, что тона /с2 и fci имеют одинаковую частоту /1/2, когда частота /2 — 3fi/2 отстоит на квинту от частоты Д. На рис. 16 представлены тона первого порядка, возникающие при наложении двух чистых тонов частоты /1 и /2. Заметим, что рис. 14 есть не что иное, как снятая крупным планом картина того, что происходит, когда частота /2 близка к /] (это заштрихованная область на рис. 16). Более жирными линиями показаны области наиболее легко различимых комбинационных тонов (их протяженность зависит от интенсивности).

Частоты комбинационных тонов fci, fc2, /сз, возникающих при наложении двух тонов (/i, /2). Сплошными линиями показаны области наиболее легко различимых комбинационных тонов

Рис. 16. Частоты комбинационных тонов fci, fc2, /сз, возникающих при наложении двух тонов (/i, /2). Сплошными линиями показаны области наиболее легко различимых комбинационных тонов

Как возникает ощущение этих дополнительных тонов? Уже отмечалось, что в исходных колебаниях барабанной перепонки, создаваемых звуком, они не присутствуют. Тщательные эксперименты, проведенные на животных, показали, что частоты комбинационных тонов отсутствуют даже у входа в улитку (на мембране овального окна, рис. 8). В то же время из результатов непосредственных измерений нервных импульсов [52] приходится сделать вывод, что на базилярной мембране действительно существуют активированные области в местах, соответствующих частотам комбинационных тонов. Считается, что они возникают вследствие «нелинейного» искажения формы волны первичного стимула в улитке. В самом деле, можно математически показать, что при подаче двух гармонических (синусоидальных) колебаний различной частоты J и Д на преобразователь с нелинейным откликом выходной сигнал будет в дополнение к исходным частотам Д и Д содержать все линейные колебания вида Д — Д, 2Д — - fa, ЗД — 2Д, Д + Д, 2Д + Д и т. д. Однако более поздние эксперименты [154] показали, что разностный тон (4) и два других комбинационных тона (5) и (6) должны создаваться взаимно независимыми процессами в улитке. Порог интенсивности для генерации первого из них, (5), значительно выше, чем для второго, и практически не зависит от отношения частот Д/Д. В то же время порог второго, (6), растет, когда отношение Д/Д приближается к единице[11].

Интересно отметить, что из-за нелинейного искажения даже один-единственный очень громкий тон частоты Д будет создавать ощущение присутствия дополнительных тонов. Эти тона, называемые слуховыми гармониками, соответствуют частотам, кратным исходной частоте, 2Д, ЗД, 4Д и т.д.

Все эксперименты, имеющие отношение к этому разделу, лучше всего проводить с электронными генераторами звука, однако можно использовать комбинационные тона и слуховые гармоники, создаваемые некоторыми музыкальными инструментами, способными издавать непрерывные звуки высокой интенсивности. Вероятно, наиболее подходящим «инструментом» для этой цели может служить собачий свисток, позволяющий извлекать различные звуки очень высокой частоты. Простой эксперимент с комбинационными тонами можно провести в домашних условиях, если одновременно дуть в два таких свистка таким образом, чтобы один давал звук постоянной частоты, а другой — частоту, изменяемую от унисона и обратно. Комбинационные тона не играют заметной роли в музыке, поскольку для их появления исходные тона должны иметь сравнительно высокую интенсивность. Однако они возникают повсюду, где звучит рок-музыка с ее обычной экстремальной (и физиологически опасной) громкостью, особенно если слушать ее через наушники!

«Фальшивые» комбинации тонов легко возникают в электронных органах и низкокачественных проигрывателях и громкоговорителях. В этих случаях такие паразитные частоты возникают из-за нелинейных искажений в электронной схеме и механической системе громкоговорителя. В частности, разностный тон легко создать с помощью электронного органа. Для этого достаточно включить на полную громкость 8-футовый флейтовый регистр и исполнять в прямой и обратной последовательности ноты на верхнем нотном стане (рис. 17); при этом будут слышны низкие тона, изображенные на нижнем нотном стане.

Исходные тона

Исполнение

j г ~ JI

Разностный тон (приблизительная высота)

Ощущение или слуховое восприятие

Рис. 17. Разностные тона (нижний нотный стан), слышимые при исполнении (громком!) суперпозиций двух тонов, показанных на верхнем нотном стане

Некоторые разностные тона, порождаемые таким образом, оказываются дисонансными из-за равномерно-темперированной настройки инструмента (разд. 5.3). Следует подчеркнуть, что в этом эксперименте будет слышен фальшивый комбинационный тон в том смысле, что ощущение низкого тона возникает не в ухе, а в громкоговорителе. Из этого примера легко видеть, почему электронные схемы и громкоговорители проигрывателей и электронных органов должны иметь как можно более линейный отклик.

2.6. Эффекты второго порядка. Биения расстроенных консонансов

Теперь повторим эксперимент из предыдущего раздела с двумя чистыми тонами, генерируемыми электрическим способом, но теперь без учета возможного появления комбинационных тонов. Будем подавать оба тона низкой интенсивности на одно и то же ухо, при этом частоту Д будем поддерживать постоянной, а частоту /2, как и раньше, изменять по своему усмотрению. Амплитуды обоих чистых тонов во время эксперимента остаются неизменными. Если варьируемая частота /2 медленно повышается, мы наблюдаем нечто необычное, когда оказываемся вблизи октавного интервала Д = 2/1, а именно четкое ощущение биений, совершенно отличных от биений вблизи унисона, но вполне заметных. Когда частота /2 точно равна 2/1, это ощущение биений исчезает. Оно появляется вновь при расстройке октавного интервала, т. е. когда /2 = 2Д + е, где греческой буквой ? обозначена небольшая частота в несколько герц. Частота биений оказывается равной е. Здесь трудно указать, что совершает биения. Большинство рассматривает это как биения «качества» тона. Мы назовем это биениями второго рода, некоторые предпочитают термин «субъективные биения». Они являются следствием нейронной обработки.

Поучительно проследить за картиной колебаний на экране осциллографа, когда мы слышим биения второго порядка. На этой картине видно изменение точного синхронизма при появлении биений. Очевидно, что наша слуховая система способна каким-то образом улавливать такие изменения формы картины колебаний. На рис. 18 показано несколько картин колебаний, соответствующих суперпозиции основного тона частоты Д и тона на октаву выше /2 = 2/1 (меньшей амплитуды) для четырех различных значений разности фаз. Пока октавный интервал выдерживается точно, разность фаз остается постоянной, и изображение на экране осциллографа не претерпевает изменений, при этом любая из четырех суперпозиций звучит так же, как остальные, — наше ухо не отличает одного случая от другого. При небольшой расстройке /2 = 2Д 4- е разность фаз непрерывно меняется со временем, и результирующая картина колебаний будет постепенно меняться от одной из форм на рис. 18 к следующей. Можно математически показать, что этот цикл изменения картины колебаний повторяется с частотой е, на которую частота верхнего тона отличается от удвоенной частоты нижнего тона. Это, очевидно, означает, что ухо чувствительно к медленно меняющейся разности фаз двух тонов[12]. Это эквивалентно следующему утверждению: слуховая система способна обнаруживать циклические изменения формы картины колебаний. Обратим внимание на то, что на рис. 18 нет заметного «среднего» изменения амплитуды от одной картины к другой в отличие от случая биений первого порядка, которые представляют циклические изменения амплитуды колебаний (рис. 13). На рис. 19 показаны две реальные осциллограммы, которые сопоставляют биения первого порядка вблизи унисона и биения второго порядка расстроенной октавы. Отметим модуляцию амплитуды в первом случае и модуляцию картины колебаний во втором. Важно учесть, что ощущение биений второго порядка появляется только в низкочастотной области исходного стимула из двух тонов. Когда частота (и Д) превышает 1 500 Гц, биения второго рода не ощущаются [121].

Существует оптимальное соотношение между интенсивностями компонент, при котором наиболее выражены биения второго порядка. Это со-

  • 0° Разность фаз
  • 90° Разность фаз
  • 180° Разность фаз
  • 270° Разность фаз

Рис. 18. Суперпозиция двух чистых тонов, различающихся на октаву, для четырех различных значений разности фаз

отношение всегда предполагает, что более высокий тон имеет меныиую интенсивность [124]. Наконец, важно отметить, что биения второго порядка воспринимаются и тогда, когда компоненты подаются раздельно на два разных уха. В этом случае возникает странное ощущение пространственного «вращения» звуковой картины «внутри» головы (разд. 2.9).

(«)

Сравнение биений первого и второго порядка, (а) Биения первого порядка (расстроенный унисон)

Рис. 19. Сравнение биений первого и второго порядка, (а) Биения первого порядка (расстроенный унисон): модуляция амплитуды без изменения формы картины колебаний, (б) Биения второго порядка (расстроенная октава): модуляция картины колебаний с небольшим изменением средней амплитуды

Биения второго порядка при расстройке консонансов чистых тонов не играют заметной роли в музыке (главным образом потому, что там не используются чистые тона). Однако они важны для понимания механизма обработки музыкальных звуков (разд. 2.8).

2.7. Отслеживание основной частоты

Теперь обратимся к другому ряду психоакустических экспериментов, сыгравших важную роль в построении теории слухового восприятия. Рассмотрим два чистых тона с частотами /1 и /г = 3/1/2, расстояние между которыми составляет чистую квинту. На рис. 20 показано результирующее (суммарное) колебание для одного значения разности фаз. Заметим, что форма колебаний в точности повторяется через отрезок времени tq, вдвое больший периода низшего тона ri. Это означает, что частота повторения fo — 1/то картины колебаний для интервала, равного квинте, вдвое меньше частоты более низкого тона:

/о = 1/1- (2.7а)

Суперпозиция двух чистых тонов, расстояние между которыми составляет музыкальную квинту (при заданной разности фаз), г» — период повторения для результирующего звука

Рис. 20. Суперпозиция двух чистых тонов, расстояние между которыми составляет музыкальную квинту (при заданной разности фаз), г» — период повторения для результирующего звука

Назовем эту частоту повторения основной частотой картины колебаний. В данном случае она лежит на октаву ниже частоты Д. Если взять два тона, образующих кварту (f? — 4fi/З), можно построить результирующую картину колебаний подобно тому, как это было сделано для квинты. Теперь результирующая частота повторений равна

/о = 1/1, (2.76)

О

что на дуодециму ниже низшего тона. Для большой терции (Д = 5Д/4) частота повторения лежит на две октавы ниже Д:

= (2.7с)

Наша слуховая система оказывается чувствительной к этим частотам повторения. Действительно, были проведены тщательные эксперименты, в которых испытуемым предъявлялись короткие последовательности стимулов, состоящие из одновременно звучащих чистых тонов, разделенных интервалом в квинту, кварту, терцию и т. д. [68]. Предлагалось определить один основной тон такой «мелодии». Большинство испытуемых выделяло тон, определяемый, соответственно, соотношениями (2.7а), (2.76) или (2.7с)![13] Важно подчеркнуть, что этот эксперимент по определению тона требует, чтобы комплексы из двух тонов были представлены в виде временной последовательности или мелодии. (Сталкиваясь с непрерывно звучащей парой чистых тонов, наша слуховая система оказывается не в состоянии «отыскать» ощущение одиночного тона, она очень быстро переключает внимание на различение частот обеих чистых компонент, как объяснялось в разд. 2.4.)

Заметим, что частоты повторения (2.7а)-(2.7с) комплексов из двух тонов совпадают с частотами соответствующих разностных тонов (см. четвертый, второй и первый примеры на рис. 17). Однако эксперименты показали, что определение частоты повторения проходит успешно даже при низкой интенсивности двух тонов Д и /2, значительно меньшей порога образования комбинационных тонов. Таким образом, исключается разностный тон (4) [122]. Реально определение частоты повторения практиковалось в музыке в течение многих веков (и неверно приписывалось эффекту комбинационных тонов). Например, начиная с конца XVI века, многие органы снабжаются регистром (под названием «51-футовая квинта»), состоящим из труб, звучащих на квинту выше исполняемой ноты, написанной на бумаге. Цель состоит в активации басового звука на октаву ниже (см. (2.7а)) написанной ноты (т. е. в усилении звука 16-футовой трубы органа). Еще 9

раньше применялась 10--футовая квинта на педалях, «дешевый» регистр, который в сочетании с 16-футовыми регистрами имитирует 32-футовый басовый регистр (на две октавы ниже написанной ноты, что потребовало бы использования очень длинных и дорогих труб).

Тон частоты /0, определяемый формулами (2.7а)-(2.7с), отсутствует в качестве одной из исходных компонент. Этот тон называют отсутствующей основной частотой (по причинам, которые станут понятны позже), соответствующее ощущение звука называют тоном периодичности, субъективным тоном, остаточным тоном или виртуальным тоном. Это ощущение следует отличать от первичного, создаваемого каждым из двух исходных чистых, одночастотных тонов. Эксперименты показали, что при обычных уровнях громкости частота Д не присутствует в колебаниях кохлеарной жидкости (при наличии, тем не менее, комбинационных тонов). В самом деле, область базилярной мембраны, соответствую-

щая частоте /о (рис. 10), может быть насыщена (замаскирована) полосой шума (звука с бесконечным числом частотных компонент, лежащих внутри данной области), так что любое дополнительное возбуждение этой области пройдет незамеченным, — и тем не менее «отсутствующая» основная частота будет слышна [152]. Или можно ввести дополнительный тон, слегка отличный от тона частоты /о- При этом биения первого порядка должны появляться, если отсутствующий основной тон /о реально существует в улитке; тем не менее биения не ощущаются. Более поразительным представляется эффект, когда отсутствующая основная частота ощущается, даже если две компоненты подаются на разные уши [68]. Все это показывает, что отсутствующая основная частота (тон периодичности) должна быть результатом нейронной обработки на более высоком уровне.

Субъективное восприятие тона, т. е. способность нашей слуховой системы улавливать частоту повторения исходной картины колебаний возможна лишь в области сравнительно низких частот (однако очень важных в музыкальном отношении), ниже 1 500 Гц. Чем сложнее картина колебаний, т. е. чем меньше интервал между компонентами, тем труднее нашей слуховой системе уловить отсутствующую основную частоту и тем более неоднозначным становится восприятие субъективного тона.

Вернемся теперь к соотношениям (2.7а)-(2.7с) и выясним, какие пары чистых тонов приводят к одинаковой частоте повторения, или одинаковой основной частоте /ф Мы получим картину, показанную на рис. 21.

2/о и З/о З/о и 4/0

квинта кварта

4/р и 5/ф З/о и 4/р и т. д.

большая терция малая терция

Другими словами, если частота /о соответствует ноте, показанной на нижнем нотном стане на рис. 21, музыкальные интервалы, показанные

Стимул, СОСТОЯЩИЙ 0 .. р

из двух тонов (ф о о °

Нота, соответствующая

тону периодичности ” 11 “ “ “

Рис. 21. Стимулы из двух тонов (верхний нотный стан), которые приводят к одному и тому же тону периодичности (нижний нотный стан). Нота «си-бемоль» в скобках должна быть понижена по отношению к любой существующей гамме (разд. 5.3), чтобы получить в качестве тона периодичности «до» малой октавы на верхнем стане, дают одну и ту же ноту в качестве субъективного тона. Важно иметь в виду, что ноты на рис. 21 представляют чистые тона одной определенной частоты, а не тона, порождаемые реальными музыкальными инструментами.

Отдельные компоненты с частотами 2/(), 3fo, 4/о, 5/о,... называются высшими гармониками основной частоты /0. Частоты высших гармоник кратны основной частоте. Любые два последовательных тона из ряда высших гармоник образуют пару с той же частотой повторения, или основной частотой /о- Таким образом, все высшие гармоники, если они будут звучать одновременно, дадут ощущение одного и того же субъективного тона, соответствующего частоте /о, даже если эта последняя полностью отсутствует в многочастотном стимуле! Вот почему в приведенных примерах частота /о была названа отсутствующей основной частотой и почему восприятие этой частоты называется отслеживанием основной частоты. Отметим еще раз замечательное свойство этого ряда чистых тонов с частотами 2/о, 3 /о Л /о , • • • ...: из всего бесконечного разнообразия супер

позиций чистых тонов, какие только можно себе представить, эта и только эта дает одну и ту же частоту повторения для любой пары соседних частот. И наоборот, именно по этой причине любой периодический тон со сложной, но повторяющейся картиной колебаний (с частотой повторения /о) представляет суперпозицию чистых тонов с частотами n/о — целое число) (см. разд. 4.2).

Описанные психоакустические эксперименты с комплексами из двух тонов были расширены с привлечением мелодий и комплексов, состоящих из многих тонов, начиная с n-й гармоники (т. е. суперпозиций чистых тонов с частотами n/о, (п + 1)/о, + 2)/о и т. д.). Хотя тон основ

ной частоты, как и раньше, отсутствует, субъективный тон, приписываемый этому комплексу, всегда соответствует частоте /о. Фактически чем больше берется гармоник, тем яснее слышен тон периодичности (если только начальная гармоника не слишком высока, т. е. число п не очень велико). Для определения тона периодичности лучше всего подходят пары соседних гармоник вблизи п = 4 [136]. Поскольку реальные музыкальные тона оказываются суперпозициями гармоник (разд. 4), именно отслеживание основной частоты является тем слуховым механизмом, который позволяет нам приписывать одну высоту сложному тону музыкального инстру-32 мента .

32Всроятно, наиболее убедительным примером отслеживания основной частоты сложных тонов может служить тот факт, что мы можем правильно воспринимать высоту басовых звуков, издаваемых дешевым транзисторными приемником, несмотря на то, что все частоты ниже 100-150 Гц отсекаются из-за несовершенства электронной схемы и громкоговорителя!

Важно понять истинную роль отслеживания основной частоты в теории слуха. Здесь может помочь краткий анализ исторических экспериментов с согласованием тонов, проведенных Смуренбургом [153][14]. Рассмотрим короткий стимул, состоящий из двух тонов с частотами компонент fa и fb, различающимися на фиксированную величину А/ = fa — fb- Когда он предъявляется в некотором определенном контексте, примерно половина испытуемых воспринимает ясно идентифицируемый субъективный «остаточный тон» (остальные слышали только один или оба тона исходного стимула, т. е. они слушали не синтетически, а аналитически). Эксперименты показывают, что если частоты fa и fb соответствуют двум соседним гармоникам сложного тона порядка п и п + 1, субъективный тон, когда он воспринимается, соответствует отсутствующей основной частоте Л (= fa/n = А/). Например, если fa = 800 Гц и fb = 1000 Гц (п = = 4, А/ = 200 Гц), то остаточный тон будет слышен как звук с частотой 200 Гц. На рис. 22, а показана картина колебаний для стимула из двух тонов, напоминающая биения первого порядка (разд. 2.4). Однако в данном случае амплитудная модуляция (изменение «огибающей» кривой) происходит очень быстро (200 раз в с) и не воспринимается как биения. Вместо этого воспринимается (примерно половиной испытуемых) тон, соответствующий частоте повторения картины колебаний, которая составляет точно 200 Гц. На рис. 22 показан соответствующий период повторения (обратная величина отсутствующей основной частоты) 1/А/ = 1/(Д — fa). Отмечен также другой, гораздо более короткий, период тонкой временной структуры картины колебаний, соответствующий так называемой центральной частоте стимула из двух тонов /с = (/а + /ь)/2 (= 900 Hz). Если взять другую пару соседних гармоник, например, fa = 2000 Гц, fb = 2 200 Гц (п — 10), то будет ощущаться тот же субъективный тон (только трудность его обнаружения будет возрастать с ростом п [67]), картина колебаний будет иметь такую же огибающую, как и на рис. 22, а, но так как центральная частота теперь выше (2 100 Гц), кривая будет содержать большее число колебаний (равное 10, номеру гармоники с частотой fa) внутри одного периода повторения.

Представляется, что наша слуховая система извлекает информацию из периодического изменения картины колебаний, как она это делает при восприятии (медленных) биений расстроенных консонансов (рис. 19). Однако возникает интересное усложнение, когда пара частот fa, fb не соответствует двум соседним гармоникам некоторой основной частоты. Рассмотрим стимул из двух тонов с частотами fa = 900 Гц, Д = 1100 Гц. Не су-

  • 1
  • (0 О
  • -1

Псевдопериод Псевдопериод ' -*-----TQ------

Л 1 а|Н

_______________________________________________1________________________________________________1___________________________________________

тс *-

J_____

1

_______L

Псевдопериод 2

Псевдопериод 1 йм

__________________________________1_______________________________________1_____________________________________

Рис. 22. Картина колебаний для двух одновременно звучащих чистых тонов, (а) Тона являются соседними гармониками (п = 4). (б) Тона с той же разностью частот, что и в случае а, но не являющиеся соседними гармониками: и — точный период повторения картины колебаний; тс — период, соответствующий центральной частоте; тр, тд — псевдопериоды (см. объяснение в тексте)

ществует музыкального тона, для которого эти два тона могли бы быть соседними гармониками, вместо этого они являются 9-й и 11-й гармониками тона с основной частотой Д = 100 Гц [15]. Будет ли восприниматься такой тон? Нет! Восприятие оказывается неоднозначным: в зависимости от контекста, в котором предъявляется стимул, могут появиться два возможных тона, соответствующие частотам 178 или 228 Гц! Такая картина колебаний показана на рис. 22, б. Прежде всего отметим, что огибающая на этой картине имеет тот же период модуляции, что и на рис. 22, а, соответствующий частоте 200 Гц. Далее, рассмотрим внимательнее картину пиков

и впадин и заметим, что точная тонкая структура повторяется с удвоенным периодом (соответствующим частоте 100 Гц). Таким образом, точная частота повторения равна 100 Гц, однако ни эта частота, ни частота модуляции 200 Гц не воспринимаются. Оказалось, что два возможных слышимых тона точно соответствуют двум «псевдопериодам» тр и Tq, отмеченным на рис. 22,6! Более того, эксперименты Смуренбурга показывают, что даже в первом примере (когда стимул состоит из двух соседних гармоник) могут быть слышны дополнительные неоднозначные тона, соответствующие псевдопериодам, определяемым временными интервалами между центральным пиком и вторичными пиками в последующем периоде модуляции (рис. 22, а).

Все это показывает, что процесс выделения высоты тона гораздо сложнее, нежели обнаружение частоты повторения или частоты амплитудной модуляции: либо механизм слуха способен блокировать слишком подробные временные особенности картины колебаний, либо имеет место совершенно иной процесс распознавания сигнала, при котором пространственная картина возбуждения, создаваемая стимулом из двух тонов на базилярной мембране, подробно анализируется процессором высоты тона и подгоняется, по возможности точно, к «знакомым» конфигурациям (например, к положениям резонансных областей соседних гармоник). Всякий раз, когда такая подгонка достигается, создается ощущение звука, а поскольку могут оказаться возможными несколько вариантов подгонки, возникает неоднозначность. Можно математически доказать, что этот процесс приводит во многих (но не всех) отношениях к тем же количественным результатам, что и вышеупомянутый механизм временного анализа сигналов. Мы вернемся к этому вопросу в разд. 4.8 и приложении В.

Наконец, различия между индивидуумами в способности воспринимать субъективные остаточные тона стимула из двух тонов побудили некоторых психоакустиков выступить с возражениями относительно интерпретации экспериментов Смуренбурга. Однако совпадение количественных результатов (проверенных несколькими независимыми группами исследователей) у тех испытуемых, которые слышат остаточный тон, столь значительно, что упомянутые различия могут указывать на разную стратегию слушания без особых последствий для выводов, сделанных из этих экспериментов относительно механизма извлечения тона как такового. Отличный исторический обзор наиболее важных экспериментов по восприятию высоты звука был сделан Пломпом [124]. Подробное обсуждение современного состояния этого вопроса и список соответствующей литературы можно найти в обзоре [117].

2.8. Кодирование звуковой информации в периферической нервной системе

Открытие эффектов второго порядка в обработке слуховой информации — восприятия биений расстроенных консонансов и отслеживания основной частоты — оказало большое влияние на теорию слуха. С одной стороны, восприятие биений расстроенных консонансов (разд. 2.6) показывает, что слуховая система каким-то образом получает и использует информацию о подробной временной структуре картины звуковых колебаний. С другой стороны, отслеживание основной частоты (разд. 2.7) может в принципе предполагать две альтернативы: 1) механизм подробного анализа временной картины колебаний, направленный на выделение повторяющихся особенностей, частота которого приводит к ощущению тона (рис. 22), либо 2) механизм анализа информации относительно деталей картины пространственного возбуждения на базилярной мембране, ориентированный на получение ощущения одного тона, если эта картина согласуется, хотя бы частично, с характерным возбуждением, создаваемым музыкальным тоном. Следует ожидать, что второй механизм будет лучше работать в области более низких гармоник (меньших значений п), где наиболее заметны соответствующие пространственные максимумы возбуждения. Любой из этих вариантов предполагает, что детальная акустическая информация, кодируемая на периферии, должна анализироваться на более высоком уровне центральной нервной системы. Более того, оба варианта могут действовать одновременно взаимодополняющим образом (см. разд. 2.9 и 4.8 и приложение В).

Для того, чтобы понять предлагаемые механизмы, мы должны сначала описать в общих чертах работу нервной системы. Когда многоклеточные организмы начали передвигаться, возникла необходимость в быстрой и более сложной обработке информации и ее запоминании. Нервная система эволюционировала вместе с сенсорными и моторными механизмами для установления связи организма с окружающим миром в реальном времени. На ранних стадиях эволюции нервная система служила просто устройством для быстрой передачи информации, при которой физические или химические сигналы, порождаемые окружающей средой и преобразованные сенсорным приемником в электрические импульсы, переносятся в отдаленные части организма, вызывая сокращение мышечного волокна. Позже возникли нервные сети, которые могли анализировать и распознавать входные сигналы разного типа и в зависимости от ситуации отдавать нужные приказы различным частям тела. Наконец, появились системы памяти, которые могли накапливать информацию, приобретаемую организмом в течение его жизни, чтобы в дальнейшем, используя прошлый опыт, успешно справляться с проблемами, создаваемыми внешней средой.

Основным строительным блоком нервной системы и единичным элементом обработки информации является нейрон — клетка с электрохимически активной мембраной, способная генерировать короткие электрические импульсы, служащие переносчиками информации. Обычно вводится понятие «формального», или «идеального», нейрона — модели клетки, обладающей некоторыми основными атрибутами большинства (но никоим образом не всех) типов нейронов — от медузы до коры головного мозга человека. Эти основные атрибуты следующие (рис. 23): 1) дендритное дерево, собирающее сигналы, поступающие от нейронов, находящихся «выше по течению», через так называемые синаптические соединения', 2) тело клетки, или сома, которое содержит ядро клетки и управляет метаболическими функциями нейрона, а также может непосредственно получать сигналы от пресинаптических нейронов; 3) аксон, который переносит электрические импульсы стандартной величины от сомы к постсинаптическим нейронам. Таким образом, нейрон представляет собой основной элемент для обработки, интеграции и дискриминации информации в нервной системе.

Схематическое изображение модели нейрона

Рис. 23. Схематическое изображение модели нейрона

Электрический потенциал невозмущенного нейрона по отношению к окружающей среде постоянен и всегда отрицателен (приблизительно — 70 милливольт (мВ) — это довольно большая величина, если учесть, что мембрана нейрона имеет толщину всего 70 нанометров (7 х 10"8 м!)). Нервный импульс, поступающий с пресинаптической клетки, вызывает освобождение нейротрансмиттера в синаптической щели, при этом локальное изменение проницаемости мембраны для электрически заряженных атомов (ионов натрия, калия и кальция) вызывает локальное изменение электрического потенциала постсинаптического нейрона, создавая импульс, распространяющийся в сторону сомы. Некоторые синапсы, в которых нейротрансмиттером служит дофамин, глицин или гаммааминобутиро-вая кислота, создают положительные импульсы, называемые возбуждающими постсинаптическими потенциалами (ВПСП); другие синапсы (с нейротрансмиттерами типа норпинефрина) создают отрицательные импульсы, или тормозные постсинаптические потенциалы (ТПСП). Возбуждающие потенциалы варьируют от +8 до +10 мВ, тормозные — от —5 до —8 мВ; они достигают максимума за несколько миллисекунд и затухают приблизительно за 10 мс. Характерное время задержки между приходом импульса на синапс, освобождением нейротрансмиттера в синаптическую щель и возникновением отклика в постсинаптической клетке обычно меньше миллисекунды.

Все это может быть измерено с помощью микроэлектродов, имплантированных в клетку, и эта процедура отнюдь не обязательно должна влиять на работу нейрона! Относительная амплитуда сигнала, генерируемого в постсинаптическом дендрите, зависит от конкретной структуры и размера синаптического контакта и от числа нейротрансмиттерных рецепторов на мембране постсинаптической клетки. Фактически амплитуда и длительность постсинаптического потенциала являются мерой способности (или эффективности) синапса, генерирующего импульс, которая, как мы увидим далее (разд. 4.9), в некоторых нервных сетях может меняться в процессе обучения.

Входные импульсы по пути к телу клетки суммируются более или менее линейно. Существует, однако, некоторый предел для такого линейного поведения возбуждаемых мембран: если потенциал клетки (всегда отрицательный) деполяризуется (становится менее отрицательным) и становится выше некоторого порогового значения (что опять-таки можно сделать искусственно, с помощью микроэлектрода), возникает фундаментальная неустойчивость и включается положительный импульс деполяризации. Порог имеет наименьшую величину в аксонном холмике (рис. 23) и находится точно там, где генерируются положительные потенциалы действия

(ПД). Включенный импульс не зависит от характера включающего фактора и возбуждает аксон стандартизированным дискретным образом. Потенциалы действия представляют собой электрические импульсы длительностью в несколько миллисекунд с амплитудой, значительно превышающей постсинаптические потенциалы (поэтому их легче зарегистрировать с помощью микроэлектрода). Скорость распространения этих импульсов варьирует от 0,3 м/с в аксонах серого вещества корковой ткани до 130 м/с в миелинизированных волокнах белого вещества и эфферентных (выходящих) нервах[16]. Новейшие исследования показывают, что процесс генерации потенциалов действия может также запускать импульсы, распространяющиеся обратно к дендритному дереву, этот процесс обратной связи может быть связан с процессом обучения (разд. 4.9). При имплантации микроэлектрода в живую нервную ткань, усилении зарегистрированных импульсов (которые в основном поступают от гораздо более сильных потенциалов действия, а не от ВПСП или ТПСП) и преобразовании их в звуковые сигналы можно слышать характерный треск и щелчки в громкоговорителе, обнаруживающие работу отдельного нервного волокна (аксона) «во время допроса». Для получения количественных практических результатов всплески электрического тока регистрируются цифровым или графическим методом как функция времени; их частота и распределение представляют физическое выражение нейронной информации на уровне отдельного нейрона.

Таким образом, потенциал действия представляет основное сообщение на выходе одиночного нейрона. Аксоны соединяют нейрон с дендритами или телами клеток других нейронов (т. е. осуществляют синаптические контакты). В мозгу человека один аксон может находиться в синаптическом контакте с тысячами других нейронов. И наоборот, один данный нейрон может соединяться с входными аксонами сотен или тысяч других клеток. Одиночный нейрон может также отдавать приказания, приводящие к возбуждению или торможению других нейронов. За активацией нейрона следует рефрактерный период, в течение которого либо он не может возбудиться снова, либо его порог возбуждения существенно повышается.

Когда нейрон с тормозным потенциалом посылает импульс другому такому нейрону, он устраняет тормозной эффект последнего. Важно отметить, что выходной сигнал нейрона определяется пространственно-временным распределением ВПСП и ТПСП, генерируемых пресинаптическими нейронами в течение некоторого короткого интервала времени. Вот почему нейрон иногда называют основным «вычисляющим элементом» нервной системы. С другой стороны, имеется много нейронов, которые с некоторой характерной частотой порождают потенциалы действия спонтанно, без каких-либо входных сигналов.

Как уже упоминалось, отдельные возбуждения обычно не следуют через одинаковые временные интервалы. Основное значение для посылаемой информации здесь имеет факт возбуждения нейрона, средняя частота (число возбуждений в единицу времени) и реальное распределение импульсов во времени для данной нервной сети (см. далее рис. 25). Нейрон может спонтанно возбуждаться со средней частотой до нескольких десятков герц, для такого нейрона формируемое сообщение определяется изменением частоты спонтанных возбуждений.

Электрические импульсы генерируются не только в нейронах. Существует другой фундаментальный тип «псевдонейронов» с возбуждаемыми мембранами — сенсорные рецепторные клетки, в которых электрические потенциалы включаются некоторым физическим агентом, например, фотоном (квантом света) в случае палочек и колбочек сетчатки или изгибающей силой, действующей на реснички волосковых клеток базилярной мембраны (см. ниже). Эти нейроны являются сенсорными детекторами нервной системы и представляют собой входной конец нейронной цепочки животного, передающей информацию о состоянии внешней среды и собственного тела через периферическую афферентную систему в аппарат обработки информации центральной нервной системы. На выходном конце этой цепочки находятся особые синапсы (с ацетилхолином в качестве вещества трансмиттера) между аксонами так называемых мотонейронов и мышечными волокнами в мускулах, железах и кровеносных сосудах; эти синапсы, будучи активированными, вызывают сокращение моторных белков, коллективно создающих сокращение этих волокон.

В нервной системе имеются три пространственных области обработки информации. Как уже отмечалось, нейрон представляет основной элемент обработки «на микроскопическом уровне». На промежуточном, или «мезоскопическом», уровне мы имеем ансамбли, состоящие из ограниченного числа нейронов, связанных между собой и предназначенных для выполнения некоторого ограниченного набора частных задач. Например, в сетчатке глаза мы имеем группы нейронов, работающих как детекторы движения или усилители контраста; в сенсорных отделах коры имеются столбчатые ансамбли, состоящие из сотен тысяч нейронов и представляющие собой кооперативные элементы, которые получают информацию от некоторой ограниченной области сетчатки, базилярной мембраны, кожи и т. д. «Макроскопическая» область — это мозг в целом, который у человека содержит 1011 нейронов с К)13—1014 синаптическими межсоединениями.

На мезо- и макроуровнях существуют два основных варианта представления информации в нервной системе. Один из них создается специфическим пространственно-временным распределением электрических импульсов в нервной сети и представляет переходное, или оперативное, состояние мозга. Другой представлен пространственным распределением синапсов и их эффективностей (которое обычно называют «синаптической архитектурой»); он определяет реальную «жесткую структуру» (hardware), или внутреннее состояние нервной сети. На макроскопическом уровне первый вариант представляет невероятно сложную картину, которая изменяется с характерными временами 0,1-100 мс и обычно включает в работу миллионы нейронов даже при решении простейших задач по обработке информации. Второй вариант имеет вид пространственной структуры, постоянной или изменяющейся очень медленно по мере накопления обучающего опыта. Заметим, что в нервной системе отсутствует какой-либо эквивалент «программного обеспечения» (software), — «программы» или оперативные инструкции включены в изменяющуюся конфигурацию «жесткой» структуры (синаптической архитектуры).

К сожалению, никакие макроскопические нервные структуры, как динамические, так и статические, как уже отмечалось в разд. 1.5, не удается представить в численной форме. Имеются также непреодолимые трудности с экспериментальной точки зрения[17]. Одиночный микроэлектрод, имплантированный в нейрон (как уже было сказано, такой электрод может не нарушать работу клетки), может дать нам возможность считывать от

дельные нервные импульсы, их частоту следования, распределение во времени, но для получения реального «пространственно-временного распределения» импульсов в любой функционирующей области мозговой ткани требуются тысячи микроэлектродов, имплантированных очень близко друг к другу Электроды с большим сечением острия позволяют измерять электрические сигналы, усредненные по десяткам или сотням нейронов, и изучать усредненную активность ограниченной области нервной ткани или нервного волокна в любой момент времени, однако не дают информации о деталях точного пространственно-временного распределения импульсов.

Что касается синаптической архитектуры, то нейрон-нейронные межсоединения можно наблюдать только под микроскопом, и хотя рост синапсов действительно наблюдался в реальном времени [66], были получены только статистические результаты относительно синаптической архитектуры (например, определена плотность синапсов) и то только для очень ограниченных участков нервной ткани. Например, одно из первых количественных исследований плотности синапсов в мозговой ткани [50] показало, что у крыс, находящихся в возбуждающих внешних условиях, насчитывалось больше нервных волокон спинного мозга (аксон-дендритных межсоединений), чем у их собратьев, помещенных в более «скучную» обстановку. Это послужило первым подтверждением так называемой гипотезы Хебба [62] относительно элементарного акта запоминания нервной информации', два изначально независимых нейрона, находящихся в непосредственной близости друг от друга, которые под влиянием некоторого воздействия, управляемого извне, стремятся одновременно возбудить нервные импульсы, устанавливают (путем выращивания, восстановления и т. п.) синаптический контакт между собой таким образом, что в дальнейшем импульс лишь одного из них будет включать импульс другого. В приложении В мы покажем, как работает этот элементарный механизм, на примере модели нервной сети.

После этого беглого взгляда на работу нервной системы нам будет легче обсудить, как может эта система собирать и кодировать информацию о картине звуковых колебаний. Когда звуковой сигнал, создаваемый одиночным чистым тоном данной частоты, попадает в ухо, колебания базилярной мембраны возбуждают волосные клетки, находящиеся в резонансной области, соответствующей этой частоте (разд. 2.3). У человека эти чувствительные элементы группируются в виде ряда из приблизительно 4 000 «внутренних» волосных клеток (простирающегося вдоль базилярной мембраны от основания до вершины на стороне стержня улитки (модиолуса), или центрального ядра кохлеарной спирали) и трех рядов с 12 000 «внешних» волосных клеток (см. рис. 9). Когда реснички волосной клетки от клоняются в некотором направлении, включаются электрические импульсы в спиральных ганглиозных нейронах, образующих синаптический контакт с сенсорной клеткой (в случае тормозного синапса частота спонтанного возбуждения может уменьшаться). Аксоны этих нейронов образуют афферентные волокна слухового нерва; их потенциалы действия коллективно переносят двоично кодированную информацию о движении базилярной мембраны в центральную нервную систему.

Важную роль играет расположение афферентных нервных окончаний. В то время как одиночное нервное волокно обычно контактирует лишь с одной внутренней волосной клеткой, тем самым получая сообщения из крайне ограниченной области базилярной мембраны, одиночные афферентные нервные волокна, возбуждающие внешние ряды, имеют контакт с 10-50 сенсорными элементами, занимающими область в несколько миллиметров, и таким образом могут собирать информацию с гораздо более широкой области резонансных частот. Имеются указания на то, что реакцией нейронов, соединенных с волосными клетками внутреннего ряда, является возбуждение, а откликом нейронов, контактирующих с внешним рядом, — торможение [155]. Внутренние волосные клетки реагируют на скорость движения базилярной мембраны, поскольку отклонение ее ресничек пропорционально скорости окружающей эндолимфатической жидкости (сила, действующая на препятствие, погруженное в жидкость, пропорциональна скорости течения жидкости). Внешние волосные клетки, напротив, реагируют на смещение, вероятно, потому, что их реснички жестко присоединены к текториальной мембране (рис. 9) (а силы механического взаимодействия зависят от мгновенного возмущения кохлеарной перегородки); величина отклика претерпевает насыщение при высоких уровнях интенсивности. Тот факт, что около 95 % афферентных волокон слухового нерва оканчивается на внутренних волосных клетках с 10-50 отдельными волокнами, образующими синаптический контакт с каждой клеткой, ясно указывает на главную роль клеток внутреннего ряда как сенсорных рецепторов. В то же время к внешним волосным клеткам присоединяются эфферентные волокна, приносящие нервные импульсы от центральной нервной системы[18]. Этот факт плюс замечательная подвижность внешних волосных клеток, открытая совсем недавно, присваивают последним особую двоякую роль эффекторов и приемников (подробнее мы обсудим это в разд. 3.6). Хотя и ясно, что волосные клетки каждого типа играют свою отдельную роль в преобразовании акустических сигналов, оба типа долж-

ны работать совместно: повреждение внешних волосных клеток серьезно ухудшает слух, даже когда внутренний ряд остается полностью работоспособным. Мы продолжим обсуждение этого вопроса в разд. 3.6; более подробную современную информацию можно найти в книгах [48,179].

При имплантации микроэлектродов в акустически активированные кохлеарные нервные волокна было обнаружено, что данное волокно имеет наинизший порог возбуждения для такой частоты звука f, которая вызывает максимальные колебания в точке х базилярной мембраны (рис. 10), возбуждаемой этим волокном. Эта частота максимального отклика называется характеристической частотой нейрона, или его «наилучшей частотой» [83] (см. также разд. 3.6 и рис. 46).

Вернемся теперь к реальному распределению отдельных импульсов во времени. Измерения показали [184], что максимальная частота возбуждения определяется максимальной скоростью базилярной мембраны, когда она двигается в направлении барабанной лестницы, а уменьшение частоты происходит при ее движении в обратном направлении, в сторону вестибулярной лестницы. Кроме того, мгновенное положение базилярной мембраны оказывает (менее выраженное) возбуждающее или тормозное действие в зависимости от того, в какую сторону отклонена мембрана в данный момент, — в сторону барабанной лестницы или от нее. Сложение этих двух эффектов определяет результирующий отклик. На рис. 24 показано гипотетическое временное распределение нервных импульсов в нервном волокне внутреннего уха, соединенном с соответствующей резонансной областью базилярной мембраны, при возбуждении низкочастотным звуком с трапецевидной формой картины колебаний [184].

При ближайшем рассмотрении этого рисунка видно, каким образом информация о частоте повторения (на самом деле о периоде повторения) исходного звукового сигнала может быть закодирована в форме последовательностей нервных импульсов. Рисунок соответствует идеализированному случаю очень низких частот. На самом деле звуковые частоты обычно выше частоты возбуждения нервных импульсов, так что реальная ситуация соответствует, скорее, такой, в которой интервалы «включено» и «выключено» изобразить труднее из-за их малой протяженности (по сравнению с периодом рефрактерности типичного нейрона) и из-за случайного характера распределения импульсов. Единственное статистически важное свойство состоит в том, что в интервалы «включено» будет попадать больше импульсов, нежели в интервалы «выключено». В результате для чистых тонов интервал времени между последовательными импульсами будет стремиться к величине, кратной периоду звуковых колебаний т [83]. Ясно, что чем выше частота звука, тем менее определенной будет такая группировка.

Схема нервного импульса в слуховом нервном волокне в различных фазах трапецевидной картины колебаний базилярной мембраны

Рис. 24. Схема нервного импульса в слуховом нервном волокне в различных фазах трапецевидной картины колебаний базилярной мембраны

Для частот выше нескольких тысяч герц она исчезает вовсе. Когда некоторые волокна, принимающие стимулы от узкой области базилярной мембраны, объединены в пучок (как это имеет место в слуховом нерве), сумма их импульсов (детектируемая макроэлектродом, имеющим контакт одновременно со многими волокнами) оказывается синхронной со слуховым стимулом. Эти коллективные синхронные нервные сигналы были названы нервными залпами.

2.9. Субъективная высота тона и роль центральной нервной системы

Из предыдущего раздела следует, что нервное волокно слухового нерва способно переносить информацию следующих двух видов:

  • 1. Тот простой факт, что оно возбуждается (или что его спонтанное возбуждение подавляется), означает, что слуховая система получает сооб щение об активации базилярной мембраны в области, иннервируемой этим волокном, или вблизи нее; таким образом пространственное распределение (или «тонотопическая организация») возбуждающихся волокон кодирует информацию о первичной высоте звука3*. Этот процесс происходит во всей области частот, но в случае наложения чистых тонов (а также гармоник сложного тона) реализуется лишь в случае, когда их частоты разделены больше, чем на критическую полосу.
  • 2. Реальное распределение импульсов в данном волокне во времени может переносить информацию о частоте повторения, или периодичности, а также о деталях самой картины колебаний в области, иннервируемой этим волокном (см. ниже). Это имеет место лишь в области низких частот (приблизительно 1500 Гц).

Несомненно, что информация относительно места возбуждения используется слуховой системой на всех уровнях (см. разд. 4.8). А как эта система использует информацию, содержащуюся во временном распределении нервных импульсов, схематически показанном на рис. 24?

Для начала вернемся на минуту к восприятию одиночных чистых (синусоидальных) тонов. Несколько аргументов указывают на тот факт, что временное распределение нервных импульсов не используется при восприятии высоты одиночного чистого тона. Например, из теоретических расчетов следует [151], что если бы первичная высота тона переносилась временными сигналами, то ДПЧ для разрешения частот (рис. 11) не зависел бы от частоты (что на самом деле не так) и, в свою очередь, должен был уменьшаться при увеличении амплитуды стимула (что на самом деле не происходит).

То обстоятельство, что временное распределение в основном игнорируется при восприятии первичной высоты чистых тонов, возможно, не вызовет удивления. Но как обстоит дело с восприятием биений расстроенных консонансов и тона периодичности комплексов гармоник? Трудно найти объяснение существованию биений расстроенных консонансов и других фазочувствительных эффектов, не допуская, что на некоторой стадии некоторый механизм анализирует тонкую временную структуру картины колебаний стимула. В самом деле, мы можем привлечь эффект, показанный на рис. 24, пытаясь объяснить, каким образом могла бы кодироваться информация о картине колебаний и ее изменении (биения второго порядка). Рассмотрим суперпозицию двух тонов, разнесенных на октаву. Предположим, что результирующая картина колебаний имеет вид, показанный в нижней части рис. 18. На базилярной мембране возникнут две резонансные области

38То есть о высоте чистого (одночастотного) тона, резонансная область которого иннервируется данным волокном (частота равна «наилучшей частоте» волокна).

с центрами в точках Xi и Х2, соответствующие двум частотам компонент /1 и /2 = 2/1 (рис. 10). В пучке кохлеарных нервов мы будем иметь два главных фокуса активности с центрами в волокнах с характерными частотами /1 и f2, что приводит к ощущению двух первичных высот, разделенных одной октавой. Однако резонансная область на базилярной мембране довольно широка, и имеет место достаточное перекрытие в области между точками и ;г2; в области перекрытия точки мембраны будут колебаться в соответствии с картиной суперпозиции, каким-то образом связанной с исходным движением барабанной перепонки[19]. Волокна, связанные с областью перекрытия, будут реагировать возбуждениями, группирующимися в интервалах «включено» увеличенной частоты, которые соответствуют убывающим (имеющим отрицательный наклон) частям второго графика на рис. 18. Заметим, что в данном случае интервалы «включено» не имеют одинаковой протяженности, а образуют последовательность с чередованием «короткий-длинный-короткий-длинный». Если бы два тона были разнесены на квинту, картина колебаний в области перекрытия выглядела бы так, как показано на рис. 20, приводя к совершенно иной последовательности интервалов «включено». Периодичность этой последовательности должна, таким образом, содержать информацию о частоте повторения, тогда как структура этой последовательности (своего рода «азбука Морзе») должна давать информацию о картине колебаний. Такая тонкая структура действительно обнаруживается при статистической обработке результатов электрофизиологических измерений.

На рис. 25 показан пример (так называемая гистограмма) распределения временных интервалов между нервными импульсами в волокне слухового нерва [141] для стимула, соответствующего музыкальной квинте, с заданной разностью фаз. Отметим разницу в относительном числе появлений данного интервала (вертикальная ось) между последовательными импульсами (горизонтальная ось). Это представляет уже упоминавшуюся (статистическую) «азбуку Морзе», переносящую информацию о картине колебаний. Чем сложнее исходная картина колебаний и чем выше частота составляющих ее тонов, тем более «размытая» информация будет переноситься последовательностью импульсов и тем труднее будет ее интерпретировать на более высоких уровнях мозга. Подробный анализ временного распределения нервных импульсов потребует работы на некотором уровне, называемом временным автокорреляционным механизмом (впервые предложенным Ликлидером [92]), в котором «цепочка» импульсов сравнивается

с предыдущими такими цепочками, при этом совпадающие картины повторений (подобные периодам, отмеченным на рис. 22, б) усиливаются, а все прочие (непериодические) подавляются.

Интервал между импульсами (мс)

Рис. 25. Гистограмма, изображающая число появлений данного интервала (вертикальная ось) между нервными импульсами в волокне слухового нерва, возбуждаемом суперпозицией двух тонов, образующих квинту, при заданной разности фаз [141]

Временные сигналы участвуют также в работе механизма, ответственного за восприятие пространственной (стерео) локализации звука[20] [42,105]. Такой бинауральный слух должен включать процесс, называемый вре-

менными кросс-корреляциями нервных сигналов от обеих улиток, в котором определяется разность сигналов, получаемых двумя улитками. Имеется физиологическое подтверждение существования такого механизма (расположенного в медиальной верхней оливе, рис. 28). Нейронная модель кросскоррелятора была предложена Ликлидером [92]. В этой модели предполагается, что восходящий нейрон (рис. 26) может возбуждаться, только если его возбуждают одновременно два входящих волокна. Поскольку нервный сигнал распространяется по волокну с конечной скоростью (разд. 2.8), одновременный приход сигналов на окончание данного восходящего нейрона требует некоторой разницы во времени между исходными сигналами в двух улитках. Например, при точной одновременности (нулевой разнице во времени) двух сигналов в улитках возбуждается восходящий нейрон, расположенный точно в центре, поскольку это то место, где встречаются правый и левый сигналы. Если же исходный сигнал сначала воспринимается правым ухом, то его импульс пройдет через среднюю точку раньше, чем он встретится с запаздывающим импульсом от левого уха. Легко понять, что положение у (рис. 26) активированного восходящего нейрона будет зависеть от времени интераурального запаздывания, которое, в свою очередь, зависит от направления приходящего звука.

Нет разницы во времени

К правому уху 1 К левому уху

-------------------------------------------------------------------------------------------I------------------------------------------------------------------------------------------------------

От левой улитки

Рис. 26. Упрощенная модель нервного механизма кросс-корреляции (детектора ин-терауральной разницы во времени) [92]

Схема на рис. 26 представляет сильно упрощенную модель. Подробное изучение и нейроанатомическое исследование верхнего оливарного комплекса (рис. 28) обнаруживают более сложную структуру. В действительности бинауральная информация кодируется в результате сложного вза имодействия возбуждающих и тормозных входных сигналов, связанного с различием во времени прихода (или фазе) и интенсивности стимулов, достигающих двух ушей [51]. Каким бы ни был реальный механизм кросскоррелятора, его временная разрешающая способность поразительна: человек может определять направление источника звука в пространстве на основе интерауральной разницы во времени менее 20 мкс! Это лишь ничтожная доля длительности одного потенциала действия. Необычная иннервация внутренних волосных клеток более чем 20 волокнами, контактирующими с одной-единственной сенсорной клеткой, возможно, требуется для того, чтобы обеспечить согласованное прохождение нервной информации с нужной скоростью [70].

Два тона, разделенные расстроенным интервалом и подаваемые в разные уши, могут «сбить с толку» кросс-коррелятор. Постепенное изменение разности фаз между двумя тонами (см. рис. 18) этот механизм будет интерпретировать как изменение разности времен прихода левого и правого слуховых сигналов, передавая мозгу ощущение о (физически не существующем) циклическом изменении направления звука! Вот почему два чистых тона, образующие расстроенный консонансный интервал и подаваемые через наушники в разные уши, создают жутковатое ощущение источника звука, который «крутится внутри головы» (см. стр. 192).

До сих пор мы обсуждали нервные механизмы, главной целью которых является определение временной структуры звуковой волны, т. е. таких деталей, как максимумы и минимумы волны (рис. 22), положительный и отрицательный наклоны (рис. 18 и 24) и различие во временах прихода (рис. 26). В сущности, такие механизмы анализируют статистическое распределение нервных импульсов (см. рис. 25), передаваемых слуховыми нервами в мозг. В последние десятилетия оставался нерешенным вопрос, является ли такой анализ последовательностей нервных импульсов необходимой гипотезой для объяснения восприятия тона периодичности [177]. Механизм временной автокорреляции с его потенциальной способностью улавливать частоту повторения нервных сигналов действительно мог бы объяснить многие важные психоакустические особенности восприятия высоты тоиа, такие как биения расстроенных консонансов и отслеживание основной частоты, но не все — примером может служить восприятие спектра звукового тона (см. ниже). Если это не временной анализ, то каков механизм, позволяющий нам приписывать одну определенную высоту комплексу гармонических тонов, — даже когда основная частота отсутствует в исходном стимуле? Почему мы вообще воспринимаем тона с частотами, связанными соотношениями (2.7а)-(2.7с), при исполнении мелодии с соответствующими гармоническими комплексами, состоящими из двух тонов?

Здесь мы представим в сильно упрощенном виде некоторые ранние идеи, которые могут привести к объяснению этих эффектов [53,161,176]. «Естественные» звуки звуковой связи, издаваемые людьми и животными, содержат значительную долю гармонических тонов (гласные звуки, пение птиц, призывные крики животных). Такие тона обладают общим свойством. Они представляют суперпозицию гармоник с частотами nfi, кратными основной частоте Д (см. стр. 197). Эти тона образуют сложную резонансную структуру на базилярной мембране со многими пространственными пиками амплитуды, по одному для каждой гармоники (рис. 27, а). Несмотря на свою сложность, эта пространственная структура обладает некоторыми инвариантными характеристиками. Одним из таких инвариантов является определенное соотношение между положениями соседних резонансных максимумов[21]. На рис. 27,6 [117], где представлена более реалистическая модель картины возбуждения для полигармонического тона, показано, как резонансные зоны для высоких гармоник сталкиваются между собой и как локальная временная картина колебаний из-за перекрытия зон приобретает все более сложный вид. Каждая гармоника низкого порядка (п < 7-9) возбуждает определенную область базилярной мембраны (эту структуру должен распознавать пространственный механизм), которая совершает простое периодическое движение на частоте данной гармоники; в этой области фазовые соотношения между гармониками несущественны. Для больших значений п резонансные области становятся неразрешенными, и картина колебаний мембраны становится сложной (эта структура должна распознаваться временным механизмом), зависящей от интенсивностей гармоник и фазовых соотношений между ними.

Мы либо обучаемся в раннем возрасте [161,162], либо обладаем встроенным механизмом [53,176], позволяющим распознавать инвариантные характеристики пространственной картины колебаний, создаваемых сложным тоном, как принадлежащие «одному и тому же объекту». Мы будем называть этот механизм центральным процессором высоты тона. Главная функция этого элемента обработки нервной информации состоит в преобразовании пространственной картины физического возбуждения базилярной мембраны в картину нервной активности таким образом, чтобы все

Положение резонансных областей

(6)

Структура возбуждения

(а) Схема резонансных областей на базилярной мембране, создаваемых сложным тоном,

Рис. 27. (а) Схема резонансных областей на базилярной мембране, создаваемых сложным тоном, (б) Картина возбуждения базилярной мембраны (сверху) и локальной картины колебаний (снизу), полученная компьютерным моделированием [117]

стимулы с одной и той же периодичностью были представлены одинаково. Здесь не рассматривается локальная временная картина колебаний — имеет значение лишь огибающая пространственного распределения вдоль базилярной мембраны. Согласно определению прагматической информации (разд. 1.6), однозначное соответствие между пространственной структурой на входе и нервной активностью в некоторых вполне определенных областях мозга на выходе (разд. 5.6) представляет сенсорную информацию, кото рую мы называем высотой тона. Воспринимается высота основной компоненты fi, которая, как уже упоминалось, обычно наиболее выражена (имеет наибольшую интенсивность) среди важнейших природных звуков окружающей среды, но не обязательно должна присутствовать в исходном тоне, чтобы быть услышанной.

Все это должно работать во многом аналогично распознаванию зрительных образов. Например, когда вы смотрите на символ Щ, он может показаться не имеющим какого-то определенного смысла как цельный объект (ваша интерпретация будет, вероятно, зависеть от пространственной ориентации этого символа и контекста, в котором он был показан). Однако всякий, кто знаком с алфавитом кириллицы, сразу воспримет его как единый объект (букву «ща») независимо от того, как и с какой ориентацией этот объект проектируется в зрительное поле.

Обычно считается, что в нашу центральную систему обработки информации встроены «шаблоны», с которыми сравниваются сложные структуры пространственного возбуждения базилярной мембраны. При соответствии данной структуры шаблону возникает ощущение определенной высоты тона. Этот процесс согласования структуры с шаблоном работает даже тогда, когда доступна лишь часть полной картины возбуждения. Если вместо сложного естественного звука нам предъявляется такой, в котором подавлены некоторые обычно ожидаемые элементы (например, отсутствующая основная частота), то такая усеченная картина возбуждения на базилярной мембране, передаваемая в механизм распознавания процессора высоты тона, все же может быть в конечном итоге согласована, хотя и с некоторыми ограничениями. Здесь мы опять находим много аналогичного распознаванию зрительных образов. Примером может служить наблюдение отсутствующих (но ожидаемых) контуров в следующей надписи:

j'lluslc

Упомянутый процесс согласования происходит, даже когда чередующиеся гармонические компоненты подаются в разные уши [68]. Это, очевидно, означает, что центральный процессор высоты тона должен находиться на некоторой верхней стадии процесса, после того как сформируется сигнал от обеих улиток. Более того, процесс согласования работает, даже если присутствуют только две соседние гармоники сложного тона, как в разд. 2.8. В таком случае, однако, механизм согласования может давать сбой, замыкаясь на одном из нескольких «допустимых» положений.

Упомянутые старые теории восприятия высоты тона ничего не говорят о том, какие основные алгоритмы реализуются процессором высоты тона в нервной системе. В то же время известно, что существуют нейронные сети, вполне способные проводить операции сложения и умножения нервных импульсов, требуемые для реализации необходимых алгоритмов. Теория Терхардта [162] ближе всего подходит к схеме нейронных соединений. Действительно, проводимые там расчеты основаны на изучении некоторой матрицы обучения — аналоговой схемы, которая «учит реагировать»[22] на характерные особенности наиболее часто встречающихся конфигураций (т. е. на соотношения между максимумами входного возбуждения, вызываемого сложным тоном). Мы вернемся к этим теориям позже, когда рассмотрим в явном виде восприятие сложных музыкальных тонов (разд. 4.8 и приложение В), а также консонанс и диссонанс (разд. 5.2).

Наконец, мы не можем исключить возможность использования (по крайней мере частичного) временного распределения нервных импульсов при восприятии высоты сложных тонов. Трудно поверить, что нервная система, всегда настроенная на работу с такой поразительной эффективностью, со многими дублирующими системами, не воспользовалась удобной возможностью использовать информацию в виде «азбуки Морзе» (рис. 24), которая действительно реализуется в периферических каналах передачи слуховой информации! Как мы уже упоминали, следует ожидать, что пространственный механизм определения высоты тона работает в области низких гармоник (где соседние резонансные области четко отделены одна от другой, см. рис. 27), тогда как временной механизм может действовать в области высоких гармоник, где неразрешенные гармоники создают картину колебаний базилярной мембраны, которая приближенно воспроизводит структуру входного звукового сигнала. Некоторые психоакустические эксперименты, по-видимому, требуют для своего объяснения наличия временного анализа. Например, низкочастотные чистые тона очень короткой продолжительности (два или три цикла колебаний) могут давать ощущение чистого тона [107]. Или, если в одно ухо подается звуковой сигнал (белый шум), а в другое — такой же сигнал, но с задержкой т (несколько миллисекунд), то ощущается слабый звук с частотой 1/т [15]. Ни один из этих ре-

зультатов не удается удовлетворительно объяснить в рамках «теории места» (пространственного анализа сигналов). Более подробное сравнение «теории места» с «теорией времени» можно найти в работах [33,93].

Из предыдущего обсуждения ясно одно: восприятие субъективной высоты тона требует, чтобы операции восприятия «высокого порядка» проводились в центральной нервной системе после того, как будет сформирован входной сигнал от обеих улиток. Поэтому мы закончим данный раздел описанием некоторых наиболее существенных деталей слухового пути [23,48]. Это понадобится также для ссылок в последующих разделах. Анатомическое исследование нервных путей и соединений между ними представляет крайне трудную экспериментальную задачу. Нейроны представляют собой клетки, части которых (аксоны или дендриты) могут иметь в длину многие сантиметры; каждый нейрон, особенно в ткани коры, может получать информацию от тысяч клеток, передавая ее сотням других. Почти невозможно определить под микроскопом всю картину связей для данной клетки. Анатомическое исследование этих каналов связи в прошлом проводилось методом окрашивания in vitro (на мозгах трупов). Сегодня возможно изучать процессы в динамике на живых животных с помощью микроэлек-тродной техники, а также на людях с использованием неинвазивных томографических методов функциональной магниторезонансной визуализации и позитронно-эмиссионной томографии, о которых уже кратко упоминалось в разд. 1.5.

Неинвазивные методы с внешними электродами в электроэнцефалографии или с маленькими сквид-магнитометрами в магнитоэнцефалографии, хотя и дают информацию об активности мозга, усредненную по областям сантиметрового размера, обладают преимуществом быстродействия, что позволяет изучать процессы на временных масштабах, измеряемых миллисекундами. Эти методы очень полезны при изучении участков поверхности коры (расположенных непосредственно под черепом), однако они малопригодны для изучения слуховых путей, которые глубоко запрятаны в мозговом стволе (магнитоэнцефалографические наблюдения можно проводить через рот, что требует наличия смелых добровольцев). Сейчас эта проблема преодолена благодаря томографическим методам динамического функционального магнитного резонанса и позитронно-эмиссионной томографии. Первый из этих методов показывает увеличение потока крови и окисления, последний дает нестационарную картину нервной активности [106] в областях миллиметрового размера на протяжении нескольких секунд и более. При этом, однако, необходимо вносить поправки на сердцебиение (каждое изображение должно быть снято в определенной фазе сердечного цикла), а для слухового канала положение усложняется неустранимым значительным шумом используемого оборудования (шумом системы охлаждения, шумом магнитострикции), который зачастую смешивается с измеряемым сигналом.

На рис. 28 представлена схема афферентного (входящего) слухового пути от улитки к слуховой области в виде карты потоков. Показаны каналы передачи информации и релейные станции обработки без какого-либо соответствия масштабам реальной архитектоники мозга. Спиральный нервный узел представляет нервную сеть в улитке, первый пункт обработки информации на этом пути. Именно здесь нейроны, контактирующие с внутренними и внешними рядами волосных клеток, получают первую возможность взаимодействовать, определяя пространственно-временное распределение активности слухового нерва (восьмого черепного нерва), который переносит эту информацию в мозг. Следующий пункт обработки, расположенный в продолговатом мозге, содержит кохлеарное ядро, состоящее из трех подразделений, сложная структура которых определяет первые шаги в решении задач разрешения и дискриминации звука. Отсюда нервная информация передается в три главных пучка. Один из них непосредственно переходит на противоположную сторону и входит в латеральную петлю — главный канал, идущий через мозговой ствол (варолиев мост). Некоторые волокна оканчиваются в ретикулярной формации, диффузной сети в мозговом стволе, которая играет роль главного мозгового «щита управления»[23]. Другой пучок (трапецевидное тело) посылает волокна от вентрального кохлеарного ядра к важным релейным станциям обработки — латеральной и медиальной верхним оливам. Медиальная верхняя олива представляет первый внутренний центр смешивания слуховых сигналов. Именно здесь кросс-коррелятор (рис. 26) может выдавать информацию, необходимую для локализации источника звука и ощущения биений расстроенных консонансов [42]. Наконец, третий промежуточный пучок ведет от вентрального кохлеарного ядра к противоположному оливарному комплексу.

Три верхние ступени на рис. 28 включают нижний бугорок, медиальное коленчатое тело и, наконец, первичные области слуховой коры (извилина Хешля в височных долях). Некоторые волокна связаны с верхним бугорком, который также иннервирован зрительными путями, что означа-

Карта потоков нервных сигналов в слуховом пути от одного уха к слуховым областям коры через мозговой ствол

Рис. 28. Карта потоков нервных сигналов в слуховом пути от одного уха к слуховым областям коры через мозговой ствол

ет наличие внутрисенсорной связи уже на уровне подкорки. Это может давать вклад в синестетические эффекты вроде зрительных иллюзий при восприятии некоторых звуков (например, ощущение цвета при слушании музыки), либо слуховых иллюзий при рассматривании ярких изображений (например, ощущение звуков при наблюдении полярного сияния). Отметим наличие на этих стадиях межсоединений с противоположными путями и другими сенсорными путями и мозговыми центрами.

На рис. 28 не показана сеть эфферентных волокон, которые переносят информацию с верхних уровней на более нижние и оканчиваются в улитке. Эта система играет важную роль в управлении входящей афферентной информацией. Нижний тракт эфферентной сети, оливокохлеарный пучок, может участвовать в процессе возникновения шероховатости звука (стр. 185). Хотя каждой улитки достигают только приблизительно 1 600 эфферентных волокон, волокна увеличенного размера обильно иннервируют наружные волосные клетки и таким образом осуществляют центральное управление механической (подвижностью) и/или электрической активностью последних (см. разд. 3.6).

Наконец, отметим некоторые общие положения, которые могут пригодиться в последующих разделах. На начальных ступенях слуховой системы (в кохлеарном ядре) существует весьма специфическое геометрическое соответствие между активированными нервными волокнами и пространственным положением звукового стимула (резонансных областей) на базилярной мембране. Однако при продвижении вверх это топологическое соответствие постепенно теряется (исключение составляет состояние анестезии). Число участвующих нейронов многократно увеличивается, реакция нервной системы в большей степени отражает сложную структуру звукового сигнала, и обратная связь с верхними уровнями оказывает все большее влияние на поведение и характеристики индивидуума. Это подтверждается результатами функциональной магниторезонансной визуализации, полученными на различных уровнях слухового пути. Например, измерение изменения сигналов нервной активности при подаче 30-секундного шумового сигнала на одно ухо (рис. 29 [97]) показывает, что активность нижнего бугорка (см. рис. 28) остается почти постоянной, с определенной скоростью нарастания и спада при включении и выключении сигнала. Выше, в медиальном коленчатом теле, уже появляется заметное изменение во время действия шума, что указывает на некоторое влияние информации обратной связи, поступающей от других мозговых центров. На уровне коры (извилина Хешля и верхняя височная извилина) ясно видна реакция на включение и выключение сигнала (сначала «появился шум!», затем «шум прекратился!»). Контралатеральные (т. е. перекрещивающиеся) каналы являются «лучшими» переносчиками информации, нежели ипсилатеральные каналы (проходящие по той же стороне), — если в разные уши подается взаимно конфликтующая информация, то контралатеральный канал стремится отвергнуть информацию, доставляемую в данное полушарие ипсилатеральным каналом [101].

(а) Нижний бугорок

(о) Медиальное коленчатое тело

  • (в) Извилина Хешля
  • (г) Верхняя височная извилина
Отклик нервной системы на различных афферентных уровнях на 30-секунд-ный шумовой сигнал, подаваемый в ухо [97]

Рис. 29. Отклик нервной системы на различных афферентных уровнях на 30-секунд-ный шумовой сигнал, подаваемый в ухо [97]. (а) Нижний бугорок, (б) Медиальное коленчатое тело, (в) Извилина Хешля. (г) Верхняя височная извилина

На уровне нижнего бугорка всегда имеет место хорошее разрешение по частоте, интенсивности и направлению звука, благодаря чему возникает селективный отклик при вариациях частоты вверх-вниз. Рефлексы действуют, но на этом уровне нет проявлений сознательного восприятия звука, как показали эксперименты с ампутацией. На уровне медиального коленчатого тела (и, вероятно, верхнего бугорка) уже имеется возможность распознавания некоторых структур. Здесь существует информация о том, где находится данный источник звука и как он перемещается в пространстве и времени. Происходит первая интеграция с информацией от других органов чувств.

Последняя стадия обработки входной информации производится в слуховой области извилины Хешля. Отсюда информация распределяется по другим мозговым центрам, где она анализируется, интегрируется в полные познавательные функции мозга и запоминается (или отбрасывается за ненадобностью). Основную роль в глобальной обработке информации, особенно с учетом замечательной специализации двух полушарий мозга, уже упоминавшейся в разд. 1.5, играет мозолистое тело — гигантская спайка из 200 миллионов волокон, соединяющих полушария. Мы вернемся к этой теме в разд. 5.7.

3. Звуковые волны, акустическая энергия

и восприятие громкости

В предыдущем разделе мы изучали простые гармонические колебания и их субъективное восприятие, не интересуясь, каким образом они достигают уха. Мы обращались к экспериментам, в которых источник звука (наушник) был расположен очень близко к барабанной перепонке. В этом разделе мы обсудим процесс распространения звуковой энергии от отдаленного источника к слушателю и выясним, как этот поток акустической энергии определяет ощущение громкости. В заключение раздела мы еще раз, подробнее, рассмотрим работу улитки — этого электромеханического чуда.

3.1. Упругие волны, сила, энергия и мощность

Когда звук распространяется в среде, точки среды совершают колебания. В отсутствие звука и других возмущений каждая точка среды[24] будет находиться в покое и оставаться в этом состоянии, пока мы не подействуем на среду каким-либо образом. Пространственное положение данной точки в невозмущенной среде называется положением равновесия этой точки.

Звуковые волны представляют частный случай так называемых упругих волн. Всякий раз, когда мы создаем внезапную деформацию в данном месте среды (например, когда молоточек ударяет по струне рояля или когда мы внезапно вызываем смещение воздуха, заставляя двигаться трость

в кларнете), возникающие упругие силы приводят в движение точки среды вблизи начальной деформации. Эти точки, в свою очередь, будут посредством упругих сил тянуть или толкать соседние точки, передавая им приказ начать движение, и т. д. Такая «цепная реакция» представляет упругую волну, распространяющуюся от места начального возмущения. При этом распространяется не вещество, а энергия, которая необходима, чтобы приводить в движение каждую точку, до которой доходит волна. Звуковые волны, представляющие интерес для музыки, — это упругие волны, в которых точки среды совершают периодическое движение (разд. 2.1). Совершая колебания, каждая точка среды всегда остается очень-очень близко к положению равновесия. Звуковая волна распространяется с определенной скоростью от источника по прямой линии, пока не поглотится или отразится. Особенности распространения, отражения и поглощения звуковых волн определяют акустические качества концертного зала или другого помещения.

Мы упомянули понятия силы и энергии. Теперь мы должны придать им точный физический смысл. Каждый имеет интуитивное представление о силе как мышечном усилии, которое мы должны приложить, чтобы изменить форму тела, чтобы привести объект в движение, чтобы удержать в руках тяжелый предмет, чтобы замедлить движение, и т. д. Но физика не удовлетворяется интуитивными понятиями. Мы должны дать ясное определение силы, а также «рецепт», указывающий, как ее измерить. И определение, и рецепт должны быть основаны на определенных экспериментах, результаты которых обобщаются и формулируются в виде физического закона.

В нашей повседневной практике для изменения формы тела мы должны сделать с ним нечто совершенно специфическое: мы должны «приложить к нему силу». Деформация, т. е. изменение формы, — не единственное возможное воздействие силы, действующей на тело. В самом деле, наш повседневный опыт показывает, что силу необходимо приложить и для того, чтобы изменить состояние движения тела. Вообще, было найдено, что ускорение а тела, представляющее быстроту изменения его скорости под действием данной силы F, пропорционально величине силе. Или наоборот, сила пропорциональна производимому ею ускорению: F = та. Это соотношение называется уравнением Ньютона. Коэффициент пропорциональности т называется массой тела. Масса представляет меру «инерции» тела, или его «сопротивление» изменению движения. Если на тело действует более одной силы, то результирующее ускорение будет определяться суммой всех сил. Эта сумма может быть равна нулю, в таком случае действующие силы находятся в равновесии между собой.

За единицу силы выбрана такая сила, которая необходима для сообщения телу массой 1 кг ускорения 1 м/с2 (т. е. для увеличения его скорости на один метр в секунду за каждую секунду). Эта единица силы получила название ньютон. Один ньютон равен силе 0,225 фунтов. Фунт как единица силы (веса) до сих пор используется в США. Поскольку ускорение силы тяжести равно 9,8 м/с2, вес тела массой 1 кг оказывается равным 9,8 ньютон (— 2,2 фунта). Мы можем измерять силу, определяя ускорение, которое она сообщает телу данной массы, или уравновешивая ее (т. е. устраняя ее действие) известной силой, например, натяжением градуированной пружины[25].

Во многих физических ситуациях данная сила «распределяется» по некоторой протяженной поверхности тела. Например, в высоко летящем самолете с герметизированной кабиной воздух, находящийся внутри, действует со значительной силой F, направленной наружу, на каждое окно (как и на любую другую часть корпуса), и эта сила пропорциональна площади окна S. Отношение р — F/S представляет давление воздуха внутри кабины. В общем случае мы определим давление воздуха как отношение силы к площади поверхности, отделяющей воздух от вакуума. Если вместо вакуума с другой стороны поверхности имеется другое давление р', сила F, действующая на поверхность S, будет равна

F = (p-p')5. (7)

Всё это очень важно для музыки. Звуковые волны в воздухе — это колебания давления воздуха. Так, если в формуле (7) S соответствует площади барабанной перепонки, р' — давлению (постоянному) во внутреннем ухе, ар- колеблющемуся давлению в слуховом проходе (рис. 8), то величина F будет представлять переменную силу, действующую на барабанную перепонку, приводящую ее в движение и, тем самым, ответственную за движение цепочки слуховых косточек в среднем ухе.

Давление измеряется в ньютонах на квадратный метр, или паскалях. Нормальное атмосферное давление на уровне моря составляет приблизительно 100 000 ньютон/м2 (= 1000 гектопаскалей). В Соединенных Штатах более привычной единицей является фунт на квадратный дюйм (например, в этих величинах обычно выражается избыточное давление в автомобильных шинах). Если перевести ньютоны в фунты, а квадратные метры в квадратные дюймы, мы получим 1 ньютон/м2 = 0,00015 фунт/кв. дюйм. Нормальное давление воздуха на уровне моря составляет, таким образом, 15 фунт/кв. дюйм.

Вернемся теперь к понятию энергии. Мы опять имеем некоторую интуитивную идею, однако наша интуиция в данном случае легко может обмануть. Например, кое-кто может сказать: «нужно много энергии, чтобы долго

держать тяжелый мешок», однако с точки зрения физика никакой энергии для этого не требуется (если только не поднимать и не опускать этот мешок). Но с точки зрения физиолога необходим постоянный приток химической энергии к мускулам, чтобы поддерживать непрерывное состояние сокращения мышечных волокон. Чтобы избежать путаницы, необходимо ввести более строгое, количественное понятие энергии.

Для решения практических задач физики одного понятия силы не достаточно. Например, мы должны знать, как долго или на каком пути действовала данная постоянная сила, если хотим определить, например, конечную скорость, приобретенную телом, ускоряемым данной силой (даже самая большая сила может произвести лишь малый конечный эффект, если время воздействия силы или путь, на котором она действует, очень коротки). Фактически для определения заданного изменения скорости материальной точки, на которую действует постоянная сила F, от нуля до некоторого значения v существенно произведение силы на расстояние, пройденное в направлении силы. Если обозначить это расстояние через х, то, как можно математически показать, исходя из уравнения Ньютона, Fx = mv2/2. Произведение Fx называется работой и считается положительным, когда перемещение х происходит в направлении силы F. Величина mv2/2 называется кинетической энергией тела с массой т. Если произведение Fx положительно, мы интерпретируем приведенное выше соотношение следующим образом: работа силы увеличивает кинетическую энергию тела, или, что то же самое, над системой совершается работа, увеличивающая кинетическую энергию системы от нуля до xnv2/2.

Единицей работы и кинетической энергии служит ньютон х метр. Эта единица носит название джоуль (Дж) в честь английского физика и инженера Джеймса Джоуля. Тело с массой 1 кг, движущееся со скоростью 1 м/с, обладает кинетической энергией 0,5 Дж. При движении с вдвое большей скоростью его кинетическая энергия будет вчетверо больше, 2 Дж. Средний человек (70 кг), бегущий со скоростью 3 м/с (6,75 миль в час), обладает кинетической энергией 315 Дж, автомобиль массой 2 000 кг, едущий со скоростью 30 м/с (67,5 миль в час), будет иметь кинетическую энергию 900 000 Дж.

Энергия может появляться не только в форме кинетической энергии. Рассмотрим тело, прикрепленное к пружине. Чтобы сжать пружину, мы должны совершить некоторую работу. Если делать это очень-очень медленно, практически никакой кинетической энергии при этом не возникнет. Вместо этого произведенная работа превратится в потенциальную энергию, которая в данном случае представляет упругую потенциальную энергию тела, присоединенного к сжатой пружине. Если отпустить пружину, тело будет ускоряться силой разжимающейся пружины, и потенциальная энергия будет превращаться в кинетическую энергию. Можно сказать, что потенциальная энергия — это энергия положения тела, а кинетическая энергия — энергия движения тела.

Сумма потенциальной и кинетической энергий тела называется его полной механической энергией (существуют и многие другие формы энергии, которые мы не будем рассматривать: тепловая, химическая, электромагнитная и т.д.). Важное значение имеют случаи, когда механическая энергия остается постоянной. В «музыкальном отношении» важен случай предыдущего примера тела, прикрепленного к пружине и совершающего колебания взад-вперед под действием упругой силы пружины. Можно показать, что результирующее колебание вокруг положения равновесия является гармоническим (при условии, что амплитуда остается малой). В момент освобождения растянутой пружины начальная кинетическая энергия тела равна нулю. Однако оно обладает начальной упругой потенциальной энергией, которая с началом колебаний превращается в кинетическую энергию. Всякий раз, когда тело проходит через свое положение равновесия, мгновенное значение упругой потенциальной энергии становится равным нулю, а кинетическая энергия принимает максимальное значение. В процессе гармонического колебания происходит превращение потенциальной энергии в кинетическую и обратно.

Полная механическая энергия остается постоянной при отсутствии диссипативных сил. Трение приводит к постепенному уменьшению полной энергии и, следовательно, амплитуды колебаний. Такое движение называется затухающими колебаниями. Оно играет крайне важную роль в музыке. В самом деле, многие музыкальные инструменты генерируют затухающие колебания, типичным примером может служить колеблющаяся струна рояля. Действие других внешних сил может приводить к постепенному увеличению механической энергии. Такие силы можно использовать для компенсации диссипативных потерь и поддержания, таким образом, постоянной амплитуды колебаний. Типичный пример — скрипичная струна, возбуждаемая смычком: возникающие при этом силы передают энергию колеблющейся струне со скоростью, равной скорости потери энергии на трение и излучение звука (разд. 4.2).

Теперь мы приходим к последнему, но наиболее важному пункту, касающемуся энергии. Машины (и люди) производят энергию с определенной быстротой. Всякая машина (или человек) может произвести почти любое количество энергии — только для этого понадобится очень долгое время! Что в действительности определяет качество, или мощность машины, так это быстрота, с которой она может производить энергию (т. е. совершать работу). Эта быстрота, если она постоянна, определяется соотношением

совершенная работа ру затраченное время ?2 — ti

(8)

Здесь W есть работа, совершенная между моментами времени р и <2, величина Р называется механической мощностью. Мощность измеряется в единицах Дж/с, эта единица носит название ватт (Вт) (в честь другого английского инженера Джеймса Уатта). Когда вы поднимаетесь по лестнице, ваше тело развивает мощность 300 Вт; электрическая энергия, потребляемая за секунду электроутюгом, составляет примерно 1 000 Вт; максимальная мощность, развиваемая мотором небольшого легкового автомобиля, равна приблизительно 30 кВт (1 лошадиная сила = 0,735 кВт). Тромбон при игре фортиссимо излучает полную акустическую мощность 6 Вт.

Понятие мощности играет наиболее важную роль в физике музыки. В самом деле, наше ухо вовсе не интересует, какова полная акустическая энергия, достигающая барабанной перепонки, — оно чувствительно к быстроте поступления этой энергии, т. е. к акустической мощности. Именно эта величина определяет ощущение громкости.

3.2. Скорость распространения, длина волны и акустическая мощность

После небольшой экскурсии в область чистой физики, совершенной нами в предыдущем разделе, мы лучше подготовлены к пониманию явления распространения волн. Для этого нам нужно иметь модель среды. Мы будем считать, что среда состоит из малых тел заданной массы, связанных между собой сжатыми пружинами (имитирующими упругие силы). Первоначально силы, создаваемые пружинами, взаимно уравновешены, и все точки среды находятся в покое. На рис. 30 показана ситуация, когда точка Р внезапно смещается вправо на расстояние х.

Пружина с нормальным сжатием

Пружина с уменьшенным сжатием

Пружина с увеличенным сжатием

Пружина с нормальным сжатием

S Q PR Т

Равновесие

Результирующая сила, действующая на точку Q

Равновесие

Результирующая Результирующая сила, действующая сила, действующая на точку Р на точку R

Рис. 30. Одномерная модель упругой среды (сжатые пружины), в которой точка Р смещена в продольном направлении

Рассматривая силы на рис. 30, видим, что на точки Q и R, которые первоначально покоятся в соответствующих положениях равновесия, действует результирующая сила, направленная вправо. Другими словами, в соответствии с уравнением Ньютона они ускоряются вправо и начинают двигаться в том же направлении, в котором была вначале смещена точка Р. Эта точка, двигаясь обратно к своему положению равновесия, ускоряется результирующей силой, действующей на нее влево (рис. 30). Спустя короткое время, когда точки Q и R двигаются вправо, сжатие пружины между точками RhT начинает увеличиваться, а пружины между точками Q и S — уменьшаться. Легко видеть, что на точки S и Т начинает действовать результирующая сила, направленная вправо, которая, в свою очередь, начинает смещать их вправо, при этом точки Q и R, могут уже возвращаться влево. Этот процесс происходит снова и снова, смещаясь от точки к точке и представляя распространение волны в обе стороны от точки Р. «Фронт» волны есть не что иное как передаваемый от точки к точке приказ: «Начинай двигаться вправо». Этот приказ отдается сжатыми пружинами (их упругими силами). При этом не происходит направленного переноса вещества. Мы называем этот случай продольной волной, поскольку смещения точек происходят параллельно направлению распространению волны. В реальном случае звуковой волны, распространяющейся в воздухе, совместное действие пружин на точки P.Q, R,... приблизительно соответствует давлению воздуха; изменение этих сил (т. е. изменение расстояний между точками) соответствует вариациям давления воздуха в звуковой волне.

Одномерная модель на рис. 30 показывает также, как происходит перенос энергии в упругой волне. Прежде всего, необходимо совершить работу «извне», чтобы создать начальное смещение Ху точки Р, поскольку мы должны изменить длины двух пружин PQ, PR. Другими словами, нам нужен источник энергии. В данном случае начальная энергия выступает в форме потенциальной энергии (энергии положения) точки Р. Затем точки справа и слева от точки Р начинают двигаться, а длины соответствующих пружин — изменяться. Все эти процессы включают как кинетическую энергию (движение точек), так и потенциальную (сжатие или растяжение пружин). Энергия, первоначально сообщенная точке Р, по мере распространения волны переносится от одной точки среды к другой — мы имеем поток, или перенос энергии от источника.

Обратимся теперь к случаю, когда пружины в модели не сжаты, а растянуты, так что соседние точки притягиваются одна к другой. Физически это соответствует натянутой скрипичной струне. Для продольных смещений (вдоль пружин) получается качественно такая же картина, как и прежде, только все силы, показанные на рис. 30, теперь изменяют направление на противоположное. Но теперь появляется совершенно новая возможность, отсутствовавшая в случае сжатых пружин: мы можем сместить точку Р перпендикулярно к направлению х (рис. 31) и получить волну другого типа. Поскольку все пружины теперь тянут точки к себе, результирующая сила Fp на рис. 31 будет сообщать точке Р ускорение, направленное вниз к положению равновесия О. Точки Q и R, в свою очередь, будут под действием результирующих сил ускоряться вверх, в направлении, перпендикулярном к смещению х. Это движение представляет поперечную упругую волну, распространяющуюся вправо и влево от точки Р. В поперечной волне смещения точек перпендикулярны к направлению распространения. В растянутой среде вроде скрипичной струны могут одновременно распространяться две моды упругой волны — поперечная и продольная.

Одномерная модель упругой среды (растянутые пружины), в которой точка Р смещается в поперечном направлении

Рис. 31. Одномерная модель упругой среды (растянутые пружины), в которой точка Р смещается в поперечном направлении

Теперь найдем скорость распространения поперечных волн. Применяя закон Ньютона к отдельным точкам одномерной модели на рис. 31, можно показать, что для струны с натяжением Т (выраженным в ньютонах) скорость Vt поперечных упругих волн имеет вид

Vt = (м/с), (9)

где d — линейная плотность среды, т. е. масса, приходящаяся на единицу длины (в кг/м). Заметим, что чем сильнее натянута струна, тем быстрее распространяются поперечные волны. С другой стороны, чем больше ее плотность, тем медленнее распространяются волны.

Физически эквивалентное соотношение существует для скорости распространения продольных волн в среде с объемной плотностью <5 (в кг/м3), давление в которой равно р (в ньютон/м2):

П = (м/с). (10)

Для идеального газа отношение р/6 оказывается пропорциональным абсолютной температуре t^, выражаемой в градусах Цельсия или Фаренгейта tc и tp с помощью простого преобразования

tA = 273 + tc = 273 + - 32) (градусы Кельвина). (11)

Заметим, что в точке замерзания воды (tc = О °C, tp = 32 °F) абсолютная температура равна = 273°. Хотя обычный воздух не является 100-процентным идеальным газом, с некоторым приближением можно считать его таковым, и тогда скорость звуковых волн в воздухе определяется формулой

VL = 20,17*7 (м/с). (12)

Эта формула дает значение 331,5 м/с (= 1087 фут/с) при 0 °C (32 °F) и 344 м/с (= 1130 фут/с) при 21 °C (70 °F). Численный множитель в формуле (12) относится только к воздуху. В общем случае его значение зависит от состава среды, в которой распространяется звук. Например, для чистого водорода он равен 74,0, так что в водороде звук распространяется почти вчетверо быстрее, чем в воздухе. Это приводит к забавному звуковому эффекту, когда человек разговаривает или поет после вдыхания водорода (менее рискованный эксперимент проводился с гелием, для которого численный коэффициент в формуле (12) приблизительно равен 35).

Звук распространяется быстро, но не бесконечно быстро. Это, например, приводит к малой, но заметной разнице времен прихода звуковых волн от разных инструментов в большом оркестре и может вызвать серьезные проблемы с синхронизацией ритма. Пианист, впервые играющий на очень большом органе, у которого пульт расположен далеко от большинства труб, вначале может оказаться в полной растерянности из-за запаздывания звука, не синхронизованного с движениями его пальцев. Реверберация в зале представляет собой наложение запаздывающих звуковых волн, претерпевших многократные отражения от стен (разд. 4.7).

Рассмотрим теперь очень длинную струну, начальная точка которой приведена в простое гармоническое движение и продолжает бесконечно колебаться под действием некоторой внешней силы. Спустя некоторое время колебаться будут все точки струны, совершая такое же простое гармоническое движение. Если в какой-то момент времени начальная точка находится, скажем, в положении наибольшего смещения, соседние точки еще не дойдут до такого положения или, наоборот, уже пройдут через него, и т. д. На рис. 32 показаны поперечные смещения всех точек струны в данный момент времени. Кривая, изображенная на графике, представляет собой

«моментальный снимок» формы струны при прохождении синусоидальной поперечной волны. График на рис. 32 не следует путать с кривой, показанной на рис. 6, где представлена временная история лишь одной данной точки. Последняя показывает картину колебаний во времени, тогда как на рис. 32 показана картина волны в пространстве. Кратчайшее расстояние между двумя точками струны, колеблющимися параллельным образом (колеблющимися в фазе, т. е. имеющими одинаковые смещения у в каждый момент времени), называется длиной волны. Длина волны обычно обозначается греческой буквой Л (ламбда). Длину волны можно определить также как минимальный пространственный интервал, после которого пространственная картина волны повторяется. Сравните это с определением периода, который представляет минимальный временной интервал, после которого повторяется картина колебаний одной данной точки (рис. 5,6).

Мгновенная картина смещений у струны при распространении вдоль нее одночастотной поперечной волны в направлении х

Рис. 32. Мгновенная картина смещений у струны при распространении вдоль нее одночастотной поперечной волны в направлении х

С течением времени моментальная кривая движется вправо со скоростью волны (рис. 33), тем не менее каждая точка струны (например, точка Xi на рис. 33) совершает движение лишь вверх-вниз. Вправо перемещается конфигурация, т. е. форма струны, но не сама струна. Другими словами, вправо смещается некоторое свойство, например, свойство «находиться в положении максимального смещения» (точки Р, Q, R на рис. 33) или «только что пройти через положение равновесия» (точки S, Т, 17). И, конечно, вправо перемещается энергия, потенциальная и кинетическая энергия колебаний вверх-вниз точек струны.

Три последовательные мгновенные картины поперечной волны в моменты времени ti, tz, Точки струны смещаются лишь вверх и вниз

Рис. 33. Три последовательные мгновенные картины поперечной волны в моменты времени ti, tz, Точки струны смещаются лишь вверх и вниз (в направлении ?/); вправо, вдоль оси х, перемещается профиль (картина) волны (а также энергия волны)

Существует важное соотношение между скоростью V синусоидальной волны, ее длиной А и частотой f колебаний отдельных точек. Из рис. 32 видно, что волна перемещается точно на одну длину волны А за время, которое требуется начальной (или любой другой) точке, чтобы совершить одно полное колебание, т. е. за один период т. Поэтому для скорости волны можно написать следующую формулу:

пройденное расстояние д

затраченное время т

Поскольку обратная величина периода равно частоте f (см. соотношение (1)), можно также написать

V = А/. (13)

Эта формула устанавливает количественную связь между «пространственным представлением» (рис. 32) и «временным представлением» (рис. 6). Соотношение (13) позволяет выразить длину волны поперечной волны в струне через частоту колебаний отдельных точек и скорость распространения (9):

А=?Д (14)

Интересно отметить, что соотношения (9) и (14) в определенной степени применимы к базилярной мембране, если заменить Т соответствующим параметром жесткости. Поскольку от основания к вершине жесткость уменьшается примерно в 10 000 раз (стр. 208), локальная скорость распространения и длина волн данной частоты в базилярной мембране в соответствии с формулами (9) и (14) будут уменьшаться в 100 раз по мере продвижения к вершине. Резонансная частота базилярной мембраны также пропорциональна квадратному корню из параметра жесткости. Из энергетических соображений следует, что при распространении волны ее амплитуда будет расти (энергия «накапливается», потому что волна замедляется). Когда волна достигает резонансной области, ее амплитуда достигает максимума, и диссипация энергии становится наибольшей, из-за чего волна быстро сходит на нет за пределами этой области. На рис. 34 схематически показано, как распространяется по базилярной мембране волна, создаваемая одночастотным тоном. Можно ожидать, что при попадании в ухо двух или более чистых тонов (как в случае реальных музыкальных тонов) будут возникать отдельные «волновые пакеты» (один такой показан на рисунке), определяющие различные резонансные области, по одной для каждой частоты (см. рис. 27 и 28). Это в сверхупрощенной форме объясняет, как работает механизм гидромеханического анализа частот. Напомним, что на рис. 34 представлена поперечная волна, в которой отдельные точки совершают колебания вверх-вниз, но картина самой волны (и связанная с ней энергия) распространяется слева направо, при этом амплитуды отдельных колебаний остаются заключенными внутри огибающей волны. Отметим уменьшение длины волны по мере приближения волны к резонансному максимуму. Все точки базилярной мембраны, в том числе и те, которые находятся вне резонансной области, колеблются с одной и той же частотой, равной частоте исходного чистого тона. И, наконец, если мы сдвигаем частоту этого тона вверх или вниз, полная картина, представленная на рис. 34, будет смещаться, соответственно, к основанию или к вершине[26].

В случае продольных волн, подобных звуковой волне в воздухе, точки совершают колебания в направлении, параллельном направлению распространения волны, и не так просто наглядно представить их положения. Поэтому звуковые волны удобнее представлять как колебания давления. На рис. 35 показаны смещения точек одномерной модели среды при прохождении через нее продольной волны.

Схема волны, генерируемой одночастотным тоном и бегущей вдоль базилярной мембраны. Сплошная кривая

Рис. 34. Схема волны, генерируемой одночастотным тоном и бегущей вдоль базилярной мембраны. Сплошная кривая: мгновенная картина поперечных смещений мембраны (показано без соблюдения масштаба!). Представьте мысленно эту кривую, ограниченную прерывистыми линиями, бегущей вправо и замедляющейся, когда ее амплитуда справа спадает до нуля. Прерывистая кривая: Огибающая амплитуды (которая остается постоянной, пока не изменятся частота и/или амплитуда предъявляемого тона)

Нулевое смещение^

Минимальное давление

Максимальное смещение Давление не меняется

Р

1 Нулевое смещение Максимальное

давление

Рис. 35. Продольная волна в одномерной среде. Чтобы показать реальные смещения, каждая точка изображена в виде груза маятника

Заметим, что точки обнаруживают наибольшее сгущение (т. е. максимальное давление) и наибольшее разрежение (минимальное давление) в тех местах, где их смещение равно нулю (это, соответственно, точки Р и Q). В тех же местах, где смещения максимальны, обращаются в нуль вариации давления. Это означает, что колебания давления в звуковой волне сдвинуты по фазе на 90° относительно колебаний точек: максимальное изменение давления (повышение или понижение) происходит в местах, где смещения точек равны нулю, и наоборот, максимальные смещения точек возникают там, где вариации давления равны нулю.

В синусоидальной звуковой волне давление в каждой точке совершает гармонические колебания относительно нормального (невозмущенного) значения (рис. 36). В точке типа А все точки среды ближе всего подходят одна к другой (максимальное повышение давления, соответствующее точкам Р на рис. 35); в точке типа В они отодвигаются одна от другой (максимальное понижение давления, соответствующее точкам Q на рис. 35). Среднее изменение давления Др равно амплитуде вариаций давления, деленной на /2 (= 1,41). С учетом соотношений (12) и (13) получаем для длины синусоидальной звуковой волны в воздухе

  • 20,1
  • (15)

где — абсолютная температура, определяемая соотношениями (11). Типичные значения длин волн при нормальной температуре приведены на рис. 37.

Нормальное атмосферное давление

Изменения давления в данный момент времени t для одночастотной звуковой волны, распространяющейся в направлении х

Рис. 36. Изменения давления в данный момент времени t для одночастотной звуковой волны, распространяющейся в направлении х

Упругие волны могут переходить из одной среды в другую, например, из воздуха в воду, из воздуха в стену и обратно в воздух, из струны в деревянный корпус скрипки, а оттуда в окружающий воздух. При каждом таком переходе природа волны может меняться (например, поперечная волна в струне и корпусе превращается в продольную звуковую волну в воздухе). Однако при каждом переходе частота волны остается неизменной. В то же время длина волны будет меняться в соответствии с соотношени-

Длина звуковой волны в воздухе при нормальной температуре как функция частоты (логарифмическая шкала)

Рис. 37. Длина звуковой волны в воздухе при нормальной температуре как функция частоты (логарифмическая шкала)

ем (13) Л = V//. Здесь скорость V меняется от среды к среде, тогда как частота / определяется исключительно начальным колебанием (источником).

Когда упругая волна наталкивается на границу между двумя средами, часть ее отражается обратно в исходную среду. Некоторые границы являются почти идеальными отражателями (например, таковы гладкая цементная стена по отношению к звуковым волнам или закрепленные концевые точки натянутой струны по отношению к поперечным волнам). Это явление связано с тем фактом, что точки среды на отражающей границе вынуждены оставаться в покое, нарушая, тем самым, баланс упругих сил, «управляющий» распространением волны. При отражении частота также остается неизменной, тогда как направление распространения при нормальном па дении меняется на противоположное (или, в общем случае, отражается под углом, равным углу падения). Амплитуда при этом также остается прежней, если нет поглощения.

В заключение этого раздела рассмотрим поток энергии, связанный со звуковой волной. Мы определим его как количество полной механической энергии (потенциальной и кинетической, связанной с упругими колебаниями точек среды), которое переносится за каждую секунду через поверхность единичной площади (1 м2), перпендикулярную направлению распространения (рис. 38). Поток энергии выражается в джоулях на квадратный метр в секунду (Дж/м2-с), или, с учетом определения мощности и ее единицы (см. (8)), в Вт/м2. Эту величину чаще называют интенсивностью и обозначают буквой I. Можно показать, что существует соотношение между интенсивностью синусоидальной звуковой волны и средним колебанием давления в волне (см. рис. 36), которое мы обозначим через Др (оно равно амплитуде вариаций давления, деленной на л/2):

Vd ’

где V — скорость звуковой волны (12), 6 — плотность воздуха. При нормальных значениях температуры и давления имеет место следующее численное соотношение:

I = 0.00234 х (Др)2 (Вт/м2). (16)

Поток энергии через поверхность единичной площади, перпендикулярную к направлению потока

Рис. 38. Поток энергии через поверхность единичной площади, перпендикулярную к направлению потока

Величина Ар измеряется в единицах ньютон/м2. Как будет показано в разд. 3.4, наиболее тихий чистый звук частоты 1000 Гц, который мы в состоянии услышать, имеет интенсивность всего 10“12 Вт/м2. Согласно соотношению (16), это соответствует средней вариации давления 2,0 х 10-5 ньютон/м2, т. е. всего лишь 2,0 х 10“10 нормального атмосферного давления! Эти цифры дают представление о том, насколько чувствительно наше ухо.

Источник звука (музыкальный инструмент или наушник) излучает звуковую энергию по всем направлениям. В общем случае количество энергии, излучаемой за секунду, зависит от выбранного направления. Предположим, что Д есть интенсивность, которую имеет в точке А волна, распространяющаяся в направлении, показанном на рис. 39. Это означает, что каждую секунду через поверхность си протекает количество энергии Если предположить, что потери энергии на этом пути не происходит, то такое же количество энергии будет протекать за секунду через поверхность а,2 в точке Aq. Следовательно,

Л«1 = ^2^2-

Радиальный поток звуковой энергии

Рис. 39. Радиальный поток звуковой энергии

Поскольку площади поверхностей ai и 0,2 пропорциональны квадратам их расстояний и и Г2 от источника, интенсивность звуковой волны оказывается обратно пропорциональной квадрату расстояния от источника:

Л

I2

(17)

Этот закон перестает выполняться, если учесть отражение и поглощение звука.

Если представить себе, что весь звуковой источник окружен сферической поверхностью, то полное количество энергии, протекающей каждую секунду через эту поверхность, называется акустической мощностью источника. Эта величина представляет темп излучения энергии источником по всем направлениям в форме звуковых волн, она измеряется в ваттах. Типичные музыкальные инструменты излучают от 0,01 (кларнет) до 6,4 Вт (тромбон при исполнении фортиссимо).

3.3. Суперпозиция волн. Стоячие волны

При отсутствии отражающих стен звуковые волны распространяются от источника прямолинейно. Как показано в предыдущем разделе, их интенсивность быстро убывает пропорционально 1/г2, где г — расстояние от источника. Если мы имеем более одного источника, волны, испускаемые каждым из них, будут распространяться независимым образом, как если бы других воли не было, и суммарный эффект в данной точке среды (например, в слуховом канале) определяется колебаниями давления, представляющими алгебраическую сумму колебаний отдельных волн[27] . Другими словами, звуковые волны складываются линейно^. Это относится и к бегущим волнам в базилярной мембране при низкой интенсивности звуков, что приводит к появлению двух резонансных областей, независимых одна от другой (двух огибающих, подобных показанной на рис. 34).

Рассмотрим суперпозицию двух чистых звуковых волн с частотами и /2 и, в соответствии с соотношением (13), с длинами волн Л] = V/J, Л 2 — V//2, которые распространяются в одном и том же направлении. Чтобы получить мгновенную картину результирующих вариаций давления, достаточно сложить значения вариаций давления, создаваемых каждой волной в отдельности, в каждой точке х вдоль направления распространения. Поскольку скорость звуковых волн не зависит от частоты (а также от картины колебаний в целом), во всех точках среды будет повторяться в точности одна и та же сложная картина колебаний, разница будет лишь во времени. Поток энергии (т. е. интенсивность суперпозиции двух или более волн со случайными фазами, распространяющихся в одном и том же направлении) равен просто сумме потоков энергии, создаваемых отдельными компонентами:

I = Л + h + /3 + • • • • (18)

Особенно важен случай, когда две синусоидальные волны одинаковой частоты и одинаковой амплитуды распространяются во взаимно противо

положных направлениях. Так, например, обстоит дело, когда синусоидальная волна отражается в данной точке (без поглощения) и уходит обратно, складываясь с пришедшей волной. Рассмотрим сначала поперечные волны в струне (рис. 40). Сложив вклады обеих компонент, мы получим другую синусоидальную волну той же частоты, но с другой амплитудой. Поразительный факт, однако, состоит в том, что эта результирующая волна вообще не распространяется'. Она остается закрепленной в некоторых точках Ni, N2, N3,..., называемых узлами, которые не совершают колебаний. Точки, расположенные между узлами, колеблются с разными амплитудами в зависимости от их положения. В частности, точки Ai, А2, A3,..., расположенные посредине между узлами и называемые антиузлами, колеблются с максимальной амплитудой (вдвое большей, чем у каждой из слагаемых волн). На рис. 41 показаны последовательные формы струны при распространении двух синусоидальных волн одинаковой амплитуды, бегущих в противоположных направлениях. Такая картина называется стоячей волной. Профиль волны периодически меняет амплитуду, но не перемещается ни вправо, ни влево. В один момент времени (Н) струна претерпевает максимальную деформацию, в другой (t5) — деформация полностью отсутствует. Как мы увидим в следующем разделе, стоячие волны играют важную роль в музыке, особенно в механизмах генерации звука музыкальными инструментами.

В стоячей волне отсутствует распространение энергии. Вся струна действует как одна упругая колеблющаяся пружина: в один момент времени (например, на рис. 41) все точки проходят через свое положение равновесия и энергия всей струны имеет форму кинетической энергии (энергии движения), в другой (Н на рис. 41) все точки находятся в состоянии максимального смещения и энергия полностью потенциальная. Другими словами, в стоячей волне все точки колеблются в фазе. Подчеркнем, что в распространяющейся волне дело обстоит не так. Например, на рис. 32 в каждый момент времени имеются точки в положении максимального отклонения (только потенциальная энергия), точки с нулевым смещением (только кинетическая энергия) и точки в промежуточном положении (оба вида энергии). Более того, в распространяющейся волне все точки колеблются с одной и той же амплитудой, различны лишь моменты времени, в которые достигается наибольшее смещение (разные точки колеблются не в фазе).

Внимательно взглянув на рис. 41, видим, что расстояние между двумя соседними узлами и N2 или расстояние /д между двумя соседними аитиузлами А± и А2 точно равно половине длины волны А:

In = Ia = А/2.

(19)

Суперпозиция двух поперечных волн одинаковой амплитуды и частоты, распространяющихся во взаимно противоположных направлениях со скоростями +V и —V

Рис. 40. Суперпозиция двух поперечных волн одинаковой амплитуды и частоты, распространяющихся во взаимно противоположных направлениях со скоростями +V и —V. Результирующая волна не распространяется, она остается «закрепленной» в узлах N, периодически изменяется только ее амплитуда

Расстояние 1^л между узлом TVi и антиузлом A i равно четверти длины волны:

Последовательное изменение формы струны при колебаниях типа стоячей волны

Рис. 41. Последовательное изменение формы струны при колебаниях типа стоячей волны

Стоячие волны могут быть и продольными. Они возникают, когда две звуковые волны с одной и той же частотой и одинаковой амплитудой вариаций давления распространяются в противоположных направлениях. Это происходит, например, когда звуковая волна бежит вдоль трубы и отражается от другого конца; стоячие волны возникают также при отражении от стен в комнатах и залах. Продольные стоячие волны обладают теми же свойствами, что и поперечные, и все вышесказанное к ним также применимо. Необходимо, однако, внести важное дополнение. Как указано в предыдущем разделе, звуковые волны удобнее всего описывать как колебания давления. Мы показали там, что точки с максимальным изменением давления имеют нулевое продольное смещение (рис. 35), а местам с нулевыми вариациями давления соответствуют точки с максимальным смещением. Применительно к случаю стоячей звуковой волны можно выразить это следующим образом: узлы давления (т. е. точки, где вариации давления постоянно равны нулю) являются антиузлами колебаний (точками, колеблющимися с максимальной амплитудой), тогда как антиузлы давления (точки с наибольшей амплитудой колебаний давления) являются узлами колебаний (точками, которые остаются в покое).

3.4. Интенсивность, уровень интенсивности звука и громкость

В разд. 2.3 было отмечено, что в случае чистого звука ощущение громкости определяется амплитудой колебаний барабанной перепонки. Эта амплитуда непосредственно связана со средним изменением давления Др во входящей звуковой волне и, следовательно, с плотностью акустической энергии, или интенсивностью I, достигающей уха (см. соотношение (16)). Здесь мы начнем с исследования области интенсивностей I чистых звуковых тонов, к которой чувствительно наше ухо. Существуют два предела чувствительности к тону данной частоты: 1) нижний предел, или порог слышимости, представляющий минимальную, но еще ощущаемую интенсивность, и 2) верхний предел слуха (болевой порог), за которым возникает физиологическая боль, что со временем приводит к повреждению слухового механизма. Оказывается, что эти два предела меняются от одного индивидуума к другому и зависят от частоты предъявляемого звука. В общем случае интервал между этими пределами наибольший на частоте приблизительно 1000 Гц (это где-то между «си» второй октавы и «до» третьей октавы). Поразительно, какая огромная область интенсивностей заключена между двумя указанными пределами слуха. Действительно, для тона 1 000 Гц средний порог слышимости лежит вблизи 10-12 Вт/м2, тогда как болевой порог составляет приблизительно 1 Вт/м2. Это дает отношение триллион к одному для интенсивностей, к которым чувствительно ухо! В табл. 2 приведены соотношения между интенсивностью звука и ощущаемой громкостью музыкального тона для частоты 1 000 Гц [28]. На этой частоте область интенсивностей, используемых в музыке, простирается от 10-9 до 10~2 Вт/м2. Это все еще огромное отношение в 10 миллионов!

Из-за такого огромного разброса значений единица Вт/м2 оказывается непрактичной. Есть и другая причина неудобства ее применения. Дифференциальный порог чувствительности (ДПЧ) данного стимула (разд. 1.4) обычно служит хорошим физическим критерием при выборе подходящей единицы для соответствующей физической величины. Эксперименты показывают, что ДПЧ д.чя интенсивности тона приблизительно пропорционален самой интенсивности тона. Такая пропорциональность предполагает, что подходящая единица должна постепенно увеличиваться при повышении интенсивности тона, который мы хотим описать. Это, конечно, приведет к невообразимому усложнению измерений, если только мы не введем какую-то другую величину, которая является некоторой функцией иитен-

Таблица 2. Сравнение интенсивности звука с ощущением громкости музыкального тона

Интенсивность (Вт/м2)

Громкость

  • 1
  • 10"3
  • 10-4

ю-5

  • 10"6
  • 10"7

Ю-8

  • 1()-9
  • 10 12

Болевой порог fff ff f mf

P

PP

PPP

Порог слышимости

сивности. Эта новая величина должна одновременно решить три задачи: 1) «сжать» всю шкалу слышимых интенсивностей до гораздо более узкой области значений; 2) использовать не абсолютные, а относительные значения (например, отнесенные к порогу слышимости); 3) дать более удобную единицу, значение которой близко к минимальному воспринимаемому изменению интенсивности звука.

Такая новая величина вводится следующим образом. Из табл. 2 видно, что эффект громкости связан с показателем степени, в которую возводится число 10, при оценке интенсивности звука (левый столбец): —12 соответствует порогу слышимости, —9 — пиано-пианиссимо (ррр), —7 — пиано, —5 — форте, —3 — форте-фортиссимо, 0 — болевому порогу (10° = 1). Это наводит на мысль, что для представления интенсивности нам следует воспользоваться тем, что в математике называется логарифмической функцией.

Десятичным логарифмом данного числа является показатель степени, в которую нужно возвести 10, чтобы в результате получить это число. Например, логарифм 100 равен 2, потому что 102 = 100; логарифм 10 000 равен 4, поскольку 104 — 10 000; логарифм 1 равен нулю, потому что 10° — 1; логарифм 0,000001 равен -6, поскольку 10-6 = 0,000001. Эти соотношения записывают в символической форме: lg 100 = 2; lg 10 000 = 4; lg 1 = 0; lg 0,000001 = —6. Для любого числа между целыми степенями десятки логарифм можно найти с помощью калькулятора.

Важное свойство состоит в том, что логарифм произведения двух чисел равен сумме логарифмов этих чисел. Например, логарифм числа, полученного умножением 104 на 103, равен 4 плюс 3 (т. е. 7), поскольку 104 х 103 = — Ю4+3 — 107. В общем случае для любых двух чисел а и b мы имеем

Таблица 3. Сравнение изменений уровня интенсивности звука IL (в дБ) с изменениями интенсивности

Изменение величины IL

Что при этом происходит с интенсивностью

Прибавление (вычитание) 1 дБ

+(-) 3 дБ

+ (-) Ю дБ

+(-) 20 дБ

+(-) 60 дБ

Умножение (деление) на 1,26

x(M) 2

х(-) 10

х(д) 100

х(-г) 1000000

соотношение lg(a х 6) = Iga + lg/. Для логарифма частного а/b вместо этого имеем lg(a/6) = Iga — lgb.

Десятичные логарифмы действительно можно использовать в качестве подходящей функции для описания интенсивности звука. За начало отсчета /0 принимаем порог слышимости (на частоте 1 000 Гц) 10~12 Вт/м2. Далее вводим величину

ZL = 10xlgy-. (21)

Jo

Эта величина называется уровнем интенсивности звука (intensity level, сокращенно IL ). Единицей для ее измерения служит децибел (сокращенное обозначение дБ). Для порога слышимости I/Io = lnIL = Q дБ. Для болевого порога I/Iq = 1012 и IL = 10 х lg 1012 = 120 дБ. Типичному «форте» (табл. 2) соответствует уровень интенсивности звука 70 дБ, звуку ррр соответствует IL = 30 дБ.

Важно отметить, что при измерении величины в децибелах вводится относительная мера по отношению к некоторому значению, принимаемому за начало отсчета (например, к порогу слышимости при определении /L). Если умножить интенсивность / на 10, то к значению IL прибавляется 10 дБ, при умножении на 100 следует прибавить 20 дБ, и т. д. Аналогично, когда интенсивность делится на 100, нужно вычесть из IL 20 дБ. В табл. 3 приведены некоторые полезные соотношения.

Мы можем использовать соотношение (16), чтобы выразить интенсивность через среднее изменение давления Др, которое гораздо легче измерить. При этом получается, что минимальный порог Iq на частоте 1 000 Гц приблизительно соответствует среднему изменению давления Дро — 2 х 10-5 ньютон/м2 (20 микропаскалей). Согласно соотношению (16), интенсивность / пропорциональна квадрату величины Др,

поэтому

lg/ = lg

Л 2 .

Др) = 21g Др.

Дро/ °Дро

Можно ввести величину

  • 5P? = 201g-^
  • (22)

именуемую уровнем звукового давления (sound pressure level, сокращенно SPL ). Для бегущей волны формулы (21) и (22) дают одинаковые численные значения, так что IL и SPL представляют одно и то же. Однако в случае стоячих волн поток энергии вообще отсутствует (разд. 3.3) и интенсивность I, входящую в формулу (21), нельзя определить, так что величина IL теряет смысл. Тем не менее, понятие среднего изменения давления Др в данной точке пространства (например, внутри органной трубы) сохраняет смысл; то же относится и к уровню звукового давления. Поэтому соотношение (22) применяется чаще, чем (21). Заметим, что определения величин IL и SPL вовсе не содержат частоты звуковой волны. Хотя мы упоминали частоту 1 000 Гц, ничто не мешает нам определить IL и SPL для любой частоты, используя, соответственно, соотношения (21) и (22). От частоты зависят, и очень сильно, субъективные пределы слуха (например, 10 и Дро), а также, в общем случае, субъективное ощущение громкости, как мы увидим далее.

При наложении двух звуков одинаковой частоты (и фазы) уровень интенсивности звука (или уровень звукового давления) ведет себя забавным образом. Взглянем на табл. 3. При сложении двух тонов одинаковой интенсивности, что, согласно формуле (18), означает удвоение интенсивности, к уровню интенсивности исходного звука просто добавляются 3 дБ, каково бы ни было реальное значение IL . Сложение десяти одинаковых тонов (в одной фазе) добавляет к результирующему значению IL всего 10 дБ. Чтобы увеличить значение IL для данного тона на 1 дБ, мы должны умножить его интенсивность на 1,26, что означает сложение с тоном, интенсивность которого составляет 0,26 (приблизительно 1/4) интенсивности исходного тона.

Минимальное изменение SPL , необходимое для различимого изменения в ощущении громкости (ДПЧ для уровня), приблизительно постоянно и составляет 0,2-0,4 дБ для диапазона частот и громкостей, используемого в музыке. Таким образом, децибел, единица измерения IL и SPL, действительно имеет «разумный размер», близкий к ДПЧ.

Возможен и другой взгляд на ДПЧ для интенсивности и уровня звука. Вместо вопроса, как следует изменить интенсивность одного данного тона, чтобы получить едва различимый эффект, можно поставить полностью эквивалентный вопрос: какова минимальная интенсивность р, которую должен иметь второй тон той же частоты и фазы, чтобы быть замеченным в присутствии первого тона, интенсивность которого 1[ поддерживается постоянной? Эта минимальная интенсивность 1% называется порогом маскировки. Исходный тон с постоянной интенсивностью Ii называется маскирующим тоном, дополнительный тон — маскируемым тоном. Маскировка играет важную роль в музыке. Здесь мы упомянули лишь о маскировке тонов той же частоты (и фазы), что и у маскирующего тона, далее мы обсудим также маскировку при различных частотах. Соотношение между уровнем маскировки ML (IL маскируемого тона на пороге), ДПЧ уровня звука и IL маскирующего тона можно получить из их определений (основанных на соотношении (18)):

ML = 101g ( DL = 101g ( 71 t12 b IL = 10 T- )• Vo / h / Vo)

До сих пор мы имели дело с физическими величинами IL и SPL. Теперь обратимся к психологической величине — громкости, соответствующей данному значению SPL. В разд. 1.4 и 2.3 мы упоминали о способности испытуемых оценивать относительную «силу» двух ощущений одного и того же рода, отмечая при этом трудности, возникающие при необходимости абсолютных количественных сравнений. В случае громкости суждения о том, звучат ли два чистых тона одинаково громко, обнаруживают очень малый разброс при переходе от одного индивидуума к другому. Однако для определения того, на сколько один тон громче другого, требуется предварительная тренировка, и результаты у разных людей сильно различаются.

Тона с одинаковым значением SPL , но разной частоты в общем случае оцениваются как имеющие разную громкость. Поэтому при сравнении тонов разной частоты SPL не может служить подходящей мерой громкости. В экспериментах по определению линий равной громкости5' величина SPL на частоте 1000 Гц принималась за начало отсчета. Результаты показаны на рис. 42 [44]. От вертикальной прямой, соответствующей частоте 1000 Гц, в обе стороны, соответствующие более низким и более высоким частотам, проведены кривые, представляющие значения SPL для тонов, которые оцениваются как имеющие ту же громкость, что и эталонный тон частотой 1 000 Гц. Отметим, в качестве примера, что в то время как SPL в 50 дБ (интенсивность 10-7 Вт/м2) на частоте 1 000 Гц оценивается как «пиано», то же значение SPL едва слышно на 60 Гц. Другими словами, чтобы обеспечить заданную громкость (например, «форте») на низких частотах, требуется гораздо большая интенсивность (поток энергии), чем [29]

на 1 000 Гц. Поэтому при постепенном удалении от неподвижного источника звука мы перестаем слышать басовые тона гораздо раньше, чем высокие. По той же причине нам приходится покупать более дорогую электронную технику, если мы хотим слышать хорошо сбалансированные басы.

Линии равной громкости [44] на диаграмме зависимости уровня звуковой громкости

Рис. 42. Линии равной громкости [44] на диаграмме зависимости уровня звуковой громкости (ZL ) от частоты. Показаны также соответствующие шкалы интенсивности звука (Вт/м2) и среднего изменения давления (ньютон/м2)

Нижняя кривая на рис. 42 представляет порог слышимости для различных частот. Здесь опять-таки видно, что чувствительность уха значительно уменьшается при переходе к низким (а также к очень высоким) частотам. Максимальная чувствительность достигается вблизи 3 000 Гц. Форма этой пороговой кривой определяется акустическими свойствами слухового прохода и механическими свойствами цепочки слуховых косточек в среднем ухе. Отметим, что все приведенные кривые представляют значения, усредненные по большому числу испытуемых. Подчеркнем также, что линии на рис. 42 относятся лишь к одиночным, непрерывно звучащим чистым тонам. Далее мы обсудим, что происходит с ощущением громкости, когда тон имеет короткую протяженность (менее секунды). Исследования показали [104], что контуры равной громкости оказываются зависящими от частоты эталонного тона (на рис. 42 эта частота принята равной 1 000 Гц).

Теперь перейдем к теме, в изложении и понимании которой порой возникает путаница. Введем новую величину, называемую уровнем громкости (обозначается LL ). Она определяется следующим образом: LL тона частоты f равен SPL тона частоты 1 000 Гц, имеющего такую же громкость. Это означает, что кривые на рис. 42 являются линиями постоянного уровня громкости. Единица для измерения LL носит название фон. Можно использовать рис. 42, чтобы найти LL тона с заданным значением SPL на произвольной частоте /. Возьмем, например, тон с SPL = 70 дБ (/ = = 10-5 Вт/м2) при 80 Гц. Мы видим, что кривая, которая проходит через эту точку, пересекает прямую 1 000 Гц на уровне 50 дБ. Таким образом, LL данного тона составляет 50 фонов. В общем случае числа вдоль прямой 1 000 Гц представляют значения LL в фонах для соответствующих линий постоянной громкости.

Подчеркнем, что величина LL, несмотря на название, является не психофизической, а физической. Она представляет те интенсивности, или значения SPL, которые звучат столь же громко, но не претендует на абсолютную меру ощущаемой громкости: тон с вдвое большим значением LL не звучит вдвое громче! Было проведено много исследований для определения субъективной шкалы громкостей. На рис. 43 показан результат [156], связывающий «субъективную громкость» L с уровнем громкости LL в области, представляющей интерес для музыки. Величина L, описывающая субъективную громкость, измеряется единицей, получившей название сон. Указанная связь нелинейна (на рис. 43 для громкости используется так называемая логарифмическая шкала). Она такова, что при увеличении значения LL на 10 фонов громкость L просто удваивается. Это, в частности, означает, что десять инструментов, исполняющих данную ноту с одним и тем же значением LL, субъективно оцениваются как звучащие лишь вдвое громче, чем один инструмент!

Было показано [157], что связь между громкостью L и интенсивностью волны I, или средним изменением давления Ар, приближенно описывается простой зависимостью:

Ь = С1^/ = С2У(ДЙ2, (23)

где Ci и Съ — параметры, зависящие от частоты. Эта зависимость изображена штриховой линией на рис. 43, которая лежит в пределах статистических флуктуаций результатов реальных измерений (не показанных на рисунке). Здесь нет логарифмической зависимости, описываемой формулами (21) и (22). Тем не менее остается значительное «сжатие» шкалы субъективной громкости: чтобы увеличить громкость L от 1 до 200, интенсивность I должна быть увеличена в 8 000 000 раз.

Сплошная линия'. Экспериментальное соотношение между психологической громкостью и физическим уровнем громкости [156]. Штриховая линия

Рис. 43. Сплошная линия'. Экспериментальное соотношение между психологической громкостью и физическим уровнем громкости [156]. Штриховая линия: Степенной закон (23) [157]

При сложении двух или более тонов одинаковой частоты (со случайными фазами) результирующий тон имеет интенсивность, равную сумме интенсивностей отдельных тонов: I — Д + /2 + /3 + ... (то же относится и к потоку энергии). Поскольку в данном случае отдельные тона неотличимы один от другого, эта полная интенсивность определяет результирующую громкость, фигурирующую в формуле (23). Очевидно, что результирующая громкость L не будет равна сумме громкостей отдельных тонов. Иная ситуация возникает, когда слагаемые волны имеют разную частоту. Можно выделить следующие три режима.

1. Если частоты всех слагаемых тонов лежат внутри критической полосы центральной частоты (разд. 2.4), результирующая громкость по-прежнему связана с полной интенсивностью (потоком энергии), равной сумме отдельных интенсивностей:

L — Ci ?'УЛ + /2 + -^з + • • ••

(24)

Это свойство позволяет определить критическую полосу [180] точнее, чем в разд. 2.4.

2. Если разброс частот стимула, состоящего из многих тонов, превышает критическую полосу, результирующая субъективная громкость будет больше, чем при простом суммировании интенсивностей (24), увеличиваясь с ростом разности частот и стремясь к значению, которое определяется суммой громкостей отдельных тонов из соседних критических полос [181]:

L — Li + L<2 + Z/з 4- .... (25)

Если отдельные громкости Li, . ? значительно различаются, необходимо учитывать также эффекты маскировки. На практике предельная громкость (25) никогда не достигается.

3. При большой разности частот отдельных тонов ситуация становится более сложной. Прежде всего возникают трудности, связанные с понятием полной громкости. Люди стремятся сосредоточить внимание лишь на одном из слагаемых тонов (например, на наиболее громком или имеющем наиболее высокую частоту) и приписывают ощущение полной громкости

" 52

всего одной компоненте :

L — максимум суммы (Li 4- L2 4- L3 4- ...). (26)

Все это играет важную роль в музыке. Например, две органных трубы одинакового типа и одной высоты звучат лишь в 1,3 раза громче, чем одна такая труба (табл. 3). Если их высоты различаются на полутон или целый тон, их совместная громкость будет по-прежнему превосходить громкость одной трубы приблизительно в 1,3 раза (поскольку полутон и целый тон лежат внутри критической полосы, см. рис. 15). Однако два тона, разделенные интервалом в большую терцию, будут звучать громче предыдущей комбинации. Эти факты хорошо известны органным мастерам и композиторам уже много веков. Поскольку громкость отдельных тонов органа не удается контролировать вручную, как в случае струнных или деревянных духовых инструментов, громкость звучания органа можно регулировать, лишь изменяя число одновременно звучащих труб. Но как сказано в предыдущем абзаце, суммирование громкостей более эффективно при значительной разности частот тонов (см. соотношение (25)), поэтому для этой цели используются регистры, звучащие на одну (4-футовый регистр), две (2-футовый регистр) и более октав выше написанной ноты (а также ниже 16-футового регистра)[30] . С другой стороны, громкостью можно управлять без добавле

ния или вычитания регистров путем изменения количества одновременно звучащих нот. Каждый новый голос, входящий в фугу, увеличивает субъективную громкость пьесы, подобно каждой дополнительной ноте в аккорде. Некоторые органисты исполняют финальные аккорды фуг Баха, включая дополнительные регистры. Это представляется абсурдным — сам Бах программировал желаемое увеличение громкости, просто записывая больше нот, чем число голосов, используемых в фуге![31]

Мы рассматривали суммирование громкости при одновременном звучании двух или более тонов, но пока не обсуждали, что происходит с порогом слышимости тона, когда он звучит в присутствии другого тона. Если частоты обоих тонов совпадают, этот порог определяется уровнем маскировки (см. стр. 250). Если частоты различны, то уровень маскировки определяется минимальным уровнем интенсивности, который должен превысить маскируемый тон, чтобы его можно было «выделить» и расслышать в отдельности в присутствии маскирующего тона. Порог интенсивности изолированных чистых тонов (нижняя кривая на рис. 15) заметно изменяется (повышается), если одновременно присутствуют другие тона. Наиболее знакомое нам проявление маскировки — это невозможность вести разговор при наличии сильного шума. На рис. 44 показан уровень маскировки ML чистого тона частоты /о в присутствии другого чистого тона с заданными характеристиками (с частотой 415 Гц и уровнем интенсивности IL) [41]. Для различных значений IL маскирующего тона представлен уровень МL над порогом слышимости (нижняя кривая на рис. 15), до которого должен быть повышен маскируемый тон. Области, близкие к /0 (точечные части кривых), должны быть экстраполированы к значениям, определяемым ДПЧ для громкости (стр. 249). Здесь важную роль играют биения, которые сами по себе не имеют ничего общего с маскировкой. При больших значениях IL возникают дополнительные осложнения, связанные с появлением слуховых гармоник на частотах 2/о, З/о и т. д. (разд. 2.5). Отметим асимметрию кривых при больших значениях IL (связанную с этими слуховыми гармониками): тон заданной частоты /0 маскирует высокие частоты эффективнее, чем низкие. В то же время маскировка приводит к небольшому изменению высоты одночастотного маскируемого тона из-за асимметричного распределения возбуждения базилярной мембраны маскирующим тоном (рис. 34).

Частота (Гц)

Рис. 44. Уровень маскировки, соответствующий чистому тону 415 Гц для различных значений уровня звука [41 ] маскирующего тона

Маскировка играет важную роль в полифонической музыке, особенно при оркестровке. Во многих случаях присутствие в музыкальной партитуре таких инструментов, как гобой или фагот, не имеет смысла, если одновременно с ними должны звучать фортиссимо медные духовые инструменты. Аналогично, добавление флейтовых регистров или других мягко звучащих струнных регистров органа к звучанию тутти диапазонных, смешанных или язычковых регистров нецелесообразно с точки зрения громкости.

Наконец, следует упомянуть о влиянии продолжительности звучания тона на ощущение громкости (называемое временным интегрированием). Прежде всего, существует временной порог — минимальная продолжительность, которую должен иметь данный чистый звук, чтобы он воспринимался как музыкальный тон. Минимальная длительность составляет 10-15 мс, или, как минимум, 2-3 периода при частоте ниже 50 Гц; более короткие звуки воспринимаются не как тона, а как щелчки[32]. Звуки, продолжающиеся дольше 15 мс (или более 2-3 периодов), можно различать как тона определенной высоты и громкости, однако субъективная громкость зависит

от продолжительности тона [125]. Чем короче звуковой импульс, тем ниже его громкость при заданной физической интенсивности звука (или заданном потоке энергии) [135]. На рис. 45 показано, как зависит относительное уменьшение громкости от длительности тона для различных частот. Заметим, что предельное значение отклика быстрее достигается на более высоких частотах, — уже через полсекунды громкость принимает постоянное значение, зависящее только от интенсивности (эта зависимость показана на рис. 43). Маскировка (рис. 44) также обнаруживает существенную и довольно сложную зависимость от длительности коротких маскирующих тонов; подробности можно найти в книге [179]. В общем случае ощущение громкости коротких тонов в первом приближении связано не столько с мгновенным значением потока энергии (с интенсивностью звуковой волны), сколько с полной акустической энергией, передаваемой этим тоном уху (т. е. с интенсивностью, умноженной на длительность). Похоже, что в данном случае ощущение громкости определяется полным числом нервных импульсов, возбуждаемых данным коротким тоном [183] (см. также следующий раздел).

Относительная громкость чистых тонов короткой протяженности t. По вертикальной оси отложено отношение r/L реально ощущаемой громкости г к громкости L стационарного тона той же частоты и амплитуды

Рис. 45. Относительная громкость чистых тонов короткой протяженности t. По вертикальной оси отложено отношение r/L реально ощущаемой громкости г к громкости L стационарного тона той же частоты и амплитуды

При длительном звучании возникает эффект адаптации, состоящий в уменьшении субъективной громкости, когда тон постоянной интенсивности слышен в течение нескольких минут[33]. Несмотря на большие различия между разными испытуемыми, в экспериментах по согласованию громкостей обнаружили некоторые общие черты [147]. При одном и том же значении SPL адаптация ускоряется с повышением частоты (высокочастотные

тона «выключаются» быстрее). Для тонов одинаковой частоты адаптация замедляется при увеличении SPL (при SPL более 40 дБ эффект адаптации исчезает). В общем случае для частот и значений SPL, встречающихся в музыке, субъективная громкость тона спадает после 100 с, а затем остается постоянной.

Ослабление громкости коротких тонов играет важную роль при исполнении музыки. Если мы хотим играть на рояле пассажи «стаккато» с заданной громкостью, мы должны ударять по клавишам гораздо сильнее, чем если бы мы исполняли те же ноты «легато» с той же громкостью[34]. Этот эффект гораздо сильнее проявляется в незатухающих тонах, например, в звуках органа. Действительно, органист имеет возможность регулировать субъективную громкость одной данной ноты, задавая ее правильную длительность. Фразировка при игре на органе есть искусство динамического управления длительностью звучания нот (это относится лишь к коротким тонам — см. рис. 45). Адаптация играет не маловажную роль в музыке, именно для борьбы с ней в верхнем диапазоне частот были придуманы трели. При этом на низких частотах адаптация не столь существенна, что доказывается использованием «органного пункта». Важная роль таких временных эффектов в музыке оправдывает проведение многочисленных исследований затухания и адаптации.

3.5. Механизм восприятия громкости и связанные с этим процессы

Какие физические, физиологические и нервные процессы ответственны за расхождение между ограниченной субъективной шкалой громкости и гигантской областью ощущаемых интенсивностей исходного звука (см. табл. 2 и соотношение (23))? При обсуждении восприятия первичного тона (разд. 2.3) мы уже сталкивались с подобным «логарифмическим сжатием»: шкала ощущаемых частот, простирающаяся от 20 Гц до приблизительно 16 000 Гц, охватывает всего 9 октав высоты тона. Там такое сжатие было обусловлено в основном механическими резонансными свойствами кохлеарной мембраны: кривая на рис. 10 имеет вид, близкий к логарифмической зависимости положения х резонансной области на базилярной мембране от частоты f чистого тона.

Что касается механизма восприятия громкости, то здесь сжатие носит частью нервный, частью механический характер. При наличии чистого тона

частота возбуждения первичных нейронов, связанных с сенсорными клетками в центре области максимальной резонансной амплитуды (т. е. с волокнами, обладающими той же характеристической частотой, см. стр. 209), становится выше спонтанного уровня. Это увеличение частоты зависит от амплитуды стимула монотонным, но нелинейным образом [144]. В самом деле, когда последняя увеличивается, скажем, в 100 раз (согласно соотношению (22), это соответствует SPL = 40 дБ), частота возбуждения повышается всего в 3-4 раза. Другой элемент, определяющий сжатие шкалы громкости, имеет следующую природу. При высоких значениях SPL частота возбуждения первичных нейронов насыщается на уровне, лишь в несколько раз превышающем частоту спонтанного возбуждения. Любое дальнейшее увеличение интенсивности не вызывает существенного изменения частоты возбуждения — нейроны просто не могут передавать импульсы с частотой выше этого предельного значения (определяемого временем восстановления после каждого импульса, см. разд. 2.8). Отдельные волокна слухового нерва с близкими характеристическими частотами имеют сильно различающиеся пороги возбуждения (значения SPL , необходимые для повышения частоты возбуждения выше спонтанного уровня). Повышение уровня стимула, необходимое для достижения насыщения, для различных волокон может меняться от 20 до 40 дБ и более. В результате ансамбль слуховых нейронов, обслуживающих данную область базилярной мембраны, может покрывать широкую динамическую область акустической системы путем надлежащего разделения функций. При систематическом изучении индивидуальных характеристик слуховых нейронов Либерман [91] выделил три группы: волокна с высокой спонтанной частотой возбуждения (более 20 импульсов в секунду) и низкими порогами, волокна с очень низкими спонтанными частотами (менее 0,5 импульсов в секунду) и высокими пороговыми значениями, распределенными в широкой области (до 50-60 дБ), и группа с промежуточными значениями спонтанных частот и порогов. Каждая группа волокон имеет свои характеристики клеток (диаметр и архитектуру синаптического контакта с внутренними волосными клетками). Интересно, что каждая внутренняя волосная клетка получает волокна от всех трех групп. Это позволяет одной отдельной сенсорной клетке передавать сигналы, распределенные по широкой динамической области, — и это еще одна причина, по которой с каждой внутренней волосной клеткой контактирует так много афферентных волокон (см. стр. 209). В соответствии с этими результатами интенсивность звука кодируется как частотой возбуждений, так и типом акустического нервного волокна, переносящего информацию.

Предыдущее утверждение нуждается в дополнении. По мере увеличения интенсивности чистого тона амплитуда волны, бегущей по базилярной мембране, увеличивается всюду, а не только в области резонансного пика. Это позволяет нейронам с характеристической частотой, отличной от частоты приходящей звуковой волны (эти нейроны соединены с волосными клетками, лежащими вблизи резонансной области, но не в ней самой), увеличивать частоту возбуждений при превышении их (нерезонансных) порогов (см. рис. 46). Таким образом, повышение интенсивности приводит к увеличению полного числа передаваемых импульсов — либо из-за повышения частоты возбуждения каждого нейрона, либо вследствие увеличения полного числа активированных нейронов. Этот последний эффект зависит в основном от формы распределения амплитуд колебаний мембраны — т. е. от чисто механического свойства.

Соотношение между субъективной громкостью и полной частотой возбуждения качественно объясняет основные свойства суммирования

Сравнение базилярной мембраны

Рис. 46. Сравнение базилярной мембраны (сплошная кривая) и нервного возбуждения. Заштрихованная область соответствует кривым настройки десяти волокон акустического нерва, соединенных с одной и той же областью базилярной мембраны [76] громкости (разд. 3.4). Для одновременно звучащих тонов с частотами, отличающимися более чем на критическую полосу, полная сумма передаваемых нервных импульсов приближенно равна сумме частот импульсов, переносимых каждой компонентой в отдельности, так что полная громкость стремится к сумме громкостей каждого тона (см. соотношение (25)). Наоборот, для тонов, частоты которых лежат внутри критической полосы, со значительным перекрытием резонансных областей на базилярной мембране, полное число импульсов будет определяться амплитудой локальных колебаний базилярной мембраны, связанных с суммой интенсивностей исходных стимулов (см. соотношение (24)).

Зависимость ощущения громкости (и порогов маскировки) от продолжительности звучания тона (рис. 45) указывает на временную зависимость процесса обработки акустического сигнала. Нервный механизм обработки сигнала выходит на «стационарный режим» лишь через несколько десятых долей секунды. Важно еще раз подчеркнуть, что, к счастью для музыки, во время этого установления стационарного режима ощущение высоты тона устойчиво с самого начала (за исключением первых десятков миллисекунд).

Как отмечалось в разд. 1.2, для тона постоянной частоты имеется слабая зависимость между высотой и громкостью. Для тонов выше 2 000 Гц высота растет при увеличении громкости и наоборот, ниже 1 000 Гц имеет место обратная зависимость [173]. Эксперимент по согласованию высот показывает, что увеличение SPL от 40 до 80 дБ вызывает повышение тона 5 000 Гц на 2 % и понижение тона 150 Гц на 1,5 % [165]. При звучании громкого финального аккорда в условиях реверберации (например, в исполнении большого органа в кафедральном соборе) многие слушатели ощущают неприятное понижение тона во время затухания звука. Этот эффект, вероятно, связан с асимметрией распределения возбуждений по базилярной мембране (см. рис. 34) и с нелинейностью нервного отклика из-за насыщения, — изменение интенсивности вызывает сдвиг центральной точки возбуждения (даже если частота остается постоянной), приводящий к изменению ощущения первичного тона [60]. Другим следствием этой асимметрии может быть малое, но вполне заметное изменение высоты чистого тона фиксированной частоты при наложении другого тона иной частоты [160,173]. Этот эффект может проявляться в музыкальной тональности (разд. 5.4). Заметим, что такое изменение высоты не объясняется временным механизмом!

Теперь вернемся к поставленному выше (стр. 185) вопросу о механизме обнаружения первичного тона: если чистый тон заданной интенсив-

1

Следует отметить, что изменение высоты тона происходит также при изменении давления в кохлеарной жидкости (например, при зевоте) или при изменении ее химического состава (например, при инъекции лекарств в спинномозговую жидкость).

ности и частоты создает на базилярной мембране резонансные колебания, охватывающие конечную пространственную область Дж, и первичный тон кодируется в форме пространственного положения х активированных волокон, то как возникает ощущение только одной высоты? Аналогичный механизм действует и в зрительной системе, создавая важные эффекты усиления контраста [133]. В зрительной системе этот процесс «усиления резкости» осуществляется нервной сетью (частично в сетчатке), которая концентрирует (или «канализирует») активность в небольшое число нейронов, окружающих область «покоя», или торможения нейронов, тем самым увеличивая контраст. До 1970-х годов считалось, что в слуховой системе имеется аналогичный нервный механизм выделения тона. Однако недавние исследования улитки выявили удивительные электромеханические свойства наружных волосных клеток, ответственные за возникновение нелинейной обратной связи, усиливающей и концентрирующей слуховую настройку до преобразования в нервные сигналы. Этот процесс будет рассмотрен в следующем разделе.

3.6. Музыка из ушей. Отоакустическое излучение и кохлеарные механизмы

Музыка из ушей?! Ну... не совсем, но почти!

В изучении и понимании механизма слуха можно выделить три основных периода. Первый связан с именем Гельмгольца [172], который предположил, что базилярная мембрана действует как анализатор спектра на основе механического возбуждения стоячих волн (картина «маленьких резонаторов в ухе»). Второй период с 1940-х до 1970-х годов прошел под знаком экспериментов фон Бекеши [171], которые показали, что поступающий звук выявляет пространственно ограниченную бегущую гидромеханическую волну, у которой положение максимума амплитуды определяется частотой входного сигнала (картина «колышащегося флага», рис. 34). Третий, нынешний период начался в 70-х годах с обширного ряда экспериментов и теоретических исследований, показавших, что бегущие волны фон Бекеши локально усиливаются посредством электромеханического процесса, в котором наружные волосные клетки благодаря их (неожиданной) подвижности работают как сенсоры механической силы и одновременно как элементы механической обратной связи (см. подробный обзор Даллоса [28]). Это усиление от цикла к циклу наиболее заметно в случае слабых сигналов, что объясняет высокую чувствительность и динамический диапазон слуха. Обратная связь может приводить к автоколебаниям или резонансу после прекращения действия внешнего стимула, а это создает колебания улитки в акустической области, которые можно зарегистрировать как слабые тона с помощью высокочувствительного микрофона, плотно вставленного в наружный слуховой канал [81].

Такое отоакустическое излучение, хотя и не имеет непосредственного отношения к музыке, является отражением процесса, который может объяснить некоторые замечательные способности слуховой системы, порой взаимно противоречивые:

  • 1) Восприятие звука, который вызывает смещение сенсорных элементов лишь на доли нанометра (10-9 м).
  • 2) Чувствительность к динамическому диапазону интенсивностей по крайней мере миллиард к одному.
  • 3) Отклик на нестационарные процессы, измеряемые долями микросекунды.
  • 4) Частотное разрешение с точностью, намного лучшей, чем могут обеспечить чисто механические элементы базилярной мембраны.

Новые исследования на клеточном уровне обнаружили, что улитка «представляет эволюционный триумф миниатюризации..., наиболее сложное механическое устройство в человеческом теле, содержащее более миллиона активно движущихся частей..., звуковой усилитель и анализатор частот, заключенные в объеме маленькой бусинки» [69,70].

Измерения движения базилярной мембраны фон Бекеши проводил на препарированных улитках мертвых животных, обнаруживающих широкие резонансные области для одиочастотиых тонов. Когда стало возможно регистрировать нервные импульсы от отдельных волокон живого слухового нерва (см. разд. 2.8), оказалось, что последние гораздо точнее настро-59

ены на некоторую характеристическую частоту, чем показывает довольно несовершенный частотный анализ базилярной мембраны. Это пролило свет на процесс выделения тона, который прежде приписывался действию нервной системы, как в случае зрения. Однако многие недавние исследования с привлечением эффекта Мёссбауэра и лазерной техники, выполненные на живых животных, обнаружили гораздо более точную настройку самой базилярной мембраны. На рис. 46 демонстрируется сравнение настройки базилярной мембраны и нервного механизма [76]. Сплошная кривая представляет значение SPL приходящей звуковой волны заданной частоты, на которое базилярная мембрана отвечает данной скоростью максимума (на рисунке это 0,04 мм/с) в данной точке, где находится радиоактивный

59 «Точная настройка» означает, что полоса частот, на которую откликается нейрон, очень узка; «нерезкая настройка» означает, что отклик возникает в широкой области частот. источник (эта кривая называется линией настройки на постоянную скорость). Глубокий максимум на частоте 18 кГц показывает, что в рассматриваемой точке базилярная мембрана наиболее чувствительна к сигналам этой частоты (чтобы создать такую скорость, требуется SPL всего 20 дБ). На октаву ниже, при 9 кГц, для той же скорости нужен сигнал на 15 дБ сильнее. В то же время кривая настройки нервного механизма (заштрихованная область на рис. 46) представляет минимум SPL сигнала данной частоты, на которую реагирует волокно, соединенное с данной точкой (например, увеличивает частоту возбуждения до превышения порога). Между настройкой базилярной мембраны и нервного механизма существует большее сходство, чем можно было ожидать на основании ранних измерений, проводимых на улитках мертвых животных. Микроэлектродные измерения на внутренних волосных клетках показывают, что соответствующие настроечные кривые очень похожи на такие кривые для афферентных нервных волокон; это означает, что процесс заострения резонанса в живых улитках должен происходить где-то в перегородке улитки, скорее всего в субтекто-риальном пространстве (рис. 9, а).

В настоящее время мёссбауэровская спектроскопия и новая лазерная техника позволяют проводить гораздо более точные измерения движения базилярной мембраны живых животных [77,142,143]. Результаты показывают, что при реальных условиях настроечные кривые базилярной мембраны действительно очень близки к таковым для внутренних волосных клеток или нервных волокон, связанных с тем же местом мембраны. Более того, измерения показывают, что резкость настроечной кривой базилярной мембраны значительно увеличивается, когда SPL стимула убывает в сторону порога. В самом деле, для данного одночастотного тона волокно слухового нерва, соединенное с резонансной областью, увеличивает свой отклик при увеличении амплитуды стимула, однако увеличение отклика, отнесенное к увеличению входного сигнала (т. е. отношение выход/вход в дБ/дБ) при низких интенсивностях стимула примерно в пять раз больше, чем при высоких. Такая «нелинейность» отклика объясняет обострение настроечных кривых и сжатие отклика при высокой интенсивности, приводящие к замечательному динамическому диапазону нашего уха (см. разд. 3.5).

Теоретические исследования показывают, что источником энергии для механизма усиления не может служить исходный звуковой сигнал [32]. Чувствительность, резкая частотная избирательность и нелинейность отклика базилярной мембраны должны быть связаны с активной механической обратной связью, создаваемой наружными волосными клетками. Это подтверждается тем фактом, что эти клетки могут изменять форму (в основном, длину) со звуковой частотой при электростимуляции [78]. Изменения формы влияют на локальную деформацию кохлеарной перегородки бегущей волной, возвращая затраченную энергию, что приводит к усилению волны. Подвижность наружных волосных клеток обеспечивается совместным действием молекул сократительного престина (белка, название которого происходит от музыкального темпа presto}, обнаруженных в латеральных мембранах клеток; скорость их действия настолько высока, что исключает электромеханические механизмы, подобные тем, которые действуют в обычных мышечных волокнах. Недавние измерения генерации сил сте-реоцилиями (см. стр. 208) наружных волосных клеток (точнее, связанными пучками стереоцилий) показали возможность существования второго механизма, связанного с механическими колебаниями [82].

Поскольку представляется определенным, что активация кохлеарного механизма обратной связи локально включается механической активацией самих наружных волосных клеток, можно ожидать, что этот процесс может управляться командами центральной нервной системы через эфферентные волокна оливокохлеарного пучка (см. стр. 223). Из-за насыщения отклика наружных волосных клеток при высоких уровнях стимуляции такое обратное действие ограничено низкими уровнями входного сигнала, не более 40 дБ над порогом. Очевидно, что для обеспечения необходимого быстродействия слуховой системы детектирование и усиление сигналов должно быть связано с процессами, происходящими внутри одной клетки, поскольку акустическая система не может позволить себе работать в неторопливом темпе нервной системы с ее временными масштабами в несколько миллисекунд и более!

В целом современное понимание [1,24,28] механизма кохлеарного усиления, которое поддерживает механический отклик базилярной мембраны, для одночастотного тона состоит в следующем:

  • 1. Синусоидальные колебания «поршня» в круглом окне (рис. 8, с5) выделяют на базилярной мембране бегущую волну, у которой максимум амплитуды занимает на мембране положение, зависящее от частоты.
  • 2. Локальные колебания вверх-вниз улавливаются стереоцилиями наружных волосных клеток, и этот процесс включает в каждой клетке электрический сигнал, заставляя сжиматься молекулы моторных белков и изгибаться соответствующие пучки стереоцилий синхронно с предъявляемым стимулом. Нервные сигналы от эфферентного оливокохлеарного пучка могут влиять на этот процесс в соответствии с командами, поступающими от мозга.
  • 3. Внутренние волосные клетки воспринимают механические колебания кохлеарной жидкости и преобразуют их в нервные сигналы в контактирующих волокнах.
  • 4. Синфазная механическая реакция наружных волосных клеток усиливает (гидродинамически или путем «сотрясения» текториальной мембраны) локальные колебания базилярной мембраны.
  • 5. При достижении некоторого верхнего предела клеточные реакции выравниваются или насыщаются, в противном случае... см. пункт (2)!

Возникает вопрос: почему описанный процесс обострения действует только в области максимального резонанса на базилярной мембране для данной частоты входного сигнала? В конце концов, колебания, хотя и с убывающей амплитудой, существуют и вдали от места максимальной амплитуды бегущей волны (рис. 28 и 34). Другими словами, почему усиливается не вся картина колебаний базилярной мембраны? Должен действовать какой-то второй механизм настройки! В самом деле, существуют экспериментальные указания на то, что сами стереоцилии настраиваются на локальную резонансную частоту и потому эффективно реагируют, только когда частота проходящей волны согласуется с частотой локального резонанса [82], а это происходит только вокруг резонансного максимума, соответствующего частоте входного сигнала (рис. 34).

Другая загадка связана с влиянием тепловых шумов. Стереоцилия вращается вокруг своего основания и запускает возбуждающий электрический импульс в соответствующей клетке при отклонении до некоторого определенного направления (и тормозящий импульс при противоположном направлении; при перпендикулярном направлении эффект не возникает, и это объясняет фазовую чувствительность возбуждения волокна слухового нерва, см. рис. 24). Поразительно, что порогу слышимости соответствует отклонение реснички всего на 0,003 градуса! Можно показать, что столь малые смещения должны возникать даже в отсутствие всякой акустической стимуляции из-за так называемого броуновского движения в эндолимфатической жидкости (мельчайшие частицы жидкости беспорядочно дрожат вследствие равновесных тепловых флуктуаций). Однако случайный шум смягчается тем фактом, что стереоцилии связаны в пучок сверхтонкими молекулярными нитями и двигаются как единое целое. Здесь, скорее всего, действует довольно универсальный физический механизм, называемый самоорганизованной критичностью [24].

1

Электрофизиологические исследования показывают, что частоты, к которым наиболее чувствительны волосные клетки, обратно пропорциональны длине пучков волосков, которая на протяжении базилярной мембраны увеличивается в несколько раз от основания (высокочастотного края) до вершины (низкочастотного края). Все это наблюдалось на улитках низших позвоночных, и пока не ясно, в какой степени это распространяется также на высших млекопитающих и человека.

Юг дБ

О -

  • -10 -
  • -20
  • -30 -
  • -40.
  • 1 000 1 200 1 400 1 600 1 800 Гц 2 000

Частота

Рис. 47. Пример спектра частот отоакустического излучения [179], измеренного чувствительным микрофоном в закрытом наружном слуховом канале. Нулевое значение SPL соответствует порогу слышимости

В заключение вернемся к «музыке из ушей». Как отмечалось выше, отоакустическое излучение представляет очень слабые звуки, которые можно обнаружить в плотно закрытом слуховом канале, уровень этих звуков обычно намного ниже порога слышимости. Существуют два основных типа — спонтанное излучение звука и излучение, вызываемое внешними звуковыми стимулами. На рис. 47 показан пример спектра спонтанного оптоакустического излучения [179] (нулевое значение SPL соответствует порогу слышимости). Спонтанное излучение сильно варьирует от одного человека к другому. Приблизительно у 50% людей с нормальным слухом обнаруживается одно или несколько таких излучений, то же имеет место у большинства животных. Отсутствие излучения не свидетельствует о каких-то аномалиях слуха (тиннитус, или «звон в ушах» в большинстве случаев не имеет отношения к излучению). Частота излучения охватывает область от 400 до 4 000 Гц, чаще всего от 1 000 до 2 000 Гц; для данного субъекта интенсивность излучения может заметно меняться в течение дня и даже варьировать в более коротких временных масштабах, однако частоты для каждой улитки весьма стабильны. Вызванное отоакустическое излучение измерить труднее, требуются передатчик, сформированный на зонде, и более сложный анализ микрофонных записей. Можно выделить два класса: излучение, возникающее одновременно с пробным тоном, и запаздывающий отклик на короткие звуковые импульсы. Есть некоторое сомнение, не является ли отоакустическое излучение побочным продуктом опи санной выше нелинейной обратной связи с участием наружных волосных клеток. Не известно, почему оно возникает в какой-то момент и почему имеет определенные частоты, можно лишь отметить, что схемы с активной обратной связью в общем случае обладают способностью к самовозбуждению и резонансу, возникающему после возбуждающего стимула. Отоаку-стическое излучение не играет никакой роли в музыке, однако является важным клиническим диагностическим средством; за дальнейшей информацией мы отсылаем интересующегося читателя к медико-технической литературе [4,48,179].

  • [1] В науке для измерения расстояний используется метрическая система мер. Единицей длины в ней служит метр (1 м = 3,28 футов); применяются также его десятичные доли (например, сантиметр = 0,01 м = 0,394 дюйма или миллиметр = 0,001 м) и кратные меры (например, километр = 1 000 м = 0,625 мили).
  • [2] Для интерпретации графиков, показанных на рис. 4 или 5, полезно имитировать описанные движения аналогичным движением руки вверх-вниз, представляя изменение расстояния (вдоль оси у) с течением времени (вдоль оси t).
  • [3] Подчеркнем, что построение в левой части рис. 6 является вспомогательным: реально лишь периодическое движение частицы Р вверх-вниз вдоль оси у.
  • [4] Попробуйте изобразить двумя руками два движения вверх-вниз, представленные в правой части рис. 7! Проделайте то же самое при различной разности фаз, например, при 180° (в противофазе), 0° (в одной фазе), 90° и т. д.
  • [5] В этой книге мы изображаем числа с помощью показателей степени: 10+п означает единицу с п нулями, а 10-п — это то же, что 1/10+п, т. е. десятичная дробь в виде единицы, стоящей на n-м месте после запятой с предшествующими нулями.
  • [6] Эта величина измерима лишь статистически в так называемом психометрическом эксперименте с вынужденным выбором. Когда разность частот двух тонов мала и слушателей просят определить, какой из них имеет большую высоту, они могут лишь гадать, и их оценки будут правильны на 50%. Если разность частот достаточно велика, правильными будут все 100% ответов. 75 % правильных ответов лежат на полпути между случайными догадками и надежным определением, так что соответствующая разность выбирается в качестве ДПЧ по частоте [60].
  • [7] Как проверить, что воспринимаемая высота результирующего тона действительно соответствует тону с частотой / = Д + Д//2? Это делается путем согласования тонов: испытуемому поочередно предъявляется эталонный тон регулируемой высоты и требуется изменять его частоту, пока он не услышит тон такой же высоты, какой обладает исходный тон.
  • [8] Это может удивить музыкантов: они заявят, что прекрасно различают два составляющих тона, когда на музыкальном инструменте исполняется малая секунда! Однако дело в том, что результаты, представленные на рис. 15, относятся лишь к суперпозициям чистых тонов, звучащих непрерывно с постоянной интенсивностью. При исполнении музыкального интервала на реальных инструментах звуки не являются простыми тонами, не звучат непрерывно и присутствует стереоэффект. Все это дает слуховой системе дополнительные намеки, которые эффективно используются для различения тонов. 2
  • [9] Возможно перекрытие нейронных сигналов на следующем уровне нервных путей, что приводит к эффектам второго порядка, которые мы обсудим в разд. 2.6-2.9. 2 В этом разделе мы рассматриваем биения только между чистыми тонами. Как мы увидим далее, аналогичные биения возникают и между сложными тонами реальных музыкальных инструментов.
  • [10] Тон более низкой частоты иногда называют корнем данного музыкального интервала.
  • [11] Причина такого разного поведения не вполне понятна. Не известно также, почему не ощущаются комбинации частот /2 + /1, 2Д + /2 и т.д.
  • [12] Внезапные изменения фазы (т. е. чередование расстроенных октавных интервалов с точными) также могут восприниматься. Способность к обнаружению достигает максимума при разности фаз 180° относительно исходного октавного интервала [130].
  • [13] Обратите внимание на то, что такой эксперимент необходимо проводить с парами синусоидальных сигналов, генерируемых электронной аппаратурой, — ни фортепиано, ни какой другой музыкальный инструмент для этого не годятся.
  • [14] К сожалению, эти интересные эксперименты нелегко воспроизвести даже в хорошо оборудованной учебной физической лаборатории!
  • [15] Далее мы будем обозначать основную частоту через /1 (а не /о, как в формулах (2.7а)-(2.7с) и на рис. 20), так что весь ряд гармоник сложного тона можно записать в виде /1, /2 = = 2/1, /з = 3/1, ... {fn = nfi, п 1}. В литературе основную частоту и частоту повторения часто обозначают через F0.
  • [16] Таким образом, время, за которое нервный импульс (потенциал действия), возбужденный мотонейроном в верхней части вашего мозга, достигает мышцы, управляющей движением пальца вашей ноги, составляет приблизительно 15 мс (в этом процессе участвуют миелинизированные волокна с общей длиной, скажем, 1,5 м с двумя или тремя промежуточными синаптическими стадиями, каждая из которых требует для передачи сигнала немного меньше миллисекунды). Время, которое требуется, чтобы передать нервную информацию из левой слуховой области коры в правую (этот процесс включает прохождение через 2 см серого вещества и 10 см белого вещества, если предположить отсутствие промежуточных синапсов), составляет приблизительно 70 мс — довольно большое время, если имеется в виду, например, обработка речевой информации (разд. 5.7)!
  • [17] 3десь имеется некоторое сходство с проблемой математического описания точного положения и скоростей всех молекул в газе: это невозможно с чисто практической точки зрения из-за огромного числа элементов и отсутствия непрерывности динамических параметров между двумя соседними элементами [4]! Статистическая термодинамика, развитая почти 150 лет назад Людвигом Больцманом, связывает математические средние таких молекулярных величин с традиционными переменными, определяющими термодинамическое состояние, — температурой, давлением, энтропией и т. п. Компьютерная томография типа функциональной магниторезонансной томографии и позитронно-эмиссионной томографии в некотором смысле показывает усредненную пространственно-временную активность нервной системы, однако имеется принципиальное отличие от термодинамики: в то время в газе имеются мириады различных распределений молекул, приводящие к одним и тем же динамическим средним, каждая картина микроскопической нервной активности в принципе представляет другую мысль, другое изображение, другую информацию.
  • [18] Неболыпая часть эфферентных волокон работает также на выход внутренних волосных клеток, но лишь косвенным образом: они образуют синаптические связи на афферентных волокнах, которые находятся в контакте с внутренними волосными клетками.
  • [19] Волны, бегущие в кохлеарной жидкости, в процессе распространения изменяют свои фазовые соотношения и, конечно, амплитуду, тем самым приводя к изменению реальной формы картины колебаний в различных точках базилярной мембраны.
  • [20] Сигналы с разными амплитудами звуковых волн, попадающих в два уха, в также с разными спектрами (тембрами) также вносят вклад в локализацию звука, особенно на высоких частотах и в замкнутом пространстве.
  • [21] Другой инвариантной характеристикой является высокая когерентность макроскопических временных изменений этой сложной картины возбуждений на всем пространстве базилярной мембраны. 2 Из-за такого перекрытия колебания базилярной мембраны описывают математическими моделями или эквивалентными электронными схемами набора фильтров с узкой полосой частот у вершины мембраны (рис. 8, б) (пропускающих только одну гармонику) и с широкой у ее основания (пропускающих несколько соседних гармоник).
  • [22] Это было осуществлено на лабораторной модели путем надлежащего уменьшения электрических сопротивлений между передающими линиями (строками и столбцами матрицы), которые одновременно возбуждаются (проводят ток) под действием некоторого заданного периодически повторяющегося входного сигнала. В настоящее время нейронные сети численно моделируются на компьютере (это обсуждается в приложении В).
  • [23] Эта структура, получающая необработанные данные от органов чувств и остального организма, а также сложную информацию от коры мозга, состоит из нескольких маленьких ядер позади мозгового ствола; она ответственна за активацию или подавление обработки мозговой информации в соответствии с сиюминутными нуждами, контролирует сон, пробуждение, осознание действительности и даже самосознание, а также влияет на многие функции внутренних органов. Повреждение компонент этой диффузной сети, что случается при резком ударе по задней стороне шеи, может привести к необратимой коме.
  • [24] «Точка» среды понимается здесь в макроскопическом смысле, на самом деле она содержит миллиарды молекул!
  • [25] «Градуированная» означает, что мы заранее определили, на сколько растягивается пружина заданной силой, например, под действием данного веса.
  • [26] Покажем, как возникает «характеристическая частота» нервного волокна в акустическом нерве (стр. 198). Рассмотрим нейрон, соединенный с волосными клетками, находящимися в положении А (рис. 34). Его реакция будет определяться амплитудой локальных колебаний базилярной мембраны. При постепенном повышении частоты предъявляемого тона, начиная с очень низкой, полная картина, показанная на рис. 34, будет перемещаться с дальнего правого края к дальнему левому. Когда огибающая колебаний проходит над точкой А, реакционная способность нейрона увеличивается до максимума (это соответствует характеристической частоте — см. рис. 28) и затем резко спадает, когда картина уходит влево.
  • [27] 0братите внимание на то, что складываются вариации давления, а не абсолютные значения давления! 2 Линейность нарушается при очень громких (интенсивных) звуковых волнах, например, создаваемых взрывом.
  • [28] Обозначения, принятые в музыке, в действительности нс представляют абсолютной меры громкости. Например, музыканты будут утверждать, что мы вполне способны воспринимать все фортиссимо и пианиссимо в музыке, исполняемой по радио, при громкости, приглушенной до шепота. В этом случае мы просто используем другие показатели, помимо интенсивности, для субъективной оценки «относительной» громкости, особенно если исполняемая пьеса нам знакома. В то же время систематические эксперименты [НО] показали, что интерпретация громкости, обозначаемой в музыкальных текстах, в реальном динамическом контексте сильно зависит от инструмента и охватываемой области частот.
  • [29] 2 ванию высот звуков.
  • [30] Существует известная аналогичная ситуация, связанная с ощущением боли. Если уколоть в двух местах, очень близких одно к другому, то боль будет «вдвое сильнее», чем при одиночном уколе. Если же места уколов находятся достаточно далеко одно от другого, нам трудно ощутить некую «общую боль». Вместо этого мы сосредоточиваемся на источнике наибольшей боли. 2 Такое добавление приводит к изменению тембра (см. разд. 4).
  • [31] Многие органы в стиле барокко имеют регистр, именуемый «Zimbelstern» («цимбальная звезда»), в виде миниатюрных цимбал или колокольчиков, укрепленных на вращающейся звезде поверх корпуса органа. Этот регистр использовался для усиления громкости финального аккорда (без какого-либо влияния на его гармонию, поскольку частоты выше 5 000 Гц не действуют па восприятие периодических топов в обычной музыкальной области частот).
  • [32] Существует общий физический принцип, согласно которому частота колебаний (а следовательно, и соответствующая высота тона) не может быть определена с точностью, лучшей, чем обратная величина длительности колебаний.
  • [33] Это нс следует путать с акустической усталостью — психологическим процессом, благодаря которому наш мозг способен игнорировать постоянный, но ненужный сигнал.
  • [34] Со звуками, извлекаемыми из музыкальных инструментов, дело обстоит сложнее: во время нарастания звука, которое может достигать несколько десятых секунды, происходит естественное изменение интенсивности и спектра, при этом нс стоит забывать про эффект реверберации (см. разд. 4.7).
 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ   След >