Выполнил студент группы 09-ОЗИ1:
Андреев А.Ю.
Преподаватель:
Дракин А.Ю.
ЭЛЕКТРОАКУСТИЧЕСКИЕ СИСТЕМЫ
Введение
Электроакустическая техника (в широком понимании данного термина)решает задачи двух направлений. Первое это регистрация звука, когда звуковая информация преобразуется в электрические сигналы и, затем, запись – фиксация этих сигналов на носителе информации для хранения (либо передача на расстояние – трансляция). Второе направление это воспроизведение электрических сигналов, сохраненных на носителе (либо прием транслированных сигналов) и, затем, воссоздание звука – преобразование этих электрических сигналов в звуковые колебания. Результатом работы аудиотехники является возможность в удобных для слушателя условиях и в удобное время создавать максимально реалистичный звуковой образ (звучание музыки, звуковое сопровождение видеофильма, игровой или обучающей компьютерной программы и т.п.). Комплекс аппаратуры, реализующий такие задачи, называют системой звукопередачи (СЗП).
Аудио-сигнал
"Звуковые волны описываются колебаниями звукового давления p(t). В основе регистрации звуковой информации лежит формирование электрического сигнала U(t)(для определенности будем полагать, что это напряжение, В), форма которого повторяет зависимость p(t) в точке регистрации
Электрический сигнал, соответствующий условию (2.1), будем называть аудио-сигналом. В простейшем случае, информация переносимая звуковой волной может быть передана посредством одного аудио-сигнала, соответствующего интегральному звуковому давлению в точке регистрации. Для целей более полноценной регистрации и воссоздания звукового поля используют два или несколько аудио-сигналов, отражающие звуковые давления в разных точках, либо звуковые волны от разных направлений. Набор аудио-сигналов, несущих информацию о звуковом поле, зафиксированных на каком-либо носителе, называют фонограммой.
Аудио-сигнал пропорционален акустическому колебанию, поэтому U(t)является функцией с ограниченным частотным диапазоном (в общем случае полагают, что нижняя граница fН ≈ 20 Гц, а верхняя граница fВ ≈ 20 кГц) и его характеристики соответствуют характеристикам звуковых волн. Поскольку методы создания электроакустических преобразователей и СЗП связаны с формированием, обработкой, хранением/передачей и преобразованием аудио-сигналов, необходимо рассмотреть основные характеристики и параметры, описывающие свойства аудио-сигналов." (1)
Параметры аудио-сигнала, как функции времени
"Прежде всего, аудио-сигнал задается непосредственно видом функции
U(t) – формой сигнала. В зависимости от характера исходного звука,
функция U(t) может быть в достаточной степени произвольна, представлять собой как регулярный (например, чистый тон – гармоническое колебание) так и случайный (например, акустический шум) сигналы. Однако U(t) знакопеременная функция с нулевым средним, т.к. частотный диапазон ограничен снизу. Пример фрагмента аудио-сигнала музыкальной фонограммы показан на рисунке 2.1.
Как и в случае любых других сигналов, свойства аудио-сигнала можно описывать большим количеством характеристик и параметров, имеющих разный физический смысл. В первую очередь, к таким параметрам можно отнести амплитуду (пиковое значение) Um, среднюю мощность P, действующее значение (среднеквадратическое значение, эффективное значение) UД
Заметим, что введенная в (2.2) средняя мощность P имеет размерность В2. Точное соответствие с мощностью в Вт будет при условии, что сигнал выделяется на единичном сопротивлении. В противном случае, при необходимости формального соответствия размерности Вт, можно ввести поправочный множитель, обратный нагрузке.
Для того чтобы охарактеризовать скорость изменения значения сигнала U(t) нередко используют понятие характерной постоянной времени сигнала С, которую можно определить как среднее время между соседними экстремумами сигнала. Отметим, что С тесно связана с периодом основных спектральных составляющих сигнала. С учетом диапазона звуковых частот, для различных фрагментов аудио-сигналов характерные постоянные времени могут составлять от Сmin ≈ 10÷50 мкс, до Сmax ≈ 10÷50 мс.
Поскольку характер аудио-сигнала может существенно отличаться для
разных участков времени, часто удобно рассматривать указанные параметры не для всего сигнала, а на интервалах времени протяженностью τ
Практическое использование величин Um(t), P(t), UД(t) обязательно требует указания значения , при котором они определялись. Приборы, основанные на аналоговых преобразователях, как правило, измеряют именно такие параметры, а постоянная времени задается устройством прибора. Отметим, что значение , обычно значительно больше, чем характерные времена изменения сигнала: >> С. В противном случае характеристики (2.3) будут меняться так же быстро, как и значение U(t) и, в результате будут терять исходный физический смысл.
Иногда сигнал U(t) представляют через огибающую A(t) и мгновенную частоту fМ(t) (либо мгновенную фазу ϕМ(t))" (1)
"Если, сигнал U(t) близок к гармоническому сигналу, т.е. основная мощность сосредоточена в узкой полосе частот: ∆f = (fВ–fН) << fСР=(fВ + fН)/2, то А(t) и fM(t) являются медленно меняющимися сигналами (верхняя граница их частотного диапазона ≈ ∆f) и по физическому смыслу соответствуют амплитуде и частоте квазигармонического колебания в данный момент времени. Если сигнал U(t) является широкополосным: ∆f ≈ fСР , то А(t) и fM(t) теряют наглядный физический смысл. Для анализа характера колебаний огибающей сложных аудио-сигналов часто целесообразно дополнительное усреднение с некоторой постоянной времени τ." (2)
"При одинаковом выборе постоянной времени усреднения , форма сигнала АС(t) примерно соответствует форме сигналов Um(t) и UД(t). Пример огибающей приведен на нижнем графике рисунка 2.1.
Для широкополосных звуков среднее и максимальное значения мгновенной частоты примерно соответствуют частоте области максимума и верхней частоте спектра сигнала." (1)
Спектральные характеристики аудио-сигнала
"Важный и эффективный подход к описанию свойств сигнала U(t) – спектральное представление, при котором сигнал характеризуется спектром SU(f) задаваемым с помощью известного интегрального преобразования Фурье (или разложением сигнала в ряд Фурье, если сигнал близок к
периодическому).
Обычно аудио-сигналы имеют относительно большую длительность (длительность T >> 1/fН) и по спектральным свойствам близки к сигналам с неограниченной длительностью, причем, как правило, непериодическим. Кроме того, реальные аудио-сигналы (или их составляющие) часто обладают свойствами случайных функций. Поэтому применение прямого интегрального преобразования Фурье к функции U(t) вызывает известные
трудности, и для спектрального анализа аудио-сигналов часто используют
спектральную плотность мощности SP(f).
Строго говоря, спектральный анализ подразумевает замену рассмотрения
сигнала U(t) как функции времени на рассмотрение его спектра S(f), который не зависит от времени. Спектр содержит информацию о сигнале U(t) на всем
промежутке времени его существования. Однако с течением времени характер аудио-сигнала может значительно изменяться, причем в
спектральном представлении более «медленные» изменения отражаются в более «узкополосной» детализации спектра. Поэтому часто оказывается удобным рассматривать спектры фрагментов сигнала на отдельных
интервалах времени (иногда их называют мгновенными спектрами) SМ(f) =
F(U(t)|t∈t-τ; t) и анализировать изменение спектра сигнала во времени. Символом F в обозначено используемое спектральное преобразование, – длительность фрагментов сигнала. Такое «спектрально-временное» рассмотрение сигнала не будет противоречивым, если правильно интерпретировать смыл спектра сигнала, ограниченного «временным окном», и согласовывать при анализе постоянные времени изменения мгновенного спектра, спектральное разрешение и длину временного окна." (4)
Верхний график – звучит фраза: «Yesterday».
Средний график – выделенная часть фрагмента (слог «Yes»).
Нижний график – примерный вид зависимости амплитуды или огибающей сигнала для приведенного фрагмента.
"Форма S(f) может быть самой разнообразной в зависимости от характера звука. Верхняя и нижняя границы (fВ и fН) диапазона частот, в котором S(f)может быть отлична от нуля в общем случае должны соответствовать граничным частотам слуховой системы человека. Считается, что значение fН находится в пределах от 10 до 20 Гц. Значение fВ полагается равным 20 кГц, хотя известно, что для многих людей она может быть существенно ниже, а так же значительно снижается с возрастом. В качестве полного диапазона частот аудио-сигнала, как правило, принимают диапазон 20 Гц – 20 кГц.
В общем случае аудио-сигнал является широкополосным сигналом, т.к. fВ превышает fН на 2–3 порядка. Для описания особенностей, связанных с разными спектральными областями аудио-сигнала весь диапазон звуковых частот (ЗЧ) разделяют на три основных части: нижние (басы), средние и высокие звуковые частоты (не путать с диапазонами низких, средних, высоких и сверхвысоких частот радиосигналов), каждая из которых так же разделяется на поддиапазоны. Примерные границы диапазонов, которые обычно подразумеваются при таком делении, приведены в таблице 2.1. На рисунке 2.2. приведены типовые спектры средней мощности SP(f) для речевых и музыкальных (симфонический оркестр) аудио-сигналов." (1)
Таблица 2.1. Деление области звуковых частот на диапазоны.
Границы диапазона, Гц | Название диапазона | |
< 40 | Нижний бас | Нижние ЗЧ (басы) |
40 – 100 | Средний бас | Нижние ЗЧ (басы) |
100 – 250 | Верхний бас | Нижние ЗЧ (басы) |
250 – 500 | Нижние средние | Средние ЗЧ |
500 – 1000 | Средние | Средние ЗЧ |
1000 – 2000 | Верхние средние | Средние ЗЧ |
2000 – 3500 | Нижние высокие | Высокие ЗЧ |
3500 – 6000 | Средние высокие | Высокие ЗЧ |
6000 – 10000 | Верхние высокие | Высокие ЗЧ |
> 10000 | Высшие | Высокие ЗЧ |
"Как видно из рисунка 2.2., область максимального уровня спектральных составляющих находится в диапазоне сотен Гц, составляющие в диапазоне выше нескольких кГц в десятки раз ниже уровня основных составляющих. Следует отметить, что низкий относительный уровень высоких звуковых частот свидетельствует об их малом информативном значении. Однако их наличие является важным для естественности звучания и качества звукового образа.
С точки зрения максимально полной передачи звуковой информации,
аудиоаппаратура должна обеспечивать указанный выше рабочий диапазон частот 0,02 – 20 кГц. С другой стороны, для упрощения аппаратуры, увеличения емкости носителей, снижения требуемой пропускной способности каналов передачи аудио-сигналов желательно уменьшать этот частотный диапазон, т.е. снижать fВ и увеличивать fН. Кроме того, дополнительные ограничения на реализуемый диапазон частот, особенно в области нижней границы, связаны с проблемами создания излучателей звука. Поэтому возникает вопрос: как влияют такие ограничения на восприятие звука, в каких пределах разумно ограничивать рабочий диапазон частот аудио-сигнала.
В качестве критерия допустимости ограничения диапазона частот аудио- сигнала обычно подразумевают заметность введенного ограничения, количественно выражаемую в %-ом уровне слушателей (экспертов), которые замечают наличие данного ограничения. Согласно результатам исследова- ний, заметность сдвига границ fВ или fН существенно зависит от характера звука. На рисунке 2.3 показаны примеры зависимости заметности от значений fВ и fН для разных типов звуковых программ." (1)
"Выбор конкретных значений fВ и fН для аппаратуры является компромиссом между желаемым снижением технико-экономических требований и желаемым уровнем сохранения качества звуковой информации.
В бытовой технике разных видов, форматов и стандартов (телефония, грамзапись, АМ и ЧМ радиовещание, ТВ, видео, КД/CD и т.д.) предусмотрены разные значения fВ и fН. Учитывая принятые в различной аппаратуре допуски на частотный диапазон можно заключить, что «хорошее» качество звучания обеспечивается при fН =100 – 150 Гц, а fВ =3–5 кГц для речи, и fВ =8 –10 кГц для музыки. Для «высокого качества» обычно полагают достаточным диапазона fН =30 Гц, fВ =15 кГц. Для полной передачи звуковой информации, как уже отмечалось, fН = 20 Гц, fВ = 20 кГц." (2)
Изменение уровня аудио-сигнала
"При обобщенном рассмотрении, непосредственно уровень значений Um(t), P(t), UД(t) слабо характеризует свойства сигнала. Важную информацию дают скорость и диапазон изменения этих величин. Скорость изменений отражает характерная постоянная времени сигнала С, рассмотренная ранее, а диапазон изменений чаще всего характеризуют динамическим диапазоном NД и пик- фактором (коэффициентом амплитуды) NП аудио-сигнала.
Под динамическим диапазоном осциллирующих сигналов обычно
понимают отношение максимального и минимального значения Um(t), однако определение может уточняться в зависимости от характера сигналов и ограничивающих их величину факторов. Для аудио-сигналов динамический диапазон обычно определяется отношением уровня Umax, выше которого сигнал находится не более 1% времени звучания и уровня Umin, ниже которого сигнал находится так же не дольше 1% времени звучания. Таким образом, 98% времени (или же с вероятностью 98%) уровень сигнала находится в пределах между Umax и Umin. Пик-фактор аудио-сигнала задают как отношение уровня Umax к среднеквадратическому значению сигнала
Учет величины динамического диапазона и пик фактора фонограмм важны для правильного выбора параметров аудиоаппаратуры, обеспечивающих защиту трактов и носителей от перегрузок, отсутствие значительных искажений сигналов и ухудшения отношения сигнал/шум. Часто при подготовке фонограмм аудио-сигналы подвергаются специальной обработке, изменяющей NД и NП для лучшего согласования с аппаратурой. Для речи типичные значения динамического диапазона и пик-фактора составляют NД ≈
25 ÷ 40 дБ, NП ≈10 ÷ 12 дБ, для звука симфонического оркестра – NД ≈ 65 ÷ 80
дБ, NП ≈ 20 ÷ 30 дБ.
При серьезном анализе свойств аудио-сигналов, кроме приведенных
основных характеристик сигналов могут использоваться и множество других параметров и характеристик. Например, ряд статистических и вероятностных
характеристик уровней сигнала и др." (1)
Системы стереофонического звучания
Общая структура системы звукопередачи
"Обобщенная структура современной системы звукопередачи (СЗП) может быть представлена рисунком 2.4. Данная структура предполагает, что на
этапе регистрации реального или синтеза виртуального звукового поля информация о звучании представляется в виде набора аудио-сигналов, хранение (запись-воспроизведение) или передача (трансляция) которых осуществляется системой хранения/передачи с числом каналов NК. Для воссоздания звука в помещении прослушивания (вторичном помещении) используется NГ громкоговорителей (излучателей)." (1)
"Формирование аудио-сигналов каналов {U1, …, UNк} выполняют профессиональные звукорежиссеры, готовящие фонограмму с музыкальным произведением, звуковым сопровождением фильма и т.д. В общем случае можно отобразить этот процесс как преобразование набора NC исходных регистрируемых аудио-сигналов преобразователем П1. В целом, выбор алгоритма получения сигналов каналов, несущих информацию о звуковом поле – задача профессиональная, творческая и в данном курсе почти не затрагивается. Напротив, запись-воспроизведение (либо прием трансляции) и формирование сигналов громкоговорителей {UГ1, …, UГNг} осуществляется аудиотехникой потребителей, алгоритмы и параметры этих процессов должны быть стандартизированы.
Один из важнейших факторов, определяющих работу СЗП – это значения NК и NГ. В простейшем случае NК=NГ. Тогда, как правило, преобразователь П2 отсутствует и на стадии формирования сигналов каналов фактически формируют сигналы излучателей. Такими обычно являются монофоническая система, одна из самых распространенных – двухканальная стереофоническая система, квадрафоническая система, стремительно распространяющиеся современные бытовые многоканальные системы домашнего кинотеатра (видеотеатра)." (3)
"Однако ход развития СЗП таков, что на практике возможно NК ≠ NГ. В этом случае система СЗП обязательно включает преобразователь П2, трансформирующий набор сигналов каналов в сигналы излучателей.
Количество каналов NК и сигналов громкоговорителей NГ непосредственно влияет на устройство аппаратуры массового потребителя. Рост количества каналов и излучателей напрямую связан с ростом сложности, стоимости, габаритов аппаратуры, а так же снижением емкости носителей и трактов передачи звуковых сигналов. Тем не мене, в результате стремления улучшить качество звучания и мощного развития техники хранения и обработки информации, бытовые электроакустические системы постоянно развивались в направлении увеличения NК и NГ.
Поскольку при внедрении новой аудиоаппаратуры ограничение на число
каналов оказалось более жестким, чем на количество излучателей, получили распространение системы звучания с NК < NГ. Примером таких систем являются псевдоквадрафонические матричные системы, широко распространенная двухканальная система для домашнего кинотеатра «Dolby Pro Logic Surround».
Рисунок 2.5 поясняет взаимосвязь развития СЗП путем увеличения NК и увеличения NГ. Сплошной линией показаны варианты СЗП получившие широкое распространение в бытовой аппаратуре, пунктиром показаны варианты систем получившие ограниченное распространение в бытовой аудиотехнике. Принципы работы и примеры упомянутых систем будут рассмотрены ниже." (4)
Следует подчеркнуть, что, несмотря на указанные принципиальные различия, этапы формирования сигналов каналов и формирования сигналов излучателей взаимосвязаны. Разработка алгоритмов работы П1, хотя и не должна быть стандартной, но неизбежно опирается на алгоритм работы П2. И наоборот, при разработке алгоритмов работы П2 приходится подразумевать определенные методы регистрации информации о звуковом поле в сигналах каналов.
Современные бытовые системы излучения звука
"Возможности воссоздания реалистичного звукового поля в помещении прослушивания существенно зависят от параметров системы излучения звука: количества (и, конечно, качества) громкоговорителей, их расположения относительно слушателя. Базовые аспекты формирования т.н.
кажущихся источников звука (КИЗ) системами из двух и нескольких излучателей рассмотрены в первой части данного курса, п. 1.6.2, 1.6.3.
К современному моменту можно выделить три варианта систем излучения
звука, получившие массовое распространение для бытовой аудиотехники.
1. Монофоническая система излучения звука, содержащая один громкоговоритель. Она является наиболее простой, однако не имеет
возможности передавать информацию о пространственном расположении ИЗ, что резко ограничивает качество звучания и реалистичность создаваемого звукового образа.
2. Система с двумя излучателями, часто называемая стереофонической, содержащая два излучателя, расположенных симметрично впереди слушателя: правый П (R – right) и левый Л (L – left). Обычно полагается, что
места положения слушателя и излучателей должны находиться в вершинах равностороннего треугольника (рисунок 2.6, а). Иногда рекомендуют повернуть излучатели в направлении на слушателя (рисунок 2.6, б)." (2)
"Современный стандарт многоизлучательной аудиосистемы часто называемый аудиосистемой домашнего кинотеатра (home theater). Он подразумевает использование шести громкоговорителей (рисунок 2.7).
Локализация КИЗ определяется пятью из них: правым фронтальным – ПФ (R
– right), левым фронтальным – ЛФ (L – left), центральным – Ц (С – center), правым тыловым – ПТ (RS – right surround) и левым тыловым – ЛТ(LS – left surround). ПФ, ЛФ и Ц излучатели располагаются впереди слушателя. Для выравнивания расстояний до слушателя Ц громкоговоритель размещают чуть глубже линии, соединяющей ПФ и ЛФ излучатели. Тыльные громкоговорители располагают по бокам от слушателя или немного сзади, и, как правило, немного выше слушателя. Низкочастотный громкоговоритель – НЧ (SW – subwoofer) – служит для излучения звуков в диапазоне частот f≤150
Гц. Выделение отдельного НЧ громкоговорителя обусловлено сочетанием технических особенностей построения таких излучателей и того
обстоятельства, что звуки указанного низкочастотного диапазона не влияют на слуховую ориентацию. В силу последнего фактора, громоздкий НЧ излучатель может располагаться практически произвольно,
однако с учетом влияния на НЧ звук акустики помещения. Такой вариант системы излучения звука в последнее время становится основным стандартом для домашних аудио-комплексов." (3)
Двухканальные системы стереофонического звучания
Отличие двухканальной СЗП от монофонической заключается в том, что посредством различий аудио-сигналов двух каналов, возможно передать информацию о пространственной ориентации источников звука.
Традиционное построение двухканальной стереосистемы
Традиционным вариантом двухканальной системы звукопередачи, часто называемой просто стереофонической системой, является простая схема с NГ=NК=2 и непосредственной подаче сигналов каналов на громкоговорители системы с двумя излучателями без преобразователя П2
"Использование интенсивностного и временного механизмов смещения КИЗ позволяет при формировании фонограммы регулировать направление расположения КИЗ в области перед слушателем. За счет этого можно добиться желаемого расположения и пространственной демаскировки создаваемых фронтальных КИЗ, передать их движение. В результате двухканальная стереофоническая система обеспечивает качественное воспроизведение музыки, реалистичное воссоздание звукового образа в области перед слушателем. Звучание двухканальной стереофонической системы уверенно предпочитается слушателями по сравнению с монофоническим вариантом (даже если сигналы стереопрограммы в некоторых пределах уступают монофоническому сигналу по отношению С/Ш, уровню нелинейных искажений и ширине частотного диапазона).
Качественное и реалистичное звучание, получаемое за счет возможности формирования пространственно разнесенных КИЗ в двухканальной
стереофонической системе называется стереоэффектом.
Используемые для получения стереоэффекта возможности формирования
КИЗ системой двух излучателей, достигаются в предположении определенного расположения слушателя (обычно подразумевается, что положения слушателя и громкоговорителей образуют вершины правильного треугольника с длиной сторон 2–5 метров). При смещении слушателя от оптимального положения стереопанорама искажается и сужается, отмечается снижение качества и реалистичности звучания (переход от полного стереоэффекта к частичному стереоэффекту, рис.2.8). При значительном смещении слушателя от оптимальной области, создаваемые КИЗ стереопанорамы сливаются и характер звучания становится аналогичен монофоническому (отсутствие стереоэффекта). Описанные свойства звучания двухканальной стереофонической СЗП с двумя громкоговорителями соответствуют расстояниям между излучателями от одного до нескольких метров. В противном случае формирование качественной стереопанорамы становится затруднительным.
В итоге, к основным ограничениям традиционной стереофонической СЗП
следует отнести возможность формирования стереопанорамы только во фронтальной области, а так же существенную ограниченность области положения слушателя в которой достигается качественный стереоэффект." (3)
Системы с расширением стереобазы
"Как было отмечено, традиционная двухканальная стереофоническая система звукопередачи имеет ограниченные возможности. Качество звучания
может снижаться при малом расстоянии между излучателями (например, в портативных проигрывателях) и при неоптимальном взаиморасположении
излучателей и слушателя. Зона стереоэффекта существенно ограничена.
Добиться некоторого улучшения качества звучания СЗП, адаптировать ее к системе излучения можно путем применения дополнительного преобразователя сигналов П2, осуществляющего линейные преобразования сигналов каналов {UЛ; UП} для получения сигналов правого и левого громкоговорителей {UЛГ; UПГ}.
В простейшем случае (рисунок 2.9, а) преобразование сводится к добавлению к сигналу канала сигнала альтернативного канала в противофазе
где а – некоторый коэффициент при добавляемой составляющей альтернативного канала. За счет проявления эффекта “сверхбаза” (см. часть
1, п. 1.5, 1.6), такое преобразование позволяет увеличить разность формируемых бинауральных сигналов и расширить стереопанораму. Более значительного эффекта можно добиться с применением в П2 коррекции АЧХ специальным фильтром Ф и введения задержки , рисунок 2.9, б. Еще более общий случай – использование сложного линейного преобразования (коррекция АЧХ, ФЧХ и задержка) обоих слагаемых (2.8), рисунок 2.9, в.
Такие системы («расширение стереобазы», «объемный звук», «звук вокруг» и т.п.) применяются, прежде всего, в портативной стереофонической аудиотехнике с малой базой между громкоговорителями и позволяют добиться того, что формируемая фронтальная стереопанорама значительно расширяется и окружает слушателя." (1)
"Следует отметить, что использование сложных линейных преобразований сигналов каналов (с коррекцией АЧХ, ФЧХ, задержки) при формировании сигналов излучателей можно интерпретировать как некоторое подобие методов бинауральных технологий формирования звукового образа (см. часть 1 п.1.6.2.).
Бинауральные системы
Описанные способы построения СЗП направлены на получение стереоэффекта и расширение зоны стереоэффекта при
формировании фронтальной стереопанорамы. Долгое время это было основной задачей СЗП, обеспечивающих воссоздание звукового образа
«концертного зала» или звукового сопровождения фильмов. Однако, с ростом требований к сложности и реалистичности воссоздаваемого звукового образа, формирование только фронтальной стереопанорамы стало недостаточным. Современные СЗП должны создавать КИЗ во всех
направлениях. Очевидно, что относительно простые методы временного и интенсивностного смещения КИЗ в системе с двумя излучателями не позволяют реализовать данные требования.
Тем не менее, система излучения звука с двумя громкоговорителями позволяет реализовать практически полную объемную стеропанораму на основе применения т.н. бинауральных технологий (часто называемых HRTF
методами) формирования сигналов излучателей. Достижение такого реалистичного режима звучания иногда называют «бинауральным эффектом». Суть бинауральных технологий формирования КИЗ была
разобрана в части 1 данного курса (п.1.6.2.).
Из принципов бинауральных технологий формирования сигналов излучателей следует, что для достижения высокой точности синтеза стереопанорамы необходимо установление и жесткое поддержание условий излучения звука, прежде всего, точного и фиксированного взаиморасположения излучателей и головы слушателя. Такое условие резко ограничивает привлекательность бинауральных методов для бытовой аудиотехники. Более простым и устойчивым является достижение бинаурального эффекта при применении головных телефонов. Однако естественность восприятия звука при использовании головных телефонов ограничена, и, вдобавок, при движениях головы вся стереопанорама претерпевает неадекватные сдвиги. Кроме того, бинауральные технологии подразумевают наличие мощных средств обработки звуковых сигналов, теоретическое и эмпирическое формирование и использование больших банков сложных передаточных функций. Технические возможности для реализации таких технологий в бытовой аудиотехнике появились только в последние годы.
В силу указанных причин, современная техника СЗП преимущественно развивается в направлении увеличения количества громкоговорителей в
системе излучения звука." (1)
Пассивные матричные системы
"Ввиду трудностей, связанных с применением бинауральных технологий, в практических СЗП более активно развивалось другое направление. Рост возможностей двухканальной СЗП, прежде всего, расширение области возможной локализации КИЗ и области стереоэффекта обеспечивалось путем
увеличения числа громкоговорителей (NК=2, но NГ>2), рисунок 2.10. В такой системе необходим преобразователь П2.
В качестве относительно просто реализуемого метода преобразования сигналов стали применять линейное суммарно-разностное преобразование
где ai и bi – некоторые коэффициенты, которые могут быть как положительными, так и отрицательными. Кроме того, часто использовались еще и сдвиги сигналов по фазе на ±90о. Структура преобразователя П2, реализующего такой принцип показана на рисунке 2.11. Системы с применением таких линейных преобразований сигналов называют матричными системами или пассивными матричными системами. В последнем названии подчеркивается то, что алгоритм работы линейного преобразователя П2 фиксирован и не зависит от параметров поступающих входных сигналов.
Следует отметить, что в матричной СЗП с NК=2, линейным преобразователем П2 и NГ>2 сигналы излучателей не могут быть полностью независимыми. Это обстоятельство обуславливает принципиальную ограниченность качества звучания такой системы по сравнению с СЗП, в которой такое же число излучателей, но NК=NГ т.е. сигналы излучателей передаются независимо. Попытка сформировать с помощью линейного преобразователя (рис. 2.11) определенную составляющую uГi в сигнале i-го громкоговорителя неизбежно сопровождается появлением аналогичных составляющих в других каналах." (2)
Адаптивные матричные системы
"Ограниченность качества круговой стереопанорамы пассивных матричных СЗП определяется принципом формирования сигналов линейным
преобразователем П2. Между тем, очевидно, что, с одной стороны, с помощью 2-х каналов можно передать полноценную информацию о объемной стереопанораме, а, с другой стороны, схема с несколькими громкоговорителей способна хорошо воспроизводить КИЗ со всех сторон от
слушателя. Для эффективного действия структуры, показанной на рисунке рисунок 2.10, декодер должен «извлечь» информацию о направлении в котором надо создать КИЗ и распределить сигнал на нужный излучатель, или пару излучателей, остальные громкоговорители не должны звучать. Поскольку линейное матричное преобразование с постоянными коэффициентами не может реализовать такой принцип, то следующим шагом развития матричных СЗП стали т.н. адаптивные матричные системы, в которых коэффициенты суммарно-разностного преобразования (2.9.) изменяются в результате совместного анализа сигналов U1 и U2
Возможная структура декодера адаптивной матричной системы показана на рисунке 2.16. Для изменения (адаптации) коэффициентов суммарно- разностного преобразования используются усилители, управляемые напряжением. Декодер содержит блок анализа входных сигналов, который в зависимости от текущих сигналов UЛ, UП формирует управляющие сигналы UУПР для усилителей.
Принцип действия адаптивных матричных СЗП можно пояснить на примере систем подобных ABC, где направление ИЗ задается соотношением уровней UЛ/UП. Качественный вид зависимостей коэффициентов усиления каналов громкоговорителей ki от UЛ/UП, задаваемых блоком анализа имеет вид, показанный на рисунке 2.17." (2)
"Эффективность формирования КИЗ в адаптивной матричной СЗП может быть достаточно высокой, почти такой же, как и в многоканальной системе с NК=NГ. Коэффициенты сik (уровень паразитных составляющих) можно снизить практически до нуля, т.к. КИЗ формирует только пара излучателей, а оставшаяся пара в это время полностью отключена соответствующими сигналами управляющими усилителями. Однако все эти преимущества хорошо реализуются при условии, что формируется только один КИЗ! Действительно, если одновременно должны звучать два источника: КИЗ(1) и КИЗ(2), то информация о их направлениях связана с соотношением компонентов от каждого источника. В результате суммирования их составляющих в общих сигналах
общее соотношение UЛ/UП уже не может отражать информацию одновременно о двух направлениях звучания и описанный выше принцип не может формировать правильное звучание двух (или нескольких) КИЗ.
Для того, что бы осуществить правильное распределение компонент сигналов КИЗ(1) и КИЗ(2) в сигналы громкоговорителей необходимо разделить пары сигналов а затем каждую из них независимо обработать по алгоритму вида (2.14). Подобное разделение и независимую
обработку осуществляет мозг при анализе бинауральных сигналов. Такая процедура требует очень мощного и сложного корреляционного анализа сигналов (2.15), и, учитывая возможное
произвольное число КИЗ, практически нереализуема доступными средствами.
В силу указанных обстоятельств, современные адаптивные матричные
СЗП работают в одном из двух режимов: режим «один КИЗ» (или
«преимущественный КИЗ») и режим «много КИЗ», рисунок 2.18. В первом случае работает адаптивный алгоритм с изменяющимися параметрами и
создается хорошо локализованный КИЗ. Во втором случае действует алгоритм пассивного матричного декодера с фиксированными параметрами, что обеспечивает формирование нескольких разнесенных, но менее точно
локализованных КИЗ. Переключение режимов осуществляется на основе сравнения сигналов каналов {UЛ;UП} и определения их коррелированности, поскольку в случае звучания одного КИЗ пара сигналов {UЛ;UП} должна иметь высокую степень корреляции, а при нескольких разнесенных КИЗ корреляция этих сигналов будет незначительна." (1)
Список источников
- Радиовещание и электроакустика: Учебник для вузов /С. И. Алябьев, А.В. Выходец, Р. Гермер и др.; Под ред. Ю. А. Ковалгина. – М.: Радио и связь, 2000 – 792 с.: ил.
- Радиовещание и электроакустика: Учебник для вузов / А. В. Выходец, М. В. Гитлиц Ю. А. Ковалгин и др.; Под ред. М.В.Гитлица. М., “Радио и связь” 1989 – 432 с.
- Dolby Laboratory. Technical information/ www.dolby.com
- Баскаков С.И. Радиотехнические цепи и сигналы: Учеб. для вузов по спец. «Радиотехника».– 3-е изд., перераб. и доп.–М.: Вычш. шк., 2000.– 462 с.