Технологии трехмерного звука

апрель 2024

Технологии/Полигон

Три измерения звука

Технологии трехмерного звука 26.03.2009
15:20
Владимир Закаменный

Раньше мы рассказывали о форматах носителей и файлов, а также об основных форматах многоканального звука. В этой статье речь пойдет о технологиях трехмерного звука, и начнем мы, пожалуй, с теории.

История и теория

Всем существующим разработкам в области 3D-звука предшествовали серьезные вычисления и исследования. Главная задача разработчиков состояла в том, чтобы создать такой сигнал, который будет при помощи двух или более источников звука (колонок или динамиков наушников) передавать звук, воспринимаемый как трехмерный.

Для описания 3D-звука используется алгоритм HRTF (Head Related Transfer Function; переводится примерно как «функция передачи звука относительно головы»). Принцип использования HRTF основан на следующем эффекте: звук, достигая человеческого уха, претерпевает значительные искажения во время прохождения через голову и тело человека (точнее, после того, как он их огибает). В зависимости от расположения источника звук искажается по-разному. Получив информацию о частоте звука и степени его искажения, человеческий мозг определяет положение источника. Таким образом, если заранее известна эта функция, а также направление и расстояние до источника, с помощью сложных вычислений можно смоделировать звук, распространяющийся из определенной точки пространства.

Опыты, с помощью которых был выведен алгоритм HRTF, проводились на специальном слуховом манекене KEMAR (аббревиатура означает Knowles Electronics Mannequin for Acoustic Research, что переводится как «манекен для акустических исследований компании Knowles Electronics»). С помощью KEMAR был создан набор библиотек HRTF, описывающих сочетания звука, услышанного манекеном, и оригинального звука в зависимости от его частоты и положения в пространстве относительно слушателя. Для моделирования источника звука с помощью библиотек HRTF достаточно знать его азимут, высоту и частоту.

Специалисты компании Sensaura пошли еще дальше. После серии опытов они определили, что HRTF в чистом виде «работает» только при воспроизведении через наушники, каналы которых идеально разделены. Моделирование звука в этом случае - относительно простое дело: каждый динамик контролирует «свое» ухо. Однако при воспроизведении того же самого звука через колонки правое ухо слышит также звук, призванный «обманывать» с точки зрения трехмерности левое, и наоборот.

Для исключения этого явления требуется добавить в звук дополнительные компенсационные вычисления, причем они должны выполняться индивидуально с учетом положения слушателя относительно колонок. На первый взгляд, это практически нерешаемая задача; право, не ставить же в колонки датчики, определяющие положение слушателя! Подстраивать же параметры стереофонии каждый раз вручную пользователь вряд ли станет. Тем не менее, удачные алгоритмы компенсации все же были разработаны; они получили название Transaural Cross-talk Cancellation (TCC).

Решена задача была с помощью другой идеи инженеров Sensaura. Она заключается в том, что функции HRTF действуют только для среднестатистического уха, так как выведены с помощью одного манекена или усредненных показаний большой группы людей. Однако уши у всех людей разные. Поэтому Sensaura разработала цифровую модель уха, в которой можно задавать параметры ушной раковины. С помощью этой цифровой модели сочетанием разных параметров можно воспроизвести форму практически любого уха.

Получившийся драйвер цифрового уха работает так: при его установке человек слушает ряд тестовых звуков и настраивает параметры драйвера, чтобы наилучшим образом ощущать трехмерность звука. Индивидуальные параметры слушателя записываются в специальный «профиль», он впоследствии и используется приложениями.

Воспроизведение объемного звука с помощью наушников или пары колонок в любом случае достигается сочетанием настроек параметров HRTF и TCC. Кстати, наиболее совершенным методом имитации реального трехмерного звукового поля является бинауральная передача звука (основанная на разнице восприятия левым и правым ухом). Метод предполагает передачу по двум каналам звуковых сигналов, записанных на «искусственной голове» (манекен с микрофонами вместо ушей), с последующим воспроизведением их через стереотелефоны или громкоговорители (бинауральная стереофония). При этом создается достаточно реалистическая картина пространственного звукового поля, однако имеется ряд проблем, связанных с узкой зоной пространственного эффекта, определенными ошибками в локализации за счет несоответствия параметров «искусственной головы» индивидуальных особенностей ушных раковин, слуховых каналов и др.

Трансауральный эффект подобен бинауральному и отличается от него только способом воспроизведения бинауральной записи. И хотя площадь, где он отчетливо проявляется, невелика, зато, находясь в ее пределах, слушатель может иметь представление о расстоянии до источников звука и их взаимном расположении в пространстве на момент записи.

Практика

Теперь, когда мы составили представление о принципах моделирования 3D-звука, можно рассмотреть готовые технологии, использующие эти решения.

AC-3 (Dolby Digital). По сути, за этой аббревиатурой скрывается звук, разложенный на колонки 5.1. Эта технология кодирования и сжатия звука, разработанная компанией Dolby Laboratories, поддерживает от 1 до 6 каналов передачи (то есть моно, стерео, квадро и 5.1) при частотах дискретизации 32, 48 и 44,1 кГц и потоке данных 32-640 Кбит/с. Сжатие основано на психоакустическом маскировании (то есть если человек на фоне одних звуков не слышит другие, неслышимые звуки удаляются). При этом используется алгоритм MDCT (Modified Discrete Cosine Transform).

DirectSound3D (DS3D). Эта технология, разработанная компанией Microsoft и поддерживающая базовые функции трехмерного звука, - своеобразный «буфер», интерфейс между разработчиками программного обеспечения и «железа». Сама по себе технология DS3D поддерживает лишь базовые функции трехмерности, формируя звуковую картину на основе координат и скоростей источников звука относительно слушателя, однако при этом совершенно не учитывая свойства помещения, в котором происходит действие. Однако она является неким открытым интерфейсом, под который можно написать расширения - программы, дополняющие функциональность DS3D.

Aureal3D (A3D). Технология компании Aureal, в основе которой лежат принципы воспроизведения трехмерного звука с помощью двух колонок. Используется техника Wavetracing, основанная на расчете распространения отраженных и прошедших через препятствия звуковых волн на основе геометрии среды. Кроме того, применяется дистанционная модель, которая позволяет более реалистично описывать распространение звука в различных средах (например, в воде или густом тумане). При этом обеспечивается полный динамизм восприятия звука, то есть полная интерактивность. Любопытно, что в разработке этого стандарта использовались и технологии NASA. О целях, с которыми американские военные занимались исследованием 3D-звука, остается только догадываться.

EAX (Environmental Audio eXtension). Эта технология – разработка компании Creative – включает в себя инструменты балансировки источников звука, моделирование объектов в трехмерном пространстве, поддержку эффектов реверберации. Также она симулирует распространение звука в закрытых и открытых помещениях и плавный переход из одной окружающей среды в другую. В EAX свойства звуковой среды описываются как совокупность эффектов реверберации, характерных для того или иного помещения, кроме того учитываются окклюзии и обструкции. Реверберации применяются для моделирования эффектов, основанных на отражении звуков (эхо и т.п.). Для расчета ревербераций используются не только свойства помещения, но и направление движения источника звука и расстояние до него. Так, например, для удаляющихся и приближающихся источников звука реверберация будут звучать по-разному. Окклюзии (occlusions – звуки, проходящие через препятствия) используются для источников звука расположенных за пределами помещения, в котором находится слушатель. При расчете окклюзий учитывается толщина стен и материал, из которого они сделаны. Обструкции (obstructions – звуки задерживаемые препятствием) используются для описания взаимодействия звука со звуконепроницаемыми препятствиями (например, дифракция звука на толстой колонне). Технология EAX (в отличие от A3D) не рассчитывает эффекты в реальном времени, а использует готовые установки – пресеты (presets), поэтому не требовательна к ресурсам системы.

Sensaura3D. Разработка компании Sensaura, предназначенная для воспроизведения трехмерного звука на основе нескольких собственных технологий: технология MacroFX используется для наиболее реалистичного позиционирования звука, что достигается за счет виртуального разбиения пространства на множество зон. Технология ZoomFX позволяет моделировать звук от крупных объектов, вроде проезжающего рядом поезда (все остальные технологии поддерживают только точечные источники звука). Для создания реалистичного звука в помещениях используется технология EnvironmentFX, отличающаяся возможностью обработки ранних отражений, отражений от движущихся поверхностей, «растройкой» звука и др. Технология MultiDrive предназначена для расширения «зоны трехмерности» звука. Разработка под названием Digital Ear позволяет настроить параметры трехмерного звука под конкретного слушателя. При этом учитываются размеры головы, размеры ушей, глубина и тип ушной раковины.

Q3D. Разработка компании QSound, предназначенная для работы с четырьмя и более колонками. Эта технология создана на основе субъективных критериев оценки направления звука, выработанных в результате более чем полумиллиона тестов. Действует посредством изменения амплитуды сигнала на определенных частотах, а также посредством фазовых и временных сдвигов. Позволяет размещать звук в пределах полукруга (180°) перед слушателем. Q3D считается алгоритмом, достаточно качественно воспроизводящим звук при умеренных запросах к аппаратным ресурсам. Естественно, он также реализован в качестве расширения DS3D.

Roland RSS (Roland Sound Space). Технология действует посредством изменения амплитуды, времени и тембра звука. При этом используется комбинация двух техник: бинауральной и трансауральной (для прослушивания бинаурального сигнала через акустические системы). Система способна производить бинауральный сигнал из стерео или моно записи. Технология RSS обеспечивает расположение звуков в полной сфере.

Ambisonics. Эта технология появилась в 1970 году в результате британских академических исследований. Она предназначена, прежде всего, не для имитации пространства, а для записи с сохранением реальной звуковой картины. В случае применения технологии возможна имитация круговой (три канала) и сферической (четыре канала) панорамы.

SRS. Разработка фирмы Hughes, но сейчас ее дальнейшим развитием занимается фирма SRS Labs. Технология позволяет производить расширение стереобазы и преобразование моно в стерео. Наряду с отдельными аппаратными устройствами, системы SRS применяются в телевизорах и другой потребительской технике, а также в компьютерных продуктах (звуковых платах, например).

Spatializer. Эта технология может применяться как для кодирования при записи, так и для обработки звука при воспроизведении. Получаемый эффект простирается от расширения стереобазы до точного позиционирования в пределах круга.

CRE (Crystal River Engineering). Еще одна технология, разработанная совместно с NASA. На этот раз интерес «космической службы» известен – разработка применялась в тренировочных имитаторах полетов и других системах виртуальной реальности.

Sonic Holography (акустическая голография). Фирменная контурная технология, разработанная основателем Sunfire Бобом Кэрвером (Bob Carver) в 1980-х годах и значительно повышающая глубину и качество любой двухканальной записи. Технология позволяет создавать звуковой ландшафт с одинаковой эффективностью как для восьмиканального сигнала, так и для обычного двухканального, что предполагает прослушивание «обычных» музыкальных программ.

В следующей, завершающей серию статье мы подробно опишем разнообразные интерфейсы и разъемы, встречаемые в домашних кинотеатрах.

Реклама

Технологии/Полигон

Три измерения звука

Конкурсы

Реклама