1. Уважаемая Ирина Аркадьевна! Почему Вы выбрали для разговора именно эту область знаний?
По нескольким причинам:
психоакустика является сейчас наиболее быстро развивающимся и самым важным направлением в акустике, от ее успехов зависит дальнейшее развитие аудиотехники, поскольку современные технологии позволяют получить любые заданные параметры, неясно только, какие из них наиболее важны для мозга при формировании слухового образа,
психоакустикой занимаются крупнейшие университеты и институты мира, работает много выдающихся ученых (см. мой учебник "Музыкальная акустика"), но в России этим направлением не занимается никто, хотелось бы его здесь развивать,
всегда интересно понять, как работает мозг, как он воспринимает музыку и зачем она ему.
2. Вопрос о слышимости фазовых искажений на примере такого параметра, как групповое время задержки. Есть часть абсолютно фазолинейных акустических систем, у которых скомпенсирована задержка между отдельными динамиками (за счет цифровых фильтров или расположения ВЧ-динамика вглубь относительно СЧ-динамика) и есть мнение, что у таких систем более четкая локализация источников в пространстве. Есть АС, у которых между динамиками задержка 0,5 мс или меньше. Вопрос – наличие задержки все-таки способствует ухудшению звучания, или, как и считается на частоте 2 кГц, задержки менее 0,5 с не воспринимаются?
Проблемой слышимости фазовых искажений в акустических системах очень много занимались в 1990-х годах, однако после того, как Блауэрт установил пороги слышимости ГВЗ (в области 2 кГц порядка 1 мс, на остальных частотах выше) при разработках АС стали ориентироваться на выполнение этого критерия. Подробнее об этом и вообще о проектировании АС можно прочитать в нашей книге Алдошина И.А., Войшвилло А.Г. "Высококачественные акустические системы и излучатели", она выложена в Интернете.
3. Какие новости о работе над стандартизацией параметров оценки качества звуковых устройств, в частности интересует оценка нелинейных искажений?
Проблемами нелинейных искажений продолжают очень активно заниматься, появилось много новых методов - многотоновые сигналы, ряды Вольтерра и пр. На эту тему у меня была статья в журнале Install Pro за 2002 год – "Электроакустические параметры излучателей (акустических систем, звуковых колонок, контрольных агрегатов и др.), ч. 3 Нелинейные искажения", ее можно найти в архиве журнала. Последние разработки в области измерений нелинейных искажений можно посмотреть на сайте Вольфганга Клиппеля (W. Klippel), его фирма является, пожалуй, самой передовой по этому направлению в мире. http://www.klippel.de/know-how/application-notes.html
4. Какие новости из области разработки и применения PEAQ?
Я не занимаюсь этим сейчас, но недавно вышла большая книга, целиком посвященная оценке качества звучания различных систем, там эти вопросы разобраны детально – "Perceptual Audio Evaluation – Theory, Method and Application" Søren Bech (Bang & Olufsen a/s), Denmark ,Nick Zacharov (Nokia Corporation), Finland. Книгу можно скачать в Интернете.
5. Почему нет толку от "высоких форматов?"
Не могу ответить на этот вопрос в том виде, в каком он сформулирован.
6. Почему большинство людей может вслепую определить в акустически неподготовленном помещении с плохими характеристиками, что является источником звука: настоящая скрипка или высококачественный звуковой тракт с записью скрипки? Какие параметры звукового сигнала в этом случае отличают звуки настоящего инструмента от звуков записи?
Это глобальная проблема, над которой работает современная акустика и аудиотехника уже более 30 лет, с момента появления систем Hi-Fi, которые и должны были создавать звук, неотличимый от живого. Количество параметров, по которым измеряется звуковая аппаратура, все время растет (их уже больше 40), но, по-видимому, какие-то важные для мозга критерии еще не учитываются, это требует решения глобальной проблемы расшифровки "слухового образа". В рамках общей проблемы "создания искусственного интеллекта" над ней работают многие крупнейшие университета и институты мира.
7. Есть ли куда развиваться дальше форматам "сжатия с потерями" музыкальных файлов? Ощущение, что где-то к 2006 году это направление себя исчерпало. Если исчерпало, то какая тема исследований сейчас самая актуальная?
Думаю, что это правильная мысль, по мере роста пропускной способности каналов и объемов памяти и носителей информации необходимость в таких форматах отпадет. В частности, новая система пространственного звуковоспроизведения Dolby Atmos их уже не использует.
8. В свете того, что наш слух имеет нелинейную природу и сам порождает гармоники, имеет ли смысл стремление к низким КНИ в аппаратуре?
Это интересный вопрос, который давно обсуждается в научных кругах, по-видимому, мозг имеет какой-то механизм, который позволяет отличать внутренние гармоники от внешних. Но многократные прослушивания подтверждают, что аппаратура с очень низкими уровнями нелинейных искажений звучит существенно лучше.
9. Почему звуковая аппаратура, например ЦАП, усилители, имеющие одинаковые и низкие значения КНИ, IMD, AЧХ, ФЧХ, и пр., звучит по-разному? Имеет ли смысл измерять все эти параметры, если они практически никак не связаны с субъективным качеством звука? Может, надо вводить какие другие параметры, проводить измерения на динамическом сигнале или измерять устройства в более широком спектре излучений, вплоть до гигагерц?
Это правильная постановка вопроса. Можно сказать так, что все известные параметры являются необходимыми для хорошего звучания, но недостаточными, поскольку пока неизвестно, какие еще параметры важны для обработки звуковых сигналов мозгом. Работы по этим направлениям интенсивно ведутся, каждый год приносит новую информацию и параметры. Но пока надо добиваться необходимого уровня по известным параметрам, это гарантирует определенный уровень звучания аппаратуры.
10. Возможно ли с помощью физического моделирования достаточно точно имитировать тембры живых инструментов? Есть ли какие-то новые исследования в этой области?
Работы по физическому моделирования продолжаются во многих научных центрах, в первую очередь в IRCAM (Париж) и Стэнфордский Университет (CCRA), посмотрите в Интернете их последние результаты. Джулиус Смит из Стэнфорда является самым компетентным специалистом в этой области. http://ccrma.stanford.edu/~jos/Mohonk05/ То, что мне удалось послушать в IRCAM – модели духовых инструментов (тромбон, валторна и др.) – звучат достаточно правдоподобно, но, конечно, отличаются от живых инструментов.
11. Происходят ли какие-то исследования в области разработки новых типов звуковых излучателей, микрофонов, свободных от недостатков электродинамических громкоговорителей, но не опасных для здоровья, как например электростатические, плазменные, и т.п.?
Из новых разработок можно отметить оптические микрофоны, ультразвуковые микрофоны, из громкоговорителей – ведутся работы по цифровым преобразователям, но новых принципов преобразования пока не появилось. Подробнее можно почитать в серии моих статей по научным результатам конгрессов AES.
12. Алгоритмы психоакустического взвешивания на основе модели слуха типа PEAQ дают неплохие результаты, схожие с субъективной экспертизой. Хотелось бы узнать поподробнее, продвигается ли это направление – математическая модель человеческого слуха?
Это направление сейчас интенсивно разрабатывается, созданы компьютерные модели оценки громкости, сейчас усиленно продвигаются работы по автоматической оценке тембра и др. Это одно из основных направлений в Институте коммуникационной акустики под руководством проф. Й. Блауэрта (Германия). Недавно вышла книга (сборник статей) под его руководством "Communication Acoustics" J. Blauert (изд-во Springer), в ней многие вопросы рассмотрены.
13. Уважаемая Ирина Аркадьевна, имеются ли перспективы в создании автоматической оценки качества акустических систем без участия человека и его субъективной оценки? Ведутся ли исследования в этом направлении, какие достижения, препятствия?
Это мечта всех разработчиков аудиотехники, конечно такие работы ведутся, созданы автоматические системы оценки громкости, бинауральной локализации и др., но до полной оценки качества звука еще далеко, поскольку не расшифрован до конца процесс формирования слухового образа в слуховой системе.
14. Какие технологии звукозаписи и звукогенерации могут стать доминирующими лет через 20, например? Что поменяется, основные тенденции развития?
Ответ на столь глобальный вопрос превышает мои возможности, но могу сказать, что в крупных фирмах Dolby, JBL, B&K и др. имеются специальные аналитические отделы, которые занимаются прогнозированием развития аппаратуры, это большая и очень серьезная работа.
15. Некоторые энтузиасты после перехода на АС с диффузорами из материалов с малыми внутренними потерями (бериллий, керамика, магний) утверждают, что никогда не вернутся к тканевым куполам и бумажным диффузорам. Существуют ли сейчас принятые научным сообществом методы, позволяющие однозначно показать, что "жесткие" диффузоры действительно лучше и "детальнее" при правильной фильтрации?
Применяются и жесткие и мягкие диафрагмы в зависимости от целей разработки аппаратуры, каждая имеет свои достоинства и недостатки, подробный анализ технологии изготовления диафрагм громкоговорителей и их сравнительная оценка даны в моей книге "Электродинамические громкоговорители" Алдошина И.А. (я видела, что ее можно заказать в OZON.RU, но вероятно, можно найти и в Интернете).
16. Каковы сейчас две-три самые передовые темы в теоретической (научной) части акустики/электроакустики? И две-три самые передовые темы в прикладной акустике/электроакустике?
Ответ на этот вопрос потребует специальной монографии. Но на протяжении ряда лет я писала в журнале "Звукорежиссер", а сейчас пишу для этого сайта ProSound.iXBT.com статьи по научным результатам конгрессов AES, которые проходят два раза в год и собирают лучших ученых мира. Думаю, если прочитать подборку этих статей за последние несколько лет, то можно получить достаточное представление по основным направлениям развития акустики. К числу наиболее интересных тем относятся аурализация, морфинг, автоматическое распознавание музыкальных инструментов, создание систем виртуальной реальности и др.
17. Можно ли создать чисто компьютерными программными средствами без реальных инструментов фонограмму, неотличимую на слух от живого исполнения?
На данном этапе развития это невозможно, поскольку проблема расшифровки слухового образа мозгом еще не решена и не понятно, по каким параметрам надо контролировать и оценивать запись.
Редакция благодарит Ирину Аркадьевну за интересные ответы.
http://prosound.ixbt.com/education/aldoshina-answ.shtml