Сравнительное тестирование
различных режимов кодирования LAME

 

Мне всегда было любопытно выжимать максимум качества звучания имеющимися средствами; масса не слишком подробно описанных настроек энкодера LAME давно притягивала мой интерес и интриговала...
И вот, в кои-то веки руки дошли более или менее методологически корректно поэкспериментировать с важнейшими из них, и сравнительно изучить результаты. Извольте.

...Был выбран Spectralab, как более специализированный и точный по сравнению с CoolEdit'ом инструмент для изучения спектров, позволяющий наглядно накладывать несколько графиков АЧХ друг на друга.

Был сграблен трек Get The Money Бреговича из саундтрека к Arizona Dreams, из него был выбран минутный фрагмент, - насыщенный хор, голос солиста, ударные и бэнд.

Фрагмент кодировался Lame'ом 3.89 с битрейтом 320кбс:

тем самым при помощи параметра -q* варьировался noise shaping and psycho acoustic algorithm; также было любопытно проверить распространенное утверждение, что, ограничивая фильтром lowpass верхние, почти неслышимые, частоты, мы получим существенную прибавку качества передачи средних, куда более значимых, частот. Вдобавок дважды тестовый трек кодировался в режиме abr, дабы поколебать мои давние сомнения в целесообразности всяческих variable bitrate и испытать пресловутый новый алгоритм Lame'а, едва ли не превосходящий по качеству режим постоянного битрейта...

Полученные мпеги были декодированы в wav при помощи нового фраунгоферовского плагина Winamp 2.76 и записаны при помощи его же DiskWriter; для совершенной точности сравнения с оригиналом в полученных wav'ах была аккуратно удалена неизбежно появившаяся тишина в начале (0.025 сек) и в конце (0.008 сек) записи. Затем wav'ы были скормлены Spectralab'у для получения интегральных спектров, - после чего наступил черед решающей, самой творческой и неоднозначной, части исследования: пристального разглядывания кривых на экране...

 

Полный спектр; соответствующими цветами обозначены кривые АЧХ исходного wav'а и развернутых мпегов на 320: с параметрами по умолчанию, с параметром -q0, с параметрами -q0 --lowpass 19.5, с параметрами -q0 --abr 320.

Я понимаю, здесь ничерта не видно, какое уж там пристальное разглядывание...
Что ж, - наступив мышом на картинку, можно в новом окне изучить несколько более крупное изображение.

Что-то становится видно, - но и этого явно недостаточно. Посему давайте поразглядываем спектры вместе, по частям...

 

Итак, важнейший для восприятия интервал частот, примерно 1-10 кГц.

примерно 10-15 кГц

15-22 кГц

 

В отличие от читателя, я имел счастливую возможность заметно масштабировать картинку спектров, и вот к каким наблюдениям мое пристальное разглядывание привело.

Прежде всего, наблюдаемые различия огибающих достаточно мизерны, - вероятно, любой из выбранных режимов кодирования даст вполне приемлемый на слух результат... Однако, озаботившись наилучшими параметрами кодирования, я искал тонких различий, и их-таки есть теперь у меня.

Пойдем сверху, где отличия заметнее всего.
Завал на верхах после 19.5 кГц зеленого графика естественен, - но, против ожидания, и в области ниже следует за белой линией оригинала не слишком точно. Желтый ABR тоже не поразил точностью; впрочем, не идеален ни один из режимов. Красный "штатный" стремится повторить форму исходника довольно уверенно вплоть до высших частот, - но синему, кажется, это удается в несколько большей степени.

Примерно та же картина наблюдается в диапазоне 17-18 кГц; однако, на более низких частотах ситуация немного изменяется. В области 15-17 кГц в лидерах подражательства по-прежнему синий график "продвинутого" кодирования без дополнительных изысков; на второе место, вероятно, выбивается его зеленый аналог, принудительно ограниченный сверху. Штатный красный режим здесь точен не вполне, но алгоритм ABR и здесь заметнее всех отстает от оригинала...

В районе 13-15 килогерц, на мой взгляд, расстановка сил несколько меняется: при уверенном лидировании синего режима на второе место по точности следования оригиналу наконец выходит желтый ABR, за ним - дефолтный красный и отчего-то только потом - усовершенствованный, но пристукнутый сверху зеленый...

Идем чуть ниже: на 10-13 кГц точнее других, сдается мне, по-прежнему синий график, затем - снова зеленый, следом - красный и только потом - хваленый новый алгоритм abr.

Средневысокие, средние частоты - различия становятся минимальными, но, на мой прищуренный взгляд, в этом, наиболее слышимом, диапазоне ситуация практически неизменна...
Однако, новость! - в интервале частот примерно с до 8 кГц оригиналу успешнее других следует, пожалуй, таки зеленый... возможно, тут-то мы и получаем выигрыш от намеренного обрезания верхов. Далее следуют синий, красный - и наименее точен, как водится, желтый...

Спускаемся ниже - все возвращается на круги своя. Идем ниже килогерца, - разноцветные графики практически сливаются, но расстановка сил, похоже, остается прежней...

 

Итак, предварительный вывод сравнительного аппаратного тестирования будет таков:

на данной фонограмме наиболее точно форму спектра исходного сигнала, в среднем по всем частотам звукового диапазона, повторяет мпег, энкодированный с параметром-q0, остальное по умолчанию (высшее качество, фильтр lowpass отключен).

...Ура, товарищи; теперь же наступает время слуховых слепых тестов, - и, как только я удосужусь этакое орагнизовать, о результатах непременно доложу.

 

Вернуться на Yar's MP3Tech
© Yar