DJ School: Война аудио форматов, или кто убьёт MP3

vinyl macro 2560x1600 wallpaper 2115595 - DJ School: Война аудио форматов, или кто убьёт MP3

Однажды, в то время, когда я еще учился в средней школе и гордился перед одноклассниками своим суперкрутым Pentium 166MMX, мне в руки попал чрезвычайно редкий диск на очень недолгое время. Дабы избежать всеобщего смеха я не буду говорить, что это был за альбом: суть в том, что мне дали его всего на пару дней а желания слушать его у меня было минимум на пол-года. Прослушав в течение суток это великолепное творение современной музыки раз тридцать, я понял, что хочу еще. Надо было срочно придумать, как мне оставить копию этого CD. Мысль о записи его на кассету была отброшена тут же: слишком большие потери в качестве. Тогда я засунул диск в CD-ROM и оцифровал его программой CDDigitalCopy (была такая когда-то… под DOS). В результате треть моего 1,6Гб-диска занял этот альбом.

По компьютерным меркам с тех пор прошло множество столетий, русский народ узнал такое технологическое чудо, как MP3, и сейчас коллекция MP3-файлов объемом в пару «гигов» — неотъемлемый атрибут любого домашнего PC. Впрочем, на лакомое место аудиоформата номер 1 нынче претендуют многие гораздо более свежие разработки. Кто из них достоин носить гордое звание «убийца MP3»? Предлагаю вам оценить наиболее сильных претендентов. Впрочем, начнем мы все-таки с Отца. Лидера. Непотопляемого. Встречайте — ваш любимый…

MP3

Об этом формате уже столько сложено песен и измарано сайтов, что, казалось бы, и сказать-то больше нечего. Тем не менее обилие всяческих разнотолков — как раз отличный повод привести в порядок всю эту разрозненную и, кстати, не всегда достоверную информацию.

Формат компрессии аудиоданных MPEG Layer III был запатентован в начале 90-х немецким Институтом Фраунхоффера в качестве стандарта для записи звука в MPEG-видеофильмах. Суть алгоритма сжатия заключается в том, что из звука, представленного в качестве набора частот, изымаются те из них, которые хуже остальных различимы человеческим ухом. То есть в звуке остаются только наиболее интенсивные для слушателя компоненты. В зависимости от коэффициента сжатия удаляется большее или меньшее количество «лишних» частот.

MP3 — многоцелевой формат благодаря широкому разбросу коэффициента сжатия, поэтому его можно применять и для «архивирования» аудиодисков, и для публикации в Интернете. Считается, что CD-качество обеспечивается MP3 уже при 128Кбит/с. На самом же деле при этом сжатии звук приобретает довольно заметные «упрощения», лучше всего различимые на звуках ударных инструментов, вокала. Долгие годы практики кодирования доказали, что наиболее оптимальное качество при не слишком большом объеме в MP3 достигается при 160Кбит/c, а при 256Кбит/c разница между оригиналом и сжатым файлом почти исчезает. Для публикации записей в Интернете отлично подойдет сжатие 56Кбит/c — при довольно четком звуке минута звучания занимает всего 400Кб. Как правило, при увеличении сжатия до 48Кбит/c качество заметно ухудшается. Максимальное сжатие, при котором остается подобие звука — 24Кбит/c в моно-режиме. В этом случае минута потянет на 150Кб.

В связи с открытостью формата MP3 существует целая куча разнообразных программ-кодировщиков, работающих по совершенно разным алгоритмам. Одна программа может выдать отличный звук и при 80Кбит/с, а другая — испортить его при 160. Среди множества сжимателей особого внимания заслуживают два: Xing Mpeg Encoder и Audioactive Production Studio. Xing Mpeg, встроенный в известный CD-риппер AudioCatalyst — один из самых быстрых и качественных кодеров. Он использует необычную схему кодирования: в процессе сжатия он удаляет из звука все частоты выше 15КГц, таким образом лучше кодируя более «существенные» частоты. «Выброшенные» частоты выше 15КГц различимы далеко не всеми людьми и далеко не на всяком оборудовании, поэтому такое решение выглядит оправданным. С другой стороны, разница между 192Кбит/c и 320Кбит/c практически отсутствует. Для апологетов бескомпромиссного качества программа Audioactive Production Studio предоставит все, что им нужно: и убийственно медленный процесс кодировки файлов, и идеально чистое качество MP3-файлов.
Существует еще один метод кодировки в формате MP3, о котором в обществе принято умалчивать. Вы можете получить его в виде отдельной DLL-библиотеки на сайте Института Фраунхоффера. Его уникальность заключается в том, что результат кодирования предстает не в .mp3, а в .wav-файле. Это так называет MPEG Wave Layer-III формат. Если у вас установлена эта библиотека, вы сможете сохранять ваши записи в этот формате практически из любой программы, работающей со звуком в Windows. С другой стороны, на компьютерах, не снабженных этой полезной утилитой, обычный с виду .wav-файл не прочитает даже WinAmp.

А теперь — несколько замечаний по поводу того, какую музыку можно сжимать в MP3. Этот алгоритм идеально подходит для хранения электронной музыки, всех музыкальных направлений, связанных с минимализмом. Хаус, транс и техно-записи, сделанные из стерильных, чистых  синтезированных звуков, после сжатия в MP3 не потеряют ни грамма от своей электронной красоты. Даже при высокой компрессии записи будут звучать идеально. Чуть хуже приходится индустрии ломаных битов, вроде джангла, хип-хопа, drum’n’bass и обильно наполненным вокалом композициям. «Грязно» звучащие, на манер Prodigy, биты, а также вокал обречены потерять часть своего очарования при любом коэффициенте MP3-сжатия. И хуже всех придется тем записям, в которых звучат электрогитары или акустические инструменты, не говоря уже о симфоническом оркестре. Мощные гитарные рифы сильно сдают после компрессии, так что Limp Bizkit в MP3 представляет довольно жалкое подобие оригинальна — грязный гитарный драйв уходит безвозвратно. То же касается и акустических инструментов: в звучании хорошо записанного оркестра настолько важны как раз те самые «лишние» частоты, убираемые при сжатии, что после их удаления звук получается весьма убогий. Подчас не спасает даже компрессия 320kb/s. Поэтому настоятельно рекомендую покупать записи альтернативных команд и классики только на обычных дисках. MP3-коллекция вроде «1000 минут Баха» может вас сильно разочаровать.

Ну и, напоследок, о будущем. Уже разработан и лицензирован официальный преемник MP3 — сына нарекли MP3 Pro, и его главное преимущество перед папой заключается в удвоении плотности записи. То есть файл MP3 Pro при сходном качестве занимает вдвое меньше места. Самое удивительное то, что все обычные проигрыватели смогут проигрывать файлы нового формата! Это реализованы хитроумным способом: дело в том, что файлы MP3 Pro поделены на две части. В первой из них хранится поток аудио в обычном MP3-формате, а во второй — специальная информация о высоких частотах, которую смогут понять только новые проигрыватели. При этом пока не вполне понятно, как по такой схеме будет реализовано потоковое аудио, но те немногие счастливчики, которые уже смогли послушать записи в новой компрессии, утверждают, что это нечто потрясающее. Что ж, поживем — увидим.

VQF

Этот относительно молодой формат, разработанный компанией NTT несколько лет назад, уже получил своих апологетов в Сети и имеет весьма неплохие перспективы развития. Алгоритм кодирования широко не разглашается. В любом случае, сравнивая результаты кодирования в форматах VQF и MP3, можно заметить, что алгоритмы имеют очень мало общего и основаны на совершенно разных подходах к сжатию звука. Это проявляется прежде всего в том, что VQF-файлы звучат гораздо более естественно, чем MP3 и точно передают записи с широким динамическим диапазоном — то есть живую музыку. Так же в записях VQF значительно меньше искажений на средних и низких частотах. Зато на «верхах» он проигрывает MP3 — выше 15КГц наблюдается сильный завал частот, который особенно ощущается при кодировании шумов. Все это предполагает весьма своеобразную методику сжатия аудио.

Итак, в чем же заключаются преимущества VQF перед другими форматами? Самая сильная сторона формата — степень сжатия. VQF-файл с компрессией 80Кб/с по качеству идентичен MP3-файлу, записанному в 128Кб/c. То есть степень сжатия превосходит МР3 более чем на 30%. Минута звучания достойного качества в VQF занимает немногим больше 600Кб. Это действительно значительное преимущество. Впрочем, положенная ложка дегтя в данном случае никуда не делась — минусов этот формат вовсе не лишен.
Главный недостаток алгоритма — очень неслабое потребление системных ресурсов. При проигрывании VQF на каком-нибудь P166 на выполнение остальных задач процессор будет просто неспособен. А уж про скорость кодирования файлов вообще можно слагать песни. Длинные песни. Скорость просто убийственная, 3-4 минуты звучания на P200MMX при полной остановке других приложений могут кодироваться минут двадцать. Некоторые кодировщики, впрочем, способны кодировать файлы за время значительно меньшее, чем время звучания самого кодируемого файла, но в их системных требованиях рекомендуется запастись чем-нибудь вроде Pentium 4.

Еще один серьезный недостаток VQF, который, впрочем, также касается владельцев не слишком «продвинутого» оборудования — на многих дешевых звуковых платах файлы VQF звучат просто ужасающе. Не вполне ясно, с чем связан подобный эффект, но факт остается фактом: если у вас десятидолларовая «пищалка», то и звук из VQF вы скорее всего получите соответствующий. На десять долларов. Разработчики формата рекомендуют использовать Hi-Fi платы, красующиеся на полках магазинов с ценниками в $150 и выше. Впрочем, недорогие карты семейства SB Live!, а также другие достойно сделанные экземпляры все-таки воспроизводят VQF с приемлемым качеством. Похоже, что преобразователи на качественных звуковых платах, в отличие от дешевых поделок, способны сгладить некую «зернистость», получаемую при раскодировании VQF-потоков. Тем не менее истина все еще где-то там.

После всего вышесказанного, спросите вы, для чего же он такой нам нужен-то? На самом деле VQF — это формат, предназначенный для самодеятельных рокеров, получивших доступ в Интернет. Как ни странно, но это так — большая часть файлов в этом формате, находящихся в Сети, содержат в себе композиции именно рокерской и акустической направленности. Все дело в том, что VQF очень хорош для акустических записей. Малые искажения, чуть «подрезанные» верхи и широта динамического диапазона делают его незаменимым форматом для записи живых инструментов и всевозможных гитар. В сочетании с сильной компрессией все эти преимущества отлично подходят для использования VQF, скажем, начинающими музыкантами, желающими поведать о себе миру и не готовых при этом слишком долго закачивать свои демо-записи в Сеть.

Для проигрывания VQF-файлов существуют как специальные плееры, вроде культового K-Jofol, так и плагины к вездесущему WinAmp’у. Тут обнаруживается еще одна особенность формата: у него не работает перемотка! Неприятный сюрприз. Впрочем, наука уже додумалась, как обойти этот минус, и перемотку можно обнаружить — правда, пока в одном-единственном плеере. Называется он хитро — Esprit, и скачать его можно на http://www.infinityedge.com/esprit/registration.htm
Что касается кодировщиков — массу восторженных рецензий получил Yamaha SoundVQ 2.54eb1. Также многим закачкам подверглась программа TwinEncoder. Все они доступны на сайте www.vqf.com

Еще раз напоминаю, что на время кодирования следует запастись большим пакетом чипсов…

WMА

Думаю, все знают, что WMA — это детище широко популярной в народе компании Microsoft. Но все ли знают, как он к этой самой Microsoft попал? История происхождения формата WMA объясняет некоторые интересные особенности его звучания.

В 1998 году компания Voxware присоединилась к проекту TwinVQ и в его составе участвовала в разработке формата VQF. История умалчивает о подробностях дальнейших событий — важно то, что через некоторое время, когда VQF начал свое шествие по умам интернетизированных рокеров, компания отделилась от проекта и на основе разработок VQF создала новый формат, получивший название Voxware Audio Codec 4.0. Он стал первым алгоритмом сжатия, обеспечивающим качество 128Кб/с MP3-файлов при цифровом потоке в 64Кб/c. Заметив его высокие характеристики при кодировании речевых сигналов, крупные телефонные компании заинтересовались новой разработкой и даже стали устанавливать ее на свои цифровые АТС. Вскоре свой орлиный взор на продукты компании обратила и Microsoft, включив поддержку Voxware Audio Codec в свой Media Player. Дальше все пошло по отработанному уже сценарию: Microsoft покупает Voxware и финансирует доработку формата, получившего впоследствии имя Windows Media Audio.

Вот такая история. Главный вывод — WMA является чуть ли не прямым потомком формата VQF, так что понятно, откуда растут его достоинства и проблемы.

Впрочем, начнем с достоинств.

Итак, по заявлениям разработчиков, WMA версии 7 выдает качество, не уступающее 128Кб/c MP3-файлу при сжатии 64Кб/c. Что тут можно добавить? Только то, что это правда. Сравнению подверглись закодированные именно в таком сжатии файлы с весьма интересной записью старика Puff’a Daddy — Victory. В ней, кроме считки и бита, играет шикарный симфонический оркестр, записанным с очень высоким качеством. Для компрессии в MP3 была использована программа Audioactive Production Studio. Прослушанные на четырех различных системах, начиная от десятидолларовых офисных колонок, подключенных к безымянной звуковой плате, и заканчивая студийными акустическими мониторами Event, подключенными через усилитель Onkyo к ProTools MixOne посеребренными проводами, был поставлен диагноз: идентичны. Разумеется, профессиональные колонки выдали характерные особенности разных форматов — звучание действительно разное, но общее качество оказалось примерно на одном уровне. И это при том, что файл WMA был вдвое меньше MP3… Впрочем, все это вовсе не значит, что при компрессии 64Кб/с в WMA вы получите приемлемый звук, как это заявлено в красочных пресс-релизах. Он просто не хуже 128Кб/c MP3-файлов, которые сами более чем далеки от идеала.

Отличительной чертой WMA является полное обрезание звука выше 20КГц, а также непонятное заполнение шумами пауз в композициях. Также WMA довольно груб в обращении с динамическим диапазоном и вносит в него неслабые искажения. Пожалуй, это все выявленные пока недостатки формата. К плюсам же можно смело отнести, во-первых, очень быстрое кодирование файлов, а во-вторых, наилучшее среди современных форматов качество звука при очень сильном сжатии. Таким образом, формат RealAudio, до сих пор применяющийся интернет-радиостанциями для передачи аудиопотоков с высокой компрессией, может с уверенностью выкидывать белый флаг и удаляться с поля боя.

Формат WMA подходит для кодирования самых разных записей. Низкие и средние частоты в его исполнении хороши, но начиная с 8КГц он начинает своевольничать с частотами и всячески искажать их. Также стоит еще раз упомянуть про натянутые отношения с динамикой звука. Посему диагноз таков: электронная транс- и хаус-музыка не для WMA. Зато хип-хоп, джангл и брейкбит идет «на ура» в связи с отсутствием особых претензий этих стилей на качество в высоких частотах. Акустические записи неплохи, симфонический же оркестр по-прежнему звучит неважно. Впрочем, это происходит потому, что классическая музыка похоже вообще не терпит какой-либо компрессии.

И напоследок пара слов о только что вышедшем Windows Media 8. Окончательная версия кодера еще не доступна, но, по заявлениям Microsoft, новый формат сохраняет CD-качество при сжатии 48Кб/с. У WMA больше нет конкурентов, скажете вы? Не тут-то было. Старики уже неспособны тягаться с этим бойцом, но на их смену приходят молодые. Встречайте главного на сегодняшний день конкурента WMA, годовалое детище компании Xiphophorus по имени…

OGG Vorbis

Этот формат был опубликован летом 2000 года. В это же время появилась бета-версия его кодера. Финальная версия до сих пор недоступна, поэтому приходится довольствоваться тем, что есть. А есть вот что.

После втрое более медлительного по сравнению с WMA процесса кодирования, на выходе при 128Кб/c мы получаем звук, близкий к оригинальной записи настолько, что минимальные различия проявляются исключительно на спектральных характеристиках и тысячедолларовых колонках. При кодировании самых разных звуков — от отрывков музыкальных композиций всех направлений до всевозможных шумов и шорохов OGG намного обошел по качеству свеженький WMA 8. При этом зачастую OGG-файлы были даже меньше WMA — на 5-20%.

Остается только добавить, что кроме всех своих достоинств OGG еще и совершенно бесплатен. Больше того — его исходные коды доступны для скачивания всеми желающими! Благодаря этому мне удалось выяснить основные принципы кодирования OGG-файлов. Механизм компрессии использует схожие с MP3 психоакустические модели, но по гораздо более хитроумным методикам. Кроме того, вся запись разбивается на несколько кусков и каждый из них кодируется с разным сжатием — это аналог Variable Bit Rate в MP3. В файле OGG может содержаться до 255 (!) каналов — то есть им же можно кодировать многоканальные потоки вроде Dolby Digital. Также в OGG-файлы можно встраивать графические изображения и тексты, которые могут возникать по ходу воспроизведения (тут и до караоке недалеко…).

Таким образом, единственные недостатки формата OGG Vorbis — это относительная медленность упаковки и недоработанность кодеков. Впрочем, с оптимизацией программ для упаковки OGG и эти недостатки исчезнут. Итак, формат, изначально позиционировавшийся как убийца MP3, мимоходом, одной левой прибил и внезапно выползшее детище Microsoft…

Что ко всему этому можно добавить? Время покажет, какой из четырех форматов займет первое место: MP3 Pro, VQF, WMA или OGG. Ясно одно: с ростом объемов жестких дисков и увеличением каналов доступа в Интернет звуковые файлы неизменно уменьшаются в объеме и прогрессируют в качестве. К чему все это приведет — не знает пока никто. Продолжаем слушать музыку.