Что такое ogg битрейт

Руководство по выбору форматов аудиофайлов: век сегодняшний и немножко прошлый

Оглавление

Вступление

Как всегда, начну со старческого брюзжания. Вот лет двадцать назад… Собственно говоря, двадцать лет назад и выбора-то особо не было.

реклама

Потому что были компакт-диски, которые превращались в WAV-файлы, занимавшие пространство среднего «винчестера» – ну и на ОС немножко места оставалось. И на BBS. И на игры. И на архив файлов. И все. Потому что средний размер жесткого диска тогда составлял какие-то сказочные сегодня 850 мегабайт. Да, именно что 850 – и именно мегабайт. Толчок всему дало появление формата MP3 в 1997 году, и это был очень знаменательный год!

Я очень хорошо помню те времена. Тогда мы с другом «возрадовались до плеши» и принялись активно кодировать компакт-диски в самые популярные 128 кбит/с с joint stereo (это когда фактически пишется один канал, и к нему добавляется информация об отличиях второй дорожки – если они есть). Еще бы, теперь альбом занимал смешные 50-70 мегабайт, и компьютерные пластиковые колонки казались вершиной прогресса. Различные звуковые карты за 200,500 или 800 долларов в журналах казались чем-то страшным и далеким. Зачем? Ведь есть MP3 128 кбит/с, смотрите, какое крутое качество!

Шли месяцы и годы (скорее ближе к месяцам). Менялись колонки, развивался MP3, и мы тогда, юные падаваны старшего школьного и начального студенческого возраста, экспериментировали с битрейтами и появившимся тогда первым конкурентом MP3 – таинственным Vorbis OGG. Сколько часов на самой разной акустике (а мы тогда уже открыли, что даже советская «Вега» уделывала все эти пластиковые недоразумения за десять баксов) было отслушано – не сосчитать.

В итоге выводы выкристаллизовались такие: OGG круче MP3 на средних битрейтах, а на высших все равны. Но преимущество OGG было в том, что на средних битрейтах файл не только лучше звучал, но и занимал меньше места. Недостатком – то, что при всех этих достоинствах OGG питался большим количеством оперативной памяти и ресурсов процессора. А в те времена мощности были, как понимаете, совсем не те.

Почему я так подробно пишу об отличиях OGG от MP3? Потому что уже начался рассказ про форматы, и все эти выводы справедливы и по сей день. Ну вот, теперь вы знаете почти все про OGG: а больше знать и не надо, поскольку его сегодня поддерживают не так уже много устройств.

И да, небольшой дисклеймер. Я не буду разводить воду про виды квантования и прочие страшные слова: если вам это интересно, то все прекрасно написано в Википедии. И форматов файлов на самом деле намного больше, чем будет перечислено далее. Вопрос в том, что они не только никому неизвестны, но и никем не поддерживаются. Почти.

И еще. Я не буду рассказывать о форматах многоканального звука. На сегодняшний день эта тема все еще в зачатке по причине своей дороговизны. И дисков выпускается мало, и также редко они перекодируются в звук. На коне по-прежнему старое доброе стерео. Очевидно, всем этого хватает. Ну или почти всем, но кто считает?

реклама

Сжатие с потерями и без

Для начала нужно определиться с тем, о чем мы будем говорить. Главное и основное: все форматы звуковых файлов сегодня делятся на:

Все, это была минутка Википедии.

И да, я раскрою вам правду на то, стоит ли тратить терабайты на lossless.

MP3: скорее отстреляться

Конечно, начать надо с MP3. И, перефразируя название фильма, – «и это все об MP3». Безусловно, все вы про него знаете, и быть Капитаном Очевидность здесь не вижу смысла. Все, что воспроизводит звук сегодня, поддерживает MP3, вплоть до максимума.

В чем его главные нарекания и минусы? В основном – в срезе верхних частот и «прореживании» всех остальных.

В этом и проявляется хваленая гибкость формата: можно сделать маленький файл и слушать покромсанную Верку Сердючку из динамика смартфона. А можно сделать большой файл, где сжатие с минимальными потерями и слушать… не на динамике смартфона как минимум.

У MP3 есть один, самый весомый и безусловный плюс, не считая хорошего качества звука и гибкости при кодировании – можно забить на качество и сделать тысячи MP3 128 кбит/с на одной флэшке. Или не забить на качество и сделать несколько сотен в 320 кбит/с.

Но плюс в том, что у него нет DRM и прочих видов защит от копирования, которые редиски-владельцы авторских прав могут ставить на свою музыку.

Отдельного абзаца заслуживает VBR. VBR – это сокращение от Variable BitRate, переменный битрейт. Основная идея VBR – то, что кодек автоматически выбирает нужный битрейт в зависимости от контента. Это происходит еще на этапе кодирования, и главное декларируемое преимущество технологии – меньший размер файла при вроде бы том же высоком качестве (разумеется, кодирование происходит все-таки «вокруг» заданной частоты).

В реальности же качество VBR заметно проигрывает своему оппоненту CBR (Constant BitRate – постоянный битрейт), плюс ко всему заметно нагружает процессор. Конечно, на современных многоядерных ЦП это не так что бы заметно, но – «как-то, доктор, неаккуратненько». В общем, смысл тут прост: VBR лучше не пользоваться, поскольку выигрыш в размерах минимален, microSD сегодня дешевы, HDD тоже не состояние стоят, а проблем от них больше. И, опять же, качество хромает.

Чем сегодня кодируют MP3? На заре формата было очень много разных декодеров, сегодня их тоже можно найти, если постараться, кто-то постоянно тоже изобретает велосипед, но безусловный авторитет уже долгие годы – LAME. Несмотря на стебный перевод названия (вольно – «хромуля»), кодек справляется со своей задачей блестяще.

Какой программой пользоваться для кодирования – тоже понятно, общепринятым авторитетом является грозный EAC (Exact Audio Copy, и он точно соответствует своему названию). И то, и другое распространяется совершенно бесплатно (более того – LAME в принципе встроен почти во все по умолчанию), так что можете попробовать свои силы в кодировании того, что и так уже сто раз кодировано.

реклама

WMA: все плохо, как всегда

Компания Microsoft разработала WMA как альтернативу MP3. Но, как и в случае с платформой Windows Phone, люди посмотрели на него, потыкали пальцем – и забросили на полку.

Потому как файл WMA изобилует мелкими неприятностями, которые сами по себе вроде бы и не так страшны (например, плохая устойчивость к ошибкам: чуть поврежденный файл про кодировании или передаче становится непригодным полностью), но в совокупности WMA становится несерьезным. К тому же, опять же декларировалось, что при меньшем битрейте WMA будет качественным. Серьезно?

Конечно, WMA сегодня поддерживает все, что поддерживает MP3. Конечно, декларируется, что поддерживается lossless-кодирование, начиная с версии 9.1. Ну поддерживается. А дальше-то что? Кто-то этим пользуется?

реклама

Плюс ко всему – в WMA можно зашивать DRM-защиту. От такого фактора потирают жадные лапки правообладатели, но говорят «фи» рядовые пользователи. Еще один гвоздь в крышку гроба WMA.

В общем, формат мутный и явно нежизнеспособный. Как и платформа Windows Phone. Как и Surface. У Microsoft хорошо получалось делать операционные системы, но вот сторонние проекты – слабовато.

Источник

Кодирование аудио с потерями. Что к чему?

Внимание: это старая версия статьи, новая доступна на моём сайте.

Эволюция кодирования аудио

На дворе 2011-й год, с момента появления первого MP3 кодировщика прошло уже 17 лет. Но то, что большинство из нас до сих пор спокойно слушает музыку в формате MP3 — вовсе не значит, что прогресс всё это время топтался на месте. И это касается не только развития алгоритма кодирования MP3, но и эволюции кодирования аудио с потерями вообще — в виде новых, более совершенных кодеков, действительно позволяющих получить лучшее качество при меньшем размере. Такие форматы как OGG Vorbis, AAC, WMA, Musepack давно оставили позади устаревший MP3 с его многочисленными ограничениями и недостатками.

Параллельно, всё большие обороты набирает кодирование без потерь (lossless). Но из-за больших объемов данных на сегодняшний день оно всё еще непригодно для полномасштабного использования — особенно для портативных устройств с ограниченным объемом памяти, для потокового вещания в сети, и просто для быстрого обмена музыкой в интернете (надо признать, что не у всех и не всегда под рукой есть 100-мегабитный доступ в интернет).

И так, MP3 устарел, и ему определенно созрела замена. Только как быть пользователю непосвященному, но желающему добиться максимально качественного звучания с минимальными затратами объемов памяти? Ведь альтернативных кодеков довольно много (как минимум 3 из них действительно достойны внимания): Apple продвигает с помощью своего iTunes Store формат AAC (Advanced Audio Coding — позиционируется как преемник MP3), Microsoft — свой собственный лицензируемый WMA (Windows Media Audio), кроме того, всё большую известность приобретает OGG Vorbis, а особо просветленные используют даже такой формат как Musepack. Который из этих кодеков выбрать?

Однозначного ответа на этот вопрос нет — и именно поэтому я пишу сию статью.

Как определиться?

Выбор того или иного кодека зависит от конкретной задачи. А именно:

1. От оборудования и ПО, с помощью которого будет воспроизводиться звук. Т.е. от наличия поддержки того или иного формата аудио, а также качества воспроизведения (им желательно руководствоваться при выборе битрейта).

2. От объема памяти, который будет выделен под конечный материал. Соответственно подбирается больший или меньший целевой битрейт/качество.

Ну и, конечно же, необходимо кроме формата и битрейта подобрать оптимальный кодировщик и параметры кодирования. При этом надо понимать, что различные форматы/кодеры по-разному проявляют себя на разных диапазонах битрейта.

Таким образом, алгоритм примерно следующий:

1) Выяснить, какие форматы поддерживает целевое устройство.
2) Определиться, сколько места вы сможете выделить под аудио материал, а также определить суммарную продолжительность аудио предназначенного для кодирования.
3) Вычислить нужный битрейт по формуле: битрейт = дисковое_пространство(в килобитах) / суммарная_продолжительность(в секундах).
4) В соответствии с битрейтом выбрать из поддерживаемых форматов оптимальный (об этом далее).
5) Подобрать наилучший кодер и параметры к нему.

Подробнее о наших героях

Что такое ogg битрейт. Смотреть фото Что такое ogg битрейт. Смотреть картинку Что такое ogg битрейт. Картинка про Что такое ogg битрейт. Фото Что такое ogg битрейт

OGG Vorbis

Что такое ogg битрейт. Смотреть фото Что такое ogg битрейт. Смотреть картинку Что такое ogg битрейт. Картинка про Что такое ogg битрейт. Фото Что такое ogg битрейт

Ogg Vorbis — это относительно новый универсальный формат аудио компрессии, официально вышедший летом 2002 года. Он принадлежит к тому же типу форматов, что и МР3, AAC, VQF и WMA, то есть к форматам компрессии с потерями. Психоакустическая модель, используемая в Ogg Vorbis, по принципам действия близка к МР3 и иже с ними, но и только — математическая обработка и практическая реализация этой модели в корне отличаются, что позволяет авторам объявить свой формат совершенно независимым от всех предшественников.
Главное неоспоримое преимущество формата Ogg Vorbis — это его полная открытость и свободность. Более того, в нем использована новейшая и наиболее качественная психоакустическая модель, из-за чего соотношение битрейт/качество значительно ниже, чем у других форматов. Как результат — качество звука лучше, но размер файла меньше.
В формате имеется большое количество достоинств. Например, формат Ogg Vorbis не ограничивает пользователя только двумя аудио каналами (стерео — левый и правый). Он поддерживает до 225 отдельных каналов с частотой дискретизации до 192kHz и разрядностью до 32bit (чего не позволяет ни один формат сжатия с потерями), поэтому Ogg Vorbis великолепно подходит для кодирования 6-ти канального звука DVD-Audio. К тому же, формат OGG Vorbis — sample accurate. Это гарантирует, что звуковые данные перед кодированием и после декодирования не будут иметь смещений или дополнительных/потерянных сэмплов относительно друг друга. Это легко оценить, когда вы кодируете non-stop музыку (когда один трек постепенно входит в другой) — в итоге сохранится целостность звука.
Возможностью потокового вещания сейчас никого не удивишь, но у этого формата она заложена с самых основ. Это дает формату достаточно полезный побочный эффект — в одном файле можно хранить несколько композиций с собственными тегами. При загрузке такого файла в плеер должны отобразиться все композиции, будто их загрузили из нескольких различных файлов.
Отдельно стоит упомянуть достаточно гибкую систему тегов. Заголовок тегов легко расширяется и позволяет включать тексты любой длины и сложности (например, текст песни), перемежающиеся изображениями (например, фотография обложки альбома). Текстовые теги хранятся в UTF-8, что позволяет писать хоть на всех языках одновременно и исключает возможные проблемы с кодировками. Это значительно удобнее различных ухищрений типа id3 тегов.
Ogg Vorbis по умолчанию использует переменный битрейт, при этом значения последнего не ограничены какими-то жесткими значениями, и он может варьироваться даже на 1kbps. При этом стоит заметить, что форматом жестко не ограничен максимальный битрейт, и при максимальных настройках кодирования он может варьироваться от 400kbps до 700kbps. Такой же гибкостью обладает частота дискретизации — пользователям предоставляется любой выбор в пределах от 2000Hz до 192000Hz.
Ogg Vorbis был разработан сообществом Xiphophorus для того, чтобы заменить все платные запатентованные аудио форматы. Несмотря на то, что это самый молодой формат из всех конкурентов МР3, Ogg Vorbis имеет полную поддержку на всех известных платформах (Windows, PocketPC, Symbian, DOS, Linux, MacOS, FreeBSD, BeOS и др.), а также большое количество аппаратных реализаций. Популярность на сегодняшний день значительно превосходит все альтернативные решения.
Стоит заметить, что Ogg Vorbis является всего лишь небольшой частью мультимедиа проекта Ogg Squish, в который также входят свободные кодировщики: Speex — для сжатия голоса; FLAC — для сжатия звука без потерь; Theora — для сжатия видео.

Musepack

При этом материал должен быть предварительно преобразован в моно и ресемплирован до частоты 22050 Гц (желательно ресемплером SoX). На выходе получим обычное Low Complexity AAC с битрейтом около 25 кбит/с.

Для музыки в этом диапазоне тоже есть варианты:

1) Nero AAC. Тут никаких преобразований не нужно:

На выходе — High Efficiency AAC v2 (с параметрическим стерео и синтезом ВЧ),

35 кбит/с. Прекрасный вариант для какого-нибудь интернет-радио. Только тут надо не забывать, что декодер в плеере должен поддерживать HE-AACv2, иначе получите полное отсутствие ВЧ и монофонию.

2) OGG Vorbis AoTuV — данная модификация libvorbis включает усовершенствование алгоритма кодирования с низкими битрейтами и, даже без технологии SBR, не сильно уступает HE-AACv2. Командная строка:

Полученные таким образом файлы должны быть полностью совместимы со стандартными декодерами OGG Vorbis. Битрейт — аналогичный — около 35 кбит/с.

3) WMA 10 Pro. Для таких случаев у Microsoft тоже есть что-то наподобие SBR (синтез ВЧ), звучит не так плохо, как могло бы. Правда битрейт чуть выходит за рамки — 48 кбит/с.

Учтите, что старые (особенно «железные») декодеры не поддерживают WMA 10. Для такого случая можно использовать WMA 9.2 (кодер тот же), правда, его качество на низких битрейтах значительно хуже.

Низкий битрейт,

Изначально я думал сразу перейти к более высоким скоростям. Но так как совсем недавно на hydrogenaudio.org прошло сравнение кодеров именно на этом битрейте, грех его пропустить.

1) QuickTime AAC — победитель (если не считать новоиспеченный Opus/CELT) того самого теста. Ниже указаны настройки для кодера QAAC:

На выходе имеем HE-AAC (с SBR, но без Parametric Stereo), что должно поддерживаться различными iPod’ами и тому подобным.

2) OGG Vorbis AoTuV — хоть и оказался довольно далеко от QAAC, но всё же:

3) И на всякий случай WMA 10 Pro:

Для старых декодеров — WMA 9 Standard:

Чуть выше,

А этот битрейт я рассматриваю уже из-за Vorbis.

1) Как показали тесты, лучше всего с ним справляется кодер OGG Vorbis AoTuV:

Используемый профиль — HE-AAC.

Стандарт де-факто, 128 кбит/с

Интересный факт: многие утверждают, что для MP3 128 кбит/с — «пограничный битрейт», с которого начинается неотличимое от оригинала качество. Пожалуй, это так… для пластмассовых китайских колонок с блатняком. Реально же этот порог находится где-то около 200 кбит/с, при чем новые форматы дают на этом битрейте более стабильное качество.

Современным кодерам эту планку в 128 кбит/с удалось занизить чуть ли не в два раза (опять же, по заявлениям разработчиков). Но, тем не менее, если у вас более-менее приличная акустика (или наушники), на сложных фрагментах разницу можно уловить и при 128 кбит/с.

Профиль — обычный AAC LC.

Для старых декодеров — WMA 9 Standard:

В этом диапазоне разница межу кодерами Nero, QuickTime AAC и Vorbis практически сходит на нет. Но здесь уже на сцену выходит тот самый Musepack. Как раз на этих битрейтах начинает проявляться его преимущество (за счет необычайно гибкого VBR режима, а также принципиально другого алгоритма сжатия):

Порог прозрачности:

То, о чем я говорил. При этом битрейте практически все кодеры дают прозрачный для большинства слушателей звук. И именно этот диапазон является оптимальным в плане размер/качество.

Кстати, у LAME MP3 в этом районе тоже находится подобный порог (VBR V2), но у этого кодека очень большие проблемы с пре-эхом (искажения предшествующие резким всплескам сигнала), а на слух часто ощущается Noise Shaping (шумы от ошибок квантования таким образом переносятся в высокочастотную область).

У таких же кодеков, как Vorbis, AAC и MPC на этом пороге начинается четкая прорисовка в композициях даже фоновых шумов.

WMA 9 Standard, максимальный битрейт воспринимаемый старыми декодерами:

Разумный максимум:

225 кбит/с повышение битрейта чаще всего уже не дает слышимого прироста качества, а размер файлов, естественно увеличивается. Но всё же, для особенно сложных композиций (и хорошей аппаратуры/ушей) существуют более высокие настройки качества. На этих битрейтах для таких кодеров как Museppack и Vorbis мне даже не удалось найти киллер-семплов (проблемные семплы, на которых явно проявляются недостатки алгоритма кодирования). И так:

Опережая ваши вопросы: да, для некоторых из этих кодеров существуют и более высокие настройки качества, но дальнейшее их повышение уже не имеет никакого смысла. Разве что вам действительно не важен объем занимаемый музыкой памяти, а поддержкой lossless ваше устройство не располагает.

Вот, собственно, и всё, чем я хотел с вами поделиться. Пробуйте, комментируйте, задавайте вопросы.

Источник

Очная ставка: OGG vs LAME

Предисловие

Наверное, никого уже не удивишь звуковыми возможностями современных компьютеров. Ведение фонотеки на компьютере наряду с аудиокассетами и компакт-дисками стало для многих привычным делом. Сегодня даже школьники знают магический пароль, объединяющий многих людей, так или иначе связанных с компьютерами. Этот пароль состоит всего из трех символов: «M» «P» «3». Задумайтесь, сколько воспоминаний уже связано у вас с ними.

Многим известно, что представляют собой аудио компакт-диски с точки зрения простоты и лёгкости обращения. «Почему?» — спросите вы. Да потому что компакт-диск, как говорится, «и в Африке» компакт-диск. Если не принимать во внимание некоторые особенности считывания, он всегда и везде такой, каким его создали, то есть одинаковый. У него один и тот же жестко определенный формат, а качество звучания в основном зависит от звукозаписывающей студии и обычно на высоте. Удобно? Не спорю!

А что же с музыкой на компьютере? Формат записи PCM (импульсно-кодовая модуляция), принятый на CD-DA дисках, недостаточно компактен, чтобы его можно было использовать для хранения музыки на своем компьютере, и уж совершенно непригоден для обмена музыкой через Сеть. Поэтому разрабатываются и постоянно совершенствуются математически чрезвычайно сложные алгоритмы сжатия аудиоданных и форматы их хранения. Эти алгоритмы порой сильно отличаются по качеству звучания друг от друга. Перед многочисленными пользователями стоит постоянная проблема выбора: какой программой, по какому алгоритму и с какими параметрами кодировать свою любимую музыку?

Несмотря на то, что создано множество различных алгоритмов и форматов, абсолютным лидером на сегодняшний день является только один из них. Это формат сжатия MPEG 1.0 Audio Layer III, называемый в народе просто «MP3». Существует много программ-кодировщиков, позволяющих записывать музыку в этот формат. Каждая из таких программ обладает своими плюсами и минусами, в Сети можно найти большое количество тестирований и сравнений различных кодировщиков формата МР3. Общепризнанным лидером на сегодня считается LAME, бесплатный открытый проект, свободный от лицензионных ограничений.

Мы уже привыкли считать, что MP3 — это лучшее, MP3 — это на века. Однако прошло не так много времени с того момента, как у преобладающего формата сжатия аудио и кодировщика появился серьезный конкурент — совершенно новый формат и алгоритм Ogg Vorbis. Уже после выхода в конце лета 2000 года версии бета 3 этого кодировщика общественность стала к нему серьезно присматриваться, и выбрать «лучшее» стало очень сложно. И вот в начале 2001 года вышли сразу две новые версии: LAME 3.88 и Ogg Vorbis 1.0 Beta 4. Обе версии значительно отличаются от предыдущих, поэтому назрела необходимость сравнить их между собой, провести, так сказать, «очную ставку» двух форматов. Что и было проделано. Результат перед вами. Данная статья является логическим продолжением опубликованной на iXBT в декабре 2000 года моей статьи «Аудио компрессия для меломанов».

Ключ на старт

Для начала несколько слов о самом процессе исследования. Тестирование, сравнение и анализ проводились в пяти условных (по авторской классификации) зонах качества:

В качестве кодировщика и декодировщика использовалась написанная автором статьи программа OrlSoft MPeg eXtension версии 2.0, уже достаточно известная и полюбившаяся пользователям в нашей стране и за ее пределами. При анализе результатов применялись программы: CoolEdit Pro 1.2, Steinberg WaveLab 3.02, SpectraLab 4.32.13.

Помимо уже применявшихся в исследованиях в моей предыдущей статье семплов Roxette «Crush On You» и Richard Clayderman «Mano a Mano» использовался целый ряд семплов из других композиций различных музыкальных стилей и направлений: DJ BOBO «What A Feeling», Bluemchen «Ist Deine Liebe Echt» и «Sehnsucht@herz.de», Chicane «Autumn Tactics» и прочие. При построении выводов и иллюстраций будут приводиться наиболее характерные результаты для каждой зоны.

Условия сравнения.

К сожалению, невозможно совершенно равнозначно сравнивать LAME и OGG по одинаковому битрейту, так как он, как правило, не получается таковым. Дело в том, что формат и кодировщик Ogg Vorbis не подразумевают использование режима кодирования с постоянным битрейтом (как в MP3), для него любой из шести предустановленных режимов (112, 128, 160, 192, 256, 350) является кодированием с плавающим потоком, так называемым VBR режимом — variate bitrate, хотя скорее всего его правильнее назвать ABR — average bitrate. Более того, кроме указания желаемой скорости (иначе говоря — ширины) потока, кодер OGG больше не позволяет никаких манипуляций со своими параметрами, в то время как LAME дает возможность управлять практически всем. Поэтому для большей объективности при проведении тестирования мы не будем вмешиваться в параметры психоакустической модели, фильтров и других параметров кодирования LAME и, таким образом, будем сравнивать оба кодера в рекомендуемых разработчиками режимах кодирования. Единственное отступление от этого правила будет сделано для lowpass фильтра (в сигнале оставляют только частоты ниже некоторого заданного уровня) для указания LAME, какие частоты мы хотим оставить в сигнале, чтобы избежать чрезмерного их срезания.

Не так давно в LAME появился режим заказного (среднего) битрейта (average bitrate — ABR), реализованный ранее в кодере OGG. По утверждению разработчиков, при одинаковом битрейте кодирование в ABR режиме должно быть не хуже, чем в обычном. Поэтому при исследовании качества LAME будем использовать два набора кодированных семплов: с постоянным и переменным битрейтами.

Ограничения форматов.

В силу спецификации формата MP3 невозможно кодировать в этот формат нон-стоп альбомы так, чтобы они могли потом воспроизводиться без пауз, поскольку файлы этого формата всегда оказываются длиннее оригиналов и имеют дополнительные отсчеты тишины в начале и в конце треков. Декодер LAME умеет исправлять начало файлов, поэтому после декодирования начало файлов всегда совпадает с оригиналом, но концовка все равно неправильная. В формате Ogg Vorbis данная проблема отсутствует: файлы совпадают с оригиналами с точностью до одного отсчета. Однако у данного кодера имеется другое серьезное ограничение: он умеет кодировать файлы только с частотой дискретизации 44100 Гц, т.е. формата аудио компакт-дисков (CD-DA). Кодировать файлы с частотой дискретизации 48000 Гц OGG на данный момент не может.

Принятая терминология.

Семпл — звуковой файл, некоторый отрывок музыкальной композиции.

Оригинал, оригинальный семпл, исходный семпл — отрывок формата WAV, взятый с аудио компакт-диска.

Кодированный семпл — семпл, закодированный (сжатый) в один из рассматриваемых форматов. В данном случае это MP3 (LAME) или OGG.

Раскодированный семпл — кодированный семпл, преобразованный обратно из сжатого формата в обычный WAV для проведения исследований.

Кодер, кодировщик — программа, производящая сжатие (кодирование) семпла из одного формата в другой, здесь — из WAV в MP3 или OGG.

АЧХ — амплитудно-частотная характеристика звука, представление звука графиком частота-амплитуда.

Сонарм, сонограмма — частотно-временное представление звука графиком время-частота.

Дельта-сигнал — разностный (дельта) сигнал, полученный путем вычитания одного семпла из другого и характеризующий различия между ними. В данном случае употребляется для вычисления разницы между оригинальными и закодированными семплами.

«Супер»

Начнем мы, разумеется, с самой лакомой для меломанов зоны высших битрейтов. При этом, главная цель кодирования заключается в достижении максимально возможного качества звучания, поэтому для тестирования возьмем максимальные параметры для обоих кодеров. Для LAME берем чистый режим 320 кбит с полным звуковым диапазоном вплоть до 22 кГц и максимальным качеством (-q0), остальные параметры позволим устанавливать самому кодеру. Для OGG также возьмем режим максимального качества — 350 кбит. К сожалению, как я уже говорил, управление какими-либо другими параметрами кодирования невозможно, поэтому придется полагаться на собственные настройки кодера. Таким образом, кодеры работают практически на пределе своих возможностей по передаче звучания оригиналов. Сжимаем, декодируем, смотрим…

И что же получается? Очень интересные факты. Я со всей ответственностью могу подтвердить заверения разработчиков обоих форматов о том, что их психоакустические модели претерпели значительные изменения, которые легко заметны при анализе раскодированных семплов. В корне изменилась обработка высоких частот. Если раньше в режиме 320 кбит LAME оставлял практически полный диапазон вплоть до 22 кГц, то сейчас эти частоты также проходят через психоакустическую модель. Данный факт прекрасно иллюстрируется сонармом (частотно-временное представление звука). Сравните оригинал и раскодированный семпл:

Что такое ogg битрейт. Смотреть фото Что такое ogg битрейт. Смотреть картинку Что такое ogg битрейт. Картинка про Что такое ogg битрейт. Фото Что такое ogg битрейт Что такое ogg битрейт. Смотреть фото Что такое ogg битрейт. Смотреть картинку Что такое ogg битрейт. Картинка про Что такое ogg битрейт. Фото Что такое ogg битрейт

Шокирующие иллюстрации, не правда ли? Но это еще что, вот полюбуйтесь, что получается у OGG на 350 кбит — срезание частот даже на уровне 16 кГц.

Что такое ogg битрейт. Смотреть фото Что такое ogg битрейт. Смотреть картинку Что такое ogg битрейт. Картинка про Что такое ogg битрейт. Фото Что такое ogg битрейт

В закодированном сигнале встречаются даже такие вот участки АЧХ (вертикальной линией отмечена частота 16 кГц).

Что такое ogg битрейт. Смотреть фото Что такое ogg битрейт. Смотреть картинку Что такое ogg битрейт. Картинка про Что такое ogg битрейт. Фото Что такое ogg битрейт

Согласитесь, довольно странное обращение с высокими частотами для режима максимального качества кодирования. В более ранних версиях обоих кодеров такого вольного обращения я не встречал. Интересно, как звучат эти семплы по сравнению с оригинальными записями… Начинаем прослушивание.

Вот это да! Вот это обработка звучания! Звук стал настолько близок к оригиналу, что отличить вслепую три записи стало чрезвычайно сложно. При максимальных параметрах оба кодера передают практически идентично звучание оригинального компакт-диска. Единственное, что после многократного перекрестного прослушивания мне удалось отметить, это большую прозрачность звучания и лучшую передачу верхних средних частот у кодера OGG. Но, повторю, эта разница настолько ничтожна, что ощутимо слышна она будет только на очень качественной и дорогой аппаратуре. Таким образом, за передачу максимально возможного качества звучания оба кодера получили твердую «пятерку» с одним только отличием, что у OGG средняя скорость потока ощутимо больше 320 кбит (обычно она варьируется в пределах от 340 до 380). Разработчики разумно решили поступиться передачей частот выше 19 кГц, отдав предпочтение более важному частотному диапазону. Усредненные АЧХ кодированных и оригинальных семплов мало отличаются друг от друга, несмотря на очень вольное управление высокими частотами обоих кодеров.

Давайте проведем исследование дельта-сигналов, то есть вычислим и сравним отличия между оригинальными и кодированными семплами.

Разностный сигнал семплов LAME на слух воспринимается как негромкий широкополосный шум, сквозь который слабо пробивается основной звук с хриплым постукиванием и сильно искаженными высокими частотами. Для семплов OGG картина оказывается намного более сложной: звучание напоминает уже не просто шум, а сильно искаженный оригинал с эффектом фазовых искажений (эффект flanger или phaser). Если судить по звучанию, можно сделать вывод, что у OGG обработка разных диапазонов частот отличается значительно большей продуманностью по сравнению с LAME, у которого, похоже, для большинства поддиапазонов применяются очень близкие параметры психоакустической модели. Это видно при анализе АЧХ дельта-сигналов (красный график для LAME, белый — для OGG). Смысл приведенных графиков заключается в том, что чем ниже уровень сигнала, тем выше качество передаваемого звучания на соответствующих частотах.

Что такое ogg битрейт. Смотреть фото Что такое ogg битрейт. Смотреть картинку Что такое ogg битрейт. Картинка про Что такое ogg битрейт. Фото Что такое ogg битрейт

Таким образом, разработчики OGG пошли по пути иного распределения приоритетов относительно применяемого в MP3 кодирования. Они решили упростить кодирование низких и средних частот ниже 2 кГц, зато улучшить передачу верхней середины и высоких частот до 16 кГц, т.е. основного слышимого диапазона. На приведенном графике хорошо видно, что в диапазоне до 2 кГц лучше передает звучание LAME, в то время как в диапазоне от 2 до 16 кГц — OGG. Отсюда и подмеченное мною лучшее качество звучания средних частот на семплах, закодированных кодером OGG.

Как уже говорилось, кодер OGG не позволяет управлять параметрами кодирования, что заставляет нас довериться выбору разработчиков формата. В то же время LAME дает огромные возможности по управлению процессом кодирования, параметрами психоакустики и фильтров, и, если при кодировании в 320 кбит насильно срезать частоты выше 20 кГц, которые по теории никто не может услышать, можно добиться лучшего качества звучания. Нагляднее всего это можно продемонстрировать на сравнительном графике усредненных АЧХ дельта-сигналов полного и обрезанного до 20 кГц при кодировании семплов.

Что такое ogg битрейт. Смотреть фото Что такое ogg битрейт. Смотреть картинку Что такое ogg битрейт. Картинка про Что такое ogg битрейт. Фото Что такое ogg битрейт

Разница в уровне дельта-сигнала составляет до 2 дБ, и это весьма ощутимая разница — порядка 15%. То есть, образно говоря, решив не кодировать частоты выше 20 кГц, мы получили улучшение передачи всего остального диапазона на 1-2 дБ. Я рекомендую придерживаться этого правила, если вы хотите получать более качественное звучание. Отмечу также, что разницу в звучании между семплами, обрезанными на 20 кГц, и семплами OGG обнаружить уже не просто сложно, а практически невозможно, разумеется, если кто-то из читателей не обладает абсолютно уникальным слухом.

Таким образом, в зоне высочайшего качества OGG и LAME практически не отличаются друг от друга, поэтому при выборе кодера меломаны могут руководствоваться только личными симпатиями.

«Хорошо»

Сверхвысокий битрейт дает великолепное качество звучания, однако не он является преобладающим среди высоких битрейтов, т.к. объем файла при потоке 2,5 Мб в минуту многие пользователи считают чрезмерно большим. Как правило, они предпочитают использовать в своих личных фонотеках файлы с битрейтом 256 кбит, считая это разумным компромиссом между хорошим качеством и размером файлов. Поэтому будем подходить к тестированию именно с такой точки зрения, т.е. сравним качество обоих кодеров и оценим потери относительно большего битрейта. Как и для режима 320 кбит, в данном случае считаю оправданным подавление высоких частот до 20 кГц для улучшения передачи основного слышимого частотного диапазона. Тестирование LAME проведем в двух режимах: с постоянной скоростью потока и с переменной.

Для начала посмотрим на частотную динамику получившихся семплов (изменение АЧХ во времени с усреднением по небольшим интервалам — от 20 до 100 миллисекунд). Тенденция к потере высоких частот подтверждается. Как и в предыдущем тесте, OGG срезает высокие частоты (выше 18 кГц) значительно больше, чем LAME. Взгляните сами:

Что такое ogg битрейт. Смотреть фото Что такое ogg битрейт. Смотреть картинку Что такое ogg битрейт. Картинка про Что такое ogg битрейт. Фото Что такое ogg битрейт Что такое ogg битрейт. Смотреть фото Что такое ogg битрейт. Смотреть картинку Что такое ogg битрейт. Картинка про Что такое ogg битрейт. Фото Что такое ogg битрейт

Что такое ogg битрейт. Смотреть фото Что такое ogg битрейт. Смотреть картинку Что такое ogg битрейт. Картинка про Что такое ogg битрейт. Фото Что такое ogg битрейт Что такое ogg битрейт. Смотреть фото Что такое ogg битрейт. Смотреть картинку Что такое ogg битрейт. Картинка про Что такое ogg битрейт. Фото Что такое ogg битрейт

Однако, несмотря на это, кодер OGG значительно лучше передает частоты в диапазоне от 15 до 18 кГц, в то время как LAME начинает их срезание в паузах между большими всплесками амплитуды сигнала и на более низких частотах. Но даже на этой диаграмме хорошо видно, что частотная передача у LAME в режиме ABR значительно превосходит стандартный режим постоянного битрейта, что позволяет подтвердить описанное выше высказывание разработчиков и сделать вывод о более высоком качестве кодирования в режиме ABR. Теперь давайте послушаем, что же у нас получилось.

Разработчики LAME серьезно изменили кодер: той разницы в звучании высоких частот, что раньше была заметна сразу, больше нет. Звучание семплов, закодированных в ABR, действительно лучше стандартного, поэтому рекомендую отказаться от использования постоянного битрейта в пользу ABR. Как бы это ни казалось вам странным, но срезание кодером OGG частот выше 18 кГц сильно не сказывается на общем звучании семплов, разница c LAME также оказалась минимальной. Понимаю, в это будет сложно поверить, но кроме небольшого «металлизирования» высоких частот и слабенького провала глубины звучания я ничего не смог обнаружить. То, что я услышал, не было похоже на то, как раньше звучали LAME и OGG! Поэтому тем, кто предпочитает 256 кбит, рекомендую и впредь им пользоваться, только нужно обязательно перейти на новую версию LAME.

А что же нам скажут дельта-сигналы? На слух их звучание подобно полученному при рассмотрении режима 320 кбит. Для семплов OGG можно отметить появление в сигнале хрипящих звуков в диапазоне высоких частот, а для семплов LAME — только общее увеличение уровня шума, какого-либо серьезного изменения в частотах не замечено.

Что такое ogg битрейт. Смотреть фото Что такое ogg битрейт. Смотреть картинку Что такое ogg битрейт. Картинка про Что такое ogg битрейт. Фото Что такое ogg битрейт

Думаю, достаточно наглядная демонстрация. Вот вам и объяснение, почему при почти одинаковом битрейте OGG сильно срезает частоты выше 18 кГц. Это делается для того, чтобы лучше передать все остальные. Вы только посмотрите! Практически на всем звуковом диапазоне семплы OGG значительно ближе к оригиналу, чем семплы LAME. Поэтому, если вы готовы пожертвовать тем, что лежит за пределами 18 кГц, ради лучшего качества, вам стоит подумать о переходе на OGG. Однако столь ощутимая разница в звучании проявляется не на всех семплах. Возьмем, например, старого знакомого — семпл Richard Clayderman, на котором все огрехи передачи высоких частот слышны сразу.

Что такое ogg битрейт. Смотреть фото Что такое ogg битрейт. Смотреть картинку Что такое ogg битрейт. Картинка про Что такое ogg битрейт. Фото Что такое ogg битрейт

В данном случае LAME показал немного лучший результат, но, тем не менее, высокое качество передачи частот выше 2 кГц кодером OGG очевидно. В то же время в очередной раз продемонстрировано значительно лучшее качество при ABR кодировании LAME, разница составляет от 1 до 2 дБ.

Что такое ogg битрейт. Смотреть фото Что такое ogg битрейт. Смотреть картинку Что такое ogg битрейт. Картинка про Что такое ogg битрейт. Фото Что такое ogg битрейт

Как мы видим, картина сильно не изменилась, закономерности остались теми же.

Таким образом, при выборе кодера для работы в режиме 256 кбит вам предстоит определить, что для вас важнее: средние частоты или частоты выше 17-18 кГц? Ответив на этот вопрос, вы сразу же ответите на вопрос о предпочтительном кодировщике. Отмечу только еще раз, что в режиме ABR качество кодирования у LAME намного лучше, чем при использовании постоянного битрейта. Это бесспорный факт. А если вам интересно мое собственное мнение, то я бы назвал лидером кодер OGG.

256 vs 320/350: кто кого?

После того, как мы определились с лидером зоны «хорошо», самое время сравнить качество кодирования двух рассмотренных зон вместе.

Слуховые испытания семплов LAME только подтверждают мои выводы об очень высоком качестве кодирования в ABR режиме 256 кбит. Разница между семплами 256 ABR и 320, конечно же, ощутима на слух: звук становится немного более резким, появляется излишняя четкость, но эту разницу нельзя назвать критической. Поэтому, если для вас является критерием не максимальное приближение к оригиналу, а просто достаточно высокое качество, то режим 256 ABR — для вас. А вот с семплами OGG ситуация оказалась с точностью до наоборот: звук немного размывается, но это размывание опять же нельзя назвать критическим. Указанные различия в кодированных семплах проявляются, только если специально проводить перекрестное прослушивание на большой громкости и очень хорошей аппаратуре. Поэтому не стоит заострять на них особое внимание.

А вот как эти различия выглядят графически.

Что такое ogg битрейт. Смотреть фото Что такое ogg битрейт. Смотреть картинку Что такое ogg битрейт. Картинка про Что такое ogg битрейт. Фото Что такое ogg битрейт

Если судить по графикам (а это уже знакомые вам усредненные АЧХ дельта-сигналов для семплов 256 и 320/350 кбит обоих кодеров), то наибольшие различия между двумя режимами обнаруживаются у кодера OGG, причем проявляются они как раз на тех частотах, где звучание OGG лучше. Здесь, по всей видимости, сказывается разница в битрейте, поскольку сравнивается не 320, а целых 350 кбит против 256.

Подводя итоги, можно сказать следующее. Кодирование в режиме 256 кбит у обоих кодеров стало настолько качественным, что, если для вас не является жизненно необходимым достижение максимального приближения к оригиналу, смело используйте режим 256 кбит и не беспокойтесь о качестве, оно выше всяких похвал. Лично я для многих не особо ценных записей стал использовать LAME 256 ABR или OGG 256 в зависимости от того, для чего кодируется музыка, а также учитывая, что нон-стоп записи можно кодировать только в OGG, т.к. он кодирует и декодирует файлы с точностью до отсчета, не добавляя лишней тишины, как это делают все MP3 кодировщики.

«Неплохо»

Режим 192 кбит является своего рода половинчатым решением, поскольку еще не дает достойного качества, но в то же время имеет не такой уж и маленький объем (1,5 Мб — 1 минута). Давайте посмотрим, что изменилось в зоне «неплохого» качества с приходом новых версий исследуемых кодеров. А вдруг они теперь уже на 192 кбит передают великолепное качество звучания? Этот вопрос нам предстоит выяснить в ходе тестирования.

Ситуация с высокими частотами изменилась кардинально: их передача лучше получается у OGG — LAME начал их срезать. Качество ABR кодирования по-прежнему лучше обычного, однако все равно хуже OGG.

Что такое ogg битрейт. Смотреть фото Что такое ogg битрейт. Смотреть картинку Что такое ogg битрейт. Картинка про Что такое ogg битрейт. Фото Что такое ogg битрейт Что такое ogg битрейт. Смотреть фото Что такое ogg битрейт. Смотреть картинку Что такое ogg битрейт. Картинка про Что такое ogg битрейт. Фото Что такое ogg битрейт

Что такое ogg битрейт. Смотреть фото Что такое ogg битрейт. Смотреть картинку Что такое ogg битрейт. Картинка про Что такое ogg битрейт. Фото Что такое ogg битрейт Что такое ogg битрейт. Смотреть фото Что такое ogg битрейт. Смотреть картинку Что такое ogg битрейт. Картинка про Что такое ogg битрейт. Фото Что такое ogg битрейт

Даже по столь спорной диаграмме, как сонарм, прекрасно видно, что в режиме 192 кбит качество передачи высоких частот у OGG выше, хотя и не намного. Оба кодера значительно срезают частоты выше 16 кГц, но OGG оставляет их больше, чем LAME. Давайте послушаем наши семплы, априори ожидая интересные результаты.

Общее качество звучания оказалось, конечно же, хуже 256 кбит, поскольку присутствует значительное металлизирование и размазывание высоких частот, а также небольшая потеря глубины у обоих кодеров. Однако на этот раз их звучание стало сильно отличаться друг от друга, в основном на высоких частотах. То, как LAME передает высокие частоты, полностью соответствует понятию «неплохо», тогда как семплы OGG вполне могут претендовать на оценку «хорошо» в большинстве случаев. Как и в предыдущих тестированиях, наиболее ярко это различие проявилось при воспроизведении семпла Richard Clayderman, на особо качественно записанных живых «тарелках». OGG частично сохраняет особый колорит звучания исследуемых семплов, хотя сильно их размазывает, тогда как LAME сводит все к обычному металлическому «циканью». Бесспорный минус для LAME. Однако его прошлые версии делали звучание таким даже на 256, а порой и на 320 кбит. Поэтому не будем сильно сгущать краски. Вопрос, правда, спорный, что лучше — размазывание или металлизирование. В то же время у OGG обнаруживается некоторое «проваливание» средних частот, которого не наблюдалось на более высоких битрейтах. Тем не менее в целом звучание для 192 кбит достаточно неплохое, хотя и не может претендовать на действительно качественное.

Давайте поглядим на разностные сигналы кодированных семплов, на которых обнаружилась наибольшая разница в звучании. На семплах LAME помимо увеличения общего уровня шумов появились отчетливо слышимые искажения в диапазоне высоких частот. На семплах OGG сквозь шум и сильные искажения высоких частот стало хорошо слышно чрезвычайно искаженное звучание оригинала в диапазоне средних частот. На семплах LAME такого высокого уровня средних частот отмечено не было. Таким образом, с понижением битрейта уровень разностных сигналов, шумов и искажений растет. Чем ниже битрейт, тем больше разница между закодированными семплами и оригинальными записями.

Что такое ogg битрейт. Смотреть фото Что такое ogg битрейт. Смотреть картинку Что такое ogg битрейт. Картинка про Что такое ogg битрейт. Фото Что такое ogg битрейт

Что такое ogg битрейт. Смотреть фото Что такое ogg битрейт. Смотреть картинку Что такое ogg битрейт. Картинка про Что такое ogg битрейт. Фото Что такое ogg битрейт

Определить, какой из кодеров ближе к оригиналу, стало очень сложно. На слух они, конечно, отличаются, но по графикам невозможно сделать вывод о предпочтительности того или иного кодера. Или вот еще диаграммы для семплов Roxette, очень плотных и громких.

Что такое ogg битрейт. Смотреть фото Что такое ogg битрейт. Смотреть картинку Что такое ogg битрейт. Картинка про Что такое ogg битрейт. Фото Что такое ogg битрейт

У вас, должно быть, возник вполне логичный вопрос: зачем я привел сразу три одинаковых графика? Если возник, значит, я не зря пишу эту статью. Ведь кроме того, что я выскажу свое мнение по исследуемому вопросу, вы должны сделать выбор сами. Именно для того, чтобы вам было легче понять мои выводы и сделать свои, я и привожу множество графиков и диаграмм.

Обобщив результаты сравнения приведенных графиков, прослушивания, просмотра АЧХ в динамике, а также исследования дельта-сигналов и сонарма — т.е. на основании всех полученных данных я бы сделал следующие выводы.

Кодеры звучат отлично друг от друга. LAME передает общее звучание неплохо, но металлизирует высокие частоты. OGG, наоборот, их размазывает и проигрывает LAME в передаче средних частот. Поэтому я считаю, что LAME при ABR кодировании все же лучше OGG справляется с задачей качественного кодирования музыки в 192 кбит. А вот при кодировании с постоянным битрейтом — проигрывает ему по полной программе, во всех тестах. Надеюсь, вы уже поняли, что режим среднего битрейта ABR всегда дает лучшее качество.

Таким образом, LAME в режиме ABR лидирует при кодировании в 192 кбит.

«Так себе»

Вот мы и подошли к двум, наверное, самым популярным на сегодня битрейтам — 160 и 128 кбит. Чем плох 128 и хорош 160? Тем, что 128 кбит, как бы странно это ни звучало для многих, недостаточно для передачи сколько-нибудь качественного звучания, т.к. на кодирование высоких частот не хватает ширины потока. А вот 160 кбит для приемлемой передачи частот 16-17 кГц уже вполне достаточно. Как же справляются с этой задачей новые версии кодеров? Давайте посмотрим.

Что такое ogg битрейт. Смотреть фото Что такое ogg битрейт. Смотреть картинку Что такое ogg битрейт. Картинка про Что такое ogg битрейт. Фото Что такое ogg битрейт Что такое ogg битрейт. Смотреть фото Что такое ogg битрейт. Смотреть картинку Что такое ogg битрейт. Картинка про Что такое ogg битрейт. Фото Что такое ogg битрейт

Что такое ogg битрейт. Смотреть фото Что такое ogg битрейт. Смотреть картинку Что такое ogg битрейт. Картинка про Что такое ogg битрейт. Фото Что такое ogg битрейт Что такое ogg битрейт. Смотреть фото Что такое ogg битрейт. Смотреть картинку Что такое ogg битрейт. Картинка про Что такое ogg битрейт. Фото Что такое ogg битрейт

В целом, конечно, неплохо для 160 кбит. OGG снова лидирует по передаче высоких частот. По всей видимости, разработчики кодера нашли способ оставлять высокие частоты не в ущерб остальным. А может, это не так? Проверим. Сонограммы LAME на этот раз практически не различаются, разве что у ABR немного лучше. Слушаем.

На всех тестовых семплах звучание OGG выше всяких похвал! Такого звучания на 160 кбит невозможно было и представить. И что только LAME не делает с высокими частотами, несмотря на искусственное подавление их выше 18 кГц. Мало того, что они «металлизируются», так по ним еще и эффект «зажевывания» появляется. Да, это нормальная реакция кодера: поток-то узковат для качественной передачи высоких частот. Зато на средних частотах LAME звучит лучше OGG. Собственно, по-другому и быть не могло: чудес не бывает, сами понимаете. Вот и усредненные АЧХ дельта-сигналов говорят о том же.

Что такое ogg битрейт. Смотреть фото Что такое ogg битрейт. Смотреть картинку Что такое ogg битрейт. Картинка про Что такое ogg битрейт. Фото Что такое ogg битрейт

Что такое ogg битрейт. Смотреть фото Что такое ogg битрейт. Смотреть картинку Что такое ogg битрейт. Картинка про Что такое ogg битрейт. Фото Что такое ogg битрейт

За счет менее качественной передачи средних частот кодер OGG лучше воспроизводит высокие и низкие частоты, т.е. как раз те частоты, которые традиционно урезаются при низких скоростях кодирования. Именно это и делает LAME как классический представитель MP3 кодировщиков.

Таким образом, систематизировав всю имеющуюся информацию, я пришел к выводу о том, что бесспорным лидером в кодировании 160 кбит является кодер OGG. Однако LAME в режиме ABR, хотя и отстает от лидера, но не намного. Вполне возможно, что в будущих версиях ситуация изменится.

«И так сойдет», или народный битрейт

Да-да, не смейтесь, именно «народный битрейт». Народным я его назвал потому, что это самый популярный на сегодня битрейт. Именно в нем хранятся основные залежи музыки в Сети, именно в нем предпочитают хранить свои временные музыкальные предпочтения компьютерщики, которым традиционно места жалко, а слушают они музыку на аппаратуре так себе, а порой и просто на компьютерных акустических системах. Зачем для такой акустики высокие битрейты? Вот потому-то я и назвал исследуемый битрейт «народным». Даже у меня, любителя истинно качественного звука, нет-нет да и проскочит «народный» файлик, взятый у друга для прослушивания. Ведь очень многие записи нигде не купишь, а вот в сжатом виде найти можно. Так что внимание битрейту 128 уделяется, наверное, не меньше, чем 256 и 320. Посмотрим, что нам скажут на этот раз наши подопытные. Кодирование LAME производим с подавлением частот выше 16500 Гц, чтобы улучшить качество передачи основного частотного диапазона. Если производить подавление на более высоких отметках, передача высоких частот от этого ощутимо не улучшается, зато общее звучание становится хуже.

Что такое ogg битрейт. Смотреть фото Что такое ogg битрейт. Смотреть картинку Что такое ogg битрейт. Картинка про Что такое ogg битрейт. Фото Что такое ogg битрейт Что такое ogg битрейт. Смотреть фото Что такое ogg битрейт. Смотреть картинку Что такое ogg битрейт. Картинка про Что такое ogg битрейт. Фото Что такое ogg битрейт

Что такое ogg битрейт. Смотреть фото Что такое ogg битрейт. Смотреть картинку Что такое ogg битрейт. Картинка про Что такое ogg битрейт. Фото Что такое ogg битрейт Что такое ogg битрейт. Смотреть фото Что такое ogg битрейт. Смотреть картинку Что такое ogg битрейт. Картинка про Что такое ogg битрейт. Фото Что такое ogg битрейт

Если не брать в расчет искусственное подавление высоких частот у LAME, то в целом сонограммы семплов обоих кодеров схожи, по крайней мере, явных различий не наблюдается, сонограмма ABR, как и всегда, немного лучше.

При прослушивании наблюдается та же звуковая картина, что и при 160 кбит: семплы OGG звучат ощутимо красивее и качественнее семплов LAME. Общее качество звучания, разумеется, несколько хуже 160, но тенденции сохраняются: OGG лучше передает высокие и низкие частоты, LAME — средние. Можно отметить действительно достойное качество кодирования для 128 кбит — наличие эффектов зажевывания, металлизации и размазывания не столь критично. Я бы сказал, что кодирование заслуживает твердой четверки. Именно четверки, потому как неизвестно, смогут ли разработчики что-либо улучшить. А вдруг смогут? Не ставить же потом шестерку! Потому — четыре.

Посмотрим на пару АЧХ различий с оригиналом.

Что такое ogg битрейт. Смотреть фото Что такое ogg битрейт. Смотреть картинку Что такое ogg битрейт. Картинка про Что такое ogg битрейт. Фото Что такое ogg битрейт

Что такое ogg битрейт. Смотреть фото Что такое ogg битрейт. Смотреть картинку Что такое ogg битрейт. Картинка про Что такое ogg битрейт. Фото Что такое ogg битрейт

Как видим, все зависит от оригинала. Первая диаграмма — для очень плотного, с насыщенным звуком семпла Roxette, вторая — семпл Clayderman. Кодер OGG, пытаясь передать высокие (за пределами 16 кГц) частоты, фактически экономит на частотах от 2 до 15 кГц, которые я ставил ему в плюс при рассмотрении высоких битрейтов. Однако звучат семплы OGG ощутимо приятнее, хотя и чувствуется некоторый провал по средним частотам. Но не стоит придавать этому провалу большого значения, т.к. для 128 кбит это не может быть серьезным критерием оценки применимости кодера.

Итак, я называю лидера. Им становится новая версия кодировщика OGG. Разработчики, примите мои поздравления!

128 vs 160: кто кого?

Соперничество между 128 и 160 кбит идет, наверное, не меньшее, чем между 256 и 320. Среди пользователей можно найти много сторонников как одного, так и другого режимов. Поэтому проведем перекрестное сравнение качества кодирования для режимов 128 и 160 раздельно для каждого кодера. А поскольку в обоих режимах кодер OGG назван мною лучшим, начнем сравнение именно с него.

Да уж… звучание отличается, и отличается сильно. На этот раз даже звучание низких частот заметно другое: они становятся размытыми, теряется четкость ударов и разборчивость басовых линий. Высокие частоты кажутся более «металлическими» и в то же время размытыми. Большой разницы в звучании на средних частотах я не заметил, видимо, разработчики пошли по верному и опробованному пути экономии на высоких и низких частотах в пользу среднего частотного диапазона. В целом звучание 160 заметно более сочное и живое, поэтому, если есть возможность не экономить, лучше кодировать в 160 кбит — для Сети это будет еще приемлемым размером. Сравнение спектра дельта-сигналов только подтверждает мои слуховые впечатления.

Что такое ogg битрейт. Смотреть фото Что такое ogg битрейт. Смотреть картинку Что такое ogg битрейт. Картинка про Что такое ogg битрейт. Фото Что такое ogg битрейт

Для OGG разница получается ощутимая — порядка 4 дБ. В целом спектр отличается только уровнем сигнала, кроме небольшого смещения в районе 2 кГц, которое и говорит об одинаковом качестве передачи средних частот.

Теперь обратим внимание на старый добрый LAME. Напомню, что относительно качественно кодировать в 128 кбит LAME стал не так давно (несколько последних версий), поэтому сравнение должно быть познавательным. Качество на семплах с большим количеством высоких частот отличается колоссально. Если при 160 передача была еще относительно нормальной, то на 128 звучание стало отрывистым, жестким, металлическим, да к тому же еще и сильно искаженным эффектом «зажевывания» или фазовыми искажениями. На семплах с менее ярко выраженными высокими частотами такого резкого отличия не наблюдается, однако их звучание редко бывает удовлетворительным. Это минус, зато есть и большой плюс. Звучание низких и средних частот в двух режимах практически не отличается! Даже видимое по сонограмме отличие в средних частотах на звучании не сказывается.

Что такое ogg битрейт. Смотреть фото Что такое ogg битрейт. Смотреть картинку Что такое ogg битрейт. Картинка про Что такое ogg битрейт. Фото Что такое ogg битрейт

Общее отличие по уровню дельта-сигналов для LAME значительно ниже OGG, наибольшая разница не превышает 2 дБ, в то время как для OGG наблюдаются различия в 4-5 дБ. Потому и на слух семплы LAME имеют меньшие различия.

Таким образом, выбирая между 128 и 160, вам стоит задуматься вот о чем. У LAME в основном страдает качество передачи высоких частот, у OGG затрагиваются также низкие частоты. Если говорить об общем уровне качества, я бы посоветовал придерживаться 160 кбит везде, где это возможно, а к 128 прибегать только в самых крайних случаях, т.к. разница в размере невелика, а в качестве звучания огромна.

Заключение

В заключение своего довольно длинного повествования я хотел бы выделить несколько ключевых тезисов.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *