Лабораторна робота №5. Обробка зображень та мультимедіа. Бельмега Карина
Зміст
Формати звукових файлів
Нестиснені формати
WAV (англ. waveform audio format)
WAVE файл складається з двох частин: заголовку файлу і області даних.
Канонічний формат WAVE файлу починається з RIFF заголовку і двох підсекцій: "fmt " і "data". Підсекція "fmt " описує параметри даних звукозапису. У підсекції даних "data" міститься розмір даних і фактичні дані звукозапису. Розроблений компаніями Microsoft та IBM. WAVE базується на форматі RIFF, поширюючи його на інформацію про такі параметри аудіо, як застосований кодек, частота дискретизації та кількість каналів. WAV як і RIFF передбачався для комп'ютерів IBM PC, тому всі змінні записані у форматі little endian. Відповідником WAV для комп'ютерів PowerPC є AIFF.
Audio Interchange File Format (AIFF)
Звукові дані в стандартному файлі формату AIFF представляють із себе нестиснутих імпульсно-кодову модуляцію. Також існує і стисла версія формату AIFF, яку називають AIFC (зрідка AIFF-C), в якій для стиснення можуть бути використані різні кодеки.
AIFF, поряд з SDII і WAV, є одним з форматів який використовується у професійних аудіо і відео додатках, оскільки на відміну від популярнішого формату mp3 в ньому звук не має втрат якості. Як і будь-які нестиснені файли, файли AIFF займають набагато більше дискового простору ніж їх стиснені аналоги: одна хвилина стерео звуку з частотою дискретизації 44,1 кГц і розміром вибірки 16 біт займає близько 10МБ.
Стандартне розширення файлів: .AIFF або .AIF, для стисненого варіанти повинно застосовуватися розширення .AIFC.
AU
Простий формат аудіофайлів, уведений Sun Microsystems. Формат був поширений на NeXT системах і на ранніх веб-сторінках. Спочатку це були 8-бітові, кодовані за μ-законом, дані без заголовків, на частоті дискретизації 8000 Гц. Обладнання інших виробників часто використовували частоту дискретизації 8192 Гц, кратну тактовим сигналам відео. Нові файли мають заголовок, що складається з шести непідписаних 32-бітових слів, додаткову інформацію, а потім дані (у великому форматі зворотний порядок байт).
Імпульсно-кодова модуляція (PCM)
Практично всі види аналогових даних (відео, голос, музика, дані телеметрії) допускають застосування ІК-модуляції. Це процес перетворення аналогового сигналу у цифровий сигнал, коли через певні інтервали часу беруться відліки аналогового сигналу і незалежно один від одного квантуються і далі кодуються цифрами.
Формати зі стисненням без втрат
WavPack
Вільний аудіо кодек з відкритими вихідними кодами для стиснення аудіо-сигналу без втрати якості. Наразі невелика кількість апаратних пристрої відтворення звуку підтримують кодек WavPack, однак це можна виправити спеціальними неофіційними «прошивками», такими як RockBox. Пристрої з «рідною» підтримкою формату:
- Cowon A3 PMP
- Skydigital Venice V38 HD Combo
- DViCO TViX HD M-6500A та HD M-7000A
- Slim Devices Squeezebox
TTA
Аудіокодек, що здійснює стиснення аудіофайлів без втрат, здатний працювати в режимі реального часу. Кодек заснований на адаптивних фільтрах і має такі ж або кращі характеристики, як і більшість сучасних кодер-декодерів без втрат. Основними вимогами до розробки компресора були прийнятна ступінь стиснення і висока швидкість роботи.
Переваги:
- Компресія аудіо до 30% без втрат
- Алгоритм кодування-декодування в режимі реального часу
- Мінімальні системні вимоги
- Безкоштовний і відкритий вихідний код і документація
- Може бути скомпільований на великій кількості різних платформ
- Простий і відкритий формат даних
- Плагіни для більшості популярних програвачів
- Графічний інтерфейс (GUI) для Windows
- Підтримка технології DirectShow
Monkey's Audio
Офіційно кодек Monkey's Audio випускається тільки для платформи Windows, хоча існує ряд неофіційних кодеків для GNU/Linux й Mac OS X, які в більшості випадків дозволяють лише стискати файли, перетворюючи їх в інший формат.
Підтримує «APL image link» файли (подібні до «Cue sheet»).
Переваги:
- Висока ефективність
- Хороша підтримка програмного забезпечення
- Версія Java (працює на багатьох платформах, multiplatform)
- Підтримує теги (ID3v1, APE tags)
- Підтримка високороздільне аудіо (High resolution)
- Підтримка RIFF чанків (Тільки в енкодері з графічним інтерфейсом GUI)
- Pipe support (тільки в спеціальній версії)
FLAC
Аудіокодек для стиснення аудіо при 100% збереженні оригінального звукового потоку. На відміну від таких кодеків, як MP3, WMA чи Ogg Vorbis, FLAC забезпечує т.зв. стиснення без втрат (англ. lossless), тобто при розпакуванні звукові дані залишаються повністю ідентичним до початкового файлу перед стисненням. FLAC також включає можливість перевірки точності даних завдяки збереженню у файлі відбитку MD5 оригінальних даних. FLAC є вільним форматом: його використання не вимагає виплат роялті, специфікації є відкритими та його основна реалізація є вільним програмним забезпеченням.
Формати із стисненням з втратами
MP3
У цьому форматі звуки кодуються частотним чином (без дискретних партій); є підтримка стерео. MP3 є форматом стиснення з втратами, тобто частина звукової інформації, яку (згідно з психоакустичною моделлю) вухо людини сприйняти не може або сприймається не всіма людьми, знищується. Ступінь стиснення можна варіювати, зокрема в межах одного файлу. Інтервал можливих значень бітрейту становить 8 — 320 кбіт/c. Для порівняння, потік даних із звичайного компакт-диска формату AUDIO-CD дорівнює 1411,2 кбіт/c при частоті дискретизації 44100 Гц.
Ogg Vorbis
Вільний формат стиснення звуку, що розроблявся компанією Xiph.Org Foundation 1998 року і офіційно випущений 19 липня 2002 року. Формат призначений для зберігання аудіо-інформації, подібно до MP3, однак його поява була зумовлена тим, що MP3 захищений патентом. Ogg Vorbis використовує власну психоакустичну модель при стисненні з втратами (т. зв. lossy) для досягнення високих ступенів стиснення інформації. Ogg Vorbis типово використовує змінний бітрейт, при цьому його значення необмежені і можуть варіюватися при мінімальних налаштуваннях на 1 kbps, а при максимальних — від 400 kbps до 700 kbps. Гнучкою є і частота дискретизації — користувачам надається будь-який вибір у межах від 2 кгц до 192 кгц. На думку деяких, така модель дозволяє отримати кращу якість відтворення при рівному ступені стиснення.
WMA
Від самого початку формат WMA позиціювався як альтернатива MP3, але сьогодні Microsoft протиставляє йому формат AAC (використається в популярному на Заході онлайновому музичному магазині iTunes). Номінально формат WMA характеризується гарною здатністю стискання даних, що дозволяє йому «обходити» формат Mp3 і конкурувати по цих параметрах з форматами Ogg vorbis і AAC. Але як було показано незалежними тестами, а також при суб'єктивній оцінці якість форматів все таки не є однозначною, а в перевазі навіть над mp3 є також сумніви, незважаючи на заперечення компанією Microsoft.
Улюблені композиції в некомпресованому форматі
ОЕ-Квітка
Ragnbone Man-Human
The Chainsmokers & Coldplay-Something just like this
Компресування композицій з бітрейдом від 128 до 320 Кбіт на сек.
Стандартна якість (128 Кбіт на сек.):
ОЕ-Квітка
Ragnbone Man-Human
The Chainsmokers & Coldplay-Something just like this
Гарна якість (192 Кбіт на сек.):
ОЕ-Квітка
Ragnbone Man-Human
The Chainsmokers & Coldplay-Something just like this
Найкраща якість (320 Кбіт на сек.):
ОЕ-Квітка
Ragnbone Man-Human
The Chainsmokers & Coldplay-Something just like this
Порівняння якості звуку в отриманих файлах
Назва композиції | Виконавець | Формат композиції | Бітрейд | Довжина копозиції | Розмір композиції (Мб) |
Квітка | ОЕ | MP3 | некомпресований формат | 00:04:15 | 50,5 |
---|---|---|---|---|---|
128 | 3,89 | ||||
192 | 5,83 | ||||
320 | 9,61 | ||||
Human | Ragnbone Man | некомпресований формат | 00:03:19 | 37,4 | |
128 | 3,14 | ||||
192 | 4,66 | ||||
320 | 7,71 | ||||
Something just like this | The Chainsmokers & Coldplay | некомпресований формат | 00:04:08 | 49,2 | |
128 | 3,83 | ||||
192 | 5,71 | ||||
320 | 9,73 |
Отже, можна зробити висновок, що зі збільшенням якості звуку композиції, збільшується її розмір. Так у некомпресованому форматі аудіо запис має найбільший розмір, а найменший у компресованому з бітрейдом 128 кбіт/с.