Обробка зображень та мультимедіа / Лабораторна робота №5 / Мельник Дмитро / група №36
Тема: Звук
Мета: Вивчення представлення звуку
Завдання:
- Вивчити формати звукових файлів.
- Зберегти 3 улюблені музикальні композиції в некомпресованому форматі.
- Кожну з композицій компресувати з бітрейдом від 128 до 320 Кбіт на сек.
- Порівняти якість звуку в отриманих файлах.
Зміст
Звукові формати
AA (Audible Audio Book File) - закритий формат, розроблений компанією Audible. Застосовується, для запису аудіокниг, які продаються через сервіси Audible і iTunes. Існує можливість уповільнювати або прискорювати швидкість прослуховування файлів - digital pitch, можливість залишати закладки при прослуховуванні аудіо книг, захист файлів, при доставці звукових записів за допомогою internet.
AAC (Advanced Audio Coding) - формат аудіо-файлу будуть якіснішими при кодуванні, ніж Mp3 при однакових розмірах. Кодування музики без втрат якості оригіналу за допомогою профілю ALAC. AAC - сімейство алгоритмів аудіо кодування MPEG4. На відміну від гібридного набору фільтрів mp3, AAC використовує MDST технологію (модифіковане косинусное перетворення) - це означає, що слухач отримує більш кращу якість звуку, ніж при MP3 кодуванні з таким же або меншим бітрейтом. Можливі розширення AAC файлів: [.m4a], [. M4b], [. M4p].
Переваги AAC перед MP3:
- до 48 звукових каналів;
- велика ефективність кодування як при постійному, так і при змінному бітрейті;
- частоти дискретизації від 8 Гц до 96 кГц (MP3: 8 Гц - 48 кГц);
- більш гнучкий режим Joint stereo.
ADX - формат стиснення з втратами і зберігання звукозапису, розроблений CRI Middleware спеціально для використання в відеоіграх. Найбільш характерна особливість - можливість зробити цикл звукозапис, що робить застосування формату зручним для використання в якості фонової музики в різних іграх, що підтримують цей медіаконтейнер. Його підтримують безліч ігор для SEGA Dreamcast деякі ігри для PlayStation 2 і GameCube.
AIFF - це стандартний формат файлів для збереження звукової інформації на платформі Macintosh. Якщо вам коли-небудь буде потрібно пересилати аудіофайли між персональним комп'ютером і комп'ютером Macintosh, використовуйте саме цей формат. Він підтримує 8- і 16-бітові монофонічні і стереофонічні звукові дані
AMR (Adaptive multi rate) - адаптивне кодування зі змінною швидкістю. Стандарт кодування звукових файлів, спеціально призначений для стиснення сигналу в мовному діапазоні частот. Використання AMR дозволяє забезпечити високу ємність мережі з одночасно високою якістю передачі мови.
APE – (Monkey‘s Audio) - формат цифрового звуку без втрат якості. Кодек Monkey's Audio випускається тільки для платформи Microsoft Windows, хоча існує ряд неофіційних кодеків для MacOS, Linux, BeOS. Файли Monkey's Audio використовують наступні розширення: .ape - для зберігання аудіо та .apl - для зберігання метаданих. Даний формат не є вільним, тому що ліцензія на нього серйозно обмежує поширення.
CDDA (Compact Disc Digital Audio) - міжнародний стандарт зберігання оцифрованого звуку на компакт-дисках, представлений фірмами Philips і Sony. Звукова інформація представлена в імпульсно-кодової модуляції з частотою дискретизації 44,1 кГц і бітрейтом 1411,2 кбіт/с, 16 біт стерео.
FLAC (Free Lossless Audio Codec) - популярний вільний кодек для стиснення аудіо. На відміну від кодеків з втратами Ogg Vorbis, MP3 і AAC, FLAC не видаляти ніякої інформації з аудиопотока і підходить як для прослуховування музики на високоякісної звуковідтворювальної апаратури, так і для архівування аудіоколекції. На сьогодні формат FLAC підтримується багатьма аудіододатками. Щоб зберігати основні типи метаданих, базовий декодер використовує теги ID3v1 і ID3v2, тому їх можна вільно додавати і редагувати.
MIDI (Musical Instrument Digital Interface) - стандарт цифрового звукозапису на формат обміну даними між електронними музичними інструментами. Інтерфейс дозволяє кодувати в цифровій формі натискання клавіш, налаштування гучності та інших акустичних параметрів, вибір тембру, темпу, тональності і ін., З точною прив'язкою в часі. В системі кодувань присутня безліч вільних команд, які виробники, програмісти і користувачі можуть використовувати на свій розсуд. Тому інтерфейс MIDI дозволяє, крім виконання музики, синхронізувати управління іншим обладнанням, наприклад, освітлювальним, піротехнічним і т.п.
MP2 - один з трьох форматів стиснення звуку з втратами, визначених у стандарті MPEG-1. Застосовується в цифровому радіомовлення DAB і застарілому стандарті Video CD, який в 90-і роки використовувався для розповсюдження фільмів на оптичних компакт-дисках і існував до широкого поширення DVD.
MP3 - третій формат кодування звукової доріжки MPEG - ліцензований формат файлу для зберігання аудіо-інформації. На даний момент MP3 є найвідомішим і популярним з поширених форматів цифрового кодування звукової інформації з втратами. Він широко використовується в файлообмінних мережах для оціночної передачі музичних творів. Формат може програватися практично в будь-який популярної операційної системи, на практично будь-якому портативному аудіо-плеєрі, а також підтримується всіма сучасними моделями музичних центрів і DVD-плеєрів.
MusePack - неліцензованому формат файлу для зберігання аудіоінформації, розповсюджуваний за GNUGeneralPublicLicense. У Musepack застосовується розбивка на смуги частот, тому він відноситься до так званих subband-кодекам. Основна особливість - точна настройка психоакустики, що дозволяє працювати з чистим VBR-кодуванням (кодування зі змінним бітрейтом). Основним завданням Musepack є прозорість звучання закодованої музики.
OGG - відкритий стандарт формату мультимедіа контейнера, який є основним файловим і потоковим форматом для мультимедіа кодеків фонду Xiph.Org. Формат Ogg є відкритим і вільним стандартом, які не мають патентних чи ліцензійних обмежень. Ogg є всього лише контейнером. Музика або відео стискаються кодеками, а результат обробки зберігається в подібних контейнерах. Контейнери Ogg можуть зберігати потоки, закодовані декількома кодеками. Наприклад, файл з відео і звуком може містити дані, закодовані аудіо і відео кодеками. У контейнері Ogg можна зберігати звук і відео в різних форматах (таких як MPEG-4, Dirac, MP3 та інші).
TAK (Tom‘slossless Audio Kompressor) - аудіокодек і формат стиснення цифрового звуку без втрат. Відрізняється високим ступенем стиснення і швидкістю кодування і декодування. Розповсюджується безкоштовно разом c набором програмного забезпечення для кодування і відтворення, а також плагінами до популярних плеєрів: Winamp, foobar2000 і ін. Розробник - Thomas Becker, Німеччина. Відносно новий кодек. Перша фінальна версія 1.0 була опублікована 26 січня 2007 року. Формат продовжує активно розвиватися (остання версія 1.1.1) і в даний час, згідно з проведеним опитуванням на форумі hydrogenaudio.org, входить в число трьох найбільш популярних форматів Аудіостиснення без втрат (після FLAC і WavPack)
Порівняння форматів
Назва формату | Квантування, біт | Частота дискретизації, кГц | Число каналів | кбіт/с | Ступінь стиснення |
---|---|---|---|---|---|
МР3 | 16 | до 48 | 2 | 128 (12-320) | ~11:1 (залежить від потоку) з втратами |
Ogg Vorbis | до 32 | до 192 | до 255 | не обмежений | ~22:1 (при 64kbps) з втратами |
CD | 16 | 44,1 | 2 | 1411,2 | 1:1 без втрат |
Dolby Digital 5.1 | 16-24 | 48 | 6 | 448 | ~12:1 з втратами |
DTS | 20-24 | 48; 96 | 6 | більше 768 | ~7:1 з втратами |
DVD-Audio | 24 | 96 | 6 | 6912 | 2:1 без втрат |
DVD-Audio | 24 | 192 | 2 | 4608 | 2:1 без втрат |
MPEG Audio Layer III (MPEG MP3) | плаваючий | до 48 | 2 | до 320 | ~11:1 (залежить від потоку) з втратами |
MPEG AAC | до 192 | до 48 | до 529 (стерео) | з втратами | |
WMA | до 24 | до 96 | до 8 | до 768 | 2:1, є версія без стиснення |
Порівняння звукових форматів без стиснення
Назва формату | Розширення файлу | Квантування, біт | Частота дискретизації, кГц | Число каналів | Ступінь стиснення/упаковки | Призначення | Випуск |
---|---|---|---|---|---|---|---|
AIFF | .aiff; .aif | 8; 16; 24; 32 | 11,025; 22,05; 24; 32; 44,1; 48; 96; 192 | 1; 2; 3; 4; 6 | 1:1; без стиснення | зберігання звукових даних на ПК | 1988, Apple |
WAVE (WAV) | .wav | 8; 16; 24; 32 | 11,025; 22,05; 24; 32; 44,1; 48; 96; 192 | 1; 2; 3; 4; 6 | 1:1; без стиснення | зберігання звукових даних на ПК | 1991, Microsoft и IBM |
DSD | .dff | 1 | 64*44.1; 128*44.1; 256*44.1 | 2, 5.1 | 1:1; без стиснення, можливе стиснення DST | SACD | 1998, Sony і Philips |
Digital eXtreme Definition (DXD) | DXD | 24; 32 | 384 | 2, 5.1 | 1:1; без стиснення | професійне виробництво SACD | 2004, Sony |
Порівняння звукових форматів без втрат
Назва формату | Розширення файлу | Квантування, біт | Частота дискретизації, кГц | Число каналів | Ступінь стиснення/упаковки | Призначення | Випуск |
---|---|---|---|---|---|---|---|
Shorten | .shn | 16 | 44.1 | 2 | 3:1 - 5:1, стиснення без втрат | зберігання звукових даних на ПК | 1994, Tony Robinson |
WavPack | .wv | 8; 16; 24; 32 | 6 - 192 | 1 - 256 | 1.4:1 - 3.3:1, стиснення без втрат | зберігання звукових даних на ПК | 1998, Conifer Software |
Meridian Lossless Packing (MLP) | .mlp | до 24 | до 192 | 1; 2; 5.1; 6.0; 8.0 | ~2:1, стиснення без втрат | DVD-Audio | 1998, MERIDIAN |
RK Audio (RKAU) | .rka | 16 | 44.1 | 2 | 2:1, стиснення без втрат, стиснення з незначними втратами | зберігання звукових даних на ПК | 2000, Malcolm Taylor, RK Software |
FLAC | .flac | 4 - 32 | 1Гц - 655.350 кГц с шагом 1 Гц | 1 - 8 | 1.4:1 - 4:1, стиснення без втрат | зберігання звукових даних на ПК, звуковий супровід до HD-відео, медіаплеєри | 2000, Josh Coalson |
Monkey’s Audio | .ape | 16; 24 | 8; 11.025; 12; 16; 22.05; 24; 32; 44.1; 48; 96 | 2 | 1.4:1 - 4:1, стиснення без втрат | зберігання звукових даних на ПК | 2000+, Matthew T. Ashland |
OptimFROG | .ofs | до 32 | до 192 | 2 | 1.4:1 - 4:1, стиснення без втрат | зберігання звукових даних на ПК | 2001, Florin Ghido |
Lossless Predictive Audio Coder (LPAC) | .pac | 8; 16; 20; 24 | до 192 | 2 | 1.5:1 - 4:1, стиснення без втрат | зберігання звукових даних на ПК | 2002, Tilman Liebchen, Marcus Purat, Peter Noll |
LosslessAudio (LA) | .la | 16 | 48 | 2 | 1.4:1 - 3.3:1, стиснення без втрат | зберігання звукових даних на ПК | 2002, Michael Bevin |
[Windows Media Audio 9 Lossless | .wma | 16; 24 | 8; 11.025; 16; 22.05; 32; 44.1; 48; 88.2; 96 | до 6 | 1.7:1 - 3:1, стиснення без втрат | зберігання звукових даних на ПК | 2003, Microsoft |
Apple Lossless (ALAC, ALE) | .m4a | 16; 24 | 44.1; 48; 88.2; 96; 192 | до 6 | 1.7:1 - 2.5:1, стиснення без втрат | зберігання звукових даних на ПК, медіаплеєри iPod | 2004, Apple Inc. |
RealAudio Lossless (RAL, ralf) | .rmvb | 16 и др. | 44.1 и др. | 2 | н/д, стиснення без втрат | Потокове мультимедіа | 2004, RealNetworks |
True Audio (TTA) | .tta | 8; 16; 24 | 0–4 ГГц | 65535 | 1.4:1 - 3.3:1, стиснення без втрат | зберігання звукових даних на ПК | 2004, Олександр Джурик |
DTS-HD Master Audio (DTS++, DTS HD) | - | до 24 | до 192 | до 8 | 2:1 - 4:1 , стиснення без втрат | Blu-ray Disc, HD DVD, PlayStation 3 | 2004, Digital Theater System. |
Direct Stream Transfer (DST) | DSD | 1 | 64*44.1; 128*44.1; 256*44.1 | 2, 5.1 | стиснення без втрат | DSD-поток при производстве SACD | 2005, MPEG-4 ISO/IEC 14496-3:2001/Amd 6:2005 |
Dolby TrueHD | .mlp | до 24 | до 192 | до 14 | 2:1 - 4:1 , стиснення без втрат | Blu-ray Disc, HD DVD | 2005, Dolby Laboratories |
ATRAC Advanced Lossless (AAL) | .aa3; .oma; .at3 | 16 | 44.1 | 2 | 1.25:1 - 3:1, стиснення без втрат | Мінідиск плеєры, PlayStation Portable, Playstation 3 | 2006, Sony |
MPEG-4 Audio Lossless Coding (ALS) | .m4a | 8; 16; 20; 24; 32 | 44.1; 48; 88.2; 96; 192; (384) | до 65536 | 1.5:1 - 4:1, стиснення без втрат | музичні інтернет-магазини, Потокове мультимедіа, дискові формати високого розділення, плеєри, архівні системи, професійне студійне виробництво, звуковий супровід до MP4-відео | 2006, MPEG ISO/IEC 14496-5:2001/Amd 10:2007/Cor 3:2009 |
MPEG-4 Scalable to Lossless (SLS), HD-AAC | .m4a | 8; 16; 20; 24 | 44.1; 48; 88.2; 96; 192 | 2, 5.1 | 1.5:1 - 4:1, стиснення без втрат, містить потік aac (стиснення з втратами, 128 кбит/с) | музичні інтернет магазини, Потокове мультимедіа, дискові формати високого розділення, звуковий супровід до MP4-відео, плеєри iPod / iPhone | 2007, MPEG ISO/IEC 14496-5:2001/Amd 10:2007 |
TAK | .tak | 16; 24 | до 192 | 2 | 1.4:1 - 3.3:1, стиснення без втрат | зберігання звукових даних на ПК | 2007, Thomas Becker |
Робота з музичними композиціями
Назва композиції | Тривалість | Бітрейт(формат mp3) | Вага оригіналу | ||
---|---|---|---|---|---|
320 kbps | 224 kbps | 128 kbps | |||
06 Ridiculous Thoughts Acoustic Version.flac | 3:07 | 8 МБ | 5 МБ | 3 МБ | 23 МБ |
03 Dreams Acoustic Version.flac | 4:24 | 11 МБ | 7 МБ | 4 МБ | 28 МБ |
01 Linger Acoustic Version.flac | 4:55 | 11 МБ | 8 МБ | 4 МБ | 33 МБ |
Висновок
Через не професійність обладнання досить важко розрізнити аудіо файли з різним бітрейтом. Але при 128 kbps я все ж таки помітив невелике погіршення якості звуку. Отже для того щоб повною мірою насолоджуватися не компресованими аудіо файлами потрібна апаратура яка здатна розкрити той чи інший формат