Обробка зображень та мультимедіа / Лабораторна робота №5 / Мельник Дмитро / група №36

Матеріал з Вікі ЦДУ
Перейти до: навігація, пошук

Тема: Звук

Мета: Вивчення представлення звуку

Завдання:

  1. Вивчити формати звукових файлів.
  2. Зберегти 3 улюблені музикальні композиції в некомпресованому форматі.
  3. Кожну з композицій компресувати з бітрейдом від 128 до 320 Кбіт на сек.
  4. Порівняти якість звуку в отриманих файлах.

Звукові формати

AA (Audible Audio Book File) - закритий формат, розроблений компанією Audible. Застосовується, для запису аудіокниг, які продаються через сервіси Audible і iTunes. Існує можливість уповільнювати або прискорювати швидкість прослуховування файлів - digital pitch, можливість залишати закладки при прослуховуванні аудіо книг, захист файлів, при доставці звукових записів за допомогою internet.

AAC (Advanced Audio Coding) - формат аудіо-файлу будуть якіснішими при кодуванні, ніж Mp3 при однакових розмірах. Кодування музики без втрат якості оригіналу за допомогою профілю ALAC. AAC - сімейство алгоритмів аудіо кодування MPEG4. На відміну від гібридного набору фільтрів mp3, AAC використовує MDST технологію (модифіковане косинусное перетворення) - це означає, що слухач отримує більш кращу якість звуку, ніж при MP3 кодуванні з таким же або меншим бітрейтом. Можливі розширення AAC файлів: [.m4a], [. M4b], [. M4p].

Переваги AAC перед MP3:

  • до 48 звукових каналів;
  • велика ефективність кодування як при постійному, так і при змінному бітрейті;
  • частоти дискретизації від 8 Гц до 96 кГц (MP3: 8 Гц - 48 кГц);
  • більш гнучкий режим Joint stereo.

ADX - формат стиснення з втратами і зберігання звукозапису, розроблений CRI Middleware спеціально для використання в відеоіграх. Найбільш характерна особливість - можливість зробити цикл звукозапис, що робить застосування формату зручним для використання в якості фонової музики в різних іграх, що підтримують цей медіаконтейнер. Його підтримують безліч ігор для SEGA Dreamcast деякі ігри для PlayStation 2 і GameCube.

AIFF - це стандартний формат файлів для збереження звукової інформації на платформі Macintosh. Якщо вам коли-небудь буде потрібно пересилати аудіофайли між персональним комп'ютером і комп'ютером Macintosh, використовуйте саме цей формат. Він підтримує 8- і 16-бітові монофонічні і стереофонічні звукові дані

AMR (Adaptive multi rate) - адаптивне кодування зі змінною швидкістю. Стандарт кодування звукових файлів, спеціально призначений для стиснення сигналу в мовному діапазоні частот. Використання AMR дозволяє забезпечити високу ємність мережі з одночасно високою якістю передачі мови.

APE – (Monkey‘s Audio) - формат цифрового звуку без втрат якості. Кодек Monkey's Audio випускається тільки для платформи Microsoft Windows, хоча існує ряд неофіційних кодеків для MacOS, Linux, BeOS. Файли Monkey's Audio використовують наступні розширення: .ape - для зберігання аудіо та .apl - для зберігання метаданих. Даний формат не є вільним, тому що ліцензія на нього серйозно обмежує поширення.

CDDA (Compact Disc Digital Audio) - міжнародний стандарт зберігання оцифрованого звуку на компакт-дисках, представлений фірмами Philips і Sony. Звукова інформація представлена в імпульсно-кодової модуляції з частотою дискретизації 44,1 кГц і бітрейтом 1411,2 кбіт/с, 16 біт стерео.

FLAC (Free Lossless Audio Codec) - популярний вільний кодек для стиснення аудіо. На відміну від кодеків з втратами Ogg Vorbis, MP3 і AAC, FLAC не видаляти ніякої інформації з аудиопотока і підходить як для прослуховування музики на високоякісної звуковідтворювальної апаратури, так і для архівування аудіоколекції. На сьогодні формат FLAC підтримується багатьма аудіододатками. Щоб зберігати основні типи метаданих, базовий декодер використовує теги ID3v1 і ID3v2, тому їх можна вільно додавати і редагувати.

MIDI (Musical Instrument Digital Interface) - стандарт цифрового звукозапису на формат обміну даними між електронними музичними інструментами. Інтерфейс дозволяє кодувати в цифровій формі натискання клавіш, налаштування гучності та інших акустичних параметрів, вибір тембру, темпу, тональності і ін., З точною прив'язкою в часі. В системі кодувань присутня безліч вільних команд, які виробники, програмісти і користувачі можуть використовувати на свій розсуд. Тому інтерфейс MIDI дозволяє, крім виконання музики, синхронізувати управління іншим обладнанням, наприклад, освітлювальним, піротехнічним і т.п.

MP2 - один з трьох форматів стиснення звуку з втратами, визначених у стандарті MPEG-1. Застосовується в цифровому радіомовлення DAB і застарілому стандарті Video CD, який в 90-і роки використовувався для розповсюдження фільмів на оптичних компакт-дисках і існував до широкого поширення DVD.

MP3 - третій формат кодування звукової доріжки MPEG - ліцензований формат файлу для зберігання аудіо-інформації. На даний момент MP3 є найвідомішим і популярним з поширених форматів цифрового кодування звукової інформації з втратами. Він широко використовується в файлообмінних мережах для оціночної передачі музичних творів. Формат може програватися практично в будь-який популярної операційної системи, на практично будь-якому портативному аудіо-плеєрі, а також підтримується всіма сучасними моделями музичних центрів і DVD-плеєрів.

MusePack - неліцензованому формат файлу для зберігання аудіоінформації, розповсюджуваний за GNUGeneralPublicLicense. У Musepack застосовується розбивка на смуги частот, тому він відноситься до так званих subband-кодекам. Основна особливість - точна настройка психоакустики, що дозволяє працювати з чистим VBR-кодуванням (кодування зі змінним бітрейтом). Основним завданням Musepack є прозорість звучання закодованої музики.

OGG - відкритий стандарт формату мультимедіа контейнера, який є основним файловим і потоковим форматом для мультимедіа кодеків фонду Xiph.Org. Формат Ogg є відкритим і вільним стандартом, які не мають патентних чи ліцензійних обмежень. Ogg є всього лише контейнером. Музика або відео стискаються кодеками, а результат обробки зберігається в подібних контейнерах. Контейнери Ogg можуть зберігати потоки, закодовані декількома кодеками. Наприклад, файл з відео і звуком може містити дані, закодовані аудіо і відео кодеками. У контейнері Ogg можна зберігати звук і відео в різних форматах (таких як MPEG-4, Dirac, MP3 та інші).

TAK (Tom‘slossless Audio Kompressor) - аудіокодек і формат стиснення цифрового звуку без втрат. Відрізняється високим ступенем стиснення і швидкістю кодування і декодування. Розповсюджується безкоштовно разом c набором програмного забезпечення для кодування і відтворення, а також плагінами до популярних плеєрів: Winamp, foobar2000 і ін. Розробник - Thomas Becker, Німеччина. Відносно новий кодек. Перша фінальна версія 1.0 була опублікована 26 січня 2007 року. Формат продовжує активно розвиватися (остання версія 1.1.1) і в даний час, згідно з проведеним опитуванням на форумі hydrogenaudio.org, входить в число трьох найбільш популярних форматів Аудіостиснення без втрат (після FLAC і WavPack)

Порівняння форматів

Назва формату Квантування, біт Частота дискретизації, кГц Число каналів кбіт/с Ступінь стиснення
МР3 16 до 48 2 128 (12-320) ~11:1 (залежить від потоку) з втратами
Ogg Vorbis до 32 до 192 до 255 не обмежений ~22:1 (при 64kbps) з втратами
CD 16 44,1 2 1411,2 1:1 без втрат
Dolby Digital 5.1 16-24 48 6 448 ~12:1 з втратами
DTS 20-24 48; 96 6 більше 768 ~7:1 з втратами
DVD-Audio 24 96 6 6912 2:1 без втрат
DVD-Audio 24 192 2 4608 2:1 без втрат
MPEG Audio Layer III (MPEG MP3) плаваючий до 48 2 до 320 ~11:1 (залежить від потоку) з втратами
MPEG AAC до 192 до 48 до 529 (стерео) з втратами
WMA до 24 до 96 до 8 до 768 2:1, є версія без стиснення

Порівняння звукових форматів без стиснення

Назва формату Розширення файлу Квантування, біт Частота дискретизації, кГц Число каналів Ступінь стиснення/упаковки Призначення Випуск
AIFF .aiff; .aif 8; 16; 24; 32 11,025; 22,05; 24; 32; 44,1; 48; 96; 192 1; 2; 3; 4; 6 1:1; без стиснення зберігання звукових даних на ПК 1988, Apple
WAVE (WAV) .wav 8; 16; 24; 32 11,025; 22,05; 24; 32; 44,1; 48; 96; 192 1; 2; 3; 4; 6 1:1; без стиснення зберігання звукових даних на ПК 1991, Microsoft и IBM
DSD .dff 1 64*44.1; 128*44.1; 256*44.1 2, 5.1 1:1; без стиснення, можливе стиснення DST SACD 1998, Sony і Philips
Digital eXtreme Definition (DXD) DXD 24; 32 384 2, 5.1 1:1; без стиснення професійне виробництво SACD 2004, Sony

Порівняння звукових форматів без втрат

Назва формату Розширення файлу Квантування, біт Частота дискретизації, кГц Число каналів Ступінь стиснення/упаковки Призначення Випуск
Shorten .shn 16 44.1 2 3:1 - 5:1, стиснення без втрат зберігання звукових даних на ПК 1994, Tony Robinson
WavPack .wv 8; 16; 24; 32 6 - 192 1 - 256 1.4:1 - 3.3:1, стиснення без втрат зберігання звукових даних на ПК 1998, Conifer Software
Meridian Lossless Packing (MLP) .mlp до 24 до 192 1; 2; 5.1; 6.0; 8.0 ~2:1, стиснення без втрат DVD-Audio 1998, MERIDIAN
RK Audio (RKAU) .rka 16 44.1 2 2:1, стиснення без втрат, стиснення з незначними втратами зберігання звукових даних на ПК 2000, Malcolm Taylor, RK Software
FLAC .flac 4 - 32 1Гц - 655.350 кГц с шагом 1 Гц 1 - 8 1.4:1 - 4:1, стиснення без втрат зберігання звукових даних на ПК, звуковий супровід до HD-відео, медіаплеєри 2000, Josh Coalson
Monkey’s Audio .ape 16; 24 8; 11.025; 12; 16; 22.05; 24; 32; 44.1; 48; 96 2 1.4:1 - 4:1, стиснення без втрат зберігання звукових даних на ПК 2000+, Matthew T. Ashland
OptimFROG .ofs до 32 до 192 2 1.4:1 - 4:1, стиснення без втрат зберігання звукових даних на ПК 2001, Florin Ghido
Lossless Predictive Audio Coder (LPAC) .pac 8; 16; 20; 24 до 192 2 1.5:1 - 4:1, стиснення без втрат зберігання звукових даних на ПК 2002, Tilman Liebchen, Marcus Purat, Peter Noll
LosslessAudio (LA) .la 16 48 2 1.4:1 - 3.3:1, стиснення без втрат зберігання звукових даних на ПК 2002, Michael Bevin
[Windows Media Audio 9 Lossless .wma 16; 24 8; 11.025; 16; 22.05; 32; 44.1; 48; 88.2; 96 до 6 1.7:1 - 3:1, стиснення без втрат зберігання звукових даних на ПК 2003, Microsoft
Apple Lossless (ALAC, ALE) .m4a 16; 24 44.1; 48; 88.2; 96; 192 до 6 1.7:1 - 2.5:1, стиснення без втрат зберігання звукових даних на ПК, медіаплеєри iPod 2004, Apple Inc.
RealAudio Lossless (RAL, ralf) .rmvb 16 и др. 44.1 и др. 2 н/д, стиснення без втрат Потокове мультимедіа 2004, RealNetworks
True Audio (TTA) .tta 8; 16; 24 0–4 ГГц 65535 1.4:1 - 3.3:1, стиснення без втрат зберігання звукових даних на ПК 2004, Олександр Джурик
DTS-HD Master Audio (DTS++, DTS HD) - до 24 до 192 до 8 2:1 - 4:1 , стиснення без втрат Blu-ray Disc, HD DVD, PlayStation 3 2004, Digital Theater System.
Direct Stream Transfer (DST) DSD 1 64*44.1; 128*44.1; 256*44.1 2, 5.1 стиснення без втрат DSD-поток при производстве SACD 2005, MPEG-4 ISO/IEC 14496-3:2001/Amd 6:2005
Dolby TrueHD .mlp до 24 до 192 до 14 2:1 - 4:1 , стиснення без втрат Blu-ray Disc, HD DVD 2005, Dolby Laboratories
ATRAC Advanced Lossless (AAL) .aa3; .oma; .at3 16 44.1 2 1.25:1 - 3:1, стиснення без втрат Мінідиск плеєры, PlayStation Portable, Playstation 3 2006, Sony
MPEG-4 Audio Lossless Coding (ALS) .m4a 8; 16; 20; 24; 32 44.1; 48; 88.2; 96; 192; (384) до 65536 1.5:1 - 4:1, стиснення без втрат музичні інтернет-магазини, Потокове мультимедіа, дискові формати високого розділення, плеєри, архівні системи, професійне студійне виробництво, звуковий супровід до MP4-відео 2006, MPEG ISO/IEC 14496-5:2001/Amd 10:2007/Cor 3:2009
MPEG-4 Scalable to Lossless (SLS), HD-AAC .m4a 8; 16; 20; 24 44.1; 48; 88.2; 96; 192 2, 5.1 1.5:1 - 4:1, стиснення без втрат, містить потік aac (стиснення з втратами, 128 кбит/с) музичні інтернет магазини, Потокове мультимедіа, дискові формати високого розділення, звуковий супровід до MP4-відео, плеєри iPod / iPhone 2007, MPEG ISO/IEC 14496-5:2001/Amd 10:2007
TAK .tak 16; 24 до 192 2 1.4:1 - 3.3:1, стиснення без втрат зберігання звукових даних на ПК 2007, Thomas Becker


Робота з музичними композиціями

Назва композиції Тривалість Бітрейт(формат mp3) Вага оригіналу
320 kbps 224 kbps 128 kbps
06 Ridiculous Thoughts Acoustic Version.flac 3:07 8 МБ 5 МБ 3 МБ 23 МБ
03 Dreams Acoustic Version.flac 4:24 11 МБ 7 МБ 4 МБ 28 МБ
01 Linger Acoustic Version.flac 4:55 11 МБ 8 МБ 4 МБ 33 МБ

Висновок

Через не професійність обладнання досить важко розрізнити аудіо файли з різним бітрейтом. Але при 128 kbps я все ж таки помітив невелике погіршення якості звуку. Отже для того щоб повною мірою насолоджуватися не компресованими аудіо файлами потрібна апаратура яка здатна розкрити той чи інший формат

Посилання

ldsound

ru.wikipedia

uk.wikipedia

flacon