Лабораторна робота 5 Якушко Максим
Зміст
Цифрові звукові формати
Існує три основні групи аудіофайлів.
- нестиснені формати — такі як WAV, AIFF, AU або PCM;
- формати із стисненням без втрат — FLAC, Monkey's Audio (розширення APE), Shorten, Tom's lossless Audio Kompressor (TAK), TTA, ATRAC Advanced Lossless, Apple Lossless, MPEG-4 SLS, MPEG-4 ALS, MPEG-4 DST, Windows Media Audio Lossless (WMA Lossless).
- формати із стисненням з втратами, як наприклад MP3, Ogg Vorbis, Musepack, AAC, ATRAC чи lossy Windows Media Audio (WMA).
Слід мати на увазі, що до аудіофайлів не відносяться такі музичні формати як MIDI, або файли нотних редакторів, які являють собою лише послідовність команд для музичного інструменту, однак не містять інформації власне про звук.
Формат аудіофайлу також слід відрізняти від аудіокодеку. Кодек здійснює кодування чи розкодування звукових даних, тоді як самі дані зберігаються у файлі відповідного звукового формату. Більшість форматів підтримують лише один тип кодування звукових даних, проте мультимедійні контейнери (напр. MKV або AVI) можуть підтримувати різні типи аудіо і відео даних.
Формати без стиснення
- AU
- DSD - формат, який використовується в SACD
- IFF-8SVX - Interchange File Format
- CDDA - формат, який використовується в аудіо-CD
- IFF-16SV
- RAW - необроблені («сирі») виміри без будь-якого заголовка або синхронізації
- DXD - якість цифрового звукозапису DXD за багатьма параметрами перевершує не тільки інші ІКМ-формати, але і DSD.
- WAV - Microsoft Wave (Waveform audio format); розроблений спільно з IBM
- AIFF - можлива частота дискретизації 11.025 - 192.0 КГц, можлива розрядність 8 - 32 біт, число каналів від одного до шести. Використовується переважно із продукцією Apple.
Формати із стисненням без втрат
Складність стиснення звуку без втрат полягає в тому, що записи звуку є надзвичайно складними у своїй структурі. Одним із методів стиснення є пошук взірців і їх повторень, проте цей метод не ефективний для більш хаотичних даних, якими є, наприклад оцифрований звук чи фотографії. Цікаво, що якщо згенерована комп'ютером графіка значно легше піддається стисненню без втрат, то синтезований звук в цьому відношенні не має переваг. Це пояснюється тим, що навіть згенерований комп'ютером звук зазвичай має дуже складну форму, яка представляє складне завдання для винайдення алгоритму.
Інша складність полягає в тому, що звучання зазвичай змінюється дуже швидко і це також є причиною того, що впорядковані послідовності байтів з'являються дуже рідко.
Найпоширенішими форматами стиснення без втрат є:
- Free Lossless Audio Codec (FLAC) - астота дискретизації 1Гц - 655.350 КГц, можлива розрядність 4 - 32, число каналів від одного до восьми, відкритий та багатоплатформний.
- Apple Lossless - частота дискретизації 44.1 - 192 КГц, можлива розрядність 16, або 24, підтримка до шести каналів. Основне призначення формату в сумісністності із сервісами Apple, які не підтримуюсь FLAC.
- MPEG-4 ALS
- Monkey's Audio - частота дискретизації 8 - 96 КГц, можлива розрядність 16, або 24, двоканальний, відкритий.
- TTA
Формати із стисненням з втратами
Стиснення із втратами має надзвичайно широке застосування. Окрім комп'ютерних програм, стиснення з втратами використовується в потоковому аудіо в DVD, цифровому телебаченні і радіо та потоковому медіа в інтернеті.
Новацією цього методу стиснення було використання психоакустики для виявлення компонентів звучання, що не сприймаються слухом людини. Прикладом можуть слугувати або високі частоти, які сприймаються лише при достатній їх потужності, або тихі звуки, що виникають одночасно або одразу після голосніших звуків і тому маскуються ними — такі компоненти звучання можуть бути передані менш точно, або і взагалі не передані.
Для здійснення маскування сигнал із часової послідовності відліків амплітуди перетворюється на послідовність спектрів звуків, в яких кожен компонент спектру кодується окремо. Для здійснення такого перетворення використовуються методи Швидкого перетворення Фур'є, МДКП, квадратурно-дзеркальних фільтрів або інші. Загальний обсяг інформації при такому перекодуванні лишається незмінним. Стиснення в певній частотній області може полягати в тому, що замасковані або нульові компоненти не запам'ятовуються взагалі, або кодуються з меншим розділенням. Наприклад, частотні компоненти у до 200 Гц та понад 14 кГц можуть бути закодовані з 4-бітною розрядністю, тоді як компоненти в середньому діапазоні — з 16 бітною. Результатом такої операції стане кодування із середньою розрядністю 8-біт, проте результат буде значно кращим ніж при кодуванні усього діапазону частот з 8-бітною розрядністю. Проте очевидно, що перекодовані з низькою роздільністю фрагменти спектру вже не можуть бути відновлені в точності, і, таким чином, втрачаються безповоротно.
Головним параметром стиснення з утратами є бітрейт, що визначає ступінь стиснення файлу та, відповідно, якість. Розрізняють стиснення з постійним бітрейтом (англ. Constant BitRate — CBR), змінним бітрейтом (англ. Variable BitRate — VBR) та усереденим бітрейтом (англ. Average BitRate — ABR).
Найпоширенішими форматами стиснення з втратами є:
- AAC - частота дискретизації до 192 КГц, число каналів до 48, на останій час є менш популярним форматом у порівнянні із mp3 та ogg.
- ADPCM
- ATRAC
- Dolby AC-3
- MP2 - MPEG-1/2 Layer 2 (Musicam)
- MP3 - частота дискретизації до 48 КГц, розрядність 16 бітна, двоканальний, бітрейт обмежений діапазоном 8 — 320 кбіт/c.
- Musepack Ogg Vorbis
- WMA (Windows Media Audio)
Приклади
Назва композиції | Формат | Тривалість | Оригінал | Bitrate | ||
---|---|---|---|---|---|---|
128 bps | 192 bps | 320 bps | ||||
Dokken - Give A Reason | .flac | 03:50 | 30.7 MB .flac | 3.51 MB .mp3 | 5.26 MB .mp3 | 8.78 MB .mp3 |
AC DC - Given The Dog A Bone | .flac | 03:34 | 24.3 MB .flac | 3.26 MB .mp3 | 4.9 MB .mp3 | 8.17 MB .mp3 |
Deep Purple - Burn | .flac | 05:59 | 41.0 MB .flac | 5.48 MB .mp3 | 8.22 MB .mp3 | 13.7 MB .mp3 |
Порівняння якості звуку
На низькому бітрейді хоч і маленький об'єм файлу, але завжди прибираються різні тихі деталі, які покращують емоційне забарвлення композиції. Тому чим більший є бітрейд тим кращою стає композиція.