ЛР№6-8/Vlad/Звук

Матеріал з Вікі ЦДУ
Перейти до: навігація, пошук
Лабораторна робота 9, 10, 11
Тема: Звук
Мета: Вивчення представлення звуку

Завдання:

  1. Вивчити формати звукових файлів.
  2. Зберегти 3 улюблені музикальні композиції в некомпресованому форматі.
  3. Кожну з композицій компресувати з бітрейдом від 128 до 320 Кбіт на сек.
  4. Порівняти якість звуку в отриманих файлах.

Формати звукових файлів

Цифрові звукові формати — формати файлів для збереження звукових даних у комп'ютерних системах. Файли таких форматів називають також аудіофайлами, або звуковими файлами.

Загальний принцип збереження аудіо на цифрових носіях полягає у послідовній фіксації значень амплітуди звукових коливань, які при відтворенні звуку відповідатимуть положенню мембран у гучномовцях. Ці значення записуються з певною частотою дискретизації та певним амплітудним розділенням. Для зменшення обсягів, ці дані можуть бути стиснені з втратами або без втрат.

Типи файлів

Існує три основні групи аудіофайлів:

  • нестиснені формати — такі як WAV, AIFF, AU або PCM;
  • формати із стисненням без втрат — FLAC, Monkey's Audio (розширення APE), Shorten, Tom's lossless Audio Kompressor (TAK), TTA, ATRAC Advanced Lossless, Apple Lossless, MPEG-4 SLS, MPEG-4 ALS, MPEG-4 DST, Windows Media Audio Lossless (WMA Lossless).
  • формати із стисненням з втратами, як наприклад MP3, Ogg Vorbis, Musepack, AAC, ATRAC чи lossy Windows Media Audio (WMA).

Нестиснені формати

WAV

WAV (англ.waveform audio format) — формат аудіофайла розроблений компаніями Microsoft та IBM. WAVE базується на форматі RIFF, поширюючи його на інформацію про такі параметри аудіо, як застосований кодек, частота дискретизації та кількість каналів. WAV як і RIFF передбачався для комп'ютерів IBM PC, тому всі змінні записані у форматі little endian.

Хоча файли WAVE можуть бути записані за допомогою будь-яких кодеків аудіо, зазвичай використовується нестиснений PCM, який призводить до великих обсягів файлу (близько 172 кБ на секунду для CD-якості). Іншим недоліком файлу є обмеження обсягу до 4 ГБ, через 32-бітну змінну. Формат WAV був частково витіснений стисненими форматами, проте, завдяки своїй простоті, надалі знаходить широке використання в процесі редагування звуку та на переносних аудіопристроях, як програвачі та цифрові диктофони.

PCM

Імпульсно-кодова модуляція (ІКМ або PCM — англ. Pulse Code Modulation) - процес перетворення аналогового сигналу у цифровий сигнал, коли через певні інтервали часу беруться відліки аналогового сигналу і незалежно один від одного квантуються і далі кодуються цифрами. ІКМ використовується для оцифровки аналогових сигналів перед їхньою передачею. Практично всі види аналогових даних (відео, голос, музика, дані телеметрії) допускають застосування ІК-модуляції.

Формати із стисненням без втрат

Monkey's Audio

Monkey's Audio або APE — популярний формат кодування цифрового звуку без втрат. Поширюється безкоштовно разом з відкритим вихідним кодом і набором програмного забезпечення для кодування і відтворення, а також плагінами до популярних плеєрів. Файли Monkey's Audio використовують такі розширення: .ape для зберігання аудіо і .apl для зберігання метаданих. Незважаючи на відкритий вихідний код, Monkey's Audio не є вільним, тому що його ліцензія накладає значні обмеження на використання.

Офіційно кодек Monkey's Audio випускається тільки для платформи Windows, хоча існує ряд неофіційних кодеків для GNU/Linux й Mac OS X, які в більшості випадків дозволяють лише стискати файли, перетворюючи їх в інший формат.

MPEG-4

MPEG-4 — група стандартів на цифрове стиснення аудіо й відео, прийняту MPEG (Moving Picture Experts Group — Групою Експертів в області Відео). З'явився у 1998 році і містить у собі групу стандартів стиснення аудіо і відео і суміжні технології, схвалені ISO — Міжнародною Організацією по стандартизації/iEC Moving Picture Experts Group (MPEG). Стандарт MPEG-4 в основному використається для мовлення (потокове відео), запису дисків з фільмами CD, відеотелефонії (відеотелефон), і Широкомовлення, що активно використовує стиснення цифрових відео й аудіо.

MPEG-4 містить у собі багато функцій MPEG-1, MPEG-2 й інших подібних стандартів, додаючи такі функції як підтримка мови віртуально розмітки VRML для показу 3D-об'єктів, об'єктно-орієнтовані файли, підтримка керування правами й різні типи інтерактивного медіа. AAC був стандартизований як доповнення до MPEG-2 (частина 7), був також розширений і включений в MPEG-4.

Windows Media Audio Lossless

Windows Media Audio 9 Lossless — аудіо кодек для стиснення без втрат фірми Microsoft, представлений на початку 2003 року. Остання версія на 2008 рік — 9.2.

Стиснутий цим кодеком аудіо компакт-диск займає від 206 до 411 Мб, при бітрейті звукових файлів від 470 кбіт/с до 1.08 Мбіт/с. Кодек входить до складу пакету Windows Media, використовує розширення файлу .Wma, підтримує 6 дискретних каналів. Офіційно випущений тільки для Windows і Mac OS X.

Формати із стисненням з втратами

MP3

MP3 — ліцензований формат файлу для зберігання аудіо-інформації. Розроблений наприкінці 1980-тих років Карлхайнц Бранденбургом, аспірантом Університету Ерлангена—Нюрнберга, Німеччина. Широко використовується в файлообмінних мережах для передачі музичних творів. Базується на теоремі Котельникова-Шеннона. Є форматом стиснення з втратами, тобто частина звукової інформації, яку вухо людини майже не сприймає, безповоротно видаляється з запису. Розробка формата була пов'язана з тим, що формат Audio-CD — дуже великий за розміром файл (1 хвилина ~ 10-15 Мб інформації), і для пересилання в інтернеті був дуже незручним. Тому треба було зменшити розмір файла та зберегти якість звучання.

У цьому форматі звуки кодуються частотним чином (без дискретних партій); є підтримка стерео. MP3 є форматом стиснення з втратами, тобто частина звукової інформації, яку (згідно з психоакустичною моделлю) вухо людини сприйняти не може або сприймається не всіма людьми, знищується. Ступінь стиснення можна варіювати, зокрема в межах одного файлу. Інтервал можливих значень бітрейту становить 8 — 320 кбіт/c. Для порівняння, потік даних із звичайного компакт-диска формату AUDIO-CD дорівнює 1411,2 кбіт/c при частоті дискретизації 44100 Гц.

Windows Media Audio

Windows Media Audio (WMA) — ліцензований формат файла, розроблений компанією Microsoft для зберігання і трансляції аудіо-інформації.

З самого початку формат WMA позиціювався як альтернатива MP3, але сьогодні Microsoft протиставляє йому формат AAC (використається в популярному на Заході онлайновому музичному магазині iTunes).

Номінально формат WMA характеризується гарною здатністю стискання даних, що дозволяє йому «обходити» формат Mp3 і конкурувати по цих параметрах з форматами Ogg vorbis і AAC. Але як було показано незалежними тестами, а також при суб'єктивній оцінці якість форматів все таки не є однозначною, а в перевазі навіть над mp3 є також сумніви, незважаючи на заперечення компанією Microsoft. Особливо варто відзначити, що ранні версії формату (або його реалізації) мали проблеми на низьких швидкостях потоку. Однак даний формат постійно розвивається, тож можна припустити, що якість оптимізовуватиметься.

Практична частина

Назва композиції Формат Bitrate Оригінал
128 bps 192 bps 320 bps
Skillet_-_Never_Surrender mp3 Слухати() Слухати Слухати Слухати(wav)
Linkin_Park_-_Roads_Untraveled mp3 Слухати Слухати Слухати Слухати(wav)
Imagine_Dragons_-_Radioactive mp3 Слухати Слухати Слухати Слухати(wav)

Висновок:

Можливо помітити, що в 128kb/s пісні сприймалися звуки не чітко. А в 320kb/s чіткіще і краще сприймались окремі звуки. WAV формат використовувати практично для кращого сприняття чіткого звуку, але mp3 формат став популярним завдяки меншого розміру для мережі і з невеликими втратами (320kb/s).