Денісова Лабораторна робота №5

Матеріал з Вікі ЦДУ
Перейти до: навігація, пошук

Формати звукових файлів

Цифрові звукові формати — формати файлів для збереження звукових даних у комп'ютерних системах. Файли таких форматів називають також аудіофайлами, або звуковими файлами. Загальний принцип збереження аудіо на цифрових носіях полягає у послідовній фіксації значень амплітуди звукових коливань, які при відтворенні звуку відповідатимуть положенню мембран у гучномовцях. Ці значення записуються з певною частотою дискретизації та певним амплітудним розділенням. Для зменшення обсягів, ці дані можуть бути стиснені з втратами або без втрат. Існує три основні групи аудіофайлів: нестиснені формати, формати із стисненням без втрат та формати із стисненням з втратами. Слід мати на увазі, що до аудіофайлів не відносяться такі музичні формати як MIDI, або файли нотних редакторів, які являють собою лише послідовність команд для музичного інструменту,однак не містять інформації власне про звук. Формат аудіофайлу також слід відрізняти від аудіо-кодеку. Кодек здійснює кодування чи розкодування звукових даних, тоді як самі дані зберігаються у файлі відповідного звукового формату. Більшість форматів підтримують лише один тип кодування звукових даних, проте мультимедійні контейнери (напр. MKV або AVI) можуть підтримувати різні типи аудіо і відео даних.


Формати із стисненням без втрат

Складність стиснення звуку без втрат полягає в тому, що записи звуку є надзвичайно складними у своїй структурі. Одним із методів стиснення є пошук взірців і їх повторень, проте цей метод не ефективний для більш хаотичних даних, якими є, наприклад оцифрований звук чи фотографії. Цікаво, що якщо згенерована комп'ютером графіка значно легше піддається стисненню без втрат, то синтезований звук в цьому відношенні не має переваг. Це пояснюється тим, що навіть згенерований комп'ютером звук зазвичай має дуже складну форму, яка представляє складне завдання для винайдення алгоритму.

  • FLAC - (Free Lossless Audio Codec — вільний аудіокодек без втрат) — аудіокодек для стиснення аудіо при 100% збереженні оригінального звукового потоку. FLAC є вільним форматом.
  • Monkey's Audio (APE) — популярний формат кодування цифрового звуку без втрат. Поширюється безкоштовно разом з відкритим вихідним кодом і набором програмного забезпечення для кодування і відтворення, а також плагінами до популярних плеєрів.
  • Shorten(SHN) - це формат стиснення без втрат аудіо файлів CD-якості.
  • ТАК (нем. Tom’s verlustfreier Audio Kompressor) — аудиокодек и формат сжатия цифрового звука без потерь. Отличается высокой степенью сжатия и скоростью кодирования и декодирования. Использует теги APEv2.
  • ATRAC (англ. Adaptive Transform Acoustic Coding, Адаптивне кодування електроакустики) — сімейство пропрієтарних аудіо алгоритмів стиснення, розроблених Sony. MiniDisc в 1992 році був першим комерційним продуктом, який використовував ATRAC, що дозволило на порівняно невеликому диску мати той же час роботи, як на CD при зберіганні аудіоінформації з мінімальною втратою якості.
  • Apple Lossless - (також відомий як Apple Lossless Encoder, ALE, або Apple Lossless Audio Codec, ALAC) — відкритий аудіокодек для стиснення цифрової музики без втрат якості, розроблений Apple Inc., цей формат повсюдно використовується в продуктах Apple.
  • MPEG-4 — група стандартів на цифрове стиснення аудіо й відео, прийняту MPEG (Moving Picture Experts Group — Групою Експертів в області Відео). З'явився у 1998 році і містить у собі групу стандартів стиснення аудіо і відео і суміжні технології.


Формати із стисненням з втратами

Стиснення із втратами має надзвичайно широке застосування. Окрім комп'ютерних програм, стиснення з втратами використовується в потоковому аудіо в DVD, цифровому телебаченні і радіо та потоковому медіа в інтернеті. Новацією цього методу стиснення було використання психоакустики для виявлення компонентів звучання, що не сприймаються слухом людини. Прикладом можуть слугувати або високі частоти, які сприймаються лише при достатній їх потужності, або тихі звуки, що виникають одночасно або одразу після голосніших звуків і тому маскуються ними — такі компоненти звучання можуть бути передані менш точно, або і взагалі не передані.

  • MP3 - ліцензований формат файлу для зберігання аудіо-інформації. Був розроблений для передачі файлів в мережі Інтернет, там же і став дуже популярним.
  • Ogg Vorbis - вільний формат стиснення звуку, призначений для зберігання аудіо-інформації, подібно до MP3, однак його поява була зумовлена тим, що MP3 захищений патентом.
  • Musepack - ( mpp, mp+, mpc, MPEG+) — неліцензований формат файлу для зберігання аудіо, розповсюджуваний за GNU General Public License.
  • AAC (Advanced Audio Coding) — стандартна схема стиснення із втратами для аудіоданих. AAC розроблена як альтернатива форматам mp3 його розробником.


Нестиснені формати

  • WAV - Microsoft Wave (Waveform audio format) розроблений спільно з IBM; WAVE базується на форматі RIFF, поширюючи його на інформацію про такі параметри аудіо, як застосований кодек, частота дискретизації та кількість каналів.
  • AIFF - Audio Interchange File Format (AIFF) — формат аудіо файлів, що застосовується для зберігання звукових даних на персональних комп'ютерах і на інших електронних аудіопристроях.
  • AU - простий формат аудіофайлів, уведений Sun Microsystems.


MPEG-3

MP3 — ліцензований формат файлу для зберігання аудіо-інформації. Розроблений наприкінці 1980-тих років Карлхайнц Бранденбургом, аспірантом Університету Ерлангена — Нюрнберга, Німеччина. Широко використовується в файлообмінних мережах для передачі музичних творів. Базується на теоремі Котельникова-Шеннона. Є форматом стиснення з втратами, тобто частина звукової інформації, яку вухо людини майже не сприймає, безповоротно видаляється з запису. Розробка формата була пов'язана з тим, що формат Audio-CD — дуже великий за розміром файл (1 хвилина ~ 10-15 Мб інформації), і для пересилання в інтернеті був дуже незручним. Тому треба було зменшити розмір файла та зберегти якість звучання. MP3 на сьогодні найбільш популярний формат збереження відцифрованого звуку. МР3 використовує приблизно у 10 разів менше дискового простору при збереженні звуку відповідної якості, ніж файл у форматі WAV. В МР3 для стиснення даних використовується механізм обрізання частот, які маскуються; механізм резервуванням інформації, за яким відновлюються високі частоти; механізм суміщеного стерео, а також стандартні алгоритми стиснення даних без втрат (алгоритм Хафмана). Досягається стисненням у 10-12 разів із збереженням CD – якості звуку, при цьому Бітрейт* = 112-128 Кб/с.


Бітрейт

Бі́това шви́дкість, бітре́йт (англ. bitrate) — швидкість проходження бітів інформації за секунду. Бітову швидкість прийнято використовувати до вимірювання ефективної швидкості передачі інформації по каналу, тобто швидкості передачі «корисної інформації» (адже крім такої є ще службова інформація, наприклад, стартові й стопові символи за асинхронної передачі, або контрольні символи за надлишкового кодування).


3 улюблені музикальні композиції в некомпресованому форматі

Назва композиції Тривалість Бітрейт(формат mp3) Вага оригіналу
128kbps 192kbps 256kbps 320kbps
Alan Walker - Alone 2:43 3.7Mb [1] 4.2Mb [2] 6Mb [3] 6.5Mb [4] 3.1Mb
Nightwish - Nemo 4:12 3.8Mb [5] 4.3Mb [6] 5.7Mb [7] 7.1Mb [8] 6.8Mb
Europe - The Final Countdown 5:11 4.7Mb [9] 4.9Mb [10] 5.6Mb [11] 7.5Mb [12] 7.4Mb

Висновки

Для прослуховування я використовувала такі засоби: динаміки, влаштовані в ноутбук та дорогі навушники. Слухаючи аудіофайли с бітрейтом 128 - 320 kbps я відчула різницю лише між 128 та 320 kbps лише через дорогі навушники. Динаміки, влаштовані в ноутбук не дали можливості почути хоча б якусь різницю між файлами. Слухаючи через дорогі навушники одразу було відчутно, що звук став більш об'ємним, насиченим різними частотами, а також стало можливим почути деякі призвуки і елементи композиції, які не було чутно на динаміках. Порівнюючи компресовані аудіофайли з бітрейтом 128 - 320 kbps та оригінальні файли бітрейт яких склав від 995 kbps до 1059 kbps, можна зробити висноки, що на дешевому обладнанні аудіофайли з бітрейтом від 128 до 192 звучать майже однаково і тільки при 256 і 320 kbps є невелике та малозамітне покращення якості. Що стосується аудіофайлів, бітрейт яких складав від 995 kbps до 1059 kbps, можна сказати, що на звичайних недорогих колонках чи навушниках ці аудіофайли мають добре звучання. При прослуховуванні музики в аудиторію, ситуація була схожою - динаміки, влаштовані в ноутбук, не давали можливості почути різницю між різними форматами та різним бітрейтом, а використовуючи колонки звук відчувався більш якісним, об'ємним та насиченим.