Мультимедия ЛАБ 5 КН17Б Устенко В.О.

Матеріал з Вікі ЦДУ
Перейти до: навігація, пошук

Вивчення представлення звуку

Music gif.gif

Музика

Музика (від грец. μουσική — мистецтво муз) — мистецтво організації музичних звуків, насамперед у часовій (ритмічній), звуковисотній та тембровій шкалі. Музичним може бути практично будь-який звук з певними акустичними характеристиками, які відповідають естетиці тієї чи іншої епохи, та може бути відтвореним. Джерелами такого звуку можуть бути: людський голос, музичні інструменти, електричні генератори тощо.

Музичний звук

Основним елементом музичного мистецтва є музичний звук. Властивості звуку вивчає музична акустика та елементарна теорія музики. Суб'єктивні особливості сприйняття звуку людиною дозволяють виділити чотири основні властивості музичного звуку — звуковисотність, тембр, гучність та тривалість.

  • Висота звуку залежить від частоти звукових коливань і може бути виражена з різним ступенем ясності, у залежності від чого розрізняють звуки визначеної і невизначеної висоти. Більшість використовуваних у музиці звуків — це звуки визначеної висоти, які можна охарактеризувати частотою коливань їх основного тону і зафіксувати як ноту, у теорії музики вони також називаються тонами. Поряд зі звуками з визначеною висотою, у музиці використовуються і звуки з невизначеною висотою — є звуки ряду ударних музичних інструментів (наприклад барабанів), деякі синтетичні звуки та шумові ефекти. Середньостатистична людина чує коливання, передані по повітрю, у діапазоні частот від 16—20 Гц до 15—20 кГц. Звук нижче діапазону чутності людини називають інфразвуком; вище: до 1 ГГц, — ультразвуком, від 1 ГГц — гіперзвуком. Представники тваринного світу здатні сприймати звуки в значно ширшому діапазоні частот. Кажани для орієнтації та знаходження здобичі використовують звуки в діапазоні 20-120 кГц. Дельфіни, наприклад, використовують для орієнтації та полювання звуки з частотою понад 100 кГц. Значно вищі 20 кГц частоти здатні сприймати і собаки. Розрізняють поздовжні й поперечні звукові хвилі залежно від співвідношення напрямку поширення хвилі й напрямки механічних коливань часток середовища поширення.
  • Тембр звуку залежить від форми коливань джерела звуку і визначається кількістю та інтенсивністю обертонів, що утворюють гармонічний ряд. Тембральне різнобарв'я музики визначається багатоманіттям музичних інструментів та прийомами гри на них. Тембр також є важливою характеристикою співацького голосу.
  • Гучність звуку характеризується як слухове уявлення про силу звука, що виникає у свідомості людини під час сприйняття звука. В абсолютному вимірі звучання музики може досягати сили 100 дБ на симфонічному концерті і 120 дБ на концертах рок-музики. Натомість, у музичній практиці важливіше значення має умовне співвідношення рівнів сили звуку, яке називається динамікою і є одним з її виразових засобів.
  • Тривалість звуку залежить від часу тривання коливального процесу і, як правило, позначається у відносних одиницях — музичних тривалостях, абсолютне значення яких залежить від темпу, у яких вони відтворюються.

Список цифровых аудиоформатов

Формати аудіо зі стисненням з втратами

Opus.jpg
  • MPEG-1 Audio Layer II (скор. MP2, іноді називається Musicam) — один з трьох форматів (рівень 2) стиснення звуку з втратами, визначених у стандарті MPEG-1. Застосовується в цифровому радіомовлення DAB і застарілому стандарті Video CD, який в 90-і роки використовувався для розповсюдження фільмів на оптичних компакт-дисках і існував до широкого розповсюдження DVD.
  • MPEG-1/2/2.5 Layer 3(скор. MP3) — розроблений наприкінці 1980-тих років Карлгайнцем Бранденбургом. Базується на теоремі Котельникова-Шеннона. Частина звукової інформації, яку вухо людини майже не сприймає, безповоротно видаляється з запису. Розробка цього формату була пов'язана з тим, що файл формату Audio-CD — дуже великий за розміром (1 хвилина ~ 10-15 Мб інформації), і для пересилання в інтернеті був дуже незручним. Тому треба було зменшити розмір файла та зберегти якість звучання.
  • Ogg Vorbis — вільний формат стиснення звуку, що розроблявся компанією Xiph.Org Foundation 1998 року
  • Speex — проект Ogg,вільний, стиснення голосу, низький бітрейт
  • Opus — проект Ogg, вільний, передача звуку по мережі; заснований на технологіях кодеків CELT и SILK.
  • GSM-FR(англ. Full Rate) — перший цифровий стандарт кодування голосу[en], що використовується в GSM-мережах. Бітрейт цього кодеку становить 13 кбіт/с. Якість голосу після кодування виходить досить низькою за сучасними мірками, але на момент розробки (початок 1990-х) це був гарний компроміс між складністю обчислень та якістю.
  • G.723.1 — один з базових кодеків мовної IP-телефонії
  • G.729 — ефективний вузькосмуговий мовний кодек IP-телефонії
  • Windows Media Audio (WMA)
  • AAC (.m4a, .mp4, .m4p, .aac) — Advanced Audio Coding, часто в контейнері MPEG-4
  • Musepack — Musepack (MPC)
  • TwinVQ — Yamaha TwinVQ (VQF)оптимізований для наднизьких бітрейтів близько 8 kbit/s.
  • RealAudio (RA, RM) — використовується для зберігання потокового RealVideo, RealAudio
  • OTS Audio File — схожий на MP3
  • SWA — Macromedia Shockwave Audio; стиснення як в MP3 з додатковими заголовками для Macromedia Director

_______________________________________________________________________________________________________________________________________________________________________________________________________________________________________

Формати аудіо зі стисненням без втрат

Foto-vox-flacvsmp3.png
  • FLAC.flac (англ. Free Lossless Audio Codec — вільний аудіокодек без втрат) — аудіокодек для стиснення аудіо при 100% збереженні оригінального звукового потоку. FLAC забезпечує т.зв. стиснення без втрат (англ. lossless), тобто при розпакуванні звукові дані залишаються повністю ідентичним до початкового файлу перед стисненням. FLAC також включає можливість перевірки точності даних завдяки збереженню у файлі відбитку MD5 оригінальних даних. FLAC є вільним форматом: його використання не вимагає виплат роялті, специфікації є відкритими та його основна реалізація є вільним програмним забезпеченням.
  • Lossless Audio (.la)
  • Lossless Predictive Audio Compression (LPAC; .pac)
  • Apple Lossless (.m4a) - розроблений Apple Inc.
  • Monkey's Audio (.ape) - файли Monkey's Audio використовують такі розширення: .ape для зберігання аудіо і .apl для зберігання метаданих.
  • OptimFROG (.ofr) - оптимізований для високого ступеня стиснення, ціною збільшення накладних витрат на стиск і декомпресію даних.
  • RKAU (.rka)
  • Shorten (.shn)
  • TTA — True Audio, вільний кодек
  • TAK (.tak) — Tom’s lossless Audio Kompressor. Вирізняється високим ступенем стиснення і швидкістю кодування і декодування. Використовує теги APEv2.
  • WavPack (.wv)
  • Windows Media Audio 9 Lossless (.wma)
  • ADX — формат звуку з максимальним бітрейтом 1 Гбіт / с. Розроблений CRI Middleware спеціально для використання в відеоіграх.
  • PXD (.pxd) - формат компанії PXD Media. Один з перших аудіокодеків без втрат (1997). Використовується в музичних конструкторах EJAY та інших.

_______________________________________________________________________________________________________________________________________________________________________________________________________________________________________

Формати аудіо безстиснення

1200px-PCM-vs-DSD.svg.png
  • AIFF
  • AU
  • CD-Audio (англ. Compact Disc Digital Audio, Audio-CD, CD-DA) — стандарт цифрового запису звуку на компакт-диск, що використовує кодування PCM з частотою дискретизації 44,1 кГц і розрядністю 16 біт.
  • DSD — однобітний аудіоформат, розроблений компаніями Sony і Philips, в якому використовується кодування Pulse Density Modulation (PDM), різновид сигма-дельта-модуляції) і застосовується для зберігання звукозаписів на оптичному носії SACD. Спочатку передбачався як архівний формат звукозаписної компанії Sony Music для перекладу музичного архіву в цифровий формат.
  • DXD(англ. Digital eXtreme Definition ) — многоразрядный формат сверхвысокого разрешения цифрового кодирования звуковых данных, применяемый в профессиональной звукозаписи.
  • IFF-8SVX — Interchange File Format
  • IFF-16SV
  • RAW (Англ. Raw - сирий, необроблений)
  • WAV (англ. waveform audio format) — формат аудіофайлу, розроблений компаніями Microsoft та IBM. WAVE базується на форматі RIFF, поширюючи його на інформацію про такі параметри аудіо, як застосований кодек, частота дискретизації та кількість каналів. WAV як і RIFF передбачався для комп'ютерів IBM PC, тому всі змінні записані у форматі little endian. Відповідником WAV для комп'ютерів PowerPC є AIFF. Хоча файли WAVE можуть бути записані за допомогою будь-яких кодеків аудіо, зазвичай використовується нестиснений PCM, який призводить до великих обсягів файлу (близько 172 кБ на секунду для CD-якості). Іншим недоліком файлу є обмеження обсягу до 4 ГБ, через 32-бітну змінну.

Порівняння звукових форматів

Назва формату Розширення файлу Квантування, біт Частота дискретизації, кГц Число каналів Ступінь стиснення
МР3 .mp3 16 до 48 2 ~11:1 (залежить від потоку) з втратами
Ogg Vorbis .ogg .oga до 32 до 192 до 255 ~22:1 (при 64kbps) з втратами
WMA .wma до 24 до 96 до 8 2:1, є версія без стиснення
FLAC .flac 4 - 32 1Гц - 655.350 кГц з кроком 1 Гц 1 - 8 1.4:1 - 4:1, стиснення без втрат
Monkey’s Audio .ape 16; 24 8; 11.025; 12; 16; 22.05; 24; 32; 44.1; 48; 96 2 1.4:1 - 4:1, стиснення без втрат
TAK .tak 16; 24 до 192 2 1.4:1 - 3.3:1, стиснення без втрат
ALS .m4a 8; 16; 20; 24; 32 44.1; 48; 88.2; 96; 192; (384) до 65536 1.5:1 - 4:1, стиснення без втрат
DSD .dff 1 64*44.1; 128*44.1; 256*44.1 2, 5.1 1:1; без стиснення, можливе стиснення DST
WAV .wav 8; 16; 24; 32 11,025; 22,05; 24; 32; 44,1; 48; 96; 192 1; 2; 3; 4; 6 1:1; без стиснення
DXD DXD 24; 32 384 2, 5.1 1:1; без стиснення

3музикальні композиції

Назва композиції Виконавець Бітрейд kbps Довжина композиції Розмір композиції (Мб)
Overkill Riot 1789 FLAC 00:05:43 73,2 (!!!)
128 MP3 5,28
256 MP3 10,5
320 MP3 13,1
Amnesia Pixel terror 1149 FLAC 00:03:45 31,0
128 MP3 3,61
256 MP3 7,05
320 MP3 8,61
Satisfy Nero 1081 FLAC 00:04:03 31,4
128 MP3 3,85
256 MP3 7,57
320 MP3 9,43