Відмінності між версіями «Обробка зображень лабораторна №5 Козін Іван»

Матеріал з Вікі ЦДУ
Перейти до: навігація, пошук
(Створена сторінка: ==Формати звукових файлів== Результат монтажу залежить не лише від початкового творчого...)
 
м
Рядок 1: Рядок 1:
==Формати звукових файлів==
+
=Вивчення представлення звуку=
Результат монтажу залежить не лише від початкового творчого задуму, майстерності при монтуванні відзнятих (записаних) матеріалів, але якості матеріалів. Останнє істотно залежить від формату зберігання даних (і початкових, і остаточних).<br />
+
[[Файл:sampling.jpg|міні]]
'''Формати аудіо'''<br />
+
Для зберігання, обробки та відтворення звуку комп'ютеру необхідно перетворити неперервний сигнал у дискретний. Ця операція називається дискретизацією. Головним її параметром є '''частота дискретизації''', яка визначає кількість сигналів за секунду при перетворенні неперервного сигналу в дискретний. Вимірюється в герцах. Найпопулярніші частоти дискретизації: 44100 Гц (покриває весь діапазон приблизного середнього людського слуху, від 20 Гц до 22 КГц) та 48000 Гц. Із цим параметром пов'язаний ще один термнін частота Найквіста, що дорівнює половині частоти дискретизації та визначає максимальну частоту цифрового сигналу (виходячи за цей поріг може виникнути деформація сигналу).<br />
'''без стиснення:'''
+
*SACD (англійською Super Audio Compact Disc), розроблений фірмами Philips і Sony;
+
*WAV (англійською waveform audio format), розроблений компаніями Microsoft та IBM;
+
*CDDA (англійською Compact Disc Digital Audio), CD-Audio, Audio-CD — найпоширеніший стандарт цифрового запису звуку на компакт-диск без стиснення.
+
'''зі стисненням:'''<br />
+
*'''без втрат:'''
+
**FLAC — найякісніший вільний кодек проекту Ogg vorbis;
+
**APE — Monkey's Audio (.ape, .apl) — популярний формат кодування цифрового звука;
+
**WMA — Windows Media Audio 9.1 Lossless — ліцензований формат файла, розроблений компанією Microsoft для зберігання і трансляції аудіо-інформації.
+
*'''з втратами:'''<br />
+
**AAC (.m4a, .mp4, .m4p, .aac) — Advanced Audio Coding — стандартна схема стиснення із втратами для аудіоданих, розроблена у 1997 році Fraunhofer IIS як альтернатива форматам mp3. Наразі поширена менше ніж mp3 і ogg vorbis;
+
**Doulby Digital (AC-3) система цифрового багатоканального звуку для кінематографа;
+
**Ogg vorbis — вільний формат, що має перевагу над MP3;
+
**MP3 (MPEG Layer 3) — найпоширеніший і найпопулярніший формат, що відтворює звук наблежено до реального при сильному стисканні;
+
**Musepack — відтворює якісний звук лише на високих частотах (.mpc);
+
**RealAudio — підтримка потокового звуку, дуже швидке декодування (.ra, .rm);
+
**TvinVQ — якісний формат для запису звуку на низьких чатсотах (.vqf);
+
**WMA — Windows Media Audio — ліцензований формат файла компанії Microsoft для зберігання і трансляції аудіо-інформації;
+
**MIDI — Musical Instrument Digital Interface — для обміну даними між музичними інструментами;
+
**MOD — формат музичних композицій комп'ютерів Amiga.
+
  
==Композиції в некомпресованому форматі==
+
[[Файл:bit_depth.jpg|міні]]
[https://drive.google.com/file/d/0B9ivnuYYp_H1cnZGb2trQ2haR2c/view?usp=sharing 3_minutes.mp3]<br />
+
Цифрові формати збереження аудіо-даних, що використовують PCM (імпульсно-кодову модуляцію) мають ще однин важливий параметр — '''розрядність''' (bit depth), який визначає ширину діапазону можливих значень кожного семпла аудіо-файлу, а саме кількість бітів, що його визначають. Більша глибина, звичайно, збільшує розмір файлу, але є показником більшого доступного динамічного діапазону. Параметр, що визначає кількість біт, яка передається на одиницю часу називається '''бітрейтом''' (bitrate) і буває статичним (CBR), “плаваючим” (VBR), або усереденим (ABR)<br />
[https://drive.google.com/file/d/0B9ivnuYYp_H1SnlrTzZYcm11MWM/view?usp=sharing Danza Kuduro.mp3]<br />
+
[https://drive.google.com/file/d/0B9ivnuYYp_H1WFhaSklRaXJxUmc/view?usp=sharing Under.mp3]
+
  
==Композиції, компресовані з бітрейдом==
+
Формати для зберігання звуку поділяються на три основних класи: нестисненні формати (можуть мати найбільший розмір у порівнянні із стисненними, але є найбільш подібними до оригінального звуку при записі), стисненні без втрат (lossless, полягають у можливості відтворення нестисненного сигналу без спотворень), стисенні із втратами (lossy, унеможливлюють відтворення оригінального сигналу внаслідок специіальних алгоритмів стиснення, але, зазвичай, мають найменший розмір).<br />
{| class="wikitable" border="1" style="text-align: center;"
+
 
|-
+
===Формати без стиснення ===
|
+
* CD-Audio (Compact Disc Digital Audio) — частота дискретизації 44.1 КГц, розрядність 16 біт, двоканальний.
| Бітрейт (розмір)
+
* WAV (Waveform Audio Format) — можлива частота дискретизації 11.025 - 192.0 КГц, можлива розрядність 8 - 32 біт, число каналів від одного до шести.
| Розмір файлу
+
* AIFF (Audio Interchange File Format) — можлива частота дискретизації 11.025 - 192.0 КГц, можлива розрядність 8 - 32 біт, число каналів від одного до шести. Використовується переважно із продукцією Apple.
| Бітрейт
+
===Формати із стисненням без втрат===
|-
+
* FLAC (Free Lossless Audio Codec ) — частота дискретизації 1Гц - 655.350 КГц, можлива розрядність 4 - 32, число каналів від одного до восьми, відкритий та багатоплатформний.
| [https://drive.google.com/file/d/0B9ivnuYYp_H1cnZGb2trQ2haR2c/view?usp=sharing 3_minutes.mp3]
+
* APE (Monkey's Audio) — частота дискретизації 8 - 96 КГц, можлива розрядність 16, або 24, двоканальний, відкритий.
| 128 кбіт/c
+
* ALAC (Apple Lossless Audio Codec) — частота дискретизації 44.1 - 192 КГц, можлива розрядність 16, або 24, підтримка до шести каналів. Основне призначення формату в сумісністності із сервісами Apple, які не підтримуюсь FLAC.
| 3 474 КБ
+
===Формати із стисненням з втратами===
| [[Файл:3_minutes_convert128.png|700x1100px]]
+
* MP3 (MPEG-1 Audio Layer 3) — частота дискретизації до 48 КГц, розрядність 16 бітна, двоканальний, бітрейт обмежений діапазоном 8 — 320 кбіт/c.
<!--|-
+
* OGG (Ogg Vorbis) — частота дискретизації до 192 КГц, розрядність до 32 біт, число каналів до 255, багатоплатформений та більш гнучкий в налаштуванні.
| [https://drive.google.com/file/d/0B9ivnuYYp_H1cnZGb2trQ2haR2c/view?usp=sharing 3_minutes.mp3]
+
* AAC (Advanced Audio Coding) — частота дискретизації до 192 КГц, число каналів до 48, на останій час є менш популярним форматом у порівнянні із mp3 та ogg.
| 160 кбіт/c
+
 
| 4 342 КБ
+
{| class="wikitable" width="100%"
| [[Файл:3_minutes_convert160.png|700x1100px]]
+
|-
+
| [https://drive.google.com/file/d/0B9ivnuYYp_H1cnZGb2trQ2haR2c/view?usp=sharing 3_minutes.mp3]
+
| 192 кбіт/c
+
| 5 210 КБ
+
| [[Файл:3 minutes covert192.png|700x1100px]] -->
+
|-
+
| [https://drive.google.com/file/d/0B9ivnuYYp_H1MjRoNFF5NUJKYms/view?usp=sharing 3_minutes.mp3]
+
| 256 кбіт/c
+
| 4 342 КБ
+
| [[Файл:3_minutes_convert_256.png|700x1100px]]
+
|-
+
| [https://drive.google.com/file/d/0B9ivnuYYp_H1TmdvY25FOE4zT2s/view?usp=sharing 3_minutes.mp3]
+
| 320 кбіт/c
+
| 5 210 КБ
+
| [[Файл:3_minutes_convert_320.png|700x1100px]]
+
|-
+
| [https://drive.google.com/file/d/0B9ivnuYYp_H1SnlrTzZYcm11MWM/view?usp=sharing Danza Kuduro.mp3]
+
| 128 кбіт/c
+
| 2 042 КБ
+
| [[Файл:Forsaj_convert_128.png|700x1100px]]
+
<!--|-
+
| [https://drive.google.com/file/d/0B9ivnuYYp_H1SnlrTzZYcm11MWM/view?usp=sharing Danza Kuduro.mp3]
+
| 160 кбіт/c
+
| 2 553 КБ
+
| [[Файл:Forsaj_convert_160.png|700x1100px]]
+
|-
+
| [https://drive.google.com/file/d/0B9ivnuYYp_H1SnlrTzZYcm11MWM/view?usp=sharing Danza Kuduro.mp3]
+
| 192 кбіт/c
+
| 3 063 КБ
+
| [[Файл:Forsaj_convert_192.png|700x1100px]]-->
+
|-
+
| [https://drive.google.com/file/d/0B9ivnuYYp_H1YW1aWlgzR0U1dG8/view?usp=sharing Danza Kuduro.mp3]
+
| 256 кбіт/c
+
| 4 084 КБ
+
| [[Файл:Forsaj_convert_256.png|700x1100px]]
+
|-
+
| [https://drive.google.com/file/d/0B9ivnuYYp_H1NGNOeUIyd0NXamc/view?usp=sharing Danza Kuduro.mp3]
+
| 320 кбіт/c
+
| 5 105 КБ
+
| [[Файл:Forsaj_convert_320.png|700x1100px]]
+
 
|-
 
|-
| [https://drive.google.com/file/d/0B9ivnuYYp_H1WFhaSklRaXJxUmc/view?usp=sharing Under.mp3]
+
! Author - Title - Length!!WAV (2822)!!MP3 (320)!!MP3 (256)!!MP3 (128)!!Spectrogram
| 128 кбіт/c
+
| 2 001 КБ
+
| [[Файл:Under_convert_128.png|700x1100px]]
+
<!--|-
+
| [https://drive.google.com/file/d/0B9ivnuYYp_H1WFhaSklRaXJxUmc/view?usp=sharing Under.mp3]
+
| 160 кбіт/c
+
| 2 502 КБ
+
| [[Файл:Under_convert_160.png|700x1100px]]
+
 
|-
 
|-
| [https://drive.google.com/file/d/0B9ivnuYYp_H1WFhaSklRaXJxUmc/view?usp=sharing Under.mp3]
+
| IAMX - No Maker Made Me - 03:59||[https://drive.google.com/open?id=0B3bFpDCUergaam00N3VFUFphU2c wav] 80.7 MB||[https://drive.google.com/open?id=0B3bFpDCUergacE9jX19Pc2k3QkU 320] 9.16 MB||[https://drive.google.com/open?id=0B3bFpDCUergabmJsQ3pjLTduVDQ 256] 7.32 MB||[https://drive.google.com/open?id=0B3bFpDCUergaaVVySTY3UktnbEU 128] 3.66 MB||[https://drive.google.com/open?id=0B3bFpDCUergaSEZ3OEwxZU5YWDQ GIF]
|рядок 2, комірка 2т/c
+
| 3 002 КБ
+
| [[Файл:Under_convert_192.png|700x1100px]]-->
+
 
|-
 
|-
| [https://drive.google.com/file/d/0B9ivnuYYp_H1MXdMakU1ZVk2OEU/view?usp=sharing Under.mp3]
+
| 65daysofstatic - Retreat! Retreat! - 04:09||[https://drive.google.com/open?id=0B3bFpDCUergabk9Tb2R3RWItNVk wav] 84.1 MB||[https://drive.google.com/open?id=0B3bFpDCUergaTFVVLWpsRE5RNTg 320] 9.53 MB||[https://drive.google.com/open?id=0B3bFpDCUergaaHgtQTZMdHZXLVk 256] 7.63 MB||[https://drive.google.com/open?id=0B3bFpDCUergaT2Y2NjYyeEdrNmM 128] 3.81 MB||[https://drive.google.com/open?id=0B3bFpDCUergaS1FoM2VDTUZlcWM GIF]
| 256 кбіт/c
+
| 4 002 КБ
+
| [[Файл:Under_convert_256.png|700x1100px]]
+
 
|-
 
|-
| [https://drive.google.com/file/d/0B9ivnuYYp_H1WDI2TXZGekdJeHM/view?usp=sharing Under.mp3]
+
| Xploding Plastix - Funnybones & Lazylegs - 04:48||[https://drive.google.com/open?id=0B3bFpDCUergaTk93c1p2ckJYd2M wav] 97.0 MB||[https://drive.google.com/open?id=0B3bFpDCUergacGFxLTluWDdoOVU 320] 11.0 MB||[https://drive.google.com/open?id=0B3bFpDCUergaNjZVT2FicTRVVHc 256] 8.80 MB||[https://drive.google.com/open?id=0B3bFpDCUergaSG51Q0dsc1hmc3M 128] 4.40 MB||[https://drive.google.com/open?id=0B3bFpDCUergaMDJIMEFYS09TUTA GIF]
| 320 кбіт/c
+
| 5 002 КБ
+
| [[Файл:Under_convert_320.png|700x1100px]]
+
 
|}
 
|}
  
 +
==Результати порівняння==
 +
У порівнянні між нестисненим та стисненим (320 кбіт/с) форматами не було помічено суттєвих відмінностей. Між двома варіантами  стиснених форматів (320 проти 256 кбіт/с) на деяких ділянках відчувалась різниця частотного діапазону. Найгірша в даному порівняні якість стисненого формату (128 кбіт/с) дає можливість не тільки відчути різницю у частотному спектрі, а також помітити спотворення сигналу на граничних для цього бітрейту частотах.
 
==Порівняння якості звуку==
 
==Порівняння якості звуку==
 
128 kbps мають менший розмір за рахунок видалення високих частот в деяких випадках (>16 kHz). Проте, потрібно враховувати тип музики, яка сжимається (багато високих частот, фокус на ударних інструментах) а також вік слухаючого.<br />
 
128 kbps мають менший розмір за рахунок видалення високих частот в деяких випадках (>16 kHz). Проте, потрібно враховувати тип музики, яка сжимається (багато високих частот, фокус на ударних інструментах) а також вік слухаючого.<br />
 
При порівнянні представлених композицій я помітив, що при використанні 128 kbps більше чути переходи і місцями музика наче обривається на долю секунди. При прослуховуванні 320 kbps музика звучить плавніше і майже не помітно "обривів".<br />
 
При порівнянні представлених композицій я помітив, що при використанні 128 kbps більше чути переходи і місцями музика наче обривається на долю секунди. При прослуховуванні 320 kbps музика звучить плавніше і майже не помітно "обривів".<br />
 
Але якщо потрібно визначити різницю між 128, 256 та 320 kbps, то треба використовувати спеціальне обладнання.
 
Але якщо потрібно визначити різницю між 128, 256 та 320 kbps, то треба використовувати спеціальне обладнання.

Версія за 15:53, 28 березня 2019

Вивчення представлення звуку

Sampling.jpg

Для зберігання, обробки та відтворення звуку комп'ютеру необхідно перетворити неперервний сигнал у дискретний. Ця операція називається дискретизацією. Головним її параметром є частота дискретизації, яка визначає кількість сигналів за секунду при перетворенні неперервного сигналу в дискретний. Вимірюється в герцах. Найпопулярніші частоти дискретизації: 44100 Гц (покриває весь діапазон приблизного середнього людського слуху, від 20 Гц до 22 КГц) та 48000 Гц. Із цим параметром пов'язаний ще один термнін — частота Найквіста, що дорівнює половині частоти дискретизації та визначає максимальну частоту цифрового сигналу (виходячи за цей поріг може виникнути деформація сигналу).

Bit depth.jpg

Цифрові формати збереження аудіо-даних, що використовують PCM (імпульсно-кодову модуляцію) мають ще однин важливий параметр — розрядність (bit depth), який визначає ширину діапазону можливих значень кожного семпла аудіо-файлу, а саме кількість бітів, що його визначають. Більша глибина, звичайно, збільшує розмір файлу, але є показником більшого доступного динамічного діапазону. Параметр, що визначає кількість біт, яка передається на одиницю часу називається бітрейтом (bitrate) і буває статичним (CBR), “плаваючим” (VBR), або усереденим (ABR)

Формати для зберігання звуку поділяються на три основних класи: нестисненні формати (можуть мати найбільший розмір у порівнянні із стисненними, але є найбільш подібними до оригінального звуку при записі), стисненні без втрат (lossless, полягають у можливості відтворення нестисненного сигналу без спотворень), стисенні із втратами (lossy, унеможливлюють відтворення оригінального сигналу внаслідок специіальних алгоритмів стиснення, але, зазвичай, мають найменший розмір).

Формати без стиснення

  • CD-Audio (Compact Disc Digital Audio) — частота дискретизації 44.1 КГц, розрядність 16 біт, двоканальний.
  • WAV (Waveform Audio Format) — можлива частота дискретизації 11.025 - 192.0 КГц, можлива розрядність 8 - 32 біт, число каналів від одного до шести.
  • AIFF (Audio Interchange File Format) — можлива частота дискретизації 11.025 - 192.0 КГц, можлива розрядність 8 - 32 біт, число каналів від одного до шести. Використовується переважно із продукцією Apple.

Формати із стисненням без втрат

  • FLAC (Free Lossless Audio Codec ) — частота дискретизації 1Гц - 655.350 КГц, можлива розрядність 4 - 32, число каналів від одного до восьми, відкритий та багатоплатформний.
  • APE (Monkey's Audio) — частота дискретизації 8 - 96 КГц, можлива розрядність 16, або 24, двоканальний, відкритий.
  • ALAC (Apple Lossless Audio Codec) — частота дискретизації 44.1 - 192 КГц, можлива розрядність 16, або 24, підтримка до шести каналів. Основне призначення формату в сумісністності із сервісами Apple, які не підтримуюсь FLAC.

Формати із стисненням з втратами

  • MP3 (MPEG-1 Audio Layer 3) — частота дискретизації до 48 КГц, розрядність 16 бітна, двоканальний, бітрейт обмежений діапазоном 8 — 320 кбіт/c.
  • OGG (Ogg Vorbis) — частота дискретизації до 192 КГц, розрядність до 32 біт, число каналів до 255, багатоплатформений та більш гнучкий в налаштуванні.
  • AAC (Advanced Audio Coding) — частота дискретизації до 192 КГц, число каналів до 48, на останій час є менш популярним форматом у порівнянні із mp3 та ogg.
Author - Title - Length WAV (2822) MP3 (320) MP3 (256) MP3 (128) Spectrogram
IAMX - No Maker Made Me - 03:59 wav 80.7 MB 320 9.16 MB 256 7.32 MB 128 3.66 MB GIF
65daysofstatic - Retreat! Retreat! - 04:09 wav 84.1 MB 320 9.53 MB 256 7.63 MB 128 3.81 MB GIF
Xploding Plastix - Funnybones & Lazylegs - 04:48 wav 97.0 MB 320 11.0 MB 256 8.80 MB 128 4.40 MB GIF

Результати порівняння

У порівнянні між нестисненим та стисненим (320 кбіт/с) форматами не було помічено суттєвих відмінностей. Між двома варіантами стиснених форматів (320 проти 256 кбіт/с) на деяких ділянках відчувалась різниця частотного діапазону. Найгірша в даному порівняні якість стисненого формату (128 кбіт/с) дає можливість не тільки відчути різницю у частотному спектрі, а також помітити спотворення сигналу на граничних для цього бітрейту частотах.

Порівняння якості звуку

128 kbps мають менший розмір за рахунок видалення високих частот в деяких випадках (>16 kHz). Проте, потрібно враховувати тип музики, яка сжимається (багато високих частот, фокус на ударних інструментах) а також вік слухаючого.
При порівнянні представлених композицій я помітив, що при використанні 128 kbps більше чути переходи і місцями музика наче обривається на долю секунди. При прослуховуванні 320 kbps музика звучить плавніше і майже не помітно "обривів".
Але якщо потрібно визначити різницю між 128, 256 та 320 kbps, то треба використовувати спеціальне обладнання.