Відмінності між версіями «Обробка зображень лабораторна №5 Козін Іван»
4541993 (обговорення • внесок) м |
4541993 (обговорення • внесок) м |
||
(не показано 7 проміжних версій цього учасника) | |||
Рядок 1: | Рядок 1: | ||
=Вивчення представлення звуку= | =Вивчення представлення звуку= | ||
− | |||
Для зберігання, обробки та відтворення звуку комп'ютеру необхідно перетворити неперервний сигнал у дискретний. Ця операція називається дискретизацією. Головним її параметром є '''частота дискретизації''', яка визначає кількість сигналів за секунду при перетворенні неперервного сигналу в дискретний. Вимірюється в герцах. Найпопулярніші частоти дискретизації: 44100 Гц (покриває весь діапазон приблизного середнього людського слуху, від 20 Гц до 22 КГц) та 48000 Гц. Із цим параметром пов'язаний ще один термнін — частота Найквіста, що дорівнює половині частоти дискретизації та визначає максимальну частоту цифрового сигналу (виходячи за цей поріг може виникнути деформація сигналу).<br /> | Для зберігання, обробки та відтворення звуку комп'ютеру необхідно перетворити неперервний сигнал у дискретний. Ця операція називається дискретизацією. Головним її параметром є '''частота дискретизації''', яка визначає кількість сигналів за секунду при перетворенні неперервного сигналу в дискретний. Вимірюється в герцах. Найпопулярніші частоти дискретизації: 44100 Гц (покриває весь діапазон приблизного середнього людського слуху, від 20 Гц до 22 КГц) та 48000 Гц. Із цим параметром пов'язаний ще один термнін — частота Найквіста, що дорівнює половині частоти дискретизації та визначає максимальну частоту цифрового сигналу (виходячи за цей поріг може виникнути деформація сигналу).<br /> | ||
− | |||
Цифрові формати збереження аудіо-даних, що використовують PCM (імпульсно-кодову модуляцію) мають ще однин важливий параметр — '''розрядність''' (bit depth), який визначає ширину діапазону можливих значень кожного семпла аудіо-файлу, а саме кількість бітів, що його визначають. Більша глибина, звичайно, збільшує розмір файлу, але є показником більшого доступного динамічного діапазону. Параметр, що визначає кількість біт, яка передається на одиницю часу називається '''бітрейтом''' (bitrate) і буває статичним (CBR), “плаваючим” (VBR), або усереденим (ABR)<br /> | Цифрові формати збереження аудіо-даних, що використовують PCM (імпульсно-кодову модуляцію) мають ще однин важливий параметр — '''розрядність''' (bit depth), який визначає ширину діапазону можливих значень кожного семпла аудіо-файлу, а саме кількість бітів, що його визначають. Більша глибина, звичайно, збільшує розмір файлу, але є показником більшого доступного динамічного діапазону. Параметр, що визначає кількість біт, яка передається на одиницю часу називається '''бітрейтом''' (bitrate) і буває статичним (CBR), “плаваючим” (VBR), або усереденим (ABR)<br /> | ||
Рядок 23: | Рядок 21: | ||
{| class="wikitable" width="100%" | {| class="wikitable" width="100%" | ||
|- | |- | ||
− | ! Author - Title | + | ! Author - Title (Length)!!original!!128kbps!!256 kbps!!320 kbps |
|- | |- | ||
− | | | + | | Scarlxrd - NX PRESSURE. (02:33)||[https://drive.google.com/open?id=1BkGX-_qwmy2HJm2XHnIJzhSZlMAehGrS original] 56 MB||[https://drive.google.com/open?id=1s6-EUTKHRD5YPgPpGkiTAYYEFG6pxCBS low quality] 2.33 MB||[https://drive.google.com/open?id=1z08BQErZJ7Kn3AflvPEYS7Cz2mVbsKKA medium quality] 4.67 MB||[https://drive.google.com/open?id=1ov1A7rgU1ta7iFTVXitlQLlYorQP886N high quality] 5.84 MB |
|- | |- | ||
− | | | + | | Seether - Same Damn Life (03:19)||[https://drive.google.com/open?id=1nl1HLPsLUZOt7ncIyxUwq4A3945exF-v original] 73.1 MB||[https://drive.google.com/open?id=1X-bz51whEzRvZ3PCSjZkdrUSDoUTUW3X low quality] 3.04 MB||[https://drive.google.com/open?id=1uMHla8jj6OxmOF8OsT9UX1ziN6Bp74xg medium quality] 6.09 MB||[https://drive.google.com/open?id=10TqMHGTIDkHSm_eDYI4uSpH3dfDp5V20 high quality] 6.09 MB |
|- | |- | ||
− | | | + | | Fat Nick & Shakewell - Pemex (02:36)||[https://drive.google.com/open?id=1x46BXANfl4kh6mlEKPmZr1yogcwZeQ4S original] 57.2 MB ||[https://drive.google.com/open?id=1rfBgerwz_U8tZIxHT18iNB0V-WeyrDYE low quality] 2.38 MB||[https://drive.google.com/open?id=1MLoQZUAnGFWwqFCYWjTeuagYFD_rTg66 medium quality] 4.76 MB||[https://drive.google.com/open?id=15d8ANt6z6ZK_2sn7ck6gwi2pGH68OGdA high quality] 7.62 MB |
|} | |} | ||
− | |||
− | |||
==Порівняння якості звуку== | ==Порівняння якості звуку== | ||
128 kbps мають менший розмір за рахунок видалення високих частот в деяких випадках (>16 kHz). Проте, потрібно враховувати тип музики, яка сжимається (багато високих частот, фокус на ударних інструментах) а також вік слухаючого.<br /> | 128 kbps мають менший розмір за рахунок видалення високих частот в деяких випадках (>16 kHz). Проте, потрібно враховувати тип музики, яка сжимається (багато високих частот, фокус на ударних інструментах) а також вік слухаючого.<br /> | ||
При порівнянні представлених композицій я помітив, що при використанні 128 kbps більше чути переходи і місцями музика наче обривається на долю секунди. При прослуховуванні 320 kbps музика звучить плавніше і майже не помітно "обривів".<br /> | При порівнянні представлених композицій я помітив, що при використанні 128 kbps більше чути переходи і місцями музика наче обривається на долю секунди. При прослуховуванні 320 kbps музика звучить плавніше і майже не помітно "обривів".<br /> | ||
Але якщо потрібно визначити різницю між 128, 256 та 320 kbps, то треба використовувати спеціальне обладнання. | Але якщо потрібно визначити різницю між 128, 256 та 320 kbps, то треба використовувати спеціальне обладнання. |
Поточна версія на 16:03, 14 травня 2019
Зміст
Вивчення представлення звуку
Для зберігання, обробки та відтворення звуку комп'ютеру необхідно перетворити неперервний сигнал у дискретний. Ця операція називається дискретизацією. Головним її параметром є частота дискретизації, яка визначає кількість сигналів за секунду при перетворенні неперервного сигналу в дискретний. Вимірюється в герцах. Найпопулярніші частоти дискретизації: 44100 Гц (покриває весь діапазон приблизного середнього людського слуху, від 20 Гц до 22 КГц) та 48000 Гц. Із цим параметром пов'язаний ще один термнін — частота Найквіста, що дорівнює половині частоти дискретизації та визначає максимальну частоту цифрового сигналу (виходячи за цей поріг може виникнути деформація сигналу).
Цифрові формати збереження аудіо-даних, що використовують PCM (імпульсно-кодову модуляцію) мають ще однин важливий параметр — розрядність (bit depth), який визначає ширину діапазону можливих значень кожного семпла аудіо-файлу, а саме кількість бітів, що його визначають. Більша глибина, звичайно, збільшує розмір файлу, але є показником більшого доступного динамічного діапазону. Параметр, що визначає кількість біт, яка передається на одиницю часу називається бітрейтом (bitrate) і буває статичним (CBR), “плаваючим” (VBR), або усереденим (ABR)
Формати для зберігання звуку поділяються на три основних класи: нестисненні формати (можуть мати найбільший розмір у порівнянні із стисненними, але є найбільш подібними до оригінального звуку при записі), стисненні без втрат (lossless, полягають у можливості відтворення нестисненного сигналу без спотворень), стисенні із втратами (lossy, унеможливлюють відтворення оригінального сигналу внаслідок специіальних алгоритмів стиснення, але, зазвичай, мають найменший розмір).
Формати без стиснення
- CD-Audio (Compact Disc Digital Audio) — частота дискретизації 44.1 КГц, розрядність 16 біт, двоканальний.
- WAV (Waveform Audio Format) — можлива частота дискретизації 11.025 - 192.0 КГц, можлива розрядність 8 - 32 біт, число каналів від одного до шести.
- AIFF (Audio Interchange File Format) — можлива частота дискретизації 11.025 - 192.0 КГц, можлива розрядність 8 - 32 біт, число каналів від одного до шести. Використовується переважно із продукцією Apple.
Формати із стисненням без втрат
- FLAC (Free Lossless Audio Codec ) — частота дискретизації 1Гц - 655.350 КГц, можлива розрядність 4 - 32, число каналів від одного до восьми, відкритий та багатоплатформний.
- APE (Monkey's Audio) — частота дискретизації 8 - 96 КГц, можлива розрядність 16, або 24, двоканальний, відкритий.
- ALAC (Apple Lossless Audio Codec) — частота дискретизації 44.1 - 192 КГц, можлива розрядність 16, або 24, підтримка до шести каналів. Основне призначення формату в сумісністності із сервісами Apple, які не підтримуюсь FLAC.
Формати із стисненням з втратами
- MP3 (MPEG-1 Audio Layer 3) — частота дискретизації до 48 КГц, розрядність 16 бітна, двоканальний, бітрейт обмежений діапазоном 8 — 320 кбіт/c.
- OGG (Ogg Vorbis) — частота дискретизації до 192 КГц, розрядність до 32 біт, число каналів до 255, багатоплатформений та більш гнучкий в налаштуванні.
- AAC (Advanced Audio Coding) — частота дискретизації до 192 КГц, число каналів до 48, на останій час є менш популярним форматом у порівнянні із mp3 та ogg.
Author - Title (Length) | original | 128kbps | 256 kbps | 320 kbps |
---|---|---|---|---|
Scarlxrd - NX PRESSURE. (02:33) | original 56 MB | low quality 2.33 MB | medium quality 4.67 MB | high quality 5.84 MB |
Seether - Same Damn Life (03:19) | original 73.1 MB | low quality 3.04 MB | medium quality 6.09 MB | high quality 6.09 MB |
Fat Nick & Shakewell - Pemex (02:36) | original 57.2 MB | low quality 2.38 MB | medium quality 4.76 MB | high quality 7.62 MB |
Порівняння якості звуку
128 kbps мають менший розмір за рахунок видалення високих частот в деяких випадках (>16 kHz). Проте, потрібно враховувати тип музики, яка сжимається (багато високих частот, фокус на ударних інструментах) а також вік слухаючого.
При порівнянні представлених композицій я помітив, що при використанні 128 kbps більше чути переходи і місцями музика наче обривається на долю секунди. При прослуховуванні 320 kbps музика звучить плавніше і майже не помітно "обривів".
Але якщо потрібно визначити різницю між 128, 256 та 320 kbps, то треба використовувати спеціальне обладнання.