Відмінності між версіями «Обробка зображень лабораторна №5 Федорова Анастасія»

Матеріал з Вікі ЦДУ
Перейти до: навігація, пошук
(Порівняння якості звуку в отриманих файлах)
(Порівняння якості звуку в отриманих файлах)
 
(не показано 7 проміжних версій цього учасника)
Рядок 1: Рядок 1:
 
==Формати звукових файлів==
 
==Формати звукових файлів==
 
+
Існує три основні групи аудіофайлів:<br />
 +
* нестиснені формати — такі як WAV, AIFF, AU або PCM;
 +
* формати із стисненням без втрат — FLAC, Monkey's Audio (розширення APE), Shorten, Tom's lossless Audio Kompressor (TAK), TTA, ATRAC Advanced Lossless, Apple Lossless, MPEG-4 SLS, MPEG-4 ALS, MPEG-4 DST, Windows Media Audio Lossless (WMA Lossless).
 +
* формати із стисненням з втратами, як наприклад MP3, Ogg Vorbis, Musepack, AAC, ATRAC чи lossy Windows Media Audio (WMA).
 
===Формати аудіо без стиснення===
 
===Формати аудіо без стиснення===
 +
====WAV====
 +
WAV (англ. waveform audio format) — формат аудіофайла розроблений компаніями Microsoft та IBM. WAVE базується на форматі RIFF, поширюючи його на інформацію про такі параметри аудіо, як застосований кодек, частота дискретизації та кількість каналів. WAV як і RIFF передбачався для комп'ютерів IBM PC, тому всі змінні записані у форматі little endian. Відповідником WAV для комп'ютерів PowerPC є AIFF.
 +
Хоча файли WAVE можуть бути записані за допомогою будь-яких кодеків аудіо, зазвичай використовується нестиснений PCM, який призводить до великих обсягів файлу (близько 172 кБ на секунду для CD-якості). Іншим недоліком файлу є обмеження обсягу до 4 ГБ, через 32-бітну змінну. Формат WAV був частково витіснений стисненими форматами, проте, завдяки своїй простоті, надалі знаходить широке використання в процесі редагування звуку та на переносних аудіопристроях, як програвачі та цифрові диктофони.
 +
====AU====
 +
Формат файлу Au - простий формат аудіофайлів, уведений Sun Microsystems. Формат був поширений на NeXT системах і на ранніх веб-сторінках. Спочатку це були 8-бітові, кодовані за μ-законом, дані без заголовків, на частоті дискретизації 8000 Гц. Обладнання інших виробників часто використовували частоту дискретизації 8192 Гц, кратну тактовим сигналам відео. Нові файли мають заголовок, що складається з шести непідписаних 32-бітових слів, додаткову інформацію, а потім дані (у великому форматі зворотний порядок байт).
 +
Хоча формат тепер підтримує безліч аудіо форматів кодування, він залишається пов'язаним з логарифмічним кодуванням за μ-законом. Це кодування й інтерфейс стали стандартом де-факто для Unix звуку.
 +
====PCM====
 +
І́мпульсно-ко́дова модуля́ція (ІКМ або PCM — англ. Pulse Code Modulation) - процес перетворення аналогового сигналу у цифровий сигнал, коли через певні інтервали часу беруться відліки аналогового сигналу і незалежно один від одного квантуються і далі кодуються цифрами[1]. ІКМ використовується для оцифровки аналогових сигналів перед їхньою передачею. Практично всі види аналогових даних (відео, голос, музика, дані телеметрії) допускають застосування ІК-модуляції.
 
===Формати аудіо зі стисненням без втрат===
 
===Формати аудіо зі стисненням без втрат===
 +
====WMA (Windows Media Audio)====
 +
Ліцензований формат файла, розроблений компанією Microsoft для зберігання і трансляції аудіо-інформації. <br>
 +
Номінально формат WMA характеризується гарною здатністю стискання даних, що дозволяє йому «обходити» формат Mp3 і конкурувати по цих параметрах з форматами Ogg vorbis і AAC.
 +
====FLAC (Free Lossless Audio Codec)====
 +
FLAC є вільним форматом: його використання не вимагає виплат роялті, специфікації є відкритими та його основна реалізація є вільним програмним забезпеченням. <br>
 +
При розпакуванні звукові дані залишаються повністю ідентичним до початкового файлу перед стисненням.
 +
====APE (Monkey's Audio)====
 +
Поширюється безкоштовно разом з відкритим вихідним кодом і набором програмного забезпечення для кодування і відтворення, а також плагінами до популярних плеєрів. <br>
 +
Офіційно кодек Monkey's Audio випускається тільки для платформи Windows, хоча існує ряд неофіційних кодеків для GNU/Linux й Mac OS X, які в більшості випадків дозволяють лише стискати файли, перетворюючи їх в інший формат.
 +
 
===Формати аудіо зі стисненням з втратами===
 
===Формати аудіо зі стисненням з втратами===
 +
====MP3====
 +
MP3 — формат файлу для зберігання аудіо-інформації. Розроблений наприкінці 1980-тих років Карлгайнцем Бранденбургом, аспірантом Університету Ерлангена—Нюрнберга, Німеччина. Формат був ліцензованим, але 23 квітня 2017 року термін дії всіх патентів сплив і ліцензійні збори скасовано. Широко використовується в файлообмінних мережах для передачі музичних творів. Базується на теоремі Котельникова-Шеннона. Є форматом стиснення з втратами, тобто частина звукової інформації, яку вухо людини майже не сприймає, безповоротно видаляється з запису. Розробка цього формату була пов'язана з тим, що файл формату Audio-CD — дуже великий за розміром (1 хвилина ~ 10-15 Мб інформації), і для пересилання в інтернеті був дуже незручним. Тому треба було зменшити розмір файла та зберегти якість звучання.
 +
====AAC====
 +
AAC (англ. Advanced Audio Coding) — стандартна схема стиснення із втратами для аудіоданих. AAC розроблена як альтернатива форматам mp3 його розробником, Fraunhofer IIS. На 2007 рік поширений менше ніж mp3 і ogg vorbis. З'явився у 1997 році.
 +
* Підтримка частоти дискретизації від 8 кГц до 96 кГц (MP3: 8 кГц — 48 кГц)
 +
* До 48 звукових каналів
 +
* Більша ефективність кодування при постійному звуковому потоці
 +
* Більша ефективність кодування при змінюваному звуковому потоці
 +
* Гнучкіший Joint stereo
 +
Все це означає, що слухач одержує поліпшену й стабільнішу якість звуку, ніж при Mp3 з таким самим або меншим бітрейтом.
 +
====Musepack====
 +
MusePack (mpp, mp+, mpc, MPEG+) — неліцензований формат файлу для зберігання аудіо, розповсюджуваний за GNU General Public License.
 +
Якість кодування MPC на високих бітрейтах (160 Кбіт/с і вище) є помітно (якщо не значно) вищою за якість MP3. При кодуванні використовується інший психоакустичний алгоритм стиснення, у mpc не втрачаються частоти, які MP3-кодери ігнорують, оскільки на їх думку їх все одно не буде чути.
 +
Основна особливість — точна настройка психоакустики, що дозволяє працювати з чистим VBR-кодуванням (кодування зі змінним бітрейтом). Основним завданням Musepack є прозорість звучання закодованої музики.
 +
 
==3 улюблені музикальні композиції в некомпресованому форматі==
 
==3 улюблені музикальні композиції в некомпресованому форматі==
[https://drive.google.com/open?id=1EzXB4Jg44xxciToES2x53HVQ6eulugIH Imagine Dragons - Natural]<br />
+
[https://drive.google.com/open?id=113IXTHahm_T6jAtZv2vQIbunfUknwvYZ Imagine Dragons - Natural]<br />
[https://drive.google.com/open?id=1g7xX8CCby6uzpzVobTtkYLbfm4w0KCWX Imagine Dragons - Whatever it takes ]<br />
+
[https://drive.google.com/open?id=1SxklwLY2v-8qj6jrfJvn3RbxbwFn-hss Imagine Dragons - Whatever it takes ]<br />
[https://drive.google.com/open?id=1FpwShJBSOz_uwps_2RcDuSNfPAxhte6X OneRepublic - Counting stars]
+
[https://drive.google.com/open?id=1zy3VQxljAPrUnH7Mi_HfyKrEYyYTNKPu OneRepublic - Counting stars]
  
 
==Компресування композицій з бітрейдом від 128 до 320 Кбіт на сек.==
 
==Компресування композицій з бітрейдом від 128 до 320 Кбіт на сек.==
Стандартна якість (128 Кбіт на сек.):
+
===Стандартна якість (128 Кбіт на сек.)===
 
+
[https://drive.google.com/open?id=1ArKpLT4lv9CRfG0PlAOkXJ6ehQv6TMK3 Imagine Dragons - Natural]<br />
Середня якість (192 Кбіт на сек.):
+
[https://drive.google.com/open?id=1zAMqNN9ksVuDM7VsLA1uEI1-K_G3A-dU Imagine Dragons - Whatever it takes]<br />
 
+
[https://drive.google.com/open?id=1cj2-xmmF8Lb7uyVH_reVtgQWYeaLSL4R OneRepublic - Counting stars]
Найвища якість (320 Кбіт на сек.):
+
===Середня якість (192 Кбіт на сек.)===
 +
[https://drive.google.com/open?id=1jy71QgAOdnUTc9T-oho-ELEDPtuBbmmU Imagine Dragons - Natural]<br />
 +
[https://drive.google.com/open?id=175xu_DfPS0zqNQRJkyFC19cEjE94Hm-U Imagine Dragons - Whatever it takes]<br />
 +
[https://drive.google.com/open?id=1aYsbCjJFVd9BLvDapfbgadxH95xVJyU_ OneRepublic - Counting stars]
 +
===Найвища якість (320 Кбіт на сек.)===
 +
[https://drive.google.com/open?id=1FhtOpySn6MT0X7ZjovqZR6W31yjpUTAU Imagine Dragons - Natural]<br />
 +
[https://drive.google.com/open?id=1A4zVYfPQfIndegl8t30A09Mys9PCZwyM Imagine Dragons - Whatever it takes]<br />
 +
[https://drive.google.com/open?id=1MNZVIt7qkc_-JgSNy8-n0Ag37rAjEn3t OneRepublic - Counting stars]
  
 
==Порівняння якості звуку в отриманих файлах==
 
==Порівняння якості звуку в отриманих файлах==
Рядок 23: Рядок 66:
 
| '''Формат композиції'''
 
| '''Формат композиції'''
 
| '''Бітрейд'''
 
| '''Бітрейд'''
| '''Довжина копозиції '''
+
| '''Довжина композиції '''
 
| '''Розмір композиції (Мб)'''
 
| '''Розмір композиції (Мб)'''
 
|-
 
|-
Рядок 31: Рядок 74:
 
| некомпресований формат
 
| некомпресований формат
 
! rowspan="4"| 00:03:08
 
! rowspan="4"| 00:03:08
| 7,19
+
| 31,7
 
|-
 
|-
 
| 128
 
| 128
Рядок 46: Рядок 89:
 
| некомпресований формат
 
| некомпресований формат
 
! rowspan="4"| 00:03:21
 
! rowspan="4"| 00:03:21
| 8,35
+
| 33,9
 
|-
 
|-
 
| 128
 
| 128
Рядок 61: Рядок 104:
 
| некомпресований формат
 
| некомпресований формат
 
! rowspan="4"| 00:04:16
 
! rowspan="4"| 00:04:16
| 9,84
+
| 43,1
 
|-
 
|-
 
| 128
 
| 128
Рядок 75: Рядок 118:
  
 
==Висновок==
 
==Висновок==
 +
Отже,чим вищий бітрейд композиції, тим краща якість звуку, тому відповідно розмір композиції з кращим звучанням буде більшим.

Поточна версія на 12:02, 17 квітня 2019

Формати звукових файлів

Існує три основні групи аудіофайлів:

  • нестиснені формати — такі як WAV, AIFF, AU або PCM;
  • формати із стисненням без втрат — FLAC, Monkey's Audio (розширення APE), Shorten, Tom's lossless Audio Kompressor (TAK), TTA, ATRAC Advanced Lossless, Apple Lossless, MPEG-4 SLS, MPEG-4 ALS, MPEG-4 DST, Windows Media Audio Lossless (WMA Lossless).
  • формати із стисненням з втратами, як наприклад MP3, Ogg Vorbis, Musepack, AAC, ATRAC чи lossy Windows Media Audio (WMA).

Формати аудіо без стиснення

WAV

WAV (англ. waveform audio format) — формат аудіофайла розроблений компаніями Microsoft та IBM. WAVE базується на форматі RIFF, поширюючи його на інформацію про такі параметри аудіо, як застосований кодек, частота дискретизації та кількість каналів. WAV як і RIFF передбачався для комп'ютерів IBM PC, тому всі змінні записані у форматі little endian. Відповідником WAV для комп'ютерів PowerPC є AIFF. Хоча файли WAVE можуть бути записані за допомогою будь-яких кодеків аудіо, зазвичай використовується нестиснений PCM, який призводить до великих обсягів файлу (близько 172 кБ на секунду для CD-якості). Іншим недоліком файлу є обмеження обсягу до 4 ГБ, через 32-бітну змінну. Формат WAV був частково витіснений стисненими форматами, проте, завдяки своїй простоті, надалі знаходить широке використання в процесі редагування звуку та на переносних аудіопристроях, як програвачі та цифрові диктофони.

AU

Формат файлу Au - простий формат аудіофайлів, уведений Sun Microsystems. Формат був поширений на NeXT системах і на ранніх веб-сторінках. Спочатку це були 8-бітові, кодовані за μ-законом, дані без заголовків, на частоті дискретизації 8000 Гц. Обладнання інших виробників часто використовували частоту дискретизації 8192 Гц, кратну тактовим сигналам відео. Нові файли мають заголовок, що складається з шести непідписаних 32-бітових слів, додаткову інформацію, а потім дані (у великому форматі зворотний порядок байт). Хоча формат тепер підтримує безліч аудіо форматів кодування, він залишається пов'язаним з логарифмічним кодуванням за μ-законом. Це кодування й інтерфейс стали стандартом де-факто для Unix звуку.

PCM

І́мпульсно-ко́дова модуля́ція (ІКМ або PCM — англ. Pulse Code Modulation) - процес перетворення аналогового сигналу у цифровий сигнал, коли через певні інтервали часу беруться відліки аналогового сигналу і незалежно один від одного квантуються і далі кодуються цифрами[1]. ІКМ використовується для оцифровки аналогових сигналів перед їхньою передачею. Практично всі види аналогових даних (відео, голос, музика, дані телеметрії) допускають застосування ІК-модуляції.

Формати аудіо зі стисненням без втрат

WMA (Windows Media Audio)

Ліцензований формат файла, розроблений компанією Microsoft для зберігання і трансляції аудіо-інформації.
Номінально формат WMA характеризується гарною здатністю стискання даних, що дозволяє йому «обходити» формат Mp3 і конкурувати по цих параметрах з форматами Ogg vorbis і AAC.

FLAC (Free Lossless Audio Codec)

FLAC є вільним форматом: його використання не вимагає виплат роялті, специфікації є відкритими та його основна реалізація є вільним програмним забезпеченням.
При розпакуванні звукові дані залишаються повністю ідентичним до початкового файлу перед стисненням.

APE (Monkey's Audio)

Поширюється безкоштовно разом з відкритим вихідним кодом і набором програмного забезпечення для кодування і відтворення, а також плагінами до популярних плеєрів.
Офіційно кодек Monkey's Audio випускається тільки для платформи Windows, хоча існує ряд неофіційних кодеків для GNU/Linux й Mac OS X, які в більшості випадків дозволяють лише стискати файли, перетворюючи їх в інший формат.

Формати аудіо зі стисненням з втратами

MP3

MP3 — формат файлу для зберігання аудіо-інформації. Розроблений наприкінці 1980-тих років Карлгайнцем Бранденбургом, аспірантом Університету Ерлангена—Нюрнберга, Німеччина. Формат був ліцензованим, але 23 квітня 2017 року термін дії всіх патентів сплив і ліцензійні збори скасовано. Широко використовується в файлообмінних мережах для передачі музичних творів. Базується на теоремі Котельникова-Шеннона. Є форматом стиснення з втратами, тобто частина звукової інформації, яку вухо людини майже не сприймає, безповоротно видаляється з запису. Розробка цього формату була пов'язана з тим, що файл формату Audio-CD — дуже великий за розміром (1 хвилина ~ 10-15 Мб інформації), і для пересилання в інтернеті був дуже незручним. Тому треба було зменшити розмір файла та зберегти якість звучання.

AAC

AAC (англ. Advanced Audio Coding) — стандартна схема стиснення із втратами для аудіоданих. AAC розроблена як альтернатива форматам mp3 його розробником, Fraunhofer IIS. На 2007 рік поширений менше ніж mp3 і ogg vorbis. З'явився у 1997 році.

  • Підтримка частоти дискретизації від 8 кГц до 96 кГц (MP3: 8 кГц — 48 кГц)
  • До 48 звукових каналів
  • Більша ефективність кодування при постійному звуковому потоці
  • Більша ефективність кодування при змінюваному звуковому потоці
  • Гнучкіший Joint stereo

Все це означає, що слухач одержує поліпшену й стабільнішу якість звуку, ніж при Mp3 з таким самим або меншим бітрейтом.

Musepack

MusePack (mpp, mp+, mpc, MPEG+) — неліцензований формат файлу для зберігання аудіо, розповсюджуваний за GNU General Public License. Якість кодування MPC на високих бітрейтах (160 Кбіт/с і вище) є помітно (якщо не значно) вищою за якість MP3. При кодуванні використовується інший психоакустичний алгоритм стиснення, у mpc не втрачаються частоти, які MP3-кодери ігнорують, оскільки на їх думку їх все одно не буде чути. Основна особливість — точна настройка психоакустики, що дозволяє працювати з чистим VBR-кодуванням (кодування зі змінним бітрейтом). Основним завданням Musepack є прозорість звучання закодованої музики.

3 улюблені музикальні композиції в некомпресованому форматі

Imagine Dragons - Natural
Imagine Dragons - Whatever it takes
OneRepublic - Counting stars

Компресування композицій з бітрейдом від 128 до 320 Кбіт на сек.

Стандартна якість (128 Кбіт на сек.)

Imagine Dragons - Natural
Imagine Dragons - Whatever it takes
OneRepublic - Counting stars

Середня якість (192 Кбіт на сек.)

Imagine Dragons - Natural
Imagine Dragons - Whatever it takes
OneRepublic - Counting stars

Найвища якість (320 Кбіт на сек.)

Imagine Dragons - Natural
Imagine Dragons - Whatever it takes
OneRepublic - Counting stars

Порівняння якості звуку в отриманих файлах

Назва композиції Виконавець Формат композиції Бітрейд Довжина композиції Розмір композиції (Мб)
Natural Imagine Dragons MP3 некомпресований формат 00:03:08 31,7
128 2,88
192 4,31
320 7,19
Whatever it takes Imagine Dragons некомпресований формат 00:03:21 33,9
128 3,08
192 4,61
320 7,69
Counting stars OneRepublic некомпресований формат 00:04:16 43,1
128 3,91
192 5,87
320 9,78

Висновок

Отже,чим вищий бітрейд композиції, тим краща якість звуку, тому відповідно розмір композиції з кращим звучанням буде більшим.