Відмінності між версіями «Кодери вихідної інформації (вокодер) та гібридні алгоритми»

Поточна версія на 03:46, 20 листопада 2010

Технологія VoIP >> Розділ 3. Передача мови по IP-мережі

[ << 3.2.1 Кодування форми сигналу ] [ 3.2.3 Процесори цифрової обробки сигналів для мовних кодеків >> ]

3.2.2 Кодери вихідної інформації (вокодер) та гібридні алгоритми

Багато методів кодування використовують особливості людської мови, пов'язані з будовою голосового апарату. Кодери, в яких реалізуються такі методи, називають кодерами вихідної інформації або вокодера (voice coding). Звуки мови утворюються при проходженні повітря, що видихається через голосовий апарат людини, найважливішими елементами якого є мова, небо, губи, зуби і голосові зв'язки. У формуванні того чи іншого звуку бере участь та чи інша частина цих елементів. Якщо звук формується за участю голосових зв'язок, потік повітря з легенів викликає їх коливання, що породжує звуковий гон. Послідовність формованих таким чином звуків становить тонову мова (або тоновий сегмент мови). Якщо звук формується байдужості зв'язок, тон у ньому відсутній, і послідовність таких звуків становить нетоновую мова {нетоновий сегмент мови). Спектр тонового звуку може бути змодельований шляхом подачі спеціальним чином сформованого сигналу збудження на вхід цифрового фільтру з параметрами, обумовленими кількома дійсними коефіцієнтами. Спектр нетонових звуків - практично рівномірне, що зумовлено їх шумовим характером. У реальних мовних сигналах не всі звуки можна чітко розділити на тонові і нетоновие, а доводиться мати справу з якимись перехідними варіантами, що ускладнює створення алгоритмів кодування, що забезпечують високу якість передачі мови при низькій швидкості передачі інформації. Рис. 3.5 ілюструє описану спрощену модель функціонування голосового тракту людини. Робота кодера, згідно такої моделі, полягає в тому, щоб, аналізуючи блок відліків мовного сигналу, обчислити параметри відповідного фільтра і параметри збудження (тоновий / нетоновий сегмент мови, частота тону, гучність і т.д.).

Рис. 3.5. Модель функціонування голосового тракту

Описаний принцип кодування отримав назву LPC (Linear Prediction Coding - кодування з лінійним передбаченням), оскільки центральним елементом моделі голосового тракту є лінійний фільтр.
Найбільш відомий стандартний алгоритм, побудований за описаним принципом, був стандартизований міністерством оборони США під назвою LPC-10, де число 10 відповідає кількості коефіцієнтів фільтра. Даний кодер забезпечує дуже низьку швидкість передачі інформації 2.4 Кбіт / с, проте якість відтворюваних мовних сигналів залишає бажати кращого і не задовольняє вимогам комерційної мовного зв'язку - мова носить яскраво виражений «синтетичний» характер.
Як вже зазначалося, алгоритми кодування форми сигналу засновані на наявності кореляційних зв'язків між відліками сигналу, які дають можливість лінійного передбачення. У поєднанні з адаптивним квантуванням цей підхід дозволяє забезпечити гарне якість мови при швидкості передачі бітів порядку 24-32 Кбіт / с. LPC-кодери (вокодер) використовують просту математичну модель голосового тракту і дозволяють використовувати дуже низькі швидкості передачі інформації 1200-2400 біт / с, проте ціною «синтетичного» характеру промови.
Гібридні алгоритми кодування та алгоритми типу «аналіз шляхом синтезу» (ABS) являють собою спроби поєднати позитивні властивості двох описаних вище основних підходів та будувати ефективні схеми кодування з діапазоном швидкостей передачі бітів 6-16 кбіт / с.
Важлива відмінність кодерів такого типу полягає в тому, що в рамках цих алгоритмів немає необхідності приймати рішення про тип відтвореного звуку (тоновий або нетоновий), так як передбачаються спеціальні заходи для кодування сигналу помилки після проходження збудження через LPC-фільтр. Наприклад, сигнал помилки може бути закодований за алгоритмом, аналогічного АДІКМ, що забезпечить високу точність його передачі. ABS-кодери не можуть бути строго класифіковані як кодери форми сигналу, проте реально метою процедури мінімізації помилки (рис. 3.6), тобто відмінності між вхідним і синтезованим сигналами, є синтез на виході кодера сигналів, форма яких найбільш близька до форми вхідних. ABS-декодер є малою частиною кодера і дуже простий (рис. 3.7).

Рис. 3.6. Спрощена блок-схема ABS-кодера

Рис. 3.7. Спрощена блок - схема ABS - декодера

[ << 3.2.1 Кодування форми сигналу ] [ 3.2.3 Процесори цифрової обробки сигналів для мовних кодеків >> ]

--Козінцев Олексій 36 гр. 14:51, 16 листопада 2010 (EET)

@@ Рядок 1: / Рядок 1: @@
 <div style="background: #33ccff">
-'''Технологія VoIP'''
+'''[[Технологія VoIP]]''' >>
-<div style="background: #323ffbb">'''Розділ 3. Передача мови по IP-мережі'''</div>
+'''[[Розділ_3._Передача_мови_по_IP-мережі|Розділ 3. Передача мови по IP-мережі]]'''
 <center>
-[[Кодування форми сигналу|<< 3.2.1 Кодування форми сигналу]]
+----
-[[Розділ_3._Передача_мови_по_IP-мережі|Розділ 3.(Зміст)]]
+[ [[Кодування форми сигналу|<< 3.2.1 Кодування форми сигналу]] ]
-[[Процесори цифрової обробки сигналів для мовних кодеків|3.2.3 Процесори цифрової обробки сигналів для мовних кодеків  >>]]
+[ [[Процесори цифрової обробки сигналів для мовних кодеків|3.2.3 Процесори цифрової обробки сигналів для мовних кодеків  >>]] ]
+----
 </center>
 </div>
-----
 == '''3.2.2 Кодери вихідної інформації (вокодер) та гібридні алгоритми''' ==
 Багато методів кодування використовують особливості людської мови, пов'язані з будовою голосового апарату. Кодери, в яких реалізуються такі методи, називають кодерами вихідної інформації або вокодера (voice coding).
 Звуки мови утворюються при проходженні повітря, що видихається через голосовий апарат людини, найважливішими елементами якого є мова, небо, губи, зуби і голосові зв'язки. У формуванні того чи іншого звуку бере участь та чи інша частина цих елементів. Якщо звук формується за участю голосових зв'язок, потік повітря з легенів викликає їх коливання, що породжує звуковий гон. Послідовність формованих таким чином звуків становить тонову мова (або тоновий сегмент мови). Якщо звук формується байдужості зв'язок, тон у ньому відсутній, і послідовність таких звуків становить нетоновую мова {нетоновий сегмент мови). Спектр тонового звуку може бути змодельований шляхом подачі спеціальним чином сформованого сигналу збудження на вхід цифрового фільтру з параметрами, обумовленими кількома дійсними коефіцієнтами. Спектр нетонових звуків - практично рівномірне, що зумовлено їх шумовим характером.
@@ Рядок 33: / Рядок 31: @@
 </center><br>
 <div style="background: #33ccff">
 <center>
-[[Кодування форми сигналу|<< 3.2.1 Кодування форми сигналу]]
+----
-[[Розділ_3._Передача_мови_по_IP-мережі|Розділ 3.(Зміст)]]
+[ [[Кодування форми сигналу|<< 3.2.1 Кодування форми сигналу]] ]
-[[Процесори цифрової обробки сигналів для мовних кодеків|3.2.3 Процесори цифрової обробки сигналів для мовних кодеків  >>]]
+[ [[Процесори цифрової обробки сигналів для мовних кодеків|3.2.3 Процесори цифрової обробки сигналів для мовних кодеків  >>]] ]
+----
 </center>
 </div>
-----
 --[[Користувач:Козінцев Олексій|Козінцев Олексій  36 гр.]] 14:51, 16 листопада 2010 (EET)

Відмінності між версіями «Кодери вихідної інформації (вокодер) та гібридні алгоритми»

Поточна версія на 03:46, 20 листопада 2010

3.2.2 Кодери вихідної інформації (вокодер) та гібридні алгоритми

Навігаційне меню

Перегляди

Особисті інструменти

Навігація

Пошук

Інструменти

портфоліо