Кодери вихідної інформації (вокодер) та гібридні алгоритми

Матеріал з Вікі ЦДУ
Версія від 03:46, 20 листопада 2010; Козінцев Олексій (обговореннявнесок)

(різн.) ← Попередня версія • Поточна версія (різн.) • Новіша версія → (різн.)
Перейти до: навігація, пошук

3.2.2 Кодери вихідної інформації (вокодер) та гібридні алгоритми

Багато методів кодування використовують особливості людської мови, пов'язані з будовою голосового апарату. Кодери, в яких реалізуються такі методи, називають кодерами вихідної інформації або вокодера (voice coding). Звуки мови утворюються при проходженні повітря, що видихається через голосовий апарат людини, найважливішими елементами якого є мова, небо, губи, зуби і голосові зв'язки. У формуванні того чи іншого звуку бере участь та чи інша частина цих елементів. Якщо звук формується за участю голосових зв'язок, потік повітря з легенів викликає їх коливання, що породжує звуковий гон. Послідовність формованих таким чином звуків становить тонову мова (або тоновий сегмент мови). Якщо звук формується байдужості зв'язок, тон у ньому відсутній, і послідовність таких звуків становить нетоновую мова {нетоновий сегмент мови). Спектр тонового звуку може бути змодельований шляхом подачі спеціальним чином сформованого сигналу збудження на вхід цифрового фільтру з параметрами, обумовленими кількома дійсними коефіцієнтами. Спектр нетонових звуків - практично рівномірне, що зумовлено їх шумовим характером. У реальних мовних сигналах не всі звуки можна чітко розділити на тонові і нетоновие, а доводиться мати справу з якимись перехідними варіантами, що ускладнює створення алгоритмів кодування, що забезпечують високу якість передачі мови при низькій швидкості передачі інформації. Рис. 3.5 ілюструє описану спрощену модель функціонування голосового тракту людини. Робота кодера, згідно такої моделі, полягає в тому, щоб, аналізуючи блок відліків мовного сигналу, обчислити параметри відповідного фільтра і параметри збудження (тоновий / нетоновий сегмент мови, частота тону, гучність і т.д.).

VoIP 3.5.png
Рис. 3.5. Модель функціонування голосового тракту


Описаний принцип кодування отримав назву LPC (Linear Prediction Coding - кодування з лінійним передбаченням), оскільки центральним елементом моделі голосового тракту є лінійний фільтр.
Найбільш відомий стандартний алгоритм, побудований за описаним принципом, був стандартизований міністерством оборони США під назвою LPC-10, де число 10 відповідає кількості коефіцієнтів фільтра. Даний кодер забезпечує дуже низьку швидкість передачі інформації 2.4 Кбіт / с, проте якість відтворюваних мовних сигналів залишає бажати кращого і не задовольняє вимогам комерційної мовного зв'язку - мова носить яскраво виражений «синтетичний» характер.
Як вже зазначалося, алгоритми кодування форми сигналу засновані на наявності кореляційних зв'язків між відліками сигналу, які дають можливість лінійного передбачення. У поєднанні з адаптивним квантуванням цей підхід дозволяє забезпечити гарне якість мови при швидкості передачі бітів порядку 24-32 Кбіт / с. LPC-кодери (вокодер) використовують просту математичну модель голосового тракту і дозволяють використовувати дуже низькі швидкості передачі інформації 1200-2400 біт / с, проте ціною «синтетичного» характеру промови.
Гібридні алгоритми кодування та алгоритми типу «аналіз шляхом синтезу» (ABS) являють собою спроби поєднати позитивні властивості двох описаних вище основних підходів та будувати ефективні схеми кодування з діапазоном швидкостей передачі бітів 6-16 кбіт / с.
Важлива відмінність кодерів такого типу полягає в тому, що в рамках цих алгоритмів немає необхідності приймати рішення про тип відтвореного звуку (тоновий або нетоновий), так як передбачаються спеціальні заходи для кодування сигналу помилки після проходження збудження через LPC-фільтр. Наприклад, сигнал помилки може бути закодований за алгоритмом, аналогічного АДІКМ, що забезпечить високу точність його передачі. ABS-кодери не можуть бути строго класифіковані як кодери форми сигналу, проте реально метою процедури мінімізації помилки (рис. 3.6), тобто відмінності між вхідним і синтезованим сигналами, є синтез на виході кодера сигналів, форма яких найбільш близька до форми вхідних. ABS-декодер є малою частиною кодера і дуже простий (рис. 3.7).

VoIP 3.6.png
Рис. 3.6. Спрощена блок-схема ABS-кодера


VoIP 3.7.png
Рис. 3.7. Спрощена блок - схема ABS - декодера


--Козінцев Олексій 36 гр. 14:51, 16 листопада 2010 (EET)