Відмінності між версіями «Процесори цифрової обробки сигналів для мовних кодеків»

Матеріал з Вікі ЦДУ
Перейти до: навігація, пошук
(Створена сторінка: <div style="background: #33ccff"> '''Технологія VoIP''' <div style="background: #323ffbb">'''Розділ 3. Передача мови по IP-мере...)
 
Рядок 10: Рядок 10:
 
----
 
----
  
== '''3.2.2 Кодери вихідної інформації (вокодер) та гібридні алгоритми''' ==
+
== '''3.2.3 Процесори цифрової обробки сигналів для мовних кодеків''' ==
 
+
Багато методів кодування використовують особливості людської мови, пов'язані з будовою голосового апарату. Кодери, в яких реалізуються такі методи, називають кодерами вихідної інформації або вокодера (voice coding).
+
Звуки мови утворюються при проходженні повітря, що видихається через голосовий апарат людини, найважливішими елементами якого є мова, небо, губи, зуби і голосові зв'язки. У формуванні того чи іншого звуку бере участь та чи інша частина цих елементів. Якщо звук формується за участю голосових зв'язок, потік повітря з легенів викликає їх коливання, що породжує звуковий гон. Послідовність формованих таким чином звуків становить тонову мова (або тоновий сегмент мови). Якщо звук формується байдужості зв'язок, тон у ньому відсутній, і послідовність таких звуків становить нетоновую мова {нетоновий сегмент мови). Спектр тонового звуку може бути змодельований шляхом подачі спеціальним чином сформованого сигналу збудження на вхід цифрового фільтру з параметрами, обумовленими кількома дійсними коефіцієнтами. Спектр нетонових звуків - практично рівномірне, що зумовлено їх шумовим характером.
+
У реальних мовних сигналах не всі звуки можна чітко розділити на тонові і нетоновие, а доводиться мати справу з якимись перехідними варіантами, що ускладнює створення алгоритмів кодування, що забезпечують високу якість передачі мови при низькій швидкості передачі інформації.
+
Рис. 3.5 ілюструє описану спрощену модель функціонування голосового тракту людини. Робота кодера, згідно такої моделі, полягає в тому, щоб, аналізуючи блок відліків мовного сигналу, обчислити параметри відповідного фільтра і параметри збудження (тоновий / нетоновий сегмент мови, частота тону, гучність і т.д.).
+
<center>
+
[[Файл:VoIP_3.5.png]]<br>
+
'''Рис. 3.5.''' Модель функціонування голосового тракту
+
</center><br>
+
Описаний принцип кодування отримав назву LPC (Linear Prediction Coding - кодування з лінійним передбаченням), оскільки центральним елементом моделі голосового тракту є лінійний фільтр. <br>Найбільш відомий стандартний алгоритм, побудований за описаним принципом, був стандартизований міністерством оборони США під назвою LPC-10, де число 10 відповідає кількості коефіцієнтів фільтра. Даний кодер забезпечує дуже низьку швидкість передачі інформації 2.4 Кбіт / с, проте якість відтворюваних мовних сигналів залишає бажати кращого і не задовольняє вимогам комерційної мовного зв'язку - мова носить яскраво виражений «синтетичний» характер.<br>
+
Як вже зазначалося, алгоритми кодування форми сигналу засновані на наявності кореляційних зв'язків між відліками сигналу, які дають можливість лінійного передбачення. У поєднанні з адаптивним квантуванням цей підхід дозволяє забезпечити гарне якість мови при швидкості передачі бітів порядку 24-32 Кбіт / с. LPC-кодери (вокодер) використовують просту математичну модель голосового тракту і дозволяють використовувати дуже низькі швидкості передачі інформації 1200-2400 біт / с, проте ціною «синтетичного» характеру промови.<br>
+
Гібридні алгоритми кодування та алгоритми типу «аналіз шляхом синтезу» (ABS) являють собою спроби поєднати позитивні властивості двох описаних вище основних підходів та будувати ефективні схеми кодування з діапазоном швидкостей передачі бітів 6-16 кбіт / с.<br>
+
Важлива відмінність кодерів такого типу полягає в тому, що в рамках цих алгоритмів немає необхідності приймати рішення про тип відтвореного звуку (тоновий або нетоновий), так як передбачаються спеціальні заходи для кодування сигналу помилки після проходження збудження через LPC-фільтр. Наприклад, сигнал помилки може бути закодований за алгоритмом, аналогічного АДІКМ, що забезпечить високу точність його передачі. ABS-кодери не можуть бути строго класифіковані як кодери форми сигналу, проте реально метою процедури мінімізації помилки (рис. 3.6), тобто відмінності між вхідним і синтезованим сигналами, є синтез на виході кодера сигналів, форма яких найбільш близька до форми вхідних. ABS-декодер є малою частиною кодера і дуже простий (рис. 3.7).<br>
+
<center>
+
[[Файл:VoIP_3.6.png]]<br>
+
'''Рис. 3.6.''' Спрощена блок-схема ABS-кодера
+
</center><br>
+
<center>
+
[[Файл:VoIP_3.7.png]]<br>
+
'''Рис. 3.7.''' Спрощена блок - схема ABS - декодера
+
</center><br>
+
<div style="background: #33ccff">
+
  
 +
Вузькополосному кодуванню мовних сигналів дорогу на ринок комерційних додатків відкрило розвиток мікроелектроніки та, зокрема, поява дешевих процесорів цифрової обробки сигналів (DSP - Digital Signal Processor) в інтегральному виконанні. До цього цифрова обробка сигналів (у тому числі, вузькосмугового кодування мови) була долею розробників апаратури для потреб армії і спецслужб.<br>
 +
Процесори DSP мають архітектуру, оптимізовану для виконання операцій, які характерні для типових алгоритмів обробки сигналів. В якості прикладів таких операцій можна назвати множення з накопиченням, а також вибірку операндів з біт-інверсної адресацією, необхідну для виконання швидкого перетворення Фур'є.<br>
 +
Архітектура процесорів DSP часто характеризується наявністю декількох обчислювальних блоків, які забезпечують виконання одночасних операцій в одному такті роботи процесора. Для завантаження обчислювальних блоків даними передбачається декілька шин передачі даних і багатопортовий пам'ять даних. Для збільшення продуктивності пам'ять інструкцій і пам'ять даних розділені, а доступ до них здійснюється також за роздільним шинам. Для процесорів DSP характерне використання інструкцій збільшеної довжини, що містять поля для управління всіма обчислювальними блоками.<br>
 +
Фізично процесори DSP виконуються у вигляді інтегральних мікросхем, що містять в одному кристалі ядро процесора, пам'ять і периферійні пристрої для обміну інформацією. Наявність вбудованої пам'яті забезпечує швидкий доступ ядра до її вмісту для отримання максимальної продуктивності.<br>
 +
Існує безліч модифікацією процесорів DSP, що розрізняються продуктивністю, обсягом пам'яті, споживаної потужністю. В обладнанні IP-телефонії використовуються дешеві процесори з середньою продуктивністю і малою споживаною потужністю, орієнтовані на реалізацію малого числа (одиниці) каналів обробки мовної інформації та застосовуються, в основному, у складі термінальних пристроїв, або потужні високопродуктивні процесори, орієнтовані на багатоканальні (десятки каналів ) додатки і використовувані в складі таких групових пристроїв як багатоканальні шлюзи IP-телефонії, що підключаються до ТМЗК по цифрових трактах Е1.<br>
 +
Одними з найбільш відомих виробників DSP є фірми Texas Instruments (www.ti.com). Analog Devices (www.analog.com). Motorola (www.motorola.com). на сайтах яких можна отримати додаткову інформацію про номенклатуру DSP і про їх застосування.<br>
 +
Обладнання ПРОТИ-1Р використовує DSP з ліцензованим в однієї з провідних в даний ської області фірм програмним забезпеченням, що реалізує необхідні алгоритми (мовні кодеки, факс, модем). Це дозволило, спираючись на існуючий досвід, різко скоротити час виходу обладнання на ринок. Крім того, в даному випадку виключається трудомістка і тривала процедура ліцензування алгоритмів мовних кодеків (G.723.1, G.729), що вимагає значних одноразових фінансових витрат. За таким самим шляхом ідуть і провідні світові виробники обладнання VolP (Cisco, Dialogic та ін), ліцензуючи програмне забезпечення DSP у компаній, що спеціалізуються саме в цій області, і концентруючи свої сили на реалізації тих функцій, які традиційно забезпечують даними виробникам устаткування технологічне лідерство .<br>
 
<center>
 
<center>
 
[[Кодери вихідної інформації (вокодер) та гібридні алгоритми|<< 3.2.2 Кодери вихідної інформації (вокодер) та гібридні алгоритми]]
 
[[Кодери вихідної інформації (вокодер) та гібридні алгоритми|<< 3.2.2 Кодери вихідної інформації (вокодер) та гібридні алгоритми]]

Версія за 14:56, 16 листопада 2010


3.2.3 Процесори цифрової обробки сигналів для мовних кодеків

Вузькополосному кодуванню мовних сигналів дорогу на ринок комерційних додатків відкрило розвиток мікроелектроніки та, зокрема, поява дешевих процесорів цифрової обробки сигналів (DSP - Digital Signal Processor) в інтегральному виконанні. До цього цифрова обробка сигналів (у тому числі, вузькосмугового кодування мови) була долею розробників апаратури для потреб армії і спецслужб.
Процесори DSP мають архітектуру, оптимізовану для виконання операцій, які характерні для типових алгоритмів обробки сигналів. В якості прикладів таких операцій можна назвати множення з накопиченням, а також вибірку операндів з біт-інверсної адресацією, необхідну для виконання швидкого перетворення Фур'є.
Архітектура процесорів DSP часто характеризується наявністю декількох обчислювальних блоків, які забезпечують виконання одночасних операцій в одному такті роботи процесора. Для завантаження обчислювальних блоків даними передбачається декілька шин передачі даних і багатопортовий пам'ять даних. Для збільшення продуктивності пам'ять інструкцій і пам'ять даних розділені, а доступ до них здійснюється також за роздільним шинам. Для процесорів DSP характерне використання інструкцій збільшеної довжини, що містять поля для управління всіма обчислювальними блоками.
Фізично процесори DSP виконуються у вигляді інтегральних мікросхем, що містять в одному кристалі ядро процесора, пам'ять і периферійні пристрої для обміну інформацією. Наявність вбудованої пам'яті забезпечує швидкий доступ ядра до її вмісту для отримання максимальної продуктивності.
Існує безліч модифікацією процесорів DSP, що розрізняються продуктивністю, обсягом пам'яті, споживаної потужністю. В обладнанні IP-телефонії використовуються дешеві процесори з середньою продуктивністю і малою споживаною потужністю, орієнтовані на реалізацію малого числа (одиниці) каналів обробки мовної інформації та застосовуються, в основному, у складі термінальних пристроїв, або потужні високопродуктивні процесори, орієнтовані на багатоканальні (десятки каналів ) додатки і використовувані в складі таких групових пристроїв як багатоканальні шлюзи IP-телефонії, що підключаються до ТМЗК по цифрових трактах Е1.
Одними з найбільш відомих виробників DSP є фірми Texas Instruments (www.ti.com). Analog Devices (www.analog.com). Motorola (www.motorola.com). на сайтах яких можна отримати додаткову інформацію про номенклатуру DSP і про їх застосування.
Обладнання ПРОТИ-1Р використовує DSP з ліцензованим в однієї з провідних в даний ської області фірм програмним забезпеченням, що реалізує необхідні алгоритми (мовні кодеки, факс, модем). Це дозволило, спираючись на існуючий досвід, різко скоротити час виходу обладнання на ринок. Крім того, в даному випадку виключається трудомістка і тривала процедура ліцензування алгоритмів мовних кодеків (G.723.1, G.729), що вимагає значних одноразових фінансових витрат. За таким самим шляхом ідуть і провідні світові виробники обладнання VolP (Cisco, Dialogic та ін), ліцензуючи програмне забезпечення DSP у компаній, що спеціалізуються саме в цій області, і концентруючи свої сили на реалізації тих функцій, які традиційно забезпечують даними виробникам устаткування технологічне лідерство .

<< 3.2.2 Кодери вихідної інформації (вокодер) та гібридні алгоритми Розділ 3.(Зміст) 3.2.4 Основні алгоритми кодування мови, що використовуються в IP-телефонії >>

</div>


--Козінцев Олексій 36 гр. 14:51, 16 листопада 2010 (EET)