Відмінності між версіями «Принципи кодування мови»
(Створена сторінка: <div style="background: #33ccff"> '''Технологія VoIP''' <div style="background: #323ffbb">'''Розділ 3. Передача мови по IP-мере...) |
|||
Рядок 3: | Рядок 3: | ||
<div style="background: #323ffbb">'''Розділ 3. Передача мови по IP-мережі'''</div> | <div style="background: #323ffbb">'''Розділ 3. Передача мови по IP-мережі'''</div> | ||
<center> | <center> | ||
− | [[ | + | [[Пристрої обмеження ефектів луни|<< 3.1.3 Пристрої обмеження ефектів луни]] |
[[Розділ_3._Передача_мови_по_IP-мережі|Розділ 3.(Зміст)]] | [[Розділ_3._Передача_мови_по_IP-мережі|Розділ 3.(Зміст)]] | ||
− | [[ | + | [[Кодування форми сигналу|3.2.1 Кодування форми сигналу >>]] |
</center> | </center> | ||
</div> | </div> | ||
Рядок 17: | Рядок 17: | ||
При перетворенні мовного сигналу в цифрову форму, так чи інакше, мають місце два процеси - дискретизація (sampling), тобто формування дискретних у часі відліків амплітуди сигналу, і квантування, тобто дискретизація отриманих відліків по амплітуді (кодування безперервної величини - амплітуди - числом з кінцевою точністю). Ці дві функції виконуються т.зв. аналого-цифровими перетворювачами (АЦП), які розміщуються в сучасних АТС на платі абонентських комплектів, а у разі передачі мови по IP-мереж - в терміналі користувача (комп'ютері або IP-телефоні).<br> | При перетворенні мовного сигналу в цифрову форму, так чи інакше, мають місце два процеси - дискретизація (sampling), тобто формування дискретних у часі відліків амплітуди сигналу, і квантування, тобто дискретизація отриманих відліків по амплітуді (кодування безперервної величини - амплітуди - числом з кінцевою точністю). Ці дві функції виконуються т.зв. аналого-цифровими перетворювачами (АЦП), які розміщуються в сучасних АТС на платі абонентських комплектів, а у разі передачі мови по IP-мереж - в терміналі користувача (комп'ютері або IP-телефоні).<br> | ||
Так звана теорема відліків свідчить, що аналоговий сигнал може бути успішно відновлений з послідовності вибірок з частотою, що перевищує, як мінімум, удвічі максимальну частоту, присутню в спектрі сигналу. У телефонних мережах смуга частот мовного сигналу навмисно, за допомогою спеціальних фільтрів, обмежена діапазоном 0.3 - 3.4 кГц, що не впливає на розбірливість мови і дозволяє дізнаватися співрозмовника по голосу. З цієї причини частота дискретизації при аналого-цифровому перетворенні обрано рівної 8кГц, причому така частота використовується в усіх телефонних мережах на нашій планеті.<br> | Так звана теорема відліків свідчить, що аналоговий сигнал може бути успішно відновлений з послідовності вибірок з частотою, що перевищує, як мінімум, удвічі максимальну частоту, присутню в спектрі сигналу. У телефонних мережах смуга частот мовного сигналу навмисно, за допомогою спеціальних фільтрів, обмежена діапазоном 0.3 - 3.4 кГц, що не впливає на розбірливість мови і дозволяє дізнаватися співрозмовника по голосу. З цієї причини частота дискретизації при аналого-цифровому перетворенні обрано рівної 8кГц, причому така частота використовується в усіх телефонних мережах на нашій планеті.<br> | ||
+ | <center> | ||
+ | [[Файл:VoIP_3.4.png]]<br> | ||
+ | '''Рис. 3.4.''' Дискретизація і квантування аналогового мовного сигналу | ||
+ | </center><br> | ||
+ | При квантуванні безперервна величина відображається на безліч дискретних значень, що, природно, призводить до втрат інформації. Для того, щоб забезпечити в такій схемі достатній динамічний діапазон (здатність передавати без спотворень як сильні, так і слабкі сигнали), дискретна амплітуда сигналу кодується 12/13-ті розрядним двійковим числом за лінійним законом. | ||
+ | Процес аналого-цифрового перетворення отримав, стосовно до систем зв'язку, назва імпульсно-кодової модуляції (ІКМ).<br> | ||
+ | Щоб знизити необхідну швидкість передачі бітів, застосовують нелінійний (логарифмічний) закон квантування, тобто квантованию піддається не амплітуда сигналу, а її логарифм. У даному випадку має місце процес «стиснення» динамічного діапазону сигналу, а при відновленні сигналу відбувається зворотний процес.<br> | ||
+ | Після тривалих і бурхливих дебатів щодо законів кодування сьогодні застосовуються дві основні різновиди ІКМ:<br> | ||
+ | з кодуванням по (m-закону і по А-закону. У результаті стиску сигнал з амплітудою, що кодуються, 12-13 бітами, описується всього вісьмома бітами. Розрізняються ці різновиди ІКМ деталями процесу стиснення (m-закон кодування краще використовувати при малій амплітуді сигналу і при малому відношенні сигнал / шум). Історично склалося так, що в Північній Америці використовується кодування за m-закону, а в Європі - по А-закону. Тому при міжнародній зв'язку в багатьох випадках потрібно перетворення m-закону в А-закон, відповідальність за яке несе країна, в якій використовується m-закон кодування. В обох випадках кожен відлік кодується 8 бітами, або одним байтом, який можна вважати звуковим фрагментом. Для передачі послідовності таких фрагментів необхідна пропускна здатність каналу, рівна 64 Кбіт / с. Це визначається простими арифметичними діями: 4 000 Гц * 2 = 8000 відліків / с, 8 000 відліків / с * 8 бітів = 64 Кбіт / с, що складає основу всієї цифрової телефонії. Оскільки ІКМ була першою стандартною технологією, що отримала широке застосування в цифрових системах передачі, пропускна здатність каналу, рівна 64 Кбіт / с, стала всесвітнім стандартом для цифрових мереж усіх видів, причому - стандартом, який забезпечує передачу мови з дуже гарною якістю. Відповідні процедури кодування та декодування стандартизовані ITU-T в рекомендації G.711.<br> | ||
+ | Однак таке висока якість передачі мовного сигналу (що є еталоном при оцінці якості інших схем кодування) досягнуто в системах ІКМ за рахунок явно надмірною, при сучасному рівні технології, швидкості передачі інформації.<br> | ||
+ | Щоб зменшити притаманну ІКМ надмірність і знизити вимоги до смуги пропускання, послідовність чисел, отримана в результаті перетворення мовного аналогового сигналу в цифрову форму, піддається математичним перетворенням, що дозволяє зменшити необхідну швидкість передачі. Ці перетворення «сирого» цифрового потоку в потік меншій швидкості називають «стисненням» (а часто - кодуванням, розглядаючи ІКМ як якусь відправну точку для подальшої обробки інформації). | ||
+ | Існує безліч підходів до «стискання» мовної інформації; всі їх можна розділити на три категорії: кодування форми сигналу (waveform coding), кодування вихідної інформації (source coding) і гібридне кодування, що представляє собою поєднання двох попередніх підходів. | ||
+ | |||
+ | ---- | ||
+ | <div style="background: #33ccff"> | ||
+ | <center> | ||
+ | [[Пристрої обмеження ефектів луни|<< 3.1.3 Пристрої обмеження ефектів луни]] | ||
+ | [[Розділ_3._Передача_мови_по_IP-мережі|Розділ 3.(Зміст)]] | ||
+ | [[Кодування форми сигналу|3.2.1 Кодування форми сигналу >>]] | ||
+ | </center> | ||
+ | </div> | ||
+ | ---- | ||
+ | --[[Користувач:Козінцев Олексій|Козінцев Олексій 36 гр.]] 14:40, 16 листопада 2010 (EET) |
Версія за 14:40, 16 листопада 2010
Технологія VoIP
<< 3.1.3 Пристрої обмеження ефектів луни Розділ 3.(Зміст) 3.2.1 Кодування форми сигналу >>
3.2 Принципи кодування мови
Як стало зрозуміло з часу винаходу Олександра Белла, для того, щоб передати мова через телефонну мережу, мовну інформацію потрібно перетворити в аналоговий електричний сигнал. При переході до цифрових мереж зв'язку виникла необхідність перетворити аналоговий електричний сигнал в цифровий формат на передавальній стороні, тобто закодувати, і перевести назад в аналогову форму, тобто декодувати, на приймальній стороні.
Процес перетворення аналогового мовного сигналу в цифрову форму називають аналізом або цифровим кодуванням мови, а зворотний процес відновлення аналогової форми мовного сигналу - синтезом або декодуванням мови.
Мета будь-якої схеми кодування - отримати таку цифрову послідовність, яка вимагає мінімальної швидкості передачі і з якої декодер може відновити вихідний мовний сигнал з мінімальними спотвореннями.
При перетворенні мовного сигналу в цифрову форму, так чи інакше, мають місце два процеси - дискретизація (sampling), тобто формування дискретних у часі відліків амплітуди сигналу, і квантування, тобто дискретизація отриманих відліків по амплітуді (кодування безперервної величини - амплітуди - числом з кінцевою точністю). Ці дві функції виконуються т.зв. аналого-цифровими перетворювачами (АЦП), які розміщуються в сучасних АТС на платі абонентських комплектів, а у разі передачі мови по IP-мереж - в терміналі користувача (комп'ютері або IP-телефоні).
Так звана теорема відліків свідчить, що аналоговий сигнал може бути успішно відновлений з послідовності вибірок з частотою, що перевищує, як мінімум, удвічі максимальну частоту, присутню в спектрі сигналу. У телефонних мережах смуга частот мовного сигналу навмисно, за допомогою спеціальних фільтрів, обмежена діапазоном 0.3 - 3.4 кГц, що не впливає на розбірливість мови і дозволяє дізнаватися співрозмовника по голосу. З цієї причини частота дискретизації при аналого-цифровому перетворенні обрано рівної 8кГц, причому така частота використовується в усіх телефонних мережах на нашій планеті.
Рис. 3.4. Дискретизація і квантування аналогового мовного сигналу
При квантуванні безперервна величина відображається на безліч дискретних значень, що, природно, призводить до втрат інформації. Для того, щоб забезпечити в такій схемі достатній динамічний діапазон (здатність передавати без спотворень як сильні, так і слабкі сигнали), дискретна амплітуда сигналу кодується 12/13-ті розрядним двійковим числом за лінійним законом.
Процес аналого-цифрового перетворення отримав, стосовно до систем зв'язку, назва імпульсно-кодової модуляції (ІКМ).
Щоб знизити необхідну швидкість передачі бітів, застосовують нелінійний (логарифмічний) закон квантування, тобто квантованию піддається не амплітуда сигналу, а її логарифм. У даному випадку має місце процес «стиснення» динамічного діапазону сигналу, а при відновленні сигналу відбувається зворотний процес.
Після тривалих і бурхливих дебатів щодо законів кодування сьогодні застосовуються дві основні різновиди ІКМ:
з кодуванням по (m-закону і по А-закону. У результаті стиску сигнал з амплітудою, що кодуються, 12-13 бітами, описується всього вісьмома бітами. Розрізняються ці різновиди ІКМ деталями процесу стиснення (m-закон кодування краще використовувати при малій амплітуді сигналу і при малому відношенні сигнал / шум). Історично склалося так, що в Північній Америці використовується кодування за m-закону, а в Європі - по А-закону. Тому при міжнародній зв'язку в багатьох випадках потрібно перетворення m-закону в А-закон, відповідальність за яке несе країна, в якій використовується m-закон кодування. В обох випадках кожен відлік кодується 8 бітами, або одним байтом, який можна вважати звуковим фрагментом. Для передачі послідовності таких фрагментів необхідна пропускна здатність каналу, рівна 64 Кбіт / с. Це визначається простими арифметичними діями: 4 000 Гц * 2 = 8000 відліків / с, 8 000 відліків / с * 8 бітів = 64 Кбіт / с, що складає основу всієї цифрової телефонії. Оскільки ІКМ була першою стандартною технологією, що отримала широке застосування в цифрових системах передачі, пропускна здатність каналу, рівна 64 Кбіт / с, стала всесвітнім стандартом для цифрових мереж усіх видів, причому - стандартом, який забезпечує передачу мови з дуже гарною якістю. Відповідні процедури кодування та декодування стандартизовані ITU-T в рекомендації G.711.
Однак таке висока якість передачі мовного сигналу (що є еталоном при оцінці якості інших схем кодування) досягнуто в системах ІКМ за рахунок явно надмірною, при сучасному рівні технології, швидкості передачі інформації.
Щоб зменшити притаманну ІКМ надмірність і знизити вимоги до смуги пропускання, послідовність чисел, отримана в результаті перетворення мовного аналогового сигналу в цифрову форму, піддається математичним перетворенням, що дозволяє зменшити необхідну швидкість передачі. Ці перетворення «сирого» цифрового потоку в потік меншій швидкості називають «стисненням» (а часто - кодуванням, розглядаючи ІКМ як якусь відправну точку для подальшої обробки інформації).
Існує безліч підходів до «стискання» мовної інформації; всі їх можна розділити на три категорії: кодування форми сигналу (waveform coding), кодування вихідної інформації (source coding) і гібридне кодування, що представляє собою поєднання двох попередніх підходів.
--Козінцев Олексій 36 гр. 14:40, 16 листопада 2010 (EET)