Стаття до проекту "Штучний інтелект" Дегтярьова Анастасія

Матеріал з Вікі ЦДУ
Перейти до: навігація, пошук


Розпізнавання мовлення

Iskusstvennyy-intellekt02.jpg

Перший пристрій для розпізнавання усної мови з'явився в 1952 році, він міг розпізнавати вимовлені людиною цифри. В 1964 році на ярмарку комп'ютерних технологій у Нью-Йорку було представлено пристрій IBM Shoebox. Комерційні програми з розпізнавання мовлення з'явилися на початку дев'яностих років. Зазвичай їх використовують люди, які через травми рук не в змозі набирати велику кількість тексту. Ці програми (наприклад, Dragon Naturally Speaking, VoiceNavigator) переводять голос користувача в текст, таким чином, розвантажуючи його руки. Надійність перекладу у таких програм не дуже висока, але з роками вона поступово покращується. Збільшення обчислювальних потужностей мобільних пристроїв дозволило і для них створити програми з функцією розпізнавання усної мови. Серед таких програм варто відзначити Microsoft Voice Command, яка дозволяє працювати з багатьма прикладними програмами за допомогою голосу. Наприклад, можна включити відтворення музики в плеєрі або створити новий документ. Однак, прогрес не стоїть на місці і останнім часом у телефонних інтерактивних програмах все частіше використовують системи автоматичного розпізнавання і синтезу мовлення. У цьому випадку спілкування з голосовим порталом стає природнішим, оскільки вибір в ньому може бути здійснений не тільки за допомогою тонового набору, але і за допомогою голосових команд. При цьому системи розпізнавання є незалежними від дикторів, тобто розпізнають голос будь-якої людини. Основною перевагою голосових систем є доброзичливість до користувача — він позбавляється від необхідності продиратися крізь складні і заплутані лабіринти голосових меню. Тепер достатньо вимовлення мети дзвінка, після чого голосова система автоматично перемістить абонента в потрібний пункт меню. Наступним кроком технологій розпізнавання мови можна вважати розвиток так званих Silent Speech Interfaces (SSI) (Інтерфейсів Безмовного/Артикуляторного Доступу). Ці системи обробки мовлення базуються на одержанні й обробці мовних сигналів на ранній стадії артикуляції. Цей етап розвитку розпізнавання мови викликаний двома істотними вадами сучасних систем розпізнавання: надмірна чутливість до шумів, а також необхідність чіткої і ясної вимови при звертанні до системи розпізнавання. Підхід, заснований на SSI, полягає в тому, щоби використовувати нові сенсори, що не піддаються впливу шумів, як доповнення до оброблених акустичних сигналів.


Опис проблеми

Блог до проекту

[1]

Мультимедійна презентація

[2]

Календар подій проекту:

Google Календар ( https://calendar.google.com/calendar?cid=bWl1M2poM3BjZzB1Z2tjOGU5cTh0bmFnaDBAZ3JvdXAuY2FsZW5kYXIuZ29vZ2xlLmNv )

Опитування до проекту

Google Форми ( https://docs.google.com/forms/d/e/1FAIpQLSfQImfk7XBfd6WbBOOb8ydOCmSu_IYmPJJYWRPilBy7XfgYYQ/viewform?usp=sf_link )

Фотоальбом до проекту

Google Фотознімки (посилання на альбом)

Спілкування між учасниками проекту

  • Чат
  • Форум
  • Спільнота на базі соціальних мереж
  • Skype
  • Telegram
  • Viber
  • Wiki-сторінка
  • Сайт
  • .....

Інформаційні ресурси

Друковані джерела

  1. ...
  2. ...
  3. ...

Відеоматеріали

  1. ...
  2. ...
  3. ...

Електронні ресурси

  1. ...
  2. ...
  3. ...


Центральноукраїнський державний педагогічний університет імені Володимира Винниченка