Відмінності між версіями «Стаття до проекту "Штучний інтелект" Дегтярьова Анастасія»
7704070 (обговорення • внесок) |
7704070 (обговорення • внесок) |
||
(не показано 14 проміжних версій цього учасника) | |||
Рядок 2: | Рядок 2: | ||
− | = | + | =Розпізнавання мовлення= |
[[Файл:Iskusstvennyy-intellekt02.jpg|праворуч|350px]] | [[Файл:Iskusstvennyy-intellekt02.jpg|праворуч|350px]] | ||
− | + | Перший пристрій для розпізнавання усної мови з'явився в 1952 році, він міг розпізнавати вимовлені людиною цифри. В 1964 році на ярмарку комп'ютерних технологій у Нью-Йорку було представлено пристрій IBM Shoebox. | |
− | + | Комерційні програми з розпізнавання мовлення з'явилися на початку дев'яностих років. Зазвичай їх використовують люди, які через травми рук не в змозі набирати велику кількість тексту. Ці програми (наприклад, Dragon Naturally Speaking, VoiceNavigator) переводять голос користувача в текст, таким чином, розвантажуючи його руки. Надійність перекладу у таких програм не дуже висока, але з роками вона поступово покращується. | |
+ | Збільшення обчислювальних потужностей мобільних пристроїв дозволило і для них створити програми з функцією розпізнавання усної мови. Серед таких програм варто відзначити Microsoft Voice Command, яка дозволяє працювати з багатьма прикладними програмами за допомогою голосу. Наприклад, можна включити відтворення музики в плеєрі або створити новий документ. | ||
+ | Однак, прогрес не стоїть на місці і останнім часом у телефонних інтерактивних програмах все частіше використовують системи автоматичного розпізнавання і синтезу мовлення. У цьому випадку спілкування з голосовим порталом стає природнішим, оскільки вибір в ньому може бути здійснений не тільки за допомогою тонового набору, але і за допомогою голосових команд. При цьому системи розпізнавання є незалежними від дикторів, тобто розпізнають голос будь-якої людини. Основною перевагою голосових систем є доброзичливість до користувача — він позбавляється від необхідності продиратися крізь складні і заплутані лабіринти голосових меню. Тепер достатньо вимовлення мети дзвінка, після чого голосова система автоматично перемістить абонента в потрібний пункт меню. | ||
+ | Наступним кроком технологій розпізнавання мови можна вважати розвиток так званих Silent Speech Interfaces (SSI) (Інтерфейсів Безмовного/Артикуляторного Доступу). Ці системи обробки мовлення базуються на одержанні й обробці мовних сигналів на ранній стадії артикуляції. Цей етап розвитку розпізнавання мови викликаний двома істотними вадами сучасних систем розпізнавання: надмірна чутливість до шумів, а також необхідність чіткої і ясної вимови при звертанні до системи розпізнавання. Підхід, заснований на SSI, полягає в тому, щоби використовувати нові сенсори, що не піддаються впливу шумів, як доповнення до оброблених акустичних сигналів. | ||
Рядок 12: | Рядок 15: | ||
==Блог до проекту== | ==Блог до проекту== | ||
− | + | Блог (https://htuchnejintelect.blogspot.com) | |
==Мультимедійна презентація== | ==Мультимедійна презентація== | ||
− | + | Презентація (https://drive.google.com/open?id=15cMpU2erY-sloEJ1atmXLXUi0yLcaOfTHwQJ2c3NnbA) | |
==Календар подій проекту:== | ==Календар подій проекту:== | ||
Рядок 24: | Рядок 27: | ||
==Фотоальбом до проекту== | ==Фотоальбом до проекту== | ||
− | [https://photos.google.com Google Фотознімки] ( | + | [https://photos.google.com Google Фотознімки] (https://photos.google.com/album/AF1QipMd7XLK05Vhpl5YVS8nkgODttLwLI9_S-J8a-Cm) |
==Спілкування між учасниками проекту== | ==Спілкування між учасниками проекту== | ||
Рядок 39: | Рядок 42: | ||
=Інформаційні ресурси= | =Інформаційні ресурси= | ||
===Друковані джерела=== | ===Друковані джерела=== | ||
− | #... | + | #Программы распознавания речи. ITCua. 28 грудня 2004. |
#... | #... | ||
#... | #... | ||
Рядок 49: | Рядок 52: | ||
===Електронні ресурси=== | ===Електронні ресурси=== | ||
− | #... | + | #[http://enc.guru.ua/index.php?title_id=95] |
− | # | + | # |
#... | #... | ||
Рядок 57: | Рядок 60: | ||
− | + | (http://kspu.kr.ua/ Центральноукраїнський державний педагогічний університет імені Володимира Винниченка) |
Поточна версія на 10:34, 16 травня 2019
Зміст
Розпізнавання мовлення
Перший пристрій для розпізнавання усної мови з'явився в 1952 році, він міг розпізнавати вимовлені людиною цифри. В 1964 році на ярмарку комп'ютерних технологій у Нью-Йорку було представлено пристрій IBM Shoebox. Комерційні програми з розпізнавання мовлення з'явилися на початку дев'яностих років. Зазвичай їх використовують люди, які через травми рук не в змозі набирати велику кількість тексту. Ці програми (наприклад, Dragon Naturally Speaking, VoiceNavigator) переводять голос користувача в текст, таким чином, розвантажуючи його руки. Надійність перекладу у таких програм не дуже висока, але з роками вона поступово покращується. Збільшення обчислювальних потужностей мобільних пристроїв дозволило і для них створити програми з функцією розпізнавання усної мови. Серед таких програм варто відзначити Microsoft Voice Command, яка дозволяє працювати з багатьма прикладними програмами за допомогою голосу. Наприклад, можна включити відтворення музики в плеєрі або створити новий документ. Однак, прогрес не стоїть на місці і останнім часом у телефонних інтерактивних програмах все частіше використовують системи автоматичного розпізнавання і синтезу мовлення. У цьому випадку спілкування з голосовим порталом стає природнішим, оскільки вибір в ньому може бути здійснений не тільки за допомогою тонового набору, але і за допомогою голосових команд. При цьому системи розпізнавання є незалежними від дикторів, тобто розпізнають голос будь-якої людини. Основною перевагою голосових систем є доброзичливість до користувача — він позбавляється від необхідності продиратися крізь складні і заплутані лабіринти голосових меню. Тепер достатньо вимовлення мети дзвінка, після чого голосова система автоматично перемістить абонента в потрібний пункт меню. Наступним кроком технологій розпізнавання мови можна вважати розвиток так званих Silent Speech Interfaces (SSI) (Інтерфейсів Безмовного/Артикуляторного Доступу). Ці системи обробки мовлення базуються на одержанні й обробці мовних сигналів на ранній стадії артикуляції. Цей етап розвитку розпізнавання мови викликаний двома істотними вадами сучасних систем розпізнавання: надмірна чутливість до шумів, а також необхідність чіткої і ясної вимови при звертанні до системи розпізнавання. Підхід, заснований на SSI, полягає в тому, щоби використовувати нові сенсори, що не піддаються впливу шумів, як доповнення до оброблених акустичних сигналів.
Опис проблеми
Блог до проекту
Блог (https://htuchnejintelect.blogspot.com)
Мультимедійна презентація
Презентація (https://drive.google.com/open?id=15cMpU2erY-sloEJ1atmXLXUi0yLcaOfTHwQJ2c3NnbA)
Календар подій проекту:
Google Календар ( https://calendar.google.com/calendar?cid=bWl1M2poM3BjZzB1Z2tjOGU5cTh0bmFnaDBAZ3JvdXAuY2FsZW5kYXIuZ29vZ2xlLmNv )
Опитування до проекту
Google Форми ( https://docs.google.com/forms/d/e/1FAIpQLSfQImfk7XBfd6WbBOOb8ydOCmSu_IYmPJJYWRPilBy7XfgYYQ/viewform?usp=sf_link )
Фотоальбом до проекту
Google Фотознімки (https://photos.google.com/album/AF1QipMd7XLK05Vhpl5YVS8nkgODttLwLI9_S-J8a-Cm)
Спілкування між учасниками проекту
- Чат
- Форум
- Спільнота на базі соціальних мереж
- Skype
- Telegram
- Viber
- Wiki-сторінка
- Сайт
- .....
Інформаційні ресурси
Друковані джерела
- Программы распознавания речи. ITCua. 28 грудня 2004.
- ...
- ...
Відеоматеріали
- ...
- ...
- ...
Електронні ресурси
- [1]
- ...
(http://kspu.kr.ua/ Центральноукраїнський державний педагогічний університет імені Володимира Винниченка)