Відмінності між версіями «Стаття до проекту "Штучний інтелект" Дегтярьова Анастасія»

Матеріал з Вікі ЦДУ
Перейти до: навігація, пошук
 
(не показано 15 проміжних версій цього учасника)
Рядок 2: Рядок 2:
  
  
=Тема статті=[[Файл:Iskusstvennyy-intellekt02.jpg|праворуч|350px]]
+
=Розпізнавання мовлення=
 +
[[Файл:Iskusstvennyy-intellekt02.jpg|праворуч|350px]]
  
Штучний інтелект – це розділ комп`ютерної лінгвістики та інформатики, що формалізує завдання, які нагадують справи, що виконує людина. Іншими словами, комп’ютер робитиме те, що донедавна виконували ми. Це поняття вів професор Дартмутського коледжу Джон МакКарті в 1956 році. Він цікавився, чи можна навчити машину, як і дитину – абстрактним поняттям, використовувати мову і самостійно вдосконалюватись методом спроб і помилок. Це поняття обговорюють наче це далеке майбутнє. Але насправді ШІ уже увійшов у наше життя.
+
Перший пристрій для розпізнавання усної мови з'явився в 1952 році, він міг розпізнавати вимовлені людиною цифри.  В 1964 році на ярмарку комп'ютерних технологій у Нью-Йорку було представлено пристрій IBM Shoebox.
На даний час ми стикаємось зі штучним інтелектом кожного дня. Це голосовий пошук – Siri і Alexa, які доступні на iOs, Android і Windows, відеоігри – персонажі, яких можуть поводитись непередбачувано для живого гравця. Автономні авто – навчають водити машину, точно так як і людину, авто зможе саме аналізувати ситуацію на дорозі і діяти.
+
Комерційні програми з розпізнавання мовлення з'явилися на початку дев'яностих років. Зазвичай їх використовують люди, які через травми рук не в змозі набирати велику кількість тексту. Ці програми (наприклад, Dragon Naturally Speaking, VoiceNavigator) переводять голос користувача в текст, таким чином, розвантажуючи його руки. Надійність перекладу у таких програм не дуже висока, але з роками вона поступово покращується.
 +
Збільшення обчислювальних потужностей мобільних пристроїв дозволило і для них створити програми з функцією розпізнавання усної мови. Серед таких програм варто відзначити Microsoft Voice Command, яка дозволяє працювати з багатьма прикладними програмами за допомогою голосу. Наприклад, можна включити відтворення музики в плеєрі або створити новий документ.
 +
Однак, прогрес не стоїть на місці і останнім часом у телефонних інтерактивних програмах все частіше використовують системи автоматичного розпізнавання і синтезу мовлення. У цьому випадку спілкування з голосовим порталом стає природнішим, оскільки вибір в ньому може бути здійснений не тільки за допомогою тонового набору, але і за допомогою голосових команд. При цьому системи розпізнавання є незалежними від дикторів, тобто розпізнають голос будь-якої людини. Основною перевагою голосових систем є доброзичливість до користувача — він позбавляється від необхідності продиратися крізь складні і заплутані лабіринти голосових меню. Тепер достатньо вимовлення мети дзвінка, після чого голосова система автоматично перемістить абонента в потрібний пункт меню.
 +
Наступним кроком технологій розпізнавання мови можна вважати розвиток так званих Silent Speech Interfaces (SSI) (Інтерфейсів Безмовного/Артикуляторного Доступу). Ці системи обробки мовлення базуються на одержанні й обробці мовних сигналів на ранній стадії артикуляції. Цей етап розвитку розпізнавання мови викликаний двома істотними вадами сучасних систем розпізнавання: надмірна чутливість до шумів, а також необхідність чіткої і ясної вимови при звертанні до системи розпізнавання. Підхід, заснований на SSI, полягає в тому, щоби використовувати нові сенсори, що не піддаються впливу шумів, як доповнення до оброблених акустичних сигналів.
  
  
Рядок 11: Рядок 15:
  
 
==Блог до проекту==
 
==Блог до проекту==
[https://www.blogger.com Blogger] або [http://WordPress.com WordPress]
+
Блог (https://htuchnejintelect.blogspot.com)
  
 
==Мультимедійна презентація==
 
==Мультимедійна презентація==
[https://drive.google.com Google Диск]
+
Презентація (https://drive.google.com/open?id=15cMpU2erY-sloEJ1atmXLXUi0yLcaOfTHwQJ2c3NnbA)
  
 
==Календар подій проекту:==
 
==Календар подій проекту:==
Рядок 23: Рядок 27:
  
 
==Фотоальбом до проекту==
 
==Фотоальбом до проекту==
[https://photos.google.com Google Фотознімки] (посилання на альбом)
+
[https://photos.google.com Google Фотознімки] (https://photos.google.com/album/AF1QipMd7XLK05Vhpl5YVS8nkgODttLwLI9_S-J8a-Cm)
  
 
==Спілкування між учасниками проекту==
 
==Спілкування між учасниками проекту==
Рядок 38: Рядок 42:
 
=Інформаційні ресурси=
 
=Інформаційні ресурси=
 
===Друковані джерела===
 
===Друковані джерела===
#...
+
#Программы распознавания речи. ITCua. 28 грудня 2004.
 
#...
 
#...
 
#...
 
#...
Рядок 48: Рядок 52:
  
 
===Електронні ресурси===
 
===Електронні ресурси===
#...
+
#[http://enc.guru.ua/index.php?title_id=95]
#...
+
#
 
#...
 
#...
  
Рядок 56: Рядок 60:
  
  
[http://kspu.kr.ua/ Центральноукраїнський державний педагогічний університет імені Володимира Винниченка]
+
(http://kspu.kr.ua/ Центральноукраїнський державний педагогічний університет імені Володимира Винниченка)

Поточна версія на 10:34, 16 травня 2019


Розпізнавання мовлення

Iskusstvennyy-intellekt02.jpg

Перший пристрій для розпізнавання усної мови з'явився в 1952 році, він міг розпізнавати вимовлені людиною цифри. В 1964 році на ярмарку комп'ютерних технологій у Нью-Йорку було представлено пристрій IBM Shoebox. Комерційні програми з розпізнавання мовлення з'явилися на початку дев'яностих років. Зазвичай їх використовують люди, які через травми рук не в змозі набирати велику кількість тексту. Ці програми (наприклад, Dragon Naturally Speaking, VoiceNavigator) переводять голос користувача в текст, таким чином, розвантажуючи його руки. Надійність перекладу у таких програм не дуже висока, але з роками вона поступово покращується. Збільшення обчислювальних потужностей мобільних пристроїв дозволило і для них створити програми з функцією розпізнавання усної мови. Серед таких програм варто відзначити Microsoft Voice Command, яка дозволяє працювати з багатьма прикладними програмами за допомогою голосу. Наприклад, можна включити відтворення музики в плеєрі або створити новий документ. Однак, прогрес не стоїть на місці і останнім часом у телефонних інтерактивних програмах все частіше використовують системи автоматичного розпізнавання і синтезу мовлення. У цьому випадку спілкування з голосовим порталом стає природнішим, оскільки вибір в ньому може бути здійснений не тільки за допомогою тонового набору, але і за допомогою голосових команд. При цьому системи розпізнавання є незалежними від дикторів, тобто розпізнають голос будь-якої людини. Основною перевагою голосових систем є доброзичливість до користувача — він позбавляється від необхідності продиратися крізь складні і заплутані лабіринти голосових меню. Тепер достатньо вимовлення мети дзвінка, після чого голосова система автоматично перемістить абонента в потрібний пункт меню. Наступним кроком технологій розпізнавання мови можна вважати розвиток так званих Silent Speech Interfaces (SSI) (Інтерфейсів Безмовного/Артикуляторного Доступу). Ці системи обробки мовлення базуються на одержанні й обробці мовних сигналів на ранній стадії артикуляції. Цей етап розвитку розпізнавання мови викликаний двома істотними вадами сучасних систем розпізнавання: надмірна чутливість до шумів, а також необхідність чіткої і ясної вимови при звертанні до системи розпізнавання. Підхід, заснований на SSI, полягає в тому, щоби використовувати нові сенсори, що не піддаються впливу шумів, як доповнення до оброблених акустичних сигналів.


Опис проблеми

Блог до проекту

Блог (https://htuchnejintelect.blogspot.com)

Мультимедійна презентація

Презентація (https://drive.google.com/open?id=15cMpU2erY-sloEJ1atmXLXUi0yLcaOfTHwQJ2c3NnbA)

Календар подій проекту:

Google Календар ( https://calendar.google.com/calendar?cid=bWl1M2poM3BjZzB1Z2tjOGU5cTh0bmFnaDBAZ3JvdXAuY2FsZW5kYXIuZ29vZ2xlLmNv )

Опитування до проекту

Google Форми ( https://docs.google.com/forms/d/e/1FAIpQLSfQImfk7XBfd6WbBOOb8ydOCmSu_IYmPJJYWRPilBy7XfgYYQ/viewform?usp=sf_link )

Фотоальбом до проекту

Google Фотознімки (https://photos.google.com/album/AF1QipMd7XLK05Vhpl5YVS8nkgODttLwLI9_S-J8a-Cm)

Спілкування між учасниками проекту

  • Чат
  • Форум
  • Спільнота на базі соціальних мереж
  • Skype
  • Telegram
  • Viber
  • Wiki-сторінка
  • Сайт
  • .....

Інформаційні ресурси

Друковані джерела

  1. Программы распознавания речи. ITCua. 28 грудня 2004.
  2. ...
  3. ...

Відеоматеріали

  1. ...
  2. ...
  3. ...

Електронні ресурси

  1. [1]
  2. ...


(http://kspu.kr.ua/ Центральноукраїнський державний педагогічний університет імені Володимира Винниченка)