Microsoft встановила рекорд з точності розпізнавання мови
- 17-09-2016, 16:43
- У світі / Hi-Tech
- опублікував Сергій Корнелюк
- 0
- 2494
Дослідницький підрозділ компанії Microsoft оголосив, що їм вдалося досягти найвищої точності розпізнавання мови за всю історію людства.
Про це повідомляє GoGetNews.
Дослідникам вдалося досягти у метриці Word Error Rate результату в 6,3%. Цей показник відображає частку неправильно розпізнаних системою слів.
Наприклад, минулого року компанія Google оголосила про досягнення результату у 8%, а у 2013 році цей показник складав взагалі 23%. Підвищення точності розпізнавання мови відіграє важливу роль у розвитку голосових помічників, таких як Cortana, Google Assistant та Siri, а також різних систем, що використовують штучний інтелект.
«Наша найкраща одиночна система досягає коефіцієнта помилок 6,9% у тесті Switchboard Національного інституту стандартів і технологій США. Ми вважаємо, що це найкращий зареєстрований на сьогоднішній день результат для технології розпізнавання мови на основі комбінації систем. Під час роботи цієї технології у групі з іншими тест Switchboard показав результат 6,3%», – розповіли дослідники з Microsoft Research.
Джеффрі Цвейг, головний науковий співробітник та керівник дослідницької групи Speech & Dialog компанії Microsoft, впевнений, що такий низький відсоток помилок було досягнуто завдяки майстерності членів його команди, які розробили нові алгоритми навчання, високоптимізовані надточні та рецидивуючі нейромережеві моделі, а також такі інструменти, як обчислювальна мережа Toolkit. Ця мережа реалізує складні механізми, які дозволяють алгоритмам глибокого навчання працювати на порядок швидше, ніж раніше. Важливим кроком вперед став прорив у паралельному навчанні на графічних процесорах.
«Це новий етап для усього широкого спектра нових технологій, розроблених співтовариством штучного інтелекту великою кількістю різних організацій за останні 20 років», – заявив Сюедун Хуан, керівник з дослідження мови у Microsoft.