«Речевые» технологии…

…появилось много проектов, посвященных «речевым» технологиям. По этой причине немного остановимся на этом вопросе…

Часто встречаются следующие утверждения: «…Речевые технологии — технологии ХХI ВЕКА благодаря которым появилась возможность управлять компьютером с помощью голоса, диктовать текст, слушать, а не читать книги, а в перспективе общаться с компьютером на интеллектуальном уровне. Основными направлениями исследований в этой области являются: распознавание речи, синтез голоса, средства речевого управления, идентификация по образцу речи. Что на сегодняшний день достигнуто в этой области, какие исследования проводятся в данный момент, перспективы развития, фирмы, компании и организации ведущие разработки в области речевых технологий, программное обеспечение, техническая информация, статьи, ссылки на эти и многие другие вопросы Вы сможете найти ответ на нашем сайте…»

Ещё: «…Компания «Х» анонсировала свою новую разработку в области речевых технологий — систему распознавания слитной русской речи Sakrament ASR, полностью отвечающую стандартам MS SAPI 5.1. Новая система распознавания слитной речи была изначально ориентирована на русскую речь и не является переделкой аналогичных систем для английского языка. При ее разработке и создании, были использованы оригинальные программные решения и наработки компании «Х» в области речевых технологий. Выпущена вторая версия системы синтеза речи Х text-to-speech engine Компания «Х» объявила о выходе второй версии системы синтеза речи Х text-to-speech engine, созданной на основе уникальной акустической базы с использованием собственных алгоритмов обработки звука. Это позволило добиться высокого качества звучания синтезируемого голоса и максимально приблизить компьютерную речь к человеческой…»

И ещё: «…Наша технология распознавания речи может быть интегрирована в различного рода устройства: от систем управления карманными компьютерами до больших автоматических справочных систем банков, аэропортов и вокзалов. Малые аппаратные требования и энергопотребление достигаются за счет использования уникального математического аппарата и лингвистических know-how Х, Inc. Исследования показали, что человеческий речевой аппарат способен воспроизвести не более 1000 различных звуков, и это количество зависит от конкретного языка. Результаты этих исследований и собственный уникальный математический аппарат позволил нам создать универсальную, дикторонезависимую, мультиязычную технологию распознавания речи с качеством распознавания порядка 98%. Технология TTS (Текст-в-речь): Разработанная в Х, Inc. технология TTS способна обеспечить воспроизведение любого слова или фразы, написанных на языке, понятном машине. Самой первой была система TTS для английского языка, но универсальность технологии позволила нам создать аналогичные системы для немецкого, греческого, португальского, русского, испанского языков и иврита…»

Прошу простить за длинные цитаты, там все правильно изложено. Но не кажется-ли Вам, что все они напоминают какой-то «шаманский» наговор. Они приведены для того, чтобы показать, что понимается многими фирмами под «речевыми» технологиями. Но уж тогда «информационно-речевые», если они не могут обойтись без программного обеспечения и вычислительной техники.

Работа, выполняемая этими предприятиями очень важна, мало того, многие люди не могут без нее обходиться в повседневной жизни. Спасибо им за их труд, но это не предмет нашего рассмотрения.

Реальность же такова: «К сожалению речевые технологии по распознаванию речи не позволяют осуществлять автоматическое распознавание беглой речи. Можно только предложить распознавание речи на ограниченном словаре (примерно 200-300 слов, но не более того)».

Но речь не об этом, вернее — не только об этом…

Владимир Козлов.

P. S.

Не все так безобидно. Привожу ещё одну цитату: «Очень сомневаюсь, чтобы самостоятельно можно было овладеть синхроном, даже если у вас природные способности. Так что, выбирая профессию, оцените также и величину своего кошелька. Предлагаю метод: переводить текст с помощью программы распознавания речи, я тут недавно купил Dragon Naturally Speaking, так она с листа считывала новости VOA. У нас есть русификация Горыныч — правда пока-что у пиратов не встречал…»

: О проекте : | : Новая статья : | : Архив : | : Ссылки :

Интернет-адрес проекта: http://pactp.tarusa.ru/netak

© No copyright.

Дизайн Евгения Санникова
E-Mail: jeen@gmx.net

 

Киев-Таруса-Москва

1999-2003