Яндекс: для распознавания речи в облаке

Технология Yandex SpeechKit, представленная осенью прошлого года, вышла на новый уровень — в виде версии Cloud: облачного сервиса распознавания речи. Создан он для разработчиков, позволяя им добавиться в своих проектах нового типа взаимодействия с пользователями.

Возможности SpeechKit на сегодня весьма обширны. Эта технология, уже встроенная при помощи библиотеки Mobile SDK в примерно 400 приложений для Android, iOS и Windows Phone (в том числе и фирменные яндексовские) и обрабатывающая за сутки несколько миллионов запросов, умеет очень точно понимать устную речь. Например, разработчики Яндекса приводят такие цифры: адреса или названия организаций она «угадывает» в 95% случаев (это близко к способностям человека!), короткие поисковые запросы понимает в 85% ситуаций, а надиктованные текстовое сообщение или заметка верна в 82%. При этом работа возможна как с русским, так и с турецким языками, а вскоре к ним добавится еще и поддержка английского. Неудивительно, что такая технология интересна не только тем, кто создает приложения для смартфонов и планшетов (от поисковых сервисов до карт и навигаторов), но и другим компаниям. И в этой-то ситуации как раз пригодится облачный сервис — SpeechKit Cloud. Что он делает?

Его главная особенность — встраивание через HTTP API в абсолютно любые программы и даже устройства (как подчеркивается в официальном пресс-релизе «от компьютерной игры до робота»). Когда человек задает устную команду, устройство, оснащенное Yandex SpeechKit Cloud, связывается с сервером, который расшифровывает фразу, и всего через секунду (!) выдает результат. И это не просто обещания, а рабочий факт, что подтвердят несколько партнеров Яндекса, уже опробовавших облачную технологию. Речь про Cubic Robots, разрабатывающую домашнего робота-помощника (он управляет «умным домом», рассказывает о погоде и пробках, читает новости — и все по устным командам), и Oktell, создающего программное обеспечение для колл-центров (в их случае технология снимает часть нагрузки с живых операторов и позволяет избавиться от традиционного «нажмите клавишу такую-то для перехода в такой-то раздел», где вместо этого человеку достаточно сказать, что его интересует, чтобы сразу выйти на нужного специалиста или пункт меню). Остается добавить, что использование такого SDK для разработчиков в первый месяц бесплатно, а его дальнейшая стоимость зависит от количества подаваемых запросов.

раздел — поиск и SEO ;

07.08.2014

Евгений Пушкарев

Написать отзыв: