На заре широкого распространения мобильных телефонов голосовой набор номера и голосовое управление казались нам чем-то фантастическим. Сегодня к ним все уже привыкли, однако в наши дни мобильные голосовые технологии умеют очень многое. Например, существуют разработки, которые позволяют идентифицировать человека по голосу. Есть системы, позволяющие диктовать телефону тексты, которые он переводит в символьные сообщения телефоны умеют решать и обратную задачу – читать тексты вслух. Сегодня мы поговорим о голосовых технологиях и о применении их в мобильных телефонах и в мобильной связи. Речевые технологии и мобильная связьВпервые технологиями распознавания речи стали оснащать мобильники, выпущенные во второй половине 1990-х годов. Например, Samsung SCH-2000, один из первых в мире телефонов, оснащённый голосовыми технологиями. Этот телефон был предназначен для CDMA-сетей. Позже подобные функции встраивали в телефоны высокого и, отчасти, среднего ценового диапазона. Теперь у производителей есть возможность оснащать такими функциями практически все аппараты, которые лишь немногим лучше самых дешёвых моделей начального уровня.
Samsung SCH-2000В итоге получилось так, что пользоваться голосовыми возможностями (по меньшей мере – голосовым набором и управлением) могут многие владельцы телефонов, однако эти возможности не стали популярными – видимо, всё дело в консерватизме, который свойственен многим. Но сегодня голосовые технологии, потенциально доступные владельцам сотовых – это не только голосовой набор и управление. Эти новые возможности могут вызвать интерес у многих. Предлагаю поговорить об этих технологиях подробнее. Применение речевых технологийГолосовой набор и беспроводные гарнитурыНачнём с наиболее старого и распространённого варианта применения речевых технологий, а именно – с голосового управления телефонов и голосового набора. Как правило, реализация этих функций выглядит так. В случае с голосовым набором, абонентам, номера которых вы хотите набирать, предварительно нужно сопоставить голосовые метки (то есть – обучить систему вашему произношению имени абонента). После обучения системы для набора номера достаточно нажать на телефоне особую кнопку (или выбрать пункт меню) и назвать записанное имя. Точно так же обычно работают системы голосового управления. Особенно удобен голосовой набор при использовании беспроводных Bluetooth-гарнитур. Как правило, голосовые метки нужно записывать на самом телефоне, а вот называть их можно уже не только в телефонный микрофон, но и в микрофон гарнитуры, даже не прикасаясь к самому телефону. Телефон нужно доставать лишь тогда, когда нужны какие-то его функции, отличные от совершения и приёма звонков. Как правило, беспроводные гарнитуры достаточно удобны – большинство из них перестаёшь замечать уже после десяти-пятнадцати минут ношения. Стоимость этих устройств (в среднем, порядка $30-50) нельзя назвать слишком высокой, а Bluetooth-адаптером оснащают сегодня даже недорогие модели телефонов (порядка $100-150). Гарнитура с поддержкой голосовых функций удобна там, где человеку постоянно нужна мобильная связь, и, в то же время, он занят чем-то ещё. Например, это может быть водитель, офисный работник, курьер и так далее. Ещё одно интересное направление, в котором развиваются голосовые технологии – это преобразование человеческой речи в текст и синтез речи. Распознавание и синтез речиСовременным телефонам по силам более серьёзные операции, чем голосовой набор. Например, одна из перспективных функций – это преобразование человеческой речи в текст. Телефон, поддерживающий распознавание речи, был представлен компанией Samsung ещё в 2005 году, но до сих пор нельзя сказать, что распознавание голоса стало привычной функцией. Это был аппарат Samsung P207, который мог написать SMS с голоса владельца телефона, а технология, которая применяется в нём, называется VoiceMode. Это – разработка компании VoiceSignal Technologies. Система воспринимает речь пользователя и умеет переводить её в тексты. Такой способ набора сообщений кажется весьма перспективным, и, хотя о поддержке системой русского языка пока не сообщалось, думается, если VoiceMode окажется популярной, её русификация не заставит себя ждать. Samsung SGH-P207У VoiceSignal Technologies есть и другие, не менее интересные разработки, некоторые из которых находят довольно широкое применение в современных аппаратах. Например, это пакет VSuite, который включает в себя функции голосового набора и голосового управления аппаратом, причём, система не нуждается в предварительном обучении. То есть, например, вы можете надиктовать ей произвольный номер и она наберёт его. Ещё одна разработка компании – технология VSearch. Она позволяет производить поиск в мобильном Интернете, используя голосовые команды. Причём, в VSearch реализована технология, по которой голос пользователя обрабатывается не на мобильном телефоне, а на VSearch-сервере. В итоге качество обработки голоса (а главное – перевода его в текст) повышается. Такой подход неприменим для обычной работы с телефоном (каждый раз подключаться к Интернету для того, чтобы набрать номер, кажется слишком накладным), а вот передать серверу голос для обработки в процессе поиска (то есть тогда, когда пользователь по умолчанию подключён к Интернету) – это уже кажется нормальным.
|