RU2394386C2 - Терминал мобильной связи и способ управления его меню - Google Patents
Терминал мобильной связи и способ управления его меню Download PDFInfo
- Publication number
- RU2394386C2 RU2394386C2 RU2008126782A RU2008126782A RU2394386C2 RU 2394386 C2 RU2394386 C2 RU 2394386C2 RU 2008126782 A RU2008126782 A RU 2008126782A RU 2008126782 A RU2008126782 A RU 2008126782A RU 2394386 C2 RU2394386 C2 RU 2394386C2
- Authority
- RU
- Russia
- Prior art keywords
- mobile communication
- communication terminal
- speech
- speech recognition
- operations
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/38—Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
- H04B1/40—Circuits
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2203/00—Indexing scheme relating to G06F3/00 - G06F3/048
- G06F2203/038—Indexing scheme relating to G06F3/038
- G06F2203/0381—Multimodal input, i.e. interface arrangements enabling the user to issue commands by simultaneous use of input devices of different nature, e.g. voice plus gesture on digitizer
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0481—Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
- G06F3/0482—Interaction with lists of selectable items, e.g. menus
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/228—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2250/00—Details of telephonic subscriber devices
- H04M2250/74—Details of telephonic subscriber devices with voice recognition means
Abstract
Изобретение относится к терминалам мобильной связи. Терминал содержит устройство ввода, запоминающее устройство, выполненное таким образом, что оно способно запоминать информацию, связанную с операциями, выполняемыми с терминалом мобильной связи, и контроллер, сконфигурированный для активации функции распознавания речи после приема введенных данных, для определения смысла введенной речевой команды на основании, по меньшей мере, одной предшествующей операции, выполненной в терминале мобильной связи, и языка, содержащегося в речевой команде, и для обеспечения операций, связанных с определенным смыслом входной речевой команды, на основании сведений, по меньшей мере, об одной предшествующей операции, выполненной в терминале мобильной связи, и языка, содержащегося в речевой команде, и на основании вероятности того, что определенный смысл введенной речевой команды соответствует информации, связанной с операциями терминала мобильной связи. 2 н. и 24 з.п. ф-лы, 9 ил.
Description
Настоящее изобретение относится к терминалу мобильной связи и к соответствующему способу, обеспечивающему выполнение операций в терминале мобильной связи на основании речевых команд и прежних операций, выполненных в терминале мобильной связи.
Уровень техники
Терминалы мобильной связи в настоящее время предоставляют множество дополнительных услуг помимо базовых услуг телефонной связи. Например, в настоящее время абонент может осуществлять доступ к сети Интернет, играть в игры, смотреть видеофильмы, слушать музыку, производить фото- и видеосъемку, запись звуковых файлов и т.д. В настоящее время терминалы мобильной связи также обеспечивают прием вещательных программ, поэтому абонент может смотреть телевизионные шоу, спортивные программы, видеофильмы и т.д.
Следовательно, терминалы мобильной связи содержат сложные графические интерфейсы пользователя или ГИП (GUI), которые пользователь может использовать для доступа к различным функциям в терминале. Например, пользователь может получить доступ к главному меню, а затем выбрать из одного из множества подменю, например, из подменю "электронная почта", подменю "предыстория телефонных звонков", подменю "доступ к сети Интернет", подменю "изображения" и т.д. После того как пользователем выбрано конкретное подменю, терминалы мобильной связи предоставляют еще один перечень подменю или пунктов меню, которые пользователь может выбрать для выполнения желательной функции.
Однако системы меню сформированы в виде древовидной схемы, вследствие чего пользователь должен выполнить несколько промежуточных функций для того, чтобы выбрать желательную конечную функцию. Кроме того, поскольку терминал имеет малый размер, пункты меню также являются малыми по размеру и их трудно увидеть. Прикосновение к конкретному пункту меню в том случае, когда терминал содержит дисплей с сенсорным экраном, также часто приводит к тому, что пользователь одновременно прикасается к более чем одному пункту меню (поскольку пункты меню отображены на дисплее расположенными близко друг к другу) или же пользователь прикасается к неправильному пункту меню.
РАСКРЫТИЕ ИЗОБРЕТЕНИЯ
Соответственно, одной из задач настоящего изобретения является решение вышеупомянутых и других проблем.
Другой задачей настоящего изобретения является создание терминала мобильной связи и соответствующего способа, обеспечивающего распознавание смысла речевой команды и управление терминалом на основании распознанной речевой команды.
Еще одной задачей настоящего изобретения является создание терминала мобильной связи и соответствующего способа, предоставляющего одно меню или несколько меню для управления различными функциями терминала на основании распознанной речевой команды.
Для достижения этих и других преимуществ и в соответствии с целью настоящего изобретения, осуществленной и описанной здесь в общих чертах, согласно одному из объектов настоящего изобретения, в нем предложен терминал мобильной связи, содержащий устройство ввода, выполненное таким образом, что оно способно принимать введенные данные для активации функции распознавания речи в терминале мобильной связи, запоминающее устройство, выполненное таким образом, что оно способно запоминать информацию, связанную с операциями, выполняемыми с терминалом мобильной связи, и контроллер, сконфигурированный таким образом, что после приема введенных данных для активации функции распознавания речи он активирует функцию распознавания речи, определяет смысл введенной речевой команды на основании сведений, по меньшей мере, об одной предшествующей операции, выполненной в терминале мобильной связи, и языка, содержащегося в речевой команде, и обеспечивает выполнение операций, связанных с определенным смыслом входной речевой команды, на основании сведений, по меньшей мере, об одной предшествующей операции, выполненной в терминале мобильной связи, и языка, содержащегося в речевой команде, и на основании вероятности того, что определенный смысл введенной речевой команды соответствует информации, связанной с операциями терминала мобильной связи.
Согласно другому объекту настоящего изобретения в нем предложен способ управления терминалом мобильной связи, содержащий следующие операции: принимают введенные данные для активации функции распознавания речи в терминале мобильной связи, после приема введенных данных для активации функции распознавания речи активируют функцию распознавания речи и обеспечивают выполнение операций, связанных с определенным смыслом введенной речевой команды, на основании сведений, по меньшей мере, об одной предшествующей операции, выполненной в терминале мобильной связи, и языка, содержащегося в речевой команде, и на основании вероятности того, что определенный смысл введенной речевой команды соответствует информации, связанной с операциями терминала мобильной связи.
Дальнейший объем применимости настоящего изобретения станет очевидным из приведенного ниже подробного описания. Однако следует понимать, что подробное описание и конкретные примеры, несмотря на указание предпочтительных вариантов осуществления настоящего изобретения, приведены исключительно в иллюстративных целях, так как для специалистов в данной области техники из этого подробного описания станет очевидной возможность различных изменений и модификаций, не выходящих за пределы сущности и объема патентных притязаний настоящего изобретения.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
Настоящее изобретение станет более понятным из приведенного ниже подробного описания и из сопроводительных чертежей, которые приведены исключительно в иллюстративных целях и, следовательно, не ограничивают настоящее изобретение и на которых изображено следующее:
на Фиг.1 изображена блок-схема терминала мобильной связи согласно одному из вариантов осуществления настоящего изобретения;
на Фиг.2 на виде спереди в перспективе изображен терминал мобильной связи согласно одному из вариантов осуществления настоящего изобретения;
на Фиг.3 на виде сзади в перспективе изображен терминал мобильной связи, показанный на Фиг.2;
на Фиг.4 изображена блок-схема системы беспроводной связи, способной работать с терминалом мобильной связи, показанным на чертежах Фиг.1-3, согласно одному из вариантов осуществления настоящего изобретения;
на Фиг.5 изображена схема последовательности операций, на которой проиллюстрирован способ управления терминалом мобильной связи согласно одному из вариантов осуществления настоящего изобретения;
на чертежах Фиг.6А-6В в общем виде показаны изображения, выводимые на экран дисплея, которые иллюстрируют способ выбора варианта активации функции распознавания речи в терминале мобильной связи согласно одному из вариантов осуществления настоящего изобретения;
на Фиг.7A изображена схема последовательности операций, на которой проиллюстрирован способ распознавания речи в терминале мобильной связи согласно одному из вариантов осуществления настоящего изобретения;
на Фиг.7Б в общем виде показаны изображения, выводимые на экран дисплея, которые содержат меню, отображенные на дисплее на основании процента правильно распознанных слов речевой команды в терминале мобильной связи согласно другому варианту осуществления настоящего изобретения;
на Фиг.7В в общем виде показаны изображения, выводимые на экран дисплея, которые иллюстрируют способ распознавания речи в терминале мобильной связи согласно одному из вариантов осуществления настоящего изобретения;
на Фиг.7Г в общем виде показаны изображения, выводимые на экран дисплея, которые иллюстрируют способ распознавания речи в терминале мобильной связи согласно одному из вариантов осуществления настоящего изобретения;
на Фиг.8 изображена блок-схема, на которой проиллюстрирована система баз данных, используемая в способе распознавания речи в терминале мобильной связи согласно одному из вариантов осуществления настоящего изобретения; и
на Фиг.9 в общем виде показано выводимое на экран дисплея изображение, иллюстрирующее отображение на дисплее сообщения, уведомляющего пользователя о том, что в текущий момент времени в терминале мобильной связи согласно одному из вариантов осуществления настоящего изобретения выполняется речевая команда.
ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ
Теперь будет приведено подробное описание предпочтительных вариантов осуществления настоящего изобретения, примеры которых проиллюстрированы на сопроводительных чертежах.
На Фиг.1 изображена блок-схема терминала 100 мобильной связи согласно одному из вариантов осуществления настоящего изобретения. Как показано на чертеже, терминал 100 мобильной связи содержит блок 110 беспроводной связи, содержащий один или большее количество компонентов, который позволяет поддерживать беспроводную связь между терминалом 100 мобильной связи и системой или сетью беспроводной связи, в пределах которой расположен терминал мобильной связи.
Например, блок 110 беспроводной связи содержит модуль 111 приема широковещательных передач, который принимает сигнал широковещательной передачи и/или информацию, связанную с широковещательной передачей, из внешнего объекта, осуществляющего управление широковещательными передачами, по широковещательному каналу. Широковещательным каналом может являться, в том числе, спутниковой канал и наземный канал.
Кроме того, термин "объект, осуществляющий управление широковещательными передачами" обычно относится к системе, которая производит передачу широковещательного сигнала и/или информации, связанной с широковещательной передачей. Примером информации, связанной с широковещательной передачей, является, в том числе, информация, связанная с широковещательным каналом, с широковещательной программой, с поставщиком услуг вещания и т.д. Например, информация, связанная с широковещательной передачей, может содержать электронную программу передач (EPG) для системы цифрового мультимедийного вещания (DMB) и электронный справочник услуг (ESG) системы цифрового телевещания для портативных устройств (DVB-H).
Кроме того, сигнал широковещательной передачи может быть реализован, помимо прочего, в виде сигнала телевизионного вещания, сигнала радиовещания и сигнала широковещательной передачи данных. Кроме того, сигнал широковещательной передачи может содержать сигнал широковещательной передачи, объединенный с сигналом телевизионного вещания или с радиовещательным сигналом.
Модуль 111 приема широковещательных передач также выполнен таким образом, что принимает сигналы широковещательной передачи, переданные из систем вещания различных типов. Такими системами вещания являются, в том числе, например, наземная система цифрового мультимедийного вещания (DMB-T), спутниковая система цифрового мультимедийного вещания (DMB-S), система цифрового телевещания для портативных устройств (DVB-H), система широковещательной передачи данных, известная как система передачи мультимедийной информации только по линии прямой связи (MediaFLO®) и наземная система цифрового вещания с комплексными услугами (ISDB-T). Также возможен прием многоадресных сигналов. Кроме того, данные, принятые модулем 111 приема широковещательных передач, могут быть запомнены в соответствующем устройстве, например, в запоминающем устройстве 160.
Блок 110 беспроводной связи также содержит модуль 112 мобильной связи, который производит передачу радиосигналов в один или большее количество сетевых объектов (которыми являются, например, базовая станция, узел B (Node B))/прием радиосигналов из них. Этими сигналами могут являться, в том числе, звуковые сигналы, видеосигналы, мультимедийные сигналы, передаваемые сигналы управления, и данные.
Он также содержит модуль 113 беспроводного доступа к сети Интернет, который обеспечивает поддержку доступа к сети Интернет для терминала мобильной связи. Соединение модуля 113 с терминалом может быть внутренним или внешним. Блок 110 беспроводной связи также содержит модуль 114 ближней связи, который, соответственно, облегчает ближнюю связь. Технологиями, пригодными для реализации этого модуля, являются, в том числе, следующие: технология радиочастотной идентификации (RFID), технология передачи данных через инфракрасный порт согласно стандарту IrDA, утвержденному Ассоциацией по средствам передачи данных в инфракрасном диапазоне, технология ультраширокополосной радиосвязи (UWB), а также такие сетевые технологии, которые обычно именуют технологией Bluetooth и технологией ZigBee.
Блок 110 беспроводной связи также содержит модуль 115 определения местоположения, и он распознает местоположение терминала 100 мобильной связи или получает сведения о его местоположении иным способом. Модуль 115 определения местоположения может быть реализован с использованием компонентов Глобальной системы определения местоположения (GPS), которые взаимодействуют с соответствующими спутниками, с компонентами сети и с их комбинациями.
Кроме того, как показано на Фиг.1, терминал 100 мобильной связи также содержит блок 120 ввода звуковых/видео (A/V) сигналов, который обеспечивает подачу звуковых или видеосигналов в терминал 100 мобильной связи. Как показано на чертеже, блок 120 ввода звуковых/видео (A/V) сигналов содержит камеру 121 и микрофон 122. Камера 121 получает и обрабатывает кадры изображений фотографических снимков или видеофильмов.
Кроме того, когда портативное устройство находится в конкретном режиме, например в режиме телефонного разговора, в режиме записи и в режиме распознавания речи, то микрофон 122 принимает внешний звуковой сигнал. Затем принятый звуковой сигнал обрабатывают и преобразовывают в цифровые данные. К тому же, портативное устройство и, в частности, блок 120 ввода звуковых/видео (A/V) сигналов обычно содержит алгоритмы удаления различных шумов, предназначенные для удаления шума, сгенерированного в ходе приема внешнего звукового сигнала. Кроме того, данные, сгенерированные блоком 120 ввода звуковых/видео (A/V) сигналов, могут быть сохранены в запоминающем устройстве 160, могут быть использованы блоком 150 вывода или могут быть переданы посредством одного или большего количества модулей блока 110 связи. При желании могут быть использованы два или большее количество микрофонов и/или две или большее количество камер.
Терминал 100 мобильной связи также содержит устройство 130 ввода пользовательских данных, которое осуществляет генерацию входных данных в ответ на манипуляции пользователя с соответствующим устройством или с соответствующими устройствами ввода. Примерами таких устройств являются, в том числе, кнопочная панель, переключатель с эластичной клавишей куполообразной формы (dome switch), сенсорная панель (например, основанная на изменении электрической емкости при приложении статического давления), колесико управления (jog wheel) и джойстик-переключатель (jog switch). Конкретным примером является следующий: устройство 130 ввода пользовательских данных выполнено в виде сенсорной панели, взаимодействующей с дисплеем с сенсорным экраном, более подробное описание которого приведено ниже.
Терминал 100 мобильной связи также содержит датчик 140, и этот датчик 140 обеспечивает измерения состояния различных аспектов работы терминала 100 мобильной связи. Например, датчик 140 может регистрировать, находится ли терминал 100 мобильной связи в открытом/закрытом состоянии, относительное расположение компонентов (например, дисплея и кнопочной панели) терминала 100 мобильной связи, изменение местоположения терминала 100 мобильной связи или компонента терминала 100 мобильной связи, наличие или отсутствие контакта пользователя с терминалом 100 мобильной связи, ориентацию или ускорение/замедление перемещения терминала 100 мобильной связи и т.д.
Например, когда терминалом 100 мобильной связи является терминал мобильной связи сдвижного типа, датчик 140 может регистрировать, является ли сдвижная часть терминала 100 мобильной связи открытой или закрытой. Другими примерами являются, в том числе, следующие: датчик 140 регистрирует наличие или отсутствие электропитания, обеспечиваемого источником 190 электропитания, наличие или отсутствие связи или иного соединения между блоком 170 интерфейса и внешним устройством и т.д.
Кроме того, блок 170 интерфейса часто реализован таким образом, что обеспечивает связь терминала 100 мобильной связи с внешними устройствами. Типичными внешними устройствами являются, в том числе, проводные/беспроводные головные телефоны, внешние зарядные устройства, источники электропитания, устройства хранения данных, выполненные таким образом, что обеспечивают хранение данных (например, звуковых данных, видеоинформации, изображений и т.д.), наушники и микрофоны. Кроме того, блок 170 интерфейса может быть сконфигурирован с использованием проводного/беспроводного порта передачи данных, разъема для плат (например, для соединения с платой памяти, с платой модуля идентификации абонента (SIM-картой), с платой модуля идентификации абонента (UIM), с платой сменного модуля идентификации абонента (RUIM) и т.д.), портов ввода/вывода звукового сигнала и портов ввода/вывода видеосигнала.
Блок 150 вывода обычно содержит различные компоненты, которые обеспечивают вывод требуемых сигналов в терминале 100 мобильной связи. Терминал 100 мобильной связи также содержит дисплей 151, который обеспечивает визуальное отображение информации, связанной с терминалом 100 мобильной связи. Например, если терминал 100 мобильной связи работает в режиме телефонного разговора, то дисплей 151 обычно обеспечивает интерфейс пользователя или графический интерфейс пользователя, содержащий информацию, связанную с заказом, проведением и завершением телефонного разговора. В качестве другого примера, если терминал 100 мобильной связи находится в режиме видеотелефонного разговора или в режиме фотографирования, то дисплей 151 может дополнительно или в альтернативном варианте выводить на экран дисплея изображения, связанные с этими режимами.
Кроме того, дисплей 151 также предпочтительно содержит сенсорный экран, работающий во взаимодействии с устройством ввода, например сенсорную панель. Такая конфигурация позволяет дисплею 151 функционировать как в качестве устройства вывода, так и в качестве устройства ввода. Кроме того, дисплей 151 может быть реализован с использованием, в том числе, таких технологий отображения информации, как, например, жидкокристаллический дисплей (LCD), жидкокристаллический дисплей на тонкопленочных транзисторах (TFT-LCD), дисплей на органических светоизлучающих диодах (OLED), гибкий дисплей и трехмерный дисплей.
Терминал 100 мобильной связи также может содержать один или большее количество таких дисплеев. Примером варианта осуществления с двумя дисплеями является следующий: один дисплей выполнен таким образом, что он является внутренним дисплеем (который виден тогда, когда терминал находится в открытом положении), а второй дисплей выполнен таким образом, что он является внешним дисплеем (который виден в обоих положениях: в открытом положении и в закрытом положении).
Кроме того, на Фиг.1 показано устройство 150 вывода, содержащее модуль 152 вывода звука, который обеспечивает вывод требуемых звуковых сигналов в терминале 100 мобильной связи. Модуль 152 вывода звука часто реализован с использованием одного или большего количества громкоговорителей, зуммеров, других устройств создания звука и комбинаций этих устройств.
Кроме того, модуль 152 вывода звука функционирует в различных режимах, в том числе в режиме приема телефонного вызова, в режиме выполнения телефонного вызова, в режиме записи, в режиме распознавания речи и в режиме приема широковещательных передач. Во время работы модуль 152 вывода звука выводит звуковые сигналы, связанные с конкретной функцией (например, с принятым телефонным вызовом, с принятым сообщением и с ошибками).
Кроме того, на чертеже показано, что блок 150 вывода дополнительно содержит сигнальное устройство 153, которое используют для сигнализации о возникновении конкретного события, связанного с терминалом 100 мобильной связи, или для распознавания факта его возникновения иным способом. Типичными событиями, являются, в том числе, принятый вызов, принятое сообщение и принятые данные, введенные пользователем. Примером такого выходного эффекта является, в том числе, создание осязательных ощущений (например, вибрации) для пользователя. Например, сигнальное устройство 153 может быть выполнено таким образом, что вибрирует в ответ на прием телефонного вызова или сообщения терминалом 100 мобильной связи.
В качестве другого примера сигнальное устройство 153 создает вибрацию в ответ на прием введенных пользователем данных в терминале 100 мобильной связи, обеспечивая, таким образом, механизм осязательной обратной связи. Кроме того, различные выходные эффекты, созданные компонентами устройства 150 вывода, могут быть реализованы по отдельности, или же такой выходной эффект может быть реализован с использованием любой комбинации этих компонентов.
Кроме того, для хранения различных типов данных для обеспечения требуемой обработки, требуемого управления и хранения данных в терминале 100 мобильной связи обычно используют запоминающее устройство 160. Примерами таких данных являются, в том числе, программные команды для прикладных программ, работающих в терминале 100 мобильной связи, предыстория телефонных вызовов, данные о контактах, данные телефонной книги, сообщения, изображения, видеоинформация и т.д.
Кроме того, запоминающее устройство 160, показанное на Фиг.1, может быть реализовано с использованием подходящих энергозависимых и энергонезависимых запоминающих устройств или устройств хранения данных любого типа, которыми являются, в том числе, следующие: оперативное запоминающее устройство (ОЗУ), статическое оперативное запоминающее устройство (статическое ОЗУ), электрически стираемое программируемое постоянное запоминающее устройство (ЭСППЗУ), стираемое программируемое постоянное запоминающее устройство (СППЗУ), программируемое постоянное запоминающее устройство (ППЗУ), постоянное запоминающее устройство (ПЗУ), магнитное запоминающее устройство, флэш-память, магнитный или оптический диск, запоминающее устройство на картах памяти или иное подобное запоминающее устройство или устройство для хранения данных, или с использованием комбинации этих устройств.
Терминал 100 также содержит контроллер 180, который обычно управляет функционированием всего терминала 100 мобильной связи. Например, контроллер 180 осуществляет управление и обработку, которые связаны с телефонными вызовами в режиме речевой связи, с передачей данных, с обменом мгновенными сообщениями, с вызовами в режиме видеотелефонной связи, с операциями камеры и с операциями записи. Как показано на Фиг.1, контроллер 180 может также содержать мультимедийный модуль 181, предназначенный для обеспечения функций воспроизведения мультимедийной информации. Мультимедийный модуль 181 может быть выполнен в виде части контроллера 180 или может быть реализован в виде отдельного компонента.
Кроме того, источник 190 электропитания обеспечивает энергию, используемую различными компонентами портативного устройства. Предоставленное электропитание может быть внутренним электропитанием, внешним электропитанием или их комбинациями.
На Фиг.2 терминал 100 мобильной связи согласно одному из вариантов осуществления настоящего изобретения показан на виде спереди-сбоку. Как показано на Фиг.2, терминал 100 мобильной связи содержит первый корпус 200, выполненный таким образом, что может скользить по направляющим во взаимодействии со вторым корпусом 205. Устройство 130 ввода пользовательских данных, описанное со ссылкой на Фиг.1, может содержать первое устройство ввода данных, например функциональные кнопки 210, второе устройство ввода данных, например кнопочную панель 215, и третье устройство ввода данных, например боковые клавиши 245.
Функциональные кнопки 210 связаны с первым корпусом 200, а кнопочная панель 215 связана со вторым корпусом 205. Кнопочная панель 215 содержит различные клавиши (например, цифр, букв и символов), предоставляющие пользователю возможность сделать телефонный вызов, подготовить текстовое или мультимедийное сообщение и управлять терминалом 100 мобильной связи каким-либо иным способом.
Кроме того, первый корпус 200 может быть перемещен путем скольжения относительно второго корпуса 205 между открытым положением и закрытым положением. В закрытом положении первый корпус 200 расположен поверх второго корпуса 205 таким образом, что кнопочная панель 215 в значительной степени или полностью закрыта первым корпусом 200. В открытом положении возможен доступ пользователя к кнопочной панели 215, а также к дисплею 151 и к функциональным кнопкам 210. Функциональные кнопки 210 удобны для ввода пользователем таких команд, как, например, команды "пуск", "стоп" и "прокрутка".
Кроме того, терминал 100 мобильной связи способен работать либо в режиме ожидания (в котором он, например, способен принять телефонный вызов или сообщение, принимать служебные сигналы управления сетью связи и реагировать на них), либо в режиме активного телефонного вызова. Как правило, терминал 100 мобильной связи функционирует в режиме ожидания тогда, когда он находится в закрытом положении, и в активном режиме тогда, когда он находится в открытом положении. Однако конфигурация режима может быть изменена при необходимости или по желанию.
Кроме того, первый корпус 200 сформирован из первого кожуха 220 и второго кожуха 225, и второй корпус 205 сформирован из первого кожуха 230 и второго кожуха 235. Первые и вторые кожухи предпочтительно выполнены из соответствующего материала, снабженного ребрами жесткости, например из пластмассы, полученной способом литья под давлением, или сформованы с использованием металла, например, нержавеющей стали (STS) и титана (Ti).
При желании может быть предусмотрено наличие одного или большего количества промежуточных кожухов, расположенных между первым и вторым кожухами одного из корпусов: первого корпуса 200 и второго корпуса 205 или обоих этих корпусов. Кроме того, первый корпус 200 и второй корпус 205 обычно имеют такой размер, что вмещают в себя электронные компоненты, используемые для обеспечения функционирования терминала 100 мобильной связи.
Первый корпус 200 также содержит камеру 121 и устройство 152 вывода звука, которое выполнено в виде громкоговорителя, расположенного надлежащим образом относительно дисплея 151. Камера 121 также может быть сконструирована таким образом, что по выбору она может быть установлена в заданное положение (например, повернута, повернута на шарнире и т.д.) относительно первого корпуса 200.
Кроме того, рядом с нижней стороной дисплея 151 расположены функциональные кнопки 210. Как изложено выше, дисплей 151 может быть реализован в виде жидкокристаллического дисплея, ЖКД (LCD), или в виде дисплея на органических светоизлучающих диодах (OLED). Дисплей 151 также может быть выполнен в виде сенсорного экрана, снабженного расположенной под ним сенсорной панелью, которая осуществляет генерацию сигналов в ответ на прикосновение пользователя (например, пальцем, ручкой-стилусом и т.д.) к сенсорному экрану.
Второй корпус 205 также содержит микрофон 122, расположенный рядом с кнопочной панелью 215, и боковые клавиши 245, которые являются одним из типов устройств ввода пользовательских данных, расположенные вдоль боковой стороны второго корпуса 205. В предпочтительном варианте боковые клавиши 245 выполнены в виде клавиш быстрого вызова функций ("горячих клавиш") таким образом, что боковые клавиши 245 связаны с конкретной функцией терминала 100 мобильной связи. Как показано на чертеже, рядом с боковыми клавишами 245 расположен блок 170 интерфейса, а в нижней части второго корпуса 205 расположен источник 190 электропитания в виде аккумулятора.
На Фиг.3 терминал 100 мобильной связи, показанный на Фиг.2, изображен на виде сзади-сбоку. Как показано на Фиг.3, второй корпус 205 содержит камеру 121 и связанные с ней лампу-вспышку 250 и зеркало 255. Лампа-вспышка 250 функционирует вместе с камерой 121 второго корпуса 205, а зеркало 255 является полезным для содействия надлежащему расположению камеры 121 в режиме автопортрета пользователем. Кроме того, камера 121 второго корпуса 205 обращена в направлении, противоположном тому направлению, в котором обращена камера 121 первого корпуса 200, показанная на Фиг.2.
Кроме того, каждая из камер 121 первого и второго корпусов 200 и 205 может иметь одинаковые или различные функциональные возможности. Например, в одном из вариантов осуществления изобретения камера 121 первого корпуса 200 работает с относительно более низкой разрешающей способностью, чем камера 121 второго корпуса 205. Такое устройство работает хорошо, например, во время телефонной связи в режиме видеоконференции, когда пропускная способность линии обратной связи может быть ограниченной. Кроме того, относительно более высокая разрешающая способность камеры 121 второго корпуса 205 (Фиг.3) является полезной для получения более высококачественных изображений для их использования впоследствии.
Второй корпус 205 также содержит модуль 152 вывода звука, который выполнен в виде громкоговорителя и который расположен в верхней части второго корпуса 205. Модули выхода звукового сигнала первого и второго корпусов 200 и 205 могут также взаимодействовать друг с другом для обеспечения вывода стереозвука. Кроме того, любой из этих модулей вывода звука или оба из них могут быть выполнены таким образом, что функционируют в качестве устройства громкоговорящей связи.
Терминал 100 также содержит антенну 260 для приема сигнала широковещательной передачи, расположенную на верхнем торце второго корпуса 205. Антенна 260 функционирует во взаимодействии с модулем 111 приема широковещательных передач (показанным на Фиг.1). При желании антенна 260 может быть установлена или выполнена таким образом, что, способна втягиваться во второй корпус 205. Кроме того, задняя сторона первого корпуса 200 содержит модуль 265 скольжения по направляющим, который соединен с соответствующим модулем скольжения по направляющим, расположенным на передней стороне второго корпуса 205, с возможностью его перемещения путем скольжения.
Кроме того, проиллюстрированная компоновка различных компонентов первого и второго корпусов 200 и 205 может быть видоизменена при необходимости или по желанию. В общем случае, в альтернативном варианте некоторые или все компоненты одного корпуса могут быть реализованы таким образом, что они расположены в другом корпусе. Кроме того, местоположение и относительное расположение таких компонентов может быть таким, что их места расположения отличаются от тех, которые показаны на представленных чертежах.
Кроме того, терминал 100 мобильной связи, показанный на чертежах Фиг.1-3, может быть выполнен таким образом, что работает в системе связи, осуществляющей передачу данных посредством кадров или пакетов, в том числе не только в системах беспроводной связи, но и в системах проводной связи, и в системах спутниковой связи. В таких системах связи используют различные интерфейсы радиосвязи и/или физические уровни.
Примерами таких интерфейсов радиосвязи, используемых в системах связи, являются, в том числе, например, следующие: множественный доступ с частотным разделением, МДЧР (FDMA), множественный доступ с временным разделением, МДВР (TDMA), множественный доступ с кодовым разделением, МДКР (CDMA) и интерфейс радиосвязи Универсальной системы мобильной связи (UMTS), стандарт интерфейса радиосвязи в рамках программы долгосрочного развития (LTE) Универсальной системы мобильной связи (UMTS) и интерфейс радиосвязи Глобальной системы мобильной связи (GSM). В качестве только лишь примера, не являющегося ограничивающим признаком, приведенное ниже описание относится к системе связи МДКР, но идея этого изобретения равным образом применима и к системам других типов.
На Фиг.4 проиллюстрирована система беспроводной связи МДКР, содержащая множество терминалов 100 мобильной связи, множество базовых станций 270, множество контроллеров 275 базовых станций (КБС) и коммутационный центр 280 мобильной связи (КЦМС).
КЦМС 280 сконфигурирован таким образом, что соединен с помощью интерфейса с коммутируемой телефонной сетью 290 общего пользования (КТСОП), и КЦМС 280 также таким образом, что соединен с помощью интерфейса с контроллерами 275 базовых станций (КБС). Кроме того, контроллеры 275 базовых станций (КБС) связаны с базовыми станциями 270 через линии обратной связи. Кроме того, линии обратной связи могут быть сконфигурированы в соответствии с любым из нескольких интерфейсов, которыми являются, в том числе, например, интерфейс линии E1/T1, интерфейс линии асинхронного режима передачи (ATM), интерфейс протокола сети Интернет (IP), интерфейс протокола соединения "точка-точка" (PPP), интерфейс протокола ретрансляции кадров (Frame Relay), интерфейс высокоскоростной цифровой абонентской линии (HDSL), ассиметричной цифровой абонентской линии (ADSL) или цифровых абонентских линий по технологии xDSL. Кроме того, система может содержать более двух контроллеров 275 базовых станций (КБС).
К тому же, каждая базовая станция 270 может содержать один или большее количество секторов, при этом каждый сектор содержит всенаправленную антенну или антенну, направленную в конкретном направлении по радиусу от базовой станции 270. В альтернативном варианте каждый сектор может содержать две антенны для приема с разнесением. Кроме того, каждая базовая станция 270 может быть выполнена таким образом, что обеспечивает поддержку множества распределений предоставленных частот, причем каждое распределение предоставленных частот имеет конкретную ширину спектра (например, 1,25 МГц, 5 МГц).
Пересечение сектора и предоставленных частот может именоваться каналом МДКР. Базовые станции 270 также могут именоваться подсистемами приемопередатчика базовой станции, ППБС (BTS). В некоторых случаях термин "базовая станция" может использоваться таким образом, что он относится к совокупности из КБС 275 и одной или большего количества базовых станций 270.
Базовые станции 270 также могут именоваться "узлами сети сотовой связи". В альтернативном варианте узлами сети сотовой связи могут именоваться отдельные сектора конкретной базовой станции 270. Кроме того, показан передатчик 295 наземной системы цифрового мультимедийного вещания (DMB), осуществляющий широковещательную передачу в терминалы 100 мобильной связи, работающие в системе.
Кроме того, модуль 111 приема широковещательных передач (показанный на Фиг.1) терминала 100 мобильной связи обычно выполнен таким образом, что способен принимать сигналы широковещательной передачи, переданные передатчиком 295 системы цифрового мультимедийного вещания (DMB). Как изложено выше, аналогичные устройства могут быть реализованы для других типов широковещательной и многоадресной передачи сигналов.
Кроме того, на Фиг.4 проиллюстрировано несколько спутников 300 Глобальной системы определения местоположения (GPS). Эти спутники облегчают определение местоположения некоторых или всех терминалов 100 мобильной связи. На Фиг.4 показаны два спутника, но информация о местоположении может быть получена посредством большего или меньшего количества спутников.
Кроме того, модуль 115 определения местоположения (показанный на Фиг.1) терминала 100 мобильной связи обычно выполнен таким образом, что взаимодействует со спутниками 300 для получения желательной информации о местоположении. Однако в альтернативном варианте может быть реализована техника определения местоположения иных типов, например такая техника определения местоположения, которая может использоваться в дополнение к технологии определения местоположения посредством Глобальной системы определения местоположения (GPS) или вместо нее. В альтернативном варианте или в дополнение к этому некоторые или все спутники 300 Глобальной системы определения местоположения (GPS) могут быть устроены таким образом, что обеспечивают передачу программ цифрового мультимедийного вещания (DMB) со спутников.
Кроме того, во время обычной работы системы беспроводной связи базовые станции 270 принимают наборы сигналов, передаваемых по линиям обратной связи из различных терминалов 100 мобильной связи. Терминалы 100 мобильной связи участвуют в телефонных вызовах, в обмене сообщениями и в других видах связи.
Кроме того, каждый сигнал, переданный по линии обратной связи, который принят конкретной базовой станцией 270, обрабатывают в этой же базовой станции 270, и результирующие данные пересылают в соответствующий КБС 275. КБС 275 обеспечивает распределение ресурсов телефонного вызова и функциональные возможности управления мобильностью, в том числе "мягкими" эстафетными передачами управления связью между базовыми станциями 270.
Кроме того, контроллеры 275 базовых станций (КБС) также направляют принятые данные в КЦМС 280, который обеспечивает дополнительные услуги маршрутизации для связи с КТСОП 290. Аналогичным образом, КТСОП служит средством связи с КЦМС 280, а КЦМС 280 служит средством связи с контроллерами 275 базовых станций (КБС). Контроллеры 275 базовых станций (КБС) также управляют базовыми станциями 270 для обеспечения передачи наборов сигналов по линии прямой связи в терминалы 100 мобильной связи.
В приведенном ниже описании дано объяснение способа управления, применимого для терминала 100 мобильной связи, сконфигурированного описанным выше способом, в различных вариантах осуществления изобретения. Однако описанные ниже варианты осуществления изобретения могут быть реализованы независимо или посредством их комбинаций. В дополнение к этому, в приведенном ниже описании предполагают, что дисплей 151 содержит сенсорный экран. Кроме того, сенсорный экран или его экран обозначен ниже номером позиции '400'.
На Фиг.5 изображена схема последовательности операций, на которой проиллюстрирован способ управления терминалом мобильной связи согласно одному из вариантов осуществления настоящего изобретения. В описании этого чертежа также ссылаются на Фиг.1. Как показано на чертеже, контроллер 180 определяет факт того, что функция распознавания речи в терминале мобильной связи активирована (операция S101). Когда функция распознавания речи активирована (результатом операции S101 является "ДА"), контроллер 180 принимает введенную пользователем речевую команду (которую ниже именуют "речевой командой") (операция S102). Затем, когда контроллером 180 распознано, что речевая команда была введена пользователем (результатом операции S102 является "ДА"), то контроллер 180 определяет смысл распознанной речевой команды (операция S103).
Кроме того, для активации функции распознавания речи согласно данному варианту осуществления изобретения пользователь может выбрать конкретную клавишу или прикоснуться к конкретному участку сенсорного экрана, содержащегося в терминале мобильной связи. Физическая активация функции распознавания речи пользователем является особенно целесообразной потому, что пользователь является более осведомленным о том, что он собирается использовать речевые команды для управления терминалом. То есть поскольку пользователь сначала должен выполнить физическую манипуляцию с терминалом, то он или она интуитивно осознают, что они собираются ввести речевую команду или инструкцию в терминал, и, следовательно, говорят более отчетливо или более медленно, чтобы тем самым активировать конкретную функцию.
Таким образом, поскольку пользователь говорит более отчетливо или более медленно, то, например, возрастает вероятность точного распознавания речевых команд. То есть активацию функции распознавания речи выполняют посредством физической манипуляции с клавишей на терминале, а не путем активации функции распознавания речи, говоря в терминал.
Затем контроллер 180 может начать или завершить активацию функции распознавания речи на основании того, какое количество раз пользователь прикоснулся к конкретной клавише или к конкретному участку сенсорного экрана, как долго пользователь прикасается к конкретной клавише или к конкретному участку сенсорного экрана и т.д. Пользователь также может задать то, каким образом контроллер 180 должен активировать функцию распознавания речи, с использованием надлежащего пункта меню, что обеспечивается настоящим изобретением. Например, пользователь может выбрать на терминале тот пункт меню, который содержит 1) установку активации распознавания речи на основании того количества раз, равного X, которое была выбрана клавиша речевого управления, 2) установку активации распознавания речи на основании количества времени, равного X, в течение которого была выбрана клавиша речевого управления, 3) установку активации распознавания речи тогда, когда выбраны клавиши X и Y, и т.д. Затем пользователь может ввести значения X и Y для задания того, каким образом контроллер 180 определяет факт активации функции речевой активации распознавания, с возможностью изменения этих параметров. Таким образом, согласно одному из вариантов осуществления настоящего изобретения пользователь активно задействует функцию речевого управления, имеющуюся в его собственном терминале мобильной связи, что увеличивает вероятность определения контроллером 180 правильной функции, соответствующей речевой команде пользователя, и что предоставляет пользователю возможность приспособить функцию речевого управления в соответствии с его или ее потребностями.
Контроллер 180 также может сохранять активированное состояние функции распознавания речи в течение времени прикосновения к заданной клавише (к заданным клавишам) или в течение времени нажатия на нее (на них) и прекращать выполнение функции распознавания речи, когда заданная клавиша отпущена (заданные клавиши отпущены). В альтернативном варианте контроллер 180 может сохранять активацию функции распознавания речи в течение заранее заданного промежутка времени после прикосновения к заданной клавише (к заданным клавишам) или нажатия на нее (на них) и прекращать или завершать выполнение функции распознавания речи по истечении заранее заданного промежутка времени. В еще одном варианте осуществления изобретения контроллер 180 может запоминать полученные речевые команды в запоминающем устройстве 160 в течение того времени, когда функция распознавания речи поддерживается в активированном состоянии.
Кроме того, контроллер 180 может определять смысл речевой команды сразу же после завершения выполнения функции распознавания речи, или может определять смысл речевой команды одновременно с вводом пользователем речевых команд. Кроме того, для определения смысла речевой команды контроллер 180 может анализировать слова, ключевое слово, структуру предложения и т.д., которые используют во введенной речевой команде, и определять содержание или смысл речевой команды.
Кроме того, контроллер 180 может также запоминать информацию, связанную с функциями, услугами или меню, предоставляемыми в терминале мобильной связи, в базе данных запоминающего устройства 160 для определения смысла речевой команды. Кроме того, для повышения вероятности точного обнаружения речевой команды пользователя может быть выполнено обновление информации, хранящейся в базе данных, с использованием обучения или способа, основанного на искусственном интеллекте. Сведения о предшествующих операциях, выполненных в терминале мобильной связи, также могут быть запомнены в базе данных. Например, пользователь может открыть свой терминал и большую часть времени проверять его сообщения электронной почты прежде, чем выполнить любую другую операцию.
Таким образом, контроллер 180 может использовать эти сведения о предшествующих операциях для повышения вероятности определения смысла речевой команды пользователя. Пользователь также может ввести ту же самую речевую команду при первом включении или открывании своего терминала мобильной связи. Сведения об этих предшествующих операциях также могут быть запомнены вместе с введенной речевой командой и могут быть использованы контроллером 180 для определения смысла введенной команды.
Таким образом, сведения о предшествующих операциях, выполненных в терминале, содержат сведения о состоянии приведения терминала в действие (например, во время режима ожидания, во время телефонного разговора, во время видеотелефонного разговора, во время сеанса передачи электронной почты, во время сеанса обмена мгновенными сообщениями, закрывание терминала и т.д.), а также содержат сведения о предшествующих командах, введенных пользователем. Например, для прослушивания музыки пользователь может предварительно закрыть терминал, а затем ввести команду "play my music" ("проиграть мою музыку"). В таком случае контроллер 180 может использовать состояние терминала мобильной связи (то есть что он находится в закрытом состоянии) для помощи в определении того, что означает речевая команда, введенная пользователем.
Возвращаясь к рассмотрению Фиг.5, когда контроллером 180 определен смысл речевой команды с использованием информации из базы данных, то контроллер 180 выводит соответствующее результирующее значение (операция S104). Таким образом, результирующее значение может содержать управляющий сигнал для выполнения функции, соответствующей распознанной речевой команде, или для управления конкретным элементом. Результирующее значение также может соответствовать информации в виде данных для отображения меню или нескольких меню, связанных с распознанной командой.
Кроме того, пользователь может ввести речевую команду в виде точного наименования конкретного меню (например, "image capturing" ("съемка изображений"), "voice call" ("телефонный вызов в режиме речевой связи"), "message transmission" ("передача сообщений") и т.д.) или используя естественный язык (например, "show me photo" ("покажите мне фотографию"), "save battery" ("перейти в режим экономии энергии аккумулятора") и т.д.). Кроме того, команда на естественном языке может содержать или может не содержать точное наименование, связанное с конкретным меню.
К тому же, естественным языком является язык, обычно используемый людьми в повседневной жизни, который отличается от искусственного языка (который создан искусственно), и его обработка может быть осуществлена с использованием алгоритма обработки естественного языка. Кроме того, как показано на Фиг.5, контроллер 180 затем определяет, может ли он распознать речевую команду, введенную пользователем (операция S105).
Например, контроллер 180 может определить, способен ли он распознать речевые команды с вероятностью, превышающей конкретное пороговое значение (равное, например, 80%). Если контроллер 180 не может определить смысл речевой команды, удовлетворяющий конкретному пороговому значению, то контроллер 180 может выполнить дополнительную обработку ошибок (операция S107), а затем повторить операции S103-S105.
Однако, если контроллер 180 может распознать речевые команды, удовлетворяющие конкретному пороговому значению, то контроллер 180 может предпочтительно отобразить на дисплее множество меню, удовлетворяющих конкретному пороговому значению (например, для которых индивидуальный процент правильно распознанных слов равен 80% или выше) (операция S106). Пользователь может визуально увидеть отображенные меню, а затем выбрать одно из отображенных на дисплее меню.
Этот признак является особенно целесообразным потому, что пользователь вновь является активно вовлеченным в функцию распознавания речи. В более подробном изложении, вместо отображения или вывода для пользователя сообщения о том, что контроллер 180 не может четко определить смысл речевой команды, контроллер 180 предпочтительно выводит множество меню, для которых вероятность того, что они являются точными, превышает конкретное пороговое значение (равное, например, 80%). Например, если пользователь вводит речевую команду "save battery" ("перейти в режим экономии энергии аккумулятора"), но контроллер 180 может определить только команду "save" (например, вследствие фонового шума, плохого приема и т.д.), контроллер 180 может отобразить на дисплее конкретное меню или пункты меню, связанные с ключевым словом "Save". То есть контроллер 180 может отобразить на дисплее меню "фотографии", меню "аккумулятор" и меню "электронная почта", поскольку каждое из этих меню содержит элемент "save". Следовательно, пользователь может затем выбрать надлежащее меню из множества меню, отображенных на дисплее.
Кроме того, как изложено выше, контроллер 180 может использовать данные о предшествующих операциях в терминале при определении смысла введенных речевых команд. Контроллер 180 также может использовать данные о физическом состоянии терминала для помощи в определении смысла введенных речевых команд. Например, контроллер 180 может предпочтительно использовать информацию о состоянии аккумулятора (например, о состоянии "аккумулятор разряжен") при определении смысла введенных речевых команд.
Кроме того, в качестве вида приема подтверждения от пользователя может использоваться сообщение, речевое подтверждение или положение или вид (форма или размер) отображения меню на дисплее, а видом ответа может являться речь пользователя, конкретная клавиша или сенсорный ввод данных. Кроме того, как изложено выше, если процент правильно распознанных слов введенной речевой команды является более низким, чем конкретное пороговое значение, то контроллер 180 может выполнить операцию обработки ошибок (операция S107).
Затем, во время операции обработки ошибок контроллер 180 может принять дополнительную речевую команду от пользователя или, как изложено выше, может отобразить множество меню, для которых процент правильно распознанных слов или вероятностный показатель превышают определенный уровень. Контроллер 180 также определяет количество распознанных функций или меню, для которых вероятность превышает определенный уровень. Если количество распознанных функций или меню, для которых процент правильно распознанных слов превышает определенный уровень, является меньшим, чем конкретное число (например, если имеется только одна функция или одно меню), то контроллер 180 автоматически выполняет эту одну функцию или реализует это одно меню.
На Фиг.6А-6В показаны изображения, выводимые на экран дисплея, которые иллюстрируют активацию пользователем функции распознавания речи в терминале мобильной связи согласно одному из вариантов осуществления настоящего изобретения. Кроме того, как изложено выше, настоящее изобретение имеет преимущество, заключающееся в том, что пользователю предоставлена возможность определения того, когда именно следует инициировать функцию речевого управления, на основании физических манипуляций, произведенных пользователем. Таким образом, пользователь более осведомлен о своем окружении (например, говорит ли он в тихой среде и т.д.), о тембре и уровне своего голоса, об используемом им естественном языке или языке иного типа и т.д. Следовательно, вероятно, что пользователь будет более внимательным при введении речевых команд, что приводит к более высокой вероятности точного определения смысла речевой команды контроллером 180.
Кроме того, другое преимущество того, что пользователю предоставляют возможность вручную активировать функцию распознавания речи путем прикосновения к клавише на терминале или путем ее выбора, состоит в снижении потребления мощности от аккумулятора. То есть функция распознавания речи потребляет большой объем ресурсов терминала мобильной связи, и когда активированное состояние функции распознавания речи непрерывно приводят в действие в режиме ожидания (или в состоянии простоя), то происходит непрерывное потребление терминалом полной мощности.
В более подробном изложении, когда контроллер 180 сконфигурирован таким образом, что принимает сигнал активации для активации функции распознавания речи посредством того, что пользователь говорит в терминал (а не путем выбора пользователем конкретной клавиши), то контроллер 180 должен непрерывно выполнять функцию распознавания речи в активном состоянии и ожидать того, что пользователь начнет говорить (это означало бы то, что начато распознавание речи). Этот непрерывный режим ожидания ввода пользователем речевой команды приводит к тому, что выполнение функции распознавания речи непрерывно уменьшает имеющуюся электроэнергию терминала.
Таким образом, имеется преимущество, заключающееся в том, что контроллер 180 управляет включением и отключением функции распознавания речи для предотвращения потребления электроэнергии и потребления ресурсов терминала мобильной связи. В одном из примеров и как показано на Фиг.6А, устройство 130 ввода пользовательских данных, имеющееся в терминале мобильной связи, содержит виртуальную клавишу 350 на дисплее 151, к которой пользователь может прикоснуться для включения и отключения функции речевого управления. Кроме того, программная клавиша может иметь форму клавиши или может представлять собой пиктограмму конкретной формы. Виртуальная клавиша 350 может также быть заменена аппаратной клавишей 351, расположенной, например, на боковой стороне терминала, как показано на Фиг.6А.
В другом примере и как показано на Фиг.6Б, для активации и отключения функции распознавания речи может быть использован произвольный участок дисплея 151, при этом клавишу или пиктограмму не отображают на дисплее 151. В еще одном примере и как показано на Фиг.6В, для управления активацией и отключением функции распознавания речи может быть введен конкретный звук через микрофон 122 терминала мобильной связи.
В более подробном изложении, этим конкретным звуком может являться звук удара, уровень громкости которого превышает определенный уровень, например звук хлопка в ладоши, произведенного пользователем. В этом случае контроллер 180 обнаруживает звук удара с использованием алгоритма или схемы для определения уровня громкости звука, введенного через микрофон 122. То есть алгоритм или схема для обнаружения звука удара сконфигурированы таким образом, что обнаруживают звук, уровень громкости которого превышает конкретный заранее заданный уровень, и потребляют менее значительный объем ресурсов или мощности терминала мобильной связи по сравнению с функцией распознавания речи.
Преимущество также заключается в том, что пользователь может установить, какой именно звук удара следует использовать для активации функции распознавания речи. Например, пользователь может выбрать соответствующий пункт меню, предоставленный терминалом из настоящего изобретения, а затем хлопнуть в ладоши два раза или три раза для уведомления контроллера 180 о том, что для активации функции распознавания речи следует использовать конкретное количество звуков хлопков в ладоши. Пользователь также может задать любой другой звук в качестве звука для активации функции распознавания речи.
Кроме того, контроллер 180 может приводить в действие функцию распознавания речи во множестве режимов. Например, контроллер 180 может различным образом приводить в действие функцию распознавания речи в первом режиме, в котором функцию распознавания речи активирует звук, уровень громкости которого превышает определенный уровень, и во втором режиме, в котором принимают речевую команду и определяют ее содержание или смысл. А именно, если в первом режиме обнаружен звук, уровень громкости которого превышает определенный уровень, то контроллер 180 реализует второй режим для активации функции распознавания речевой команды.
Кроме того, в другом варианте осуществления изобретения контроллер 180 начинает активацию функции распознавания речи после получения информации о телодвижениях пользователя. В более подробном изложении, информация о телодвижениях содержит сигнал о движении руки или о жесте пользователя. Для обнаружения информации о телодвижениях пользователя может использоваться датчик 140. В еще одном варианте осуществления изобретения контроллер 180 начинает активацию функции распознавания речи после приема радиосигнала ближнего или дальнего действия с использованием беспроводного устройства.
Кроме того, контроллер 180 может принимать радиосигнал посредством блока 110 беспроводной связи и принимать сигнал о движении руки или о жесте пользователя посредством датчика 140. В этих вариантах осуществления изобретения блок 110 беспроводной связи, используемый для приема сигнала для активации функции распознавания речи, устройство 130 ввода пользовательских данных и датчик 140 могут в совокупности именоваться устройством ввода сигнала активации.
Кроме того, как изложено выше, контроллер 180 завершает или прекращает выполнение функции распознавания речи по истечении заранее заданного промежутка времени, после приема сигнала завершения от пользователя и т.д. для уменьшения потребляемой мощности и потребления ресурсов терминала мобильной связи. С этой целью сигнал завершения может соответствовать прикосновению к клавише или нажатию на нее, прикосновению к конкретному участку сенсорного экрана, звуку удара, радиосигналу или информации о телодвижении пользователя, точно так же или аналогично тому, как это делают для включения активации функции распознавания речи.
В более подробном изложении, контроллер 180 может начать активацию функции распознавания речи, сохранять активированное состояние функции распознавания речи в течение конкретного промежутка времени и автоматически завершать активированное состояние функции распознавания речи по истечении этого конкретного промежутка времени. В альтернативном варианте контроллер 180 может сохранять активированное состояние функции распознавания речи в течение времени непрерывного нажатия на клавишу или прикосновения к сенсору для ввода данных и завершать активированное состояние функции распознавания речи после отпускания этих средств ввода данных. В другом примере контроллер 180 может завершать функцию речевого управления в том случае, если пользователь не произносит слова в терминал в течение более длительного промежутка времени, чем конкретный промежуток времени.
На Фиг.7A изображена схема последовательности операций, на которой проиллюстрирован способ распознавания речи согласно одному из вариантов осуществления настоящего изобретения. В описании этого чертежа также ссылаются на Фиг.1. Как показано на Фиг.7A, когда начато выполнение функции распознавания речи (операция S201), то контроллер 180 сохраняет введенную речевую команду в запоминающем устройстве 160 (операция S202) и обрабатывает речевую команду согласно конкретному алгоритму распознавания речи (операция S203).
Затем в соответствии с алгоритмом распознавания речи контроллер 180 выполняет преобразование введенных речевых команд в текстовую информацию и сохраняет преобразованную текстовую информацию в произвольной области запоминающего устройства 160 (операция S204). После этого контроллер 180 обрабатывает текстовую информацию для определения смысла команды. Кроме того, в предпочтительном варианте контроллер 180 определяет смысл речевой команды одновременно с вводом речевых команд.
Однако, как упомянуто выше, контроллер 180 также может определять смысл речевых команд после завершения ввода речевых команд пользователем. Например, если речевая команда не введена пользователем в течение заранее заданного конкретного промежутка времени, то контроллер 180 может определить, что пользователь уже завершил ввод речевых команд, и затем он начинает процедуру определения смысла речевых команд.
Затем, как показано на Фиг.7A, контроллер 180 обнаруживает конкретные слова или ключевые слова, содержащиеся в текстовой информации, для определения смысла речевой команды (операция S205), и сравнивает обнаруженные слова или ключевые слова с информацией, связанной с различными функциями и меню, которая хранится в конкретной базе данных терминала мобильной связи (операция S206). Кроме того, когда в базе данных хранятся одинаковые или похожие слова или ключевые слова, то процент правильно распознанных слов речевой команды может быть определен по количеству соответствующих слов или ключевых слов (операция S207).
Кроме того, информация для определения процента правильно распознанных слов может быть не ограничена информацией о количестве слов или ключевых слов, содержащихся в речевой команде. То есть величина для определения процента правильно распознанных слов может быть установлена по-разному для каждого ключевого слова, поэтому даже в том случае, если количество слов или ключевых слов мало, процент правильно распознанных слов может быть изменен за счет ключевого слова с высокой вероятностью правильного распознавания.
Кроме того, процент правильно распознанных произнесенных слов представляет собой информацию, которая указывает, является ли смысл распознанной речевой команды точным или нет. В более подробном изложении, если наименование конкретного меню введено точно, то может быть получен процент правильно распознанных слов, равный 100%. Однако если речевая команда принята на естественном языке, то в речевой команде может содержаться незначащее слово, и каждый пользователь может по-иному произносить то же самое слово, поэтому в действительности трудно получить процент правильно распознанных слов, равный 100%.
Таким образом, в варианте осуществления настоящего изобретения преимущественно полагают, что процент правильно распознанных слов, превышающий конкретное значение (равное, например, 80%), дает точный результат. Следовательно, если имеется несколько смыслов, определенных с аналогичным процентом правильно распознанных слов (а именно, значения процента правильно распознанных слов являются сходными, но речевая команда может быть истолкована таким образом, что имеет различный смысл), то контроллер 180 отображает на дисплее множество исполняемых меню, которые соответствуют процентам правильно распознанных слов, превышающим заранее заданное пороговое значение, для того чтобы пользователь мог выбрать одно из отображенных на дисплее меню (операция S208).
Кроме того, контроллер 180 может также отобразить меню в порядке приоритетов, причем первым по порядку идет меню с самым высоким процентом правильно распознанных слов. Например, как показано на Фиг.7Б, пиктограмма меню с самым высоким процентом правильно распознанных слов может быть отображена в центральном участке экрана 410 дисплея. В альтернативном варианте, как показано на Фиг.7Б, пиктограмма меню с самым высоким процентом правильно распознанных слов может быть отображена на экране 420 дисплея таким образом, что имеет больший размер, является более темной или выделена яркостью. Отображенное меню, которому соответствует самый высокий процент правильно распознанных слов, также может быть отображено мерцающим.
Кроме того, для повышения процента правильно распознанных слов, если пользователь часто выбирает некоторое меню, то контроллер 180 может обучиться или запомнить то количество раз, которое было выбрано, и использовать эту информацию, полученную путем обучения, для изменения процента правильно распознанных слов для конкретного меню.
Таким образом, процент правильно распознанных слов может быть изменен для речевой команды, введенной со сходным или одинаковым произношением или содержанием.
На Фиг.7В в общем виде показаны выводимые на экран дисплея изображения для объяснения способа распознавания речи согласно одному из вариантов осуществления настоящего изобретения. Как показано на чертеже, когда пользователь вводит речевую команду "I want to see my pictures" ("Я хочу увидеть мои изображения") на естественном языке, то контроллер 180 обнаруживает значащие слова или ключевые слова (например, "see" ("увидеть"), "pictures" ("изображения")) из предложения, образующего речевую команду, и сравнивает эти слова с информацией, которая хранится в базе данных, имеющейся в терминале мобильной связи.
Кроме того, тот факт, являются ли обнаруженные слова или ключевые слова значащими словами или нет, может быть определен по частям речи. В альтернативном варианте в качестве значащего слова может быть обнаружено только конкретное заранее заданное ключевое слово. Затем контроллер 180 ищет в базе данных информацию, соответствующую значащим словам или ключевым словам.
Кроме того, база данных может содержать множество данных о ключевых словах, связанных с различными меню или функциями терминала мобильной связи. Например, в качестве информации о ключевых словах, соответствующей слову "фотоальбом", в дополнение к точному слову "фотоальбом" может быть запомнена информация, соответственно, о множестве ключевых слов, например меню более нижнего уровня для меню "камера", "фотография", "видео", "альбом" и т.д.
Как показано на экране 510 дисплея на Фиг.7В, когда отсутствует информация, связанная с меню или с функцией, которая идентична речевой команде, контроллер 180 отображает на дисплее множество меню, для каждого из которых процент правильно распознанных слов превышает конкретное значение. Как изложено выше, контроллер 180 отображает на дисплее пиктограмму 521 меню, имеющего самый высокий процент правильно распознанных слов, таким образом, что она является большей по размеру или более темной, чем другие отображенные на дисплее элементы.
Кроме того, на экране 520 дисплея на Фиг.7В проиллюстрировано автоматическое выполнение контроллером 180 соответствующей функции меню, для которого процент правильно распознанных слов превышает конкретное значение, при наличии только одного меню, для которого процент правильно распознанных слов превышает конкретное значение. Кроме того, контроллер 180 может вывести речевую команду, смысл которой был определен, в виде текстового сообщения, или сообщения иного типа, или в виде речевого сообщения.
На Фиг.7Г в общем виде показаны выводимые на экран дисплея изображения для объяснения способа распознавания речи согласно еще одному варианту осуществления настоящего изобретения. В этом варианте осуществления изобретения пользователь сначала активирует функцию распознавания речи путем прикосновении к экрану 610 дисплея, а затем вводит речевую команду "Enable battery saving" ("Разрешить переход в режим экономии энергии аккумулятора") на естественном языке, как показано на экране 620 дисплея. Затем контроллер 180 обнаруживает значащие слова или ключевые слова (например, "battery" аккумулятор, "saving" ("режим экономии энергии") в предложении, образующем речевую команду, и сравнивает эти слова с информацией, хранящейся в базе данных, для определения их смысла.
Однако, поскольку в этом варианте осуществления изобретения отсутствует какое-либо меню, точно соответствующее речевой команде, то контроллер 180 отображает на дисплее множество меню (например, "фоновое изображение", "фоновая подсветка", "экран в режиме ожидания" и т.д.), связанных с функцией уменьшения потребляемой мощности аккумулятора, что показано на экране 630 дисплея.
Кроме того, как изложено выше, по меньшей мере, один из следующих параметров: размер, положение, цвет и контраст множества меню может быть по-иному отображен или выделен на дисплее в соответствии с порядком следования согласно проценту правильно распознанных слов, начиная с наибольшего. Например, часто выбираемые пользователем меню с высокими значениями процента правильно распознанных слов могут быть отображены таким образом, чтобы отличаться от других меню.
На Фиг.8 изображена блок-схема, на которой проиллюстрированы базы данных для распознавания речи согласно одному из вариантов осуществления настоящего изобретения. Базы данных содержат хранящуюся в них информацию, используемую контроллером 180 для определения смысла речевой команды. Таким образом, множество баз данных может быть сконфигурировано в соответствии с характеристиками каждой информации. Кроме того, каждая база данных, сконфигурированная в соответствии с характеристиками каждой информации, может быть обновлена посредством непрерывного процесса обучения под управлением контроллера 180.
Кроме того, термин "процесс обучения" для баз данных относится к установлению соответствия между речевой информацией, произнесенной пользователем, и соответствующим словом. Например, если пользователем было произнесено слово "fifteen" ("пятнадцать"), но контроллер 180 распознает это слово как "fifty" ("пятьдесят"), то пользователь может исправить "пятьдесят" на "пятнадцать", в результате чего контроллер 180 распознает это же самое произношение впоследствии как слово "пятнадцать".
Следовательно, посредством этого процесса обучения может быть установлено соответствие множества данных с речевой информацией каждым данным из баз данных. Например, базы данных могут содержать первую базу 161 данных, предназначенную для хранения речевой информации, которая позволяет распознавать речь пользователя, введенную через микрофон, по формату, слогам или морфемам, вторую базу 162 данных, предназначенную для хранения информации, позволяющей контроллеру 180 определять общий смысл речевой команды на основании распознанной речевой информации, третью базу 163 данных, предназначенную для хранения информации, связанной с меню, для реализации функции или услуги терминала мобильной связи, и четвертую базу данных 164, предназначенную для хранения сообщений или речевой информации, подлежащих выводу из терминала мобильной связи для получения подтверждения пользователем смысла речевой команды, определенного контроллером.
Кроме того, в каждой базе данных может храниться информация о особенностях речи (о произношении) или информация о формате, о слогах, о морфемах, о словах, о ключевых словах или о предложениях. Соответственно, контроллер 180 может выполнять операцию распознавания речи и определять смысл речевой команды с использованием, по меньшей мере, одной из множества баз 161-164 данных, и реализовывать меню, связанное с функцией или с услугой, соответствующее этому определенному смыслу речевой команды.
На Фиг.9 в общем виде показано выводимое на экран дисплея изображение, на котором отображают информацию для уведомления пользователя о том, что в текущий момент времени в терминале мобильной связи согласно одному из вариантов осуществления настоящего изобретения выполняется распознанная речевая команда. В более подробном изложении, когда контроллером 180 распознана речевая команда или определен смысл речевой команды, контроллер 180 выводит соответствующее результирующее значение. Результирующим значением может являться управляющий сигнал для выполнения конкретной функции терминала мобильной связи, информация о меню, связанная с распознанной командой, или вывод информации в виде данных при выполнении функции. На Фиг.9 показано, что контроллер 180 выводит информацию 500, уведомляя пользователя о том, что введенная речевая команда была распознана.
Кроме того, описанные выше варианты осуществления изобретения относятся к распознаванию речевой команды пользователя. Однако настоящее изобретение также применимо и для того случая, когда пользователь выполняет дополнительную функцию ввода данных во время распознавания речевой команды. Например, функции распознавания речи и сенсорного ввода данных, распознавания речи и ввода данных посредством клавиш или распознавания речи и сенсорного ввода данных/ввода данных посредством клавиш могут выполняться одновременно.
Кроме того, контроллер 180 может не допускать выполнения функции распознавания речи в конкретном режиме или меню или в конкретном режиме работы. Кроме того, звуковая информация (например, звуковое уведомление или инструктивная информация) или видеоинформация (например, индикатор 500 на Фиг.9), указывающая, что в текущий момент применяется функция распознавания речи, может быть воспроизведена в режиме распознавания речи, в меню или в указателе режима работы. К тому же, информация о том, что в текущий момент применяется функция распознавания речи, может быть предоставлена пользователю путем вывода справочной информации.
Кроме того, описанные выше различные варианты осуществления изобретения могут быть реализованы в считываемом посредством компьютера носителе информации с использованием, например, компьютерного программного обеспечения, аппаратных средств или какой-либо их комбинации. Для варианта аппаратной реализации описанные выше варианты осуществления изобретения могут быть реализованы в одной или в большем количестве специализированных интегральных микросхем (ASIC), процессоров для цифровой обработки сигналов (DSP), устройств цифровой обработки сигналов (DSPD), программируемых логических устройств (PLD), программируемых пользователем вентильных матриц (FPGA), процессоров, контроллеров, микроконтроллеров, микропроцессоров, других электронных устройств, предназначенных для выполнения описанных здесь функций, или в выборочной комбинации этих устройств.
Для варианта программной реализации описанные здесь варианты осуществления изобретения могут быть реализованы посредством отдельных программных модулей, например, процедур и функций, каждая из которых выполняют одну или большее количество описанных здесь функций и операций. Программные коды могут быть реализованы посредством прикладной программы, написанной на любом подходящем языке программирования, и могут быть запомнены в запоминающем устройстве (например, в запоминающем устройстве 160) и выполнены контроллером или процессором (например, контроллером 180).
Кроме того, терминал 100 мобильной связи может быть реализован во множестве различных конфигураций. Примерами таких конфигураций являются, в том числе, следующие: конструкция складывающегося типа, конструкция сдвижного типа, конструкция прямоугольного типа, конструкция поворотного типа, конструкция шарнирного типа и их комбинации.
Поскольку приведенные в качестве примера варианты осуществления изобретения могут быть реализованы в нескольких вариантах, не выходя за пределы их отличительных признаков, то также следует понимать, что ни одна из подробностей приведенного выше описания не является ограничивающим признаком для описанных выше вариантов осуществления изобретения, за исключением тех случаев, когда это оговорено особо, а наоборот, их следует истолковывать расширительно в пределах объема патентных притязаний, определенного в прилагаемой формуле изобретения. Следовательно, подразумевают, что прилагаемая формула изобретения охватывает собой различные изменения и модификации, не выходящие за пределы объема формулы изобретения или эквивалентов этого объема патентных притязаний.
Claims (26)
1. Терминал мобильной связи, содержащий устройство ввода, сконфигурированное для приема введенных данных для активации функции распознавания речи в терминале мобильной связи, запоминающее устройство, сконфигурированное для запоминания информации, связанной с операциями, выполняемыми с терминалом мобильной связи, и контроллер, сконфигурированный для активации функции распознавания речи после приема введенных данных определения смысла введенной речевой команды на основании, по меньшей мере, одной предшествующей операции, выполненной в терминале мобильной связи, и языка речевой команды, и обеспечения выполнения операций, связанных с определенным смыслом входной речевой команды, на основании упомянутой, по меньшей мере, одной предшествующей операции, выполненной в терминале мобильной связи, и языка, содержащегося в речевой команде, и на основании вероятности того, что определенный смысл введенной речевой команды соответствует информации, связанной с операциями терминала мобильной связи.
2. Терминал мобильной связи по п.1, в котором в обеспеченных операциях исключены промежуточные операции так, что в результате выбора обеспеченной операции выполняются функции, соответствующей выбранной обеспеченной операции, без необходимости выбора исключенных промежуточных операций.
3. Терминал мобильной связи по п.1, в котором обеспеченные операции, связанные с определенным смыслом речевой команды, включены все операции, для которых вероятность больше заранее заданное пороговое значение.
4. Терминал, мобильной связи по п.3, в котором заранее заданное пороговое значение установлено производителем терминала или пользователем терминала.
5. Терминал мобильной связи по п.3, в котором заранее заданное пороговое значение выбирается автоматически на основании определенного количества операций.
6. Терминал мобильной связи по п.1, в котором контроллер дополнительно сконфигурирован для определения смысла введенной речевой команды на основании режима работы терминала мобильной связи.
7. Терминал мобильной связи по п.1, в котором в обеспеченных операциях, связанных с определенным смыслом введенной речевой команды, содержится, по меньшей мере, один пункт меню, соответствующий определенному смыслу введенной речевой команды.
8. Терминал мобильной связи по п.7, в котором контроллер дополнительно сконфигурирован для вывода всех пунктов меню, соответствующих определенному смыслу введенной речевой команды, для которых вероятность больше заранее заданное порогового значения.
9. Терминал мобильной связи по п.8, в котором контроллер дополнительно сконфигурирован для отображения на дисплее исключительно пункт меню, соответствующего определенному смыслу введенной речевой команды имеющей наибольшую вероятность относительно других меню.
10. Терминал мобильной связи по п.9, в котором контроллер отображается на дисплее исключительно пункт меню, соответствующий определенному смыслу введенной речевой команды, имеющей наибольшую вероятность, путем дифференцированного управления информацией, по меньшей мере, об одном из: размера, положения на экране дисплея, цвета, контраста и подсветки, того пункта меню, для которого вероятность является наибольшей.
11. Терминал мобильной связи по п.1, в котором устройство ввода содержит, по меньшей мере, одно из следующих средств: 1) сенсорную клавишу с программируемыми функциями, затрагиваемую для активации функции распознавания речи, 2) аппаратную клавишу, нажимаемую или с манипулируемую для активации функции распознавания речи, 3) произвольное место сенсорного экрана, содержащегося в устройстве ввода, затрагиваемого для активизации функции распознавания речи, 4) звук удара, вводимый для активации функции распознавания речи, 5) радиосигнал ближнего действия или радиосигнал дальнего действия, и 6) сигнал от пользователя с информацией о его телодвижениях.
12. Терминал мобильной связи по п.1, также содержащий: первую базу данных, сконфигурированную для хранения речевой информации или информации о произношении, используемой контроллером для распознавания речевой команды; вторую базу данных, сконфигурированную для хранения информации о словах, о ключевых словах или о предложениях, используемой контроллером для распознавания речевой команды; третью базу данных, сконфигурированную для хранения информации, связанной с функциями или с меню терминала мобильной связи; и четвертую базу данных, сконфигурированную для хранения справочной информации, выводимой для информирования пользователя о том, что контроллер пытается определить смысл распознанной речевой команды.
13. Терминал мобильной связи по п.1, в котором контроллер дополнительно сконфигурирован для вывода звуковой или видеоинформации, указывающей, что функция распознавания речи находится в активированном состоянии.
14. Способ управления терминалом мобильной связи, содержащий следующие операции: принимают введенные данные для активации функции распознавания речи в терминале мобильной связи; активируют функцию распознавания речи, после приема введенных данных; и обеспечивают выполнение операций, связанных с определенным смыслом введенной речевой команды, на основании сведений, по меньшей мере, об одной предшествующей операции, выполненной в терминале мобильной связи, и языка речевой команды, и на основании вероятности того, что определенный смысл введенной речевой команды соответствует информации, связанной с операциями терминала мобильной связи.
15. Способ по п.14, в котором предусмотренные операции исключают промежуточные операции, вследствие чего выбор предусмотренной операции приводит к выполнению функции, соответствующей выбранной обеспеченной операции, без необходимости выбора исключенных промежуточных операций.
16. Способ по п.14, в котором предусмотренные операции, связанные с определенным смыслом речевой команды, включают в себя все операции, для которых вероятность превышает заранее заданное пороговое значение.
17. Способ по п.16, в котором заданное пороговое значение установлено производителем терминала или пользователем терминала.
18. Способ по п.16, в котором заранее заданное пороговое значение выбирают автоматически на основании определенного количества операций.
19. Способ по п.14, также содержащий операцию, на которой определяют смысл введенной речевой команды на основании, по меньшей мере, одной предшествующей операции, выполненной в терминале мобильной связи, и языка речевой команды.
20. Способ по п.19, также содержащий операцию, на которой определяют смысл введенной речевой команды на основании режима работы терминала мобильной связи.
21. Способ по п.20, в котором обеспеченные операции, связанные с определенным смыслом введенной речевой команды, содержат, по меньшей мере, один пункт меню, соответствующий определенному смыслу введенной речевой команды.
22. Способ по п.21, также содержащий операцию, на которой выводят все пункты меню, соответствующие определенному смыслу введенной речевой команды, для которых вероятность превышает заранее заданное пороговое значение.
23. Способ по п.22, также содержащий операцию, на которой отображают на дисплее исключительно пункт меню, соответствующий определенному смыслу введенной речевой команды, для которого вероятность является наибольшей относительно других меню.
24. Способ по п.23, в котором операцию, при которой на дисплее отображают исключительно пункт меню, соответствующий определенному смыслу введенной речевой команды, для которого вероятность является наибольшей, выполняют путем дифференцированного управления информацией, по меньшей мере, об одном из следующего: размер, положение на экране дисплея, цвет, контраст и подсветка, того пункта меню, для которого вероятность является наибольшей.
25. Способ по п.14, в котором операция ввода содержит активацию функции распознавания речи с использованием, по меньшей мере, одного из следующих средств: 1) сенсорной виртуальной клавиши, к которой прикасаются для активации функции распознавания речи, 2) аппаратной клавиши, которую нажимают или над которой совершают манипуляции для активации функции распознавания речи, 3) произвольного места сенсорного экрана, содержащегося в устройстве ввода, к которому прикасаются для активации функции распознавания речи, 4) звука удара, который вводят для активации функции распознавания речи, 5) радиосигнала ближнего действия или радиосигнала дальнего действия, и 6) сигнала с информацией о телодвижениях от пользователя.
26. Способ по п.14, также содержащий операцию, на которой выводят звуковую или видеоинформацию, указывающую, что функция распознавания речи находится в активированном состоянии.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020080032842A KR20090107365A (ko) | 2008-04-08 | 2008-04-08 | 이동 단말기 및 그 메뉴 제어방법 |
KR10-2008-0032842 | 2008-04-08 |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2008126782A RU2008126782A (ru) | 2010-01-10 |
RU2394386C2 true RU2394386C2 (ru) | 2010-07-10 |
Family
ID=40445594
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2008126782A RU2394386C2 (ru) | 2008-04-08 | 2008-07-01 | Терминал мобильной связи и способ управления его меню |
Country Status (6)
Country | Link |
---|---|
US (2) | US8150700B2 (ru) |
EP (1) | EP2109298B1 (ru) |
JP (1) | JP5481058B2 (ru) |
KR (1) | KR20090107365A (ru) |
CN (1) | CN101557651B (ru) |
RU (1) | RU2394386C2 (ru) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013162414A1 (ru) * | 2012-04-23 | 2013-10-31 | Janovskiy Igor Vladimirovich | Терминал беспроводной голосовой связи |
RU2596994C2 (ru) * | 2010-11-09 | 2016-09-10 | Конинклейке Филипс Электроникс Н.В. | Пользовательский интерфейс с тактильной обратной связью |
RU2601152C2 (ru) * | 2014-09-09 | 2016-10-27 | ХЕРЕ Глобал Б.В. | Устройство, способ и компьютерная программа для обеспечения предоставления информации пользователю |
RU2611023C2 (ru) * | 2011-02-10 | 2017-02-17 | Самсунг Электроникс Ко., Лтд. | Устройство, включающее в себя множество сенсорных экранов, и способ переключения экранов для устройства |
RU2637900C2 (ru) * | 2015-03-26 | 2017-12-07 | Сяоми Инк. | Способ и устройство для активизации элемента |
Families Citing this family (268)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US10002189B2 (en) | 2007-12-20 | 2018-06-19 | Apple Inc. | Method and apparatus for searching using an active ontology |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
KR20090107365A (ko) * | 2008-04-08 | 2009-10-13 | 엘지전자 주식회사 | 이동 단말기 및 그 메뉴 제어방법 |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
WO2010067118A1 (en) | 2008-12-11 | 2010-06-17 | Novauris Technologies Limited | Speech recognition involving a mobile device |
KR101566379B1 (ko) * | 2009-05-07 | 2015-11-13 | 삼성전자주식회사 | 입력 신호 종류 별 사용자 기능 활성화 방법 및 이를 지원하는 휴대 단말기 |
US10255566B2 (en) | 2011-06-03 | 2019-04-09 | Apple Inc. | Generating and processing task items that represent tasks to perform |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
WO2011089450A2 (en) | 2010-01-25 | 2011-07-28 | Andrew Peter Nelson Jerram | Apparatuses, methods and systems for a digital conversation management platform |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US20110246194A1 (en) * | 2010-03-30 | 2011-10-06 | Nvoq Incorporated | Indicia to indicate a dictation application is capable of receiving audio |
US8738377B2 (en) * | 2010-06-07 | 2014-05-27 | Google Inc. | Predicting and learning carrier phrases for speech input |
US8296151B2 (en) * | 2010-06-18 | 2012-10-23 | Microsoft Corporation | Compound gesture-speech commands |
US10762293B2 (en) | 2010-12-22 | 2020-09-01 | Apple Inc. | Using parts-of-speech tagging and named entity recognition for spelling correction |
JP5039214B2 (ja) * | 2011-02-17 | 2012-10-03 | 株式会社東芝 | 音声認識操作装置及び音声認識操作方法 |
US8630860B1 (en) * | 2011-03-03 | 2014-01-14 | Nuance Communications, Inc. | Speaker and call characteristic sensitive open voice search |
CN102685307A (zh) * | 2011-03-15 | 2012-09-19 | 中兴通讯股份有限公司 | 命令信息处理方法、装置及系统 |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
EP2506202A1 (en) * | 2011-03-29 | 2012-10-03 | Research In Motion Limited | Mobile wireless communications device for selecting a payment account to use with a payment processing system based upon a microphone or device profile and associated methods |
JP2015039071A (ja) * | 2011-03-30 | 2015-02-26 | 株式会社東芝 | 音声認識操作装置及び音声認識操作方法 |
US20120304067A1 (en) * | 2011-05-25 | 2012-11-29 | Samsung Electronics Co., Ltd. | Apparatus and method for controlling user interface using sound recognition |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
KR20130032966A (ko) | 2011-09-26 | 2013-04-03 | 엘지전자 주식회사 | 사용자 인터페이스 방법 및 장치 |
US9992745B2 (en) | 2011-11-01 | 2018-06-05 | Qualcomm Incorporated | Extraction and analysis of buffered audio data using multiple codec rates each greater than a low-power processor rate |
KR20180137041A (ko) | 2011-12-07 | 2018-12-26 | 퀄컴 인코포레이티드 | 디지털화된 오디오 스트림을 분석하는 저전력 집적 회로 |
KR101590332B1 (ko) * | 2012-01-09 | 2016-02-18 | 삼성전자주식회사 | 영상장치 및 그 제어방법 |
KR101889836B1 (ko) | 2012-02-24 | 2018-08-20 | 삼성전자주식회사 | 음성인식을 통한 단말기의 잠금 상태 해제 및 조작 방법 및 장치 |
JP5814823B2 (ja) * | 2012-02-28 | 2015-11-17 | 京セラ株式会社 | 携帯端末、特定モード設定プログラムおよび特定モード設定方法 |
US10276156B2 (en) * | 2012-02-29 | 2019-04-30 | Nvidia Corporation | Control using temporally and/or spectrally compact audio commands |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
JP2013238935A (ja) * | 2012-05-11 | 2013-11-28 | Sharp Corp | 入力装置、入力装置の制御方法、制御プログラム、および記録媒体 |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US9400633B2 (en) * | 2012-08-02 | 2016-07-26 | Nuance Communications, Inc. | Methods and apparatus for voiced-enabling a web application |
US9781262B2 (en) * | 2012-08-02 | 2017-10-03 | Nuance Communications, Inc. | Methods and apparatus for voice-enabling a web application |
US10157612B2 (en) | 2012-08-02 | 2018-12-18 | Nuance Communications, Inc. | Methods and apparatus for voice-enabling a web application |
US9292252B2 (en) | 2012-08-02 | 2016-03-22 | Nuance Communications, Inc. | Methods and apparatus for voiced-enabling a web application |
CN102883041A (zh) * | 2012-08-02 | 2013-01-16 | 聚熵信息技术(上海)有限公司 | 移动终端的语音控制装置及方法 |
US9292253B2 (en) | 2012-08-02 | 2016-03-22 | Nuance Communications, Inc. | Methods and apparatus for voiced-enabling a web application |
CN103578472A (zh) * | 2012-08-10 | 2014-02-12 | 海尔集团公司 | 电器设备的控制方法和控制装置 |
CN103593134B (zh) * | 2012-08-17 | 2018-01-23 | 上海博泰悦臻电子设备制造有限公司 | 车载设备和语音功能的控制方法 |
CN103593081B (zh) * | 2012-08-17 | 2017-11-07 | 上海博泰悦臻电子设备制造有限公司 | 车载设备和语音功能的控制方法 |
US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
JP6068901B2 (ja) * | 2012-09-26 | 2017-01-25 | 京セラ株式会社 | 情報端末、音声操作プログラムおよび音声操作方法 |
US8468023B1 (en) | 2012-10-01 | 2013-06-18 | Google Inc. | Handsfree device with countinuous keyword recognition |
JP6133564B2 (ja) * | 2012-10-05 | 2017-05-24 | 京セラ株式会社 | 電子機器、制御方法、及び制御プログラム |
CN110636163A (zh) * | 2012-11-20 | 2019-12-31 | 华为终端有限公司 | 一种语音响应的方法及移动设备 |
CN103871401B (zh) * | 2012-12-10 | 2016-12-28 | 联想(北京)有限公司 | 一种语音识别的方法及电子设备 |
CN103869948B (zh) * | 2012-12-14 | 2019-01-15 | 联想(北京)有限公司 | 语音命令处理方法和电子设备 |
CN104871240A (zh) | 2012-12-28 | 2015-08-26 | 索尼公司 | 信息处理设备、信息处理方法、以及程序 |
KR101732137B1 (ko) | 2013-01-07 | 2017-05-02 | 삼성전자주식회사 | 원격 제어 장치 및 전력 제어 방법 |
BR112015018905B1 (pt) | 2013-02-07 | 2022-02-22 | Apple Inc | Método de operação de recurso de ativação por voz, mídia de armazenamento legível por computador e dispositivo eletrônico |
KR102057629B1 (ko) * | 2013-02-19 | 2020-01-22 | 엘지전자 주식회사 | 이동 단말기 및 이동 단말기의 제어 방법 |
US9734819B2 (en) | 2013-02-21 | 2017-08-15 | Google Technology Holdings LLC | Recognizing accented speech |
CN104247280A (zh) * | 2013-02-27 | 2014-12-24 | 视听公司 | 话音控制的通信连接 |
US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
US9661136B2 (en) | 2013-03-15 | 2017-05-23 | Adesign | Mobile device having function of controlling call connection in lock mode by using voice signal |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
KR101331122B1 (ko) * | 2013-03-15 | 2013-11-19 | 주식회사 에이디자인 | 모바일 기기의 수신시 통화연결 방법 |
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
WO2014144949A2 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | Training an at least partial voice command system |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
EP3008641A1 (en) | 2013-06-09 | 2016-04-20 | Apple Inc. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
CN105265005B (zh) | 2013-06-13 | 2019-09-17 | 苹果公司 | 用于由语音命令发起的紧急呼叫的系统和方法 |
KR101749009B1 (ko) | 2013-08-06 | 2017-06-19 | 애플 인크. | 원격 디바이스로부터의 활동에 기초한 스마트 응답의 자동 활성화 |
GB2518002B (en) * | 2013-09-10 | 2017-03-29 | Jaguar Land Rover Ltd | Vehicle interface system |
US9508345B1 (en) | 2013-09-24 | 2016-11-29 | Knowles Electronics, Llc | Continuous voice sensing |
KR102155482B1 (ko) * | 2013-10-15 | 2020-09-14 | 삼성전자 주식회사 | 디스플레이장치 및 그 제어방법 |
US9532155B1 (en) | 2013-11-20 | 2016-12-27 | Knowles Electronics, Llc | Real time monitoring of acoustic environments using ultrasound |
US10296160B2 (en) | 2013-12-06 | 2019-05-21 | Apple Inc. | Method for extracting salient dialog usage from live data |
CN104754203B (zh) * | 2013-12-31 | 2018-07-31 | 华为技术有限公司 | 拍摄方法、装置及终端 |
US9462169B2 (en) | 2013-12-31 | 2016-10-04 | Huawei Technologies Co., Ltd. | Shooting method, apparatus, and terminal |
KR102218906B1 (ko) * | 2014-01-17 | 2021-02-23 | 엘지전자 주식회사 | 이동 단말기 및 이의 제어 방법 |
CN104917904A (zh) * | 2014-03-14 | 2015-09-16 | 联想(北京)有限公司 | 一种语音信息处理方法、装置和电子设备 |
US9437188B1 (en) | 2014-03-28 | 2016-09-06 | Knowles Electronics, Llc | Buffered reprocessing for multi-microphone automatic speech recognition assist |
US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
CN106471570B (zh) | 2014-05-30 | 2019-10-01 | 苹果公司 | 多命令单一话语输入方法 |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
HUE039773T2 (hu) * | 2014-06-11 | 2019-02-28 | Huawei Tech Co Ltd | Eljárás és terminál egy alkalmazás szolgáltatás gyorsindítására |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
KR102367132B1 (ko) * | 2014-07-31 | 2022-02-25 | 삼성전자주식회사 | 디바이스 및 디바이스의 기능 수행 방법 |
WO2016017978A1 (en) * | 2014-07-31 | 2016-02-04 | Samsung Electronics Co., Ltd. | Device and method for performing functions |
KR20160016491A (ko) * | 2014-07-31 | 2016-02-15 | 삼성전자주식회사 | 디바이스 및 디바이스의 기능 수행 방법 |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9846496B2 (en) | 2014-09-04 | 2017-12-19 | Home Box Office, Inc. | Virtual input device system |
US10044591B2 (en) | 2014-09-04 | 2018-08-07 | Home Box Office, Inc. | Two-way remote communication system for testing a client device program |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
CN104267922B (zh) * | 2014-09-16 | 2019-05-31 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US10444977B2 (en) * | 2014-12-05 | 2019-10-15 | Verizon Patent And Licensing Inc. | Cellphone manager |
US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
KR20160089782A (ko) * | 2015-01-20 | 2016-07-28 | 엘지전자 주식회사 | 이동 단말기 및 그 제어 방법 |
US10152299B2 (en) | 2015-03-06 | 2018-12-11 | Apple Inc. | Reducing response latency of intelligent automated assistants |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US10460227B2 (en) | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10200824B2 (en) | 2015-05-27 | 2019-02-05 | Apple Inc. | Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device |
KR20160142528A (ko) * | 2015-06-03 | 2016-12-13 | 엘지전자 주식회사 | 단말 장치, 네트워크 시스템 및 그 제어 방법 |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
US9407989B1 (en) | 2015-06-30 | 2016-08-02 | Arthur Woodrow | Closed audio circuit |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10740384B2 (en) | 2015-09-08 | 2020-08-11 | Apple Inc. | Intelligent automated assistant for media search and playback |
US10331312B2 (en) | 2015-09-08 | 2019-06-25 | Apple Inc. | Intelligent automated assistant in a media environment |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10956666B2 (en) | 2015-11-09 | 2021-03-23 | Apple Inc. | Unconventional virtual assistant interactions |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
JP2017146437A (ja) * | 2016-02-17 | 2017-08-24 | 本田技研工業株式会社 | 音声入力処理装置 |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US11176930B1 (en) * | 2016-03-28 | 2021-11-16 | Amazon Technologies, Inc. | Storing audio commands for time-delayed execution |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US11227589B2 (en) | 2016-06-06 | 2022-01-18 | Apple Inc. | Intelligent list reading |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179309B1 (en) | 2016-06-09 | 2018-04-23 | Apple Inc | Intelligent automated assistant in a home environment |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
US20180039478A1 (en) * | 2016-08-02 | 2018-02-08 | Google Inc. | Voice interaction services |
US10261752B2 (en) * | 2016-08-02 | 2019-04-16 | Google Llc | Component libraries for voice interaction services |
US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
EP3490232B1 (en) | 2016-10-27 | 2020-02-26 | NTT DoCoMo, Inc. | Communication terminal device, program, and information processing method |
KR102594022B1 (ko) | 2016-11-24 | 2023-10-26 | 삼성전자주식회사 | 전자 장치 및 그의 채널맵 업데이트 방법 |
US11281993B2 (en) | 2016-12-05 | 2022-03-22 | Apple Inc. | Model and ensemble compression for metric learning |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
CN106683675A (zh) * | 2017-02-08 | 2017-05-17 | 张建华 | 一种控制方法及语音操作系统 |
US10353480B2 (en) | 2017-04-17 | 2019-07-16 | Essential Products, Inc. | Connecting assistant device to devices |
US10355931B2 (en) * | 2017-04-17 | 2019-07-16 | Essential Products, Inc. | Troubleshooting voice-enabled home setup |
CN106910503A (zh) * | 2017-04-26 | 2017-06-30 | 海信集团有限公司 | 用于智能终端显示用户操控指令的方法、装置和智能终端 |
DK201770383A1 (en) | 2017-05-09 | 2018-12-14 | Apple Inc. | USER INTERFACE FOR CORRECTING RECOGNITION ERRORS |
US10417266B2 (en) | 2017-05-09 | 2019-09-17 | Apple Inc. | Context-aware ranking of intelligent response suggestions |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
DK180048B1 (en) | 2017-05-11 | 2020-02-04 | Apple Inc. | MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION |
US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK201770427A1 (en) | 2017-05-12 | 2018-12-20 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
US20180336892A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Detecting a trigger of a digital assistant |
US20180336275A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Intelligent automated assistant for media exploration |
US10403278B2 (en) | 2017-05-16 | 2019-09-03 | Apple Inc. | Methods and systems for phonetic matching in digital assistant services |
US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
DK179560B1 (en) | 2017-05-16 | 2019-02-18 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US10657328B2 (en) | 2017-06-02 | 2020-05-19 | Apple Inc. | Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling |
CN107544827A (zh) * | 2017-08-23 | 2018-01-05 | 金蝶软件(中国)有限公司 | 一种功能调用的方法及相关装置 |
JP6914154B2 (ja) * | 2017-09-15 | 2021-08-04 | シャープ株式会社 | 表示制御装置、表示制御方法及びプログラム |
US10445429B2 (en) | 2017-09-21 | 2019-10-15 | Apple Inc. | Natural language understanding using vocabularies with compressed serialized tries |
US10755051B2 (en) | 2017-09-29 | 2020-08-25 | Apple Inc. | Rule-based natural language processing |
CN207199277U (zh) * | 2017-10-11 | 2018-04-06 | 京东方科技集团股份有限公司 | 一种显示装置 |
CN107945806B (zh) * | 2017-11-10 | 2022-03-08 | 北京小米移动软件有限公司 | 基于声音特征的用户识别方法及装置 |
US10636424B2 (en) | 2017-11-30 | 2020-04-28 | Apple Inc. | Multi-turn canned dialog |
US10733982B2 (en) | 2018-01-08 | 2020-08-04 | Apple Inc. | Multi-directional dialog |
US10733375B2 (en) | 2018-01-31 | 2020-08-04 | Apple Inc. | Knowledge-based framework for improving natural language understanding |
US10789959B2 (en) | 2018-03-02 | 2020-09-29 | Apple Inc. | Training speaker recognition models for digital assistants |
US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
US10909331B2 (en) | 2018-03-30 | 2021-02-02 | Apple Inc. | Implicit identification of translation payload with neural machine translation |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US10984780B2 (en) | 2018-05-21 | 2021-04-20 | Apple Inc. | Global semantic word embeddings using bi-directional recurrent neural networks |
US11386266B2 (en) | 2018-06-01 | 2022-07-12 | Apple Inc. | Text correction |
DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
DK201870355A1 (en) | 2018-06-01 | 2019-12-16 | Apple Inc. | VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
US10504518B1 (en) | 2018-06-03 | 2019-12-10 | Apple Inc. | Accelerated task performance |
FI20185605A1 (en) * | 2018-06-29 | 2019-12-30 | Crf Box Oy | Continuous verification of user identity in clinical trials via audio-based user interface |
US11010561B2 (en) | 2018-09-27 | 2021-05-18 | Apple Inc. | Sentiment prediction from textual data |
US10839159B2 (en) | 2018-09-28 | 2020-11-17 | Apple Inc. | Named entity normalization in a spoken dialog system |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US11170166B2 (en) | 2018-09-28 | 2021-11-09 | Apple Inc. | Neural typographical error modeling via generative adversarial networks |
US11475898B2 (en) | 2018-10-26 | 2022-10-18 | Apple Inc. | Low-latency multi-speaker speech recognition |
CN109688474A (zh) * | 2018-12-28 | 2019-04-26 | 南京创维信息技术研究院有限公司 | 电视语音控制方法、装置和计算机可读存储介质 |
US11638059B2 (en) | 2019-01-04 | 2023-04-25 | Apple Inc. | Content playback on multiple devices |
CN109887487B (zh) * | 2019-01-29 | 2021-05-11 | 北京声智科技有限公司 | 一种数据筛选方法、装置及电子设备 |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
CN109976702A (zh) * | 2019-03-20 | 2019-07-05 | 青岛海信电器股份有限公司 | 一种语音识别方法、装置及终端 |
DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
US11475884B2 (en) | 2019-05-06 | 2022-10-18 | Apple Inc. | Reducing digital assistant latency when a language is incorrectly determined |
US11423908B2 (en) | 2019-05-06 | 2022-08-23 | Apple Inc. | Interpreting spoken requests |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
US11496600B2 (en) | 2019-05-31 | 2022-11-08 | Apple Inc. | Remote execution of machine-learned models |
DK180129B1 (en) | 2019-05-31 | 2020-06-02 | Apple Inc. | USER ACTIVITY SHORTCUT SUGGESTIONS |
US11289073B2 (en) | 2019-05-31 | 2022-03-29 | Apple Inc. | Device text to speech |
DK201970511A1 (en) | 2019-05-31 | 2021-02-15 | Apple Inc | Voice identification in digital assistant systems |
US11227599B2 (en) | 2019-06-01 | 2022-01-18 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
US11360641B2 (en) | 2019-06-01 | 2022-06-14 | Apple Inc. | Increasing the relevance of new available information |
US11449308B2 (en) * | 2019-07-19 | 2022-09-20 | Google Llc | Condensed spoken utterances for automated assistant control of an intricate application GUI |
JP7237356B2 (ja) * | 2019-08-28 | 2023-03-13 | 株式会社トーアエンジニアリング | Cad制御支援システム |
US11488406B2 (en) | 2019-09-25 | 2022-11-01 | Apple Inc. | Text detection using global geometry estimators |
JP7447458B2 (ja) * | 2019-12-13 | 2024-03-12 | コニカミノルタ株式会社 | 制御装置、制御システム及び制御プログラム |
US11061543B1 (en) | 2020-05-11 | 2021-07-13 | Apple Inc. | Providing relevant data items based on context |
US11038934B1 (en) | 2020-05-11 | 2021-06-15 | Apple Inc. | Digital assistant hardware abstraction |
US11490204B2 (en) | 2020-07-20 | 2022-11-01 | Apple Inc. | Multi-device audio adjustment coordination |
US11438683B2 (en) | 2020-07-21 | 2022-09-06 | Apple Inc. | User identification using headphones |
CN112397069A (zh) * | 2021-01-19 | 2021-02-23 | 成都启英泰伦科技有限公司 | 一种语音遥控方法及装置 |
US11680209B1 (en) | 2021-12-13 | 2023-06-20 | Uop Llc | Process for converting plastic feed containing polypropylene to aromatics |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2647190A1 (en) * | 2006-03-31 | 2007-10-11 | Kyocera Corporation | Mobile communication terminal and program |
CA2650457A1 (en) * | 2006-05-08 | 2007-11-15 | Nokia Corporation | Improved mobile communication terminal and method |
CA2654161A1 (en) * | 2006-06-20 | 2007-12-27 | Telefonaktiebolaget Lm Ericsson (Publ) | Arrangement and method for controlling service activation on a mobile terminal |
Family Cites Families (86)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6237734A (ja) * | 1985-08-12 | 1987-02-18 | Matsushita Electric Ind Co Ltd | 命令選択装置 |
JPH05341951A (ja) * | 1992-06-11 | 1993-12-24 | Toshiba Corp | 音声入力操作装置 |
JP3725566B2 (ja) * | 1992-12-28 | 2005-12-14 | 株式会社東芝 | 音声認識インターフェース |
US5452289A (en) * | 1993-01-08 | 1995-09-19 | Multi-Tech Systems, Inc. | Computer-based multifunction personal communications system |
CA2115210C (en) | 1993-04-21 | 1997-09-23 | Joseph C. Andreshak | Interactive computer system recognizing spoken commands |
FI981154A (fi) | 1998-05-25 | 1999-11-26 | Nokia Mobile Phones Ltd | Menetelmä ja laite puheen tunnistamiseksi |
WO2000010160A1 (fr) | 1998-08-17 | 2000-02-24 | Sony Corporation | Dispositif et procede de reconnaissance vocale, dispositif de navigation, telephone portable et processeur d'informations |
US6965863B1 (en) * | 1998-11-12 | 2005-11-15 | Microsoft Corporation | Speech recognition user interface |
US7881936B2 (en) * | 1998-12-04 | 2011-02-01 | Tegic Communications, Inc. | Multimodal disambiguation of speech recognition |
US6233560B1 (en) * | 1998-12-16 | 2001-05-15 | International Business Machines Corporation | Method and apparatus for presenting proximal feedback in voice command systems |
KR100310339B1 (ko) * | 1998-12-30 | 2002-01-17 | 윤종용 | 이동전화 단말기의 음성인식 다이얼링 방법 |
US6519479B1 (en) * | 1999-03-31 | 2003-02-11 | Qualcomm Inc. | Spoken user interface for speech-enabled devices |
US6434527B1 (en) * | 1999-05-17 | 2002-08-13 | Microsoft Corporation | Signalling and controlling the status of an automatic speech recognition system for use in handsfree conversational dialogue |
US6931384B1 (en) * | 1999-06-04 | 2005-08-16 | Microsoft Corporation | System and method providing utility-based decision making about clarification dialog given communicative uncertainty |
US6622119B1 (en) * | 1999-10-30 | 2003-09-16 | International Business Machines Corporation | Adaptive command predictor and method for a natural language dialog system |
US7725307B2 (en) * | 1999-11-12 | 2010-05-25 | Phoenix Solutions, Inc. | Query engine for processing voice based queries including semantic decoding |
GB2358987B (en) | 2000-02-01 | 2003-10-29 | Ericsson Telefon Ab L M | Electronic devices |
US6895380B2 (en) * | 2000-03-02 | 2005-05-17 | Electro Standards Laboratories | Voice actuation with contextual learning for intelligent machine control |
US6934684B2 (en) * | 2000-03-24 | 2005-08-23 | Dialsurf, Inc. | Voice-interactive marketplace providing promotion and promotion tracking, loyalty reward and redemption, and other features |
JP2001296881A (ja) * | 2000-04-14 | 2001-10-26 | Sony Corp | 情報処理装置および方法、並びに記録媒体 |
US6587824B1 (en) * | 2000-05-04 | 2003-07-01 | Visteon Global Technologies, Inc. | Selective speaker adaptation for an in-vehicle speech recognition system |
AU2001272009A1 (en) * | 2000-06-16 | 2001-12-24 | Healthetech, Inc. | Speech recognition capability for a personal digital assistant |
US6658386B2 (en) * | 2000-12-12 | 2003-12-02 | International Business Machines Corporation | Dynamically adjusting speech menu presentation style |
JP3919210B2 (ja) * | 2001-02-15 | 2007-05-23 | アルパイン株式会社 | 音声入力案内方法及び装置 |
GB2372864B (en) * | 2001-02-28 | 2005-09-07 | Vox Generation Ltd | Spoken language interface |
US20020152071A1 (en) * | 2001-04-12 | 2002-10-17 | David Chaiken | Human-augmented, automatic speech recognition engine |
JP2003241790A (ja) * | 2002-02-13 | 2003-08-29 | Internatl Business Mach Corp <Ibm> | 音声コマンド処理システム、コンピュータ装置、音声コマンド処理方法およびプログラム |
US7398209B2 (en) * | 2002-06-03 | 2008-07-08 | Voicebox Technologies, Inc. | Systems and methods for responding to natural language speech utterance |
EP1400953B1 (en) * | 2002-09-12 | 2013-03-20 | me2me AG | Method for building speech and/or language recognition models |
US20070186480A1 (en) * | 2002-11-22 | 2007-08-16 | Brian Freeman | Automatic door control system |
US6993482B2 (en) * | 2002-12-18 | 2006-01-31 | Motorola, Inc. | Method and apparatus for displaying speech recognition results |
KR100668297B1 (ko) * | 2002-12-31 | 2007-01-12 | 삼성전자주식회사 | 음성인식방법 및 장치 |
US7333803B2 (en) * | 2004-01-20 | 2008-02-19 | Lucent Technologies Inc. | Network support for voice-to-text memo service |
US20050177373A1 (en) * | 2004-02-05 | 2005-08-11 | Avaya Technology Corp. | Methods and apparatus for providing context and experience sensitive help in voice applications |
US20090164215A1 (en) * | 2004-02-09 | 2009-06-25 | Delta Electronics, Inc. | Device with voice-assisted system |
US20050197843A1 (en) * | 2004-03-07 | 2005-09-08 | International Business Machines Corporation | Multimodal aggregating unit |
KR100617711B1 (ko) | 2004-06-25 | 2006-08-28 | 삼성전자주식회사 | 휴대단말기에서 음성인식구동 방법 |
US20080154601A1 (en) * | 2004-09-29 | 2008-06-26 | Microsoft Corporation | Method and system for providing menu and other services for an information processing system using a telephone or other audio interface |
US8942985B2 (en) * | 2004-11-16 | 2015-01-27 | Microsoft Corporation | Centralized method and system for clarifying voice commands |
US7376645B2 (en) * | 2004-11-29 | 2008-05-20 | The Intellection Group, Inc. | Multimodal natural language query system and architecture for processing voice and proximity-based queries |
CN100521707C (zh) | 2004-12-24 | 2009-07-29 | 深圳市金立通信设备有限公司 | 具声控拨号功能的手机控制方法 |
US8185399B2 (en) * | 2005-01-05 | 2012-05-22 | At&T Intellectual Property Ii, L.P. | System and method of providing an automated data-collection in spoken dialog systems |
US7437297B2 (en) * | 2005-01-27 | 2008-10-14 | International Business Machines Corporation | Systems and methods for predicting consequences of misinterpretation of user commands in automated systems |
US8200495B2 (en) * | 2005-02-04 | 2012-06-12 | Vocollect, Inc. | Methods and systems for considering information about an expected response when performing speech recognition |
US7640160B2 (en) * | 2005-08-05 | 2009-12-29 | Voicebox Technologies, Inc. | Systems and methods for responding to natural language speech utterance |
CA2618623C (en) * | 2005-08-09 | 2015-01-06 | Mobilevoicecontrol, Inc. | Control center for a voice controlled wireless communication device system |
US7620549B2 (en) * | 2005-08-10 | 2009-11-17 | Voicebox Technologies, Inc. | System and method of supporting adaptive misrecognition in conversational speech |
US8265939B2 (en) * | 2005-08-31 | 2012-09-11 | Nuance Communications, Inc. | Hierarchical methods and apparatus for extracting user intent from spoken utterances |
JP2007065347A (ja) * | 2005-08-31 | 2007-03-15 | Denso Corp | 音声認識システム |
US7693716B1 (en) * | 2005-09-27 | 2010-04-06 | At&T Intellectual Property Ii, L.P. | System and method of developing a TTS voice |
US20070112571A1 (en) * | 2005-11-11 | 2007-05-17 | Murugappan Thirugnana | Speech recognition at a mobile terminal |
JP2007142840A (ja) * | 2005-11-18 | 2007-06-07 | Canon Inc | 情報処理装置及び情報処理方法 |
CA2633959C (en) * | 2005-12-12 | 2015-04-28 | Mark Samuelson | Mobile device retrieval and navigation |
JP4755918B2 (ja) * | 2006-02-22 | 2011-08-24 | 東芝テック株式会社 | データ入力装置及び方法並びにプログラム |
KR100735820B1 (ko) * | 2006-03-02 | 2007-07-06 | 삼성전자주식회사 | 휴대 단말기에서 음성 인식에 의한 멀티미디어 데이터 검색방법 및 그 장치 |
JP2007280179A (ja) * | 2006-04-10 | 2007-10-25 | Mitsubishi Electric Corp | 携帯端末 |
US8121838B2 (en) * | 2006-04-11 | 2012-02-21 | Nuance Communications, Inc. | Method and system for automatic transcription prioritization |
US7774202B2 (en) * | 2006-06-12 | 2010-08-10 | Lockheed Martin Corporation | Speech activated control system and related methods |
KR100783105B1 (ko) | 2006-08-22 | 2007-12-07 | 삼성전자주식회사 | 음성인식 기능을 구비한 전화기의 전화통화 방법 및 장치 |
US7957972B2 (en) * | 2006-09-05 | 2011-06-07 | Fortemedia, Inc. | Voice recognition system and method thereof |
KR100774927B1 (ko) | 2006-09-27 | 2007-11-09 | 엘지전자 주식회사 | 이동통신 단말기, 메뉴 및 아이템 선택방법 |
KR20080032842A (ko) | 2006-10-11 | 2008-04-16 | 삼성전자주식회사 | 평판표시패널을 구비한 전자기기 |
US20080091426A1 (en) * | 2006-10-12 | 2008-04-17 | Rod Rempel | Adaptive context for automatic speech recognition systems |
US7904298B2 (en) * | 2006-11-17 | 2011-03-08 | Rao Ashwin P | Predictive speech-to-text input |
JP4471128B2 (ja) * | 2006-11-22 | 2010-06-02 | セイコーエプソン株式会社 | 半導体集積回路装置、電子機器 |
US20090192898A1 (en) * | 2006-11-29 | 2009-07-30 | E-Meal, Llc | Remote Ordering System |
US20080154612A1 (en) * | 2006-12-26 | 2008-06-26 | Voice Signal Technologies, Inc. | Local storage and use of search results for voice-enabled mobile communications devices |
US20080221884A1 (en) * | 2007-03-07 | 2008-09-11 | Cerra Joseph P | Mobile environment speech processing facility |
US7870000B2 (en) * | 2007-03-28 | 2011-01-11 | Nuance Communications, Inc. | Partially filling mixed-initiative forms from utterances having sub-threshold confidence scores based upon word-level confidence data |
EP1976255B1 (en) * | 2007-03-29 | 2015-03-18 | Intellisist, Inc. | Call center with distributed speech recognition |
JP4412504B2 (ja) * | 2007-04-17 | 2010-02-10 | 本田技研工業株式会社 | 音声認識装置、音声認識方法、及び音声認識用プログラム |
US7809664B2 (en) * | 2007-12-21 | 2010-10-05 | Yahoo! Inc. | Automated learning from a question and answering network of humans |
US8099289B2 (en) * | 2008-02-13 | 2012-01-17 | Sensory, Inc. | Voice interface and search for electronic devices including bluetooth headsets and remote systems |
US7917368B2 (en) * | 2008-02-25 | 2011-03-29 | Mitsubishi Electric Research Laboratories, Inc. | Method for interacting with users of speech recognition systems |
US20090234655A1 (en) * | 2008-03-13 | 2009-09-17 | Jason Kwon | Mobile electronic device with active speech recognition |
KR20090107365A (ko) * | 2008-04-08 | 2009-10-13 | 엘지전자 주식회사 | 이동 단말기 및 그 메뉴 제어방법 |
US8958848B2 (en) * | 2008-04-08 | 2015-02-17 | Lg Electronics Inc. | Mobile terminal and menu control method thereof |
KR101466027B1 (ko) * | 2008-04-30 | 2014-11-28 | 엘지전자 주식회사 | 이동 단말기 및 그 통화내용 관리 방법 |
KR101462930B1 (ko) * | 2008-04-30 | 2014-11-19 | 엘지전자 주식회사 | 이동 단말기 및 그 화상통화 제어방법 |
KR101462932B1 (ko) * | 2008-05-28 | 2014-12-04 | 엘지전자 주식회사 | 이동 단말기 및 그의 텍스트 수정방법 |
KR100988397B1 (ko) * | 2008-06-09 | 2010-10-19 | 엘지전자 주식회사 | 이동 단말기 및 그의 텍스트 수정방법 |
KR101513615B1 (ko) * | 2008-06-12 | 2015-04-20 | 엘지전자 주식회사 | 이동 단말기 및 그 음성 인식 방법 |
KR101502003B1 (ko) * | 2008-07-08 | 2015-03-12 | 엘지전자 주식회사 | 이동 단말기 및 그 텍스트 입력 방법 |
KR20100007625A (ko) * | 2008-07-14 | 2010-01-22 | 엘지전자 주식회사 | 이동 단말기 및 그 메뉴 표시 방법 |
US8412531B2 (en) * | 2009-06-10 | 2013-04-02 | Microsoft Corporation | Touch anywhere to speak |
US9263034B1 (en) * | 2010-07-13 | 2016-02-16 | Google Inc. | Adapting enhanced acoustic models |
-
2008
- 2008-04-08 KR KR1020080032842A patent/KR20090107365A/ko active Search and Examination
- 2008-06-16 US US12/140,107 patent/US8150700B2/en active Active
- 2008-07-01 RU RU2008126782A patent/RU2394386C2/ru active
- 2008-07-02 CN CN200810127912XA patent/CN101557651B/zh active Active
- 2008-11-21 JP JP2008298799A patent/JP5481058B2/ja active Active
- 2008-12-05 EP EP08021190.7A patent/EP2109298B1/en active Active
-
2012
- 2012-01-31 US US13/362,353 patent/US8560324B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2647190A1 (en) * | 2006-03-31 | 2007-10-11 | Kyocera Corporation | Mobile communication terminal and program |
CA2650457A1 (en) * | 2006-05-08 | 2007-11-15 | Nokia Corporation | Improved mobile communication terminal and method |
CA2654161A1 (en) * | 2006-06-20 | 2007-12-27 | Telefonaktiebolaget Lm Ericsson (Publ) | Arrangement and method for controlling service activation on a mobile terminal |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2596994C2 (ru) * | 2010-11-09 | 2016-09-10 | Конинклейке Филипс Электроникс Н.В. | Пользовательский интерфейс с тактильной обратной связью |
RU2611023C2 (ru) * | 2011-02-10 | 2017-02-17 | Самсунг Электроникс Ко., Лтд. | Устройство, включающее в себя множество сенсорных экранов, и способ переключения экранов для устройства |
US10635295B2 (en) | 2011-02-10 | 2020-04-28 | Samsung Electronics Co., Ltd | Device including plurality of touch screens and screen change method for the device |
WO2013162414A1 (ru) * | 2012-04-23 | 2013-10-31 | Janovskiy Igor Vladimirovich | Терминал беспроводной голосовой связи |
US9338275B2 (en) | 2012-04-23 | 2016-05-10 | Igor' Vladimirovich Janovskiy | Terminal network for wireless voice communication |
RU2601152C2 (ru) * | 2014-09-09 | 2016-10-27 | ХЕРЕ Глобал Б.В. | Устройство, способ и компьютерная программа для обеспечения предоставления информации пользователю |
US10028037B2 (en) | 2014-09-09 | 2018-07-17 | Here Global B.V. | Apparatus, method and computer program for enabling information to be provided to a user |
RU2637900C2 (ru) * | 2015-03-26 | 2017-12-07 | Сяоми Инк. | Способ и устройство для активизации элемента |
Also Published As
Publication number | Publication date |
---|---|
JP5481058B2 (ja) | 2014-04-23 |
EP2109298A1 (en) | 2009-10-14 |
JP2009252238A (ja) | 2009-10-29 |
CN101557651A (zh) | 2009-10-14 |
US8560324B2 (en) | 2013-10-15 |
US8150700B2 (en) | 2012-04-03 |
US20090254351A1 (en) | 2009-10-08 |
US20120130712A1 (en) | 2012-05-24 |
EP2109298B1 (en) | 2017-11-22 |
CN101557651B (zh) | 2012-12-12 |
RU2008126782A (ru) | 2010-01-10 |
KR20090107365A (ko) | 2009-10-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2394386C2 (ru) | Терминал мобильной связи и способ управления его меню | |
RU2412463C2 (ru) | Терминал мобильной связи и способ управления его меню | |
US9900414B2 (en) | Mobile terminal and menu control method thereof | |
US8428654B2 (en) | Mobile terminal and method for displaying menu thereof | |
KR101462930B1 (ko) | 이동 단말기 및 그 화상통화 제어방법 | |
EP2192475B1 (en) | Control of input/output through touch | |
US8543394B2 (en) | Mobile terminal and text correcting method in the same | |
US8355914B2 (en) | Mobile terminal and method for correcting text thereof | |
US8600762B2 (en) | Mobile terminal and method for recognizing voice thereof | |
US9465794B2 (en) | Terminal and control method thereof | |
KR20090107364A (ko) | 이동 단말기 및 그 메뉴 제어방법 | |
KR101537693B1 (ko) | 단말기 및 그 제어 방법 | |
KR101521909B1 (ko) | 이동 단말기 및 그 메뉴 제어방법 | |
KR101513635B1 (ko) | 단말기 및 그 제어 방법 | |
KR101451661B1 (ko) | 이동 단말기 및 그 메뉴 제어 방법 |