RU2667717C2 - Диалоговые политики на основе параметров окружающей среды и генерация ответа - Google Patents
Диалоговые политики на основе параметров окружающей среды и генерация ответа Download PDFInfo
- Publication number
- RU2667717C2 RU2667717C2 RU2015154501A RU2015154501A RU2667717C2 RU 2667717 C2 RU2667717 C2 RU 2667717C2 RU 2015154501 A RU2015154501 A RU 2015154501A RU 2015154501 A RU2015154501 A RU 2015154501A RU 2667717 C2 RU2667717 C2 RU 2667717C2
- Authority
- RU
- Russia
- Prior art keywords
- environmental conditions
- user
- dialogue
- act
- response
- Prior art date
Links
- 230000004044 response Effects 0.000 title claims abstract description 48
- 230000007613 environmental effect Effects 0.000 claims abstract description 109
- 230000009471 action Effects 0.000 claims abstract description 60
- 230000000694 effects Effects 0.000 claims abstract description 10
- 230000002452 interceptive effect Effects 0.000 claims abstract description 8
- 238000000034 method Methods 0.000 claims description 14
- 230000000007 visual effect Effects 0.000 claims description 12
- 238000013475 authorization Methods 0.000 claims 4
- 239000000126 substance Substances 0.000 abstract 1
- 238000004891 communication Methods 0.000 description 14
- 230000003993 interaction Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 238000013500 data storage Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 239000012634 fragment Substances 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 238000012550 audit Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000013179 statistical model Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010425 computer drawing Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000012384 transportation and delivery Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- User Interface Of Digital Computer (AREA)
- Stored Programmes (AREA)
- Digital Computer Display Output (AREA)
- Air Conditioning Control Device (AREA)
Abstract
Изобретение относится к переговорной диалоговой системе. Техническим результатом является расширение арсенала технических средств. Система содержит процессор и память; операционную среду, выполняющуюся с использованием процессора; и диалоговый диспетчер, который выполнен с возможностью осуществления действий, содержащих: определение условий окружающей среды, которые связаны с актом пользовательского диалога, при этом условия окружающей среды включают в себя текущие условия окружающей среды, связанные с пользователем, совершающим акт пользовательского диалога, и текущие условия окружающей среды, связанные с другим пользователем, который является частью акта пользовательского диалога; определение машинного действия с использованием акта пользовательского диалога и условий окружающей среды; определение ответа на машинное действие с использованием условий окружающей среды и машинного действия; и обеспечение ответа. 3 н. и 5 з.п. ф-лы, 9 ил.
Description
УРОВЕНЬ ТЕХНИКИ
[0001] Переговорные диалоговые системы используются для разнообразных приложений. Например, разработаны переговорные диалоговые системы, которые позволяют пользователям искать контент, покупать предметы, получать предписания и пр. Эти переговорные диалоговые системы непрерывно усовершенствуются для обеспечения более естественных взаимодействий между компьютером и пользователем.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
[0002] Эта сущность изобретения призвана представлять в упрощенной форме основные принципы, которые дополнительно описаны в нижеследующем подробном описании. Эта сущность изобретения не призвана идентифицировать ключевые признаки или существенные признаки заявленного изобретения, а также не подлежит использованию для помощи в определении объема заявленного изобретения.
[0003] Условия окружающей среды, совместно с другой информацией, используются для регулировки разных операций переговорной диалоговой системы. Условия окружающей среды можно использовать в разные моменты времени в переговорной диалоговой системе. Каждый из компонентов диалогового диспетчера и генерации ответа в переговорной диалоговой системе использует доступные условия окружающей среды совместно с другой информацией в диалоговой системе (например, результатами понимания языка предыдущей реплики в диалоге, результатами распознавания речи и их достоверностью, результатами знания, предыдущим машинными действиями, контекстом сеанса, контекстом клиента …) при осуществлении своих операций. Например, условия окружающей среды можно использовать для регулировки выхода диалогового диспетчера (например, машинного действия). Информация состояния диалога, которая используется диалоговым диспетчером, включает в себя условия окружающей среды совместно с другой диалоговой информацией для текущей реплики в диалоге, а также условия окружающей среды для одной или более предыдущих реплик в диалоге. Условия окружающей среды также можно использовать после приема машинного действия для регулировки ответа, который предоставляется пользователю. Например, генератор ответа может использовать условия окружающей среды для определения, как пользователю предоставляется машинное действие (например, речевое, визуальное).
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
[0004] Фиг. 1 демонстрирует использование условий окружающей среды для регулировки разных операций, осуществляемых переговорной диалоговой системой;
[0005] фиг. 2 демонстрирует взаимодействия между приложением и диалоговой услугой для конфигурирования разрешений;
[0006] фиг. 3 демонстрирует иллюстративную переговорную диалоговую систему, использующую условия окружающей среды;
[0007] фиг. 4 демонстрирует процесс для использования условий окружающей среды в переговорной диалоговой системе;
[0008] фиг. 5 демонстрирует иллюстративную онлайновую систему, которая использует условия окружающей среды при определении машинного действия и как доставлять ответ в диалоге; и
[0009] фиг. 6, 7A, 7B и 8 и соответствующие описания обеспечивают рассмотрение различных операционных сред, в которых можно практически применять варианты осуществления изобретения.
ПОДРОБНОЕ ОПИСАНИЕ
[0010] Далее будут описаны чертежи, в которых сходные ссылочные позиции представляют сходные элементы, в различных вариантах осуществления.
[0011] Фиг. 1 демонстрирует использование условий окружающей среды для регулировки разных операций, осуществляемых переговорной диалоговой системой.
[0012] Как показано, система 100 включает в себя диалоговую услугу 105, диалоговый диспетчер 26, разрешения и настройки 110, генератор 120 машинного действия, диалоговую политику 130, генератор 140 ответа, информацию 145 состояния диалога, условия 150 окружающей среды, модель(и) 160 понимания, приложение 110 и устройство 115 ввода на основе сенсорного экрана.
[0013] В целом, переговорная диалоговая система 100 использует сигналы окружающей среды (например, понимание языка и результаты знания, результаты распознавания речи и их достоверность …) для политики и генерации ответа помимо использования другой информации или сигналов, обычно доступных в диалоговой системе. Сигналы окружающей среды расширяют (не заменяют) сигналы, обычно используемые в диалоговой системе. Диалоговый диспетчер 26 использует условия 150 окружающей среды в дополнение к информации 145 состояния диалога для регулировки разных операций переговорной диалоговой системы. Условия окружающей среды можно использовать в разные моменты времени в переговорной диалоговой системе 100. Компоненты диалогового диспетчера 26, генератора 120 машинного действия и генератора 140 ответа в переговорной диалоговой системе 100 могут использовать доступные условия 150 окружающей среды при осуществлении своих операций.
[0014] Генератор 120 машинного действия может использовать условия 150 окружающей среды для регулировки определяемого машинного действия совместно с информацией 145 состояния использования диалога. В целом, условия 150 окружающей среды расширяют информацию 145 состояния диалога, которая используется в диалоговой системе. Например, информация 145 состояния диалога включает в себя информацию, например, но без ограничения: например, результаты понимания языка предыдущей реплики в диалоге, результаты распознавания речи и их достоверность, результаты знания, предыдущие машинные действия, контекст сеанса, контекст клиента и пр. Каждое взаимодействие между пользователем и вычислительным устройством (т.е. машиной) является репликой. Текущая реплика является текущим взаимодействием между пользователем и машиной, для которой определяется машинное действие. Предыдущая реплика является предыдущим взаимодействием между пользователем и машиной. Согласно варианту осуществления, информация 145 состояния диалога включает в себя информацию, относящуюся к одной или более предыдущим репликам. Например, результаты понимания языка, которые связывают значение с предложением на естественном языке, хранятся в информации 145 состояния диалога. Эти предыдущие результаты понимания языка можно использовать для обеспечения контекста текущей реплики в диалоге. Информация состояния диалога также может включать в себя результаты знания, которые являются результатами, возвращаемыми из источника знаний, например, базы данных или источника данных. Например, если пользователь запрашивает фильмы в реплике диалога, результаты знания включают в себя перечень фильмов. Машинное действие, определяемое с использованием условий окружающей среды, может отличаться от определяемого машинного действия без использования условий окружающей среды. Например, машинное действие, которое генерируется генератором 120 машинного действия, может указывать необходимость спросить водителя, действительно ли он хочет сделать вызов во время движения, когда условия 150 окружающей среды указывают, что пользователь в данный момент ведет машину. Без использования условий 150 окружающей среды для расширения машинного действия, генератор 120 машинного действия, вероятно, будет генерировать машинное действие для автоматического инициирования вызова, когда пользователь в данный момент ведет машину, вместо того, чтобы спрашивать водителя, действительно ли он хочет сделать вызов во время движения. Генератор 120 машинного действия использует диалоговую политику 130 при определении машинного действия. Диалоговая политика 130 включает в себя разные правила, в том числе, правила, которые используют условия 150 окружающей среды и другую информацию состояния диалога, для регулировки генерируемого машинного действия.
[0015] Условия 150 окружающей среды также можно использовать генератором 140 ответа после приема машинного действия для регулировки ответа, который предоставляется пользователю. Условия 150 окружающей среды может влиять на то, как машинное действие (например, речевое, визуальное …) предоставляется пользователю. Например, ответ, генерируемый генератором 140 ответа, может быть визуальным ответом, когда условия 150 окружающей среды указывают, что окружающая среда пользователя зашумлена. Ответ, генерируемый генератором 140 ответа, может быть звуковым ответом, когда условия 150 окружающей среды указывают, что окружающая среда пользователя очень ярка, и маловероятно, что дисплей можно видеть отчетливо.
[0016] Условия 150 окружающей среды могут включать в себя разнообразные условия, например, но без ограничения: погодные условия, условия трафика, условия текущей активности, используемое в данный момент вычислительное устройство и пр. Условия текущей активности могут включать в себя информацию, например, но без ограничения: текущую скорость, текущее местоположение и пр. В целом, условия окружающей среды относятся к любым условиям окружающей среды, которые связаны с пользователем, обеспечивающим ввод (акт пользовательского диалога). Согласно варианту осуществления, условия окружающей среды также могут быть связаны с другим пользователем 154 (например, вызываемым контактом). Согласно варианту осуществления, условия окружающей среды, которые собираются и используются для регулировки работы переговорной диалоговой системы, задаются и авторизуются пользователем.
[0017] Для облегчения связи с диалоговым диспетчером 26, можно реализовать одну или более процедур обратного вызова. Согласно варианту осуществления, прикладная программа 110 является многорежимным приложением, которое выполнено с возможностью приема речевого ввода и ввода от устройства 115 ввода, чувствительного к прикосновению или других устройств ввода. Например, голосовой ввод, ввод с клавиатуры (например, физической клавиатуры и/или SIP), ввод на основе видео и пр. Прикладная программа 110 также может обеспечивать многорежимный вывод (например, речь, графику, вибрации, звуки, …). Диалоговый диспетчер 26 может обеспечивать информацию на/от приложения 110 в ответ на пользовательский ввод (например, речь, жест). Например, пользователь может сказать фразу для идентификации задания, осуществляемого приложением 110 (например, выбора фильма, покупки предмета, идентификации продукта, …). Жесты могут включать в себя, но без ограничения: щипковый жест; растягивающий жест; жест выбора (например, тычковое действие на отображаемом элементе); жест выбора и удержания (например, жест тычка и удержания, принятое на отображаемом элементе); маховое действие и/или действие перетаскивание; и пр. Жесты также могут включать в себя оптически захватываемые жесты, например: волновой жест, прокручивающий жест, направляющий жест и пр. Например, для обнаружения жестов можно использовать такое устройство, как MICROSOFT KINECT.
[0018] Система 100, как показано, содержит устройство 115 ввода на основе сенсорного экрана, которое обнаруживает, когда был принят тактильный ввод (например, палец, касающийся или почти касающийся сенсорного экрана). Можно использовать сенсорный экран любого типа, который обнаруживает тактильный ввод пользователя.
[0019] Для взаимодействия с диалоговой услугой 105 можно использовать естественный пользовательский интерфейс (NUI) и/или какие-либо другие интерфейсы. Например, для взаимодействия с диалоговой услугой 105 можно использовать комбинацию диалога на естественном языке и других невербальных режимов выражения намерения (например, жестов, например, вышеописанных жестов, прикосновения, взгляда, изображений, видеозаписей, устной просодии и т.д.). Диалоговый диспетчер 26 может использовать модель понимания (например, модель понимания языка (LU) или многорежимную модель понимания). Как показано, диалоговый диспетчер 26 составляет часть диалоговой услуги 105, которая принимает речевые фрагменты и выполнена с возможностью иметь диалог с пользователем.
[0020] В целом, понимание естественного языка (NLU) в целеориентированных диалоговых системах направлено на идентификацию области(ей) и намерения(ий) пользователя, выраженных на естественном языке (NL), и на извлечение соответствующих аргументов или слотов. Например, в области авиалиний, пользователи часто запрашивают информацию о рейсе (например, “Я хочу полететь в Бостон из Нью-Йорка на следующей неделе”). Дополнительные подробности приведены ниже.
[0021] Фиг. 2 демонстрирует взаимодействия между приложением и диалоговой услугой для конфигурирования разрешений.
[0022] Как показано, фиг. 2 демонстрирует диалоговую услугу 105, включающую в себя настройки 210 и журнал(ы) 212, и приложение 110 которое включает в себя пользовательский интерфейс 222 настроек, пользовательский интерфейс 226 аудита, пользовательский интерфейс 228 местоположения и локальные настройки 224.
[0023] Пользователь может конфигурировать разные критерии, например, разрешения, фильтры и настройки, которые относятся к работе приложения 110 и к использованию и сбору условий окружающей среды, которые связаны с одним или более пользователями. Например, авторизованный пользователь может определить, что условия окружающей среды могут собираться и использоваться диалоговой услугой 105.
[0024] Пользователь может устанавливать разрешения, которые указывают, какие условия окружающей среды можно собирать. Например, пользователь может дать согласие на сбор и использование диалоговой услугой 105 различных типов условий окружающей среды.
[0025] Пользователь также может конфигурировать один или более фильтров, которые фильтруют информацию с использованием различных критериев (например, времени суток, запрашивающего устройства, местоположения запрашивания и пр.). Например, пользователь может давать согласие на сбор определенных условий окружающей среды в течение определенных промежутков времени и не давать согласие на сбор условий окружающей среды в течение других промежутков времени. Пользователь может конфигурировать фильтр для ограничения точности одного или более из условий окружающей среды. Например, информацию местоположения, которая связана с пользователем, можно конфигурировать для обеспечения общего местоположения по сравнению с детальным местоположением. Пользователь также может устанавливать локальные настройки 224, например, настройки адаптации приложения (например, цветовые схемы, пиктограммы и пр.) для использования при взаимодействии с приложением 110. Например, настройки 224 могут изменять внешний вид пользовательского интерфейса, например UI 228.
[0026] Пользовательский интерфейс 226 аудита авторизованный пользователь может использовать для просмотра информации, относящейся к условиям окружающей среды, которая хранятся в журнале 212, и взаимодействия с ней. Доступ к данным, связанным с журналом, имеет только авторизованный пользователь, предоставивший правильный набор удостоверений защиты. Данные безопасно хранятся в журнале(ах) 212.
[0027] Фиг. 3 демонстрирует иллюстративную переговорную диалоговую систему, использующую условия окружающей среды.
[0028] Как показано, система 300 включает в себя диспетчер 310 ввода, компонент 320 понимания языка, диалоговый движок 330, генератор 140 ответа и движок 350 окружающей среды.
[0029] Диспетчер 310 ввода выполнен с возможностью приема пользовательского ввода (акта пользовательского диалога). Актом пользовательского диалога может быть пользовательский ввод того или иного типа. Например, актом пользовательского диалога может быть речевой ввод (например, речевой фрагмент), тактильный ввод, жестовый ввод, текстовый ввод, а также другие типы ввода. Диспетчер 310 ввода может включать в себя разные компоненты, например, автоматический распознаватель речи (ASR), распознаватель жестов, распознаватель рукописного текста и пр. Когда актом пользовательского диалога является речь, речь распознается диспетчером 310 ввода с использованием ASR. Диспетчер 310 ввода выводит текст, который поступает на компонент 320 понимания языка.
[0030] Компонент 320 понимания языка выполнен с возможностью приема и анализа текста. В целом, компонент 320 понимания языка связывает значение со словами текста. Например, компонент 320 понимания языка может размечать текст, осуществлять синтаксический анализ текста и пр. Компонент 320 понимания языка традиционно является компонентом на основе правил, который преобразует предложения естественного языка в семантические представления.
[0031] Диалоговый движок 330 управляет диалогом путем определения машинного действия в ответ на акт пользовательского диалога. Диалоговый движок 330 может представлять собой модель на основе правил или статистическую модель, или некоторую комбинацию модели на основе правил и статистической модели. Диалоговый движок 330 вычисляет возможные состояния диалога с использованием компонента 332 вычисления состояния диалога. При вычислении возможных состояний диалога компонент 332 вычисления состояния диалога использует условия окружающей среды, полученные от движка 350 окружающей среды, помимо другой информации состояния диалога. Условия окружающей среды, которые используются диалоговой системой, представляют собой, помимо другой диалоговой информации, обычно используемой в диалоговой системе, например, но без ограничения: результаты понимания языка предыдущей реплики, результаты распознавания речи и их достоверность, результаты знания, предыдущие машинные действия, контекст сеанса, контекст клиента и пр. Условия окружающей среды могут быть связаны с одним или более пользователями. Диалоговый диспетчер 26 определяет машинное действие или машинные действия. Информация состояния диалога, которая используется диалоговым диспетчером 26, включает в себя условия окружающей среды для текущей реплики в диалоге, а также условия окружающей среды для одной или более предыдущих реплик в диалоге. Диалоговый движок 330 выдает определенное машинное действие на генератор 140 ответа.
[0032] Генератор 140 ответа использует условия окружающей среды, полученные от движка окружающей среды, помимо другой диалоговой информации, для определения типа ответа, предоставляемого пользователю. Например, генератор 140 ответа может определять, предоставить ли пользователю речевой ответ или визуальный ответ. Например, компонент тексторечевого преобразования ("TTS"), в результате определения, может выводить ответ в виде синтезированной речи. Согласно варианту осуществления, условия окружающей среды обновляются после того, как диалоговый диспетчер 26 определяет машинное действие, и до того, как генератор 140 ответа принимает условия окружающей среды.
[0033] Фиг. 4 демонстрирует процесс для использования условий окружающей среды в переговорной диалоговой системе. Из представленного здесь описания процедур следует, что логические операции различных вариантов осуществления реализованы (1) как последовательность осуществляемых на компьютере действий или программных модулей, выполняющихся на вычислительной системе и/или (2) как соединенные между собой схемы машинной логики или схемные модули в вычислительной системе. Реализация является вопросом выбора, зависящего от требований производительности вычислительной системы, реализующей изобретение. Соответственно, логические операции, проиллюстрированные и составляющие описанные здесь варианты осуществления, именуются по-разному как операции, структурные устройства, действия или модули. Эти операции, структурные устройства, действия и модули можно реализовать программными средствами, программно-аппаратными средствами, в виде цифровой логики специального назначения, и любой их комбинации.
[0034] После начальной операции, процесс 400 переходит к операции 410, где принимается акт пользовательского диалога. Актом пользовательского диалога может быть пользовательский ввод того или иного типа, например, но без ограничения: речевой ввод (например, речевой фрагмент), тактильный ввод, жестовый ввод, текстовый ввод, а также другие типы ввода. В целом, акт пользовательского диалога составляет часть переговоров с диалоговой системой.
[0035] При переходе к операции 420, определяются условия окружающей среды. Условия окружающей среды связаны с одним или более пользователями. Например, условия окружающей среды могут быть текущими условиями окружающей среды, которые связаны с пользователем, совершающим акт пользовательского диалога. Условия окружающей среды также могут быть текущими условиями окружающей среды, которые связаны с другим пользователем, который является частью акта пользовательского диалога. Например, акт пользовательского диалога может быть актом для контакта с другим пользователем. Условия окружающей среды могут включать в себя разнообразные условия, например, но без ограничения: погодные условия (например, температуру, давление …), условия трафика, условия текущей активности, используемое в данный момент вычислительное устройство и пр. В целом, любые условия окружающей среды могут определяться и использоваться переговорной диалоговой системой. Условия текущей активности могут включать в себя разнообразные условия окружающей среды, например, местоположение пользователя, скорость пользователя и пр.
[0036] При переходе к операции 430, машинное действие определяется с использованием условий окружающей среды, другой информации состояния диалога и акта пользовательского диалога. Согласно варианту осуществления, при вычислении возможных состояний диалога переговорная диалоговая система, помимо другой информации состояния диалога, использует условия окружающей среды. Например, другая информация состояния диалога может включать в себя, но без ограничения: результаты понимания языка предыдущей реплики, результаты распознавания речи и их достоверность, результаты знания, предыдущие машинные действия, контекст сеанса, контекст клиента и пр. Информация состояния диалога включает в себя условия окружающей среды для текущей реплики в диалоге, а также условия окружающей среды для одной или более предыдущих реплик в диалоге.
[0037] Нижеследующие примеры иллюстрируют регулировку машинного действия с использованием условий окружающей среды и другой информации в диалоговой системе для определения машинного действия. Примеры приведены в целях иллюстрации, но не ограничения.
[0038] Ниже приведен пример диалога, когда пользователь ведет машину. 1) Пользователь: “Позвонить Павлу на домашний”; 2) диалоговая система: “Уверены, что хотите звонить во время движения?” Как можно видеть, машинное действие, вместо осуществления вызова, отрегулировано запрашивать, хочет ли пользователь сделать вызов.
[0039] Следующим примером является диалог, где пользователь пытается вызвать контакт в период времени, когда контакт, скорее всего, спит. 1) Пользователь: “Позвонить Павлу”; 2) диалоговая система: “Павел сейчас, наверное, спит. Не хотите ли взамен отправить Павлу сообщение?” В этом примере, условия окружающей среды, которые связаны с контактом, изменили машинное действие.
[0040] Следующим примером является диалог, где пользователь пытается сделать вызов, когда пользователь находится в режиме роуминга, или контакт находится в режиме роуминга. 1) Пользователь: “Позвонить Павлу”; диалоговая система: “Звонок Павлу будет стоить Павлу два доллара в минуту, поскольку он сейчас в роуминге. Не хотите ли взамен отправить Павлу сообщение?” В этом примере, условия окружающей среды, изменившие машинное действие, связаны с текущей активностью контакта.
[0041] Следующим примером является диалог, где пользователь пытается вызвать контакт, когда контакт, вероятно, ведет машину. 1) Пользователь: “Позвонить Павлу”; 2) диалоговая система: “Павел сейчас может быть за рулем. Не хотите ли взамен отправить Павлу сообщение?” В этом примере, условия окружающей среды, изменившие машинное действие, связаны с текущей активностью контакта.
[0042] Следующим примером является диалог, где пользователь пытается вызвать контакт, когда контакт находится в зашумленной окружающей среде. 1) Пользователь: “Позвонить Павлу”; 2) диалоговая система “Возможно, Павел плохо слышит Вас. Не хотите ли взамен отправить сообщение?” В этом примере, условия окружающей среды, изменившие машинное действие, связаны с текущими шумовыми условиями контакта.
[0043] После операции 440, ответ на машинное действие определяется с использованием условий окружающей среды. Может быть обеспечено много различных типов ответа (например, визуальный, звуковой, тактильный …). Пользователю может предоставляться речевой ответ, или пользователю может предоставляться визуальный ответ. Например, пользователь может находиться в зашумленной окружающей среде, и ответ регулируется, чтобы быть громче нормального. Тип ответа также может изменяться. Например, ответ может изменяться от звукового ответа к визуальному ответу.
[0044] При переходе к операции 450, пользователю предоставляется ответ.
[0045] Затем процесс переходит к конечной операции и возвращается к обработке других действий.
[0046] Фиг. 5 демонстрирует иллюстративную онлайновую систему, которая использует условия окружающей среды при определении машинного действия и как доставлять ответ в диалоге. Как показано, система 1000 включает в себя услугу 1010, хранилище 1045 данных, условия 150 окружающей среды, устройство 1050 ввода на основе сенсорного экрана (например, графический планшет), смартфон 1030 и устройство 1080 отображения.
[0047] Как показано, услуга 1010 является облачной услугой и/или услугой в масштабах предприятия, которую можно конфигурировать для обеспечения таких услуг, как описанные здесь диалоговые услуги. С услугой можно взаимодействовать с использованием различных типов ввода и вывода. Например, пользователь может использовать речевой ввод, тактильный ввод, аппаратный ввод и пр. Функциональные возможности одной или более из услуг, предоставляемых услугой 1010, также могут быть сконфигурированы как приложение клиентско-серверной основе.
[0048] Как показано, услуга 1010 является многоабонентской услугой которая предоставляет ресурсы 1015 и услуги любому количеству абонентов (например, абонентам 1-N). Многоабонентская услуга 1010 является облачной услугой, которая предоставляет ресурсы 1015 абонентам, подписавшимся на услугу, и поддерживает данные каждого абонента в отдельности и защищенные от других абонентских данных.
[0049] Система 1000, как показано, содержит устройство 1050 ввода на основе сенсорного экрана (например, устройство графического планшета) и смартфон 1030, который обнаруживает, когда был принят тактильный ввод (например, палец, касающийся или почти касающийся сенсорного экрана). Можно использовать сенсорный экран любого типа, который обнаруживает тактильный ввод пользователя. Например, сенсорный экран может включать в себя один или более слоев емкостного материала, который обнаруживает тактильный ввод. Помимо или вместо емкостного материала можно использовать другие датчики. Например, можно использовать инфракрасные (IR) датчики. Согласно варианту осуществления, сенсорный экран выполнен с возможностью обнаружения объектов, который контактирует с или над касаемой поверхностью. Хотя в этом описании используется термин "над", следует понимать, что ориентация системы сенсорной панели не имеет значения. Термин "над" применимо ко всем таким ориентациям. Сенсорный экран можно конфигурировать для определения положений приема тактильного ввода (например, начальной точки, промежуточных точек и конечной точки). Фактический контакт между касаемой поверхностью и объектом можно обнаруживать любыми подходящими средствами, в том числе, например, датчиком вибрации или микрофоном, подключенным к сенсорной панели. Неполный перечень примеров датчиков обнаружения контакта включает в себя механизмы регистрации давления, микроскопические акселерометры, пьезоэлектрические устройства, емкостные датчики, резистивные датчики, индуктивные датчики, лазерные виброметры и светодиодные виброметры.
[0050] Согласно варианту осуществления, смартфон 1030, устройство 1050 ввода на основе сенсорного экрана и устройство 1080 выполнены с возможностью многорежимного ввода и вывода, и каждый из них включает в себя приложение (1031, 1051, 1081), которое взаимодействует с услугой 1010.
[0051] Как показано, устройство 1050 ввода на основе сенсорного экрана, смартфон 1030 и устройство 1080 отображения демонстрирует иллюстративные дисплеи 1052, 1032 и 1082, демонстрирующие использование приложения. Данные могут храниться на устройстве (например, смартфоне 1030, устройстве 1050 ввода на основе сенсорного экрана и/или в каком-либо другом месте (например, сетевом хранилище 1045 данных). Хранилище 1045 данных, или какое-либо другое хранилище, можно использовать для хранения модели понимания, а также других данных. Приложения, используемые устройствами, могут быть клиентскими приложениями, серверными приложениями, облачными приложениями или некоторой комбинации. Согласно варианту осуществления, устройство 1080 отображения является таким устройством, как MICROSOFT XBOX, подключенный к дисплею.
[0052] Диалоговый диспетчер 26 выполнен с возможностью осуществления операций, связанных с описанными здесь процессами. Диалоговый диспетчер 26 выполнен с возможностью доступа к условиям 150 окружающей среды. Хотя диспетчер 26 показан в услуге 1010, функциональные возможности диспетчера могут быть включены в другие положения (например, на смартфоне 1030 и/или устройстве 1050 ввода на основе сенсорного экрана и/или устройстве 1080).
[0053] Описанные здесь варианты осуществления и функциональные возможности могут действовать посредством большого количества вычислительных систем, включающих в себя, без ограничения, настольные компьютерные системы, проводные и беспроводные вычислительные системы, мобильные вычислительные системы (например, мобильные телефоны, нетбуки, компьютеры типа планшета или графического планшета, компьютеры-ноутбуки и портативные компьютеры), карманные устройства, многопроцессорные системы, микропроцессорную или программируемую бытовую электронику, миникомпьютеры и универсальные компьютеры.
[0054] Кроме того, описанные здесь варианты осуществления и функциональные возможности могут действовать в распределенных системах (например, облачных вычислительных системах), где прикладные функциональные возможности, память, хранение и извлечение данных и различные функции обработки могут осуществляться удаленно друг от друга в распределенной вычислительной сети, например, интернете или интрасети. Пользовательские интерфейсы и информация различных типов могут отображаться посредством встроенных дисплеев вычислительных устройств или посредством удаленных блоков отображения, связанных с одним или более вычислительными устройствами. Например, пользовательские интерфейсы и информация различных типов можно отображать, и с ними можно взаимодействовать на поверхности стены, на которую проецируются пользовательские интерфейсы и информация различных типов. Взаимодействие с большим количеством вычислительных систем, позволяющих практически применять варианты осуществления изобретения, включает в себя, клавишный ввод, ввод через сенсорный экран, голосовой или другой аудиоввод, жестовый ввод, когда соответствующее вычислительное устройство снабжено функциональными возможностями обнаружения (например, камерой) для захвата и интерпретации жестов пользователя для управления функционированием вычислительного устройства и пр.
[0055] Фиг. 6-8 и соответствующие описания обеспечивают рассмотрение различных операционных сред, в которых можно практически применять варианты осуществления изобретения. Однако устройства и системы, проиллюстрированные и рассмотренные со ссылкой на фиг. 6-8, приведены в целях примера и иллюстрации, но не ограничения большого количества конфигураций вычислительного устройства, которые можно использовать для практического применения описанных здесь вариантов осуществления изобретения.
[0056] На фиг. 6 показана блок-схема, демонстрирующая физические компоненты (т.е. аппаратные) вычислительного устройства 1100, позволяющие практически применять варианты осуществления изобретения. Описанные ниже компоненты вычислительного устройства могут быть пригодны для вышеописанных вычислительных устройств. В базовой конфигурации, вычислительное устройство 1100 может включать в себя по меньшей мере один блок 1102 обработки и системную память 1104. В зависимости от конфигурации и типа вычислительного устройства, системная память 1104 может содержать, но без ограничения, энергозависимое хранилище (например, оперативную память), энергонезависимое хранилище (например, постоянную память), флэш-память или любую комбинацию таких блоков памяти. Системная память 1104 может включать в себя операционную систему 1105 и один или более программных модулей 1106 пригодных для выполнения прикладных программ 1120, например диалоговый диспетчер 26. Операционная система 1105, например, может быть пригодна для управления работой вычислительного устройства 1100. Кроме того, варианты осуществления изобретения можно практически применять совместно с библиотекой графики, другими операционными системами или любой другой прикладной программой и не ограничивается никаким конкретным приложением или системой. Эта базовая конфигурация представлена на фиг. 6 компонентами, обрамленными пунктирной линией 1108. Вычислительное устройство 1100 может иметь дополнительные признаки или функциональные возможности. Например, вычислительное устройство 1100 также может включать в себя, например, дополнительные устройства хранения данных (сменные и/или стационарные), например, магнитные диски, оптические диски или ленту. Такое дополнительное хранилище представлено на фиг. 6 сменным запоминающим устройством 1109 и стационарным запоминающим устройством 1110.
[0057] Как указано выше, несколько программных модулей и файлов данных может храниться в системной памяти 1104. При выполнении на блоке 1102, обработки, программные модули 1106 (например, диалоговый диспетчер 26) могут осуществлять процессы, включающие в себя, но без ограничения, одну или более стадий способов и процессов, проиллюстрированных на фигурах. Другие программные модули, которые можно использовать в соответствии с вариантами осуществления настоящего изобретения, может включать в себя приложения электронной почты и контактов, приложения редактирования текста, приложения электронной таблицы, приложения базы данных, приложения презентации слайдов, прикладные или компьютерные программы рисования и т.д.
[0058] Кроме того, варианты осуществления изобретения можно практически применять в электрической схеме, содержащей дискретные электронные элементы, упакованные или интегральные электронные микросхемы, содержащие логические вентили, схему, использующую микропроцессор, или на едином кристалле, содержащем электронные элементы или микропроцессоры. Например, варианты осуществления изобретения можно практически применять в виде однокристальной системы (SOC), где каждый или многие из компонентов, представленных на фиг. 6, могут интегрироваться в единую интегральную схему. Такое устройство SOC может включать в себя один или более блоков обработки, блоков графики, блоков связи, блоков виртуализации системы, и различные прикладные функциональные возможности, которые все встроены (или “вшиты”) в подложку кристалла в качестве единой интегральной схемы. При работе посредством SOC, функциональные возможности, описанные здесь в отношении диалоговый диспетчер 26 могут действовать посредством зависящей от приложения логики, объединенной с другими компонентами вычислительного устройства 1100 на единой интегральной схеме (кристалле). Варианты осуществления изобретения также можно практически применять с использованием других технологий, позволяющих осуществлять логические операции, например, например, AND, OR и NOT, в том числе, но без ограничения, механических, оптических, жидкостных и квантовых технологий. Кроме того, варианты осуществления изобретения можно практически применять в компьютере общего назначения или в любых других схемах или системах.
[0059] Вычислительное устройство 1100 также может иметь одно или более устройств 1112 ввода, например, клавиатуру, мышь, перо, устройство звукового ввода, устройство сенсорного ввода и т.д. Также могут быть включены устройство(а) 1114 вывода, например, дисплей, громкоговорители, принтер и т.д. Вышеупомянутые устройства являются примерами, и можно использовать другие. Вычислительное устройство 1100 может включать в себя одно или более соединений 1116 с возможностью связи, позволяющих осуществлять связь с другими вычислительными устройствами 1118. Примеры пригодных соединений 1116 с возможностью связи включают в себя, но без ограничения, схемы RF передатчика, приемника и/или приемопередатчика; универсальную последовательную шину (USB), параллельные и/или последовательные порты.
[0060] Используемый здесь термин "компьютерно-считываемые носители" может включать в себя компьютерные носители данных. Компьютерные носители данных могут включать в себя энергозависимые и энергонезависимые, сменные и стационарные носители, реализованные посредством любого способа или технологии для хранения информации, например, компьютерно-считываемых инструкций, структур данных или программных модулей. Системная память 1104, сменное запоминающее устройство 1109 и стационарное запоминающее устройство 1110 являются примерами компьютерных носителей данных (т.е. запоминающего устройства). Компьютерные носители данных может включать в себя RAM, ROM, электрически стираемую постоянную память (EEPROM), флэш-память или другую технологию памяти, CD-ROM, цифровые универсальные диски (DVD) или другое оптическое запоминающее устройство, магнитные кассеты, магнитную ленту, магнитное дисковое запоминающее устройство или другие магнитные запоминающие устройства, или любое другое промышленное изделие, которые можно использовать для хранения информации, и к которым может обращаться вычислительное устройство 1100. Любые такие компьютерные носители данных могут входить в состав вычислительного устройства 1100. Компьютерные носители данных не включает в себя несущую волну или другой распространяющийся или модулированный сигнал данных.
[0061] Среды связи можно реализовать в виде компьютерно-считываемых инструкций, структур данных, программных модулей или других данных в модулированном сигнале данных, например, несущей волне или другом механизме переноса, и включать в себя любые носители доставки информации. Термин “модулированный сигнал данных” могут описывать сигнал, одна или более характеристик которого устанавливается или изменяется таким образом, чтобы кодировать информацию в сигнале. В порядке примера, но не ограничения, среды связи могут включать в себя проводные носители, например, проводную сеть или прямое проводное соединение, и беспроводные среды передачи данных, например, акустические, радиочастотные (RF), инфракрасные и другие беспроводные среды передачи данных.
[0062] Фиг. 7A и 7B демонстрируют мобильное вычислительное устройство 1200, например, мобильный телефон, смартфон, планшетный персональный компьютер, портативный компьютер и пр., позволяющие практически применять варианты осуществления изобретения. Со ссылкой на фиг. 7A, проиллюстрирован один вариант осуществления мобильного вычислительного устройства 1200 для реализации вариантов осуществления. В базовой конфигурации, мобильным вычислительным устройством 1200 является карманный компьютер, имеющий элементы ввода и элементы вывода. Мобильное вычислительное устройство 1200 обычно включает в себя дисплей 1205 и одну или более кнопок 1210 ввода, которые позволяют пользователю вводить информацию в мобильное вычислительное устройство 1200. Дисплей 1205 мобильного вычислительного устройства 1200 также может действовать как устройство ввода (например, дисплей с сенсорным экраном). Если включен, необязательный боковой элемент 1215 ввода допускает дополнительный пользовательский ввод. Боковым элементом 1215 ввода может быть вращательный переключатель, кнопка или элемент ручного ввода любого другого типа. В альтернативных вариантах осуществления, мобильное вычислительное устройство 1200 может включать в себя больше или меньше элементов ввода. Например, дисплей 1205, в некоторых вариантах осуществления, может не быть сенсорным экраном. В еще одном альтернативном варианте осуществления, мобильное вычислительное устройство 1200 является системой портативного телефона, например сотовым телефоном. Мобильное вычислительное устройство 1200 также может включать в себя необязательную клавишную панель 1235. Необязательная клавишная панель 1235 может быть физической клавишной панелью или “программной” клавишной панелью, сгенерированной на дисплее с сенсорным экраном. В различных вариантах осуществления, элементы вывода включают в себя дисплей 1205 для демонстрации графического пользовательского интерфейса (GUI), визуальный индикатор 1220 (например, светодиодный) и/или преобразователь 1225 аудиосигнала (например, громкоговоритель). В некоторых вариантах осуществления, мобильное вычислительное устройство 1200 включает в себя вибрационный преобразователь для снабжения пользователя тактильной обратной связью. В еще одном варианте осуществления, мобильное вычислительное устройство 1200 включает в себя входной и/или выходной порты, например вход аудиосигнала (например, гнездо для подключения микрофона), выход аудиосигнала (например, гнездо для подключения головных телефонов) и выход видеосигнала (например, порт HDMI) для отправки сигналов на внешнее устройство или прием сигналов от него.
[0063] На фиг. 7B показана блок-схема, демонстрирующая архитектуру одного варианта осуществления мобильного вычислительного устройства. Таким образом, мобильное вычислительное устройство 1200 может включать в себя систему 1202 (т.е. архитектуру) для реализации некоторых вариантов осуществления. В одном варианте осуществления, система 1202 реализуется в виде “смартфона”, способного выполнять одно или более приложений (например, браузера, программы электронной почты, программы календаря, менеджера контактов, клиента службы обмена сообщениями, игровой программы и клиента/проигрывателя медийных материалов). В некоторых вариантах осуществления, система 1202 интегрирована как вычислительное устройство, например, карманный персональный компьютер (PDA), объединенный с беспроводным телефоном.
[0064] Одна или более прикладных программ 1266 может загружаться в память 1262 и выполняться на операционной системе 1264 или совместно с ней. Примеры прикладных программ включают в себя программы набора номера телефона, программы электронной почты, программы управления личной информацией (PIM), программы редактирования текста, программы электронной таблицы, программы интернет-браузера, программы обмена сообщениями и т.д. Система 1202 также включает в себя участок 1268 энергонезависимой памяти в памяти 1262. Участок 1268 энергонезависимой памяти можно использовать для хранения постоянной информации, которая не должна быть потеряна при отключении питания системы 1202. Прикладные программы 1266 могут использовать и сохранять в участке 1268, энергонезависимой памяти такую информацию, как электронная почта или другие сообщения, используемые приложением электронной почты и пр. Приложение синхронизации (не показано) также располагается в системе 1202 и запрограммировано взаимодействовать с соответствующим приложением синхронизации, присутствующим на хост-компьютере, для поддержания синхронизации информации, хранящейся в участке 1268 энергонезависимой памяти, с соответствующей информацией, хранящейся на хост-компьютере. Очевидно, другие приложения могут загружаться в память 1262 и выполняться на мобильном вычислительном устройстве 1200, включающий в себя описанный здесь диалоговый диспетчер 26.
[0065] Система 1202 имеет источник 1270 питания, который можно реализовать в виде одной или более батарей. Источник 1270 питания может дополнительно включают в себя внешний источник питания, например, адаптер переменного тока или зарядную док-станцию, которая пополняет или подзаряжает батареи.
[0066] Система 1202 также может включать в себя блок 1272 радиосвязи, который осуществляет функцию передачи и приема радиопередач. Блок 1272 радиосвязи обеспечивает возможность беспроводного соединения между системой 1202 и “внешним миром” через носитель передач или поставщика услуг. Передачи на блок 1272 радиосвязи и от него осуществляются под управлением операционной системы 1264. Другими словами, передачи, принятые блоком 1272 радиосвязи, могут рассылаться на прикладные программы 1266 через операционную систему 1264, и наоборот.
[0067] Визуальный индикатор 1220 можно использовать для обеспечения визуальных извещений, и/или аудиоинтерфейс 1274 можно использовать для создания звуковых извещений с помощью преобразователя 1225 аудиосигнала. В проиллюстрированном варианте осуществления, визуальным индикатором 1220 является светодиод (LED), и преобразователем 1225 аудиосигнала является громкоговоритель. Эти устройства могут быть непосредственно подключены к источнику 1270 питания таким образом, чтобы, будучи активированы, они оставались включенными на протяжении времени, определяемого механизмом извещения, несмотря на то, что процессор 1260 и другие компоненты могут отключаться для экономии энергии батареи. LED может быть запрограммирован оставаться включенным неопределенно долго, пока пользователь не предпримет акт для указания статуса включения питания устройства. Аудиоинтерфейс 1274 используется для вывода звуковых сигналов пользователю и приема звуковых сигналов от него. Например, помимо подключения к преобразователю 1225, аудиоинтерфейс 1274 также может подключаться к микрофону для приема звукового ввода, например, для облегчения телефонного разговора. В соответствии с вариантами осуществления настоящего изобретения, микрофон также может служить аудиодатчиком для облегчения управления извещениями, что будет описано ниже. Система 1202 может дополнительно включать в себя видеоинтерфейс 1276, который позволяет встроенной камере записывать неподвижные изображения, видеопоток и пр.
[0068] Мобильное вычислительное устройство 1200, реализующее систему 1202 может иметь дополнительные признаки или функциональные возможности. Например, мобильное вычислительное устройство 1200 также может включать в себя, например, дополнительные устройства хранения данных (сменные и/или стационарные), магнитные диски, оптические диски или ленту. Такое дополнительное хранилище представлено на фиг. 7B участком 1268 энергонезависимой памяти. Мобильное вычислительное устройство 1200 также может включать в себя порт 1230 периферийных устройств.
[0069] Данные/информация, сгенерированные или захваченные мобильным вычислительным устройством 1200 и сохраненные посредством системы 1202, могут храниться локально на мобильном вычислительном устройстве 1200, как описано выше, или данные могут храниться на любом количестве носителей данных, к которым устройство может обращаться через блок 1272 радиосвязи или через проводное соединение между мобильным вычислительным устройством 1200 и отдельным вычислительным устройством, связанным с мобильным вычислительным устройством 1200, например, компьютером-сервером в распределенной вычислительной сети, например, интернете. Очевидно, к таким данным/информации можно обращаться через мобильное вычислительное устройство 1200 посредством блока 1272 радиосвязи или по распределенной вычислительной сети. Аналогично, такие данные/информация могут легко переноситься между вычислительными устройствами для хранения и использоваться общеизвестными средствами переноса и хранения данных/информации, включающими в себя системы электронной почты и совместного использования объединенных данных/информации.
[0070] Фиг. 8 демонстрирует вариант осуществления архитектуры иллюстративной системы, как описано выше. Контент, разработку которого, взаимодействие с которым или редактирование которого можно осуществлять с помощью диалоговый диспетчер 26 может храниться на разных каналах связи или других типах хранилища. Например, различные документы могут храниться с использованием службы 1322, каталогов, веб-портала 1324, службы 1326 почтового ящика, хранилища 1328 мгновенного обмена сообщениями или социально-сетевого сайта 1330. Диалоговый диспетчер 26 может использовать любой из этих типов систем и т.п. для обеспечения описанного здесь использования данных. Сервер 1320 может обеспечивать диалоговый диспетчер 26 клиентам. В порядке одного примера, сервер 1320 может быть веб-сервером, обеспечивающим диалоговый диспетчер 26 по сети. Сервер 1320 может обеспечивать диалоговый диспетчер 26 по сети клиентам через сеть 1315. В порядке примера, клиентское вычислительное устройство можно реализовать в виде вычислительного устройства 1100 и воплотить в персональном компьютере, планшетном вычислительном устройстве 1310 и/или мобильном вычислительном устройстве 1200 (например, смартфоне). Любой из этих вариантов осуществления клиентского вычислительного устройства 1100, 1310, и 1200 может получать контент из хранилища 1316.
[0071] Варианты осуществления настоящего изобретения, в порядке примера, описаны выше со ссылкой на блок-схемы и/или операционные иллюстрации способов, систем и компьютерных программных продуктов согласно вариантам осуществления изобретения. Функции/действия, указанные в блоках, могут осуществлять в другом порядке, чем показано в какой-либо блок-схеме операций. Например, два блока, показанные последовательно, фактически может выполняться, по существу, одновременно, или блоки иногда могут выполняться в обратном порядке, в зависимости от предусмотренных функциональных возможностей/действий.
[0072] Описание и иллюстрация одного или более вариантов осуществления, обеспеченных в этой заявке, никоим образом не призваны ограничивать объем заявленного изобретения. Варианты осуществления, примеры и детали, обеспеченные в этой заявке, считаются достаточными для переноса имущества и позволяют другим создавать и использовать предпочтительные варианты осуществления заявленного изобретения. Заявленное изобретение не следует рассматривать как ограниченное каким-либо вариантом осуществления, примером или деталью, обеспеченными в этой заявке. Независимо от того, показаны ли и описаны ли они совместно или по отдельности, различные признаки (как структурные, так и методологические) подлежат выборочному включению или исключению для создания варианта осуществления с конкретным набором признаков. На основании описания и иллюстрации настоящей заявки, специалист в данной области техники может предложить вариации, модификации и альтернативные варианты осуществления, отвечающие сущности более широких аспектов общих принципов изобретения, воплощенных в этой заявке, которые не выходят за рамки более широкого объема заявленного изобретения.
Claims (24)
1. Способ использования условий окружающей среды в дополнение к другой информации состояния диалога в переговорной диалоговой системе, содержащий этапы, на которых:
определяют (420) условия окружающей среды, которые связаны с актом пользовательского диалога, при этом условия окружающей среды включают в себя текущие условия окружающей среды, связанные с пользователем, совершающим акт пользовательского диалога, и текущие условия окружающей среды, связанные с другим пользователем, который является частью акта пользовательского диалога;
определяют (430) машинное действие с использованием условий окружающей среды и акта пользовательского диалога;
определяют (440) ответ на машинное действие, причем это определение содержит использование условий окружающей среды для регулировки ответа; и
обеспечивают (450) ответ.
2. Способ по п. 1, в котором определение (420) условий окружающей среды, которые связаны с вводом, содержит определение по меньшей мере одного из: местоположения; уровня шума; скорости; температуры; текущей активности, или текущего вычислительного устройства в случае авторизации.
3. Способ по п. 1, в котором определение (420) условий окружающей среды содержит определение второго набора условий окружающей среды, которые связаны с другим пользователем в случае авторизации.
4. Компьютерно-считываемый носитель данных, где хранятся компьютерно-исполняемые инструкции для использования условий (150) окружающей среды в дополнение к другой информации (145) состояния диалога в переговорной диалоговой системе (100), содержащий:
прием акта пользовательского диалога;
определение условий (150) окружающей среды, которые связаны с актом пользовательского диалога, при этом условия окружающей среды включают в себя текущие условия (154) окружающей среды, связанные с пользователем, совершающим акт пользовательского диалога, и текущие условия (154) окружающей среды, связанные с другим пользователем, который является частью упомянутого акта пользовательского диалога;
определение машинного действия с использованием акта пользовательского диалога и условий (150) окружающей среды;
определение ответа на машинное действие с использованием условий (150) окружающей среды и машинного действия; и
обеспечение ответа.
5. Компьютерно-считываемый носитель данных по п. 4, в котором определение условий (150) окружающей среды, которые связаны с вводом, содержит определение по меньшей мере одного из: текущей активности, осуществляемой при приеме акта пользовательского диалога, или текущего вычислительного устройства в случае авторизации.
6. Система для использования условий окружающей среды в дополнение к другой информации состояния диалога в переговорной диалоговой системе, содержащая:
процессор и память;
операционную среду, выполняющуюся с использованием процессора; и
диалоговый диспетчер, который выполнен с возможностью осуществления действий, содержащих:
определение условий окружающей среды, которые связаны с актом пользовательского диалога, при этом условия окружающей среды включают в себя текущие условия окружающей среды, связанные с пользователем, совершающим акт пользовательского диалога, и текущие условия окружающей среды, связанные с другим пользователем, который является частью акта пользовательского диалога;
определение машинного действия с использованием акта пользовательского диалога и условий окружающей среды;
определение ответа на машинное действие с использованием условий окружающей среды и машинного действия; и
обеспечение ответа.
7. Система по п. 6, в которой определение условий окружающей среды, которые связаны с вводом, содержит определение по меньшей мере одного из: текущей активности, осуществляемой при приеме акта пользовательского диалога, или текущего вычислительного устройства в случае авторизации.
8. Система по п. 6, в которой определение ответа содержит использование условий окружающей среды для определения типа ответа из: речевого ответа или визуального представления ответа.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/923,917 | 2013-06-21 | ||
US13/923,917 US9589565B2 (en) | 2013-06-21 | 2013-06-21 | Environmentally aware dialog policies and response generation |
PCT/US2014/041014 WO2014204655A1 (en) | 2013-06-21 | 2014-06-05 | Environmentally aware dialog policies and response generation |
Publications (3)
Publication Number | Publication Date |
---|---|
RU2015154501A RU2015154501A (ru) | 2017-06-20 |
RU2015154501A3 RU2015154501A3 (ru) | 2018-05-04 |
RU2667717C2 true RU2667717C2 (ru) | 2018-09-24 |
Family
ID=51134327
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2015154501A RU2667717C2 (ru) | 2013-06-21 | 2014-06-05 | Диалоговые политики на основе параметров окружающей среды и генерация ответа |
Country Status (11)
Country | Link |
---|---|
US (2) | US9589565B2 (ru) |
EP (1) | EP3011471A1 (ru) |
JP (1) | JP6492069B2 (ru) |
KR (1) | KR102231733B1 (ru) |
CN (2) | CN105378708B (ru) |
AU (2) | AU2014281049B9 (ru) |
BR (1) | BR112015031231B1 (ru) |
CA (1) | CA2913735C (ru) |
MX (1) | MX352774B (ru) |
RU (1) | RU2667717C2 (ru) |
WO (1) | WO2014204655A1 (ru) |
Families Citing this family (54)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8181205B2 (en) | 2002-09-24 | 2012-05-15 | Russ Samuel H | PVR channel and PVR IPG information |
US11592723B2 (en) | 2009-12-22 | 2023-02-28 | View, Inc. | Automated commissioning of controllers in a window network |
US11054792B2 (en) | 2012-04-13 | 2021-07-06 | View, Inc. | Monitoring sites containing switchable optical devices and controllers |
US10964320B2 (en) * | 2012-04-13 | 2021-03-30 | View, Inc. | Controlling optically-switchable devices |
US20240046928A1 (en) * | 2012-04-13 | 2024-02-08 | View, Inc. | Controlling optically-switchable devices |
US10860683B2 (en) | 2012-10-25 | 2020-12-08 | The Research Foundation For The State University Of New York | Pattern change discovery between high dimensional data sets |
US9728184B2 (en) | 2013-06-18 | 2017-08-08 | Microsoft Technology Licensing, Llc | Restructuring deep neural network acoustic models |
US9311298B2 (en) | 2013-06-21 | 2016-04-12 | Microsoft Technology Licensing, Llc | Building conversational understanding systems using a toolset |
US9589565B2 (en) | 2013-06-21 | 2017-03-07 | Microsoft Technology Licensing, Llc | Environmentally aware dialog policies and response generation |
EP3114640B1 (en) | 2014-03-05 | 2022-11-02 | View, Inc. | Monitoring sites containing switchable optical devices and controllers |
US9324321B2 (en) | 2014-03-07 | 2016-04-26 | Microsoft Technology Licensing, Llc | Low-footprint adaptation and personalization for a deep neural network |
US9529794B2 (en) | 2014-03-27 | 2016-12-27 | Microsoft Technology Licensing, Llc | Flexible schema for language model customization |
US9614724B2 (en) | 2014-04-21 | 2017-04-04 | Microsoft Technology Licensing, Llc | Session-based device configuration |
US9520127B2 (en) | 2014-04-29 | 2016-12-13 | Microsoft Technology Licensing, Llc | Shared hidden layer combination for speech recognition systems |
US10111099B2 (en) | 2014-05-12 | 2018-10-23 | Microsoft Technology Licensing, Llc | Distributing content in managed wireless distribution networks |
US9430667B2 (en) | 2014-05-12 | 2016-08-30 | Microsoft Technology Licensing, Llc | Managed wireless distribution network |
US9384334B2 (en) | 2014-05-12 | 2016-07-05 | Microsoft Technology Licensing, Llc | Content discovery in managed wireless distribution networks |
US9874914B2 (en) | 2014-05-19 | 2018-01-23 | Microsoft Technology Licensing, Llc | Power management contracts for accessory devices |
US10037202B2 (en) | 2014-06-03 | 2018-07-31 | Microsoft Technology Licensing, Llc | Techniques to isolating a portion of an online computing service |
US9367490B2 (en) | 2014-06-13 | 2016-06-14 | Microsoft Technology Licensing, Llc | Reversible connector for accessory devices |
US9717006B2 (en) | 2014-06-23 | 2017-07-25 | Microsoft Technology Licensing, Llc | Device quarantine in a wireless network |
CN104360897B (zh) * | 2014-10-29 | 2017-09-22 | 百度在线网络技术(北京)有限公司 | 对话处理方法和对话管理系统 |
US11574621B1 (en) | 2014-12-23 | 2023-02-07 | Amazon Technologies, Inc. | Stateless third party interactions |
US9792560B2 (en) * | 2015-02-17 | 2017-10-17 | Microsoft Technology Licensing, Llc | Training systems and methods for sequence taggers |
US10338959B2 (en) | 2015-07-13 | 2019-07-02 | Microsoft Technology Licensing, Llc | Task state tracking in systems and services |
US20180101762A1 (en) * | 2015-12-10 | 2018-04-12 | Pablo Gutierrez | Graphical interfaced based intelligent automated assistant |
US10635281B2 (en) | 2016-02-12 | 2020-04-28 | Microsoft Technology Licensing, Llc | Natural language task completion platform authoring for third party experiences |
US9978367B2 (en) * | 2016-03-16 | 2018-05-22 | Google Llc | Determining dialog states for language models |
US9996531B1 (en) * | 2016-03-29 | 2018-06-12 | Facebook, Inc. | Conversational understanding |
US20190026265A1 (en) * | 2016-04-08 | 2019-01-24 | Sony Corporation | Information processing apparatus and information processing method |
US20180005629A1 (en) * | 2016-06-30 | 2018-01-04 | Microsoft Technology Licensing, Llc | Policy authoring for task state tracking during dialogue |
US10185840B2 (en) * | 2016-08-30 | 2019-01-22 | Google Llc | Conditional disclosure of individual-controlled content in group contexts |
EP3396978B1 (de) * | 2017-04-26 | 2020-03-11 | Sivantos Pte. Ltd. | Verfahren zum betrieb einer hörvorrichtung und hörvorrichtung |
CN107103903B (zh) * | 2017-05-05 | 2020-05-29 | 百度在线网络技术(北京)有限公司 | 基于人工智能的声学模型训练方法、装置及存储介质 |
US10418033B1 (en) * | 2017-06-01 | 2019-09-17 | Amazon Technologies, Inc. | Configurable output data formats |
CN107240395B (zh) * | 2017-06-16 | 2020-04-28 | 百度在线网络技术(北京)有限公司 | 一种声学模型训练方法和装置、计算机设备、存储介质 |
KR102441066B1 (ko) * | 2017-10-12 | 2022-09-06 | 현대자동차주식회사 | 차량의 음성생성 시스템 및 방법 |
US10783329B2 (en) * | 2017-12-07 | 2020-09-22 | Shanghai Xiaoi Robot Technology Co., Ltd. | Method, device and computer readable storage medium for presenting emotion |
JP2019106054A (ja) * | 2017-12-13 | 2019-06-27 | 株式会社東芝 | 対話システム |
JP2019144790A (ja) * | 2018-02-20 | 2019-08-29 | 富士ゼロックス株式会社 | 情報処理装置及びプログラム |
KR102445365B1 (ko) * | 2018-03-19 | 2022-09-20 | 현대자동차주식회사 | 대화 시스템, 이를 포함하는 차량 및 대화 처리 방법 |
KR20190131741A (ko) * | 2018-05-17 | 2019-11-27 | 현대자동차주식회사 | 대화 시스템 및 대화 처리 방법 |
US10890653B2 (en) | 2018-08-22 | 2021-01-12 | Google Llc | Radar-based gesture enhancement for voice interfaces |
US10770035B2 (en) | 2018-08-22 | 2020-09-08 | Google Llc | Smartphone-based radar system for facilitating awareness of user presence and orientation |
US10698603B2 (en) | 2018-08-24 | 2020-06-30 | Google Llc | Smartphone-based radar system facilitating ease and accuracy of user interactions with displayed objects in an augmented-reality interface |
US10788880B2 (en) | 2018-10-22 | 2020-09-29 | Google Llc | Smartphone-based radar system for determining user intention in a lower-power mode |
US10761611B2 (en) | 2018-11-13 | 2020-09-01 | Google Llc | Radar-image shaper for radar-based applications |
US11138272B2 (en) * | 2018-11-15 | 2021-10-05 | International Business Machines Corporation | Generating and executing an optimal dialogue strategy |
US11043214B1 (en) * | 2018-11-29 | 2021-06-22 | Amazon Technologies, Inc. | Speech recognition using dialog history |
CN109933272A (zh) * | 2019-01-31 | 2019-06-25 | 西南电子技术研究所(中国电子科技集团公司第十研究所) | 多模态深度融合机载座舱人机交互方法 |
US11531736B1 (en) | 2019-03-18 | 2022-12-20 | Amazon Technologies, Inc. | User authentication as a service |
WO2020242493A1 (en) * | 2019-05-31 | 2020-12-03 | Google Llc | Dynamically assigning multi-modality circumstantial data to assistant action requests for correlating with subsequent requests |
US11922305B2 (en) * | 2020-06-04 | 2024-03-05 | Salesforce, Inc. | Systems and methods for safe policy improvement for task oriented dialogues |
US11705108B1 (en) | 2021-12-10 | 2023-07-18 | Amazon Technologies, Inc. | Visual responses to user inputs |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005013262A1 (en) * | 2003-08-01 | 2005-02-10 | Philips Intellectual Property & Standards Gmbh | Method for driving a dialog system |
US20070226649A1 (en) * | 2006-03-23 | 2007-09-27 | Agmon Jonathan | Method for predictive typing |
US20080235017A1 (en) * | 2007-03-22 | 2008-09-25 | Honda Motor Co., Ltd. | Voice interaction device, voice interaction method, and voice interaction program |
US20110144999A1 (en) * | 2009-12-11 | 2011-06-16 | Samsung Electronics Co., Ltd. | Dialogue system and dialogue method thereof |
RU2011122784A (ru) * | 2008-11-07 | 2012-12-20 | Лингупедиа Инвестментс Сарл | Способ семантической обработки естественного языка с использованием графического языка-посредника |
Family Cites Families (140)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2631864B2 (ja) | 1988-06-13 | 1997-07-16 | 大成建設株式会社 | 偏平トンネルの施工方法 |
US5170499A (en) * | 1989-03-06 | 1992-12-08 | Motorola, Inc. | Method and apparatus for adjusting the volume level of a radio |
DE69126983T2 (de) | 1991-08-19 | 1998-03-05 | Lernout & Hauspie Speechprod | Einrichtung zur mustererkennung mit einem kuenstlichen neuronalen netzwerk fuer kontextabhaengige modellierung |
US5233681A (en) | 1992-04-24 | 1993-08-03 | International Business Machines Corporation | Context-dependent speech recognizer using estimated next word context |
US6405132B1 (en) * | 1997-10-22 | 2002-06-11 | Intelligent Technologies International, Inc. | Accident avoidance system |
JPH10312196A (ja) * | 1997-03-12 | 1998-11-24 | Seiko Epson Corp | 応答音声の音量適正化方法およびその装置 |
US6167377A (en) | 1997-03-28 | 2000-12-26 | Dragon Systems, Inc. | Speech recognition language models |
JP3229240B2 (ja) * | 1997-06-10 | 2001-11-19 | インターナショナル・ビジネス・マシーンズ・コーポレーション | メッセージ処理方法、メッセージ処理装置及びメッセージ処理を制御するプログラムを格納する記憶媒体 |
KR100241901B1 (ko) | 1997-08-28 | 2000-02-01 | 윤종용 | 핸드셋과 핸즈프리킷 공용 음성인식기의 등록 엔트리 관리방법 |
US6160986A (en) * | 1998-04-16 | 2000-12-12 | Creator Ltd | Interactive toy |
ITTO980383A1 (it) | 1998-05-07 | 1999-11-07 | Cselt Centro Studi Lab Telecom | Procedimento e dispositivo di riconoscimento vocale con doppio passo di riconoscimento neurale e markoviano. |
US20050091057A1 (en) | 1999-04-12 | 2005-04-28 | General Magic, Inc. | Voice application development methodology |
US6647270B1 (en) * | 1999-09-10 | 2003-11-11 | Richard B. Himmelstein | Vehicletalk |
US7392185B2 (en) | 1999-11-12 | 2008-06-24 | Phoenix Solutions, Inc. | Speech based learning/training system using semantic decoding |
US6263308B1 (en) | 2000-03-20 | 2001-07-17 | Microsoft Corporation | Methods and apparatus for performing speech recognition using acoustic models which are improved through an interactive process |
US7788602B2 (en) | 2000-06-06 | 2010-08-31 | Microsoft Corporation | Method and system for providing restricted actions for recognized semantic categories |
CA2414707C (en) | 2000-06-29 | 2011-08-16 | Aspen Technology, Inc. | Computer method and apparatus for constraining a non-linear approximator of an empirical process |
JP2002091477A (ja) | 2000-09-14 | 2002-03-27 | Mitsubishi Electric Corp | 音声認識システム、音声認識装置、音響モデル管理サーバ、言語モデル管理サーバ、音声認識方法及び音声認識プログラムを記録したコンピュータ読み取り可能な記録媒体 |
US6807536B2 (en) | 2000-11-16 | 2004-10-19 | Microsoft Corporation | Methods and systems for computing singular value decompositions of matrices and low rank approximations of matrices |
US6622136B2 (en) | 2001-02-16 | 2003-09-16 | Motorola, Inc. | Interactive tool for semi-automatic creation of a domain model |
US6970947B2 (en) * | 2001-07-18 | 2005-11-29 | International Business Machines Corporation | Method and apparatus for providing a flexible and scalable context service |
US20030149566A1 (en) | 2002-01-02 | 2003-08-07 | Esther Levin | System and method for a spoken language interface to a large database of changing records |
JP2003280683A (ja) | 2002-03-20 | 2003-10-02 | Toshiba Corp | 音声認識装置、音声認識装置における音声認識制御方法、音声処理に関する辞書管理装置 |
US7006972B2 (en) | 2002-03-20 | 2006-02-28 | Microsoft Corporation | Generating a task-adapted acoustic model from one or more different corpora |
US7191119B2 (en) | 2002-05-07 | 2007-03-13 | International Business Machines Corporation | Integrated development tool for building a natural language understanding application |
US7548847B2 (en) | 2002-05-10 | 2009-06-16 | Microsoft Corporation | System for automatically annotating training data for a natural language understanding system |
US7398209B2 (en) | 2002-06-03 | 2008-07-08 | Voicebox Technologies, Inc. | Systems and methods for responding to natural language speech utterance |
US7756531B2 (en) * | 2002-09-04 | 2010-07-13 | Farhad John Aminzadeh | Method and apparatus for avoiding call disturbances and facilitating urgent calls based on a caller's decision |
US7274741B2 (en) | 2002-11-01 | 2007-09-25 | Microsoft Corporation | Systems and methods for generating a comprehensive user attention model |
JP2004227468A (ja) * | 2003-01-27 | 2004-08-12 | Canon Inc | 情報提供装置、情報提供方法 |
US20040176083A1 (en) * | 2003-02-25 | 2004-09-09 | Motorola, Inc. | Method and system for reducing distractions of mobile device users |
US7366655B1 (en) | 2003-04-02 | 2008-04-29 | At&T Corp. | Method of generating a labeling guide for spoken dialog services |
US7835910B1 (en) | 2003-05-29 | 2010-11-16 | At&T Intellectual Property Ii, L.P. | Exploiting unlabeled utterances for spoken language understanding |
CA2473195C (en) | 2003-07-29 | 2014-02-04 | Microsoft Corporation | Head mounted multi-sensory audio input system |
US20050065789A1 (en) | 2003-09-23 | 2005-03-24 | Sherif Yacoub | System and method with automated speech recognition engines |
US7774196B2 (en) | 2003-10-01 | 2010-08-10 | Dictaphone Corporation | System and method for modifying a language model and post-processor information |
JP2005157494A (ja) * | 2003-11-20 | 2005-06-16 | Aruze Corp | 会話制御装置及び会話制御方法 |
EP1687807B1 (en) | 2003-11-21 | 2016-03-16 | Nuance Communications, Inc. | Topic specific models for text formatting and speech recognition |
CN100539763C (zh) * | 2003-11-27 | 2009-09-09 | 国际商业机器公司 | 控制来自移动车辆的无线通信的方法 |
KR101022159B1 (ko) * | 2004-03-04 | 2011-03-17 | 엘지전자 주식회사 | 차량용 네비게이션 장치 및 그 동작 방법 |
US8412521B2 (en) | 2004-08-20 | 2013-04-02 | Multimodal Technologies, Llc | Discriminative training of document transcription system |
US7693713B2 (en) | 2005-06-17 | 2010-04-06 | Microsoft Corporation | Speech models generated using competitive training, asymmetric training, and data boosting |
US7640160B2 (en) | 2005-08-05 | 2009-12-29 | Voicebox Technologies, Inc. | Systems and methods for responding to natural language speech utterance |
US7620549B2 (en) * | 2005-08-10 | 2009-11-17 | Voicebox Technologies, Inc. | System and method of supporting adaptive misrecognition in conversational speech |
US7949529B2 (en) * | 2005-08-29 | 2011-05-24 | Voicebox Technologies, Inc. | Mobile systems and methods of supporting natural language human-machine interactions |
US8321220B1 (en) | 2005-11-30 | 2012-11-27 | At&T Intellectual Property Ii, L.P. | System and method of semi-supervised learning for spoken language understanding using semantic role labeling |
US20070128979A1 (en) * | 2005-12-07 | 2007-06-07 | J. Shackelford Associates Llc. | Interactive Hi-Tech doll |
US7835911B2 (en) | 2005-12-30 | 2010-11-16 | Nuance Communications, Inc. | Method and system for automatically building natural language understanding models |
US7603330B2 (en) | 2006-02-01 | 2009-10-13 | Honda Motor Co., Ltd. | Meta learning for question classification |
DE102006006551B4 (de) | 2006-02-13 | 2008-09-11 | Siemens Ag | Verfahren und System zum Bereitstellen von Sprachdialoganwendungen sowie mobiles Endgerät |
JP2007264128A (ja) | 2006-03-27 | 2007-10-11 | Toshiba Corp | 音声認識装置及びその方法 |
US7627536B2 (en) | 2006-06-13 | 2009-12-01 | Microsoft Corporation | Dynamic interaction menus from natural language representations |
US7716049B2 (en) | 2006-06-30 | 2010-05-11 | Nokia Corporation | Method, apparatus and computer program product for providing adaptive language model scaling |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US20080153537A1 (en) * | 2006-12-21 | 2008-06-26 | Charbel Khawand | Dynamically learning a user's response via user-preferred audio settings in response to different noise environments |
WO2008081543A1 (ja) * | 2006-12-28 | 2008-07-10 | Fujitsu Limited | 携帯端末装置、その通話制御プログラム、その通話制御プログラムを格納した記録媒体、及びその通話制御方法 |
US7912700B2 (en) | 2007-02-08 | 2011-03-22 | Microsoft Corporation | Context based word prediction |
TW200836893A (en) * | 2007-03-01 | 2008-09-16 | Benq Corp | Interactive home entertainment robot and method of controlling the same |
US8838457B2 (en) | 2007-03-07 | 2014-09-16 | Vlingo Corporation | Using results of unstructured language model based speech recognition to control a system-level function of a mobile communications facility |
US20090030697A1 (en) | 2007-03-07 | 2009-01-29 | Cerra Joseph P | Using contextual information for delivering results generated from a speech recognition facility using an unstructured language model |
US20070150428A1 (en) | 2007-03-20 | 2007-06-28 | Brandyn Webb | Inference engine for discovering features and making predictions using generalized incremental singular value decomposition |
US8275615B2 (en) | 2007-07-13 | 2012-09-25 | International Business Machines Corporation | Model weighting, selection and hypotheses combination for automatic speech recognition and machine translation |
CN101415039A (zh) * | 2007-10-17 | 2009-04-22 | 宏达国际电子股份有限公司 | 通话管理方法 |
US8140335B2 (en) * | 2007-12-11 | 2012-03-20 | Voicebox Technologies, Inc. | System and method for providing a natural language voice user interface in an integrated voice navigation services environment |
US8229729B2 (en) | 2008-03-25 | 2012-07-24 | International Business Machines Corporation | Machine translation in continuous space |
JP2009230068A (ja) | 2008-03-25 | 2009-10-08 | Denso Corp | 音声認識装置及びナビゲーションシステム |
US8332394B2 (en) | 2008-05-23 | 2012-12-11 | International Business Machines Corporation | System and method for providing question and answers with deferred type evaluation |
US8364481B2 (en) | 2008-07-02 | 2013-01-29 | Google Inc. | Speech recognition with parallel recognition tasks |
US8412529B2 (en) | 2008-10-29 | 2013-04-02 | Verizon Patent And Licensing Inc. | Method and system for enhancing verbal communication sessions |
US20100114890A1 (en) | 2008-10-31 | 2010-05-06 | Purediscovery Corporation | System and Method for Discovering Latent Relationships in Data |
JP5475795B2 (ja) | 2008-11-05 | 2014-04-16 | グーグル・インコーポレーテッド | カスタム言語モデル |
EP3258468B1 (en) * | 2008-11-10 | 2019-08-21 | Google LLC | Multisensory speech detection |
US20100128863A1 (en) | 2008-11-21 | 2010-05-27 | Robert Bosch Gmbh | Context aware voice communication proxy |
US8447608B1 (en) | 2008-12-10 | 2013-05-21 | Adobe Systems Incorporated | Custom language models for audio content |
US20100211695A1 (en) | 2009-02-16 | 2010-08-19 | Comverse, Ltd. | Context-aware communications |
US8930179B2 (en) | 2009-06-04 | 2015-01-06 | Microsoft Corporation | Recognition using re-recognition and statistical classification |
US9177557B2 (en) | 2009-07-07 | 2015-11-03 | General Motors Llc. | Singular value decomposition for improved voice recognition in presence of multi-talker background noise |
US8886641B2 (en) | 2009-10-15 | 2014-11-11 | Yahoo! Inc. | Incorporating recency in network search using machine learning |
US8571866B2 (en) | 2009-10-23 | 2013-10-29 | At&T Intellectual Property I, L.P. | System and method for improving speech recognition accuracy using textual context |
US8249627B2 (en) * | 2009-12-21 | 2012-08-21 | Julia Olincy | “I am driving/busy” automatic response system for mobile phones |
US8315597B2 (en) * | 2009-12-21 | 2012-11-20 | Julia Olincy | “I am driving/busy” automatic response system for mobile phones |
EP2339576B1 (en) | 2009-12-23 | 2019-08-07 | Google LLC | Multi-modal input on an electronic device |
US8400332B2 (en) | 2010-02-09 | 2013-03-19 | Ford Global Technologies, Llc | Emotive advisory system including time agent |
JP2012038239A (ja) | 2010-08-11 | 2012-02-23 | Sony Corp | 情報処理装置、情報処理方法、及び、プログラム |
US8972253B2 (en) | 2010-09-15 | 2015-03-03 | Microsoft Technology Licensing, Llc | Deep belief network for large vocabulary continuous speech recognition |
FR2965377A1 (fr) | 2010-09-24 | 2012-03-30 | Univ D Avignon Et Des Pays De Vaucluse | Procede de classification de donnees biometriques |
JP2012075047A (ja) * | 2010-09-29 | 2012-04-12 | Toshiba Corp | Ip交換システム及びip交換装置 |
US8812321B2 (en) | 2010-09-30 | 2014-08-19 | At&T Intellectual Property I, L.P. | System and method for combining speech recognition outputs from a plurality of domain-specific speech recognizers via machine learning |
US20120084248A1 (en) * | 2010-09-30 | 2012-04-05 | Microsoft Corporation | Providing suggestions based on user intent |
JP5704692B2 (ja) | 2010-11-30 | 2015-04-22 | 独立行政法人情報通信研究機構 | パターン分類装置の学習装置及びそのためのコンピュータプログラム |
US8352245B1 (en) | 2010-12-30 | 2013-01-08 | Google Inc. | Adjusting language models |
JP5861649B2 (ja) | 2011-02-03 | 2016-02-16 | 日本電気株式会社 | モデル適応化装置、モデル適応化方法およびモデル適応化用プログラム |
US9081760B2 (en) | 2011-03-08 | 2015-07-14 | At&T Intellectual Property I, L.P. | System and method for building diverse language models |
US9679561B2 (en) | 2011-03-28 | 2017-06-13 | Nuance Communications, Inc. | System and method for rapid customization of speech recognition models |
US10642934B2 (en) | 2011-03-31 | 2020-05-05 | Microsoft Technology Licensing, Llc | Augmented conversational understanding architecture |
US8489529B2 (en) | 2011-03-31 | 2013-07-16 | Microsoft Corporation | Deep convex network with joint use of nonlinear random projection, Restricted Boltzmann Machine and batch-based parallelizable optimization |
US20120253789A1 (en) * | 2011-03-31 | 2012-10-04 | Microsoft Corporation | Conversational Dialog Learning and Correction |
WO2012135210A2 (en) * | 2011-03-31 | 2012-10-04 | Microsoft Corporation | Location-based conversational understanding |
US9244984B2 (en) * | 2011-03-31 | 2016-01-26 | Microsoft Technology Licensing, Llc | Location based conversational understanding |
US8260615B1 (en) | 2011-04-25 | 2012-09-04 | Google Inc. | Cross-lingual initialization of language models |
US20120290293A1 (en) | 2011-05-13 | 2012-11-15 | Microsoft Corporation | Exploiting Query Click Logs for Domain Detection in Spoken Language Understanding |
US8918352B2 (en) | 2011-05-23 | 2014-12-23 | Microsoft Corporation | Learning processes for single hidden layer neural networks with linear output units |
KR101270074B1 (ko) * | 2011-05-31 | 2013-05-31 | 삼성에스디에스 주식회사 | 소리 기반 공간지도를 이용한 상황인식 장치 및 방법 |
US20130031476A1 (en) | 2011-07-25 | 2013-01-31 | Coin Emmett | Voice activated virtual assistant |
KR20130022513A (ko) | 2011-08-24 | 2013-03-07 | 한국전자통신연구원 | 결합 쌍일차 변환 공간 기반의 화자 적응 방법 및 장치 |
EP3392876A1 (en) | 2011-09-30 | 2018-10-24 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
GB201117052D0 (en) * | 2011-10-04 | 2011-11-16 | Daybees Ltd | Automated diary population |
US8698621B2 (en) * | 2011-11-22 | 2014-04-15 | Verizon Patent And Licensing Inc. | Method and system for providing notifications of a mobile device in motion to determine call treatment |
US9235799B2 (en) | 2011-11-26 | 2016-01-12 | Microsoft Technology Licensing, Llc | Discriminative pretraining of deep neural networks |
US9082402B2 (en) | 2011-12-08 | 2015-07-14 | Sri International | Generic virtual personal assistant platform |
KR101590332B1 (ko) * | 2012-01-09 | 2016-02-18 | 삼성전자주식회사 | 영상장치 및 그 제어방법 |
US9324323B1 (en) | 2012-01-13 | 2016-04-26 | Google Inc. | Speech recognition using topic-specific language models |
US9263040B2 (en) * | 2012-01-17 | 2016-02-16 | GM Global Technology Operations LLC | Method and system for using sound related vehicle information to enhance speech recognition |
JP2012128440A (ja) * | 2012-02-06 | 2012-07-05 | Denso Corp | 音声対話装置 |
CN102609264A (zh) | 2012-02-14 | 2012-07-25 | 深圳市同洲视讯传媒有限公司 | 一种调用应用程序编程接口生成调用代码的方法及装置 |
US9524730B2 (en) | 2012-03-30 | 2016-12-20 | Ohio State Innovation Foundation | Monaural speech filter |
US8346563B1 (en) | 2012-04-10 | 2013-01-01 | Artificial Solutions Ltd. | System and methods for delivering advanced natural language interaction applications |
GB201208373D0 (en) | 2012-05-14 | 2012-06-27 | Touchtype Ltd | Mechanism for synchronising devices,system and method |
US8600525B1 (en) | 2012-05-31 | 2013-12-03 | Honeywell Asca Inc. | Efficient quadratic programming (QP) solver for process control and optimization |
US9053708B2 (en) | 2012-07-18 | 2015-06-09 | International Business Machines Corporation | System, method and program product for providing automatic speech recognition (ASR) in a shared resource environment |
US9424840B1 (en) | 2012-08-31 | 2016-08-23 | Amazon Technologies, Inc. | Speech recognition platforms |
US8527276B1 (en) | 2012-10-25 | 2013-09-03 | Google Inc. | Speech synthesis using deep neural networks |
US10282419B2 (en) | 2012-12-12 | 2019-05-07 | Nuance Communications, Inc. | Multi-domain natural language processing architecture |
KR101559124B1 (ko) | 2013-02-28 | 2015-10-12 | 한양대학교 산학협력단 | 리튬황전지용 양극, 이를 포함하는 리튬황전지 및 이의 제조 방법 |
US9177550B2 (en) | 2013-03-06 | 2015-11-03 | Microsoft Technology Licensing, Llc | Conservatively adapting a deep neural network in a recognition system |
US9728184B2 (en) | 2013-06-18 | 2017-08-08 | Microsoft Technology Licensing, Llc | Restructuring deep neural network acoustic models |
US9311298B2 (en) | 2013-06-21 | 2016-04-12 | Microsoft Technology Licensing, Llc | Building conversational understanding systems using a toolset |
US9589565B2 (en) | 2013-06-21 | 2017-03-07 | Microsoft Technology Licensing, Llc | Environmentally aware dialog policies and response generation |
CN103400577B (zh) | 2013-08-01 | 2015-09-16 | 百度在线网络技术(北京)有限公司 | 多语种语音识别的声学模型建立方法和装置 |
CN103456299B (zh) | 2013-08-01 | 2016-06-15 | 百度在线网络技术(北京)有限公司 | 一种控制语音识别的方法和装置 |
US9280968B2 (en) | 2013-10-04 | 2016-03-08 | At&T Intellectual Property I, L.P. | System and method of using neural transforms of robust audio features for speech processing |
US9721561B2 (en) | 2013-12-05 | 2017-08-01 | Nuance Communications, Inc. | Method and apparatus for speech recognition using neural networks with speaker adaptation |
US9373324B2 (en) | 2013-12-06 | 2016-06-21 | International Business Machines Corporation | Applying speaker adaption techniques to correlated features |
US9400955B2 (en) | 2013-12-13 | 2016-07-26 | Amazon Technologies, Inc. | Reducing dynamic range of low-rank decomposition matrices |
KR101937655B1 (ko) | 2013-12-31 | 2019-01-11 | 코오롱인더스트리 주식회사 | 복합 중공사막 및 그 제조방법 |
US10339920B2 (en) | 2014-03-04 | 2019-07-02 | Amazon Technologies, Inc. | Predicting pronunciation in speech recognition |
US9324321B2 (en) | 2014-03-07 | 2016-04-26 | Microsoft Technology Licensing, Llc | Low-footprint adaptation and personalization for a deep neural network |
US9529794B2 (en) | 2014-03-27 | 2016-12-27 | Microsoft Technology Licensing, Llc | Flexible schema for language model customization |
US9520127B2 (en) | 2014-04-29 | 2016-12-13 | Microsoft Technology Licensing, Llc | Shared hidden layer combination for speech recognition systems |
US20150325236A1 (en) | 2014-05-08 | 2015-11-12 | Microsoft Corporation | Context specific language model scale factors |
-
2013
- 2013-06-21 US US13/923,917 patent/US9589565B2/en active Active
-
2014
- 2014-06-05 WO PCT/US2014/041014 patent/WO2014204655A1/en active Application Filing
- 2014-06-05 CA CA2913735A patent/CA2913735C/en active Active
- 2014-06-05 AU AU2014281049A patent/AU2014281049B9/en active Active
- 2014-06-05 CN CN201480035401.9A patent/CN105378708B/zh active Active
- 2014-06-05 RU RU2015154501A patent/RU2667717C2/ru active
- 2014-06-05 BR BR112015031231-4A patent/BR112015031231B1/pt active IP Right Grant
- 2014-06-05 EP EP14736140.6A patent/EP3011471A1/en not_active Ceased
- 2014-06-05 KR KR1020167001395A patent/KR102231733B1/ko active IP Right Grant
- 2014-06-05 CN CN202010129077.4A patent/CN111368155B/zh active Active
- 2014-06-05 MX MX2015017624A patent/MX352774B/es active IP Right Grant
- 2014-06-05 JP JP2016521428A patent/JP6492069B2/ja active Active
-
2017
- 2017-02-21 US US15/438,227 patent/US10304448B2/en active Active
-
2019
- 2019-07-26 AU AU2019208255A patent/AU2019208255B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005013262A1 (en) * | 2003-08-01 | 2005-02-10 | Philips Intellectual Property & Standards Gmbh | Method for driving a dialog system |
US20070226649A1 (en) * | 2006-03-23 | 2007-09-27 | Agmon Jonathan | Method for predictive typing |
US20080235017A1 (en) * | 2007-03-22 | 2008-09-25 | Honda Motor Co., Ltd. | Voice interaction device, voice interaction method, and voice interaction program |
RU2011122784A (ru) * | 2008-11-07 | 2012-12-20 | Лингупедиа Инвестментс Сарл | Способ семантической обработки естественного языка с использованием графического языка-посредника |
US20110144999A1 (en) * | 2009-12-11 | 2011-06-16 | Samsung Electronics Co., Ltd. | Dialogue system and dialogue method thereof |
Also Published As
Publication number | Publication date |
---|---|
US10304448B2 (en) | 2019-05-28 |
CA2913735A1 (en) | 2014-12-24 |
KR20160021850A (ko) | 2016-02-26 |
CN105378708A (zh) | 2016-03-02 |
CN111368155B (zh) | 2024-03-08 |
US20140379353A1 (en) | 2014-12-25 |
BR112015031231B1 (pt) | 2022-04-26 |
BR112015031231A8 (pt) | 2020-03-24 |
US9589565B2 (en) | 2017-03-07 |
BR112015031231A2 (pt) | 2017-07-25 |
AU2014281049B2 (en) | 2019-05-02 |
AU2019208255A1 (en) | 2019-08-15 |
EP3011471A1 (en) | 2016-04-27 |
CN111368155A (zh) | 2020-07-03 |
MX2015017624A (es) | 2016-04-15 |
WO2014204655A1 (en) | 2014-12-24 |
RU2015154501A3 (ru) | 2018-05-04 |
MX352774B (es) | 2017-12-07 |
RU2015154501A (ru) | 2017-06-20 |
CA2913735C (en) | 2022-04-12 |
AU2014281049B9 (en) | 2019-05-23 |
JP2016524190A (ja) | 2016-08-12 |
KR102231733B1 (ko) | 2021-03-23 |
US20170162201A1 (en) | 2017-06-08 |
CN105378708B (zh) | 2020-03-27 |
AU2014281049A1 (en) | 2015-12-10 |
AU2019208255B2 (en) | 2020-11-12 |
JP6492069B2 (ja) | 2019-03-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2667717C2 (ru) | Диалоговые политики на основе параметров окружающей среды и генерация ответа | |
US20220116438A1 (en) | Network system for content playback on multiple devices | |
RU2689203C2 (ru) | Гибкая схема для настройки языковой модели | |
JP6335139B2 (ja) | 手動始点/終点指定及びトリガフレーズの必要性の低減 | |
US20140201629A1 (en) | Collaborative learning through user generated knowledge | |
US9830039B2 (en) | Using human wizards in a conversational understanding system | |
CN105378624A (zh) | 在交互出现于白板上时显示交互 | |
EP3504702A1 (en) | Systems and methods for artifical intelligence voice evolution | |
CN112219386A (zh) | 语音响应系统的图形用户界面 | |
CN110472021A (zh) | 会话中推荐新闻的技术 | |
US20140207448A1 (en) | Adaptive online feature normalization for speech recognition |