RU2667717C2 - Диалоговые политики на основе параметров окружающей среды и генерация ответа - Google Patents

Диалоговые политики на основе параметров окружающей среды и генерация ответа Download PDF

Info

Publication number
RU2667717C2
RU2667717C2 RU2015154501A RU2015154501A RU2667717C2 RU 2667717 C2 RU2667717 C2 RU 2667717C2 RU 2015154501 A RU2015154501 A RU 2015154501A RU 2015154501 A RU2015154501 A RU 2015154501A RU 2667717 C2 RU2667717 C2 RU 2667717C2
Authority
RU
Russia
Prior art keywords
environmental conditions
user
dialogue
act
response
Prior art date
Application number
RU2015154501A
Other languages
English (en)
Other versions
RU2015154501A3 (ru
RU2015154501A (ru
Inventor
Дэниел БОЙС
Ларри ХЕК
Тасос АНАСТАСАКОС
Рухи САРИКАЯ
Original Assignee
МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи filed Critical МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи
Publication of RU2015154501A publication Critical patent/RU2015154501A/ru
Publication of RU2015154501A3 publication Critical patent/RU2015154501A3/ru
Application granted granted Critical
Publication of RU2667717C2 publication Critical patent/RU2667717C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • User Interface Of Digital Computer (AREA)
  • Stored Programmes (AREA)
  • Digital Computer Display Output (AREA)
  • Air Conditioning Control Device (AREA)

Abstract

Изобретение относится к переговорной диалоговой системе. Техническим результатом является расширение арсенала технических средств. Система содержит процессор и память; операционную среду, выполняющуюся с использованием процессора; и диалоговый диспетчер, который выполнен с возможностью осуществления действий, содержащих: определение условий окружающей среды, которые связаны с актом пользовательского диалога, при этом условия окружающей среды включают в себя текущие условия окружающей среды, связанные с пользователем, совершающим акт пользовательского диалога, и текущие условия окружающей среды, связанные с другим пользователем, который является частью акта пользовательского диалога; определение машинного действия с использованием акта пользовательского диалога и условий окружающей среды; определение ответа на машинное действие с использованием условий окружающей среды и машинного действия; и обеспечение ответа. 3 н. и 5 з.п. ф-лы, 9 ил.

Description

УРОВЕНЬ ТЕХНИКИ
[0001] Переговорные диалоговые системы используются для разнообразных приложений. Например, разработаны переговорные диалоговые системы, которые позволяют пользователям искать контент, покупать предметы, получать предписания и пр. Эти переговорные диалоговые системы непрерывно усовершенствуются для обеспечения более естественных взаимодействий между компьютером и пользователем.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
[0002] Эта сущность изобретения призвана представлять в упрощенной форме основные принципы, которые дополнительно описаны в нижеследующем подробном описании. Эта сущность изобретения не призвана идентифицировать ключевые признаки или существенные признаки заявленного изобретения, а также не подлежит использованию для помощи в определении объема заявленного изобретения.
[0003] Условия окружающей среды, совместно с другой информацией, используются для регулировки разных операций переговорной диалоговой системы. Условия окружающей среды можно использовать в разные моменты времени в переговорной диалоговой системе. Каждый из компонентов диалогового диспетчера и генерации ответа в переговорной диалоговой системе использует доступные условия окружающей среды совместно с другой информацией в диалоговой системе (например, результатами понимания языка предыдущей реплики в диалоге, результатами распознавания речи и их достоверностью, результатами знания, предыдущим машинными действиями, контекстом сеанса, контекстом клиента …) при осуществлении своих операций. Например, условия окружающей среды можно использовать для регулировки выхода диалогового диспетчера (например, машинного действия). Информация состояния диалога, которая используется диалоговым диспетчером, включает в себя условия окружающей среды совместно с другой диалоговой информацией для текущей реплики в диалоге, а также условия окружающей среды для одной или более предыдущих реплик в диалоге. Условия окружающей среды также можно использовать после приема машинного действия для регулировки ответа, который предоставляется пользователю. Например, генератор ответа может использовать условия окружающей среды для определения, как пользователю предоставляется машинное действие (например, речевое, визуальное).
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
[0004] Фиг. 1 демонстрирует использование условий окружающей среды для регулировки разных операций, осуществляемых переговорной диалоговой системой;
[0005] фиг. 2 демонстрирует взаимодействия между приложением и диалоговой услугой для конфигурирования разрешений;
[0006] фиг. 3 демонстрирует иллюстративную переговорную диалоговую систему, использующую условия окружающей среды;
[0007] фиг. 4 демонстрирует процесс для использования условий окружающей среды в переговорной диалоговой системе;
[0008] фиг. 5 демонстрирует иллюстративную онлайновую систему, которая использует условия окружающей среды при определении машинного действия и как доставлять ответ в диалоге; и
[0009] фиг. 6, 7A, 7B и 8 и соответствующие описания обеспечивают рассмотрение различных операционных сред, в которых можно практически применять варианты осуществления изобретения.
ПОДРОБНОЕ ОПИСАНИЕ
[0010] Далее будут описаны чертежи, в которых сходные ссылочные позиции представляют сходные элементы, в различных вариантах осуществления.
[0011] Фиг. 1 демонстрирует использование условий окружающей среды для регулировки разных операций, осуществляемых переговорной диалоговой системой.
[0012] Как показано, система 100 включает в себя диалоговую услугу 105, диалоговый диспетчер 26, разрешения и настройки 110, генератор 120 машинного действия, диалоговую политику 130, генератор 140 ответа, информацию 145 состояния диалога, условия 150 окружающей среды, модель(и) 160 понимания, приложение 110 и устройство 115 ввода на основе сенсорного экрана.
[0013] В целом, переговорная диалоговая система 100 использует сигналы окружающей среды (например, понимание языка и результаты знания, результаты распознавания речи и их достоверность …) для политики и генерации ответа помимо использования другой информации или сигналов, обычно доступных в диалоговой системе. Сигналы окружающей среды расширяют (не заменяют) сигналы, обычно используемые в диалоговой системе. Диалоговый диспетчер 26 использует условия 150 окружающей среды в дополнение к информации 145 состояния диалога для регулировки разных операций переговорной диалоговой системы. Условия окружающей среды можно использовать в разные моменты времени в переговорной диалоговой системе 100. Компоненты диалогового диспетчера 26, генератора 120 машинного действия и генератора 140 ответа в переговорной диалоговой системе 100 могут использовать доступные условия 150 окружающей среды при осуществлении своих операций.
[0014] Генератор 120 машинного действия может использовать условия 150 окружающей среды для регулировки определяемого машинного действия совместно с информацией 145 состояния использования диалога. В целом, условия 150 окружающей среды расширяют информацию 145 состояния диалога, которая используется в диалоговой системе. Например, информация 145 состояния диалога включает в себя информацию, например, но без ограничения: например, результаты понимания языка предыдущей реплики в диалоге, результаты распознавания речи и их достоверность, результаты знания, предыдущие машинные действия, контекст сеанса, контекст клиента и пр. Каждое взаимодействие между пользователем и вычислительным устройством (т.е. машиной) является репликой. Текущая реплика является текущим взаимодействием между пользователем и машиной, для которой определяется машинное действие. Предыдущая реплика является предыдущим взаимодействием между пользователем и машиной. Согласно варианту осуществления, информация 145 состояния диалога включает в себя информацию, относящуюся к одной или более предыдущим репликам. Например, результаты понимания языка, которые связывают значение с предложением на естественном языке, хранятся в информации 145 состояния диалога. Эти предыдущие результаты понимания языка можно использовать для обеспечения контекста текущей реплики в диалоге. Информация состояния диалога также может включать в себя результаты знания, которые являются результатами, возвращаемыми из источника знаний, например, базы данных или источника данных. Например, если пользователь запрашивает фильмы в реплике диалога, результаты знания включают в себя перечень фильмов. Машинное действие, определяемое с использованием условий окружающей среды, может отличаться от определяемого машинного действия без использования условий окружающей среды. Например, машинное действие, которое генерируется генератором 120 машинного действия, может указывать необходимость спросить водителя, действительно ли он хочет сделать вызов во время движения, когда условия 150 окружающей среды указывают, что пользователь в данный момент ведет машину. Без использования условий 150 окружающей среды для расширения машинного действия, генератор 120 машинного действия, вероятно, будет генерировать машинное действие для автоматического инициирования вызова, когда пользователь в данный момент ведет машину, вместо того, чтобы спрашивать водителя, действительно ли он хочет сделать вызов во время движения. Генератор 120 машинного действия использует диалоговую политику 130 при определении машинного действия. Диалоговая политика 130 включает в себя разные правила, в том числе, правила, которые используют условия 150 окружающей среды и другую информацию состояния диалога, для регулировки генерируемого машинного действия.
[0015] Условия 150 окружающей среды также можно использовать генератором 140 ответа после приема машинного действия для регулировки ответа, который предоставляется пользователю. Условия 150 окружающей среды может влиять на то, как машинное действие (например, речевое, визуальное …) предоставляется пользователю. Например, ответ, генерируемый генератором 140 ответа, может быть визуальным ответом, когда условия 150 окружающей среды указывают, что окружающая среда пользователя зашумлена. Ответ, генерируемый генератором 140 ответа, может быть звуковым ответом, когда условия 150 окружающей среды указывают, что окружающая среда пользователя очень ярка, и маловероятно, что дисплей можно видеть отчетливо.
[0016] Условия 150 окружающей среды могут включать в себя разнообразные условия, например, но без ограничения: погодные условия, условия трафика, условия текущей активности, используемое в данный момент вычислительное устройство и пр. Условия текущей активности могут включать в себя информацию, например, но без ограничения: текущую скорость, текущее местоположение и пр. В целом, условия окружающей среды относятся к любым условиям окружающей среды, которые связаны с пользователем, обеспечивающим ввод (акт пользовательского диалога). Согласно варианту осуществления, условия окружающей среды также могут быть связаны с другим пользователем 154 (например, вызываемым контактом). Согласно варианту осуществления, условия окружающей среды, которые собираются и используются для регулировки работы переговорной диалоговой системы, задаются и авторизуются пользователем.
[0017] Для облегчения связи с диалоговым диспетчером 26, можно реализовать одну или более процедур обратного вызова. Согласно варианту осуществления, прикладная программа 110 является многорежимным приложением, которое выполнено с возможностью приема речевого ввода и ввода от устройства 115 ввода, чувствительного к прикосновению или других устройств ввода. Например, голосовой ввод, ввод с клавиатуры (например, физической клавиатуры и/или SIP), ввод на основе видео и пр. Прикладная программа 110 также может обеспечивать многорежимный вывод (например, речь, графику, вибрации, звуки, …). Диалоговый диспетчер 26 может обеспечивать информацию на/от приложения 110 в ответ на пользовательский ввод (например, речь, жест). Например, пользователь может сказать фразу для идентификации задания, осуществляемого приложением 110 (например, выбора фильма, покупки предмета, идентификации продукта, …). Жесты могут включать в себя, но без ограничения: щипковый жест; растягивающий жест; жест выбора (например, тычковое действие на отображаемом элементе); жест выбора и удержания (например, жест тычка и удержания, принятое на отображаемом элементе); маховое действие и/или действие перетаскивание; и пр. Жесты также могут включать в себя оптически захватываемые жесты, например: волновой жест, прокручивающий жест, направляющий жест и пр. Например, для обнаружения жестов можно использовать такое устройство, как MICROSOFT KINECT.
[0018] Система 100, как показано, содержит устройство 115 ввода на основе сенсорного экрана, которое обнаруживает, когда был принят тактильный ввод (например, палец, касающийся или почти касающийся сенсорного экрана). Можно использовать сенсорный экран любого типа, который обнаруживает тактильный ввод пользователя.
[0019] Для взаимодействия с диалоговой услугой 105 можно использовать естественный пользовательский интерфейс (NUI) и/или какие-либо другие интерфейсы. Например, для взаимодействия с диалоговой услугой 105 можно использовать комбинацию диалога на естественном языке и других невербальных режимов выражения намерения (например, жестов, например, вышеописанных жестов, прикосновения, взгляда, изображений, видеозаписей, устной просодии и т.д.). Диалоговый диспетчер 26 может использовать модель понимания (например, модель понимания языка (LU) или многорежимную модель понимания). Как показано, диалоговый диспетчер 26 составляет часть диалоговой услуги 105, которая принимает речевые фрагменты и выполнена с возможностью иметь диалог с пользователем.
[0020] В целом, понимание естественного языка (NLU) в целеориентированных диалоговых системах направлено на идентификацию области(ей) и намерения(ий) пользователя, выраженных на естественном языке (NL), и на извлечение соответствующих аргументов или слотов. Например, в области авиалиний, пользователи часто запрашивают информацию о рейсе (например, “Я хочу полететь в Бостон из Нью-Йорка на следующей неделе”). Дополнительные подробности приведены ниже.
[0021] Фиг. 2 демонстрирует взаимодействия между приложением и диалоговой услугой для конфигурирования разрешений.
[0022] Как показано, фиг. 2 демонстрирует диалоговую услугу 105, включающую в себя настройки 210 и журнал(ы) 212, и приложение 110 которое включает в себя пользовательский интерфейс 222 настроек, пользовательский интерфейс 226 аудита, пользовательский интерфейс 228 местоположения и локальные настройки 224.
[0023] Пользователь может конфигурировать разные критерии, например, разрешения, фильтры и настройки, которые относятся к работе приложения 110 и к использованию и сбору условий окружающей среды, которые связаны с одним или более пользователями. Например, авторизованный пользователь может определить, что условия окружающей среды могут собираться и использоваться диалоговой услугой 105.
[0024] Пользователь может устанавливать разрешения, которые указывают, какие условия окружающей среды можно собирать. Например, пользователь может дать согласие на сбор и использование диалоговой услугой 105 различных типов условий окружающей среды.
[0025] Пользователь также может конфигурировать один или более фильтров, которые фильтруют информацию с использованием различных критериев (например, времени суток, запрашивающего устройства, местоположения запрашивания и пр.). Например, пользователь может давать согласие на сбор определенных условий окружающей среды в течение определенных промежутков времени и не давать согласие на сбор условий окружающей среды в течение других промежутков времени. Пользователь может конфигурировать фильтр для ограничения точности одного или более из условий окружающей среды. Например, информацию местоположения, которая связана с пользователем, можно конфигурировать для обеспечения общего местоположения по сравнению с детальным местоположением. Пользователь также может устанавливать локальные настройки 224, например, настройки адаптации приложения (например, цветовые схемы, пиктограммы и пр.) для использования при взаимодействии с приложением 110. Например, настройки 224 могут изменять внешний вид пользовательского интерфейса, например UI 228.
[0026] Пользовательский интерфейс 226 аудита авторизованный пользователь может использовать для просмотра информации, относящейся к условиям окружающей среды, которая хранятся в журнале 212, и взаимодействия с ней. Доступ к данным, связанным с журналом, имеет только авторизованный пользователь, предоставивший правильный набор удостоверений защиты. Данные безопасно хранятся в журнале(ах) 212.
[0027] Фиг. 3 демонстрирует иллюстративную переговорную диалоговую систему, использующую условия окружающей среды.
[0028] Как показано, система 300 включает в себя диспетчер 310 ввода, компонент 320 понимания языка, диалоговый движок 330, генератор 140 ответа и движок 350 окружающей среды.
[0029] Диспетчер 310 ввода выполнен с возможностью приема пользовательского ввода (акта пользовательского диалога). Актом пользовательского диалога может быть пользовательский ввод того или иного типа. Например, актом пользовательского диалога может быть речевой ввод (например, речевой фрагмент), тактильный ввод, жестовый ввод, текстовый ввод, а также другие типы ввода. Диспетчер 310 ввода может включать в себя разные компоненты, например, автоматический распознаватель речи (ASR), распознаватель жестов, распознаватель рукописного текста и пр. Когда актом пользовательского диалога является речь, речь распознается диспетчером 310 ввода с использованием ASR. Диспетчер 310 ввода выводит текст, который поступает на компонент 320 понимания языка.
[0030] Компонент 320 понимания языка выполнен с возможностью приема и анализа текста. В целом, компонент 320 понимания языка связывает значение со словами текста. Например, компонент 320 понимания языка может размечать текст, осуществлять синтаксический анализ текста и пр. Компонент 320 понимания языка традиционно является компонентом на основе правил, который преобразует предложения естественного языка в семантические представления.
[0031] Диалоговый движок 330 управляет диалогом путем определения машинного действия в ответ на акт пользовательского диалога. Диалоговый движок 330 может представлять собой модель на основе правил или статистическую модель, или некоторую комбинацию модели на основе правил и статистической модели. Диалоговый движок 330 вычисляет возможные состояния диалога с использованием компонента 332 вычисления состояния диалога. При вычислении возможных состояний диалога компонент 332 вычисления состояния диалога использует условия окружающей среды, полученные от движка 350 окружающей среды, помимо другой информации состояния диалога. Условия окружающей среды, которые используются диалоговой системой, представляют собой, помимо другой диалоговой информации, обычно используемой в диалоговой системе, например, но без ограничения: результаты понимания языка предыдущей реплики, результаты распознавания речи и их достоверность, результаты знания, предыдущие машинные действия, контекст сеанса, контекст клиента и пр. Условия окружающей среды могут быть связаны с одним или более пользователями. Диалоговый диспетчер 26 определяет машинное действие или машинные действия. Информация состояния диалога, которая используется диалоговым диспетчером 26, включает в себя условия окружающей среды для текущей реплики в диалоге, а также условия окружающей среды для одной или более предыдущих реплик в диалоге. Диалоговый движок 330 выдает определенное машинное действие на генератор 140 ответа.
[0032] Генератор 140 ответа использует условия окружающей среды, полученные от движка окружающей среды, помимо другой диалоговой информации, для определения типа ответа, предоставляемого пользователю. Например, генератор 140 ответа может определять, предоставить ли пользователю речевой ответ или визуальный ответ. Например, компонент тексторечевого преобразования ("TTS"), в результате определения, может выводить ответ в виде синтезированной речи. Согласно варианту осуществления, условия окружающей среды обновляются после того, как диалоговый диспетчер 26 определяет машинное действие, и до того, как генератор 140 ответа принимает условия окружающей среды.
[0033] Фиг. 4 демонстрирует процесс для использования условий окружающей среды в переговорной диалоговой системе. Из представленного здесь описания процедур следует, что логические операции различных вариантов осуществления реализованы (1) как последовательность осуществляемых на компьютере действий или программных модулей, выполняющихся на вычислительной системе и/или (2) как соединенные между собой схемы машинной логики или схемные модули в вычислительной системе. Реализация является вопросом выбора, зависящего от требований производительности вычислительной системы, реализующей изобретение. Соответственно, логические операции, проиллюстрированные и составляющие описанные здесь варианты осуществления, именуются по-разному как операции, структурные устройства, действия или модули. Эти операции, структурные устройства, действия и модули можно реализовать программными средствами, программно-аппаратными средствами, в виде цифровой логики специального назначения, и любой их комбинации.
[0034] После начальной операции, процесс 400 переходит к операции 410, где принимается акт пользовательского диалога. Актом пользовательского диалога может быть пользовательский ввод того или иного типа, например, но без ограничения: речевой ввод (например, речевой фрагмент), тактильный ввод, жестовый ввод, текстовый ввод, а также другие типы ввода. В целом, акт пользовательского диалога составляет часть переговоров с диалоговой системой.
[0035] При переходе к операции 420, определяются условия окружающей среды. Условия окружающей среды связаны с одним или более пользователями. Например, условия окружающей среды могут быть текущими условиями окружающей среды, которые связаны с пользователем, совершающим акт пользовательского диалога. Условия окружающей среды также могут быть текущими условиями окружающей среды, которые связаны с другим пользователем, который является частью акта пользовательского диалога. Например, акт пользовательского диалога может быть актом для контакта с другим пользователем. Условия окружающей среды могут включать в себя разнообразные условия, например, но без ограничения: погодные условия (например, температуру, давление …), условия трафика, условия текущей активности, используемое в данный момент вычислительное устройство и пр. В целом, любые условия окружающей среды могут определяться и использоваться переговорной диалоговой системой. Условия текущей активности могут включать в себя разнообразные условия окружающей среды, например, местоположение пользователя, скорость пользователя и пр.
[0036] При переходе к операции 430, машинное действие определяется с использованием условий окружающей среды, другой информации состояния диалога и акта пользовательского диалога. Согласно варианту осуществления, при вычислении возможных состояний диалога переговорная диалоговая система, помимо другой информации состояния диалога, использует условия окружающей среды. Например, другая информация состояния диалога может включать в себя, но без ограничения: результаты понимания языка предыдущей реплики, результаты распознавания речи и их достоверность, результаты знания, предыдущие машинные действия, контекст сеанса, контекст клиента и пр. Информация состояния диалога включает в себя условия окружающей среды для текущей реплики в диалоге, а также условия окружающей среды для одной или более предыдущих реплик в диалоге.
[0037] Нижеследующие примеры иллюстрируют регулировку машинного действия с использованием условий окружающей среды и другой информации в диалоговой системе для определения машинного действия. Примеры приведены в целях иллюстрации, но не ограничения.
[0038] Ниже приведен пример диалога, когда пользователь ведет машину. 1) Пользователь: “Позвонить Павлу на домашний”; 2) диалоговая система: “Уверены, что хотите звонить во время движения?” Как можно видеть, машинное действие, вместо осуществления вызова, отрегулировано запрашивать, хочет ли пользователь сделать вызов.
[0039] Следующим примером является диалог, где пользователь пытается вызвать контакт в период времени, когда контакт, скорее всего, спит. 1) Пользователь: “Позвонить Павлу”; 2) диалоговая система: “Павел сейчас, наверное, спит. Не хотите ли взамен отправить Павлу сообщение?” В этом примере, условия окружающей среды, которые связаны с контактом, изменили машинное действие.
[0040] Следующим примером является диалог, где пользователь пытается сделать вызов, когда пользователь находится в режиме роуминга, или контакт находится в режиме роуминга. 1) Пользователь: “Позвонить Павлу”; диалоговая система: “Звонок Павлу будет стоить Павлу два доллара в минуту, поскольку он сейчас в роуминге. Не хотите ли взамен отправить Павлу сообщение?” В этом примере, условия окружающей среды, изменившие машинное действие, связаны с текущей активностью контакта.
[0041] Следующим примером является диалог, где пользователь пытается вызвать контакт, когда контакт, вероятно, ведет машину. 1) Пользователь: “Позвонить Павлу”; 2) диалоговая система: “Павел сейчас может быть за рулем. Не хотите ли взамен отправить Павлу сообщение?” В этом примере, условия окружающей среды, изменившие машинное действие, связаны с текущей активностью контакта.
[0042] Следующим примером является диалог, где пользователь пытается вызвать контакт, когда контакт находится в зашумленной окружающей среде. 1) Пользователь: “Позвонить Павлу”; 2) диалоговая система “Возможно, Павел плохо слышит Вас. Не хотите ли взамен отправить сообщение?” В этом примере, условия окружающей среды, изменившие машинное действие, связаны с текущими шумовыми условиями контакта.
[0043] После операции 440, ответ на машинное действие определяется с использованием условий окружающей среды. Может быть обеспечено много различных типов ответа (например, визуальный, звуковой, тактильный …). Пользователю может предоставляться речевой ответ, или пользователю может предоставляться визуальный ответ. Например, пользователь может находиться в зашумленной окружающей среде, и ответ регулируется, чтобы быть громче нормального. Тип ответа также может изменяться. Например, ответ может изменяться от звукового ответа к визуальному ответу.
[0044] При переходе к операции 450, пользователю предоставляется ответ.
[0045] Затем процесс переходит к конечной операции и возвращается к обработке других действий.
[0046] Фиг. 5 демонстрирует иллюстративную онлайновую систему, которая использует условия окружающей среды при определении машинного действия и как доставлять ответ в диалоге. Как показано, система 1000 включает в себя услугу 1010, хранилище 1045 данных, условия 150 окружающей среды, устройство 1050 ввода на основе сенсорного экрана (например, графический планшет), смартфон 1030 и устройство 1080 отображения.
[0047] Как показано, услуга 1010 является облачной услугой и/или услугой в масштабах предприятия, которую можно конфигурировать для обеспечения таких услуг, как описанные здесь диалоговые услуги. С услугой можно взаимодействовать с использованием различных типов ввода и вывода. Например, пользователь может использовать речевой ввод, тактильный ввод, аппаратный ввод и пр. Функциональные возможности одной или более из услуг, предоставляемых услугой 1010, также могут быть сконфигурированы как приложение клиентско-серверной основе.
[0048] Как показано, услуга 1010 является многоабонентской услугой которая предоставляет ресурсы 1015 и услуги любому количеству абонентов (например, абонентам 1-N). Многоабонентская услуга 1010 является облачной услугой, которая предоставляет ресурсы 1015 абонентам, подписавшимся на услугу, и поддерживает данные каждого абонента в отдельности и защищенные от других абонентских данных.
[0049] Система 1000, как показано, содержит устройство 1050 ввода на основе сенсорного экрана (например, устройство графического планшета) и смартфон 1030, который обнаруживает, когда был принят тактильный ввод (например, палец, касающийся или почти касающийся сенсорного экрана). Можно использовать сенсорный экран любого типа, который обнаруживает тактильный ввод пользователя. Например, сенсорный экран может включать в себя один или более слоев емкостного материала, который обнаруживает тактильный ввод. Помимо или вместо емкостного материала можно использовать другие датчики. Например, можно использовать инфракрасные (IR) датчики. Согласно варианту осуществления, сенсорный экран выполнен с возможностью обнаружения объектов, который контактирует с или над касаемой поверхностью. Хотя в этом описании используется термин "над", следует понимать, что ориентация системы сенсорной панели не имеет значения. Термин "над" применимо ко всем таким ориентациям. Сенсорный экран можно конфигурировать для определения положений приема тактильного ввода (например, начальной точки, промежуточных точек и конечной точки). Фактический контакт между касаемой поверхностью и объектом можно обнаруживать любыми подходящими средствами, в том числе, например, датчиком вибрации или микрофоном, подключенным к сенсорной панели. Неполный перечень примеров датчиков обнаружения контакта включает в себя механизмы регистрации давления, микроскопические акселерометры, пьезоэлектрические устройства, емкостные датчики, резистивные датчики, индуктивные датчики, лазерные виброметры и светодиодные виброметры.
[0050] Согласно варианту осуществления, смартфон 1030, устройство 1050 ввода на основе сенсорного экрана и устройство 1080 выполнены с возможностью многорежимного ввода и вывода, и каждый из них включает в себя приложение (1031, 1051, 1081), которое взаимодействует с услугой 1010.
[0051] Как показано, устройство 1050 ввода на основе сенсорного экрана, смартфон 1030 и устройство 1080 отображения демонстрирует иллюстративные дисплеи 1052, 1032 и 1082, демонстрирующие использование приложения. Данные могут храниться на устройстве (например, смартфоне 1030, устройстве 1050 ввода на основе сенсорного экрана и/или в каком-либо другом месте (например, сетевом хранилище 1045 данных). Хранилище 1045 данных, или какое-либо другое хранилище, можно использовать для хранения модели понимания, а также других данных. Приложения, используемые устройствами, могут быть клиентскими приложениями, серверными приложениями, облачными приложениями или некоторой комбинации. Согласно варианту осуществления, устройство 1080 отображения является таким устройством, как MICROSOFT XBOX, подключенный к дисплею.
[0052] Диалоговый диспетчер 26 выполнен с возможностью осуществления операций, связанных с описанными здесь процессами. Диалоговый диспетчер 26 выполнен с возможностью доступа к условиям 150 окружающей среды. Хотя диспетчер 26 показан в услуге 1010, функциональные возможности диспетчера могут быть включены в другие положения (например, на смартфоне 1030 и/или устройстве 1050 ввода на основе сенсорного экрана и/или устройстве 1080).
[0053] Описанные здесь варианты осуществления и функциональные возможности могут действовать посредством большого количества вычислительных систем, включающих в себя, без ограничения, настольные компьютерные системы, проводные и беспроводные вычислительные системы, мобильные вычислительные системы (например, мобильные телефоны, нетбуки, компьютеры типа планшета или графического планшета, компьютеры-ноутбуки и портативные компьютеры), карманные устройства, многопроцессорные системы, микропроцессорную или программируемую бытовую электронику, миникомпьютеры и универсальные компьютеры.
[0054] Кроме того, описанные здесь варианты осуществления и функциональные возможности могут действовать в распределенных системах (например, облачных вычислительных системах), где прикладные функциональные возможности, память, хранение и извлечение данных и различные функции обработки могут осуществляться удаленно друг от друга в распределенной вычислительной сети, например, интернете или интрасети. Пользовательские интерфейсы и информация различных типов могут отображаться посредством встроенных дисплеев вычислительных устройств или посредством удаленных блоков отображения, связанных с одним или более вычислительными устройствами. Например, пользовательские интерфейсы и информация различных типов можно отображать, и с ними можно взаимодействовать на поверхности стены, на которую проецируются пользовательские интерфейсы и информация различных типов. Взаимодействие с большим количеством вычислительных систем, позволяющих практически применять варианты осуществления изобретения, включает в себя, клавишный ввод, ввод через сенсорный экран, голосовой или другой аудиоввод, жестовый ввод, когда соответствующее вычислительное устройство снабжено функциональными возможностями обнаружения (например, камерой) для захвата и интерпретации жестов пользователя для управления функционированием вычислительного устройства и пр.
[0055] Фиг. 6-8 и соответствующие описания обеспечивают рассмотрение различных операционных сред, в которых можно практически применять варианты осуществления изобретения. Однако устройства и системы, проиллюстрированные и рассмотренные со ссылкой на фиг. 6-8, приведены в целях примера и иллюстрации, но не ограничения большого количества конфигураций вычислительного устройства, которые можно использовать для практического применения описанных здесь вариантов осуществления изобретения.
[0056] На фиг. 6 показана блок-схема, демонстрирующая физические компоненты (т.е. аппаратные) вычислительного устройства 1100, позволяющие практически применять варианты осуществления изобретения. Описанные ниже компоненты вычислительного устройства могут быть пригодны для вышеописанных вычислительных устройств. В базовой конфигурации, вычислительное устройство 1100 может включать в себя по меньшей мере один блок 1102 обработки и системную память 1104. В зависимости от конфигурации и типа вычислительного устройства, системная память 1104 может содержать, но без ограничения, энергозависимое хранилище (например, оперативную память), энергонезависимое хранилище (например, постоянную память), флэш-память или любую комбинацию таких блоков памяти. Системная память 1104 может включать в себя операционную систему 1105 и один или более программных модулей 1106 пригодных для выполнения прикладных программ 1120, например диалоговый диспетчер 26. Операционная система 1105, например, может быть пригодна для управления работой вычислительного устройства 1100. Кроме того, варианты осуществления изобретения можно практически применять совместно с библиотекой графики, другими операционными системами или любой другой прикладной программой и не ограничивается никаким конкретным приложением или системой. Эта базовая конфигурация представлена на фиг. 6 компонентами, обрамленными пунктирной линией 1108. Вычислительное устройство 1100 может иметь дополнительные признаки или функциональные возможности. Например, вычислительное устройство 1100 также может включать в себя, например, дополнительные устройства хранения данных (сменные и/или стационарные), например, магнитные диски, оптические диски или ленту. Такое дополнительное хранилище представлено на фиг. 6 сменным запоминающим устройством 1109 и стационарным запоминающим устройством 1110.
[0057] Как указано выше, несколько программных модулей и файлов данных может храниться в системной памяти 1104. При выполнении на блоке 1102, обработки, программные модули 1106 (например, диалоговый диспетчер 26) могут осуществлять процессы, включающие в себя, но без ограничения, одну или более стадий способов и процессов, проиллюстрированных на фигурах. Другие программные модули, которые можно использовать в соответствии с вариантами осуществления настоящего изобретения, может включать в себя приложения электронной почты и контактов, приложения редактирования текста, приложения электронной таблицы, приложения базы данных, приложения презентации слайдов, прикладные или компьютерные программы рисования и т.д.
[0058] Кроме того, варианты осуществления изобретения можно практически применять в электрической схеме, содержащей дискретные электронные элементы, упакованные или интегральные электронные микросхемы, содержащие логические вентили, схему, использующую микропроцессор, или на едином кристалле, содержащем электронные элементы или микропроцессоры. Например, варианты осуществления изобретения можно практически применять в виде однокристальной системы (SOC), где каждый или многие из компонентов, представленных на фиг. 6, могут интегрироваться в единую интегральную схему. Такое устройство SOC может включать в себя один или более блоков обработки, блоков графики, блоков связи, блоков виртуализации системы, и различные прикладные функциональные возможности, которые все встроены (или “вшиты”) в подложку кристалла в качестве единой интегральной схемы. При работе посредством SOC, функциональные возможности, описанные здесь в отношении диалоговый диспетчер 26 могут действовать посредством зависящей от приложения логики, объединенной с другими компонентами вычислительного устройства 1100 на единой интегральной схеме (кристалле). Варианты осуществления изобретения также можно практически применять с использованием других технологий, позволяющих осуществлять логические операции, например, например, AND, OR и NOT, в том числе, но без ограничения, механических, оптических, жидкостных и квантовых технологий. Кроме того, варианты осуществления изобретения можно практически применять в компьютере общего назначения или в любых других схемах или системах.
[0059] Вычислительное устройство 1100 также может иметь одно или более устройств 1112 ввода, например, клавиатуру, мышь, перо, устройство звукового ввода, устройство сенсорного ввода и т.д. Также могут быть включены устройство(а) 1114 вывода, например, дисплей, громкоговорители, принтер и т.д. Вышеупомянутые устройства являются примерами, и можно использовать другие. Вычислительное устройство 1100 может включать в себя одно или более соединений 1116 с возможностью связи, позволяющих осуществлять связь с другими вычислительными устройствами 1118. Примеры пригодных соединений 1116 с возможностью связи включают в себя, но без ограничения, схемы RF передатчика, приемника и/или приемопередатчика; универсальную последовательную шину (USB), параллельные и/или последовательные порты.
[0060] Используемый здесь термин "компьютерно-считываемые носители" может включать в себя компьютерные носители данных. Компьютерные носители данных могут включать в себя энергозависимые и энергонезависимые, сменные и стационарные носители, реализованные посредством любого способа или технологии для хранения информации, например, компьютерно-считываемых инструкций, структур данных или программных модулей. Системная память 1104, сменное запоминающее устройство 1109 и стационарное запоминающее устройство 1110 являются примерами компьютерных носителей данных (т.е. запоминающего устройства). Компьютерные носители данных может включать в себя RAM, ROM, электрически стираемую постоянную память (EEPROM), флэш-память или другую технологию памяти, CD-ROM, цифровые универсальные диски (DVD) или другое оптическое запоминающее устройство, магнитные кассеты, магнитную ленту, магнитное дисковое запоминающее устройство или другие магнитные запоминающие устройства, или любое другое промышленное изделие, которые можно использовать для хранения информации, и к которым может обращаться вычислительное устройство 1100. Любые такие компьютерные носители данных могут входить в состав вычислительного устройства 1100. Компьютерные носители данных не включает в себя несущую волну или другой распространяющийся или модулированный сигнал данных.
[0061] Среды связи можно реализовать в виде компьютерно-считываемых инструкций, структур данных, программных модулей или других данных в модулированном сигнале данных, например, несущей волне или другом механизме переноса, и включать в себя любые носители доставки информации. Термин “модулированный сигнал данных” могут описывать сигнал, одна или более характеристик которого устанавливается или изменяется таким образом, чтобы кодировать информацию в сигнале. В порядке примера, но не ограничения, среды связи могут включать в себя проводные носители, например, проводную сеть или прямое проводное соединение, и беспроводные среды передачи данных, например, акустические, радиочастотные (RF), инфракрасные и другие беспроводные среды передачи данных.
[0062] Фиг. 7A и 7B демонстрируют мобильное вычислительное устройство 1200, например, мобильный телефон, смартфон, планшетный персональный компьютер, портативный компьютер и пр., позволяющие практически применять варианты осуществления изобретения. Со ссылкой на фиг. 7A, проиллюстрирован один вариант осуществления мобильного вычислительного устройства 1200 для реализации вариантов осуществления. В базовой конфигурации, мобильным вычислительным устройством 1200 является карманный компьютер, имеющий элементы ввода и элементы вывода. Мобильное вычислительное устройство 1200 обычно включает в себя дисплей 1205 и одну или более кнопок 1210 ввода, которые позволяют пользователю вводить информацию в мобильное вычислительное устройство 1200. Дисплей 1205 мобильного вычислительного устройства 1200 также может действовать как устройство ввода (например, дисплей с сенсорным экраном). Если включен, необязательный боковой элемент 1215 ввода допускает дополнительный пользовательский ввод. Боковым элементом 1215 ввода может быть вращательный переключатель, кнопка или элемент ручного ввода любого другого типа. В альтернативных вариантах осуществления, мобильное вычислительное устройство 1200 может включать в себя больше или меньше элементов ввода. Например, дисплей 1205, в некоторых вариантах осуществления, может не быть сенсорным экраном. В еще одном альтернативном варианте осуществления, мобильное вычислительное устройство 1200 является системой портативного телефона, например сотовым телефоном. Мобильное вычислительное устройство 1200 также может включать в себя необязательную клавишную панель 1235. Необязательная клавишная панель 1235 может быть физической клавишной панелью или “программной” клавишной панелью, сгенерированной на дисплее с сенсорным экраном. В различных вариантах осуществления, элементы вывода включают в себя дисплей 1205 для демонстрации графического пользовательского интерфейса (GUI), визуальный индикатор 1220 (например, светодиодный) и/или преобразователь 1225 аудиосигнала (например, громкоговоритель). В некоторых вариантах осуществления, мобильное вычислительное устройство 1200 включает в себя вибрационный преобразователь для снабжения пользователя тактильной обратной связью. В еще одном варианте осуществления, мобильное вычислительное устройство 1200 включает в себя входной и/или выходной порты, например вход аудиосигнала (например, гнездо для подключения микрофона), выход аудиосигнала (например, гнездо для подключения головных телефонов) и выход видеосигнала (например, порт HDMI) для отправки сигналов на внешнее устройство или прием сигналов от него.
[0063] На фиг. 7B показана блок-схема, демонстрирующая архитектуру одного варианта осуществления мобильного вычислительного устройства. Таким образом, мобильное вычислительное устройство 1200 может включать в себя систему 1202 (т.е. архитектуру) для реализации некоторых вариантов осуществления. В одном варианте осуществления, система 1202 реализуется в виде “смартфона”, способного выполнять одно или более приложений (например, браузера, программы электронной почты, программы календаря, менеджера контактов, клиента службы обмена сообщениями, игровой программы и клиента/проигрывателя медийных материалов). В некоторых вариантах осуществления, система 1202 интегрирована как вычислительное устройство, например, карманный персональный компьютер (PDA), объединенный с беспроводным телефоном.
[0064] Одна или более прикладных программ 1266 может загружаться в память 1262 и выполняться на операционной системе 1264 или совместно с ней. Примеры прикладных программ включают в себя программы набора номера телефона, программы электронной почты, программы управления личной информацией (PIM), программы редактирования текста, программы электронной таблицы, программы интернет-браузера, программы обмена сообщениями и т.д. Система 1202 также включает в себя участок 1268 энергонезависимой памяти в памяти 1262. Участок 1268 энергонезависимой памяти можно использовать для хранения постоянной информации, которая не должна быть потеряна при отключении питания системы 1202. Прикладные программы 1266 могут использовать и сохранять в участке 1268, энергонезависимой памяти такую информацию, как электронная почта или другие сообщения, используемые приложением электронной почты и пр. Приложение синхронизации (не показано) также располагается в системе 1202 и запрограммировано взаимодействовать с соответствующим приложением синхронизации, присутствующим на хост-компьютере, для поддержания синхронизации информации, хранящейся в участке 1268 энергонезависимой памяти, с соответствующей информацией, хранящейся на хост-компьютере. Очевидно, другие приложения могут загружаться в память 1262 и выполняться на мобильном вычислительном устройстве 1200, включающий в себя описанный здесь диалоговый диспетчер 26.
[0065] Система 1202 имеет источник 1270 питания, который можно реализовать в виде одной или более батарей. Источник 1270 питания может дополнительно включают в себя внешний источник питания, например, адаптер переменного тока или зарядную док-станцию, которая пополняет или подзаряжает батареи.
[0066] Система 1202 также может включать в себя блок 1272 радиосвязи, который осуществляет функцию передачи и приема радиопередач. Блок 1272 радиосвязи обеспечивает возможность беспроводного соединения между системой 1202 и “внешним миром” через носитель передач или поставщика услуг. Передачи на блок 1272 радиосвязи и от него осуществляются под управлением операционной системы 1264. Другими словами, передачи, принятые блоком 1272 радиосвязи, могут рассылаться на прикладные программы 1266 через операционную систему 1264, и наоборот.
[0067] Визуальный индикатор 1220 можно использовать для обеспечения визуальных извещений, и/или аудиоинтерфейс 1274 можно использовать для создания звуковых извещений с помощью преобразователя 1225 аудиосигнала. В проиллюстрированном варианте осуществления, визуальным индикатором 1220 является светодиод (LED), и преобразователем 1225 аудиосигнала является громкоговоритель. Эти устройства могут быть непосредственно подключены к источнику 1270 питания таким образом, чтобы, будучи активированы, они оставались включенными на протяжении времени, определяемого механизмом извещения, несмотря на то, что процессор 1260 и другие компоненты могут отключаться для экономии энергии батареи. LED может быть запрограммирован оставаться включенным неопределенно долго, пока пользователь не предпримет акт для указания статуса включения питания устройства. Аудиоинтерфейс 1274 используется для вывода звуковых сигналов пользователю и приема звуковых сигналов от него. Например, помимо подключения к преобразователю 1225, аудиоинтерфейс 1274 также может подключаться к микрофону для приема звукового ввода, например, для облегчения телефонного разговора. В соответствии с вариантами осуществления настоящего изобретения, микрофон также может служить аудиодатчиком для облегчения управления извещениями, что будет описано ниже. Система 1202 может дополнительно включать в себя видеоинтерфейс 1276, который позволяет встроенной камере записывать неподвижные изображения, видеопоток и пр.
[0068] Мобильное вычислительное устройство 1200, реализующее систему 1202 может иметь дополнительные признаки или функциональные возможности. Например, мобильное вычислительное устройство 1200 также может включать в себя, например, дополнительные устройства хранения данных (сменные и/или стационарные), магнитные диски, оптические диски или ленту. Такое дополнительное хранилище представлено на фиг. 7B участком 1268 энергонезависимой памяти. Мобильное вычислительное устройство 1200 также может включать в себя порт 1230 периферийных устройств.
[0069] Данные/информация, сгенерированные или захваченные мобильным вычислительным устройством 1200 и сохраненные посредством системы 1202, могут храниться локально на мобильном вычислительном устройстве 1200, как описано выше, или данные могут храниться на любом количестве носителей данных, к которым устройство может обращаться через блок 1272 радиосвязи или через проводное соединение между мобильным вычислительным устройством 1200 и отдельным вычислительным устройством, связанным с мобильным вычислительным устройством 1200, например, компьютером-сервером в распределенной вычислительной сети, например, интернете. Очевидно, к таким данным/информации можно обращаться через мобильное вычислительное устройство 1200 посредством блока 1272 радиосвязи или по распределенной вычислительной сети. Аналогично, такие данные/информация могут легко переноситься между вычислительными устройствами для хранения и использоваться общеизвестными средствами переноса и хранения данных/информации, включающими в себя системы электронной почты и совместного использования объединенных данных/информации.
[0070] Фиг. 8 демонстрирует вариант осуществления архитектуры иллюстративной системы, как описано выше. Контент, разработку которого, взаимодействие с которым или редактирование которого можно осуществлять с помощью диалоговый диспетчер 26 может храниться на разных каналах связи или других типах хранилища. Например, различные документы могут храниться с использованием службы 1322, каталогов, веб-портала 1324, службы 1326 почтового ящика, хранилища 1328 мгновенного обмена сообщениями или социально-сетевого сайта 1330. Диалоговый диспетчер 26 может использовать любой из этих типов систем и т.п. для обеспечения описанного здесь использования данных. Сервер 1320 может обеспечивать диалоговый диспетчер 26 клиентам. В порядке одного примера, сервер 1320 может быть веб-сервером, обеспечивающим диалоговый диспетчер 26 по сети. Сервер 1320 может обеспечивать диалоговый диспетчер 26 по сети клиентам через сеть 1315. В порядке примера, клиентское вычислительное устройство можно реализовать в виде вычислительного устройства 1100 и воплотить в персональном компьютере, планшетном вычислительном устройстве 1310 и/или мобильном вычислительном устройстве 1200 (например, смартфоне). Любой из этих вариантов осуществления клиентского вычислительного устройства 1100, 1310, и 1200 может получать контент из хранилища 1316.
[0071] Варианты осуществления настоящего изобретения, в порядке примера, описаны выше со ссылкой на блок-схемы и/или операционные иллюстрации способов, систем и компьютерных программных продуктов согласно вариантам осуществления изобретения. Функции/действия, указанные в блоках, могут осуществлять в другом порядке, чем показано в какой-либо блок-схеме операций. Например, два блока, показанные последовательно, фактически может выполняться, по существу, одновременно, или блоки иногда могут выполняться в обратном порядке, в зависимости от предусмотренных функциональных возможностей/действий.
[0072] Описание и иллюстрация одного или более вариантов осуществления, обеспеченных в этой заявке, никоим образом не призваны ограничивать объем заявленного изобретения. Варианты осуществления, примеры и детали, обеспеченные в этой заявке, считаются достаточными для переноса имущества и позволяют другим создавать и использовать предпочтительные варианты осуществления заявленного изобретения. Заявленное изобретение не следует рассматривать как ограниченное каким-либо вариантом осуществления, примером или деталью, обеспеченными в этой заявке. Независимо от того, показаны ли и описаны ли они совместно или по отдельности, различные признаки (как структурные, так и методологические) подлежат выборочному включению или исключению для создания варианта осуществления с конкретным набором признаков. На основании описания и иллюстрации настоящей заявки, специалист в данной области техники может предложить вариации, модификации и альтернативные варианты осуществления, отвечающие сущности более широких аспектов общих принципов изобретения, воплощенных в этой заявке, которые не выходят за рамки более широкого объема заявленного изобретения.

Claims (24)

1. Способ использования условий окружающей среды в дополнение к другой информации состояния диалога в переговорной диалоговой системе, содержащий этапы, на которых:
определяют (420) условия окружающей среды, которые связаны с актом пользовательского диалога, при этом условия окружающей среды включают в себя текущие условия окружающей среды, связанные с пользователем, совершающим акт пользовательского диалога, и текущие условия окружающей среды, связанные с другим пользователем, который является частью акта пользовательского диалога;
определяют (430) машинное действие с использованием условий окружающей среды и акта пользовательского диалога;
определяют (440) ответ на машинное действие, причем это определение содержит использование условий окружающей среды для регулировки ответа; и
обеспечивают (450) ответ.
2. Способ по п. 1, в котором определение (420) условий окружающей среды, которые связаны с вводом, содержит определение по меньшей мере одного из: местоположения; уровня шума; скорости; температуры; текущей активности, или текущего вычислительного устройства в случае авторизации.
3. Способ по п. 1, в котором определение (420) условий окружающей среды содержит определение второго набора условий окружающей среды, которые связаны с другим пользователем в случае авторизации.
4. Компьютерно-считываемый носитель данных, где хранятся компьютерно-исполняемые инструкции для использования условий (150) окружающей среды в дополнение к другой информации (145) состояния диалога в переговорной диалоговой системе (100), содержащий:
прием акта пользовательского диалога;
определение условий (150) окружающей среды, которые связаны с актом пользовательского диалога, при этом условия окружающей среды включают в себя текущие условия (154) окружающей среды, связанные с пользователем, совершающим акт пользовательского диалога, и текущие условия (154) окружающей среды, связанные с другим пользователем, который является частью упомянутого акта пользовательского диалога;
определение машинного действия с использованием акта пользовательского диалога и условий (150) окружающей среды;
определение ответа на машинное действие с использованием условий (150) окружающей среды и машинного действия; и
обеспечение ответа.
5. Компьютерно-считываемый носитель данных по п. 4, в котором определение условий (150) окружающей среды, которые связаны с вводом, содержит определение по меньшей мере одного из: текущей активности, осуществляемой при приеме акта пользовательского диалога, или текущего вычислительного устройства в случае авторизации.
6. Система для использования условий окружающей среды в дополнение к другой информации состояния диалога в переговорной диалоговой системе, содержащая:
процессор и память;
операционную среду, выполняющуюся с использованием процессора; и
диалоговый диспетчер, который выполнен с возможностью осуществления действий, содержащих:
определение условий окружающей среды, которые связаны с актом пользовательского диалога, при этом условия окружающей среды включают в себя текущие условия окружающей среды, связанные с пользователем, совершающим акт пользовательского диалога, и текущие условия окружающей среды, связанные с другим пользователем, который является частью акта пользовательского диалога;
определение машинного действия с использованием акта пользовательского диалога и условий окружающей среды;
определение ответа на машинное действие с использованием условий окружающей среды и машинного действия; и
обеспечение ответа.
7. Система по п. 6, в которой определение условий окружающей среды, которые связаны с вводом, содержит определение по меньшей мере одного из: текущей активности, осуществляемой при приеме акта пользовательского диалога, или текущего вычислительного устройства в случае авторизации.
8. Система по п. 6, в которой определение ответа содержит использование условий окружающей среды для определения типа ответа из: речевого ответа или визуального представления ответа.
RU2015154501A 2013-06-21 2014-06-05 Диалоговые политики на основе параметров окружающей среды и генерация ответа RU2667717C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/923,917 2013-06-21
US13/923,917 US9589565B2 (en) 2013-06-21 2013-06-21 Environmentally aware dialog policies and response generation
PCT/US2014/041014 WO2014204655A1 (en) 2013-06-21 2014-06-05 Environmentally aware dialog policies and response generation

Publications (3)

Publication Number Publication Date
RU2015154501A RU2015154501A (ru) 2017-06-20
RU2015154501A3 RU2015154501A3 (ru) 2018-05-04
RU2667717C2 true RU2667717C2 (ru) 2018-09-24

Family

ID=51134327

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2015154501A RU2667717C2 (ru) 2013-06-21 2014-06-05 Диалоговые политики на основе параметров окружающей среды и генерация ответа

Country Status (11)

Country Link
US (2) US9589565B2 (ru)
EP (1) EP3011471A1 (ru)
JP (1) JP6492069B2 (ru)
KR (1) KR102231733B1 (ru)
CN (2) CN105378708B (ru)
AU (2) AU2014281049B9 (ru)
BR (1) BR112015031231B1 (ru)
CA (1) CA2913735C (ru)
MX (1) MX352774B (ru)
RU (1) RU2667717C2 (ru)
WO (1) WO2014204655A1 (ru)

Families Citing this family (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8181205B2 (en) 2002-09-24 2012-05-15 Russ Samuel H PVR channel and PVR IPG information
US11592723B2 (en) 2009-12-22 2023-02-28 View, Inc. Automated commissioning of controllers in a window network
US11054792B2 (en) 2012-04-13 2021-07-06 View, Inc. Monitoring sites containing switchable optical devices and controllers
US10964320B2 (en) * 2012-04-13 2021-03-30 View, Inc. Controlling optically-switchable devices
US20240046928A1 (en) * 2012-04-13 2024-02-08 View, Inc. Controlling optically-switchable devices
US10860683B2 (en) 2012-10-25 2020-12-08 The Research Foundation For The State University Of New York Pattern change discovery between high dimensional data sets
US9728184B2 (en) 2013-06-18 2017-08-08 Microsoft Technology Licensing, Llc Restructuring deep neural network acoustic models
US9311298B2 (en) 2013-06-21 2016-04-12 Microsoft Technology Licensing, Llc Building conversational understanding systems using a toolset
US9589565B2 (en) 2013-06-21 2017-03-07 Microsoft Technology Licensing, Llc Environmentally aware dialog policies and response generation
EP3114640B1 (en) 2014-03-05 2022-11-02 View, Inc. Monitoring sites containing switchable optical devices and controllers
US9324321B2 (en) 2014-03-07 2016-04-26 Microsoft Technology Licensing, Llc Low-footprint adaptation and personalization for a deep neural network
US9529794B2 (en) 2014-03-27 2016-12-27 Microsoft Technology Licensing, Llc Flexible schema for language model customization
US9614724B2 (en) 2014-04-21 2017-04-04 Microsoft Technology Licensing, Llc Session-based device configuration
US9520127B2 (en) 2014-04-29 2016-12-13 Microsoft Technology Licensing, Llc Shared hidden layer combination for speech recognition systems
US10111099B2 (en) 2014-05-12 2018-10-23 Microsoft Technology Licensing, Llc Distributing content in managed wireless distribution networks
US9430667B2 (en) 2014-05-12 2016-08-30 Microsoft Technology Licensing, Llc Managed wireless distribution network
US9384334B2 (en) 2014-05-12 2016-07-05 Microsoft Technology Licensing, Llc Content discovery in managed wireless distribution networks
US9874914B2 (en) 2014-05-19 2018-01-23 Microsoft Technology Licensing, Llc Power management contracts for accessory devices
US10037202B2 (en) 2014-06-03 2018-07-31 Microsoft Technology Licensing, Llc Techniques to isolating a portion of an online computing service
US9367490B2 (en) 2014-06-13 2016-06-14 Microsoft Technology Licensing, Llc Reversible connector for accessory devices
US9717006B2 (en) 2014-06-23 2017-07-25 Microsoft Technology Licensing, Llc Device quarantine in a wireless network
CN104360897B (zh) * 2014-10-29 2017-09-22 百度在线网络技术(北京)有限公司 对话处理方法和对话管理系统
US11574621B1 (en) 2014-12-23 2023-02-07 Amazon Technologies, Inc. Stateless third party interactions
US9792560B2 (en) * 2015-02-17 2017-10-17 Microsoft Technology Licensing, Llc Training systems and methods for sequence taggers
US10338959B2 (en) 2015-07-13 2019-07-02 Microsoft Technology Licensing, Llc Task state tracking in systems and services
US20180101762A1 (en) * 2015-12-10 2018-04-12 Pablo Gutierrez Graphical interfaced based intelligent automated assistant
US10635281B2 (en) 2016-02-12 2020-04-28 Microsoft Technology Licensing, Llc Natural language task completion platform authoring for third party experiences
US9978367B2 (en) * 2016-03-16 2018-05-22 Google Llc Determining dialog states for language models
US9996531B1 (en) * 2016-03-29 2018-06-12 Facebook, Inc. Conversational understanding
US20190026265A1 (en) * 2016-04-08 2019-01-24 Sony Corporation Information processing apparatus and information processing method
US20180005629A1 (en) * 2016-06-30 2018-01-04 Microsoft Technology Licensing, Llc Policy authoring for task state tracking during dialogue
US10185840B2 (en) * 2016-08-30 2019-01-22 Google Llc Conditional disclosure of individual-controlled content in group contexts
EP3396978B1 (de) * 2017-04-26 2020-03-11 Sivantos Pte. Ltd. Verfahren zum betrieb einer hörvorrichtung und hörvorrichtung
CN107103903B (zh) * 2017-05-05 2020-05-29 百度在线网络技术(北京)有限公司 基于人工智能的声学模型训练方法、装置及存储介质
US10418033B1 (en) * 2017-06-01 2019-09-17 Amazon Technologies, Inc. Configurable output data formats
CN107240395B (zh) * 2017-06-16 2020-04-28 百度在线网络技术(北京)有限公司 一种声学模型训练方法和装置、计算机设备、存储介质
KR102441066B1 (ko) * 2017-10-12 2022-09-06 현대자동차주식회사 차량의 음성생성 시스템 및 방법
US10783329B2 (en) * 2017-12-07 2020-09-22 Shanghai Xiaoi Robot Technology Co., Ltd. Method, device and computer readable storage medium for presenting emotion
JP2019106054A (ja) * 2017-12-13 2019-06-27 株式会社東芝 対話システム
JP2019144790A (ja) * 2018-02-20 2019-08-29 富士ゼロックス株式会社 情報処理装置及びプログラム
KR102445365B1 (ko) * 2018-03-19 2022-09-20 현대자동차주식회사 대화 시스템, 이를 포함하는 차량 및 대화 처리 방법
KR20190131741A (ko) * 2018-05-17 2019-11-27 현대자동차주식회사 대화 시스템 및 대화 처리 방법
US10890653B2 (en) 2018-08-22 2021-01-12 Google Llc Radar-based gesture enhancement for voice interfaces
US10770035B2 (en) 2018-08-22 2020-09-08 Google Llc Smartphone-based radar system for facilitating awareness of user presence and orientation
US10698603B2 (en) 2018-08-24 2020-06-30 Google Llc Smartphone-based radar system facilitating ease and accuracy of user interactions with displayed objects in an augmented-reality interface
US10788880B2 (en) 2018-10-22 2020-09-29 Google Llc Smartphone-based radar system for determining user intention in a lower-power mode
US10761611B2 (en) 2018-11-13 2020-09-01 Google Llc Radar-image shaper for radar-based applications
US11138272B2 (en) * 2018-11-15 2021-10-05 International Business Machines Corporation Generating and executing an optimal dialogue strategy
US11043214B1 (en) * 2018-11-29 2021-06-22 Amazon Technologies, Inc. Speech recognition using dialog history
CN109933272A (zh) * 2019-01-31 2019-06-25 西南电子技术研究所(中国电子科技集团公司第十研究所) 多模态深度融合机载座舱人机交互方法
US11531736B1 (en) 2019-03-18 2022-12-20 Amazon Technologies, Inc. User authentication as a service
WO2020242493A1 (en) * 2019-05-31 2020-12-03 Google Llc Dynamically assigning multi-modality circumstantial data to assistant action requests for correlating with subsequent requests
US11922305B2 (en) * 2020-06-04 2024-03-05 Salesforce, Inc. Systems and methods for safe policy improvement for task oriented dialogues
US11705108B1 (en) 2021-12-10 2023-07-18 Amazon Technologies, Inc. Visual responses to user inputs

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005013262A1 (en) * 2003-08-01 2005-02-10 Philips Intellectual Property & Standards Gmbh Method for driving a dialog system
US20070226649A1 (en) * 2006-03-23 2007-09-27 Agmon Jonathan Method for predictive typing
US20080235017A1 (en) * 2007-03-22 2008-09-25 Honda Motor Co., Ltd. Voice interaction device, voice interaction method, and voice interaction program
US20110144999A1 (en) * 2009-12-11 2011-06-16 Samsung Electronics Co., Ltd. Dialogue system and dialogue method thereof
RU2011122784A (ru) * 2008-11-07 2012-12-20 Лингупедиа Инвестментс Сарл Способ семантической обработки естественного языка с использованием графического языка-посредника

Family Cites Families (140)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2631864B2 (ja) 1988-06-13 1997-07-16 大成建設株式会社 偏平トンネルの施工方法
US5170499A (en) * 1989-03-06 1992-12-08 Motorola, Inc. Method and apparatus for adjusting the volume level of a radio
DE69126983T2 (de) 1991-08-19 1998-03-05 Lernout & Hauspie Speechprod Einrichtung zur mustererkennung mit einem kuenstlichen neuronalen netzwerk fuer kontextabhaengige modellierung
US5233681A (en) 1992-04-24 1993-08-03 International Business Machines Corporation Context-dependent speech recognizer using estimated next word context
US6405132B1 (en) * 1997-10-22 2002-06-11 Intelligent Technologies International, Inc. Accident avoidance system
JPH10312196A (ja) * 1997-03-12 1998-11-24 Seiko Epson Corp 応答音声の音量適正化方法およびその装置
US6167377A (en) 1997-03-28 2000-12-26 Dragon Systems, Inc. Speech recognition language models
JP3229240B2 (ja) * 1997-06-10 2001-11-19 インターナショナル・ビジネス・マシーンズ・コーポレーション メッセージ処理方法、メッセージ処理装置及びメッセージ処理を制御するプログラムを格納する記憶媒体
KR100241901B1 (ko) 1997-08-28 2000-02-01 윤종용 핸드셋과 핸즈프리킷 공용 음성인식기의 등록 엔트리 관리방법
US6160986A (en) * 1998-04-16 2000-12-12 Creator Ltd Interactive toy
ITTO980383A1 (it) 1998-05-07 1999-11-07 Cselt Centro Studi Lab Telecom Procedimento e dispositivo di riconoscimento vocale con doppio passo di riconoscimento neurale e markoviano.
US20050091057A1 (en) 1999-04-12 2005-04-28 General Magic, Inc. Voice application development methodology
US6647270B1 (en) * 1999-09-10 2003-11-11 Richard B. Himmelstein Vehicletalk
US7392185B2 (en) 1999-11-12 2008-06-24 Phoenix Solutions, Inc. Speech based learning/training system using semantic decoding
US6263308B1 (en) 2000-03-20 2001-07-17 Microsoft Corporation Methods and apparatus for performing speech recognition using acoustic models which are improved through an interactive process
US7788602B2 (en) 2000-06-06 2010-08-31 Microsoft Corporation Method and system for providing restricted actions for recognized semantic categories
CA2414707C (en) 2000-06-29 2011-08-16 Aspen Technology, Inc. Computer method and apparatus for constraining a non-linear approximator of an empirical process
JP2002091477A (ja) 2000-09-14 2002-03-27 Mitsubishi Electric Corp 音声認識システム、音声認識装置、音響モデル管理サーバ、言語モデル管理サーバ、音声認識方法及び音声認識プログラムを記録したコンピュータ読み取り可能な記録媒体
US6807536B2 (en) 2000-11-16 2004-10-19 Microsoft Corporation Methods and systems for computing singular value decompositions of matrices and low rank approximations of matrices
US6622136B2 (en) 2001-02-16 2003-09-16 Motorola, Inc. Interactive tool for semi-automatic creation of a domain model
US6970947B2 (en) * 2001-07-18 2005-11-29 International Business Machines Corporation Method and apparatus for providing a flexible and scalable context service
US20030149566A1 (en) 2002-01-02 2003-08-07 Esther Levin System and method for a spoken language interface to a large database of changing records
JP2003280683A (ja) 2002-03-20 2003-10-02 Toshiba Corp 音声認識装置、音声認識装置における音声認識制御方法、音声処理に関する辞書管理装置
US7006972B2 (en) 2002-03-20 2006-02-28 Microsoft Corporation Generating a task-adapted acoustic model from one or more different corpora
US7191119B2 (en) 2002-05-07 2007-03-13 International Business Machines Corporation Integrated development tool for building a natural language understanding application
US7548847B2 (en) 2002-05-10 2009-06-16 Microsoft Corporation System for automatically annotating training data for a natural language understanding system
US7398209B2 (en) 2002-06-03 2008-07-08 Voicebox Technologies, Inc. Systems and methods for responding to natural language speech utterance
US7756531B2 (en) * 2002-09-04 2010-07-13 Farhad John Aminzadeh Method and apparatus for avoiding call disturbances and facilitating urgent calls based on a caller's decision
US7274741B2 (en) 2002-11-01 2007-09-25 Microsoft Corporation Systems and methods for generating a comprehensive user attention model
JP2004227468A (ja) * 2003-01-27 2004-08-12 Canon Inc 情報提供装置、情報提供方法
US20040176083A1 (en) * 2003-02-25 2004-09-09 Motorola, Inc. Method and system for reducing distractions of mobile device users
US7366655B1 (en) 2003-04-02 2008-04-29 At&T Corp. Method of generating a labeling guide for spoken dialog services
US7835910B1 (en) 2003-05-29 2010-11-16 At&T Intellectual Property Ii, L.P. Exploiting unlabeled utterances for spoken language understanding
CA2473195C (en) 2003-07-29 2014-02-04 Microsoft Corporation Head mounted multi-sensory audio input system
US20050065789A1 (en) 2003-09-23 2005-03-24 Sherif Yacoub System and method with automated speech recognition engines
US7774196B2 (en) 2003-10-01 2010-08-10 Dictaphone Corporation System and method for modifying a language model and post-processor information
JP2005157494A (ja) * 2003-11-20 2005-06-16 Aruze Corp 会話制御装置及び会話制御方法
EP1687807B1 (en) 2003-11-21 2016-03-16 Nuance Communications, Inc. Topic specific models for text formatting and speech recognition
CN100539763C (zh) * 2003-11-27 2009-09-09 国际商业机器公司 控制来自移动车辆的无线通信的方法
KR101022159B1 (ko) * 2004-03-04 2011-03-17 엘지전자 주식회사 차량용 네비게이션 장치 및 그 동작 방법
US8412521B2 (en) 2004-08-20 2013-04-02 Multimodal Technologies, Llc Discriminative training of document transcription system
US7693713B2 (en) 2005-06-17 2010-04-06 Microsoft Corporation Speech models generated using competitive training, asymmetric training, and data boosting
US7640160B2 (en) 2005-08-05 2009-12-29 Voicebox Technologies, Inc. Systems and methods for responding to natural language speech utterance
US7620549B2 (en) * 2005-08-10 2009-11-17 Voicebox Technologies, Inc. System and method of supporting adaptive misrecognition in conversational speech
US7949529B2 (en) * 2005-08-29 2011-05-24 Voicebox Technologies, Inc. Mobile systems and methods of supporting natural language human-machine interactions
US8321220B1 (en) 2005-11-30 2012-11-27 At&T Intellectual Property Ii, L.P. System and method of semi-supervised learning for spoken language understanding using semantic role labeling
US20070128979A1 (en) * 2005-12-07 2007-06-07 J. Shackelford Associates Llc. Interactive Hi-Tech doll
US7835911B2 (en) 2005-12-30 2010-11-16 Nuance Communications, Inc. Method and system for automatically building natural language understanding models
US7603330B2 (en) 2006-02-01 2009-10-13 Honda Motor Co., Ltd. Meta learning for question classification
DE102006006551B4 (de) 2006-02-13 2008-09-11 Siemens Ag Verfahren und System zum Bereitstellen von Sprachdialoganwendungen sowie mobiles Endgerät
JP2007264128A (ja) 2006-03-27 2007-10-11 Toshiba Corp 音声認識装置及びその方法
US7627536B2 (en) 2006-06-13 2009-12-01 Microsoft Corporation Dynamic interaction menus from natural language representations
US7716049B2 (en) 2006-06-30 2010-05-11 Nokia Corporation Method, apparatus and computer program product for providing adaptive language model scaling
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US20080153537A1 (en) * 2006-12-21 2008-06-26 Charbel Khawand Dynamically learning a user's response via user-preferred audio settings in response to different noise environments
WO2008081543A1 (ja) * 2006-12-28 2008-07-10 Fujitsu Limited 携帯端末装置、その通話制御プログラム、その通話制御プログラムを格納した記録媒体、及びその通話制御方法
US7912700B2 (en) 2007-02-08 2011-03-22 Microsoft Corporation Context based word prediction
TW200836893A (en) * 2007-03-01 2008-09-16 Benq Corp Interactive home entertainment robot and method of controlling the same
US8838457B2 (en) 2007-03-07 2014-09-16 Vlingo Corporation Using results of unstructured language model based speech recognition to control a system-level function of a mobile communications facility
US20090030697A1 (en) 2007-03-07 2009-01-29 Cerra Joseph P Using contextual information for delivering results generated from a speech recognition facility using an unstructured language model
US20070150428A1 (en) 2007-03-20 2007-06-28 Brandyn Webb Inference engine for discovering features and making predictions using generalized incremental singular value decomposition
US8275615B2 (en) 2007-07-13 2012-09-25 International Business Machines Corporation Model weighting, selection and hypotheses combination for automatic speech recognition and machine translation
CN101415039A (zh) * 2007-10-17 2009-04-22 宏达国际电子股份有限公司 通话管理方法
US8140335B2 (en) * 2007-12-11 2012-03-20 Voicebox Technologies, Inc. System and method for providing a natural language voice user interface in an integrated voice navigation services environment
US8229729B2 (en) 2008-03-25 2012-07-24 International Business Machines Corporation Machine translation in continuous space
JP2009230068A (ja) 2008-03-25 2009-10-08 Denso Corp 音声認識装置及びナビゲーションシステム
US8332394B2 (en) 2008-05-23 2012-12-11 International Business Machines Corporation System and method for providing question and answers with deferred type evaluation
US8364481B2 (en) 2008-07-02 2013-01-29 Google Inc. Speech recognition with parallel recognition tasks
US8412529B2 (en) 2008-10-29 2013-04-02 Verizon Patent And Licensing Inc. Method and system for enhancing verbal communication sessions
US20100114890A1 (en) 2008-10-31 2010-05-06 Purediscovery Corporation System and Method for Discovering Latent Relationships in Data
JP5475795B2 (ja) 2008-11-05 2014-04-16 グーグル・インコーポレーテッド カスタム言語モデル
EP3258468B1 (en) * 2008-11-10 2019-08-21 Google LLC Multisensory speech detection
US20100128863A1 (en) 2008-11-21 2010-05-27 Robert Bosch Gmbh Context aware voice communication proxy
US8447608B1 (en) 2008-12-10 2013-05-21 Adobe Systems Incorporated Custom language models for audio content
US20100211695A1 (en) 2009-02-16 2010-08-19 Comverse, Ltd. Context-aware communications
US8930179B2 (en) 2009-06-04 2015-01-06 Microsoft Corporation Recognition using re-recognition and statistical classification
US9177557B2 (en) 2009-07-07 2015-11-03 General Motors Llc. Singular value decomposition for improved voice recognition in presence of multi-talker background noise
US8886641B2 (en) 2009-10-15 2014-11-11 Yahoo! Inc. Incorporating recency in network search using machine learning
US8571866B2 (en) 2009-10-23 2013-10-29 At&T Intellectual Property I, L.P. System and method for improving speech recognition accuracy using textual context
US8249627B2 (en) * 2009-12-21 2012-08-21 Julia Olincy “I am driving/busy” automatic response system for mobile phones
US8315597B2 (en) * 2009-12-21 2012-11-20 Julia Olincy “I am driving/busy” automatic response system for mobile phones
EP2339576B1 (en) 2009-12-23 2019-08-07 Google LLC Multi-modal input on an electronic device
US8400332B2 (en) 2010-02-09 2013-03-19 Ford Global Technologies, Llc Emotive advisory system including time agent
JP2012038239A (ja) 2010-08-11 2012-02-23 Sony Corp 情報処理装置、情報処理方法、及び、プログラム
US8972253B2 (en) 2010-09-15 2015-03-03 Microsoft Technology Licensing, Llc Deep belief network for large vocabulary continuous speech recognition
FR2965377A1 (fr) 2010-09-24 2012-03-30 Univ D Avignon Et Des Pays De Vaucluse Procede de classification de donnees biometriques
JP2012075047A (ja) * 2010-09-29 2012-04-12 Toshiba Corp Ip交換システム及びip交換装置
US8812321B2 (en) 2010-09-30 2014-08-19 At&T Intellectual Property I, L.P. System and method for combining speech recognition outputs from a plurality of domain-specific speech recognizers via machine learning
US20120084248A1 (en) * 2010-09-30 2012-04-05 Microsoft Corporation Providing suggestions based on user intent
JP5704692B2 (ja) 2010-11-30 2015-04-22 独立行政法人情報通信研究機構 パターン分類装置の学習装置及びそのためのコンピュータプログラム
US8352245B1 (en) 2010-12-30 2013-01-08 Google Inc. Adjusting language models
JP5861649B2 (ja) 2011-02-03 2016-02-16 日本電気株式会社 モデル適応化装置、モデル適応化方法およびモデル適応化用プログラム
US9081760B2 (en) 2011-03-08 2015-07-14 At&T Intellectual Property I, L.P. System and method for building diverse language models
US9679561B2 (en) 2011-03-28 2017-06-13 Nuance Communications, Inc. System and method for rapid customization of speech recognition models
US10642934B2 (en) 2011-03-31 2020-05-05 Microsoft Technology Licensing, Llc Augmented conversational understanding architecture
US8489529B2 (en) 2011-03-31 2013-07-16 Microsoft Corporation Deep convex network with joint use of nonlinear random projection, Restricted Boltzmann Machine and batch-based parallelizable optimization
US20120253789A1 (en) * 2011-03-31 2012-10-04 Microsoft Corporation Conversational Dialog Learning and Correction
WO2012135210A2 (en) * 2011-03-31 2012-10-04 Microsoft Corporation Location-based conversational understanding
US9244984B2 (en) * 2011-03-31 2016-01-26 Microsoft Technology Licensing, Llc Location based conversational understanding
US8260615B1 (en) 2011-04-25 2012-09-04 Google Inc. Cross-lingual initialization of language models
US20120290293A1 (en) 2011-05-13 2012-11-15 Microsoft Corporation Exploiting Query Click Logs for Domain Detection in Spoken Language Understanding
US8918352B2 (en) 2011-05-23 2014-12-23 Microsoft Corporation Learning processes for single hidden layer neural networks with linear output units
KR101270074B1 (ko) * 2011-05-31 2013-05-31 삼성에스디에스 주식회사 소리 기반 공간지도를 이용한 상황인식 장치 및 방법
US20130031476A1 (en) 2011-07-25 2013-01-31 Coin Emmett Voice activated virtual assistant
KR20130022513A (ko) 2011-08-24 2013-03-07 한국전자통신연구원 결합 쌍일차 변환 공간 기반의 화자 적응 방법 및 장치
EP3392876A1 (en) 2011-09-30 2018-10-24 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
GB201117052D0 (en) * 2011-10-04 2011-11-16 Daybees Ltd Automated diary population
US8698621B2 (en) * 2011-11-22 2014-04-15 Verizon Patent And Licensing Inc. Method and system for providing notifications of a mobile device in motion to determine call treatment
US9235799B2 (en) 2011-11-26 2016-01-12 Microsoft Technology Licensing, Llc Discriminative pretraining of deep neural networks
US9082402B2 (en) 2011-12-08 2015-07-14 Sri International Generic virtual personal assistant platform
KR101590332B1 (ko) * 2012-01-09 2016-02-18 삼성전자주식회사 영상장치 및 그 제어방법
US9324323B1 (en) 2012-01-13 2016-04-26 Google Inc. Speech recognition using topic-specific language models
US9263040B2 (en) * 2012-01-17 2016-02-16 GM Global Technology Operations LLC Method and system for using sound related vehicle information to enhance speech recognition
JP2012128440A (ja) * 2012-02-06 2012-07-05 Denso Corp 音声対話装置
CN102609264A (zh) 2012-02-14 2012-07-25 深圳市同洲视讯传媒有限公司 一种调用应用程序编程接口生成调用代码的方法及装置
US9524730B2 (en) 2012-03-30 2016-12-20 Ohio State Innovation Foundation Monaural speech filter
US8346563B1 (en) 2012-04-10 2013-01-01 Artificial Solutions Ltd. System and methods for delivering advanced natural language interaction applications
GB201208373D0 (en) 2012-05-14 2012-06-27 Touchtype Ltd Mechanism for synchronising devices,system and method
US8600525B1 (en) 2012-05-31 2013-12-03 Honeywell Asca Inc. Efficient quadratic programming (QP) solver for process control and optimization
US9053708B2 (en) 2012-07-18 2015-06-09 International Business Machines Corporation System, method and program product for providing automatic speech recognition (ASR) in a shared resource environment
US9424840B1 (en) 2012-08-31 2016-08-23 Amazon Technologies, Inc. Speech recognition platforms
US8527276B1 (en) 2012-10-25 2013-09-03 Google Inc. Speech synthesis using deep neural networks
US10282419B2 (en) 2012-12-12 2019-05-07 Nuance Communications, Inc. Multi-domain natural language processing architecture
KR101559124B1 (ko) 2013-02-28 2015-10-12 한양대학교 산학협력단 리튬황전지용 양극, 이를 포함하는 리튬황전지 및 이의 제조 방법
US9177550B2 (en) 2013-03-06 2015-11-03 Microsoft Technology Licensing, Llc Conservatively adapting a deep neural network in a recognition system
US9728184B2 (en) 2013-06-18 2017-08-08 Microsoft Technology Licensing, Llc Restructuring deep neural network acoustic models
US9311298B2 (en) 2013-06-21 2016-04-12 Microsoft Technology Licensing, Llc Building conversational understanding systems using a toolset
US9589565B2 (en) 2013-06-21 2017-03-07 Microsoft Technology Licensing, Llc Environmentally aware dialog policies and response generation
CN103400577B (zh) 2013-08-01 2015-09-16 百度在线网络技术(北京)有限公司 多语种语音识别的声学模型建立方法和装置
CN103456299B (zh) 2013-08-01 2016-06-15 百度在线网络技术(北京)有限公司 一种控制语音识别的方法和装置
US9280968B2 (en) 2013-10-04 2016-03-08 At&T Intellectual Property I, L.P. System and method of using neural transforms of robust audio features for speech processing
US9721561B2 (en) 2013-12-05 2017-08-01 Nuance Communications, Inc. Method and apparatus for speech recognition using neural networks with speaker adaptation
US9373324B2 (en) 2013-12-06 2016-06-21 International Business Machines Corporation Applying speaker adaption techniques to correlated features
US9400955B2 (en) 2013-12-13 2016-07-26 Amazon Technologies, Inc. Reducing dynamic range of low-rank decomposition matrices
KR101937655B1 (ko) 2013-12-31 2019-01-11 코오롱인더스트리 주식회사 복합 중공사막 및 그 제조방법
US10339920B2 (en) 2014-03-04 2019-07-02 Amazon Technologies, Inc. Predicting pronunciation in speech recognition
US9324321B2 (en) 2014-03-07 2016-04-26 Microsoft Technology Licensing, Llc Low-footprint adaptation and personalization for a deep neural network
US9529794B2 (en) 2014-03-27 2016-12-27 Microsoft Technology Licensing, Llc Flexible schema for language model customization
US9520127B2 (en) 2014-04-29 2016-12-13 Microsoft Technology Licensing, Llc Shared hidden layer combination for speech recognition systems
US20150325236A1 (en) 2014-05-08 2015-11-12 Microsoft Corporation Context specific language model scale factors

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005013262A1 (en) * 2003-08-01 2005-02-10 Philips Intellectual Property & Standards Gmbh Method for driving a dialog system
US20070226649A1 (en) * 2006-03-23 2007-09-27 Agmon Jonathan Method for predictive typing
US20080235017A1 (en) * 2007-03-22 2008-09-25 Honda Motor Co., Ltd. Voice interaction device, voice interaction method, and voice interaction program
RU2011122784A (ru) * 2008-11-07 2012-12-20 Лингупедиа Инвестментс Сарл Способ семантической обработки естественного языка с использованием графического языка-посредника
US20110144999A1 (en) * 2009-12-11 2011-06-16 Samsung Electronics Co., Ltd. Dialogue system and dialogue method thereof

Also Published As

Publication number Publication date
US10304448B2 (en) 2019-05-28
CA2913735A1 (en) 2014-12-24
KR20160021850A (ko) 2016-02-26
CN105378708A (zh) 2016-03-02
CN111368155B (zh) 2024-03-08
US20140379353A1 (en) 2014-12-25
BR112015031231B1 (pt) 2022-04-26
BR112015031231A8 (pt) 2020-03-24
US9589565B2 (en) 2017-03-07
BR112015031231A2 (pt) 2017-07-25
AU2014281049B2 (en) 2019-05-02
AU2019208255A1 (en) 2019-08-15
EP3011471A1 (en) 2016-04-27
CN111368155A (zh) 2020-07-03
MX2015017624A (es) 2016-04-15
WO2014204655A1 (en) 2014-12-24
RU2015154501A3 (ru) 2018-05-04
MX352774B (es) 2017-12-07
RU2015154501A (ru) 2017-06-20
CA2913735C (en) 2022-04-12
AU2014281049B9 (en) 2019-05-23
JP2016524190A (ja) 2016-08-12
KR102231733B1 (ko) 2021-03-23
US20170162201A1 (en) 2017-06-08
CN105378708B (zh) 2020-03-27
AU2014281049A1 (en) 2015-12-10
AU2019208255B2 (en) 2020-11-12
JP6492069B2 (ja) 2019-03-27

Similar Documents

Publication Publication Date Title
RU2667717C2 (ru) Диалоговые политики на основе параметров окружающей среды и генерация ответа
US20220116438A1 (en) Network system for content playback on multiple devices
RU2689203C2 (ru) Гибкая схема для настройки языковой модели
JP6335139B2 (ja) 手動始点/終点指定及びトリガフレーズの必要性の低減
US20140201629A1 (en) Collaborative learning through user generated knowledge
US9830039B2 (en) Using human wizards in a conversational understanding system
CN105378624A (zh) 在交互出现于白板上时显示交互
EP3504702A1 (en) Systems and methods for artifical intelligence voice evolution
CN112219386A (zh) 语音响应系统的图形用户界面
CN110472021A (zh) 会话中推荐新闻的技术
US20140207448A1 (en) Adaptive online feature normalization for speech recognition