RU2012150996A - Способ коммуникации пользователя с информационной диалоговой системой - Google Patents

Способ коммуникации пользователя с информационной диалоговой системой Download PDF

Info

Publication number
RU2012150996A
RU2012150996A RU2012150996/08A RU2012150996A RU2012150996A RU 2012150996 A RU2012150996 A RU 2012150996A RU 2012150996/08 A RU2012150996/08 A RU 2012150996/08A RU 2012150996 A RU2012150996 A RU 2012150996A RU 2012150996 A RU2012150996 A RU 2012150996A
Authority
RU
Russia
Prior art keywords
request
user
user input
response
text
Prior art date
Application number
RU2012150996/08A
Other languages
English (en)
Other versions
RU2530267C2 (ru
Inventor
Илья Геннадьевич Гельфенбейн
Ольга Александровна Гельфенбейн
Артем Владимирович Гончарук
Илья Андреевич Платонов
Павел Александрович Сиротин
Original Assignee
Общество с ограниченной ответственностью "Спиктуит"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Общество с ограниченной ответственностью "Спиктуит" filed Critical Общество с ограниченной ответственностью "Спиктуит"
Priority to RU2012150996/08A priority Critical patent/RU2530267C2/ru
Priority to PCT/IB2012/056955 priority patent/WO2014083389A1/ru
Publication of RU2012150996A publication Critical patent/RU2012150996A/ru
Application granted granted Critical
Publication of RU2530267C2 publication Critical patent/RU2530267C2/ru
Priority to US14/721,012 priority patent/US9564149B2/en
Priority to US15/395,476 priority patent/US10102854B2/en
Priority to US15/720,854 priority patent/USRE47974E1/en
Priority to US16/137,069 priority patent/US10748537B2/en
Priority to US16/990,525 priority patent/US11355117B2/en
Priority to US17/747,707 priority patent/US20220277745A1/en

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/63Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1807Speech classification or search using natural language modelling using prosody or stress
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/06Transformation of speech into a non-audible representation, e.g. speech visualisation or speech processing for tactile aids
    • G10L21/18Details of the transformation process
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/227Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of the speaker; Human-factor methodology

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Theoretical Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Quality & Reliability (AREA)
  • Psychiatry (AREA)
  • Hospice & Palliative Care (AREA)
  • Child & Adolescent Psychology (AREA)
  • Telephonic Communication Services (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

1. Способ коммуникации пользователя с информационной диалоговой системой, включающийактивацию пользователем подсистемы пользовательского ввода,ввод пользователем запроса,прием и преобразование запроса пользователя в текст подсистемой пользовательского ввода,передачу текста, полученного в результате преобразования запроса, диалоговому модулю,обработку диалоговым модулем полученного текста,формирование диалоговым модулем ответа на запрос,передачу ответа пользователю,отображение и/или воспроизведение сформированного ответа,отличающийся тем, что после отображения и/или воспроизведения сформированного ответа выполняют автоматическую активацию подсистемы пользовательского ввода, после чего пользователь выполняет ввод нового или уточняющего запроса.2. Способ по п.1, отличающийся тем, что автоматическую активацию подсистемы пользовательского ввода факультативно выполняют по истечении заранее заданного диалоговым модулем интервала времени после отображения и/или воспроизведения сформированного ответа.3. Способ по п.1, отличающийся тем, что ввод пользователем запроса выполняют посредством голосовой команды и/или с использованием клавиатуры.4. Способ по п.1, отличающийся тем, что формирование диалоговым модулем ответа выполняют в виде текста.5. Способ по п.1, отличающийся тем, что воспроизведение сформированного ответа дополнительно выполняют посредством подсистемы генерации и воспроизведения голоса.6. Способ по п.1, отличающийся тем, что отображение и/или воспроизведение сформированного ответа выполняют посредством голосовой реплики и/или отображения текста на дисплее.7. Способ по п.1, отличающийся

Claims (9)

1. Способ коммуникации пользователя с информационной диалоговой системой, включающий
активацию пользователем подсистемы пользовательского ввода,
ввод пользователем запроса,
прием и преобразование запроса пользователя в текст подсистемой пользовательского ввода,
передачу текста, полученного в результате преобразования запроса, диалоговому модулю,
обработку диалоговым модулем полученного текста,
формирование диалоговым модулем ответа на запрос,
передачу ответа пользователю,
отображение и/или воспроизведение сформированного ответа,
отличающийся тем, что после отображения и/или воспроизведения сформированного ответа выполняют автоматическую активацию подсистемы пользовательского ввода, после чего пользователь выполняет ввод нового или уточняющего запроса.
2. Способ по п.1, отличающийся тем, что автоматическую активацию подсистемы пользовательского ввода факультативно выполняют по истечении заранее заданного диалоговым модулем интервала времени после отображения и/или воспроизведения сформированного ответа.
3. Способ по п.1, отличающийся тем, что ввод пользователем запроса выполняют посредством голосовой команды и/или с использованием клавиатуры.
4. Способ по п.1, отличающийся тем, что формирование диалоговым модулем ответа выполняют в виде текста.
5. Способ по п.1, отличающийся тем, что воспроизведение сформированного ответа дополнительно выполняют посредством подсистемы генерации и воспроизведения голоса.
6. Способ по п.1, отличающийся тем, что отображение и/или воспроизведение сформированного ответа выполняют посредством голосовой реплики и/или отображения текста на дисплее.
7. Способ по п.1, отличающийся тем, что обработку диалоговым модулем полученного текста выполняют с использованием дополнительных систем и/или подсистем.
8. Способ по п.1, отличающийся тем, что в формируемый диалоговым модулем ответ на запрос включают дополнительные метаданные.
9. Способ по п.8, отличающийся тем, что в дополнительные метаданные, включают инструкции, направляемые дополнительным системам и/или подсистемам.
RU2012150996/08A 2012-11-28 2012-11-28 Способ коммуникации пользователя с информационной диалоговой системой RU2530267C2 (ru)

Priority Applications (8)

Application Number Priority Date Filing Date Title
RU2012150996/08A RU2530267C2 (ru) 2012-11-28 2012-11-28 Способ коммуникации пользователя с информационной диалоговой системой
PCT/IB2012/056955 WO2014083389A1 (ru) 2012-11-28 2012-12-04 Способ коммуникации пользователя с информационной диалоговой системой
US14/721,012 US9564149B2 (en) 2012-11-28 2015-05-26 Method for user communication with information dialogue system
US15/395,476 US10102854B2 (en) 2012-11-28 2016-12-30 Dialog system with automatic reactivation of speech acquiring mode
US15/720,854 USRE47974E1 (en) 2012-11-28 2017-09-29 Dialog system with automatic reactivation of speech acquiring mode
US16/137,069 US10748537B2 (en) 2012-11-28 2018-09-20 Dialog system with automatic reactivation of speech acquiring mode
US16/990,525 US11355117B2 (en) 2012-11-28 2020-08-11 Dialog system with automatic reactivation of speech acquiring mode
US17/747,707 US20220277745A1 (en) 2012-11-28 2022-05-18 Dialog system with automatic reactivation of speech acquiring mode

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2012150996/08A RU2530267C2 (ru) 2012-11-28 2012-11-28 Способ коммуникации пользователя с информационной диалоговой системой

Publications (2)

Publication Number Publication Date
RU2012150996A true RU2012150996A (ru) 2014-06-27
RU2530267C2 RU2530267C2 (ru) 2014-10-10

Family

ID=50827238

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2012150996/08A RU2530267C2 (ru) 2012-11-28 2012-11-28 Способ коммуникации пользователя с информационной диалоговой системой

Country Status (3)

Country Link
US (1) US9564149B2 (ru)
RU (1) RU2530267C2 (ru)
WO (1) WO2014083389A1 (ru)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10235130B2 (en) 2014-11-06 2019-03-19 Microsoft Technology Licensing, Llc Intent driven command processing
US9922098B2 (en) 2014-11-06 2018-03-20 Microsoft Technology Licensing, Llc Context-based search and relevancy generation
US9646611B2 (en) 2014-11-06 2017-05-09 Microsoft Technology Licensing, Llc Context-based actions
US9786299B2 (en) * 2014-12-04 2017-10-10 Microsoft Technology Licensing, Llc Emotion type classification for interactive dialog system
US11100944B2 (en) * 2016-04-12 2021-08-24 Sony Corporation Information processing apparatus, information processing method, and program
DE102016115243A1 (de) * 2016-04-28 2017-11-02 Masoud Amri Programmieren in natürlicher Sprache
US10839017B2 (en) 2017-04-06 2020-11-17 AIBrain Corporation Adaptive, interactive, and cognitive reasoner of an autonomous robotic system utilizing an advanced memory graph structure
US11151992B2 (en) 2017-04-06 2021-10-19 AIBrain Corporation Context aware interactive robot
US10810371B2 (en) 2017-04-06 2020-10-20 AIBrain Corporation Adaptive, interactive, and cognitive reasoner of an autonomous robotic system
US10929759B2 (en) 2017-04-06 2021-02-23 AIBrain Corporation Intelligent robot software platform
US10963493B1 (en) 2017-04-06 2021-03-30 AIBrain Corporation Interactive game with robot system
CN110019848A (zh) * 2017-12-22 2019-07-16 深圳市优必选科技有限公司 对话交互方法、装置及机器人
CN109086368A (zh) * 2018-07-20 2018-12-25 吴怡 一种基于人工智能云平台的法律咨询机器人
US11715467B2 (en) 2019-04-17 2023-08-01 Tempus Labs, Inc. Collaborative artificial intelligence method and system
RU2737598C1 (ru) * 2020-02-04 2020-12-01 Павел Андреевич Морозов Способ формирования оперативной информации на основе формализованной концептуальной модели предметной области
CN112507103A (zh) * 2020-12-18 2021-03-16 北京百度网讯科技有限公司 任务型对话及模型训练方法、装置、设备和存储介质

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0028810D0 (en) * 2000-11-25 2001-01-10 Hewlett Packard Co Voice communication concerning a local entity
US8301436B2 (en) * 2003-05-29 2012-10-30 Microsoft Corporation Semantic object synchronous understanding for highly interactive interface
US8055713B2 (en) * 2003-11-17 2011-11-08 Hewlett-Packard Development Company, L.P. Email application with user voice interface
ATE415684T1 (de) * 2004-01-29 2008-12-15 Harman Becker Automotive Sys Verfahren und system zur sprachdialogschnittstelle
TWI277948B (en) * 2005-09-02 2007-04-01 Delta Electronics Inc Method and system for template inquiry dialogue system
JP5025353B2 (ja) * 2007-07-03 2012-09-12 ニュアンス コミュニケーションズ,インコーポレイテッド 対話処理装置、対話処理方法及びコンピュータ・プログラム
US8370160B2 (en) * 2007-12-31 2013-02-05 Motorola Mobility Llc Methods and apparatus for implementing distributed multi-modal applications
US20120121077A1 (en) * 2009-07-05 2012-05-17 Delegate Communications Ltd. System and method for brokering communication dependent tasks
KR101649911B1 (ko) * 2010-01-04 2016-08-22 삼성전자 주식회사 확장 도메인을 이용한 대화 시스템 및 그 자연어 인식 방법
JP6078964B2 (ja) * 2012-03-26 2017-02-15 富士通株式会社 音声対話システム及びプログラム

Also Published As

Publication number Publication date
RU2530267C2 (ru) 2014-10-10
US9564149B2 (en) 2017-02-07
US20150255089A1 (en) 2015-09-10
WO2014083389A1 (ru) 2014-06-05

Similar Documents

Publication Publication Date Title
RU2012150996A (ru) Способ коммуникации пользователя с информационной диалоговой системой
RU2012150997A (ru) Способ обучения информационной диалоговой системы пользователем
EP4239628A3 (en) Determining hotword suitability
RU2016146267A (ru) Перевод внутри вызова
SG10201707702YA (en) Collaborative Voice Controlled Devices
EP3923277A3 (en) Delayed responses by computational assistant
RU2017107170A (ru) Задействование персонального цифрового помощника посредством находящегося поблизости устройства
WO2014105359A3 (en) Voice inspection guidance
EP3425634A3 (en) Noise compensation using geotagged audio signals
EP4047497A3 (en) Speaker verification using co-location information
WO2014043027A3 (en) Improving phonetic pronunciation
WO2012018802A3 (en) Translating languages
MY192807A (en) A method, device and system for message response
MX346294B (es) Método y sistema para el reconocimiento de comandos de voz.
WO2013059766A3 (en) Systems, methods, and interfaces for display of inline content and block level content on an access device
GB201205790D0 (en) Transcription of speech
RU2015121375A (ru) Устройство обработки информации и устройство ввода
PL401347A1 (pl) Spójny interfejs do lokalnej i oddalonej syntezy mowy
WO2012159095A3 (en) Background audio listening for content recognition
WO2010131920A3 (ko) 위치기반 데이터 서비스 장치 및 방법
MY178033A (en) Method, device and computer storage medium for adding information of friends
NZ730641A (en) Method and system for selectively biased linear discriminant analysis in automatic speech recognition systems
RU2015110156A (ru) Терминал и способ чтения на основе терминала
RU2016114565A (ru) Устройство обработки информации, способ и программа
WO2014052326A3 (en) Apparatus and methods for managing resources for a system using voice recognition

Legal Events

Date Code Title Description
PD4A Correction of name of patent owner
PC41 Official registration of the transfer of exclusive right

Effective date: 20170417

MM4A The patent is invalid due to non-payment of fees

Effective date: 20191129