RU2011136720A - Системы и способы организации интерактивного доступа к сервисам внешнего размещения с использованием голосовой связи - Google Patents

Системы и способы организации интерактивного доступа к сервисам внешнего размещения с использованием голосовой связи Download PDF

Info

Publication number
RU2011136720A
RU2011136720A RU2011136720/08A RU2011136720A RU2011136720A RU 2011136720 A RU2011136720 A RU 2011136720A RU 2011136720/08 A RU2011136720/08 A RU 2011136720/08A RU 2011136720 A RU2011136720 A RU 2011136720A RU 2011136720 A RU2011136720 A RU 2011136720A
Authority
RU
Russia
Prior art keywords
speech
concepts
fragment
voice
service
Prior art date
Application number
RU2011136720/08A
Other languages
English (en)
Inventor
Эугениуш ВЛАСЮК
Original Assignee
Софтхус Сп.З.О.О.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Софтхус Сп.З.О.О. filed Critical Софтхус Сп.З.О.О.
Publication of RU2011136720A publication Critical patent/RU2011136720A/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/39Electronic components, circuits, software, systems or apparatus used in telephone systems using speech synthesis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)

Abstract

1. Способ предоставления сервиса пользователю в системе, содержащей модуль голосового распознавания, сеансовый администратор и модуль голосового генератора, причем способ содержит этапы, на которых:принимают фрагмент речи через модуль голосового распознавания;преобразуют фрагмент речи в одну или более структур, используя словарь, связанный с онтологией;идентифицируют понятия во фрагменте речи, используя структуры;выбирают сервис на основе понятий при условии, что фрагмент речи включает в себя достаточную информацию;генерируют текстовое сообщение на основе выбранного сервиса; ипреобразуют текстовое сообщение в голосовое сообщение, используя голосовой генератор.2. Способ по п.1, дополнительно содержащий этап, на котором преобразуют фрагмент речи в текст и затем преобразуют текст в одну или более структур.3. Способ по п.1, дополнительно содержащий этапы, на которых, когда фрагмент речи не включает в себя достаточную информацию, генерируют текстовое сообщение, предназначенное для вызова дополнительной информации, преобразуют текстовое сообщение в голосовое сообщение, используя голосовой генератор, и передают голосовое сообщение пользователю.4. Способ по п.1, дополнительно содержащий этап, на котором передают голосовое сообщение пользователю.5. Способ по п.1, дополнительно содержащий этапы, на которых:принимают дополнительные фрагменты речи через модуль голосового распознавания в ответ на голосовое сообщение, переданное пользователю;преобразуют фрагмент речи в одну или более структур, используя словарь, связанный с онтологией;идентифицируют понятия во фрагментах речи, используя структуры;получают инфор

Claims (21)

1. Способ предоставления сервиса пользователю в системе, содержащей модуль голосового распознавания, сеансовый администратор и модуль голосового генератора, причем способ содержит этапы, на которых:
принимают фрагмент речи через модуль голосового распознавания;
преобразуют фрагмент речи в одну или более структур, используя словарь, связанный с онтологией;
идентифицируют понятия во фрагменте речи, используя структуры;
выбирают сервис на основе понятий при условии, что фрагмент речи включает в себя достаточную информацию;
генерируют текстовое сообщение на основе выбранного сервиса; и
преобразуют текстовое сообщение в голосовое сообщение, используя голосовой генератор.
2. Способ по п.1, дополнительно содержащий этап, на котором преобразуют фрагмент речи в текст и затем преобразуют текст в одну или более структур.
3. Способ по п.1, дополнительно содержащий этапы, на которых, когда фрагмент речи не включает в себя достаточную информацию, генерируют текстовое сообщение, предназначенное для вызова дополнительной информации, преобразуют текстовое сообщение в голосовое сообщение, используя голосовой генератор, и передают голосовое сообщение пользователю.
4. Способ по п.1, дополнительно содержащий этап, на котором передают голосовое сообщение пользователю.
5. Способ по п.1, дополнительно содержащий этапы, на которых:
принимают дополнительные фрагменты речи через модуль голосового распознавания в ответ на голосовое сообщение, переданное пользователю;
преобразуют фрагмент речи в одну или более структур, используя словарь, связанный с онтологией;
идентифицируют понятия во фрагментах речи, используя структуры;
получают информацию для предоставления пользователю на основании идентифицированных понятий;
генерируют другое текстовое сообщение на основании, по меньшей мере, одного из полученной информации или идентифицированных понятий;
преобразуют текстовое сообщение в голосовое сообщение, используя голосовой генератор; и
передают текстовое сообщение пользователю.
6. Способ по п.1, в котором преобразование фрагмента речи в одну или более структур, используя словарь, связанный с онтологией, содержит ассоциирование фрагмента речи с одним или более блоками, связанными с множеством понятий, которые в свою очередь ассоциированы с множеством сервисов.
7. Способ по п.6, в котором идентифицирование понятий во фрагменте речи, используя структуры, содержит определение того, какие понятия связаны с блоками.
8. Способ по п.7, в котором выбор сервиса на основе понятий содержит определение того, какой сервис наиболее тесно связан с фрагментом речи, на основе ряда ассоциированных понятий, которые связаны с фрагментом речи через блоки для каждого из множества сервисов.
9. Способ по п.1, дополнительно содержащий этап, на котором идентифицируют особые понятия, ассоциированные с выбранным сервисом, и присваивают значение идентифицированным особым понятиям на основе информации, содержащейся во фрагменте речи.
10. Способ по п.9, дополнительно содержащий этапы, на которых определяют, все ли особые понятия, ассоциированные с выбранным сервисом, присутствуют во фрагменте речи, и если нет, то генерируют текстовое сообщение, предназначенное для вызова информации, касающейся некоторых отсутствующих особых понятий, и преобразуют текстовое сообщение в голосовое сообщение, используя голосовой генератор.
11. Способ по п.10, дополнительно содержащий этап, на котором выполняют или завершают сервис, когда все особые понятия присутствуют и им назначено значение.
12. Способ по п.11, в котором выполнение сервиса содержит сохранение информации, содержащейся во фрагменте речи и ассоциированной с особыми понятиями.
13. Система для предоставления сервиса пользователю, содержащая:
модуль голосового распознавания, сконфигурированный с возможностью приема фрагмента речи и преобразования этого фрагмента речи в текст; одной или более структур, использующих словарь, связанный с онтологией;
сеансовый администратор, сконфигурированный с возможностью соединения с модулем голосового распознавания и сконфигурированный с возможностью:
генерирования структуры, ассоциированной с текстом, с использованием словаря, связанного с онтологией;
идентификации понятий во фрагменте речи с использованием структуры;
выбора сервиса на основании понятий при условии, если фрагмент речи включает в себя достаточную информацию; и
генерирования текстового сообщения ответа на основании выбранного сервиса; и
модуль голосового генератора, соединенный с сеансовым администратором и сконфигурированный с возможностью преобразования текстового сообщения ответа в голосовое сообщение.
14. Система по п.13, в которой сеансовый администратор дополнительно сконфигурирован с возможностью генерирования текстового сообщения, предназначенного для вызова дополнительной информации, когда фрагмент речи не включает в себя достаточную информацию, и в которой модуль голосового генератора дополнительно сконфигурирован с возможностью преобразования текстового сообщения в голосовое сообщение и передачи этого голосового сообщения пользователю.
15. Система по п.13, в которой сеансовый администратор дополнительно сконфигурирован с возможностью генерирования структуры, ассоциированной с текстом, посредством ассоциирования фрагмента речи с одним или более блоками, связанными с множеством понятий, которые, в свою очередь, ассоциированы с множеством сервисов.
16. Система по п.15, в которой сеансовый администратор дополнительно сконфигурирован с возможностью идентификации понятий во фрагменте речи с использованием структур посредством определения понятий, которые связаны с блоками.
17. Система по п.16, в которой сеансовый администратор дополнительно сконфигурирован с возможностью выбора сервиса на основании понятий посредством определения того, какой сервис наиболее тесно связан с фрагментом речи, на основании ряда ассоциированных понятий, которые связаны с фрагментом речи через блоки для каждого из множества сервисов.
18. Система по п.13, в которой сеансовый администратор дополнительно сконфигурирован с возможностью идентификации особых понятий, ассоциированных с выбранным сервисом, и назначения значения идентифицированным особым понятиями на основании информации, содержащейся во фрагменте речи.
19. Система по п.18, в которой сеансовый администратор дополнительно сконфигурирован с возможностью определения, все ли особые понятия, ассоциированные с выбранным сервисом, присутствуют во фрагменте речи, и если нет, то генерирования текстового сообщения, предназначенного для вызова информации, касающейся каких-либо отсутствующих особых понятий, и в которой модуль голосового генератора дополнительно сконфигурирован с возможностью преобразования текстового сообщения в голосовое сообщение с использованием голосового генератора.
20. Система по п.19, в которой сеансовый администратор дополнительно сконфигурирован с возможностью выполнения или завершения сервиса, когда все заданные понятия присутствуют и им назначено значение.
21. Система по п.20, в которой сеансовый администратор дополнительно сконфигурирован с возможностью выполнения сервиса посредством сохранения информации, содержащейся во фрагменте речи и ассоциированной с особыми понятиями.
RU2011136720/08A 2009-02-03 2010-01-19 Системы и способы организации интерактивного доступа к сервисам внешнего размещения с использованием голосовой связи RU2011136720A (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12/364,927 2009-02-03
US12/364,927 US8417523B2 (en) 2009-02-03 2009-02-03 Systems and methods for interactively accessing hosted services using voice communications
PCT/IB2010/000186 WO2010089645A1 (en) 2009-02-03 2010-01-19 Systems and methods for interactively accessing hosted services using voice communications

Publications (1)

Publication Number Publication Date
RU2011136720A true RU2011136720A (ru) 2013-03-10

Family

ID=42244676

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2011136720/08A RU2011136720A (ru) 2009-02-03 2010-01-19 Системы и способы организации интерактивного доступа к сервисам внешнего размещения с использованием голосовой связи

Country Status (10)

Country Link
US (3) US8417523B2 (ru)
EP (1) EP2394267A1 (ru)
JP (1) JP2012517174A (ru)
KR (1) KR20110127180A (ru)
CN (1) CN102369568A (ru)
IL (1) IL214424A0 (ru)
RU (1) RU2011136720A (ru)
SG (1) SG173511A1 (ru)
TW (1) TW201034004A (ru)
WO (1) WO2010089645A1 (ru)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007132467A1 (en) * 2006-05-15 2007-11-22 E-Glue Software Technologies Ltd. Call center analytical system having real time capabilities
US9021565B2 (en) 2011-10-13 2015-04-28 At&T Intellectual Property I, L.P. Authentication techniques utilizing a computing device
US20130130648A1 (en) * 2011-11-22 2013-05-23 Kamran J. Tadjeran Providing support to a user
US9858039B2 (en) * 2014-01-28 2018-01-02 Oracle International Corporation Voice recognition of commands extracted from user interface screen devices
CN104836925A (zh) * 2014-02-11 2015-08-12 携程计算机技术(上海)有限公司 咨询系统及方法
US10514677B2 (en) * 2014-04-11 2019-12-24 Honeywell International Inc. Frameworks and methodologies configured to assist configuring devices supported by a building management system
DE102014213350A1 (de) 2014-07-09 2016-01-14 Volkswagen Aktiengesellschaft Verfahren und Vorrichtung zur Ermittlung von Informationen über Mobilitäts-situationen
CN105338204A (zh) * 2014-08-15 2016-02-17 中兴通讯股份有限公司 一种交互式语音应答方法及装置
CN105827877A (zh) * 2015-01-06 2016-08-03 中国移动通信集团上海有限公司 一种基于ivr平台的业务处理方法及ivr平台
JP6849964B2 (ja) * 2016-09-05 2021-03-31 株式会社Nextremer 対話制御装置、対話エンジン、管理端末、対話装置、対話制御方法、対話方法、およびプログラム
CN108182943B (zh) * 2017-12-29 2021-03-26 北京奇艺世纪科技有限公司 一种智能设备控制方法、装置及智能设备
WO2019193378A1 (en) * 2018-04-06 2019-10-10 Flex Ltd. Device and system for accessing multiple virtual assistant services
CN110459211B (zh) 2018-05-07 2023-06-23 阿里巴巴集团控股有限公司 人机对话方法、客户端、电子设备及存储介质
CN109327629A (zh) * 2018-11-01 2019-02-12 深圳市号互联科技有限公司 一种人工智能语音导航数据处理方法
CN112399019A (zh) * 2020-09-16 2021-02-23 中国农业银行股份有限公司河北省分行 智能外呼方法、终端设备及可读存储介质

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7006881B1 (en) * 1991-12-23 2006-02-28 Steven Hoffberg Media recording device with remote graphic user interface
US20020035474A1 (en) * 2000-07-18 2002-03-21 Ahmet Alpdemir Voice-interactive marketplace providing time and money saving benefits and real-time promotion publishing and feedback
US7027974B1 (en) * 2000-10-27 2006-04-11 Science Applications International Corporation Ontology-based parser for natural language processing
IL140322A0 (en) 2000-12-14 2002-05-23 Poly Information Ltd Method and interface for inteligent user machine interaction
IL140673A0 (en) * 2001-01-01 2002-02-10 Poly Information Ltd A method and system for improved speech recognition
US7249018B2 (en) * 2001-01-12 2007-07-24 International Business Machines Corporation System and method for relating syntax and semantics for a conversational speech application
US6950793B2 (en) * 2001-01-12 2005-09-27 International Business Machines Corporation System and method for deriving natural language representation of formal belief structures
US7127402B2 (en) * 2001-01-12 2006-10-24 International Business Machines Corporation Method and apparatus for converting utterance representations into actions in a conversational system
US7016849B2 (en) * 2002-03-25 2006-03-21 Sri International Method and apparatus for providing speech-driven routing between spoken language applications
US7302383B2 (en) * 2002-09-12 2007-11-27 Luis Calixto Valles Apparatus and methods for developing conversational applications
US20040162724A1 (en) 2003-02-11 2004-08-19 Jeffrey Hill Management of conversations
JP4441782B2 (ja) * 2003-05-14 2010-03-31 日本電信電話株式会社 情報提示方法及び情報提示装置
CN1219266C (zh) * 2003-05-23 2005-09-14 郑方 一种实现多路对话的人-机汉语口语对话系统的方法
US7539619B1 (en) * 2003-09-05 2009-05-26 Spoken Translation Ind. Speech-enabled language translation system and method enabling interactive user supervision of translation and speech recognition accuracy
JP2006317876A (ja) * 2005-05-16 2006-11-24 Nippon Telegr & Teleph Corp <Ntt> 音声読み上げ装置およびプログラム
US7949529B2 (en) * 2005-08-29 2011-05-24 Voicebox Technologies, Inc. Mobile systems and methods of supporting natural language human-machine interactions
JP4584166B2 (ja) * 2006-03-14 2010-11-17 Necパーソナルプロダクツ株式会社 Webページ文章自動検出装置
US20080095327A1 (en) 2006-10-18 2008-04-24 Prokom Investments S.A. Systems, apparatuses, and methods for interactively accessing networked services using voice communications
US8032383B1 (en) * 2007-05-04 2011-10-04 Foneweb, Inc. Speech controlled services and devices using internet

Also Published As

Publication number Publication date
IL214424A0 (en) 2011-09-27
SG173511A1 (en) 2011-09-29
WO2010089645A1 (en) 2010-08-12
KR20110127180A (ko) 2011-11-24
CN102369568A (zh) 2012-03-07
JP2012517174A (ja) 2012-07-26
TW201034004A (en) 2010-09-16
US20130226579A1 (en) 2013-08-29
US20100198595A1 (en) 2010-08-05
EP2394267A1 (en) 2011-12-14
US20130226575A1 (en) 2013-08-29
US8417523B2 (en) 2013-04-09

Similar Documents

Publication Publication Date Title
RU2011136720A (ru) Системы и способы организации интерактивного доступа к сервисам внешнего размещения с использованием голосовой связи
US9390711B2 (en) Information recognition method and apparatus
CN103377028B (zh) 用于以语音启动人机界面的方法和系统
CN104221078B (zh) 声音识别服务器综合装置以及声音识别服务器综合方法
US8909525B2 (en) Interactive voice recognition electronic device and method
CN110970021B (zh) 一种问答控制方法、装置及系统
CN103631853B (zh) 基于相关性的语音搜索和响应
JP5857090B2 (ja) 情報検索装置、情報検索プログラム、及び情報検索システム
WO2013027360A1 (ja) 音声認識システム、認識辞書登録システム及び音響モデル識別子系列生成装置
CA2696514A1 (en) Speech recognition learning system and method
CN106409283A (zh) 基于音频的人机混合交互系统及方法
CN103019407B (zh) 输入法应用方法、自动问答处理方法及电子设备、服务器
CN108028044A (zh) 使用多个识别器减少延时的语音识别系统
CN104091478A (zh) 随问随答学习机以及网络学习系统
CN103533129B (zh) 实时的语音翻译通信方法、系统及所适用的通讯设备
CN101551998A (zh) 一组可以进行语音互动的装置以及其和人的语音互动方法
KR20130050197A (ko) 음성 인식 단문 메시지 서비스 기반의 사용자 맞춤 광고 장치, 및 음성 인식 단문 메시지 서비스 기반의 사용자 맞춤 광고 노출 방법
WO2015154447A1 (zh) 一种交互式语音应答方法及装置
US20140067401A1 (en) Provide services using unified communication content
CN111128175B (zh) 口语对话管理方法及系统
CN108447473A (zh) 语音翻译方法和装置
CN102376304B (zh) 文本朗读系统及其文本朗读方法
KR102342571B1 (ko) 다중 음성인식모듈을 적용한 음성 인식 방법 및 이를 위한 음성인식장치
US20130297314A1 (en) Rescoring method and apparatus in distributed environment
CN104347081A (zh) 一种测试场景说法覆盖度的方法和装置