RU2011136720A - Системы и способы организации интерактивного доступа к сервисам внешнего размещения с использованием голосовой связи - Google Patents
Системы и способы организации интерактивного доступа к сервисам внешнего размещения с использованием голосовой связи Download PDFInfo
- Publication number
- RU2011136720A RU2011136720A RU2011136720/08A RU2011136720A RU2011136720A RU 2011136720 A RU2011136720 A RU 2011136720A RU 2011136720/08 A RU2011136720/08 A RU 2011136720/08A RU 2011136720 A RU2011136720 A RU 2011136720A RU 2011136720 A RU2011136720 A RU 2011136720A
- Authority
- RU
- Russia
- Prior art keywords
- speech
- concepts
- fragment
- voice
- service
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract 20
- 230000004308 accommodation Effects 0.000 title 1
- 230000002452 interceptive effect Effects 0.000 title 1
- 239000012634 fragment Substances 0.000 claims abstract 37
- 238000006243 chemical reaction Methods 0.000 claims 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1815—Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/39—Electronic components, circuits, software, systems or apparatus used in telephone systems using speech synthesis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/40—Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
Abstract
1. Способ предоставления сервиса пользователю в системе, содержащей модуль голосового распознавания, сеансовый администратор и модуль голосового генератора, причем способ содержит этапы, на которых:принимают фрагмент речи через модуль голосового распознавания;преобразуют фрагмент речи в одну или более структур, используя словарь, связанный с онтологией;идентифицируют понятия во фрагменте речи, используя структуры;выбирают сервис на основе понятий при условии, что фрагмент речи включает в себя достаточную информацию;генерируют текстовое сообщение на основе выбранного сервиса; ипреобразуют текстовое сообщение в голосовое сообщение, используя голосовой генератор.2. Способ по п.1, дополнительно содержащий этап, на котором преобразуют фрагмент речи в текст и затем преобразуют текст в одну или более структур.3. Способ по п.1, дополнительно содержащий этапы, на которых, когда фрагмент речи не включает в себя достаточную информацию, генерируют текстовое сообщение, предназначенное для вызова дополнительной информации, преобразуют текстовое сообщение в голосовое сообщение, используя голосовой генератор, и передают голосовое сообщение пользователю.4. Способ по п.1, дополнительно содержащий этап, на котором передают голосовое сообщение пользователю.5. Способ по п.1, дополнительно содержащий этапы, на которых:принимают дополнительные фрагменты речи через модуль голосового распознавания в ответ на голосовое сообщение, переданное пользователю;преобразуют фрагмент речи в одну или более структур, используя словарь, связанный с онтологией;идентифицируют понятия во фрагментах речи, используя структуры;получают инфор
Claims (21)
1. Способ предоставления сервиса пользователю в системе, содержащей модуль голосового распознавания, сеансовый администратор и модуль голосового генератора, причем способ содержит этапы, на которых:
принимают фрагмент речи через модуль голосового распознавания;
преобразуют фрагмент речи в одну или более структур, используя словарь, связанный с онтологией;
идентифицируют понятия во фрагменте речи, используя структуры;
выбирают сервис на основе понятий при условии, что фрагмент речи включает в себя достаточную информацию;
генерируют текстовое сообщение на основе выбранного сервиса; и
преобразуют текстовое сообщение в голосовое сообщение, используя голосовой генератор.
2. Способ по п.1, дополнительно содержащий этап, на котором преобразуют фрагмент речи в текст и затем преобразуют текст в одну или более структур.
3. Способ по п.1, дополнительно содержащий этапы, на которых, когда фрагмент речи не включает в себя достаточную информацию, генерируют текстовое сообщение, предназначенное для вызова дополнительной информации, преобразуют текстовое сообщение в голосовое сообщение, используя голосовой генератор, и передают голосовое сообщение пользователю.
4. Способ по п.1, дополнительно содержащий этап, на котором передают голосовое сообщение пользователю.
5. Способ по п.1, дополнительно содержащий этапы, на которых:
принимают дополнительные фрагменты речи через модуль голосового распознавания в ответ на голосовое сообщение, переданное пользователю;
преобразуют фрагмент речи в одну или более структур, используя словарь, связанный с онтологией;
идентифицируют понятия во фрагментах речи, используя структуры;
получают информацию для предоставления пользователю на основании идентифицированных понятий;
генерируют другое текстовое сообщение на основании, по меньшей мере, одного из полученной информации или идентифицированных понятий;
преобразуют текстовое сообщение в голосовое сообщение, используя голосовой генератор; и
передают текстовое сообщение пользователю.
6. Способ по п.1, в котором преобразование фрагмента речи в одну или более структур, используя словарь, связанный с онтологией, содержит ассоциирование фрагмента речи с одним или более блоками, связанными с множеством понятий, которые в свою очередь ассоциированы с множеством сервисов.
7. Способ по п.6, в котором идентифицирование понятий во фрагменте речи, используя структуры, содержит определение того, какие понятия связаны с блоками.
8. Способ по п.7, в котором выбор сервиса на основе понятий содержит определение того, какой сервис наиболее тесно связан с фрагментом речи, на основе ряда ассоциированных понятий, которые связаны с фрагментом речи через блоки для каждого из множества сервисов.
9. Способ по п.1, дополнительно содержащий этап, на котором идентифицируют особые понятия, ассоциированные с выбранным сервисом, и присваивают значение идентифицированным особым понятиям на основе информации, содержащейся во фрагменте речи.
10. Способ по п.9, дополнительно содержащий этапы, на которых определяют, все ли особые понятия, ассоциированные с выбранным сервисом, присутствуют во фрагменте речи, и если нет, то генерируют текстовое сообщение, предназначенное для вызова информации, касающейся некоторых отсутствующих особых понятий, и преобразуют текстовое сообщение в голосовое сообщение, используя голосовой генератор.
11. Способ по п.10, дополнительно содержащий этап, на котором выполняют или завершают сервис, когда все особые понятия присутствуют и им назначено значение.
12. Способ по п.11, в котором выполнение сервиса содержит сохранение информации, содержащейся во фрагменте речи и ассоциированной с особыми понятиями.
13. Система для предоставления сервиса пользователю, содержащая:
модуль голосового распознавания, сконфигурированный с возможностью приема фрагмента речи и преобразования этого фрагмента речи в текст; одной или более структур, использующих словарь, связанный с онтологией;
сеансовый администратор, сконфигурированный с возможностью соединения с модулем голосового распознавания и сконфигурированный с возможностью:
генерирования структуры, ассоциированной с текстом, с использованием словаря, связанного с онтологией;
идентификации понятий во фрагменте речи с использованием структуры;
выбора сервиса на основании понятий при условии, если фрагмент речи включает в себя достаточную информацию; и
генерирования текстового сообщения ответа на основании выбранного сервиса; и
модуль голосового генератора, соединенный с сеансовым администратором и сконфигурированный с возможностью преобразования текстового сообщения ответа в голосовое сообщение.
14. Система по п.13, в которой сеансовый администратор дополнительно сконфигурирован с возможностью генерирования текстового сообщения, предназначенного для вызова дополнительной информации, когда фрагмент речи не включает в себя достаточную информацию, и в которой модуль голосового генератора дополнительно сконфигурирован с возможностью преобразования текстового сообщения в голосовое сообщение и передачи этого голосового сообщения пользователю.
15. Система по п.13, в которой сеансовый администратор дополнительно сконфигурирован с возможностью генерирования структуры, ассоциированной с текстом, посредством ассоциирования фрагмента речи с одним или более блоками, связанными с множеством понятий, которые, в свою очередь, ассоциированы с множеством сервисов.
16. Система по п.15, в которой сеансовый администратор дополнительно сконфигурирован с возможностью идентификации понятий во фрагменте речи с использованием структур посредством определения понятий, которые связаны с блоками.
17. Система по п.16, в которой сеансовый администратор дополнительно сконфигурирован с возможностью выбора сервиса на основании понятий посредством определения того, какой сервис наиболее тесно связан с фрагментом речи, на основании ряда ассоциированных понятий, которые связаны с фрагментом речи через блоки для каждого из множества сервисов.
18. Система по п.13, в которой сеансовый администратор дополнительно сконфигурирован с возможностью идентификации особых понятий, ассоциированных с выбранным сервисом, и назначения значения идентифицированным особым понятиями на основании информации, содержащейся во фрагменте речи.
19. Система по п.18, в которой сеансовый администратор дополнительно сконфигурирован с возможностью определения, все ли особые понятия, ассоциированные с выбранным сервисом, присутствуют во фрагменте речи, и если нет, то генерирования текстового сообщения, предназначенного для вызова информации, касающейся каких-либо отсутствующих особых понятий, и в которой модуль голосового генератора дополнительно сконфигурирован с возможностью преобразования текстового сообщения в голосовое сообщение с использованием голосового генератора.
20. Система по п.19, в которой сеансовый администратор дополнительно сконфигурирован с возможностью выполнения или завершения сервиса, когда все заданные понятия присутствуют и им назначено значение.
21. Система по п.20, в которой сеансовый администратор дополнительно сконфигурирован с возможностью выполнения сервиса посредством сохранения информации, содержащейся во фрагменте речи и ассоциированной с особыми понятиями.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/364,927 | 2009-02-03 | ||
US12/364,927 US8417523B2 (en) | 2009-02-03 | 2009-02-03 | Systems and methods for interactively accessing hosted services using voice communications |
PCT/IB2010/000186 WO2010089645A1 (en) | 2009-02-03 | 2010-01-19 | Systems and methods for interactively accessing hosted services using voice communications |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2011136720A true RU2011136720A (ru) | 2013-03-10 |
Family
ID=42244676
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2011136720/08A RU2011136720A (ru) | 2009-02-03 | 2010-01-19 | Системы и способы организации интерактивного доступа к сервисам внешнего размещения с использованием голосовой связи |
Country Status (10)
Country | Link |
---|---|
US (3) | US8417523B2 (ru) |
EP (1) | EP2394267A1 (ru) |
JP (1) | JP2012517174A (ru) |
KR (1) | KR20110127180A (ru) |
CN (1) | CN102369568A (ru) |
IL (1) | IL214424A0 (ru) |
RU (1) | RU2011136720A (ru) |
SG (1) | SG173511A1 (ru) |
TW (1) | TW201034004A (ru) |
WO (1) | WO2010089645A1 (ru) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007132467A1 (en) * | 2006-05-15 | 2007-11-22 | E-Glue Software Technologies Ltd. | Call center analytical system having real time capabilities |
US9021565B2 (en) | 2011-10-13 | 2015-04-28 | At&T Intellectual Property I, L.P. | Authentication techniques utilizing a computing device |
US20130130648A1 (en) * | 2011-11-22 | 2013-05-23 | Kamran J. Tadjeran | Providing support to a user |
US9858039B2 (en) * | 2014-01-28 | 2018-01-02 | Oracle International Corporation | Voice recognition of commands extracted from user interface screen devices |
CN104836925A (zh) * | 2014-02-11 | 2015-08-12 | 携程计算机技术(上海)有限公司 | 咨询系统及方法 |
US10514677B2 (en) * | 2014-04-11 | 2019-12-24 | Honeywell International Inc. | Frameworks and methodologies configured to assist configuring devices supported by a building management system |
DE102014213350A1 (de) | 2014-07-09 | 2016-01-14 | Volkswagen Aktiengesellschaft | Verfahren und Vorrichtung zur Ermittlung von Informationen über Mobilitäts-situationen |
CN105338204A (zh) * | 2014-08-15 | 2016-02-17 | 中兴通讯股份有限公司 | 一种交互式语音应答方法及装置 |
CN105827877A (zh) * | 2015-01-06 | 2016-08-03 | 中国移动通信集团上海有限公司 | 一种基于ivr平台的业务处理方法及ivr平台 |
JP6849964B2 (ja) * | 2016-09-05 | 2021-03-31 | 株式会社Nextremer | 対話制御装置、対話エンジン、管理端末、対話装置、対話制御方法、対話方法、およびプログラム |
CN108182943B (zh) * | 2017-12-29 | 2021-03-26 | 北京奇艺世纪科技有限公司 | 一种智能设备控制方法、装置及智能设备 |
WO2019193378A1 (en) * | 2018-04-06 | 2019-10-10 | Flex Ltd. | Device and system for accessing multiple virtual assistant services |
CN110459211B (zh) | 2018-05-07 | 2023-06-23 | 阿里巴巴集团控股有限公司 | 人机对话方法、客户端、电子设备及存储介质 |
CN109327629A (zh) * | 2018-11-01 | 2019-02-12 | 深圳市号互联科技有限公司 | 一种人工智能语音导航数据处理方法 |
CN112399019A (zh) * | 2020-09-16 | 2021-02-23 | 中国农业银行股份有限公司河北省分行 | 智能外呼方法、终端设备及可读存储介质 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7006881B1 (en) * | 1991-12-23 | 2006-02-28 | Steven Hoffberg | Media recording device with remote graphic user interface |
US20020035474A1 (en) * | 2000-07-18 | 2002-03-21 | Ahmet Alpdemir | Voice-interactive marketplace providing time and money saving benefits and real-time promotion publishing and feedback |
US7027974B1 (en) * | 2000-10-27 | 2006-04-11 | Science Applications International Corporation | Ontology-based parser for natural language processing |
IL140322A0 (en) | 2000-12-14 | 2002-05-23 | Poly Information Ltd | Method and interface for inteligent user machine interaction |
IL140673A0 (en) * | 2001-01-01 | 2002-02-10 | Poly Information Ltd | A method and system for improved speech recognition |
US7249018B2 (en) * | 2001-01-12 | 2007-07-24 | International Business Machines Corporation | System and method for relating syntax and semantics for a conversational speech application |
US6950793B2 (en) * | 2001-01-12 | 2005-09-27 | International Business Machines Corporation | System and method for deriving natural language representation of formal belief structures |
US7127402B2 (en) * | 2001-01-12 | 2006-10-24 | International Business Machines Corporation | Method and apparatus for converting utterance representations into actions in a conversational system |
US7016849B2 (en) * | 2002-03-25 | 2006-03-21 | Sri International | Method and apparatus for providing speech-driven routing between spoken language applications |
US7302383B2 (en) * | 2002-09-12 | 2007-11-27 | Luis Calixto Valles | Apparatus and methods for developing conversational applications |
US20040162724A1 (en) | 2003-02-11 | 2004-08-19 | Jeffrey Hill | Management of conversations |
JP4441782B2 (ja) * | 2003-05-14 | 2010-03-31 | 日本電信電話株式会社 | 情報提示方法及び情報提示装置 |
CN1219266C (zh) * | 2003-05-23 | 2005-09-14 | 郑方 | 一种实现多路对话的人-机汉语口语对话系统的方法 |
US7539619B1 (en) * | 2003-09-05 | 2009-05-26 | Spoken Translation Ind. | Speech-enabled language translation system and method enabling interactive user supervision of translation and speech recognition accuracy |
JP2006317876A (ja) * | 2005-05-16 | 2006-11-24 | Nippon Telegr & Teleph Corp <Ntt> | 音声読み上げ装置およびプログラム |
US7949529B2 (en) * | 2005-08-29 | 2011-05-24 | Voicebox Technologies, Inc. | Mobile systems and methods of supporting natural language human-machine interactions |
JP4584166B2 (ja) * | 2006-03-14 | 2010-11-17 | Necパーソナルプロダクツ株式会社 | Webページ文章自動検出装置 |
US20080095327A1 (en) | 2006-10-18 | 2008-04-24 | Prokom Investments S.A. | Systems, apparatuses, and methods for interactively accessing networked services using voice communications |
US8032383B1 (en) * | 2007-05-04 | 2011-10-04 | Foneweb, Inc. | Speech controlled services and devices using internet |
-
2009
- 2009-02-03 US US12/364,927 patent/US8417523B2/en not_active Expired - Fee Related
-
2010
- 2010-01-19 KR KR1020117020568A patent/KR20110127180A/ko not_active Application Discontinuation
- 2010-01-19 WO PCT/IB2010/000186 patent/WO2010089645A1/en active Application Filing
- 2010-01-19 RU RU2011136720/08A patent/RU2011136720A/ru unknown
- 2010-01-19 EP EP10713502A patent/EP2394267A1/en not_active Withdrawn
- 2010-01-19 JP JP2011548797A patent/JP2012517174A/ja active Pending
- 2010-01-19 SG SG2011055753A patent/SG173511A1/en unknown
- 2010-01-19 CN CN2010800147504A patent/CN102369568A/zh active Pending
- 2010-02-01 TW TW099102886A patent/TW201034004A/zh unknown
-
2011
- 2011-08-03 IL IL214424A patent/IL214424A0/en not_active IP Right Cessation
-
2013
- 2013-04-08 US US13/858,888 patent/US20130226579A1/en not_active Abandoned
- 2013-04-08 US US13/858,905 patent/US20130226575A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
IL214424A0 (en) | 2011-09-27 |
SG173511A1 (en) | 2011-09-29 |
WO2010089645A1 (en) | 2010-08-12 |
KR20110127180A (ko) | 2011-11-24 |
CN102369568A (zh) | 2012-03-07 |
JP2012517174A (ja) | 2012-07-26 |
TW201034004A (en) | 2010-09-16 |
US20130226579A1 (en) | 2013-08-29 |
US20100198595A1 (en) | 2010-08-05 |
EP2394267A1 (en) | 2011-12-14 |
US20130226575A1 (en) | 2013-08-29 |
US8417523B2 (en) | 2013-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2011136720A (ru) | Системы и способы организации интерактивного доступа к сервисам внешнего размещения с использованием голосовой связи | |
US9390711B2 (en) | Information recognition method and apparatus | |
CN103377028B (zh) | 用于以语音启动人机界面的方法和系统 | |
CN104221078B (zh) | 声音识别服务器综合装置以及声音识别服务器综合方法 | |
US8909525B2 (en) | Interactive voice recognition electronic device and method | |
CN110970021B (zh) | 一种问答控制方法、装置及系统 | |
CN103631853B (zh) | 基于相关性的语音搜索和响应 | |
JP5857090B2 (ja) | 情報検索装置、情報検索プログラム、及び情報検索システム | |
WO2013027360A1 (ja) | 音声認識システム、認識辞書登録システム及び音響モデル識別子系列生成装置 | |
CA2696514A1 (en) | Speech recognition learning system and method | |
CN106409283A (zh) | 基于音频的人机混合交互系统及方法 | |
CN103019407B (zh) | 输入法应用方法、自动问答处理方法及电子设备、服务器 | |
CN108028044A (zh) | 使用多个识别器减少延时的语音识别系统 | |
CN104091478A (zh) | 随问随答学习机以及网络学习系统 | |
CN103533129B (zh) | 实时的语音翻译通信方法、系统及所适用的通讯设备 | |
CN101551998A (zh) | 一组可以进行语音互动的装置以及其和人的语音互动方法 | |
KR20130050197A (ko) | 음성 인식 단문 메시지 서비스 기반의 사용자 맞춤 광고 장치, 및 음성 인식 단문 메시지 서비스 기반의 사용자 맞춤 광고 노출 방법 | |
WO2015154447A1 (zh) | 一种交互式语音应答方法及装置 | |
US20140067401A1 (en) | Provide services using unified communication content | |
CN111128175B (zh) | 口语对话管理方法及系统 | |
CN108447473A (zh) | 语音翻译方法和装置 | |
CN102376304B (zh) | 文本朗读系统及其文本朗读方法 | |
KR102342571B1 (ko) | 다중 음성인식모듈을 적용한 음성 인식 방법 및 이를 위한 음성인식장치 | |
US20130297314A1 (en) | Rescoring method and apparatus in distributed environment | |
CN104347081A (zh) | 一种测试场景说法覆盖度的方法和装置 |