CN105912725A - 一种通过自然语言交互调用海量智慧应用的系统 - Google Patents
一种通过自然语言交互调用海量智慧应用的系统 Download PDFInfo
- Publication number
- CN105912725A CN105912725A CN201610312932.9A CN201610312932A CN105912725A CN 105912725 A CN105912725 A CN 105912725A CN 201610312932 A CN201610312932 A CN 201610312932A CN 105912725 A CN105912725 A CN 105912725A
- Authority
- CN
- China
- Prior art keywords
- application service
- module
- application
- magnanimity
- wisdom
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000003993 interaction Effects 0.000 title abstract description 3
- 238000000605 extraction Methods 0.000 claims description 19
- 230000006870 function Effects 0.000 claims description 7
- 238000010801 machine learning Methods 0.000 claims description 6
- 241001672694 Citrus reticulata Species 0.000 claims description 4
- 238000011109 contamination Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000012271 agricultural production Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000013011 mating Effects 0.000 description 1
- 238000000034 method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9032—Query formulation
- G06F16/90332—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明涉及一种通过自然语言交互调用海量智慧应用的系统,所述系统包括:语音输入模块,语音识别模块,语义提取模块,第三方应用服务接口以及第三方应用服务模块;通过规范的提示语引导来提高问句的准确性;通过自定义关键词、关键词组合、阈值管理对语音识别后得到的语义进行处理,实现语音对不同应用服务的精确调用。通过第三方应用服务接口实现海量应用服务的集中管理,解决了众多应用服务需要单独下载,使用时需要在不同的应用之间频繁切换的问题,提高了应用服务的效率进而提升了用户体验。
Description
技术领域
本发明涉及语音识别、语义提取、机器学习以及信息集成领域,具体涉及一种通过自然语言交互调用海量智慧应用的系统。
背景技术
现有技术中,信息查询一般是采用手动输入,然后通过搜索引擎检索,来查找筛选所需要的信息。还有一种方式是通过不同的应用软件查询获取不同的信息。
现有技术所存在的缺点是:手机应用软件种类多,需要每个单独下载,才能获取对应的应用服务;智能终端文字输入交互的方式慢,不便捷;不习惯或不会输入法的人群,一些应用服务使用不了;在使用服务时要花时间查找应用软件,耗费时间;没有通过统一的入口实现众多应用服务的集成;信息不集中,需要不同渠道查找。
发明内容
鉴于上述问题,为了克服现有技术中的缺点,本发明的目的是提供一种能够通过自然语言交互,并调用各方面智慧应用系统,解决了众多应用服务需要单独下载,使用时需要在不同的应用之间频繁切换的问题,方便快捷,提高了应用服务的效率进而提升了用户体验。
本发明提供一种通过自然语言交互调用海量智慧应用的系统,所述系统包括:语音输入模块,语音识别模块,语义提取模块,应用服务接口模块以及第三方应用服务模块;语音输入模块用于接收用户的语音信息;语音识别模块用于识别接收到的语音信息,得到文字信息;语义提取模块用于根据识别得到的文字信息确定语义信息;应用服务接口模块将语义提取模块与第三方应用服务模块相连接,使语义提取模块得到的语义信息能够调用相应的应用服务;第三方应用服务模块用于提供海量的智慧应用。
优选地,语音输入模块能够输入的语音包括普通话、各地方言和外语。
优选地,语音输入模块通过提示语引导用户采用标准可靠的问话模式,通过问话的规范性来提高问句的准确性。
优选地,语音识别模块包括第三方语音数据库以及机器学习算法模块,机器学习算法模块能够对第三方语音数据库中的数据进行增加和修改。
优选地,语义提取模块通过以下方式提高语义提取的准确度:
(1)用户自定义问句中的关键词,只要问句出现自定义的关键词,应用服务直接调用,实现标准可靠的问话模式;
(2)用户通过关键词的组合,实现标准可靠的问话语句类型的扩展;
(3)无论是单个关键词还是组合关键词,与应用服务均呈对应关系;
(4)提出阈值管理,在语音输入后系统提取的语义与应用服务设定的语义匹配度达到阈值时,应用服务才被调用。
优选地,阈值管理进一步包括:用户根据系统对自身语音识别的成功率,自主设置语义匹配阈值,不同的用户能够设置不同的语义匹配度阈值。
优选地,阈值管理进一步还包括:若系统对自身语音识别的成功率低,则提高设置的阈值,以提高系统调用应用服务的准确度;若系统对自身语音识别的成功率高,则降低设置的阈值,以扩大语音识别的范围。
优选地,用户可根据需要将第三方应用服务添加到前端页面中,实现所需应用服务的快速调用。
优选地,所需应用服务包括:天气查询,违章查询,音乐,有声小说,视频。
优选地,用户能够在应用服务页面中通过“添加更多”功能,扩展语音应用服务,进而实现语音应用服务前端页面的个性化定制。
本发明的有益效果:
通过规范的提示语引导来提高问句的准确性;通过自定义关键词、关键词组合、阈值管理对语音识别后得到的语义进行处理,实现语音对不同应用服务的精确调用;通过第三方应用服务接口实现海量应用服务的集中管理,解决了众多应用服务需要单独下载,使用时需要在不同的应用之间频繁切换的问题,提高了应用服务的效率进而提升了用户体验。
附图说明
图1是语音调用应用服务的流程示意图;
图2是语音调用的应用服务类别示意图;
图3是个性化定制的语音应用服务前端页面示意图;
图4是海量语音应用服务库示意图。
具体实施方式
下面结合附图对本发明作进一步说明。
参见附图1,本发明提供一种自然语言交互调用海量智慧应用服务的系统,所述系统包括:语音输入模块,语音识别模块,语义提取模块,应用服务接口模块以及第三方应用服务模块;语音输入模块用于接收用户的语音信息;语音识别模块用于识别接收到的语音信息,得到文字信息;语义提取模块用于根据识别得到的文字信息确定语义信息;应用服务接口模块将语义提取模块与第三方应用服务模块相连接,使语义提取模块得到的语义信息能够调用相应的应用服务;第三方应用服务模块用于提供海量的智慧应用。
其中,语音输入模块能够接收的语音包括普通话、各地方言和外语。语音识别模块包括第三方语音数据库以及机器学习算法模块,机器学习算法模块能够对第三方语音数据库中的数据进行增加和修改。用户可根据需要将第三方应用服务添加到前端页面中,实现所需应用服务的快速调用;用户能够在应用服务页面中通过“添加更多”功能,扩展语音应用服务,进而实现语音应用服务前端页面的个性化定制。
本发明对输入的普通话或各地方言通过第三方云平台(如科大讯飞)进行语音识别,然后对云平台返回的文字进行语义提取,通过提取的语义调用对应的功能模块,进而体验详细的应用服务。
现有阶段,对复杂语句语音的识别率以及语义的理解均不能达到100%,各地方言差异较大,语音、语调、语速均不尽相同。为实现语音与应用服务的高效率匹配,本发明通过提示语引导用户采用标准可靠的问话模式,通过问话的规范性来提高问句的准确性。
本发明通过以下方式提高语义提取的准确度:
(1)用户可以自定义问句中的关键词,只要问句出现自定义的关键词,应用服务直接调用,实现标准可靠的问话模式;如关键词a对应应用服务A0;
(2)用户还可以通过关键词的组合,实现标准可靠的问话语句类型的扩展;如关键词(a+b)对应应用服务A1;
(3)无论是单个关键词还是组合关键词,与应用服务均呈对应关系;
(4)本发明提出阈值管理,在语音输入后系统提取的语义与应用服务设定的语义匹配度达到阈值时,应用服务才被调用。
用户可以根据系统对自身语音识别的成功率,自主设置阈值。不同的用户可以设置不同的语义匹配度阈值,以在系统调用应用服务的准确度与语音识别的范围上取得平衡。
如果系统对自身语音识别的成功率低,可以提高设置的阈值,以提高系统调用应用服务的准确度;如果系统对自身语音识别的成功率高,可以降低设置的阈值,以扩大语音识别的范围。
如图2所示,以语音调用应用服务为例,对系统进行说明。
(1)提示语句引导
当用户有农业技术需求时,发出语音命令:请给我接到农技服务;我需要农技服务;请连接到农技服务。当用户有询问某地的天气时,发出语音命令:上海的天气怎么样?我想知道河南洛阳的天气;上海城隍庙有哪些美食店?
在语音交互界面,滚动出现规范的标准可靠的问话,用户遵循提示语的引导,可准确快速调用应用服务。
系统按频次对识别的关键词排名,给出相应规范的引导提示语。
(2)关键词:特定名称
问句中只要出现关键词,如“天气”、“火车票”、“加油站”、“餐馆”等特定词组,系统直接调用相应的页面,如“出行“、“旅游“、“美食”等页面。同时关键词进入到系统词库,按出现的频次进行排序。
(3)关键词的组合:特定名称+特定名称
问句中可以包含多个关键词,如”地名+天气“,”地名+餐馆“、”地名+商品名“等,组合关键词使语音调用的应用服务更加多样,同时能够提高调用的准确度。
如图3所示,本发明在应用服务前端页面中设计的“添加更多”功能,能够实现语音应用服务前端页面的扩展;通过“添加更多”功能,实现应用服务前端页面的个性化定制。
如图4所示,本发明通过第三方应用接口提供海量的语音应用服务。用户可根据需要,将对应的应用服务如天气查询,土地流转,农资商城,农信贷、农管家、农业资讯等通过添加功能,均可添加到应用服务前端页面中。
本发明通过语音实现海量应用服务的调用,简单快捷;通过规范的提示语引导来提高问句的准确性;通过自定义关键词、关键词组合、阈值管理对语音识别 后得到的语义进行处理,实现语音对不同应用服务的精确调用;通过第三方应用接口提供海量的语音应用服务,用户可根据个人偏好或需要,通过“添加更多”功能定制个性化的应用服务前端界面,实现统一入口对接第三方海量应用服务,实现应用服务的集中管理。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本领域的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
Claims (10)
1.一种通过自然语言交互调用海量智慧应用的系统,其特征在于,所述系统包括:语音输入模块,语音识别模块,语义提取模块,第三方应用服务接口以及第三方应用服务模块;语音输入模块用于接收用户的语音信息;语音识别模块用于识别接收到的语音信息,得到文字信息;语义提取模块用于根据识别得到的文字信息确定语义信息;第三方应用服务接口将语义提取模块与第三方应用服务模块相连接,使语义提取模块得到的语义信息能够调用相应的应用服务;第三方应用服务模块用于提供海量的智慧应用。
2.根据权利要求1所述的一种通过自然语言交互调用海量智慧应用的系统,其特征在于,语音输入模块能够接收的语音包括普通话、各地方言和外语。
3.根据权利要求1所述的一种通过自然语言交互调用海量智慧应用的系统,其特征在于,语音识别模块包括第三方语音数据库以及机器学习算法模块,机器学习算法模块能够对第三方语音数据库中的数据进行增加和修改。
4.根据权利要求1所述的一种通过自然语言交互调用海量智慧应用的系统,其特征在于,语音输入模块通过提示语引导用户采用标准可靠的问话模式,通过问话的规范性来提高问句的准确性。
5.根据权利要求1所述的一种通过自然语言交互调用海量智慧应用的系统,其特征在于,语义提取模块通过以下方式提高语义提取的准确度:
(1)用户自定义问句中的关键词,只要问句出现自定义的关键词,应用服务直接调用,实现标准可靠的问话模式;
(2)用户通过关键词的组合,实现标准可靠的问话语句类型的扩展;
(3)无论是单个关键词还是组合关键词,与应用服务均呈对应关系;
(4)提出阈值管理,在语音输入后系统提取的语义与应用服务设定的语义匹配度达到阈值时,应用服务才被调用。
6.根据权利要求5所述的一种通过自然语言交互调用海量智慧应用的系统,其特征在于,阈值管理进一步包括:用户根据系统对自身语音识别的成功率,自主设置语义匹配阈值,不同的用户能够设置不同的语义匹配度阈值。
7.根据权利要求6所述的一种通过自然语言交互调用海量智慧应用的系统,其特征在于,阈值管理进一步还包括:若系统对自身语音识别的成功率低,则提高设置的阈值,以提高系统调用应用服务的准确度;若系统对自身语音识别的成功率高,则降低设置的阈值,以扩大语音识别的范围。
8.根据权利要求1所述的一种通过自然语言交互调用海量智慧应用的系统,其特征在于,用户可根据需要将第三方应用服务添加到前端页面中,实现所需应用服务的快速调用。
9.根据权利要求8所述的一种通过自然语言交互调用海量智慧应用的系统,其特征在于,所需应用服务包括:天气查询,违章查询,音乐,有声小说,视频。
10.根据权利要求8或9所述的一种通过自然语言交互调用海量智慧应用的系统,其特征在于,用户能够在应用服务页面中通过“添加更多”功能,扩展语音应用服务,进而实现语音应用服务前端页面的个性化定制。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610312932.9A CN105912725A (zh) | 2016-05-12 | 2016-05-12 | 一种通过自然语言交互调用海量智慧应用的系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610312932.9A CN105912725A (zh) | 2016-05-12 | 2016-05-12 | 一种通过自然语言交互调用海量智慧应用的系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105912725A true CN105912725A (zh) | 2016-08-31 |
Family
ID=56748146
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610312932.9A Pending CN105912725A (zh) | 2016-05-12 | 2016-05-12 | 一种通过自然语言交互调用海量智慧应用的系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105912725A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106338924A (zh) * | 2016-09-23 | 2017-01-18 | 广州视源电子科技股份有限公司 | 一种自动调整设备运行参数阈值的方法与装置 |
CN106406806A (zh) * | 2016-09-19 | 2017-02-15 | 北京智能管家科技有限公司 | 一种用于智能设备的控制方法及装置 |
CN108406848A (zh) * | 2018-03-14 | 2018-08-17 | 安徽果力智能科技有限公司 | 一种基于场景分析的智能机器人及其运动控制方法 |
CN108737324A (zh) * | 2017-04-13 | 2018-11-02 | 腾讯科技(深圳)有限公司 | 生成人工智能服务组件的方法、装置及相关设备、系统 |
CN110277095A (zh) * | 2018-03-16 | 2019-09-24 | 纬创资通股份有限公司 | 语音服务控制装置及其方法 |
CN111461946A (zh) * | 2020-04-14 | 2020-07-28 | 山东致群信息技术有限公司 | 一种智能公安审讯系统 |
CN111540353A (zh) * | 2020-04-16 | 2020-08-14 | 重庆农村商业银行股份有限公司 | 一种语义理解方法、装置、设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080010069A1 (en) * | 2006-07-10 | 2008-01-10 | Microsoft Corporation | Authoring and running speech related applications |
CN103400579A (zh) * | 2013-08-04 | 2013-11-20 | 徐华 | 一种语音识别系统和构建方法 |
CN103915095A (zh) * | 2013-01-06 | 2014-07-09 | 华为技术有限公司 | 语音识别的方法、交互设备、服务器和系统 |
-
2016
- 2016-05-12 CN CN201610312932.9A patent/CN105912725A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080010069A1 (en) * | 2006-07-10 | 2008-01-10 | Microsoft Corporation | Authoring and running speech related applications |
CN103915095A (zh) * | 2013-01-06 | 2014-07-09 | 华为技术有限公司 | 语音识别的方法、交互设备、服务器和系统 |
CN103400579A (zh) * | 2013-08-04 | 2013-11-20 | 徐华 | 一种语音识别系统和构建方法 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106406806A (zh) * | 2016-09-19 | 2017-02-15 | 北京智能管家科技有限公司 | 一种用于智能设备的控制方法及装置 |
CN106406806B (zh) * | 2016-09-19 | 2020-01-24 | 北京儒博科技有限公司 | 一种用于智能设备的控制方法及装置 |
CN106338924A (zh) * | 2016-09-23 | 2017-01-18 | 广州视源电子科技股份有限公司 | 一种自动调整设备运行参数阈值的方法与装置 |
CN108737324A (zh) * | 2017-04-13 | 2018-11-02 | 腾讯科技(深圳)有限公司 | 生成人工智能服务组件的方法、装置及相关设备、系统 |
CN108737324B (zh) * | 2017-04-13 | 2021-03-02 | 腾讯科技(深圳)有限公司 | 生成人工智能服务组件的方法、装置及相关设备、系统 |
CN108406848A (zh) * | 2018-03-14 | 2018-08-17 | 安徽果力智能科技有限公司 | 一种基于场景分析的智能机器人及其运动控制方法 |
CN110277095A (zh) * | 2018-03-16 | 2019-09-24 | 纬创资通股份有限公司 | 语音服务控制装置及其方法 |
CN110277095B (zh) * | 2018-03-16 | 2021-06-18 | 纬创资通股份有限公司 | 语音服务控制装置及其方法 |
CN111461946A (zh) * | 2020-04-14 | 2020-07-28 | 山东致群信息技术有限公司 | 一种智能公安审讯系统 |
CN111540353A (zh) * | 2020-04-16 | 2020-08-14 | 重庆农村商业银行股份有限公司 | 一种语义理解方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105912725A (zh) | 一种通过自然语言交互调用海量智慧应用的系统 | |
CN106446045B (zh) | 基于对话交互的用户画像的构建方法及系统 | |
CN110019742B (zh) | 用于处理信息的方法和装置 | |
CN108305626A (zh) | 应用程序的语音控制方法和装置 | |
CN106354835A (zh) | 基于上下文语义理解的人工对话辅助系统 | |
CN104008132B (zh) | 语音地图搜索方法及系统 | |
CN111666380A (zh) | 一种智能呼叫方法、装置、设备和介质 | |
CN108447471A (zh) | 语音识别方法及语音识别装置 | |
CN110266900B (zh) | 客户意图的识别方法、装置及客服系统 | |
CN106328124A (zh) | 一种基于用户行为特征的语音识别方法 | |
CN111489765A (zh) | 一种基于智能语音技术的话务服务质检方法 | |
WO2023272616A1 (zh) | 一种文本理解方法、系统、终端设备和存储介质 | |
CN112906380A (zh) | 文本中角色的识别方法、装置、可读介质和电子设备 | |
CN112669842A (zh) | 人机对话控制方法、装置、计算机设备及存储介质 | |
CN110956955A (zh) | 一种语音交互的方法和装置 | |
CN114818649A (zh) | 基于智能语音交互技术的业务咨询处理方法及装置 | |
CN105323392A (zh) | 一种快速进入ivr菜单的方法及装置 | |
CN115599894A (zh) | 情绪识别的方法、装置、电子设备及存储介质 | |
EP4352630A1 (en) | Reducing biases of generative language models | |
CN111538817B (zh) | 人机交互方法和装置 | |
CN113726942A (zh) | 一种智能电话接听方法、系统、介质及电子终端 | |
JP2012003704A (ja) | Faq候補抽出システムおよびfaq候補抽出プログラム | |
CN112906381A (zh) | 对话归属的识别方法、装置、可读介质和电子设备 | |
CN112015879A (zh) | 基于文本结构化管理的人机交互引擎实现方法及装置 | |
CN111427996A (zh) | 一种人机交互文本中抽取日期时间的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160831 |