CN112364140A - 一种通过配置单实现语音识别意图定制的方法 - Google Patents

一种通过配置单实现语音识别意图定制的方法 Download PDF

Info

Publication number
CN112364140A
CN112364140A CN202011217455.0A CN202011217455A CN112364140A CN 112364140 A CN112364140 A CN 112364140A CN 202011217455 A CN202011217455 A CN 202011217455A CN 112364140 A CN112364140 A CN 112364140A
Authority
CN
China
Prior art keywords
data
elements
template
scene
party
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011217455.0A
Other languages
English (en)
Other versions
CN112364140B (zh
Inventor
辛裴
陈鹏
杨祉雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Seeyon Internet Software Corp
Original Assignee
Beijing Seeyon Internet Software Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Seeyon Internet Software Corp filed Critical Beijing Seeyon Internet Software Corp
Priority to CN202011217455.0A priority Critical patent/CN112364140B/zh
Publication of CN112364140A publication Critical patent/CN112364140A/zh
Application granted granted Critical
Publication of CN112364140B publication Critical patent/CN112364140B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Stored Programmes (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种通过配置单实现语音识别意图定制的方法,其具体操作流程包含以下步骤:A、预备应用场景数据;B、配置智能应用脚本文件;C、场景关键元素的排列组合;D、接入用户自身关键业务元素;E、业务数据智能更新维护,将日常人们用语中涉及到的人、物、时间、地点、事件等元素,通过开发工具对元素进行排列组合穷举,形成模板文件,当业务场景涉及到以上元素时,只需要套模板,就可以生成对话模板,封装了第三方平台API,并设计简单规则,解析脚本文件,打通了用户业务场景、本地系统和第三方AI辅助平台的数据链路,保证了用户用简单的方式就能对智能应用进行增删改等能力。

Description

一种通过配置单实现语音识别意图定制的方法
技术领域
本发明涉及互联网应用技术领域,具体为一种通过配置单实现语音识别意图定制的方法。
背景技术
智能语音交互场景需要开发人员在提供智能服务的第三方厂商平台按照相关规则进行手动配置,比如:新建协同场景、会议安排场景等,需要根据业务场景的需求,配置诸如“意图”、“词槽”、“关键字”、“停用词”、“对话模板”等相关必要元素;每当新增一个场景,开发人员就要重新配置一个场景,并在第三方平台上进行测试,待测试好了,方可接入到协同办公软件中。
每增加一个场景,开发人员需要去第三方平台配置,由于业务的多样性,需要开发人员对业务有比较深的了解,才能配置出正确的场景,存在业务门槛;而其他熟悉业务的人员由于对配置规则不了解,也无法实现独立操作,对于业务人员来说存在技术门槛。
当增加的业务场景时,需要开发人员在智能产品上单独进行开发适配,开发完成测试成功后才能进行应用上架,对于不熟悉客户端开发的人员,会有较高的技术门槛,不适合业务场景的扩展性。
如果用户对智能产品有个性化需求,需要用户去深入了解第三方平台的配置规则,按照规则一步一步配置出来,这样会导致用户的学习成本很高,在没有相关专业技术人员的指导下,几乎是不可能完成的;这样也会导致我们的智能产品不能横向扩展,无法满足用户需求。
智能机器人要理解用户的对话意图,对话模板即说话的方式是关键,而对话模板需要根据不同的业务进行配置,这样不了解业务的开发者存在对对话模板穷举不完的情况,导致智能机器人对用户意图的识别率较低。
由于AI技术对于大部分人来说存在技术门槛,要做一个智能应用除了要关注业务场景外还需要了解智能应用意图识别中的关键术语,如:“词槽”、“关键字”、“对话模板”、“停用词”等概念。
当用户要配置智能应用时,需要做以下几步操作:
到第三方AI辅助服务平台注册账号,并通读其比较复杂的文档,按照规范配置相关元素,配置完成后需要反复在其平台上训练模型、调试测试,最终才能达到用户想要的对话理解效果。
对话模型生成后,用户需要调用其提供的接口方能进行对话沟通。
用户配置的业务数据单方面在第三方平台上需要保存一份,自己系统上的数据和第三方AI服务平台是脱钩的,不能产生联动;一旦系统数据改变,需要自己的维护人员到第三方AI服务平台手动同步数据,这样手动同步数据的方式既浪费时间,又容易出错。
针对当前已有技术,如何解决上述提出的问题,成为了当前急需解决的难题。
发明内容
本发明的目的在于提供一种将日常人们用语中涉及到的人、物、时间、地点、事件等元素,通过开发工具对元素进行排列组合穷举,形成模板文件,打通了用户业务场景、本地系统和第三方AI辅助平台的数据链路,保证了用户用简单的方式就能对智能应用进行增删改等能力的语音识别意图定制的方法。
为实现上述目的,本发明提供如下技术方案:一种通过配置单实现语音识别意图定制的方法其具体操作流程包含以下步骤:
A、预备应用场景数据;
B、配置智能应用脚本文件;
C、场景关键元素的排列组合;
D、接入用户自身关键业务元素;
E、业务数据智能更新维护。
作为优选,根据步骤A预备应用场景数据:
a、将智能应用场景中涉及到必要元素,主要是词槽、关键字、停用词通过开发工具穷举。
b、将元素文字预先设置进第三方AI辅助服务平台。
作为优选,根据步骤B配置智能应用脚本文件:
a、将大部分对话场景中出现的时间、地点、人物、事件内容等具体的元素进行排列组合。
b、然后把对话模板中的有效信息以占位符的方式预留出来,以json数据格式的文件放到系统中。
作为优选,根据步骤C场景关键元素的排列组合:
a、人物+时间的组合模板;
b、时间+事件内容的组合模板;
c、人物+时间+事件内容的组合模板。
作为优选,根据步骤D接入用户自身关键业务元素:
a、将用户自身业务中关键的时间,人物、地点、事件内容等业务元素,整理成一份配置单文件;
b、将业务元素配置成意图定制技术所规定的映射格式;
c、再将配置单文件放入到系统指定目录;
d、重启系统小致平台的应用接入引擎主动读取配置单文件中的内容,通过解析文件内容将数据转换成命令数据和意图数据;
e、将命令数据分发到命令库,将意图数据和对话模板数据分发到第三方AI辅助服务平台,第三方AI辅助服务平台产生对话意图并插入对话模板;
f、然后训练模型,待完成后,就产生一个新的智能应用;
g、第三方AI辅助服务平台将智能应用返回给命令库,进行数据映射关系建立。
作为优选,根据步骤E业务数据智能更新维护:
a、业务数据更新时,用户修改配置单内容;
b、应用接入引擎到系统命令库找到智能应用映射关系;
c、同步完成系统命令库数据后并同步更新第三方AI辅助服务平台对应的智能应用数据
与现有技术相比,本发明的有益效果是:
(1)本发明人机对话模板的精炼抽取,将日常人们用语中涉及到的人、物、时间、地点、事件等元素,通过开发工具对元素进行排列组合穷举,形成模板文件,当业务场景涉及到以上元素时,只需要套模板,就可以生成对话模板了。
(2)应用接入引擎,封装了第三方平台API,并设计简单规则,解析脚本文件,打通了用户业务场景、本地系统和第三方AI辅助平台的数据链路,保证了用户用简单的方式就能对智能应用进行增删改等能力。
附图说明
图1为本发明整体运作流程结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,一种通过配置单实现语音识别意图定制的方法其具体操作流程包含以下步骤:
A、预备应用场景数据;
B、配置智能应用脚本文件;
C、场景关键元素的排列组合;
D、接入用户自身关键业务元素;
E、业务数据智能更新维护。
根据步骤A预备应用场景数据:
a、将智能应用场景中涉及到必要元素,主要是词槽、关键字、停用词通过开发工具穷举。
b、将元素文字预先设置进第三方AI辅助服务平台。
根据步骤B配置智能应用脚本文件:
a、将大部分对话场景中出现的时间、地点、人物、事件内容等具体的元素进行排列组合。
b、然后把对话模板中的有效信息以占位符的方式预留出来,以json数据格式的文件放到系统中。
根据步骤C场景关键元素的排列组合:
a、人物+时间的组合模板;
b、时间+事件内容的组合模板;
c、人物+时间+事件内容的组合模板。
根据步骤D接入用户自身关键业务元素:
a、将用户自身业务中关键的时间,人物、地点、事件内容等业务元素,整理成一份配置单文件;
b、将业务元素配置成意图定制技术所规定的映射格式;
c、再将配置单文件放入到系统指定目录;
d、重启系统小致平台的应用接入引擎主动读取配置单文件中的内容,通过解析文件内容将数据转换成命令数据和意图数据;
e、将命令数据分发到命令库,将意图数据和对话模板数据分发到第三方AI辅助服务平台,第三方AI辅助服务平台产生对话意图并插入对话模板;
f、然后训练模型,待完成后,就产生一个新的智能应用;
g、第三方AI辅助服务平台将智能应用返回给命令库,进行数据映射关系建立。
根据步骤E业务数据智能更新维护:
a、业务数据更新时,用户修改配置单内容;
b、应用接入引擎到系统命令库找到智能应用映射关系;
c、同步完成系统命令库数据后并同步更新第三方AI辅助服务平台对应的智能应用数据。
上述实施例只是本发明的较佳实施例,并不是对本发明技术方案的限制,只要是不经过创造性劳动即可在上述实施例的基础上实现的技术方案,均应视为落入本发明专利的权利保护范围内。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (6)

1.一种通过配置单实现语音识别意图定制的方法,其特征在于:其具体操作流程包含以下步骤:
A、预备应用场景数据;
B、配置智能应用脚本文件;
C、场景关键元素的排列组合;
D、接入用户自身关键业务元素;
E、业务数据智能更新维护。
2.根据权利要求1所述的一种通过配置单实现语音识别意图定制的方法,其特征在于:所述根据步骤A预备应用场景数据:
a、将智能应用场景中涉及到必要元素,主要是词槽、关键字、停用词通过开发工具穷举。
b、将元素文字预先设置进第三方AI辅助服务平台。
3.根据权利要求1所述的一种通过配置单实现语音识别意图定制的方法,其特征在于:所述根据步骤B配置智能应用脚本文件:
a、将大部分对话场景中出现的时间、地点、人物、事件内容等具体的元素进行排列组合。
b、然后把对话模板中的有效信息以占位符的方式预留出来,以json数据格式的文件放到系统中。
4.根据权利要求1所述的一种通过配置单实现语音识别意图定制的方法,其特征在于:所述根据步骤C场景关键元素的排列组合:
a、人物+时间的组合模板;
b、时间+事件内容的组合模板;
c、人物+时间+事件内容的组合模板。
5.根据权利要求1所述的一种通过配置单实现语音识别意图定制的方法,其特征在于:所述根据步骤D接入用户自身关键业务元素:
a、将用户自身业务中关键的时间,人物、地点、事件内容等业务元素,整理成一份配置单文件;
b、将业务元素配置成意图定制技术所规定的映射格式;
c、再将配置单文件放入到系统指定目录;
d、重启系统小致平台的应用接入引擎主动读取配置单文件中的内容,通过解析文件内容将数据转换成命令数据和意图数据;
e、将命令数据分发到命令库,将意图数据和对话模板数据分发到第三方AI辅助服务平台,第三方AI辅助服务平台产生对话意图并插入对话模板;
f、然后训练模型,待完成后,就产生一个新的智能应用;
g、第三方AI辅助服务平台将智能应用返回给命令库,进行数据映射关系建立。
6.根据权利要求1所述的一种通过配置单实现语音识别意图定制的方法,其特征在于:所述根据步骤E业务数据智能更新维护:
a、业务数据更新时,用户修改配置单内容;
b、应用接入引擎到系统命令库找到智能应用映射关系;
c、同步完成系统命令库数据后并同步更新第三方AI辅助服务平台对应的智能应用数据。
CN202011217455.0A 2020-11-04 2020-11-04 一种通过配置单实现语音识别意图定制的方法 Active CN112364140B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011217455.0A CN112364140B (zh) 2020-11-04 2020-11-04 一种通过配置单实现语音识别意图定制的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011217455.0A CN112364140B (zh) 2020-11-04 2020-11-04 一种通过配置单实现语音识别意图定制的方法

Publications (2)

Publication Number Publication Date
CN112364140A true CN112364140A (zh) 2021-02-12
CN112364140B CN112364140B (zh) 2022-09-13

Family

ID=74512812

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011217455.0A Active CN112364140B (zh) 2020-11-04 2020-11-04 一种通过配置单实现语音识别意图定制的方法

Country Status (1)

Country Link
CN (1) CN112364140B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170147554A1 (en) * 2015-11-25 2017-05-25 Semantic Machines, Inc. Automatic spoken dialogue script discovery
CN108874917A (zh) * 2018-05-30 2018-11-23 北京五八信息技术有限公司 意图识别方法、装置、设备及存储介质
CN109413286A (zh) * 2018-10-22 2019-03-01 北京移数通电讯有限公司 一种智能客服语音应答系统及方法
CN110136712A (zh) * 2019-05-07 2019-08-16 甄十信息科技(上海)有限公司 实现智能语音ai功能的方法及装置
CN110209793A (zh) * 2019-06-18 2019-09-06 佰聆数据股份有限公司 一种用于智能识别文本语义的方法
CN110276071A (zh) * 2019-05-24 2019-09-24 众安在线财产保险股份有限公司 一种文本匹配方法、装置、计算机设备及存储介质
CN110442701A (zh) * 2019-08-15 2019-11-12 苏州思必驰信息科技有限公司 语音对话处理方法及装置
CN111538816A (zh) * 2020-07-09 2020-08-14 平安国际智慧城市科技股份有限公司 基于ai识别的问答方法、装置、电子设备及介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170147554A1 (en) * 2015-11-25 2017-05-25 Semantic Machines, Inc. Automatic spoken dialogue script discovery
CN108874917A (zh) * 2018-05-30 2018-11-23 北京五八信息技术有限公司 意图识别方法、装置、设备及存储介质
CN109413286A (zh) * 2018-10-22 2019-03-01 北京移数通电讯有限公司 一种智能客服语音应答系统及方法
CN110136712A (zh) * 2019-05-07 2019-08-16 甄十信息科技(上海)有限公司 实现智能语音ai功能的方法及装置
CN110276071A (zh) * 2019-05-24 2019-09-24 众安在线财产保险股份有限公司 一种文本匹配方法、装置、计算机设备及存储介质
CN110209793A (zh) * 2019-06-18 2019-09-06 佰聆数据股份有限公司 一种用于智能识别文本语义的方法
CN110442701A (zh) * 2019-08-15 2019-11-12 苏州思必驰信息科技有限公司 语音对话处理方法及装置
CN111538816A (zh) * 2020-07-09 2020-08-14 平安国际智慧城市科技股份有限公司 基于ai识别的问答方法、装置、电子设备及介质

Also Published As

Publication number Publication date
CN112364140B (zh) 2022-09-13

Similar Documents

Publication Publication Date Title
CN100472500C (zh) 会话浏览器和会话系统
US10824798B2 (en) Data collection for a new conversational dialogue system
US20100100809A1 (en) Multi-modal/multi-channel application tool architecture
US20050028085A1 (en) Dynamic generation of voice application information from a web server
US20040038670A1 (en) Mail server, program and mobile terminal for realizing the mail server
JP6795668B1 (ja) 議事録作成システム
CN101138228A (zh) 个性化语音扩展标记语言应用
JP4334227B2 (ja) 情報システムにアクセスする自然言語問合せシステム
CN109240670A (zh) 模块化的软件开发方法、系统、设备及介质
CN106302933B (zh) 通话语音信息处理方法及终端
WO2010129056A2 (en) System and method for speech processing and speech to text
KR102076793B1 (ko) 음성을 통한 전자문서 제공 방법, 음성을 통한 전자문서 작성 방법 및 장치
CN110489198A (zh) 一种工单处理的方法和系统
JP7357166B2 (ja) 対話ロボット生成方法、対話ロボット管理プラットフォーム及び記憶媒体
CN107733722A (zh) 用于配置语音服务的方法和装置
CN112035630A (zh) 结合rpa和ai的对话交互方法、装置、设备及存储介质
KR100733772B1 (ko) 이동통신 가입자를 위한 립싱크 서비스 제공 방법 및 이를위한 시스템
JP2002236681A (ja) 日常言語コンピューティングシステムおよびその方法
KR20210109914A (ko) 대화 인식을 통한 서식 기반 전자문서 입력 장치 및 방법
CN109660672A (zh) 语音类型的转换方法、设备及计算机可读存储介质
CN112364140B (zh) 一种通过配置单实现语音识别意图定制的方法
CN109891410B (zh) 用于新的会话对话系统的数据收集
CN100464555C (zh) 一种基于voicexml的电话语音实时交互系统和方法
CN112487170B (zh) 面向场景配置的人机交互对话机器人系统
US20220253596A1 (en) Method for providing electric document using chatbot, apparatus and method for writing electric document using chatbot

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant