CN115762470A - 基于ai的模板式话术的实现方法及相关产品 - Google Patents
基于ai的模板式话术的实现方法及相关产品 Download PDFInfo
- Publication number
- CN115762470A CN115762470A CN202211396104.XA CN202211396104A CN115762470A CN 115762470 A CN115762470 A CN 115762470A CN 202211396104 A CN202211396104 A CN 202211396104A CN 115762470 A CN115762470 A CN 115762470A
- Authority
- CN
- China
- Prior art keywords
- processing
- conversation
- label
- labels
- voice data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000012545 processing Methods 0.000 claims abstract description 109
- 230000011218 segmentation Effects 0.000 claims abstract description 45
- 238000005065 mining Methods 0.000 claims abstract description 18
- 238000007781 pre-processing Methods 0.000 claims abstract description 10
- 238000004364 calculation method Methods 0.000 claims description 57
- 230000015654 memory Effects 0.000 claims description 28
- 230000006870 function Effects 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 13
- 230000004913 activation Effects 0.000 claims description 11
- 238000004891 communication Methods 0.000 claims description 11
- 238000013528 artificial neural network Methods 0.000 claims description 7
- 238000001994 activation Methods 0.000 claims 3
- 230000008901 benefit Effects 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 10
- 239000000243 solution Substances 0.000 description 6
- 230000008569 process Effects 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000005111 flow chemistry technique Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000002347 injection Methods 0.000 description 2
- 239000007924 injection Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
Abstract
本申请实施例提供一种基于AI的模板式话术的实现方法及相关产品,所述方法包括:终端接收样本语料,对该样本语料执行分词预处理得到分词处理结果,将该分词处理结果执行会话标签处理得到该样本语料的多个会话标签;终端将多个会话标签中每个会话标签逐一执行模板挖掘处理得到每个标签下的匹配规则集;终端依据多个会话标签下的多个匹配规则集执行流畅度处理得到该样本语料的最终语音数据。本申请具有成本低的优点。
Description
技术领域
本申请涉及大数据以及金融技术领域,尤其涉及一种基于AI的模板式话术的实现方法及相关产品。
背景技术
电话客服是客服人员代表公司通过电话与客户进行沟通交流维护的一种方便快捷的方式。随着近期人工智能在语音领域的应用,越来越多的电话客服采用了AI机器人的方式实现语音客服,现有的AI机器人的语音基于不同的语音模板来实现对话,但是在现实场景中,需要人工手工对模板式会话进行干预,这样提高了成本和对话效率。
发明内容
本申请实施例公开了一种基于AI的模板式话术的实现方法及相关产品,该方法降低人工干预模板式会话的比例,降低人工成本,提高用户的体验度。
第一方面,提供一种基于AI的模板式话术的实现方法,所述方法包括如下步骤:
终端接收样本语料,对该样本语料执行分词预处理得到分词处理结果,将该分词处理结果执行会话标签处理得到该样本语料的多个会话标签;
终端将多个会话标签中每个会话标签逐一执行模板挖掘处理得到每个标签下的匹配规则集;
终端依据多个会话标签下的多个匹配规则集执行流畅度处理得到该样本语料的最终语音数据。
第二方面,提供一种基于AI的模板式话术的实现系统,所述系统包括:
接收单元,用于接收样本语料;
处理单元,用于对该样本语料执行分词预处理得到分词处理结果,将该分词处理结果执行会话标签处理得到该样本语料的多个会话标签;将多个会话标签中每个会话标签逐一执行模板挖掘处理得到每个标签下的匹配规则集;依据多个会话标签下的多个匹配规则集执行流畅度处理得到该样本语料的最终语音数据。
第三方面,提供一种电子设备,包括处理器、存储器、通信接口,以及一个或多个程序,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行第一方面所述的方法中的步骤的指令。
第四方面,提供了一种计算机可读存储介质,存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行第一方面所述的方法。
第五方面,提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
本申请提供的技术方案通过终端接收样本语料,对该样本语料执行分词预处理得到分词处理结果,将该分词处理结果执行会话标签处理得到该样本语料的多个会话标签,终端将多个会话标签中每个会话标签逐一执行模板挖掘处理得到每个标签下的匹配规则集;终端依据多个会话标签下的多个匹配规则集执行流畅度处理得到该样本语料的最终语音数据。这样就能够实现同样的样本语料的最终语音数据的多样性,提高用户的感受,另外,上述合成语音数据的方案过多的人工干预,降低了人工成本,降低了成本,因此其具有提高用户体验度的优点。
附图说明
以下对本申请实施例用到的附图进行介绍。
图1是本申请的一种终端设备的结构示意图;
图2是本申请模型构架示意图;
图3是本申请提供的会话标签模型的示意图;
图4A为本申请提供的例子A的匹配规则集示意图;
图4B为本申请提供的例子B的匹配规则集示意图
图5是本申请一个实施例提供的基于AI的模板式话术的实现方法的流程示意图;
图6是本申请一个实施例提供的基于AI的模板式话术的实现系统的结构示意图;
图7是本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面结合本申请实施例中的附图对本申请实施例进行描述。
本申请中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,表示前后关联对象是一种“或”的关系。
本申请实施例中出现的“多个”是指两个或两个以上。本申请实施例中出现的第一、第二等描述,仅作示意与区分描述对象之用,没有次序之分,也不表示本申请实施例中对设备个数的特别限定,不能构成对本申请实施例的任何限制。本申请实施例中出现的“连接”是指直接连接或者间接连接等各种连接方式,以实现设备间的通信,本申请实施例对此不做任何限定。
会话标签:基于模型对文本内容进行拆分与抽象化成标签,如例句“如果再不还进来,我们可能就要对您进行进一步流程处理了”,会话内容“如果再不还进来”则会抽象成标签“${如果产生逾期不良记录}”,会话内容“我们可能就要对您进行进一步流程处理了”则会抽象成标签“${可能会按程序进一步处理}”,后续相似句或同义句内容则会同样进行抽象化,如“你再不还进来”则会同样被抽象成“${如果产生逾期不良记录}”。
会话模板:假设所有的文本内容已经基于上述方法进行抽象,而真实场景中的人群使用的话术则是基于会话标签的排列组合,如“如果再不还进来,我们可能就要对您进行进一步流程处理了,现在能不能处理”则会被抽象成模板“${如果产生逾期不良记录}${可能会按程序进一步处理}${确认还款}”,同理“现在能不能处理,如果再不还进来,我们可能就要打电话给您家人进行进一步核实了”则会被抽象成模板“${确认还款}${如果产生逾期不良记录}${可能会联系家人进行核实}”。
参阅图1,图1提供了一种终端设备的结构框图,如图1所示,该终端设备可以包括:处理器、存储器、通信单元和总线;上述处理器依据不同的功能,可以添加例如:麦克风、移动设备等等硬件结构,当然在实际应用中,也可以根据不同的硬件来实现,当然在实际应用中,上述终端设备也可以集成在其他硬件设备上,例如智能手机、服务器、计算机设备等等。
本申请的技术方案主要基于三大模型对真人的话术经验至AI进行移植,分别是“会话标签模型”、“模板挖掘模型”,“流畅度检验模型”,其如图2所示,图2为本申请模型构架示意图。
使用规则、分词、关联模型、聚类模型等进行中心句挖掘,集合挡板实现会话标签模型,如图3所示。
输入文本经过会话标签模型进行抽象化成对应的多标签,捕捉单标签下相同意思对应的多个表达方式(中心句),最终形成一些特定的匹配规则集,如下两个例子:例子A的表示如图4A所示,例子B的表示如图4B所示。
最终长文本会被抽象成多个标签,具体可以包括:你在我们公司的欠款已经逾期了$(已经产生逾期不良记录),现在欠了有一千三百二十一块钱$(逾期欠款是M),现在没有多少时间了$(情况比较紧急),您尽快把当前欠款处理了$(建议尽快处理欠款)。本申请中的“$”表示抽象后的标签。
模板挖掘模型方案如下:输入的语料会计算出一个大型的标签共现矩阵,配合业务实际的约束来加强合规性、合理性、针对性,最后产出一系列的话术模板。
构建子句池方案:
输入的语料会构建出一个大型的标签子句池,每个标签下会包含一系列多个子句,且每个子句都是完全符合业务要求的精校短句。单个标签下,子句的数量越大且子句之间差异越大,则多样性越强。
流畅度检验方案:
输入的文本会经过一个流畅度检验模型进行评分,其中主要包含了大量的敏感词、违规词等质检规则模块以及基于循环神经网络检测语序的模型模块。
参阅图5,图5为本申请提供的一种基于AI的模板式话术的实现方法的流程示意图,如图5所示,该方法可以由如图1所示的终端执行,该方法如图5所示,包括如下步骤:
步骤S501、终端接收样本语料,对该样本语料执行分词预处理得到分词处理结果,将该分词处理结果执行会话标签处理得到该样本语料的多个会话标签;
示例的,上述分词处理的方法可以采用通过的分词处理方法来执行,本申请并不限制上述分词处理的方法。
示例的,上述将分词处理结果执行会话标签处理得到该样本语料的会话标签具体可以包括:
将该分词处理结果输入到关联挖掘模型处理得到挡板和关键词,同时将该分词处理结果输入到聚类模型处理得到中心句,依据该挡板和关键词以及中心句确定该多个会话标签。
示例的,上述样本语料可以为文本信息,例如,张三,信用卡欠款500元,已经逾期。上述文本信息可以有多种格式的信息,例如图片格式、PDF格式、txt格式等等,本申请并不限制上述文本信息的具体格式。
步骤S502、终端将多个会话标签中每个会话标签逐一执行模板挖掘处理得到每个标签下的匹配规则集;
示例的,上述步骤S502的实现方法具体可以包括:
终端从预设的匹配规则集数据库中注意查询每个会话标签下的相同意思的多个中心句,将相同意思的多个中心句汇聚到该会话标签下的匹配规则集内,遍历所有会话标签得到每个标签下的匹配规则集。
具体的,上述预设的匹配规则集数据库可以通过历史输入的语料会构建出一个大型的标签子句池,每个标签下会包含一系列多个子句,且每个子句都是完全符合业务要求的精校短句,单个标签下,子句的数量越大且子句之间差异越大,则多样性越强。
如图4A和图4B所示即为不同的会话标签下的匹配规则集,上述匹配规则集数据库中的中心句可以通过采集人工的历史数据得到,这里不再赘述。
步骤S503、终端依据多个会话标签下的多个匹配规则集执行流畅度处理得到该样本语料的最终语音数据。
本申请提供的技术方案通过终端接收样本语料,对该样本语料执行分词预处理得到分词处理结果,将该分词处理结果执行会话标签处理得到该样本语料的多个会话标签,终端将多个会话标签中每个会话标签逐一执行模板挖掘处理得到每个标签下的匹配规则集;终端依据多个会话标签下的多个匹配规则集执行流畅度处理得到该样本语料的最终语音数据。这样就能够实现同样的样本语料的最终语音数据的多样性,提高用户的感受,另外,上述合成语音数据的方案过多的人工干预,降低了人工成本,降低了成本,因此其具有提高用户体验度的优点。
示例的,上述终端依据多个会话标签下的多个匹配规则集执行流畅度处理得到该样本语料的最终语音数据具体可以包括:
终端生成n个语音数据,具体包括:从每个会话标签下匹配规则集中随机抽取一个中心句,按会话标签的先后顺序将中心句组合起来得到第一组合中心文本,将第一组合中心文本生成第一语音数据,执行n次得到n个语音数据,对n个语音数据输入到流畅度模型计算得到n个计算结果,从n个计算结果中选择一个计算结果对应的语音数据确定为最终语音数据。
示例的,上述对n个语音数据输入到流畅度模型计算得到n个计算结果具体可以包括:
将n个语音数据作为n个输入数据分别输入到流畅度模型执行神经网络运算得到n个运算结果,对n个运算结果执行激活处理得到n个计算结果。
示例的,上述从n个计算结果中选择一个计算结果对应的语音数据确定为最终语音数据具体包括:
从n个计算结果中选择最大值确定为一个计算结果;
或从n个计算结果中提取大于第一阈值的m个计算结果,从m个计算结果中随机抽取一个确定为一个计算结果。
示例的,上述神经网络运算可以包括:多层卷积运算、全连接运算,上述激活处理可以通过激活函数来处理,该激活函数具体可以为:
y=sigmoid(x),其中x是运算结果,y是激活结果,上述激活函数还可以为tanh,relu,softmax或线性激活操作的函数。
参阅图6,图6提供一种基于AI的模板式话术的实现系统的结构示意图,如图6所示,所述系统包括:
接收单元601,用于接收样本语料;
处理单元602,用于对该样本语料执行分词预处理得到分词处理结果,将该分词处理结果执行会话标签处理得到该样本语料的多个会话标签;将多个会话标签中每个会话标签逐一执行模板挖掘处理得到每个标签下的匹配规则集;依据多个会话标签下的多个匹配规则集执行流畅度处理得到该样本语料的最终语音数据。
示例的,处理单元602,具体用于将该分词处理结果输入到关联挖掘模型处理得到挡板和关键词,同时将该分词处理结果输入到聚类模型处理得到中心句,依据该挡板和关键词以及中心句确定该多个会话标签。
示例的,处理单元602,具体用于终端从预设的匹配规则集数据库中注意查询每个会话标签下的相同意思的多个中心句,将相同意思的多个中心句汇聚到该会话标签下的匹配规则集内,遍历所有会话标签得到每个标签下的匹配规则集。
示例的,处理单元602,具体用于终端生成n个语音数据,具体包括:从每个会话标签下匹配规则集中随机抽取一个中心句,按会话标签的先后顺序将中心句组合起来得到第一组合中心文本,将第一组合中心文本生成第一语音数据,执行n次得到n个语音数据,对n个语音数据输入到流畅度模型计算得到n个计算结果,从n个计算结果中选择一个计算结果对应的语音数据确定为最终语音数据。
示例的,处理单元602,具体用于将n个语音数据作为n个输入数据分别输入到流畅度模型执行神经网络运算得到n个运算结果,对n个运算结果执行激活处理得到n个计算结果。
示例的,处理单元602,具体用于从n个计算结果中选择最大值确定为一个计算结果;
或从n个计算结果中提取大于第一阈值的m个计算结果,从m个计算结果中随机抽取一个确定为一个计算结果。
可以理解的是,上述装置为了实现上述功能,其包含了执行各个功能相应的硬件和/或软件模块。结合本文中所公开的实施例描述的各示例的算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。本领域技术人员可以结合实施例对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本实施例可以根据上述方法示例对电子设备进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块可以采用硬件的形式实现。需要说明的是,本实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
需要说明的是,上述方法实施例涉及的各步骤的所有相关内容均可以援引到对应功能模块的功能描述,在此不再赘述。
在采用集成的单元的情况下,用户设备可以包括处理模块和存储模块。其中,处理模块可以用于对用户设备的动作进行控制管理,例如,可以用于支持电子设备执行上述获取单元、通信单元、处理单元执行的步骤。存储模块可以用于支持电子设备执行存储程序代码和数据等。
其中,处理模块可以是处理器或控制器。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,数字信号处理(digital signal processing,DSP)和微处理器的组合等等。存储模块可以是存储器。通信模块具体可以为射频电路、蓝牙芯片、Wi-Fi芯片等与其他电子设备交互的设备。
可以理解的是,本申请实施例示意的各模块间的接口连接关系,只是示意性说明,并不构成对用户设备的结构限定。在本申请另一些实施例中,用户设备也可以采用上述实施例中不同的接口连接方式,或多种接口连接方式的组合。
请参见图7,图7是本申请实施例提供的一种电子设备70,该电子设备70包括处理器701、存储器702、通信接口703和显示屏704,所述处理器701、存储器702和通信接口703通过总线相互连接,所述显示屏为所述电子设备供电,该电子设备还可以包括:
存储器702包括但不限于是随机存储记忆体(random access memory,RAM)、只读存储器(read-only memory,ROM)、可擦除可编程只读存储器(erasable programmableread only memory,EPROM)、或便携式只读存储器(compact disc read-only memory,CD-ROM),该存储器702用于相关计算机程序及数据。通信接口703用于接收和发送数据。
处理器701可以是一个或多个中央处理器(central processing unit,CPU),在处理器701是一个CPU的情况下,该CPU可以是单核CPU,也可以是多核CPU。
处理器701可以包括一个或多个处理单元,例如:处理单元可以包括应用处理器(application processor,AP),调制解调处理器,图形处理器(graphics processingunit,GPU),图像信号处理器(image signal processor,ISP),控制器,视频编解码器,数字信号处理器(digital signal processor,DSP),基带处理器,和/或神经网络处理器(neural-network processing unit,NPU)等。其中,不同的处理单元可以是独立的部件,也可以集成在一个或多个处理器中。在一些实施例中,用户设备也可以包括一个或多个处理单元。其中,控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。在其他一些实施例中,处理单元中还可以设置存储器,用于存储指令和数据。示例性地,处理单元中的存储器可以为高速缓冲存储器。该存储器可以保存处理单元刚用过或循环使用的指令或数据。如果处理单元需要再次使用该指令或数据,可从所述存储器中直接调用。这样就避免了重复存取,减少了处理单元的等待时间,因而提高了用户设备处理数据或执行指令的效率。
在一些实施例中,处理器701可以包括一个或多个接口。接口可以包括集成电路间(inter-integrated circuit,I2C)接口、集成电路间音频(inter-integrated circuitsound,I2S)接口、脉冲编码调制(pulse code modulation,PCM)接口、通用异步收发传输器(universal asynchronous receiver/transmitter,UART)接口、移动产业处理器接口(mobile industry processor interface,MIPI)、用输入输出(general-purpose input/output,GPIO)接口、SIM卡接口和/或USB接口等。其中,USB接口是符合USB标准规范的接口,具体可以是Mini USB接口、Micro USB接口、USB Type C接口等。USB接口可以用于连接充电器为用户设备充电,也可以用于用户设备与外围设备之间传输数据。该USB接口也可以用于连接耳机,通过耳机播放音频。
若该电子设备70为用户设备或终端设备,例如智能手机、计算机设备、服务器,该电子设备70中的处理器701用于读取所述存储器702中存储的计算机程序代码,执行以下操作:
接收样本语料,对该样本语料执行分词预处理得到分词处理结果,将该分词处理结果执行会话标签处理得到该样本语料的多个会话标签;
将多个会话标签中每个会话标签逐一执行模板挖掘处理得到每个标签下的匹配规则集;
依据多个会话标签下的多个匹配规则集执行流畅度处理得到该样本语料的最终语音数据。
上述将该分词处理结果执行会话标签处理得到该样本语料的多个会话标签具体包括:
将该分词处理结果输入到关联挖掘模型处理得到挡板和关键词,同时将该分词处理结果输入到聚类模型处理得到中心句,依据该挡板和关键词以及中心句确定该多个会话标签。
上述将多个会话标签中每个会话标签逐一执行模板挖掘处理得到每个标签下的匹配规则集具体包括:
从预设的匹配规则集数据库中注意查询每个会话标签下的相同意思的多个中心句,将相同意思的多个中心句汇聚到该会话标签下的匹配规则集内,遍历所有会话标签得到每个标签下的匹配规则集。
上述依据多个会话标签下的多个匹配规则集执行流畅度处理得到该样本语料的最终语音数据具体包括:
生成n个语音数据,具体包括:从每个会话标签下匹配规则集中随机抽取一个中心句,按会话标签的先后顺序将中心句组合起来得到第一组合中心文本,将第一组合中心文本生成第一语音数据,执行n次得到n个语音数据,对n个语音数据输入到流畅度模型计算得到n个计算结果,从n个计算结果中选择一个计算结果对应的语音数据确定为最终语音数据。
上述对n个语音数据输入到流畅度模型计算得到n个计算结果具体包括:
将n个语音数据作为n个输入数据分别输入到流畅度模型执行神经网络运算得到n个运算结果,对n个运算结果执行激活处理得到n个计算结果。
上述从n个计算结果中选择一个计算结果对应的语音数据确定为最终语音数据具体包括:
从n个计算结果中选择最大值确定为一个计算结果;
或从n个计算结果中提取大于第一阈值的m个计算结果,从m个计算结果中随机抽取一个确定为一个计算结果。
其中,上述方法实施例涉及的各场景的所有相关内容均可以援引到对应功能模块的功能描述,在此不再赘述。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,当其在网络设备上运行时,图5所示的方法流程得以实现。
本申请实施例还提供一种计算机程序产品,当所述计算机程序产品在终端上运行时,图5所示的方法流程得以实现。
上述主要从方法侧执行过程的角度对本申请实施例的方案进行了介绍。可以理解的是,电子设备为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模板。本领域技术人员应该很容易意识到,结合本文中所提供的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例可以根据上述方法示例对电子设备进行功能单元的划分,例如,可以对应各个功能划分各个功能单元,也可以将两个或两个以上的功能集成在一个处理单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。需要说明的是,本申请实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模板并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例上述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取器(英文:Random Access Memory,简称:RAM)、磁盘或光盘等。
Claims (10)
1.一种基于AI的模板式话术的实现方法,其特征在于,所述方法包括如下步骤:
终端接收样本语料,对该样本语料执行分词预处理得到分词处理结果,将该分词处理结果执行会话标签处理得到该样本语料的多个会话标签;
终端将多个会话标签中每个会话标签逐一执行模板挖掘处理得到每个标签下的匹配规则集;
终端依据多个会话标签下的多个匹配规则集执行流畅度处理得到该样本语料的最终语音数据。
2.根据权利要求1所述的方法,其特征在于,所述将该分词处理结果执行会话标签处理得到该样本语料的多个会话标签具体包括:
将该分词处理结果输入到关联挖掘模型处理得到挡板和关键词,同时将该分词处理结果输入到聚类模型处理得到中心句,依据该挡板和关键词以及中心句确定该多个会话标签。
3.根据权利要求1所述的方法,其特征在于,终端将多个会话标签中每个会话标签逐一执行模板挖掘处理得到每个标签下的匹配规则集具体包括:
终端从预设的匹配规则集数据库中注意查询每个会话标签下的相同意思的多个中心句,将相同意思的多个中心句汇聚到该会话标签下的匹配规则集内,遍历所有会话标签得到每个标签下的匹配规则集。
4.根据权利要求1所述的方法,其特征在于,终端依据多个会话标签下的多个匹配规则集执行流畅度处理得到该样本语料的最终语音数据具体包括:
终端生成n个语音数据,具体包括:从每个会话标签下匹配规则集中随机抽取一个中心句,按会话标签的先后顺序将中心句组合起来得到第一组合中心文本,将第一组合中心文本生成第一语音数据,执行n次得到n个语音数据,对n个语音数据输入到流畅度模型计算得到n个计算结果,从n个计算结果中选择一个计算结果对应的语音数据确定为最终语音数据。
5.根据权利要求4所述的方法,其特征在于,所述对n个语音数据输入到流畅度模型计算得到n个计算结果具体包括:
将n个语音数据作为n个输入数据分别输入到流畅度模型执行神经网络运算得到n个运算结果,对n个运算结果执行激活处理得到n个计算结果。
6.根据权利要求4所述的方法,其特征在于,所述从n个计算结果中选择一个计算结果对应的语音数据确定为最终语音数据具体包括:
从n个计算结果中选择最大值确定为一个计算结果;
或从n个计算结果中提取大于第一阈值的m个计算结果,从m个计算结果中随机抽取一个确定为一个计算结果。
7.根据权利要求5所述的方法,其特征在于,所述激活处理的激活函数为:sigmoid、tanh,relu或softmax。
8.一种基于AI的模板式话术的实现系统,其特征在于,所述系统包括:
接收单元,用于接收样本语料;
处理单元,用于对该样本语料执行分词预处理得到分词处理结果,将该分词处理结果执行会话标签处理得到该样本语料的多个会话标签;将多个会话标签中每个会话标签逐一执行模板挖掘处理得到每个标签下的匹配规则集;依据多个会话标签下的多个匹配规则集执行流畅度处理得到该样本语料的最终语音数据。
9.一种电子设备,包括处理器、存储器、通信接口,以及一个或多个程序,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行如权利要求1-7任意一项所述的方法的步骤的指令。
10.一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,当其在用户设备上运行时,执行如权利要求1-7任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211396104.XA CN115762470A (zh) | 2022-11-08 | 2022-11-08 | 基于ai的模板式话术的实现方法及相关产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211396104.XA CN115762470A (zh) | 2022-11-08 | 2022-11-08 | 基于ai的模板式话术的实现方法及相关产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115762470A true CN115762470A (zh) | 2023-03-07 |
Family
ID=85368448
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211396104.XA Pending CN115762470A (zh) | 2022-11-08 | 2022-11-08 | 基于ai的模板式话术的实现方法及相关产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115762470A (zh) |
-
2022
- 2022-11-08 CN CN202211396104.XA patent/CN115762470A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110444198B (zh) | 检索方法、装置、计算机设备和存储介质 | |
CN114357973B (zh) | 意图识别方法、装置、电子设备及存储介质 | |
CN112380853B (zh) | 业务场景交互方法、装置、终端设备及存储介质 | |
CN113903363B (zh) | 基于人工智能的违规行为检测方法、装置、设备及介质 | |
CN111783471B (zh) | 自然语言的语义识别方法、装置、设备及存储介质 | |
CN113240510B (zh) | 异常用户预测方法、装置、设备及存储介质 | |
WO2024099457A1 (zh) | 一种信息推荐方法、装置、存储介质及电子设备 | |
CN114140947A (zh) | 界面展示方法、装置、电子设备、存储介质和程序产品 | |
CN117056481A (zh) | 基于大模型技术的云服务行业对话帮助系统及实现方法 | |
CN111581347A (zh) | 语句相似度匹配方法及装置 | |
CN115762470A (zh) | 基于ai的模板式话术的实现方法及相关产品 | |
CN114528851A (zh) | 回复语句确定方法、装置、电子设备和存储介质 | |
CN112364682A (zh) | 一种案件搜索方法及装置 | |
CN111161737A (zh) | 数据处理方法、装置、电子设备和存储介质 | |
CN115270799B (zh) | 命名实体识别方法及装置 | |
CN112434501B (zh) | 工单智能生成的方法、装置、电子设备及介质 | |
CN114373448B (zh) | 话题检测方法、装置、电子设备及存储介质 | |
CN115329767B (zh) | 抽取文本实体的方法、装置、电子设备及存储介质 | |
CN117453899B (zh) | 一种基于大模型的智能对话系统、方法与电子设备 | |
CN111401059A (zh) | 小说朗读的方法 | |
CN113505293A (zh) | 信息推送方法、装置、电子设备及存储介质 | |
CN112883185A (zh) | 基于机器学习的问题推荐方法及装置 | |
CN113836915A (zh) | 数据处理方法、装置、设备及可读存储介质 | |
CN114417819A (zh) | 数据召回方法、装置、存储介质及电子设备 | |
CN115934947A (zh) | 法律案件争议焦点的识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Country or region after: China Address after: 518000 18th floor, building A4, Kexing Science Park, Nanshan District, Shenzhen City, Guangdong Province Applicant after: Zhaolian Consumer Finance Co.,Ltd. Address before: 518000 18th floor, building A4, Kexing Science Park, Nanshan District, Shenzhen City, Guangdong Province Applicant before: MERCHANTS UNION CONSUMER FINANCE Co.,Ltd. Country or region before: China |