CN110674634A - 一种文字交互方法及服务端设备 - Google Patents

一种文字交互方法及服务端设备 Download PDF

Info

Publication number
CN110674634A
CN110674634A CN201910854445.9A CN201910854445A CN110674634A CN 110674634 A CN110674634 A CN 110674634A CN 201910854445 A CN201910854445 A CN 201910854445A CN 110674634 A CN110674634 A CN 110674634A
Authority
CN
China
Prior art keywords
word
text
scene
matching
text field
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910854445.9A
Other languages
English (en)
Inventor
滕铮浩
吴杰
金仁杰
章海华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201910854445.9A priority Critical patent/CN110674634A/zh
Publication of CN110674634A publication Critical patent/CN110674634A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J11/00Manipulators not otherwise provided for
    • B25J11/0005Manipulators having means for high-level communication with users, e.g. speech generator, face recognition means
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Abstract

本发明公开了一种文字交互方法及服务端设备,文字交互方法包括:接收用户端输入的至少一文字段;文字段通过分词获得词语组,词语组与词包库匹配获得文字段关键词组;文字段关键词组与设置有场景关键词组的场景节点匹配,根据文字段关键词组与所述场景关键词组的匹配程度选择匹配程度高的场景节点,输出匹配程度高的场景节点中的回复文字段。

Description

一种文字交互方法及服务端设备
技术领域
本发明涉及人工智能领域,尤其涉及一种文字交互方法及服务端设备。
背景技术
目前通过机器学习算法对语音的识别准确率已经达到95%以上,通过声学和语言建模使用算法的语音识别程序,使得语音信息能够快速精确地识别并被转换为文本,通过语音文本访问功能命令或者进行交流,在语音识别技术的各种应用当中,通过语音识别技术实现机器人与真人之间交互的功能是如今发展的一大热点,如何有效地提高机器人真人语音与机器人之间的交互效率是目前面临的难题。
发明内容
本发明要解决的技术问题,在于提供一种文字交互方法及服务端设备,使得真人发送的文本信息或语音信息经过语音识别转换为文本后能够快速准确地得到机器人的反馈,解决机器人与真人交流效率低、准确率不高的问题。
为实现上述目的,本发明采用下述技术方案:
第一方面,本发明提供一种应用于服务端的文字交互方法,包括:
接收用户端输入的至少一文字段;
所述文字段通过分词获得词语组,所述词语组与词包库匹配获得文字段关键词组;
所述文字段关键词组与设置有场景关键词组的场景节点匹配,根据所述文字段关键词组与所述场景关键词组的匹配程度选择匹配程度高的场景节点,输出所述匹配程度高的场景节点中的回复文字段。
在上述方案中,当所述文字段为多个时,所述多个文字段之间相互隔开,所述多个文字段匹配多个场景节点输出多个回复文字段。
在上述方案中,所述词语组与词包库匹配获得文字段关键词组,包括:
所述词语组中的词语按照顺序与词包库中预先设置的关键词匹配;
所述词语与所述词包库中预先设置的关键词匹配成功则标记所述词语为文字段关键词,所述文字段关键词按照顺序组成文字段关键词组。
在上述方案中,所述文字段关键词组与设置有场景关键词组的场景节点匹配,包括:
根据词语顺序提取所述文字段关键词组中的文字段关键词并按照语句顺序标记;
所述文字段关键词按照标记顺序与每个场景节点的场景关键词组匹配,所述文字段关键词与所述场景关键词组中的场景关键词相同所述场景节点匹配度增加。
在上述方案中,所述输出多个回复文字段包括:
分行输出所述多个回复文字段,所述多个回复文字段之间通过文本框隔开,或同时输出所述多个回复文字段,所述多个回复文字段位于同一文本框中。
第二方面,本发明提供一种服务端设备,包括:
接收单元,用于接收用户端输入的至少一文字段;
分词单元,用于将用户端输入的所述文字段进行分词得到词语组;
词包库单元,用于存储调用词包库;
第一匹配单元,用于将所述词语组与词包库匹配获得文字段关键词组;
场景节点单元,用于存储调用场景节点;
第二匹配单元,用于将所述文字段关键词组与设置有场景关键词组的场景节点匹配获得匹配程度高的场景节点;
输出单元,用于输出所述匹配程度高的场景节点中的回复文字段。
在上述方案中,所述服务端设备还包括:
显示单元,所述显示单元用于显示接收单元接收的文字段和输出单元输出的回复文字段,所述文字段和回复文字段根据输入输出次序显示于所述显示单元上。
第三方面,本发明提供一种服务端设备,包括:存储器、处理器及存储在所述存储器上并在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如第一方面中任一项所述的方法的步骤。
第四方面,本发明提供一种计算机可读存储介质,所述计算机可读存储介质上存储有文字交互程序,所述文字交互程序被处理器执行时实现如第一方面任一项所述的文字交互方法的步骤。
本发明的有益效果是:基于用户输入的文字段信息或语音段信息进行识别,对信息进行分词匹配获得文字段关键词组,根据文字段关键词组进入匹配度最高的场景节点输出回复文字,一是实现了用户与机器人之间的文字交互功能,二是基于用户输入信息,机器人切中真实用户想法,获得真实用户需求并实现双方的交互。
附图说明
图1为本申请提供的应用于服务端的文字交互方法的流程示意图;
图2为本申请提供的第一应用场景示意图;
图3为本申请提供的第一应用场景示意图;
图4为本申请提供的一种服务端设备的结构示意图;
图5为本申请提供的一种服务端设备的结构示意图;
图6为本申请提供的一种服务端设备的结构示意图;
图7为本申请提供的应用于服务端具有语音识别功能的文字交互方法流程示意图;
图8为本申请提供的语音识别单元的结构示意图;
图9为本申请提供的服务端设备的硬件结构示意图。
具体实施方式
下面通过具体实施例,并结合附图,对本申请的技术方案作进一步的具体描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在目前机器人代替真人与用户交流模式中,机器人预先设置话术模板,机器人通过识别用户文字信息中的关键词匹配话术、输出话术,机器人与用户进行一问一答的交流模式。在实际应用中,当用户输出的某段文字信息中包含多项关键词以及连续输出多段文字信息时,机器人不会对所有的关键词进行识别而只是对首个关键词进行识别,因此机器人难以对用户的真实意图进行理解,并根据用户真实意图进行反馈。
为了能够保证机器人与用户交流过程中及时了解用户的真实意图并及时作出回复,本申请实施例对机器人与用户的文字交互方法进行改进,使机器人不再局限于对用户文字信息的首个关键词进行识别。
以下结合附图,详细说明本申请中各实施例提供的技术方案。
第一方面,本申请实施例提供一种应用于服务端的文字交互方法,如附图1所示,包括:
步骤S101,接收用户端输入的至少一文字段;
针对步骤S101而言:
服务端接收用户端输入的至少一文字段,当用户端输入一文字段时,服务端接收用
户端输入的一文字段;当用户端输入多个文字段时,服务端接收用户端输入的多个文字段,基于用户输入的文字段,服务端可以向用户端发送回复文字段。
请参阅附图2,为本申请实施例的第一应用场景示意图,该应用环境包括用于存储和运行文字交互系统的服务端及多个用户端(如附图2所示的用户A、用户B及用户C),服务端为物理服务器,服务端内的各个单元以硬件、软件功能模块、软硬件组合形式中的任意一种存在,用户端可以为手机、台式计算机、平板电脑、笔记本电脑、智能手表中等具备通信功能的电子设备中的任意一种,通常用户端应当具备输入文字的功能,包括实体键盘、虚拟键盘中的任意一种。
请参阅附图3,为本申请实施例的第二应用场景示意图,该应用环境包括用于存储和运行文字交互系统的服务端及多个用户端(如附图2所示的用户A、用户B及用户C),本申请实施例的第二应用场景示意图与第一应用场景示意图的不同之处在于:服务端为云端服务器。第二应用场景中服务端的各个功能单元以软件功能模块形式存在,用户端可以为手机、台式计算机、平板电脑、笔记本电脑、智能手表中等具备通信功能的电子设备中的任意一种,通常用户端应当具备输入文字的功能,包括实体键盘、虚拟键盘中的任意一种。
用户端与服务端之间通过网络连接,该网络连接可以是通过有线网络连接,也可以是无线网络连接,当用户端与服务端之间采用有线网络连接时,用户端、服务端应当具备有线网络接口,包括RJ-45接口、SC光纤接口、FDDI接口、Console接口等有线网络接口中的任意一种。
当采用无线网络连接时,用户端、服务端均集成有无线通信模组用于信息的发送和接收。具体地,无线通信模组将基站的下行信息接收后,给用户端、服务端的处理器处理;另外,将上行的数据发送给基站。通常,无线通信模组可以是4G通信模组、5G通信模组、NBIOT通信模组等蜂窝类通信模组中的任意一种,更具体地, 4G通信模组、5G通信模组、NBIOT通信模组都集成射频收发器、射频前端和天线单元,其中,4G通信模组还具有4G调制调解器,支持FDD LTE(频双分工)、TD-LTE(时双分工)两种网络制式,向下兼容2G/3G,支持TD-SCDMA(Time Division - Synchronous Code Division Multiple Access,时分-同步码分多址)/WCDMA(Wideband Code Division Multiple Access,宽带码分多址)/ EDGE(Enhanced Data Rate for GSM Evolution,增强型数据速率GSM演进技术)/GPRS(GeneralPacket Radio Service,通用分组无线服务技术)/GSM(Global System for MobileCommunications,全球移动通信系统)/CDMA1X(CDMA Multi-Carrier,cdma2000的第一阶段)模式,5G通信模组具有5G调制调解器,5G通信模组使用3GPP R15 5GNR协议,NBIOT通信模组一般部署于GSM(Global System for Mobile Communications,全球移动通信系统)、UMTS(Universal Mobile Telecommunications System,通用移动通信系统)、LTE(LongTerm Evolution,长期演进)网络中。
步骤S102,所述文字段通过分词获得词语组,词语组与词包库匹配获得文字段关键词组;
针对步骤S102而言:
一般性地,用户端输入文字段的格式包括unicode、GBK、UTF-8中的任意一种字符串格式,服务端接收用户端输入的字符串后对文字段基于字符串匹配进行分词,服务端将用户端输入的字符串进行分隔,分隔后的子字符串与词典中的词条进行匹配,当子字符串与词条相同时匹配成功,进行下一个子字符串的匹配,若子字符串未匹配成功,则将子字符串从该子字符串的末尾去除一个字,再进行匹配,直到匹配成功或子字符串字数为0进行下一个子字符串匹配。基于字符串匹配的分词方法包括正向最大匹配法、逆向最大匹配法、双向最大匹配法,以下以分词准确度较高的逆向最大匹配法详述:
预设值最大匹配长度为3,用户端输入“我比较在意周边的环境”,
的环境
环境:逆向第一个词与词条匹配成功;
周边的
的:逆向第二个词与词条匹配成功;
意周边
周边:逆向第三个词与词条匹配成功;
较在意
在意:逆向第四个词与词条匹配成功;
我比较
比较:逆向第五个词与词条匹配成功;
我:逆向第六个词与词条匹配成功。
用户端输入“我比较在意周边的环境”通过逆向最大匹配法分词后获得的词语组为“我”、“比较”、“在意”、“周边”、“的”、“环境”,也可以通过正向最大匹配法或双向最大匹配法对用户端输入的文字段进行分词处理,此外,也不排除使用基于统计以及机器学习的分词方式进行文字段的分词处理,包括建立统计语言模型,例如N元文法模型(N-gram)、隐马尔可夫模型(Hidden Markov Model ,HMM)、最大熵模型(ME)、条件随机场模型(Conditional Random Fields,CRF)等,对文字段进行单词划分,然后对划分结果做概率计算,获取概率最大的分词方式,相比于基于字符串匹配的分词方法,基于统计以及机器学习的分词方式分词效果较好,但分词速度较慢、需要大量标注数据,本领域技术人员应当知晓,本申请实施例中服务端接收的文字段亦可以通过基于统计以及机器学习的分词方式进行分词处理以获得词语组。
如本申请实施例中步骤S102所示,用户端输入的文字段经服务端分词后获得的词语组与词包库匹配获得文字段关键词组,词包库为预先设置的关键词数据库,文字段分词后获得的词语组与词包库中的关键词进行匹配,从而获得用户端输入的文字段中所包括的文字段关键词组。
具体地,词语组中的词语按照获得的词语顺序一一与词包库中的关键词匹配,以用户端输入“我比较在意周边的环境”文字段为例,当词包库中含有“周边”、“环境”这两组关键词时,“周边”、“环境”两个词语均被标记为文字段关键词,按照获得的词语顺序组成该文字段关键词组【周边 环境】;当词包库中含有“在意”、“周边”、“环境”三组关键词时,“在意”、“周边”、“环境”三个词语均被标记为文字段关键词,按照获得的词语顺序组成该文字段关键词组【在意 周边 环境】,根据词包库中的关键词数据不同,词语组与词包库匹配获得的文字段关键词组也有所差别,也有可能出现词语组未能与词包库匹配成功的情形,并不局限于本申请实施例所述情形之中。
步骤S103,所述文字段关键词组与设置有场景关键词组的场景节点匹配,根据所述文字段关键词组与所述场景关键词组的匹配程度选择匹配程度高的场景节点,向用户端发送所述匹配程度高的场景节点中的回复文字段。
针对步骤S103而言:
场景节点输出回复文字段,场景节点包括场景关键词组和相对应的回复文字段,场景关键词组用于标记场景节点,文字段关键词组与场景关键词组进行匹配,具体地:
根据词语顺序提取所述文字段关键词组中的文字段关键词并按照语句顺序标记;
所述文字段关键词按照标记顺序与每个场景节点的场景关键词组匹配,所述文字段关键词与所述场景关键词组中的场景关键词相同所述场景节点匹配度增加。
以上述用户端输入“我比较在意周边的环境”文字段、提取的文字段关键词组【在意 周边 环境】为例,根据文字段关键词组的关键词词语顺序,将“在意”标记为第一文字段关键词、“周边”标记为第二文字段关键词、“环境”标记为第三文字段关键词,按照文字段关键词的标记顺序与场景关键词组进行匹配,每一个场景节点的场景关键词组均不相同,例如场景节点1的场景关键词组为【周边 环境 绿化 河】、回复文字段为“周边环境优美,绿化面积较高,小区内有河流通过”,第一文字段关键词与场景节点1的场景关键词组进行匹配,场景节点1的场景关键词组不包括第一文字段关键词“在意”,第一文字段关键词匹配失败,当前场景节点1匹配度为0,第二文字段关键词与场景节点1的场景关键词组进行匹配,场景节点1的场景关键词组包括第二文字段关键词“周边”,第二文字段关键词匹配成功,当前场景节点1匹配度为1,第三文字段关键词与场景节点1的场景关键词组进行匹配,场景节点1的场景关键词组包括第三文字段关键词“环境”,第三文字段关键词匹配成功,则场景节点1的最终匹配度为2;场景节点2的场景关键词组为【周边 购物 综合体 地铁】、回复文字段为“周边购物方便,不仅有综合体,而且距离地铁很近”,第一文字段关键词与场景节点2的场景关键词组进行匹配,场景节点2的场景关键词组不包括第一文字段关键词“在意”,第一文字段关键词匹配失败,当前场景节点2匹配度为0,第二文字段关键词与场景节点2的场景关键词组进行匹配,场景节点2的场景关键词组包括第二文字段关键词“周边”,第二文字段关键词匹配成功,当前场景节点2匹配度为1,第三文字段关键词与场景节点2的场景关键词组进行匹配,场景节点2的场景关键词组不包括第三文字段关键词“环境”,第三文字段关键词匹配失败,则场景节点2的最终匹配度为1。当所有的场景节点均匹配完毕后,选择匹配度最高的场景节点的回复文字段进行输出,本申请实施例中选择输出的回复文字段为“周边环境优美,绿化面积较高,小区内有河流通过”。
除此之外,当存在多个匹配度相同的场景节点时,优先选择在前的文字段关键词匹配成功的文字段关键词组,例如多个场景的匹配度均为3时,场景节点1分别与第一、第三、第四文字段关键词匹配成功,场景节点2分别与第二、第三、第四文字段关键词匹配成功,场景节点3分别与第三、第四、第五文字段关键词匹配成功,优先选择场景节点1作为回复文字段输出;或者场景节点4分别与第一、第二、第五文字段关键词匹配成功,此时在场景节点1与场景节点4中优先选择第二文字段关键词匹配成功的场景节点4作为回复文字段输出;又或者场景节点5亦分别与第一、第二、第五文字段关键词匹配成功,此时在场景节点4与场景节点5中优先选择场景节点次序在前的场景节点4作为回复文字段输出。
当用户端输入的文字段为多个时,服务端按照文字段顺序将多个文字段进行分词,获得多个文字段的多个词语组,将所述多个词语组与词包库匹配获得多个文字段关键字组,所述多个文字段关键词组按照文字段顺序与场景节点匹配输出多个回复文字段。
可选地,所述输出多个回复文字段,可以包括如下方式中的至少一种:
1、分行输出所述多个回复文字段,所述多个回复文字段之间通过文本框隔开;
2、同时输出所述多个回复文字段,所述多个回复文字段位于同一文本框中。
第二方面,本申请实施例还提供一种服务端设备40,用于执行如附图1所示的文字交互方法,如附图4所示,包括:
接收单元401,用于接收用户端输入的至少一文字段;
分词单元402,用于将用户端输入的所述文字段进行分词得到词语组;
词包库单元406,用于存储调用词包库;
第一匹配单元403,用于将所述词语组与词包库匹配获得文字段关键词组;
场景节点单元407,用于存储调用场景节点;
第二匹配单元404,用于将所述文字段关键词组与设置有场景关键词组的场景节点匹配获得匹配程度高的场景节点;
输出单元405,用于输出所述匹配程度高的场景节点中的回复文字段。
一实施例中,如附图5所示,该服务端设备40还包括:显示单元408,所述显示单元408用于显示接收单元401接收的文字段和输出单元405输出的回复文字段,所述文字段和回复文字段根据输入输出次序显示于所述显示单元408上。
一实施例中,如附图6所示,该服务端设备40还包括:语音识别单元409,所述语音识别单元409用于识别用户端输入的语音信息,从而使得用户能够在用户端直接输入语音信息而不用手动输入文字段,服务端接收用户端输入的语音信息段,语音识别单元409对语音信息段进行分析识别,此时用户端具备语音采集功能,包括麦克风、麦克风阵列、声音传感器等。
具体地说,接收单元401接收用户端输入的语音信息段,如附图8所示语音识别单元409包括特征提取单元4091、模式匹配单元4092和模式库单元4093,特征提取单元4091提取语音信息段中的特征信息,包括MFCC(Mel-scale Frequency CepstralCoefficients,梅尔频率倒谱系数)、PLP(Perceptual Linear Predict ive,感知线性预测)、BN(Bottleneck)特征中任意一种特征信息,以下以特征提取单元4091提取语音信息段中的MFCC特征为例,进行详细说明:
201、特征提取单元对语音信息段进行预加重、分帧和加窗;
202、对每一个获得的短时分析窗,通过傅里叶变换得到对应的频谱;
203、对每一个对应的频谱通过Mel滤波器组获得Mel频谱;
204、对Mel频谱进行倒谱分析,获得Mel频率倒谱系数MFCC。
所述的MFCC就是这一帧语音的特征,将所有帧段提取的MFCC特征通过离散余弦变换获得一系列的倒谱向量,语音信息段即通过一系列的倒谱向量进行描述,每一个倒谱向量为每一帧语音信息的MFCC特征向量。
模式匹配单元4092根据语音信息段的MFCC特征向量与模式库单元4093中的预存入的模型匹配,匹配的方法包括动态时间规整(DTW)、高斯混合模型(GMM)、人工神经网络(ANN)、离散小波变换(DWT)等中的任意一种,具体在本申请实施例中不再赘述。
基于服务端设备具有语音识别功能,本申请还提供如附图7所示应用于服务端的文字交互方法,包括:
步骤S301:接收用户端输入的至少一语音信息段;
步骤S302:服务端将所述语音信息段识别为对应的文字段;
步骤S303:将所述文字段通过分词获得词语组,词语组与词包库匹配获得文字段关键词组;
步骤S304:所述文字段关键词组与设置有场景关键词组的场景节点匹配,根据所述文字段关键词组与所述场景关键词组的匹配程度选择匹配程度高的场景节点,向用户端发送所述匹配程度高的场景节点中的回复文字段。
此外,本申请实施例中的各单元部分可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能模块的功能实现。
所述集成的单元如果以软件功能模块的形式实现而非作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中,基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出实质性贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器或其它包括处理器的设备执行本申请实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器、随机存取存储器、磁碟或者光盘等各种可以存储程序代码的介质。
因此,本申请实施例提供了一种计算机可读介质,该计算机可读介质存储有文字交互程序,所述文字交互程序被至少一个处理器执行实现上述实施例第一方面所述的方法的步骤。
基于上述服务端设备以及计算机可读介质,请参阅附图9,其示出了本发明实施例提供的服务端设备的具体硬件结构,可以包括:至少一个网络接口502、存储器503和至少一个处理器501。服务端中的各个组件通过总线系统504耦合在一起。可以理解,总线系统504用于实现这些组件之间的连接通信。总线系统504除包括数据总线之外,还包括电源总线、控制总线和状态信号总线,但是为了清楚说明起见,在附图9中将各种总线都标为总线系统504。
可以理解,本申请实施例中的存储器503可以易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-Only Memory,R0M)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PR0M,EPR0M)、电可擦除可编程只读存储器 (Electrically EPR0M,EEPR0M)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态 随机存取存储器(Double Data RateSDRAM,DDRSDRAM)、增强型同步动态随机存取存储器 (Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(DirectRambus RAM,DRRAM)。本申请实施例描述的系统和方法的存储器503旨在包括但不限于这些和任意其它适合类型的存储器。
而处理器501可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器501中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器501可以是通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用 集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器503,处理器501读取存储器503中的信息,结合其硬件完成上述方法的步骤。
在一些实施方式中,存储器503存储了如下的元素,可执行模块或者数据结构,或者他们的子集,或者他们的扩展集:操作系统5031和应用程序5032。
其中,操作系统5031,包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种寄出业务以及处理基于硬件的任务。应用程序5032,包含各种应用程序,例如媒体播放器(Media Player)、浏览器(Browser)等,用于实现各种应用业务。实现本申请实施例方法的程序可以包含在应用程序中。
在本申请实施例中,服务端设备还包括:存储在存储器503上并可在处理器501上运行的计算机程序,计算机程序被处理器执行实现如下的步骤:
接收用户端输入的至少一文字段;
所述文字段通过分词获得词语组,所述词语组与词包库匹配获得文字段关键词组;
所述文字段关键词组与设置有场景关键词组的场景节点匹配,根据所述文字段关键词组与所述场景关键词组的匹配程度选择匹配程度高的场景节点,输出所述匹配程度高的场景节点中的回复文字段。
可选地,所述计算机程序被所述处理器执行根据所述用户端输入的所述文字段确定输出所述匹配程度高的场景节点中的回复文字段,具体实现如下步骤
可选地,当所述文字段为多个时,所述多个文字段之间相互隔开,所述多个文字段匹配多个场景节点输出多个回复文字段。
可选地,所述词语组与词包库匹配获得文字段关键词组,包括:
所述词语组中的词语按照顺序与词包库中预先设置的关键词匹配;
所述词语与所述词包库中预先设置的关键词匹配成功则标记所述词语为文字段关键词,所述文字段关键词按照顺序组成文字段关键词组。
可选地,所述文字段关键词组与设置有场景关键词组的场景节点匹配,包括:
根据词语顺序提取所述文字段关键词组中的文字段关键词并按照语句顺序标记;
所述文字段关键词按照标记顺序与每个场景节点的场景关键词组匹配,所述文字段关键词与所述场景关键词组中的场景关键词相同所述场景节点匹配度增加。
可选地,当输出所述匹配程度高的场景节点中的回复文字段为多个时,包括:
分行输出所述多个回复文字段,所述多个回复文字段之间通过文本框隔开,或同时输出所述多个回复文字段,所述多个回复文字段位于同一文本框中。
此外,所述计算机可读介质被至少一个处理器执行时实现如下步骤:
接收用户端输入的至少一文字段;
所述文字段通过分词获得词语组,所述词语组与词包库匹配获得文字段关键词组;
所述文字段关键词组与设置有场景关键词组的场景节点匹配,根据所述文字段关键词组与所述场景关键词组的匹配程度选择匹配程度高的场景节点,输出所述匹配程度高的场景节点中的回复文字段。
可选地,所述计算机程序被所述处理器执行根据所述用户端输入的所述文字段确定输出所述匹配程度高的场景节点中的回复文字段,具体实现如下步骤
可选地,当所述文字段为多个时,所述多个文字段之间相互隔开,所述多个文字段匹配多个场景节点输出多个回复文字段。
可选地,所述词语组与词包库匹配获得文字段关键词组,包括:
所述词语组中的词语按照顺序与词包库中预先设置的关键词匹配;
所述词语与所述词包库中预先设置的关键词匹配成功则标记所述词语为文字段关键词,所述文字段关键词按照顺序组成文字段关键词组。
可选地,所述文字段关键词组与设置有场景关键词组的场景节点匹配,包括:
根据词语顺序提取所述文字段关键词组中的文字段关键词并按照语句顺序标记;
所述文字段关键词按照标记顺序与每个场景节点的场景关键词组匹配,所述文字段关键词与所述场景关键词组中的场景关键词相同所述场景节点匹配度增加。
可选地,当输出所述匹配程度高的场景节点中的回复文字段为多个时,包括:
分行输出所述多个回复文字段,所述多个回复文字段之间通过文本框隔开,或同时输出所述多个回复文字段,所述多个回复文字段位于同一文本框中。
本领域技术人员应当明白,本申请实施例可提供为方法、系统或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
上面结合附图对本发明的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,这些均属于本申请的保护范围之内。

Claims (9)

1.一种文字交互方法,其特征是,所述方法应用于服务端,所述方法包括:
接收用户端输入的至少一文字段;
所述文字段通过分词获得词语组,所述词语组与词包库匹配获得文字段关键词组;
所述文字段关键词组与设置有场景关键词组的场景节点匹配,根据所述文字段关键词组与所述场景关键词组的匹配程度选择匹配程度高的场景节点,向用户端发送所述匹配程度高的场景节点中的回复文字段。
2.根据权利要求1所述的一种文字交互方法,其特征是,还包括:
当所述文字段为多个时,所述多个文字段之间相互隔开,所述多个文字段匹配多个场景节点输出多个回复文字段。
3.根据权利要求1所述的一种文字交互方法,其特征是,所述词语组与词包库匹配获得文字段关键词组,包括:
所述词语组中的词语按照顺序与词包库中预先设置的关键词匹配;
所述词语与所述词包库中预先设置的关键词匹配成功则标记所述词语为文字段关键词,所述文字段关键词按照顺序组成文字段关键词组。
4.根据权利要求1所述的一种文字交互方法,其特征是,所述文字段关键词组与设置有场景关键词组的场景节点匹配,包括:
根据词语顺序提取所述文字段关键词组中的文字段关键词并按照语句顺序标记;
所述文字段关键词按照标记顺序与每个场景节点的场景关键词组匹配,所述文字段关键词与所述场景关键词组中的场景关键词相同所述场景节点匹配度增加。
5.根据权利要求2所述的一种文字交互方法,其特征是,所述输出多个回复文字段包括:
分行输出所述多个回复文字段,所述多个回复文字段之间通过文本框隔开,或同时输出所述多个回复文字段,所述多个回复文字段位于同一文本框中。
6.一种服务端设备,其特征是,包括:
接收单元,用于接收用户端输入的至少一文字段;
分词单元,用于将用户端输入的所述文字段进行分词得到词语组;
词包库单元,用于存储调用词包库;
第一匹配单元,用于将所述词语组与词包库匹配获得文字段关键词组;
场景节点单元,用于存储调用场景节点;
第二匹配单元,用于将所述文字段关键词组与设置有场景关键词组的场景节点匹配获得匹配程度高的场景节点;
输出单元,用于输出所述匹配程度高的场景节点中的回复文字段。
7.根据权利要求7所述的一种文字交互系统,其特征是,还包括显示单元,所述显示单元用于显示接收单元接收的文字段和输出单元输出的回复文字段,所述文字段和回复文字段根据输入输出次序显示于所述显示单元上。
8.一种服务端设备,其特征是,包括:存储器、处理器及存储在所述存储器上并在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1-6任一项所述的方法的步骤。
9.一种计算机可读存储介质,其特征是,所述计算机可读存储介质上存储有文字交互程序,所述文字交互程序被处理器执行时实现如权利要求1-6任一项所述的文字交互方法的步骤。
CN201910854445.9A 2019-09-10 2019-09-10 一种文字交互方法及服务端设备 Pending CN110674634A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910854445.9A CN110674634A (zh) 2019-09-10 2019-09-10 一种文字交互方法及服务端设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910854445.9A CN110674634A (zh) 2019-09-10 2019-09-10 一种文字交互方法及服务端设备

Publications (1)

Publication Number Publication Date
CN110674634A true CN110674634A (zh) 2020-01-10

Family

ID=69077587

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910854445.9A Pending CN110674634A (zh) 2019-09-10 2019-09-10 一种文字交互方法及服务端设备

Country Status (1)

Country Link
CN (1) CN110674634A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112559865A (zh) * 2020-12-15 2021-03-26 泰康保险集团股份有限公司 信息处理系统、计算机可读存储介质及电子设备
WO2022012579A1 (zh) * 2020-07-14 2022-01-20 维沃移动通信有限公司 消息显示方法、装置和电子设备
CN117131183A (zh) * 2023-10-26 2023-11-28 南通贝瑞斯曼信息科技有限公司 一种基于会话模拟的客服自动回复方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107818781A (zh) * 2017-09-11 2018-03-20 远光软件股份有限公司 智能交互方法、设备及存储介质
CN109871527A (zh) * 2017-12-01 2019-06-11 武汉楚鼎信息技术有限公司 一种基于分词的语义识别方法
CN110020411A (zh) * 2019-03-29 2019-07-16 上海掌门科技有限公司 图文内容生成方法及设备
CN110053055A (zh) * 2019-03-04 2019-07-26 平安科技(深圳)有限公司 一种机器人及其回答问题的方法、存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107818781A (zh) * 2017-09-11 2018-03-20 远光软件股份有限公司 智能交互方法、设备及存储介质
CN109871527A (zh) * 2017-12-01 2019-06-11 武汉楚鼎信息技术有限公司 一种基于分词的语义识别方法
CN110053055A (zh) * 2019-03-04 2019-07-26 平安科技(深圳)有限公司 一种机器人及其回答问题的方法、存储介质
CN110020411A (zh) * 2019-03-29 2019-07-16 上海掌门科技有限公司 图文内容生成方法及设备

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022012579A1 (zh) * 2020-07-14 2022-01-20 维沃移动通信有限公司 消息显示方法、装置和电子设备
CN112559865A (zh) * 2020-12-15 2021-03-26 泰康保险集团股份有限公司 信息处理系统、计算机可读存储介质及电子设备
CN112559865B (zh) * 2020-12-15 2023-12-08 泰康保险集团股份有限公司 信息处理系统、计算机可读存储介质及电子设备
CN117131183A (zh) * 2023-10-26 2023-11-28 南通贝瑞斯曼信息科技有限公司 一种基于会话模拟的客服自动回复方法及系统
CN117131183B (zh) * 2023-10-26 2024-01-26 南通贝瑞斯曼信息科技有限公司 一种基于会话模拟的客服自动回复方法及系统

Similar Documents

Publication Publication Date Title
CN109272988B (zh) 基于多路卷积神经网络的语音识别方法
KR102413692B1 (ko) 음성 인식을 위한 음향 점수 계산 장치 및 방법, 음성 인식 장치 및 방법, 전자 장치
KR102423302B1 (ko) 음성 인식에서의 음향 점수 계산 장치 및 방법과, 음향 모델 학습 장치 및 방법
US7788098B2 (en) Predicting tone pattern information for textual information used in telecommunication systems
CN110797002B (zh) 语音合成方法、装置、电子设备及存储介质
US20140088964A1 (en) Exemplar-Based Latent Perceptual Modeling for Automatic Speech Recognition
CN108428446A (zh) 语音识别方法和装置
CN110674634A (zh) 一种文字交互方法及服务端设备
KR20170034227A (ko) 음성 인식 장치 및 방법과, 음성 인식을 위한 변환 파라미터 학습 장치 및 방법
CN110277088B (zh) 智能语音识别方法、装置及计算机可读存储介质
WO2021147041A1 (zh) 语义分析方法、装置、设备及存储介质
CN110910903B (zh) 语音情绪识别方法、装置、设备及计算机可读存储介质
US20220115002A1 (en) Speech recognition method, speech recognition device, and electronic equipment
CN112786007A (zh) 语音合成方法、装置、可读介质及电子设备
CN112562640B (zh) 多语言语音识别方法、装置、系统及计算机可读存储介质
CN111833845A (zh) 多语种语音识别模型训练方法、装置、设备及存储介质
CN111261141A (zh) 一种语音识别方法以及语音识别装置
CN112786008A (zh) 语音合成方法、装置、可读介质及电子设备
CN113724718B (zh) 目标音频的输出方法及装置、系统
KR102192678B1 (ko) 음향 모델 입력 데이터의 정규화 장치 및 방법과, 음성 인식 장치
CN112201275A (zh) 声纹分割方法、装置、设备及可读存储介质
CN116343747A (zh) 语音合成方法、语音合成装置、电子设备及存储介质
CN114495905A (zh) 语音识别方法、装置及存储介质
CN112133292A (zh) 一种针对民航陆空通话领域的端到端的自动语音识别方法
CN111508466A (zh) 一种文本处理方法、装置、设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200110

WD01 Invention patent application deemed withdrawn after publication