CN107423363B - 基于人工智能的话术生成方法、装置、设备及存储介质 - Google Patents

基于人工智能的话术生成方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN107423363B
CN107423363B CN201710480310.1A CN201710480310A CN107423363B CN 107423363 B CN107423363 B CN 107423363B CN 201710480310 A CN201710480310 A CN 201710480310A CN 107423363 B CN107423363 B CN 107423363B
Authority
CN
China
Prior art keywords
candidate
dialect
template
broadcasted
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710480310.1A
Other languages
English (en)
Other versions
CN107423363A (zh
Inventor
何荞至
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201710480310.1A priority Critical patent/CN107423363B/zh
Publication of CN107423363A publication Critical patent/CN107423363A/zh
Priority to US15/991,417 priority patent/US10755148B2/en
Application granted granted Critical
Publication of CN107423363B publication Critical patent/CN107423363B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • G06F16/322Trees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Software Systems (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了基于人工智能的话术生成方法、装置、设备及存储介质,其中方法包括:生成话术森林,采用一棵多叉树的数据结构,多叉树中至少包括三层节点,按照从上到下的顺序依次为根节点、领域节点和角色节点,每个叶子节点分别对应于与该叶子节点所在路径上的信息相对应的至少一个话术模板;获取用户问题,根据用户问题对话术森林进行搜索,得到用户问题对应的叶子节点,并将得到的叶子节点对应的话术模板作为候选话术模板;根据用户问题以及候选话术模板生成待播报的话术,并播报给用户。本发明所述方案具有广泛适用性,并能够提升话术播报效果等。

Description

基于人工智能的话术生成方法、装置、设备及存储介质
【技术领域】
本发明涉及计算机应用技术,特别涉及基于人工智能的话术生成方法、装置、设备及存储介质。
【背景技术】
人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。
随着技术的发展,人机对话产品的应用越来越广泛,而目前主要的人机对话产品中,通常都按照领域进行了划分,即一个产品对应于一个领域。
另外,目前的人机对话产品中,在针对用户问题播报应答的话术时,通常都只有一个角色。
也就是说,现有的人机对话产品,主要采用单领域、单角色的实现方式,从而导致产品的适用性较差,仅适用于单一的领域,且话术播报效果不佳。
【发明内容】
有鉴于此,本发明提供了基于人工智能的话术生成方法、装置、设备及存储介质,具有广泛适用性并能够提升话术播报效果。
具体技术方案如下:
一种基于人工智能的话术生成方法,包括:
生成话术森林,所述话术森林采用一棵多叉树的数据结构,所述多叉树中至少包括三层节点,按照从上到下的顺序依次为根节点、领域节点和角色节点,每个叶子节点分别对应于与所述叶子节点所在路径上的信息相对应的至少一个话术模板;
获取用户问题,根据所述用户问题对所述话术森林进行搜索,得到所述用户问题对应的叶子节点;
将得到的叶子节点对应的话术模板作为候选话术模板;
根据所述用户问题以及所述候选话术模板生成待播报的话术,并播报给用户。
根据本发明一优选实施例,所述根据所述用户问题对所述话术森林进行搜索,得到所述用户问题对应的叶子节点包括:
获取所述用户问题的语义解析结果,所述语义解析结果中至少包括:领域以及角色信息;
按照所述语义解析结果对所述话术森林进行搜索,得到与所述语义解析结果相匹配的叶子节点。
根据本发明一优选实施例,所述根据所述用户问题以及所述候选话术模板生成待播报的话术包括:
根据所述用户问题,分别对每个候选话术模板进行槽位替换,得到候选话术;
从所述候选话术中去除不符合要求的候选话术;
从剩余的候选话术中选出一个作为所述待播报的话术。
根据本发明一优选实施例,所述分别对每个候选话术模板进行槽位替换包括:
获取所述用户问题的内容查询结果;
针对每个候选话术模板,分别根据所述内容查询结果对所述候选话术模板中的第一类槽位进行替换,并根据预先设定的候选替换集,对所述候选话术模板中的第二类槽位进行替换。
根据本发明一优选实施例,所述从所述候选话术中去除不符合要求的候选话术包括:
从所述候选话术中去除包含未被替换的第一类槽位的候选话术;
所述从剩余的候选话术中选出一个作为所述待播报的话术包括:
从剩余的候选话术中随机选出一个作为所述待播报的话术。
根据本发明一优选实施例,所述从剩余的候选话术中选出一个作为所述待播报的话术之后,进一步包括:
针对所述待播报的话术中的每个词,分别确定所述词是否位于预先生成的词库中;
若是,则按照所述词库中定义的所述词的播报方式信息,为所述词打上标签;
将打上标签后的话术作为所述待播报的话术。
一种基于人工智能的话术生成装置,包括:预处理单元、搜索单元以及生成单元;
所述预处理单元,用于生成话术森林,所述话术森林采用一棵多叉树的数据结构,所述多叉树中至少包括三层节点,按照从上到下的顺序依次为根节点、领域节点和角色节点,每个叶子节点分别对应于与所述叶子节点所在路径上的信息相对应的至少一个话术模板;
所述搜索单元,用于获取用户问题,根据所述用户问题对所述话术森林进行搜索,得到所述用户问题对应的叶子节点,并将得到的叶子节点对应的话术模板作为候选话术模板;
所述生成单元,用于根据所述用户问题以及所述候选话术模板生成待播报的话术,并播报给用户。
根据本发明一优选实施例,所述搜索单元获取所述用户问题的语义解析结果,所述语义解析结果中至少包括:领域以及角色信息,按照所述语义解析结果对所述话术森林进行搜索,得到与所述语义解析结果相匹配的叶子节点。
根据本发明一优选实施例,所述生成单元中包括:替换子单元、筛选子单元以及播报子单元;
所述替换子单元,用于根据所述用户问题,分别对每个候选话术模板进行槽位替换,得到候选话术;
所述筛选子单元,用于从所述候选话术中去除不符合要求的候选话术,并从剩余的候选话术中选出一个作为所述待播报的话术;
所述播报子单元,用于将所述待播报的话术播报给用户。
根据本发明一优选实施例,所述替换子单元获取所述用户问题的内容查询结果,针对每个候选话术模板,分别根据所述内容查询结果对所述候选话术模板中的第一类槽位进行替换,并根据预先设定的候选替换集,对所述候选话术模板中的第二类槽位进行替换。
根据本发明一优选实施例,所述筛选子单元从所述候选话术中去除包含未被替换的第一类槽位的候选话术,并从剩余的候选话术中随机选出一个作为所述待播报的话术。
根据本发明一优选实施例,所述生成单元中进一步包括:打标子单元;
所述打标子单元,用于针对所述待播报的话术中的每个词,分别确定所述词是否位于预先生成的词库中,若是,则按照所述词库中定义的所述词的播报方式信息,为所述词打上标签,将打上标签后的话术作为所述待播报的话术。
一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现如以上所述的方法。
一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如以上所述的方法。
基于上述介绍可以看出,采用本发明所述方案,可预先生成采用一棵多叉树的数据结构的话术森林,该多叉树中至少包括三层节点,按照从上到下的顺序分别为根节点、领域节点和角色节点,每个叶子节点分别对应于与该叶子节点所在路径上的信息相对应的至少一个话术模板,这样,当获取到用户问题后,可首先根据用户问题对话术森林进行搜索,从而得到用户问题对应的叶子节点,进而将得到的叶子节点对应的话术模板作为候选话术模板,并根据用户问题以及候选话术模板生成待播报的话术,播报给用户,相比于现有技术,本发明所述方案中可实现多领域多角色的话术生成,即可同时适用于各不同的领域,从而具有广泛适用性,而且可采用不同的角色进行话术播报,从而提升了话术播报效果。
【附图说明】
图1为本发明所述话术生成方法第一实施例的流程图。
图2为本发明所述多叉树的结构示意图。
图3为本发明所述话术模板样例示意图。
图4为本发明所述话术生成方法第二实施例的流程图。
图5本发明所述话术生成装置实施例的组成结构示意图。
图6示出了适于用来实现本发明实施方式的示例性计算机系统/服务器12的框图。
【具体实施方式】
为了使本发明的技术方案更加清楚、明白,以下参照附图并举实施例,对本发明所述方案进行进一步说明。
显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
图1为本发明所述话术生成方法第一实施例的流程图,如图1所示,包括以下具体实现方式。
在101中,生成话术森林,采用一棵多叉树的数据结构,多叉树中至少包括三层节点,按照从上到下的顺序依次为根节点、领域节点和角色节点,每个叶子节点分别对应于与该叶子节点所在路径上的信息相对应的至少一个话术模板。
为实现本实施例所述方案,需要首先生成话术森林,采用一棵多叉树的数据结构,该数据结构中的不同分支对应不同的内容。
图2为本发明所述多叉树的结构示意图,如图2所示,该多叉树中包括三层节点,最上面的为根(Root)节点,根节点的下一层节点为领域(Domain)节点,领域节点的下一层节点为角色(Role)节点。
以上仅以多叉树中包括三层节点为例进行说明,并不用于限制本发明的技术方案,在实际应用中,多叉树中还可以包括更多层节点,比如,角色节点的下一层节点可为意图(Intent)节点,意图节点的下一层节点可为语气(Mood)节点等,具体包括多少层节点可根据实际需要而定。
上述领域可以包括音乐(music)及天气(weather)等,角色可以包括邻家小妹(调皮可爱的女性虚拟角色)和霸道总裁(冷酷简单的男性虚拟角色)等,对于music领域来说,其意图可包括播放、播放控制等,对于weather领域来说,其意图可包括查天气、查气温等。
多叉树中具体包括哪些领域、每个领域下可分别对应哪些角色,以及每个角色下可分别对应哪些意图等均可根据实际需要而定,如可根据产品、项目或业务需要设定。
而且,多叉树在生成之后,还可根据实际需要随时进行更新,如增加新的领域、增加新的角色等。
另外,多叉树中的每个叶子节点分别对应于与该叶子节点所在路径上的信息相对应的至少一个话术模板。
图3为本发明所述话术模板样例示意图,每个话术模板分别与对应的叶子节点所在的路径上的信息相匹配,即与对应的叶子节点所在路径上的领域及角色等相匹配。
在102中,获取用户问题,根据用户问题对话术森林进行搜索,得到用户问题对应的叶子节点。
在人机交互产品中,用户会以语音的形式同机器进行交互,对于获取到的语音形式的用户问题,需要首先通过语音识别技术等,将其转换为文本形式的用户问题,本发明中所述的用户问题均指文本形式的用户问题。
针对获取到的用户问题,可首先按照现有技术获取其语义解析结果,语义解析结果中至少包括:领域以及角色信息。其中,领域即指用户问题所属的领域,角色即指用户问题中指定的角色,如果用户未指定,可采用默认的角色,除领域和角色信息外,语义解析结果中还可进一步包括意图等信息,具体包括哪些信息可根据实际需要而定。
之后,可按照语义解析结果对话术森林进行搜索,从而得到与语义解析结果相匹配的叶子节点。
以如图2所示话术森林为例,在得到语义解析结果之后,可首先根据语义解析结果中的领域信息对多叉树中的第二层节点进行查找,假设查找到Domain1,之后,根据语义解析结果中的角色信息对Domain1的下一层节点进行查找,假设查找到Role2,那么Role2即为与语义解析结果相匹配的叶子节点。
在103中,将得到的叶子节点对应的话术模板作为候选话术模板。
如前所述,每个叶子节点分别对应至少一个话术模板,通常为多个,那么在得到与语义解析结果相匹配的叶子节点之后,可将该叶子节点对应的话术模板确定为候选话术模板。
在104中,根据用户问题以及候选话术模板生成待播报的话术,并播报给用户。
为生成待播报的话术,首先,可根据用户问题,分别对每个候选话术模板进行槽位(slot)替换,从而得到候选话术。
具体地,可获取用户问题的内容查询结果,内容查询结果即指根据用户需求得到的内容信息,以music领域为例,当用户需求为“播放一首刘德华的歌”时,内容查询结果可包括:歌手-刘德华、歌曲名-忘情水、所属专辑等。
这样,针对每个候选话术模板,可分别根据内容查询结果等对候选话术模板中的第一类槽位进行替换,并根据预先设定的候选替换集,对候选话术模板中的第二类槽位进行替换。
假设得到的候选话术模板为“首语气词#0.6邻家小妹播放#0.8@byartist的@name”和“首语气词#0.6邻家小妹播放#0.8@name”。
在以上两个候选话术模板中,“@byartist”和“@name”为第一类槽位,会分别为替换为“刘德华”和“忘情水”,可见,第一类槽位即指和用户需求直接相关的槽位。
在实际应用中,除了可根据内容查询结果对第一类槽位进行替换之外,还可能会用到其它信息,如语义解析结果等,视实际情况而定。
在以上的两个候选话术模板中,“首语气词”和“邻家小妹播放”为第二类槽位,后面的数字表示会以一定概率出现,如“首语气词”以60%的概率出现,“邻家小妹播放”以80%的概率出现,另外,也可以没有数字,那么则表示会以100%的概率出现,即一定会出现。
对于“首语气词”来说,如果其出现的话,那么可从预先设定/生成的、“首语气词”对应的候选替换集中随机选出一个,利用选出的替换内容对“首语气词”进行替换,对应的候选替换集可为{嗯嗯、啦啦啦、太棒啦}等。
对于“邻家小妹播放”来说,如果其出现的话,那么可从预先设定/生成的、“邻家小妹播放”对应的候选替换集中随机选出一个,利用选出的替换内容对“邻家小妹播放”进行替换,对应的候选替换集可为{这就为您播放、准备为您播放}等。
按照上述方式对第二类槽位进行替换,可使得生成的话术更为多样性。
经过替换之后,对于“首语气词#0.6邻家小妹播放#0.8@byartist的@name”和“首语气词#0.6邻家小妹播放#0.8@name”这两个候选话术模板,可分别得到对应的候选话术“嗯嗯,这就为您播放刘德华的忘情水”以及“啦啦啦,准备为您播放忘情水”。
在分别得到各候选话术模板对应的候选话术之后,可进一步从中去除不符合要求的候选话术。
具体地,可从候选话术中去除包含未被替换的第一类槽位的候选话术。
比如,没有找到相应的替换内容,如“忘情水”,那么@name就会保留下来,不会被替换,相应地,则可将对应的候选话术去除。
对于剩余的候选话术,可从中选出一个作为待播报的话术,如何进行选择不作限制,比如,可从剩余的候选话术中随机选出一个作为待播报的话术。
在获取到待播报的话术之后,为提升话术播报效果,还可进一步对其进行打标操作,即:针对待播报的话术中的每个词,分别确定该词是否位于预先生成的词库中,若是,则按照词库中定义的该词的播报方式信息,为该词打上标签,进而将打上标签后的话术作为待播报的话术。
为此,需要预先生成一个词库,其中包括有需要进行特殊处理的词,即需要按照定义的播报方式进行播报的词,相应地,词库中需要包括这些词及对应的播报方式信息,播报方式信息可包括播报速度、是否停顿、是否重读、音调等信息。
假设待播报的话术为“嗯嗯,这就为您播放刘德华的忘情水”,那么进行打标操作之后,可得到“嗯嗯<break time="200ms"/>,这就为您播放刘德华的<emphasis level="strong">忘情水</emphasis>”。
在完成打标操作之后,即可将话术播报给用户,具体实现为现有技术。
基于上述介绍,图4为本发明所述话术生成方法第二实施例的流程图,如图4所示,包括以下具体实现方式。
在401中,生成话术森林。
在402中,针对获取到的用户问题,分别获取其语义解析结果及内容查询结果。
在403中,根据语义解析结果对话术森林进行搜索,得到对应的叶子节点,并将得到的叶子节点对应的话术模板作为候选话术模板。
在404中,根据内容查询结果以及候选替换集等对候选话术模板进行槽位替换,得到候选话术。
在405中,从候选话术中去除不符合要求的候选话术,并从剩余的候选话术中随机选出一个话术。
在406中,对选出的话术进行打标操作。
在407中,将打标操作后的话术播报给用户。
可以看出,采用上述各方法实施例所述方案,可实现多领域多角色的话术生成,即可同时适用于各不同的领域,从而具有广泛适用性,而且可采用不同的角色进行话术播报,从而提升了播报效果。
另外,采用上述各方法实施例所述方案,可根据实际需要随时对话术森林中的领域、角色以及话术模板等进行更新,易于维护,可控且便于扩展。
以上是关于方法实施例的介绍,以下通过装置实施例,对本发明所述方案进行进一步说明。
图5本发明所述话术生成装置实施例的组成结构示意图,如图5所示,包括:预处理单元501、搜索单元502以及生成单元503。
预处理单元501,用于生成话术森林,采用一棵多叉树的数据结构,多叉树中至少包括三层节点,按照从上到下的顺序依次为根节点、领域节点和角色节点,每个叶子节点分别对应于与叶子节点所在路径上的信息相对应的至少一个话术模板。
搜索单元502,用于获取用户问题,根据用户问题对话术森林进行搜索,得到用户问题对应的叶子节点,并将得到的叶子节点对应的话术模板作为候选话术模板。
生成单元503,用于根据用户问题以及候选话术模板生成待播报的话术,并播报给用户。
预处理单元501所生成的话术森林即多叉树的结构可如图2所示,如图2所示,多叉树中包括三层节点,最上面的为根节点,根节点的下一层节点为领域节点,领域节点的下一层节点为角色节点。
在实际应用中,多叉树中还可以包括更多层节点,比如,角色节点的下一层节点可为意图节点等。
多叉树中的每个叶子节点分别对应于与该叶子节点所在路径上的信息相对应的至少一个话术模板。
搜索单元502在获取到用户问题之后,可首先按照现有技术获取其语义解析结果,语义解析结果中至少包括:领域以及角色信息,之后,可按照语义解析结果对话术森林进行搜索,从而得到与语义解析结果相匹配的叶子节点。
如前所述,每个叶子节点分别对应至少一个话术模板,通常为多个,那么在得到与语义解析结果相匹配的叶子节点之后,可将该叶子节点对应的话术模板确定为候选话术模板。
如图3所示,生成单元503中可具体包括:替换子单元5031、筛选子单元5032以及播报子单元5033。
替换子单元5031,用于根据用户问题,分别对每个候选话术模板进行槽位替换,得到候选话术。
筛选子单元5032,用于从候选话术中去除不符合要求的候选话术,并从剩余的候选话术中选出一个作为待播报的话术。
播报子单元5033,用于将待播报的话术播报给用户。
具体地,替换子单元5031可获取用户问题的内容查询结果,并针对每个候选话术模板,分别根据内容查询结果等对候选话术模板中的第一类槽位进行替换,并根据预先设定的候选替换集,对候选话术模板中的第二类槽位进行替换。
具体替换方式可参照图1所示104中的相关说明。
针对替换后得到的候选话术,筛选子单元5032可进一步从中去除包含未被替换的第一类槽位的候选话术,进而从剩余的候选话术中随机选出一个作为待播报的话术。
如图5所示,在获取到待播报的话术之后,为提升话术播报效果,还可进一步由打标子单元5034对其进行打标操作,即:针对待播报的话术中的每个词,分别确定该词是否位于预先生成的词库中,若是,则按照词库中定义的该词的播报方式信息,为该词打上标签,进而将打上标签后的话术作为待播报的话术。
为此,需要预先生成一个词库,其中包括有需要进行特殊处理的词,即需要按照定义的播报方式进行播报的词,相应地,词库中需要包括这些词及对应的播报方式信息,播报方式信息可包括播报速度、是否停顿、是否重读、音调等信息。
图5所示装置实施例的具体工作流程请参照前述方法实施例中的相应说明,不再赘述。
可以看出,采用上述装置实施例所述方案,可实现多领域多角色的话术生成,即可同时适用于各不同的领域,从而具有广泛适用性,而且可采用不同的角色进行话术播报,从而提升了播报效果。
另外,采用上述装置实施例所述方案,可根据实际需要随时对话术森林中的领域、角色以及话术模板等进行更新,易于维护,可控且便于扩展。
图6示出了适于用来实现本发明实施方式的示例性计算机系统/服务器12的框图。图6显示的计算机系统/服务器12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图6所示,计算机系统/服务器12以通用计算设备的形式表现。计算机系统/服务器12的组件可以包括但不限于:一个或者多个处理器(处理单元)16,存储器28,连接不同系统组件(包括存储器28和处理器16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
计算机系统/服务器12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机系统/服务器12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。计算机系统/服务器12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图6未显示,通常称为“硬盘驱动器”)。尽管图6中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
计算机系统/服务器12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机系统/服务器12交互的设备通信,和/或与使得该计算机系统/服务器12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机系统/服务器12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图6所示,网络适配器20通过总线18与计算机系统/服务器12的其它模块通信。应当明白,尽管图中未示出,可以结合计算机系统/服务器12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理器16通过运行存储在存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现图1所示实施例中的方法,即:
生成话术森林,采用一棵多叉树的数据结构,多叉树中至少包括三层节点,按照从上到下的顺序依次为根节点、领域节点和角色节点,每个叶子节点分别对应于与该叶子节点所在路径上的信息相对应的至少一个话术模板;
获取用户问题,根据用户问题对话术森林进行搜索,得到用户问题对应的叶子节点,并将得到的叶子节点对应的话术模板作为候选话术模板;
根据用户问题以及候选话术模板生成待播报的话术,并播报给用户。
具体实现请参照前述各实施例中的相关说明,不再赘述。
本发明同时公开了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时将实现如图1所示实施例中的方法。
可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、
Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法等,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (12)

1.一种基于人工智能的话术生成方法,其特征在于,包括:
生成话术森林,所述话术森林采用一棵多叉树的数据结构,所述多叉树中至少包括三层节点,按照从上到下的顺序依次为根节点、领域节点和角色节点,每个叶子节点分别对应于与所述叶子节点所在路径上的信息相对应的至少一个话术模板;
获取用户问题,获取所述用户问题的语义解析结果,所述语义解析结果中至少包括:领域以及角色信息;按照所述语义解析结果对所述话术森林进行搜索,得到与所述语义解析结果相匹配的叶子节点;
将得到的叶子节点对应的话术模板作为候选话术模板;
根据所述用户问题以及所述候选话术模板生成待播报的话术,并播报给用户。
2.根据权利要求1所述的方法,其特征在于,
所述根据所述用户问题以及所述候选话术模板生成待播报的话术包括:
根据所述用户问题,分别对每个候选话术模板进行槽位替换,得到候选话术;
从所述候选话术中去除不符合要求的候选话术;
从剩余的候选话术中选出一个作为所述待播报的话术。
3.根据权利要求2所述的方法,其特征在于,
所述分别对每个候选话术模板进行槽位替换包括:
获取所述用户问题的内容查询结果;
针对每个候选话术模板,分别根据所述内容查询结果对所述候选话术模板中的第一类槽位进行替换,并根据预先设定的候选替换集,对所述候选话术模板中的第二类槽位进行替换。
4.根据权利要求3所述的方法,其特征在于,
所述从所述候选话术中去除不符合要求的候选话术包括:
从所述候选话术中去除包含未被替换的第一类槽位的候选话术;
所述从剩余的候选话术中选出一个作为所述待播报的话术包括:
从剩余的候选话术中随机选出一个作为所述待播报的话术。
5.根据权利要求2所述的方法,其特征在于,
所述从剩余的候选话术中选出一个作为所述待播报的话术之后,进一步包括:
针对所述待播报的话术中的每个词,分别确定所述词是否位于预先生成的词库中;
若是,则按照所述词库中定义的所述词的播报方式信息,为所述词打上标签;
将打上标签后的话术作为所述待播报的话术。
6.一种基于人工智能的话术生成装置,其特征在于,包括:预处理单元、搜索单元以及生成单元;
所述预处理单元,用于生成话术森林,所述话术森林采用一棵多叉树的数据结构,所述多叉树中至少包括三层节点,按照从上到下的顺序依次为根节点、领域节点和角色节点,每个叶子节点分别对应于与所述叶子节点所在路径上的信息相对应的至少一个话术模板;
所述搜索单元,用于获取用户问题,获取所述用户问题的语义解析结果,所述语义解析结果中至少包括:领域以及角色信息;按照所述语义解析结果对所述话术森林进行搜索,得到与所述语义解析结果相匹配的叶子节点,将得到的叶子节点对应的话术模板作为候选话术模板;
所述生成单元,用于根据所述用户问题以及所述候选话术模板生成待播报的话术,并播报给用户。
7.根据权利要求6所述的装置,其特征在于,
所述生成单元中包括:替换子单元、筛选子单元以及播报子单元;
所述替换子单元,用于根据所述用户问题,分别对每个候选话术模板进行槽位替换,得到候选话术;
所述筛选子单元,用于从所述候选话术中去除不符合要求的候选话术,并从剩余的候选话术中选出一个作为所述待播报的话术;
所述播报子单元,用于将所述待播报的话术播报给用户。
8.根据权利要求7所述的装置,其特征在于,
所述替换子单元获取所述用户问题的内容查询结果,针对每个候选话术模板,分别根据所述内容查询结果对所述候选话术模板中的第一类槽位进行替换,并根据预先设定的候选替换集,对所述候选话术模板中的第二类槽位进行替换。
9.根据权利要求8所述的装置,其特征在于,
所述筛选子单元从所述候选话术中去除包含未被替换的第一类槽位的候选话术,并从剩余的候选话术中随机选出一个作为所述待播报的话术。
10.根据权利要求7所述的装置,其特征在于,
所述生成单元中进一步包括:打标子单元;
所述打标子单元,用于针对所述待播报的话术中的每个词,分别确定所述词是否位于预先生成的词库中,若是,则按照所述词库中定义的所述词的播报方式信息,为所述词打上标签,将打上标签后的话术作为所述待播报的话术。
11.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1~5中任一项所述的方法。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1~5中任一项所述的方法。
CN201710480310.1A 2017-06-22 2017-06-22 基于人工智能的话术生成方法、装置、设备及存储介质 Active CN107423363B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201710480310.1A CN107423363B (zh) 2017-06-22 2017-06-22 基于人工智能的话术生成方法、装置、设备及存储介质
US15/991,417 US10755148B2 (en) 2017-06-22 2018-05-29 Method and apparatus for generating a response based on artificial intelligence, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710480310.1A CN107423363B (zh) 2017-06-22 2017-06-22 基于人工智能的话术生成方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN107423363A CN107423363A (zh) 2017-12-01
CN107423363B true CN107423363B (zh) 2021-02-19

Family

ID=60427244

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710480310.1A Active CN107423363B (zh) 2017-06-22 2017-06-22 基于人工智能的话术生成方法、装置、设备及存储介质

Country Status (2)

Country Link
US (1) US10755148B2 (zh)
CN (1) CN107423363B (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108538294B (zh) * 2018-04-27 2020-11-17 科大讯飞股份有限公司 一种语音交互方法及装置
CN109241256B (zh) * 2018-08-20 2022-09-27 百度在线网络技术(北京)有限公司 对话处理方法、装置、计算机设备和可读存储介质
CN110110039A (zh) * 2019-01-10 2019-08-09 浙江百应科技有限公司 一种智能语音机器人可视化搭建的方法
CN109961786B (zh) * 2019-01-31 2023-04-14 平安科技(深圳)有限公司 基于语音分析的产品推荐方法、装置、设备和存储介质
CN109949071A (zh) * 2019-01-31 2019-06-28 平安科技(深圳)有限公司 基于语音情绪分析的产品推荐方法、装置、设备和介质
CN111737408B (zh) * 2019-03-25 2024-05-03 阿里巴巴集团控股有限公司 基于剧本的对话方法、设备及电子设备
US11182809B2 (en) 2019-04-01 2021-11-23 Paypal, Inc. Dynamic information probing for classifying an item
CN111951782A (zh) * 2019-04-30 2020-11-17 京东方科技集团股份有限公司 语音问答方法及装置、计算机可读存储介质和电子设备
CN110175223A (zh) * 2019-05-29 2019-08-27 北京搜狗科技发展有限公司 一种实现问题生成的方法及装置
CN112016285B (zh) * 2019-05-31 2023-11-07 北京京东振世信息技术有限公司 物流信息的处理方法和处理系统
CN110297616B (zh) * 2019-05-31 2023-06-02 百度在线网络技术(北京)有限公司 话术的生成方法、装置、设备以及存储介质
CN111128121B (zh) * 2019-12-20 2021-04-30 贝壳找房(北京)科技有限公司 语音信息生成方法和装置、电子设备和存储介质
CN111144905B (zh) * 2019-12-24 2023-11-03 泰康保险集团股份有限公司 问卷配置方法、系统、计算机设备及计算机可读存储介质
CN111105800B (zh) * 2019-12-26 2022-07-15 百度在线网络技术(北京)有限公司 语音交互处理方法、装置、设备和介质
CN111563151B (zh) * 2020-05-07 2024-02-02 腾讯科技(深圳)有限公司 一种信息采集的方法、会话配置的方法、装置及存储介质
CN112581954B (zh) * 2020-12-01 2023-08-04 杭州九阳小家电有限公司 一种高匹配性语音交互方法和智能设备
CN112559717A (zh) * 2020-12-24 2021-03-26 北京百度网讯科技有限公司 搜索匹配方法、装置、电子设备以及存储介质
CN117376652B (zh) * 2023-12-07 2024-04-09 深圳市优友互联股份有限公司 直播场景交互追溯的方法和装置、计算机设备、存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103268313A (zh) * 2013-05-21 2013-08-28 北京云知声信息技术有限公司 一种自然语言的语义解析方法及装置
CN104008160A (zh) * 2014-05-29 2014-08-27 吴春尧 一种实现并行话题控制的模糊推理聊天机器人方法和系统
CN106599215A (zh) * 2016-12-16 2017-04-26 广州索答信息科技有限公司 一种基于深度学习的问句生成方法和问句生成系统
CN106649825A (zh) * 2016-12-29 2017-05-10 上海智臻智能网络科技股份有限公司 语音交互系统及其创建方法和装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1041499A1 (en) * 1999-03-31 2000-10-04 International Business Machines Corporation File or database manager and systems based thereon
BRPI0412778A (pt) * 2003-07-22 2006-09-26 Kinor Technologies Inc acesso á informações usando ontologia
US7376551B2 (en) * 2005-08-01 2008-05-20 Microsoft Corporation Definition extraction
US8903806B2 (en) * 2010-12-10 2014-12-02 Microsoft Corporation Matching queries to data operations using query templates
CN103678269A (zh) * 2012-08-30 2014-03-26 国际商业机器公司 一种信息处理方法和装置
CN103795876A (zh) * 2012-10-29 2014-05-14 殷程 智能语音脚本
CN106407196A (zh) * 2015-07-29 2017-02-15 成都诺铱科技有限公司 应用于物流管理软件的语义分析智能指令机器人
CN106528531B (zh) * 2016-10-31 2019-09-03 北京百度网讯科技有限公司 基于人工智能的意图分析方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103268313A (zh) * 2013-05-21 2013-08-28 北京云知声信息技术有限公司 一种自然语言的语义解析方法及装置
CN104008160A (zh) * 2014-05-29 2014-08-27 吴春尧 一种实现并行话题控制的模糊推理聊天机器人方法和系统
CN106599215A (zh) * 2016-12-16 2017-04-26 广州索答信息科技有限公司 一种基于深度学习的问句生成方法和问句生成系统
CN106649825A (zh) * 2016-12-29 2017-05-10 上海智臻智能网络科技股份有限公司 语音交互系统及其创建方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
社会语义网络结构分析-以MetaFilter为例;叶光辉 等;《情报理论与实践》;20151231(第12期);第57-63页 *

Also Published As

Publication number Publication date
US10755148B2 (en) 2020-08-25
US20180373965A1 (en) 2018-12-27
CN107423363A (zh) 2017-12-01

Similar Documents

Publication Publication Date Title
CN107423363B (zh) 基于人工智能的话术生成方法、装置、设备及存储介质
CN107220235B (zh) 基于人工智能的语音识别纠错方法、装置及存储介质
CN108288468B (zh) 语音识别方法及装置
CN108959257B (zh) 一种自然语言解析方法、装置、服务器及存储介质
CN107221328B (zh) 修改源的定位方法及装置、计算机设备及可读介质
CN108847241A (zh) 将会议语音识别为文本的方法、电子设备及存储介质
CN110164435A (zh) 语音识别方法、装置、设备及计算机可读存储介质
US20200184948A1 (en) Speech playing method, an intelligent device, and computer readable storage medium
CN102662935A (zh) 一种交互式的机器翻译方法和机器翻译系统
CN109213851B (zh) 对话系统中口语理解的跨语言迁移方法
US20180226073A1 (en) Context-based cognitive speech to text engine
CN115427958A (zh) 语音识别和内容去识别
CN109448704A (zh) 语音解码图的构建方法、装置、服务器和存储介质
CN111951779A (zh) 语音合成的前端处理方法及相关设备
Dethlefs et al. Conditional random fields for responsive surface realisation using global features
US11354504B2 (en) Multi-lingual action identification
CN111597800B (zh) 同义句的获取方法及装置、设备及存储介质
CN108932218A (zh) 一种实例扩展方法、装置、设备和介质
CN112185361B (zh) 一种语音识别模型训练方法、装置、电子设备及存储介质
CN110245334B (zh) 用于输出信息的方法和装置
CN109657127B (zh) 一种答案获取方法、装置、服务器及存储介质
CN110020429A (zh) 语义识别方法及设备
CN110888940A (zh) 文本信息提取方法、装置、计算机设备及存储介质
CN114118068B (zh) 训练文本数据的扩增方法、装置及电子设备
KR20120045906A (ko) 코퍼스 오류 교정 장치 및 그 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant