CN106844734A - 一种自动生成会话回复内容的方法 - Google Patents

一种自动生成会话回复内容的方法 Download PDF

Info

Publication number
CN106844734A
CN106844734A CN201710076147.2A CN201710076147A CN106844734A CN 106844734 A CN106844734 A CN 106844734A CN 201710076147 A CN201710076147 A CN 201710076147A CN 106844734 A CN106844734 A CN 106844734A
Authority
CN
China
Prior art keywords
sentence
type
initiation
session
reply
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710076147.2A
Other languages
English (en)
Other versions
CN106844734B (zh
Inventor
陈包容
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changsha Dove Software Co Ltd
Original Assignee
Changsha Dove Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Changsha Dove Software Co Ltd filed Critical Changsha Dove Software Co Ltd
Priority to CN201710076147.2A priority Critical patent/CN106844734B/zh
Publication of CN106844734A publication Critical patent/CN106844734A/zh
Application granted granted Critical
Publication of CN106844734B publication Critical patent/CN106844734B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本发明提供的自动生成会话回复内容的方法,通过采集当前会话句,根据当前会话句的语义,判断当前会话句是否为发起句,若是,则判断发起句的类型,若否,则继续监测,直至出现发起句,以及根据发起句的语义及发起句的类型,自动搜索获得与发起句对应的回复句,并将回复句作为自动生成的会话回复内容,解决了采用现有技术获得的会话回复内容不精准的技术问题,不仅能自动生成与发起句对应的会话回复内容,从而大大减少了预先建立会话语料库的工作量,而且通过结合发起句的语义及发起句的类型自动生成的会话回复内容更精准和实用,进一步使得基于获得的会话回复内容更真实模拟会话。

Description

一种自动生成会话回复内容的方法
技术领域
本发明涉及通信技术领域,具体涉及一种自动生成会话回复内容的方法。
背景技术
目前,智能会话系统中回复句的获取主要采用以下两种方法:1、基于匹配的方法,例如基于关键词匹配或基于模板匹配的方法获得回复句;2、自动生成的方法,例如基于上下文无关文法自动生成回复句。
基于匹配方法获得的回复句,需要预先建立用于匹配获得回复句的会话语料库,工作量大,且根据会话语料库直接匹配获得的回复句精度不高,特别是针对复杂或非标准结构的会话发起句,难以从数据库中匹配获得精准的回复句。而采用自动生成方法获得的回复句,不一定准确和适用。针对该问题,本发明提出了一种自动生成精准度较高的会话回复内容的方法。
发明内容
本发明提供了一种自动生成会话回复内容的方法,以解决采用现有技术获得的会话回复内容不精准的技术问题。
本发明提供的自动生成会话回复内容的方法,包括:
采集当前会话句;
根据当前会话句的语义,判断当前会话句是否为发起句,若是,则判断发起句的类型,若否,则继续监测,直至出现发起句;
根据发起句的语义及发起句的类型,自动搜索获得与发起句对应的回复句,并将回复句作为自动生成的会话回复内容。
进一步地,根据当前会话句的语义,判断当前会话句是否为发起句包括:
判断当前会话句在预设时间区间内是否有通讯对方发送的上文,若无,则将当前会话句确定为发起句;
若有,则判断当前会话句是否与通讯对方发送的上文无语义关联,若是,则将当前会话句确定为发起句,否则为非发起句。
进一步地,判断发起句的类型包括:
判断发起句是否为具有完整独立语义的语句,若是,则判断发起句是否由多个具有完整独立语义的单句组成,若是,则将发起句的类型确定为复句发起句类型,否则为单句发起句类型;若否,则判断发起句是否包含具有完整独立语义的单句,若包含,则将发起句的类型确定为非标准复句发起句类型,若不包含,则为非标准单句发起句类型;
搜索非标准单句发起句类型的发起句是否有自己的上文连续会话句,若无,则不进行衍生扩展,若有,则进一步判断非标准单句发起句类型的发起句是否可与自己的上文连续会话句合并成具有完整独立语义的语句,若能,则将非标准单句发起句类型的发起句的类型衍生扩展为非标准句群发起句类型,若不能,则不进行衍生扩展;
搜索非标准复句发起句类型的发起句是否有自己的上文连续会话句,若无,则不进行衍生扩展,若有,则进一步判断非标准复句发起句类型的发起句是否可与自己的上文连续会话句合并成具有完整独立语义的语句,若能,则将非标准复句发起句类型的发起句的类型衍生扩展为非标准句群发起句类型,若不能,则不进行衍生扩展;
判断单句、复句、非标准单句、非标准复句以及非标准句群类型的发起句是否有自己的上文连续会话句,若有,则进一步判断发起句是否可与自己的上文连续会话句合并成语义关联的句群,若是,则将发起句的类型衍生扩展为句群发起句类型,否则不进行衍生扩展。
进一步地,根据发起句的语义及发起句的类型,自动搜索获得与发起句对应的回复句包括:
将发起句的类型进行衍生扩展,获得多种类型的发起句;
针对每一种类型的发起句,分别搜索获得与其语义关联的回复句。
进一步地,针对每一种类型的发起句,分别搜索获得与其语义关联的回复句包括:
针对每一种类型的发起句,分别采集获得与预设的场景标签对应的场景标签值;
根据每一种类型的发起句、每一种类型的发起句与预设的场景标签对应的场景标签值,在预设数据库或互联网上搜索获得与其语义关联的回复句。
进一步地,根据发起句的语义及发起句的类型自动搜索获得与发起句对应的回复句之后包括:
将回复句显示到接收发起句的移动终端界面;
在移动终端界面显示用户在回复句中选择的确定回复句,其中,用户可编辑修改回复句或/和选择发送回复句。
进一步地,场景标签包括:
第一场景标签和第二场景标签,且第一场景标签包括:会话通讯双方的时间、地点、日期、天气、季节、体感数据,会话通讯双方会话通讯的间隔时间、频率、时间跨度场景标签中的一种或多种组合;
第二场景标签包括:会话内容主题,会话通讯双方的会话意图、性别、职业、职务、心情、兴趣爱好、健康状况、实时行为状态,会话内容的句型、句类、句式结构类型,以及总量场景标签中的一种或多种组合。
本发明具有以下有益效果:
本发明提供的自动生成会话回复内容的方法,通过采集当前会话句,根据当前会话句的语义,判断当前会话句是否为发起句,若是,则判断发起句的类型,若否,则继续监测,直至出现发起句,以及根据发起句的语义及发起句的类型,自动搜索获得与发起句对应的回复句,并将回复句作为自动生成的会话回复内容,解决了采用现有技术获得的会话回复内容不精准的技术问题,不仅能自动生成与发起句对应的会话回复内容,从而大大减少了预先建立会话语料库的工作量,而且通过结合发起句的语义及发起句的类型自动生成的会话回复内容更精准和实用,进一步使得基于获得的会话回复内容更真实模拟会话。
除了上面所描述的目的、特征和优点之外,本发明还有其它的目的、特征和优点。下面将参照图,对本发明作进一步详细的说明。
附图说明
构建本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构建对本发明的不当限定。在附图中:
图1是本发明优选实施例自动生成会话回复内容的方法流程图;
图2是本发明优选实施例针对的精简实施例一的自动生成会话回复内容的方法的流程图;
图3是本发明优选实施例针对的精简实施例二的自动生成会话回复内容的方法的流程图。
具体实施方式
以下结合附图对本发明的实施例进行详细说明,但是本发明可以由权利要求限定和覆盖的多种不同方式实施。
参照图1,本发明的优选实施例提供了一种自动生成会话回复内容的方法,包括:
步骤S101,采集当前会话句;
步骤S102,根据当前会话句的语义,判断当前会话句是否为发起句,若是,则判断发起句的类型,若否,则继续监测,直至出现发起句;
步骤S103,根据发起句的语义及发起句的类型,自动搜索获得与发起句对应的回复句,并将回复句作为自动生成的会话回复内容。
本发明实施例提供的自动生成会话回复内容的方法,通过采集当前会话句,根据当前会话句的语义,判断当前会话句是否为发起句,若是,则判断发起句的类型,若否,则继续监测,直至出现发起句,以及根据发起句的语义及发起句的类型,自动搜索获得与发起句对应的回复句,并将回复句作为自动生成的会话回复内容,解决了采用现有技术获得的会话回复内容不精准的技术问题,不仅能自动生成与发起句对应的会话回复内容,从而大大减少了预先建立会话语料库的工作量,而且通过结合发起句的语义及发起句的类型自动生成的会话回复内容更精准和实用,进一步使得基于获得的会话回复内容更真实模拟会话。
需要说明的是,本实施例自动生成会话回复内容主要是针对会话中出现的发起句自动生成会话回复内容,也即本实施例自动生成会话回复内容前需确定发起句,然后再针对确定的发起句自动生成会话回复内容。具体地,首先采集当前会话句,然后根据当前会话句的语义,判断其是否为发起句,若不是,则继续监测,直至出现发起句。且本实施例中的发起句具体是指无通讯对方发送上文的会话句或与通讯对方发送的上文无语义关联的会话句。
可选地,根据当前会话句的语义,判断当前会话句是否为发起句包括:
判断当前会话句在预设时间区间内是否有通讯对方发送的上文,若无,则将当前会话句确定为发起句;
若有,则判断当前会话句是否与通讯对方发送的上文无语义关联,若是,则将当前会话句确定为发起句,否则为非发起句。
为了精准确定会话内容中的发起句,本实施例首先判断当前会话句在预设时间区间内是否有通讯对方发送的上文,若无,则将当前会话句确定为发起句,若有,则判断当前会话句是否与通讯对方发送的上文无语义关联,若是,则将当前会话句确定为发起句,否则将当前会话句确定为非发起句。
在实际的会话过程中,如果当前会话句在预设时间区间内无通讯对方发送的上文,一般将其认为是发起会话的起始句,也即发起句。例如假设当前会话句为12月3日发送的会话句,上一条会话句是通讯对方于12月1日发送的会话句,假设预设的时间区间为1天,则通过判断可知,当前会话句在预设时间区间内无通讯对方发送的上文,则将当前会话句认为是发起会话的起始句,也即将当前会话句判定为发起句。且本实施例预设的时间区间具体由用户自定义,例如可以是1小时、半天、一天、一个月等等,也即当判断出当前会话句在1小时、半天、一天、一个月内无通讯对方发送的上文,则判定当前会话句为发起句。需要说明的是,本实施例中当前会话句是否与通讯对方发送的上文无语义关联,具体是指当前会话句是否包括与通讯对方发送的上文无语义关联的语句。
例如,当前会话句有通讯对方发送的上文,且通讯对方A发送的上文为“最近怎么样?”,则针对第一种情况的当前会话句(通讯方B:“挺好的”),可判断出该当前会话句不包括与通讯对方发送的上文无语义关联的语句,此时确定该当前会话句为非发起句;针对第二种情况的当前会话句(通讯方B:“帮我缴电话费了吗?”),可判断出该当前会话句包括与通讯对方发送的上文无语义关联的语句,此时确定该当前会话句为发起句;针对第三种情况的当前会话句(通讯方B:“挺好的,帮我缴电话费了吗?”),可判断出该当前会话句同样包括与通讯对方发送的上文无语义关联的语句(“帮我缴电话费了吗?”),此时确定该当前会话句为发起句。
本实施例通过判断当前会话句在预设时间区间内是否有通讯对方发送的上文,以及在有通讯对方发送的上文时,判断当前会话句是否与通讯对方发送的上文无语义关联,可以精准确定会话内容中的发起句,为后续根据确定的发起句自动搜索精准的会话回复内容奠定基础。
可选地,判断发起句的类型包括:
判断发起句是否为具有完整独立语义的语句,若是,则判断发起句是否由多个具有完整独立语义的单句组成,若是,则将发起句的类型确定为复句发起句类型,否则为单句发起句类型;若否,则判断发起句是否包含具有完整独立语义的单句,若包含,则将发起句的类型确定为非标准复句发起句类型,若不包含,则为非标准单句发起句类型;
搜索非标准单句发起句类型的发起句是否有自己的上文连续会话句,若无,则不进行衍生扩展,若有,则进一步判断非标准单句发起句类型的发起句是否可与自己的上文连续会话句合并成具有完整独立语义的语句,若能,则将非标准单句发起句类型的发起句的类型衍生扩展为非标准句群发起句类型,若不能,则不进行衍生扩展;
搜索非标准复句发起句类型的发起句是否有自己的上文连续会话句,若无,则不进行衍生扩展,若有,则进一步判断非标准复句发起句类型的发起句是否可与自己的上文连续会话句合并成具有完整独立语义的语句,若能,则将非标准复句发起句类型的发起句的类型衍生扩展为非标准句群发起句类型,若不能,则不进行衍生扩展;
判断单句、复句、非标准单句、非标准复句以及非标准句群类型的发起句是否有自己的上文连续会话句,若有,则进一步判断发起句是否可与自己的上文连续会话句合并成语义关联的句群,若是,则将发起句的类型衍生扩展为句群发起句类型,否则不进行衍生扩展。
在实际的实施过程中,发起句可能以多种类型进行呈现,例如单句、复句、非标准句等等,且不同类型的发起句可能会影响或导致自动获取的回复句不同。针对该问题,本实施例按照预设的类型判断规则,确定发起句的类型。具体地,首先在发起句具有完整独立语义的前提下,通过判断发起句是由一个还是多个完整独立语义的单句组成,确定发起句为单句还是复句发起句类型,以及在发起句不具有完整独立语义的前提下,通过判断发起句是否包含具有完整独立语义的单句来确定发起句的类型为非标准复句还是非标准单句发起句类型;然后通过搜索非标准单句和非标准复句发起句类型的发起句是否有自己的上文连续会话句,以及是否可与自己的上文连续会话句合并成具有完整独立语义的语句,确定是否将发起句的类型衍生扩展为非标准句群发起句类型;最后通过判断单句、复句、非标准单句、非标准复句以及非标准句群类型的发起句是否有自己的上文连续会话句,确定发起句的类型是否可以衍生扩展为句群发起句类型。
具体地,本实施例确定发起句类型的过程本质上分为三个判别过程,即第一个判别过程是对每一条发起句按照四种发起句类型(单句、复句、非标准单句以及非标准复句)进行逐一判别;第二个判别过程是在进行完第一个判别过程后,接着判别非标准单句和非标准复句发起句类型的发起句是否可进一步衍生扩展为非标准句群发起句类型;第三个判别过程是在进行完第二个判别过程后,接着判别单句、复句、非标准单句、非标准复句以及非标准句群类型的发起句是否可进一步衍生扩展为句群发起句类型。
本实施例通过确定发起句的类型,一方面有利于对发起句进行句子结构和成分的深度分析,另一方面,基于对发起句进行类型判断和结构分析,有利于更精准提取实用性高且形式多样的回复句。需要说明的是,本实施例中发起句是否有自己的上文连续会话句具体是指发起句是否有发送发起句的发送方发送的上文连续会话句。
可选地,根据发起句的语义及发起句的类型,自动搜索获得与发起句对应的回复句包括:
将发起句的类型进行衍生扩展,获得多种类型的发起句;
针对每一种类型的发起句,分别搜索获得与其语义关联的回复句。
具体地,由于本实施例中发起句的类型包括多种,例如单句、复句、非标准单句、非标准复句,非标准句群、句群发起句类型,故为了更精准获取实用性高且形式多样的会话回复内容,本实施例首先将发起句的类型进行衍生扩展,获得多种类型的发起句,然后针对每一种类型的发起句,分别搜索获得与其语义关联的回复句。例如假设发起句类型为句群发起句类型,则可以将该类型的发起句衍生扩展为单句发起句和/或复句发起句类型,并针对单句发起句和/或复句发起句类型的发起句,分别搜索获得与其语义关联的回复句。
可选地,针对每一种类型的发起句,分别搜索获得与其语义关联的回复句包括:
针对每一种类型的发起句,分别采集获得与预设的场景标签对应的场景标签值;
根据每一种类型的发起句、每一种类型的发起句与预设的场景标签对应的场景标签值,在预设数据库或互联网上搜索获得与其语义关联的回复句。
为了获得更精准和实用的会话回复内容,本实施例在针对每一种类型的发起句,分别搜索获得与其语义关联的回复句时,首先针对每一种类型的发起句,分别采集获得与预设的场景标签对应的场景标签值,然后根据每一种类型的发起句、每一种类型的发起句与预设的场景标签对应的场景标签值,在预设数据库或互联网上搜索获得与其语义关联的回复句。
例如对于发起句“最近怎么样,一起聚聚?”,容易判断出该发起句类型为复句发起句类型,且通过衍生扩展后,可将该类型的发起句衍生扩展为两个单句发起句类型的发起句,具体为“最近怎么样”和“一起聚聚?”;然后针对这两个单句发起句类型的发起句,分别采集与预设的场景标签对应的场景标签值,假设预设的场景标签为会话内容主题、会话时间和会话地点,且假设采集到第一个发起句与预设的三个场景标签对应的场景标签值分别为:打招呼,早上八点,长沙,第二个发起句与预设的三个场景标签对应的场景标签值分别为:聚会,早上八点,长沙;最后,根据每一种类型的发起句、每一种类型的发起句与预设的场景标签对应的场景标签值,在预设数据库或互联网上搜索获得与其语义关联的回复句。也即根据发起句“最近怎么样”、发起句与预设的场景标签对应的场景标签值(打招呼,早上八点,长沙),在预设数据库或互联网上搜索获得与其语义关联的回复句,以及根据发起句“一起聚聚?”、发起句与预设的场景标签对应的场景标签值(聚会,早上八点,长沙),在预设数据库或互联网上搜索获得与其语义关联的回复句。
需要说明的是,本实施例中预设的场景标签根据能否对其进行直接采集分为第一场景标签和第二场景标签,其中第一场景标签为能对其进行直接采集的场景标签,例如时间、地点场景标签,第二场景标签为不能对其进行直接采集的场景标签,例如会话内容主题、会话双方关系场景标签等等。
且本实施例针对第二场景标签,可以通过搜索或匹配获得第二会话场景标签值;根据所述第一会话场景标签值推理获得第二会话场景标签值;通过对会话内容进行语义推理获得第二会话场景标签值;通过获取与会话内容关联的关联词获得第二会话场景标签值;根据已训练好的分类器分类获得第二会话场景标签值;通过已获得的第二会话场景标签进一步多层次推理计算获得新的第二会话场景标签;或根据上述方法的任意组合获得与第二场景标签值。
例如针对地点场景标签值,可以通过移动终端的GPS自动采集获得;针对通讯双方关系场景标签值,可以通过第一场景标签值推理获得;针对会话意图采集标签值,可以通过计算与会话内容关联的词向量获得;针对心情场景标签值,可以通过将会话内容和/或第一会话场景标签值和/或搜索或匹配获得第二会话场景标签值和/或推理获得的第二会话场景标签值和/或通过对会话内容进行语义推理获得的第二会话场景标签值作为分类器的输入,并根据分类器的输出结果,获得第二会话场景标签值。
由此可见,本实施例针对不能直接进行采集的场景标签,能实现对其进行自动获取,且通过结合发起句与预设的场景标签对应的场景标签值搜索获得会话回复内容的搜索速度更快,搜索精度更高。
可选地,根据发起句的语义及发起句的类型自动搜索获得与发起句对应的回复句之后包括:
将回复句显示到接收发起句的移动终端界面;
在移动终端界面显示用户在回复句中选择的确定回复句,其中,用户可编辑修改回复句或/和选择发送回复句。
在实际的实施过程中,根据发起句的语义及发起句的类型自动搜索获得的与发起句对应的回复句可能有多条,故为了进一步获得精准的回复句,本实施例在自动搜索获得回复句后,还可以通过与用户交互确定最终的回复句;此外,为了满足个性化需求,用户对于获取的回复句能进行编辑修改或/和选择发送回复句。
本实施例通过在移动终端界面显示用户在回复句中选择的确定回复句,方便用户选择最终的回复句进行回复,且用户通过编辑修改回复句或/和选择发送回复句,大大提升了用户体验。
可选地,场景标签包括:
第一场景标签和第二场景标签,且第一场景标签包括:会话通讯双方的时间、地点、日期、天气、季节、体感数据,会话通讯双方会话通讯的间隔时间、频率、时间跨度场景标签项中的一种或多种组合。
第二场景标签包括:会话内容主题,会话通讯双方的会话意图、性别、职业、职务、心情、兴趣爱好、健康状况、实时行为状态,会话内容的句型、句类、句式结构类型,以及总量场景标签项中的一种或多种组合。
需要说明的是,本实施例采集与会话意图场景标签对应的场景标签值时,可以通过预先建立的用于识别通讯方和/或通讯对方的会话意图的会话意图识别模型实现。具体地,首先训练好与会话内容样本对应的会话意图识别模型,然后根据训练好的会话意图识别模型识别通讯方和/或通讯对方针对会话内容的会话意图。
下面针对二个精简实施例对本发明的自动生成会话回复内容的方法进行更进一步说明。
精简实施例一
参照图2,本发明的精简实施例一提供的自动生成会话回复内容的方法,包括:
步骤S201,采集当前会话句。
具体地,假设本实施例采集的当前会话句为通讯方A给通讯对方B发送的会话内容,具体为“费了吗?”,其中,会话内容可以为文本、图片、语音、视频或动漫格式,且当会话内容是语音、图片、视频或动漫格式时,还包括将语音、图片、视频或动漫格式的会话内容转换为文本格式的会话内容。
步骤S202,判断当前会话句在预设时间区间内是否有通讯对方发送的上文,若无,则将当前会话句确定为发起句;
若有,则判断当前会话句是否与通讯对方发送的上文无语义关联,若是,则将当前会话句确定为发起句,否则继续监测,直至出现发起句。
具体地,假设当前会话句在预设时间区间内没有通讯对方发送的上文,则将当前会话句确定为发起句。
步骤S203,判断发起句是否为具有完整独立语义的语句,若是,则判断发起句是否由多个具有完整独立语义的单句组成,若是,则将发起句的类型确定为复句发起句类型,否则为单句发起句类型;若否,则判断发起句是否包含具有完整独立语义的单句,若包含,则将发起句的类型确定为非标准复句发起句类型,若不包含,则为非标准单句发起句类型。
具体地,通过判断可知,本实施例中的发起句(“费了吗?”)不具有完整独立语义,且不包含具有完整独立语义的单句,故将发起句的类型确定为非标准单句发起句类型。
步骤S204,搜索非标准单句发起句类型的发起句是否有自己的上文连续会话句,若无,则不进行衍生扩展,若有,则进一步判断非标准单句发起句类型的发起句是否可与自己的上文连续会话句合并成具有完整独立语义的语句,若能,则将非标准单句发起句类型的发起句的类型衍生扩展为非标准句群发起句类型,若不能,则不进行衍生扩展。
具体地,假设本实施例中的当前会话句有自己的上文连续会话句,即当前会话句的上文也为通讯方A给通讯对方B发送的会话内容,具体为“帮我缴”,且通过判断可知当前会话句(非标准单句发起句类型的发起句)可与自己的上文连续会话句合并成具有完整独立语义的语句,此时将非标准单句发起句类型的发起句的类型衍生扩展为非标准句群发起句类型。具体见表1。
表1
步骤S205,判断单句、复句、非标准单句、非标准复句以及非标准句群类型的发起句是否有自己的上文连续会话句,若有,则进一步判断发起句是否可与自己的上文连续会话句合并成语义关联的句群,若是,则将发起句的类型衍生扩展为句群发起句类型,否则不进行衍生扩展。
具体地,假设本实施例中的非标准句群类型的发起句无自己的上文连续会话句,则不进行衍生扩展。
步骤S206,将发起句的类型进行衍生扩展,获得多种类型的发起句。
具体地,通过表1可知,本实施例可以将发起句的类型衍生扩展为单句类型的发起句,具体为“帮我缴费了吗?”。
步骤S207,针对每一种类型的发起句,分别搜索获得与其语义关联的回复句。
具体地,由于本实施例中的发起句包括三种类型(非标准单句、非标准句群以及单句发起句类型),则针对这三种类型的发起句,分别搜索获得与其语义关联的回复句。在实际的实施过程中,由于非标准单句和非标准复句不具有独立完整语义,故针对这种类型的发起句搜索获得的回复句的精准性和实用性都不高,故可忽略针对非标准单句和非标准复句搜索回复句的搜索。
由此可见,本发明实施例提供的自动生成会话回复内容的方法,通过采集当前会话句,根据当前会话句的语义,判断当前会话句是否为发起句,若是,则判断发起句的类型,若否,则继续监测,直至出现发起句,以及根据发起句的语义及发起句的类型,自动搜索获得与发起句对应的回复句,并将回复句作为自动生成的会话回复内容,解决了采用现有技术获得的会话回复内容不精准的技术问题,不仅能自动生成与发起句对应的会话回复内容,从而大大减少了预先建立会话语料库的工作量,而且通过结合发起句的语义及发起句的类型自动生成的会话回复内容更精准和实用,进一步使得基于获得的会话回复内容更真实模拟会话。
精简实施例二
参照图3,本发明的精简实施例二提供的自动生成会话回复内容的方法,包括:
步骤S301,采集当前会话句。
具体地,假设本实施例采集的当前会话句为通讯方A给通讯对方B发送的会话内容,具体为“有折扣吗?”,其中,会话内容可以为文本、图片、语音、视频或动漫格式,且当会话内容是语音、图片、视频或动漫格式时,还包括将语音、图片、视频或动漫格式的会话内容转换为文本格式的会话内容。
步骤S302,根据当前会话句的语义,判断当前会话句是否为发起句,若是,则判断发起句的类型,若否,则继续监测,直至出现发起句。
具体地,假设当前会话句在预设时间区间内没有通讯对方发送的上文,则将当前会话句确定为发起句。
步骤S303,将发起句的类型进行衍生扩展,获得多种类型的发起句。
具体地,假设本实施例中的当前会话句有自己的上文连续会话句,即当前会话句的上文也为通讯方A给通讯对方B发送的会话内容,具体为“军鸽机器人软件现在售价多少?”,且通过判断可知当前会话句(单句发起句类型的发起句)可与自己的上文连续会话句合并成具有完整独立语义的句群,此时将单句发起句类型的发起句的类型衍生扩展为句群发起句类型。具体见表2所示。此外,通过对发起句进一步进行衍生扩展,可将发起句的类型扩展衍生为复句发起句类型,具体见表2所示。
表2
步骤S304,针对每一种类型的发起句,分别采集获得与预设的场景标签对应的场景标签值。
具体地,假设预设的场景标签为会话内容主题,会话双方关系,通讯方职业。且假设采集到发起句与预设的场景标签对应的场景标签值见表3所示。
表3
步骤S305,根据每一种类型的发起句、每一种类型的发起句与预设的场景标签对应的场景标签值,在预设数据库或互联网上搜索获得与其语义关联的回复句。
具体地,在该步骤中,本实施例针对每一种类型的发起句、每一种类型的发起句与预设的场景标签对应的场景标签值,在预设数据库或互联网上搜索获得与其语义关联的回复句。
步骤S306,将回复句显示到接收发起句的移动终端界面。
具体地,假设针对上述发起句搜索到三个回复句,则本实施例将回复句分别显示到接收发起句的移动终端界面。
步骤S307,在移动终端界面显示用户在回复句中选择的确定回复句,其中,用户可编辑修改回复句或/和选择是否发送回复句。
具体地,系统接收到用户从三个回复句中选择的确定回复句后,在移动终端界面显示用户在回复句中选择的确定回复句。同时,用户还可以对搜索获得的回复句进行编辑修改或/和选择发送该回复句。
由此可见,本发明实施例提供的自动生成会话回复内容的方法,通过采集当前会话句,根据当前会话句的语义,判断当前会话句是否为发起句,若是,则判断发起句的类型,若否,则继续监测,直至出现发起句,以及根据发起句的语义及发起句的类型,自动搜索获得与发起句对应的回复句,并将回复句作为自动生成的会话回复内容,解决了采用现有技术获得的会话回复内容不精准的技术问题,不仅能自动生成与发起句对应的会话回复内容,从而大大减少了预先建立会话语料库的工作量,而且通过结合发起句的语义及发起句的类型自动生成的会话回复内容更精准和实用,进一步使得基于获得的会话回复内容更真实模拟会话。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种自动生成会话回复内容的方法,其特征在于,包括:
采集当前会话句;
根据所述当前会话句的语义,判断所述当前会话句是否为发起句,若是,则判断所述发起句的类型,若否,则继续监测,直至出现发起句;
根据所述发起句的语义及所述发起句的类型,自动搜索获得与所述发起句对应的回复句,并将所述回复句作为自动生成的会话回复内容。
2.根据权利要求1所述的自动生成会话回复内容的方法,其特征在于,根据所述当前会话句的语义,判断所述当前会话句是否为发起句包括:
判断所述当前会话句在预设时间区间内是否有通讯对方发送的上文,若无,则将所述当前会话句确定为发起句;
若有,则判断所述当前会话句是否与所述通讯对方发送的上文无语义关联,若是,则将所述当前会话句确定为发起句,否则为非发起句。
3.根据权利要求2所述的自动生成会话回复内容的方法,其特征在于,判断所述发起句的类型包括:
判断所述发起句是否为具有完整独立语义的语句,若是,则判断所述发起句是否由多个具有完整独立语义的单句组成,若是,则将所述发起句的类型确定为复句发起句类型,否则为单句发起句类型;若否,则判断所述发起句是否包含具有完整独立语义的单句,若包含,则将所述发起句的类型确定为非标准复句发起句类型,若不包含,则为非标准单句发起句类型;
搜索非标准单句发起句类型的所述发起句是否有自己的上文连续会话句,若无,则不进行衍生扩展,若有,则进一步判断非标准单句发起句类型的所述发起句是否可与所述自己的上文连续会话句合并成具有完整独立语义的语句,若能,则将非标准单句发起句类型的所述发起句的类型衍生扩展为非标准句群发起句类型,若不能,则不进行衍生扩展;
搜索非标准复句发起句类型的所述发起句是否有自己的上文连续会话句,若无,则不进行衍生扩展,若有,则进一步判断非标准复句发起句类型的所述发起句是否可与所述自己的上文连续会话句合并成具有完整独立语义的语句,若能,则将非标准复句发起句类型的所述发起句的类型衍生扩展为非标准句群发起句类型,若不能,则不进行衍生扩展;
判断单句、复句、非标准单句、非标准复句以及非标准句群类型的所述发起句是否有自己的上文连续会话句,若有,则进一步判断所述发起句是否可与自己的上文连续会话句合并成语义关联的句群,若是,则将所述发起句的类型衍生扩展为句群发起句类型,否则不进行衍生扩展。
4.根据权利要求3所述的自动生成会话回复内容的方法,其特征在于,根据所述发起句的语义及所述发起句的类型,自动搜索获得与所述发起句对应的回复句包括:
将所述发起句的类型进行衍生扩展,获得多种类型的发起句;
针对每一种类型的所述发起句,分别搜索获得与其语义关联的回复句。
5.根据权利要求4所述的自动生成会话回复内容的方法,其特征在于,针对每一种类型的所述发起句,分别搜索获得与其语义关联的回复句包括:
针对每一种类型的所述发起句,分别采集获得与预设的场景标签对应的场景标签值;
根据每一种类型的所述发起句、每一种类型的所述发起句与预设的场景标签对应的场景标签值,在预设数据库或互联网上搜索获得与其语义关联的回复句。
6.根据权利要求5所述的自动生成会话回复内容的方法,其特征在于,根据所述发起句的语义及所述发起句的类型自动搜索获得与所述发起句对应的回复句之后包括:
将所述回复句显示到接收所述发起句的移动终端界面;
在所述移动终端界面显示用户在所述回复句中选择的确定回复句,其中,用户可编辑修改所述回复句或/和选择发送所述回复句。
7.根据权利要求6所述的自动生成会话回复内容的方法,其特征在于,所述场景标签包括:
第一场景标签和第二场景标签,且所述第一场景标签包括:会话通讯双方的时间、地点、日期、天气、季节、体感数据,会话通讯双方会话通讯的间隔时间、频率、时间跨度场景标签中的一种或多种组合;
所述第二场景标签包括:会话内容主题,会话通讯双方的会话意图、性别、职业、职务、心情、兴趣爱好、健康状况、实时行为状态,会话内容的句型、句类、句式结构类型,以及总量场景标签中的一种或多种组合。
CN201710076147.2A 2017-02-13 2017-02-13 一种自动生成会话回复内容的方法 Active CN106844734B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710076147.2A CN106844734B (zh) 2017-02-13 2017-02-13 一种自动生成会话回复内容的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710076147.2A CN106844734B (zh) 2017-02-13 2017-02-13 一种自动生成会话回复内容的方法

Publications (2)

Publication Number Publication Date
CN106844734A true CN106844734A (zh) 2017-06-13
CN106844734B CN106844734B (zh) 2023-01-24

Family

ID=59128135

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710076147.2A Active CN106844734B (zh) 2017-02-13 2017-02-13 一种自动生成会话回复内容的方法

Country Status (1)

Country Link
CN (1) CN106844734B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018145436A1 (zh) * 2017-02-13 2018-08-16 长沙军鸽软件有限公司 一种从会话内容中提取会话对的方法
CN108491471A (zh) * 2018-03-07 2018-09-04 维沃移动通信有限公司 一种文本信息的处理方法、移动终端
CN111400502A (zh) * 2018-12-29 2020-07-10 北京快如科技有限公司 一种回复消息的方法和装置

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010033298A1 (en) * 2000-03-01 2001-10-25 Benjamin Slotznick Adjunct use of instant messenger software to enable communications to or between chatterbots or other software agents
CN101122972A (zh) * 2007-09-01 2008-02-13 腾讯科技(深圳)有限公司 一种虚拟宠物聊天系统、方法及虚拟宠物问答服务器
US20110055735A1 (en) * 2009-08-28 2011-03-03 Apple Inc. Method and apparatus for initiating and managing chat sessions
CN103076950A (zh) * 2012-12-25 2013-05-01 北京百度网讯科技有限公司 一种会话线程列表的管理方法
CN103390047A (zh) * 2013-07-18 2013-11-13 天格科技(杭州)有限公司 聊天机器人知识库及其构建方法
US20140372540A1 (en) * 2013-06-13 2014-12-18 Evernote Corporation Initializing chat sessions by pointing to content
CN105389296A (zh) * 2015-12-11 2016-03-09 小米科技有限责任公司 信息分割方法及装置
CN105677823A (zh) * 2016-01-04 2016-06-15 上海精学锐信息科技有限公司 一种问答整理的方法及装置
US20160224549A1 (en) * 2015-02-03 2016-08-04 Line Corporation Methods, systems and recording mediums for managing conversation contents in messenger
CN106202476A (zh) * 2016-07-14 2016-12-07 广州安望信息科技有限公司 一种基于知识图谱的人机对话的方法及装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010033298A1 (en) * 2000-03-01 2001-10-25 Benjamin Slotznick Adjunct use of instant messenger software to enable communications to or between chatterbots or other software agents
CN101122972A (zh) * 2007-09-01 2008-02-13 腾讯科技(深圳)有限公司 一种虚拟宠物聊天系统、方法及虚拟宠物问答服务器
US20110055735A1 (en) * 2009-08-28 2011-03-03 Apple Inc. Method and apparatus for initiating and managing chat sessions
CN103076950A (zh) * 2012-12-25 2013-05-01 北京百度网讯科技有限公司 一种会话线程列表的管理方法
US20140372540A1 (en) * 2013-06-13 2014-12-18 Evernote Corporation Initializing chat sessions by pointing to content
CN103390047A (zh) * 2013-07-18 2013-11-13 天格科技(杭州)有限公司 聊天机器人知识库及其构建方法
US20160224549A1 (en) * 2015-02-03 2016-08-04 Line Corporation Methods, systems and recording mediums for managing conversation contents in messenger
CN105389296A (zh) * 2015-12-11 2016-03-09 小米科技有限责任公司 信息分割方法及装置
CN105677823A (zh) * 2016-01-04 2016-06-15 上海精学锐信息科技有限公司 一种问答整理的方法及装置
CN106202476A (zh) * 2016-07-14 2016-12-07 广州安望信息科技有限公司 一种基于知识图谱的人机对话的方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018145436A1 (zh) * 2017-02-13 2018-08-16 长沙军鸽软件有限公司 一种从会话内容中提取会话对的方法
CN108491471A (zh) * 2018-03-07 2018-09-04 维沃移动通信有限公司 一种文本信息的处理方法、移动终端
CN108491471B (zh) * 2018-03-07 2020-11-20 维沃移动通信有限公司 一种文本信息的处理方法、移动终端
CN111400502A (zh) * 2018-12-29 2020-07-10 北京快如科技有限公司 一种回复消息的方法和装置

Also Published As

Publication number Publication date
CN106844734B (zh) 2023-01-24

Similar Documents

Publication Publication Date Title
CN106951468B (zh) 对话生成方法及装置
CN109308357B (zh) 一种用于获得答案信息的方法、装置和设备
CN108984650B (zh) 计算机可读记录介质及计算机设备
CN105931638A (zh) 面向智能机器人的对话系统数据处理方法及装置
CN105206284B (zh) 疏导青少年心理压力的虚拟聊天方法与系统
CN108829682B (zh) 计算机可读存储介质、智能问答方法及智能问答装置
CN102866990A (zh) 一种主题对话方法和装置
CN111666006B (zh) 画作问答方法及装置、画作问答系统、可读存储介质
CN106709072A (zh) 一种基于共享语料库获得智能会话回复内容的方法
CN107103083A (zh) 一种机器人实现智能会话的方法
CN106844734A (zh) 一种自动生成会话回复内容的方法
CN106874452A (zh) 一种获取会话回复内容的方法
CN106649410B (zh) 一种获取聊天回复内容的方法及装置
CN110442700A (zh) 用于人机交互的人机多轮对话方法及系统、智能设备
CN106874451A (zh) 一种自动建立个人专属语料库的方法
CN108595609A (zh) 基于人物ip的机器人回复生成方法、系统、介质及设备
CN112632239A (zh) 基于人工智能技术的类脑问答系统
CN106844735A (zh) 一种自动建立个人专属语料库的方法
CN108540677A (zh) 语音处理方法及系统
CN105808688A (zh) 基于人工智能的补全检索方法及装置
CN106649280B (zh) 一种创建共享语料库的方法
CN112541072B (zh) 一种基于知识图谱的供需信息推荐方法及系统
CN114064943A (zh) 会议管理方法、装置、存储介质及电子设备
CN106657157A (zh) 一种从会话内容中提取会话对的方法
CN107832342A (zh) 机器人聊天方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant