CN106503242B - 一种智能交互方法、装置及服务器 - Google Patents

一种智能交互方法、装置及服务器 Download PDF

Info

Publication number
CN106503242B
CN106503242B CN201610979693.2A CN201610979693A CN106503242B CN 106503242 B CN106503242 B CN 106503242B CN 201610979693 A CN201610979693 A CN 201610979693A CN 106503242 B CN106503242 B CN 106503242B
Authority
CN
China
Prior art keywords
user
session
question
information
session context
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610979693.2A
Other languages
English (en)
Other versions
CN106503242A (zh
Inventor
张泓卿
朱频频
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Zhizhen Intelligent Network Technology Co Ltd
Original Assignee
Shanghai Zhizhen Intelligent Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Zhizhen Intelligent Network Technology Co Ltd filed Critical Shanghai Zhizhen Intelligent Network Technology Co Ltd
Priority to CN201610979693.2A priority Critical patent/CN106503242B/zh
Publication of CN106503242A publication Critical patent/CN106503242A/zh
Application granted granted Critical
Publication of CN106503242B publication Critical patent/CN106503242B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种智能交互方法、装置及服务器,所述方法包括:获取一个或多个会话场景,每个会话场景的界定条件包括两个以上语义信息;在与用户的交互过程中获取问答数据,所述问答数据包括所述用户的请求信息;当所述问答数据包括所述会话场景的界定条件时,确定所述用户所处的会话场景;向所述用户发送与其所处的会话场景对应的反馈信息。所述方法、装置及服务器可以提升反馈的准确性。

Description

一种智能交互方法、装置及服务器
技术领域
本发明涉及数据处理领域,尤其涉及一种智能交互方法、装置及服务器。
背景技术
随着计算机技术的普及,人们的生活已经逐渐走入智能时代。不仅仅是电脑、手机、PAD等终端设备,人们的衣食住行等方方面面都开始应用智能交互技术,例如,智能电视,智能导航,智能家居等。也就是说,智能交互技术将为人们生活的各个方面提供方便、快捷的服务。
现有的交互系统通常在在接收到用户的输入后,做出与输入对应的反馈,难以精确发掘用户需求,反馈的准确性较差。
发明内容
本发明解决的技术问题是提升智能交互方法的反馈的准确性。
为解决上述技术问题,本发明实施例提供一种智能交互方法,包括:获取一个或多个会话场景,每个会话场景的界定条件包括两个以上语义信息;在与用户的交互过程中获取问答数据,所述问答数据包括所述用户的请求信息;
当所述问答数据包括所述会话场景的界定条件时,确定所述用户所处的会话场景;向所述用户发送与其所处的会话场景对应的反馈信息。
可选的,所述智能交互方法还包括:预先设定一个或多个会话场景,确定每个会话场景的界定条件,每个所述语义信息包括多条语义相同但表述不同的语句;当所述问答数据包括的一语句与所述语义信息的语义相似度大于预设值时,则判断所述问答数据包括所述语义信息。
可选的,所述反馈信息包括以下一种或多种:业务推荐信息、产品推荐信息、广告推荐信息和品牌价值引导信息。
可选的,当根据用户的当前请求信息确定所述用户所处的会话场景之后,在向所述用户发送与所述当前请求信息对应的答案信息之后且在获取用户的下一请求信息之前,发送所述反馈信息。
可选的,当确定所述用户所处的会话场景时,在结束与用户的当前交互过程之后,向所述用户单独发送所述反馈信息。
可选的,所述智能交互方法还包括:获取所述用户的个人信息,结合所述个人信息和所述会话场景确定所述反馈信息。
可选的,所述会话场景的界定条件还包括:地址和/或时间;所述问答数据还包括用户发送所述请求信息的地址和/或时间。
可选的,所述会话场景通过以下方式获取:获取多个待处理的会话数据,每个所述待处理的会话数据包含若干个按时间排列的问句;对每个所述待处理的会话数据的第一个问句进行语义聚类处理,得到一个或多个第一分组;分别对属于同一第一分组的每个所述待处理的会话数据的第二个问句进行语义聚类处理,得到一个或多个第二分组;不断重复上述语义聚类处理的过程,分别对属于同一第i分组的每个所述待处理的会话数据的第i+1个问句进行语义聚类处理,得到一个或多个第i+1分组,直至获得满足预设条件的一个或多个叶子分组,其中,i为正整数;基于语义聚类处理的结果,根据所述叶子分组及对应的所有上级分组按照时间顺序排列建立所述会话场景,所述会话场景中每个分组为一个语义信息。
可选的,所述预设条件包括:所述叶子分组及对应的所有上级分组中每个分组所包括的问句的数目大于或等于第二阈值;所述叶子分组为第j分组,j大于或等于第三阈值。
可选的,所述待处理的会话数据是在问答日志或/和开放数据中爬取到的。
本发明实施例还提供一种智能交互装置,包括:会话场景获取单元,适于获取一个或多个会话场景,每个会话场景的界定条件包括两个以上语义信息;问答数据获取单元,适于在与用户的交互过程中获取问答数据,所述问答数据包括所述用户的请求信息;用户会话场景确定单元,适于当所述问答数据包括所述会话场景的界定条件时,确定所述用户所处的会话场景;反馈信息发送单元,适于向所述用户发送与其所处的会话场景对应的反馈信息。
可选的,所述智能交互装置,还包括:会话场景设定单元,适于预先设定一个或多个会话场景,确定每个会话场景的界定条件,每个所述语义信息包括多条语义相同但表述不同的语句;所述用户会话场景确定单元还包括:语义判断单元,适于在所述问答数据包括的一语句与所述语义信息的语义相似度大于预设值时,判断所述问答数据包括所述语义信息。
可选的,所述反馈信息包括以下一种或多种:业务推荐信息、产品推荐信息、广告推荐信息和品牌价值引导信息。
可选的,所述反馈信息发送单元,适于在根据用户的当前请求信息确定所述用户所处的会话场景之后,在向所述用户发送与所述当前请求信息对应的答案信息之后且在获取用户的下一请求信息之前,发送所述反馈信息。
可选的,所述反馈信息发送单元,适于当确定所述用户所处的会话场景时,在结束与用户的当前交互过程之后,向所述用户单独发送所述反馈信息。
可选的,所述智能交互装置还包括:用户信息获取单元,适于获取所述用户的个人信息,结合所述个人信息和所述会话场景确定所述反馈信息。
可选的,所述会话场景的界定条件还包括:地址和/或时间;所述问答数据还包括用户发送所述请求信息的地址和/或时间。
可选的,所述会话场景获取单元,包括:会话数据获取单元,适于获取多个待处理的会话数据,每个所述待处理的会话数据包含若干个按时间排列的问句;叶子分组生成单元,适于对每个所述待处理的会话数据的第一个问句进行语义聚类处理,得到一个或多个第一分组;分别对属于同一第一分组的每个所述待处理的会话数据的第二个问句进行语义聚类处理,得到一个或多个第二分组;不断重复上述语义聚类处理的过程,分别对属于同一第i分组的每个所述待处理的会话数据的第i+1个问句进行语义聚类处理,得到一个或多个第i+1分组,直至获得满足预设条件的一个或多个叶子分组,其中,i为正整数;会话场景建立单元,适于基于语义聚类处理的结果,根据所述叶子分组及对应的所有上级分组按照时间顺序排列建立所述会话场景,所述会话场景中每个分组为一个语义信息。
可选的,所述预设条件包括:所述叶子分组及对应的所有上级分组中每个分组所包括的问句的数目大于或等于第二阈值;所述叶子分组为第j分组,j大于或等于第三阈值。
可选的,所述待处理的会话数据是在问答日志或/和开放数据中爬取到的。
本发明实施例还提供一种服务器,配置有如权利要求11至19任一项所述的智能交互装置。
可选的,所述待处理的会话数据是在问答日志或/和开放数据中爬取到的。
与现有技术相比,本发明实施例的技术方案具有以下有益效果:
在本发明实施例中,通过获取一个或多个会话场景,当与用户交互过程中的问答数据是否包括述会话场景的界定条件时,确定所述用户所处的会话场景,并向所述用户发送与其所处的会话场景对应的反馈信息。由于每个会话场景的界定条件包括两个以上语义信息,当所述问答数据包括所述会话场景的界定条件时,可以确定用户所处的会话场景为相应的会话场景,从而可以更为精确地发掘用户的需求,进而可以做出更符合用户需求的反馈。
附图说明
图1是本发明实施例中一种智能交互方法的流程图;
图2是本发明实施例中一种获取会话场景的方法的流程图;
图3是本发明实施例中一种语义聚类过程对应的树结构的示意图;
图4是本发明实施例中一种智能交互装置的结构示意图;
图5是图4中会话场景获取单元的一种具体实现的结构示意图。
具体实施方式
如前所述,现有的交互系统通常在在接收到用户的输入后,做出与输入对应的反馈,难以精确发掘用户需求,反馈的准确性较差。
在智能交互领域中,针对用户需求在做出与用户输入的回答之外,向用户进行反馈,以发送针对性的信息的需求越来越多。这通常需要发掘用户需求,仅仅根据用户的某次输入进行反馈的精确性较差。
在本发明实施例中,通过获取一个或多个会话场景,在与用户的交互过程中获取问答数据,并判断问答数据是否包括会话场景的界定条件,当所述问答数据包括所述会话场景的界定条件时,确定所述用户所处的会话场景。由于会话场景中的界定条件包括两个以上语义信息,故会话场景相比用户的单条问句可以更准确的反应用户需求,从而可以通过判断问答数据是否包含会话场景的界定条件,对用户需求进行区分,进而可以根据会话场景,对用户进行更加准确的进行反馈。
为使本发明的上述目的、特征和有益效果能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
图1是本发明实施例中一种智能交互方法的流程图。
在步骤S11中,获取一个或多个会话场景,每个会话场景的界定条件包括两个以上语义信息。
会话场景可以是反应用户实际需求的场景,获取一个或多个会话场景可以是从实际的会话中获取。实际的会话可以来源于智能交互系统的已有数据,或者相应领域的电商、垂直网站(例如京东,汽车之家,苏宁)以及贴吧等开放数据中爬取的。会话场景中包含的两个以上的语义信息可以是通过对多个实际的会话进行语义聚类处理得到。
通过聚类处理得到的会话场景中,语义信息可以是有时间顺序的,也可以是无时间顺序的。
获取一个或多个会话场景也可以是获取预先设定的一个或多个会话场景,预先设定的会话场景中包含所述界定条件。
在步骤S12中,在与用户的交互过程中获取问答数据,所述问答数据包括所述用户的请求信息。
问答数据可以是用户与智能系统进行交互时的数据,其中来自用户的请求信息通常被称为问句,来自智能系统的语句通常被称为答句。本发明实施例中的问答数据与用户具有对应关系,例如可以是对应于某个ID的问答数据,也可以是在同一交互过程中的问答数据,或者利用页面进行交互时,可以是同一页面的问答数据。
在步骤S13中,当所述问答数据包括所述会话场景的界定条件时,确定所述用户所处的会话场景。
可以在每次接收到新的请求信息后,将问答数据中的请求信息与所述语义信息进行比较,直至确定问答数据中包括一个或多个会话场景中任一个会话场景的界定条件。
当确定问答数据包括会话场景界定条件中一语义信息后,对后续的请求信息,可以仅判断是否包括该语义信息以外的其他界定条件,直至确定问答数据中包括一个或多个会话场景中任一个会话场景的界定条件,以确定所述用户所处的会话场景。
确定所述用户所处的会话场景可以是从获取到的一个或多个会话场景中确定。
在步骤S14中,向所述用户发送与其所处的会话场景对应的反馈信息。
在具体实施中,所述反馈信息包括以下一种或多种:业务推荐信息、产品推荐信息、广告推荐信息和品牌价值引导信息。
在一具体实现中,每个所述语义信息可以包括多条语义相同但表述不同的语句,例如一条语义信息可以包括:“XX品牌好不好”、“XX品牌怎么样”、“XX品牌值得购买吗”等语句。
当所述问答数据包括的一语句与所述语义信息的语义相似度大于或等于预设值时,则判断所述问答数据包括所述语义信息。
沿用上例,当问答数据包括语句“XX品牌好吗”时,若经判断,该语句与所述语义信息的语义相似度大于或等于预设值,则可以确定问答数据包括所述语义信息。
在另一具体实现中,也可以对会话场景中界定条件包括的每个语义信息进行相似语句拓展,比较用户问答数据中的语句与语义信息包含的语句与拓展后的语句,当所述问答数据中语句和语义信息包含的语句与拓展后的语句中任一语句相似度大于或等于预设值,则判定当所述问答数据包括所述语义信息。
当会话场景的界定条件仅包含两个以上的语义信息时,若用户的问答数据中包含界定条件中的每个语义信息,则可以确定问答数据包括所述会话场景的界定条件,进而可以确定用户处于该会话场景,并向所述用户发送与其所处的会话场景对应的反馈信息。
例如,一个会话场景的界定条件中的语义信息包括如下语句:“XX品牌手机怎么样”“屏幕碎了怎么办”,与会话场景对应的反馈信息为XX手机屏幕保险的内容。
可以对“XX品牌手机怎么样”以及“屏幕碎了怎么办”分别进行语义扩展,以使得语义信息包括更多的同义语句。
当每次接收到用户的请求信息后,可以判断请求信息与语义信息中的语句的相似度是否大于预设值。
假设交互过程中用户的问答数据依次为:“XX品牌手机好吗”“屏幕碎了”“XX手机能换新吗”。
在经判断,问答数据中请求信息“XX品牌手机好吗”包含“XX品牌手机怎么样”对应的语义信息,则对后续接收到的请求信息,可以仅判断请求信息是否包括另一语义信息,也即“屏幕碎了怎么办”对应的语义信息。
当接收到“屏幕碎了”时,经判断认为所述问答数据包括该会话场景的界定条件,则可以向用户发送XX手机屏幕保险的内容。
具体地,可以在对用户的请求信息“屏幕碎了”进行回应后,例如,向用户发送XX手机售后途径后,向用户发送XX手机屏幕保险的内容;也可以在与用户当前的交互过程结束后,也即在对“XX手机能换新吗”进行回应后,向用户发送XX手机屏幕保险的内容。
可以看出,在具体实施中,当根据用户的当前请求信息确定所述用户所处的会话场景之后,可以在向所述用户发送与所述当前请求信息对应的答案信息之后且在获取用户的下一请求信息之前,发送所述反馈信息。
确定所述用户所处的会话场景时,也可以在结束与用户的当前交互过程之后,向所述用户单独发送所述反馈信息。
在具体实施中,还可以获取所述用户的个人信息,结合所述个人信息和所述会话场景确定所述反馈信息。
相应地,一个会话场景可以对应多种反馈信息中,不同的反馈信息可以对应于不同的个人信息,例如,在一个会话场景的对应反馈信息中,可以有根据性别进行划分的反馈信息、根据年龄段进行划分的反馈信息、和/或根据兴趣偏好进行划分的反馈信息等。
在一具体实现中,所述会话场景的界定条件还包括:地址和/或时间;所述问答数据还包括用户发送所述请求信息的地址和/或时间。如:会话场景的界定条件包括两个,一个为地址,另一个为“屏幕碎了怎么办”的语义信息,此时的地址也作为一个语义信息。
由于对应不同地址的用户,其需求可能差异较大,另外,反馈信息可以是有时效性的信息,故可以结合地址和/或时间界定会话场景,以更加精确的定位用户需求并进行反馈信息的发送。
参见图2,在一具体实现中,会话场景可以通过步骤S21至S23获取。
在步骤S21中,获取多个待处理的会话数据,每个所述待处理的会话数据包含若干个按时间排列的问句。
在具体实施中,按照目标领域,可以采用多种方式获取所述待处理的会话数据。比如,可以从领域日志中爬取所述待处理的会话数据,还可以从相应领域的电商、垂直网站(例如京东,汽车之家,苏宁)以及贴吧等开放数据中爬取所述待处理的会话数据。
需要说明的是,在具体实施中,所获取的每个待处理的会话数据中,问句的数目可以相同,也可以不同,具体不受限制。在从领域日志及开放数据中获取所述待处理的会话数据时,可以先对爬取的会话数据进行筛选,将筛选出的会话数据作为所述待处理的会话数据。比如,可以将爬取的会话数据中问句的数目大于或等于第一阈值的会话数据作为所述待处理的会话数据,其中,所述第一阈值可以根据实际情况进行设置。
例如,待处理的会话数据可以包括如下四个问句:
Q1:什么是安吉星
Q2:好用么
Q3:多少钱
Q4:跟安捷星比有什么优点
在步骤S22中,对每个所述待处理的会话数据进行聚类处理,以得到叶子分组及对应的所有上级分组。
具体地,对每个所述待处理的会话数据的第一个问句进行语义聚类处理,得到一个或多个第一分组;分别对属于同一第一分组的每个所述待处理的会话数据的第二个问句进行语义聚类处理,得到一个或多个第二分组;不断重复上述语义聚类处理的过程,分别对属于同一第i分组的每个所述待处理的会话数据的第i+1个问句进行语义聚类处理,得到一个或多个第i+1分组,直至获得满足预设条件的一个或多个叶子分组,其中,i为正整数。
在具体实施中,可以采用多种方式对各个问句进行语义聚类处理。比如,可以通过计算各个问句之间的语义相似度,并在语义相似度的值大于一定阈值时,将相应问句作为一个聚类。
上述语义聚类过程可以形成一树结构,每个分组表示一个聚类结果并作为该树结构的一个结点。其中,第一分组为该树结构的第一个层次中的结点,第二分组为该树结构的第二个层次中的结点,第i分组为该树结构的第i个层次中的结点,第i+1分组为该树结构的第i+1个层次中的结点。每一层次所包含的分组的数目可以相同,也可以不同。所述叶子分组为该树结构的叶子结点,也叫终端结点。除叶子分组外,每个分组都有子结点。所述叶子分组所在分支的其它结点,也就是与所述叶子分组位于同一分支的所有上级分组为所述叶子分组的祖先分组。
在本发明的一实施例中,所述预设条件可以包括:所述叶子分组及对应的所有上级分组中每个分组所包括的问句的数目大于或等于第二阈值;所述叶子分组位于第j分组,j大于或等于第三阈值。
在具体实施中,所述第二阈值及第三阈值可以根据实际情况进行设置,比如,所述第二阈值可以为2,所述第三阈值为3。在所述语义聚类处理的过程中,通过所述预设条件可以获得所述叶子分组。
为了描述方便,以第i分组表示语义聚类过程中获得的任一分组为例,在具体实施中,既可以在对各待处理的会话数据的全部问句进行语义聚类处理,获得对应树结构的全部终端结点后,再从所述全部终端结点中筛选出符合预设条件的终端结点;也可以在每获得一第i分组后,即通过所述预设条件对所获得的第i分组进行判断,并在满足所述预设条件后继续后续流程,否则删除该第i分组。
比如,当所述第i分组非终端结点时,若第i分组中问句的数目大于第二阈值,则对属于同一第i分组的每个所述待处理的会话数据的第i+1个问句进行语义聚类处理,得到一个或多个第i+1分组。当所述第i分组为终端结点时,若i大于或等于第三阈值,则所述第i分组为满足所述预设条件的叶子分组,否则删除该第i分组。由此,语义聚类处理结束后,所获得的终端结点均为满足所述预设条件的叶子分组。
参照图3,下面以获取5个待处理的会话数据s1,s2,s3,s4及s5,所述第二阈值为2,所述第三阈值为4为例,对上述语义聚类处理过程进行详细说明。其中,每个待处理的会话数据包括的问句如下:
s1={Q11,Q12,Q13,Q14},
s2={Q21,Q22,Q23,Q24},
s3={Q31,Q32,Q33,Q34,Q35},
s4={Q41,Q42,Q43,Q44,Q45},
s5={Q51,Q52,Q53,Q54,Q55}。
首先,对s1~s5中的第一个问句{Q11,Q21,Q31,Q41,Q51}进行聚类,得到一个第一分组Z1={Q11,Q21,Q31,Q41,Q51}。第一分组Z1位于对应树结构的第一个层次L1。
接着,对s1~s5中的第二个问句{Q12,Q22,Q32,Q42,Q52}进行聚类,得到两个第二分组Z21={Q12,Q32,Q42,Q52},Z22={Q22}。第二分组Z21及Z22位于对应树结构的第二个层次L2。此时,由于第二分组Z22中仅存在Q22这一个问句(即该分组中包括的问句的数目小于第二阈值),故删除第二分组Z22。
然后,对s1、s3、s4及s5中的第三个问句进行聚类,得到两个第三分组Z31={Q13,Q33},Z32={Q43,Q53}。第三分组Z31及Z32位于对应树结构的第三个层次L3。
接着,对s1及s3中的第四个问句进行聚类,得到一个第四分组Z41={Q14,Q34}。对s4及s5的第四个问句进行聚类,得到两个第四分组Z42及Z43,其中,Z42={Q44},Z43={Q54}。第四分组Z41、Z42及Z43位于对应树结构的第四个层次L4。
其中:由于待处理的会话数据s1仅存在4个问句,第四分组Z41所在的分组数等于第三阈值,并且第四分组Z41中问句的数目等于第二阈值,第四分组Z41的各上级分组中包括的问句数目均大于或等于第二阈值,因此,所述第四分组Z41为满足所述预设条件的叶子分组。而Z42及Z43中仅存在一个问句,即Z42及Z43中问句的数目小于第二阈值,故删除Z42及Z43。另外,由于Z32所在的分组数小于第三阈值,故删除第三分组Z32。
最后,将s3中的第五个问句Q35单独聚为一类,得到第五分组Z5={Q35}。第五分组Z5位于对应树结构的第五个层次L5。由于与第五分组Z5位数目中所包含的问句数目小于第二阈值,故删除第五分组Z5。
最终得到的满足所述预设条件的叶子分组为Z41。
继续参见图2,在步骤S23中,基于语义聚类处理的结果,根据所述叶子分组及对应的所有上级分组按照时间顺序排列建立所述会话场景,所述会话场景中每个分组为一个语义信息。
在具体实施中,根据每个所述叶子分组及对应的所有上级分组,也就是根据所述叶子分组及其祖先分组(后续将所有的上级分组称为祖先分组),可以采用多种方式建立相应的场景会话序列。
在本发明的一实施例中,可以直接从所述叶子分组及对应的所有上级分组中分别选取一问句,将所选取的问句按照时间顺序排列作为对应的场景会话序列。其中,从每个分组中选取问句可以为该分组中的任意问句,由于该分组中各问句之间的语义相似,因此,无论从该分组中选取问句的结果如何,均不会对该场景序列对应的知识点产生较大的影响。
例如,对于叶子分组Z41及其祖先分组Z31、Z21及Z1,对应的场景会话序列可以为{Q11,Q12,Q13,Q14},也可以为{Q11,Q21,Q33,Q34}。
在本发明的另一实施例中,所述场景会话序列可以包括:标准问句及扩展问句。其中,所述标准问句即按照常用形式表现的问句,所述扩展问句即与标准问句相同语义但形式不同的问句。比如,标准问句为“这支笔多少钱”时,对应的扩展问句可以包括“这支笔的价格是多少”、“这支笔的价格怎么样”及“这支笔的市场价是多少”。
根据每个所述叶子分组及对应的所有上级分组,也就是根据所述叶子分组及其祖先分组建立相应的场景会话序列时,可以分别将所述叶子分组的语义及所述叶子分组对应的所有上级分组的语义按照时间顺序排列作为对应的场景会话序列的标准问句,而将所述叶子分组及对应的所有上级分组中不同于所述语义的问句作为对应标准问句的扩展问句。
比如,对于叶子分组Z41及其祖先分组Z31、Z21及Z1,建立对应的场景会话序列时,可以分别将Z41、Z31、Z21及Z1的语义作为该场景会话序列的标准问句,而将Q14及Q34作为Z41对应的标准问句的扩展问句,将Q13及Q33作为Z31对应的标准问句的扩展问句,将Q12、Q32、Q42及Q52作为Z21对应的标准问句的扩展问句,将Q11、Q21、Q31、Q41及Q51作为Z1对应的标准问句的扩展问句。
可以理解的是,如图2所示的获取会话场景的方法,得到的会话场景的界定条件中包含的各个语义信息之间可以是有时间顺序的。对应的,在判断答数据是否包括所述会话场景的界定条件时,应当是按照语义的顺序依次进行判断。
如前所述,会话场景的界定条件中包含的各个语义信息之间也可以是无时间顺序的,若会话场景的界定条件中包含的各个语义信息之间无时间顺序,则在判断答数据是否包括所述会话场景的界定条件时,问答数据中的请求信息可以以任意的顺序与界定条件中的语义信息进行匹配,直至确定所述用户所处的会话场景。
故会话场景中语义信息之间的顺序可以在判断答数据是否包括所述会话场景的界定条件的过程中体现,如图2所示的获取会话场景的方法得到的会话场景也可以作为语义信息之间无时间顺序的会话场景应用。
在本发明实施例中,通过获取一个或多个会话场景,在与用户的交互过程中获取问答数据,并判断问答数据是否包括会话场景的界定条件,当所述问答数据包括所述会话场景的界定条件时,确定所述用户所处的会话场景。由于会话场景中的界定条件包括两个以上语义信息,故会话场景相比用户的单条问句可以更准确的反应用户需求,从而可以通过判断问答数据是否包含会话场景的界定条件,对用户需求进行区分,进而可以根据会话场景,对用户进行更加准确的进行反馈。
本发明实施例还提供一种智能交互装置,其结构示意图参见图4,具体可以包括:
会话场景获取单元41,适于获取一个或多个会话场景,每个会话场景的界定条件包括两个以上语义信息;
问答数据获取单元42,适于在与用户的交互过程中获取问答数据,所述问答数据包括所述用户的请求信息;
用户会话场景确定单元43,适于当所述问答数据包括所述会话场景的界定条件时,确定所述用户所处的会话场景;
反馈信息发送单元44,适于向所述用户发送与其所处的会话场景对应的反馈信息。
在具体实施中,智能交互装置还可以包括会话场景设定单元45,适于预先设定一个或多个会话场景,确定每个会话场景的界定条件,每个所述语义信息包括多条语义相同但表述不同的语句;
所述用户会话场景确定单元43还包括:语义判断单元(图未示),适于在所述问答数据包括的一语句与所述语义信息的语义相似度大于预设值时,判断所述问答数据包括所述语义信息。
在具体实施中,所述反馈信息包括以下一种或多种:业务推荐信息、产品推荐信息、广告推荐信息和品牌价值引导信息。
在一具体实现中,所述反馈信息发送单元44,适于在根据用户的当前请求信息确定所述用户所处的会话场景之后,在向所述用户发送与所述当前请求信息对应的答案信息之后且在获取用户的下一请求信息之前,发送所述反馈信息。
在另一具体实现中,所述反馈信息发送单元44,适于当确定所述用户所处的会话场景时,在结束与用户的当前交互过程之后,向所述用户单独发送所述反馈信息。
在具体实施中,所述智能交互装置还可以包括:用户信息获取单元46,适于获取所述用户的个人信息,结合所述个人信息和所述会话场景确定所述反馈信息。
在具体实施中,所述会话场景的界定条件还包括:地址和/或时间;所述问答数据还包括用户发送所述请求信息的地址和/或时间。
参见图5,在具体实施中,所述会话场景获取单元41可以包括:
会话数据获取单元51,适于获取多个待处理的会话数据,每个所述待处理的会话数据包含若干个按时间排列的问句;
叶子分组生成单元52,适于对每个所述待处理的会话数据的第一个问句进行语义聚类处理,得到一个或多个第一分组;分别对属于同一第一分组的每个所述待处理的会话数据的第二个问句进行语义聚类处理,得到一个或多个第二分组;不断重复上述语义聚类处理的过程,分别对属于同一第i分组的每个所述待处理的会话数据的第i+1个问句进行语义聚类处理,得到一个或多个第i+1分组,直至获得满足预设条件的一个或多个叶子分组,其中,i为正整数;
会话场景建立单元53,适于基于语义聚类处理的结果,根据所述叶子分组及对应的所有上级分组按照时间顺序排列建立所述会话场景,所述会话场景中每个分组为一个语义信息。
在具体实施中,所述预设条件可以包括:
所述叶子分组及对应的所有上级分组中每个分组所包括的问句的数目大于或等于第二阈值;
所述叶子分组为第j分组,j大于或等于第三阈值。
在具体实施中,所述待处理的会话数据可以是在问答日志或/和开放数据中爬取到的。
本发明实施例中智能交互装置涉及的名词及各个单元的工作原理可以参照智能交互方法,在此不再赘述。
具体地,所述智能交互装置可以是问答机器人、手机等电子设备。
本发明实施例中智能交互装置可以利用通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它可编程逻辑器件、分立的门或晶体管逻辑、分立的硬件组件、或其设计成执行本文所描述功能的任何组合来实现或执行。
通用处理器可以是微处理器,但在替换方案中,该处理器可以是任何常规的处理器、控制器、微控制器、或状态机。处理器还可以被实现为计算设备的组合,例如DSP与微处理器的组合、多个微处理器、与DSP核心协作的一个或多个微处理器、或任何其他此类配置。
本发明实施例还提供一种服务器,配置有所述智能交互装置。服务器可以是单台服务器或服务器集群。
与现有业务推荐技术比较而言,语义的理解和用户场景的判断信息与内容更加符合用户自发意愿,更能体现交互时用户真实的需求内容。当前的关键词对业务需求准确率匹配极低,用户属性分类固定但忽略特定场景下的具体需求,用户使用行为有更多随机性、非关联性和信息干扰。
因本发明对用户需求判定的精准度较高,除去单独建立对话系统外,本发明可以完全并行于现有的电商客服、人机交互、对话咨询系统。也可以仅应用于业务推荐。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:ROM、RAM、磁盘或光盘等。
虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。

Claims (20)

1.一种智能交互方法,其特征在于,包括:
获取一个或多个会话场景,每个会话场景的界定条件包括两个以上语义信息;
在与用户的交互过程中获取问答数据,所述问答数据包括所述用户的请求信息;
当所述问答数据包括所述会话场景的界定条件时,确定所述用户所处的会话场景;
向所述用户发送与其所处的会话场景对应的反馈信息;
所述会话场景通过以下方式获取:
获取多个待处理的会话数据,每个所述待处理的会话数据包含若干个按时间排列的问句;
对每个所述待处理的会话数据的第一个问句进行语义聚类处理,得到一个或多个第一分组;分别对属于同一第一分组的每个所述待处理的会话数据的第二个问句进行语义聚类处理,得到一个或多个第二分组;不断重复上述语义聚类处理的过程,分别对属于同一第i分组的每个所述待处理的会话数据的第i+1个问句进行语义聚类处理,得到一个或多个第i+1分组,直至获得满足预设条件的一个或多个叶子分组,其中,i为正整数;
基于语义聚类处理的结果,根据所述叶子分组及对应的所有上级分组按照时间顺序排列建立所述会话场景,所述会话场景中每个分组为一个语义信息。
2.根据权利要求1所述的智能交互方法,其特征在于,还包括:预先设定一个或多个会话场景,确定每个会话场景的界定条件,每个所述语义信息包括多条语义相同但表述不同的语句;当所述问答数据包括的一语句与所述语义信息的语义相似度大于预设值时,则判断所述问答数据包括所述语义信息。
3.根据权利要求1所述的智能交互方法,其特征在于,所述反馈信息包括以下一种或多种:业务推荐信息、产品推荐信息、广告推荐信息和品牌价值引导信息。
4.根据权利要求1所述的智能交互方法,其特征在于,当根据用户的当前请求信息确定所述用户所处的会话场景之后,在向所述用户发送与所述当前请求信息对应的答案信息之后且在获取用户的下一请求信息之前,发送所述反馈信息。
5.根据权利要求1所述的智能交互方法,其特征在于,当确定所述用户所处的会话场景时,在结束与用户的当前交互过程之后,向所述用户单独发送所述反馈信息。
6.根据权利要求1所述的智能交互方法,其特征在于,还包括:获取所述用户的个人信息,结合所述个人信息和所述会话场景确定所述反馈信息。
7.根据权利要求1所述的智能交互方法,其特征在于,所述会话场景的界定条件还包括:地址和/或时间;所述问答数据还包括用户发送所述请求信息的地址和/或时间。
8.根据权利要求1所述的智能交互方法,其特征在于,所述预设条件包括:所述叶子分组及对应的所有上级分组中每个分组所包括的问句的数目大于或等于第二阈值;
所述叶子分组为第j分组,j大于或等于第三阈值。
9.根据权利要求1或8所述的智能交互方法,其特征在于,所述待处理的会话数据是在问答日志或/和开放数据中爬取到的。
10.一种智能交互装置,其特征在于,包括:
会话场景获取单元,适于获取一个或多个会话场景,每个会话场景的界定条件包括两个以上语义信息;
问答数据获取单元,适于在与用户的交互过程中获取问答数据,所述问答数据包括所述用户的请求信息;
用户会话场景确定单元,适于当所述问答数据包括所述会话场景的界定条件时,确定所述用户所处的会话场景;
反馈信息发送单元,适于向所述用户发送与其所处的会话场景对应的反馈信息;
所述会话场景获取单元,包括:
会话数据获取单元,适于获取多个待处理的会话数据,每个所述待处理的会话数据包含若干个按时间排列的问句;
叶子分组生成单元,适于对每个所述待处理的会话数据的第一个问句进行语义聚类处理,得到一个或多个第一分组;分别对属于同一第一分组的每个所述待处理的会话数据的第二个问句进行语义聚类处理,得到一个或多个第二分组;不断重复上述语义聚类处理的过程,分别对属于同一第i分组的每个所述待处理的会话数据的第i+1个问句进行语义聚类处理,得到一个或多个第i+1分组,直至获得满足预设条件的一个或多个叶子分组,其中,i为正整数;
会话场景建立单元,适于基于语义聚类处理的结果,根据所述叶子分组及对应的所有上级分组按照时间顺序排列建立所述会话场景,所述会话场景中每个分组为一个语义信息。
11.根据权利要求10所述的智能交互装置,其特征在于,还包括:
会话场景设定单元,适于预先设定一个或多个会话场景,确定每个会话场景的界定条件,每个所述语义信息包括多条语义相同但表述不同的语句;
所述用户会话场景确定单元还包括:语义判断单元,适于在所述问答数据包括的一语句与所述语义信息的语义相似度大于预设值时,判断所述问答数据包括所述语义信息。
12.根据权利要求10所述的智能交互装置,其特征在于,所述反馈信息包括以下一种或多种:业务推荐信息、产品推荐信息、广告推荐信息和品牌价值引导信息。
13.根据权利要求10所述的智能交互装置,其特征在于,所述反馈信息发送单元,适于在根据用户的当前请求信息确定所述用户所处的会话场景之后,在向所述用户发送与所述当前请求信息对应的答案信息之后且在获取用户的下一请求信息之前,发送所述反馈信息。
14.根据权利要求10所述的智能交互装置,其特征在于,所述反馈信息发送单元,适于当确定所述用户所处的会话场景时,在结束与用户的当前交互过程之后,向所述用户单独发送所述反馈信息。
15.根据权利要求10所述的智能交互装置,其特征在于,还包括:用户信息获取单元,适于获取所述用户的个人信息,结合所述个人信息和所述会话场景确定所述反馈信息。
16.根据权利要求10所述的智能交互装置,其特征在于,所述会话场景的界定条件还包括:地址和/或时间;所述问答数据还包括用户发送所述请求信息的地址和/或时间。
17.根据权利要求10所述的智能交互装置,其特征在于,所述预设条件包括:所述叶子分组及对应的所有上级分组中每个分组所包括的问句的数目大于或等于第二阈值;
所述叶子分组为第j分组,j大于或等于第三阈值。
18.根据权利要求10或17所述的智能交互装置,其特征在于,所述待处理的会话数据是在问答日志或/和开放数据中爬取到的。
19.一种服务器,其特征在于,配置有如权利要求10至17任一项所述的智能交互装置。
20.根据权利要求19所述的服务器,其特征在于,所述待处理的会话数据是在问答日志或/和开放数据中爬取到的。
CN201610979693.2A 2016-11-08 2016-11-08 一种智能交互方法、装置及服务器 Active CN106503242B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610979693.2A CN106503242B (zh) 2016-11-08 2016-11-08 一种智能交互方法、装置及服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610979693.2A CN106503242B (zh) 2016-11-08 2016-11-08 一种智能交互方法、装置及服务器

Publications (2)

Publication Number Publication Date
CN106503242A CN106503242A (zh) 2017-03-15
CN106503242B true CN106503242B (zh) 2019-04-19

Family

ID=58323356

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610979693.2A Active CN106503242B (zh) 2016-11-08 2016-11-08 一种智能交互方法、装置及服务器

Country Status (1)

Country Link
CN (1) CN106503242B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106951964A (zh) * 2017-03-20 2017-07-14 海桂珍 一种基于心理学知识的人工智能学习系统及其方法
CN107357855B (zh) * 2017-06-29 2018-06-08 北京神州泰岳软件股份有限公司 支持场景关联的智能问答方法及装置
CN107977866A (zh) * 2017-12-14 2018-05-01 北京木业邦科技有限公司 木材产品推荐方法、装置及计算机可读存储介质
CN110019718B (zh) * 2017-12-15 2021-04-09 上海智臻智能网络科技股份有限公司 修改多轮问答系统的方法、终端设备以及存储介质
US11341422B2 (en) 2017-12-15 2022-05-24 SHANGHAI XIAOl ROBOT TECHNOLOGY CO., LTD. Multi-round questioning and answering methods, methods for generating a multi-round questioning and answering system, and methods for modifying the system
CN110807152B (zh) * 2019-10-31 2022-06-07 武汉天喻教育科技有限公司 基于多业务的推荐引擎系统的创建方法和存储介质
CN112163078B (zh) * 2020-09-29 2024-06-07 彩讯科技股份有限公司 智能应答方法、装置、服务器及存储介质
CN116932926B (zh) * 2023-09-14 2023-11-17 深圳酷宅科技有限公司 应用于智能家居控制的数据分析方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102868695A (zh) * 2012-09-18 2013-01-09 天格科技(杭州)有限公司 基于会话树的智能在线客服方法及系统
CN104639428A (zh) * 2015-02-10 2015-05-20 深圳市中兴移动通信有限公司 即时通讯中会话场景的自适应方法和移动终端
CN104809062A (zh) * 2015-04-22 2015-07-29 北京京东尚科信息技术有限公司 一种人工智能应答系统的测试方法及系统
CN105553833A (zh) * 2015-12-30 2016-05-04 上海智臻智能网络科技股份有限公司 客服系统及其服务方法、机器人客服
CN105630938A (zh) * 2015-12-23 2016-06-01 深圳市智客网络科技有限公司 一种智能问答系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102868695A (zh) * 2012-09-18 2013-01-09 天格科技(杭州)有限公司 基于会话树的智能在线客服方法及系统
CN104639428A (zh) * 2015-02-10 2015-05-20 深圳市中兴移动通信有限公司 即时通讯中会话场景的自适应方法和移动终端
CN104809062A (zh) * 2015-04-22 2015-07-29 北京京东尚科信息技术有限公司 一种人工智能应答系统的测试方法及系统
CN105630938A (zh) * 2015-12-23 2016-06-01 深圳市智客网络科技有限公司 一种智能问答系统
CN105553833A (zh) * 2015-12-30 2016-05-04 上海智臻智能网络科技股份有限公司 客服系统及其服务方法、机器人客服

Also Published As

Publication number Publication date
CN106503242A (zh) 2017-03-15

Similar Documents

Publication Publication Date Title
CN106503242B (zh) 一种智能交互方法、装置及服务器
CN106155522B (zh) 会话数据处理、知识库建立、优化、交互方法及装置
CN105391730B (zh) 一种信息反馈方法、装置及系统
AU2017206197A1 (en) Virtual assistant interactivity platform
CN108519998B (zh) 基于知识图谱的问题引导方法及装置
US9864855B2 (en) Verification data processing method and device and storage medium
JP7029003B2 (ja) パスワード保護質問設定方法及び装置
US20180075014A1 (en) Conversational artificial intelligence system and method using advanced language elements
CN104980421B (zh) 一种批量请求处理方法及系统
CN105871690A (zh) 即时通信的实现方法和装置
CN104917739A (zh) 虚假账号的识别方法及装置
US20190050376A1 (en) Automatic value formatting based on intrinsic structural semantics
US9369536B1 (en) Event-based user behavior timeline, predictions, and recommendations
CN106570013A (zh) 页面访问数据的处理方法和装置
CN105279168A (zh) 支持自然语言的数据查询方法、开放平台及用户终端
CN107784068A (zh) 数据变化的获取方法、装置、存储介质、处理器及服务端
US9177127B1 (en) Confounder generation in knowledge-based authentication for an enterprise
CN109635086A (zh) 一种应用于知识平台的知识推荐方法及装置
CN105871585A (zh) 终端关联方法及装置
CN110837549B (zh) 一种信息处理方法、装置及存储介质
US10037417B1 (en) Transformation of network activity data for user identification
CN106257520A (zh) 解析应答方法及系统
CN111026972B (zh) 物联网中的订阅数据推送方法、装置、设备及存储介质
CN109829033A (zh) 数据展示方法和终端设备
EP3216266B1 (en) Generating network resource

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant