CN112395400A - 对话状态获取方法、系统、可读存储介质及电子设备 - Google Patents

对话状态获取方法、系统、可读存储介质及电子设备 Download PDF

Info

Publication number
CN112395400A
CN112395400A CN202011290076.4A CN202011290076A CN112395400A CN 112395400 A CN112395400 A CN 112395400A CN 202011290076 A CN202011290076 A CN 202011290076A CN 112395400 A CN112395400 A CN 112395400A
Authority
CN
China
Prior art keywords
cluster
preset
preset attribute
clusters
distribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011290076.4A
Other languages
English (en)
Other versions
CN112395400B (zh
Inventor
冯伟
武晓飞
郭强
王文彬
董志雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beike Technology Co Ltd
Original Assignee
Beike Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beike Technology Co Ltd filed Critical Beike Technology Co Ltd
Priority to CN202011290076.4A priority Critical patent/CN112395400B/zh
Publication of CN112395400A publication Critical patent/CN112395400A/zh
Application granted granted Critical
Publication of CN112395400B publication Critical patent/CN112395400B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Human Computer Interaction (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及人工智能技术领域,公开一种对话状态获取方法及系统。所述对话状态获取方法包括:对目标对象的多个样本进行拟合,以获取目标对象的多个聚类、每个聚类的多元分布及每个聚类的先验概率,其中每个样本为包括相互关联的多个预设属性的属性值的第一预设属性向量,以及每个聚类的多元分布为属于每个聚类的第一预设属性向量的分布;以及基于每个聚类的多元分布、所述每个聚类的先验概率及吉布斯采样方法,获取属于特定聚类的特定预设属性向(其为满足所述用户对话条件的所述目标对象的预设状态)。本发明可在人机辅助场景中快速推理得到满足用户对话的最优状态,以实现精准的对话状态追踪。

Description

对话状态获取方法、系统、可读存储介质及电子设备
技术领域
本发明涉及人工智能技术领域,具体地涉及一种对话状态获取方法、对话状态获取系统、可读存储介质及电子设备。
背景技术
目前的智能对话场景中,DST(Dialogue State Tracking,对话状态追踪)是用于概括从对话初始时刻到当前时刻的整体信息的一种技术,其目的在于为系统动作决策提供充分的数据支撑。通常,DST的核心技术手段是确定对话过程中的关键槽位分布,具体地,DST的过程就是根据截止至t-1时刻的对话槽位分布和当前t时刻nlu观测结果(主要包括t时刻的槽位分布)来推断截止至t时刻的对话槽位分布。
在一般的任务型人机对话中,DST所采用的最常用且有效的方法之一是通过话术澄清方式将不确定的槽位内容进行确定(比如在买房场景中,系统在对话中发现用户可接受的房屋总价:50%概率为100w,50%概率为300w,那么通过向用户澄清询问可以有效确定房屋总价)。这种话术澄清方式适用于单个槽位与相应的槽位值的澄清场景。
然而,咨询助手的IM场景(人机辅助场景,即人与人之间的对话,机器对其中一方进行对话辅助提示)所涉及的逻辑复杂且槽位及槽位值的种类繁多,即其涉及多种内容推理、运算等场景(需要设立各种背景知识、常识、习惯等因素),而且对话轮数偏长。由于各个槽位之间相互关联,无法进行话术澄清(并且在IM场景中,被辅助者几乎不会采纳澄清话术),这会使DST实现难度大增。如果在对话过程中对槽位值的置信分布产生歧义(无法通过澄清解决),会对后面继续追踪状态及其他依赖状态而执行的操作产生很大影响。
发明内容
本发明的目的是提供一种对话状态获取方法及、对话状态获取系统、可读存储介质及电子设备,其在人机辅助场景中快速推理得到满足用户对话的最优状态,以实现精准的对话状态追踪。
为了实现上述目的,本发明第一方面提供一种对话状态获取方法,所述对话状态获取方法包括:对目标对象的多个样本进行拟合,以获取所述目标对象的多个聚类、所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率,其中所述样本为第一预设属性向量,该第一预设属性向量包括相互关联的多个预设属性的属性值,以及所述每个聚类的多元分布为属于所述每个聚类的所述第一预设属性向量的分布;以及基于所述多个聚类中的每个聚类的多元分布、所述每个聚类的先验概率及吉布斯采样方法,获取属于特定聚类的特定预设属性向量,所述特定预设属性向量为满足所述用户对话条件的所述目标对象的预设状态。
优选地,所述对目标对象的多个样本进行拟合包括:采用多个高斯混合模型分别对所述多个样本进行拟合,以获取针对所述多个高斯混合模型的拟合损失,其中所述多个高斯混合模型中的聚类数量不同;基于所述针对所述多个高斯混合模型的拟合损失及所述多个高斯混合模型的聚类数量,采用赤池信息量准则确定所述多个高斯混合模型的赤池信息量准则指标;以及筛选与所述赤池信息量准则指标的最小值相对应的高斯混合模型,以获取所述目标对象的多个聚类及所述多个聚类中的每个聚类的多元高斯分布。
优选地,所述获取属于特定聚类的特定预设属性向量包括:采用所述吉布斯采样方法获取属于所述每个聚类的预设数量的所述第二预设属性向量,其中所述第二预设属性向量包括所述多个预设属性的属性值;基于所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率,确定对应于所述每个聚类的所述预设数量的所述第二预设属性向量的目标函数的取值,其中所述目标函数为在观测到所述用户对话条件下的聚类及第二预设属性向量的概率函数;以及从所述目标函数的取值中,筛选出所述取值的最大值所对应的特定聚类的所述第二预设属性向量。
优选地,所述确定对应于所述每个聚类的所述预设数量的所述第二预设属性向量的目标函数的取值包括:确定所述预设数量的所述第二预设属性向量在所述用户对话条件下的槽位分布;基于所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率,确定在所述每个聚类下的所述预设数量的所述第二预设属性向量的修正得分;以及基于所述预设数量的所述第二预设属性向量在所述用户对话条件下的槽位分布及所述每个聚类下的所述预设数量的所述第二预设属性向量的修正得分,确定所述对应于所述每个聚类的所述预设数量的所述第二预设属性向量的目标函数的取值。
优选地,所述确定在所述每个聚类下的所述预设数量的所述第二预设属性向量的修正得分包括:基于所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率,确定在用户画像条件下所述每个聚类的概率;基于所述多个聚类中的每个聚类的多元分布、所述每个聚类的先验概率及所述每个聚类的所述预设数量的所述第二预设属性向量,确定所述预设数量的所述第二预设属性向量的概率及所述预设数量的所述第二预设属性向量在所述每个聚类条件下的概率;以及基于所述在用户画像条件下所述每个聚类的概率、所述预设数量的所述第二预设属性向量的概率及所述预设数量的所述第二预设属性向量在所述每个聚类条件下的概率,确定在所述每个聚类下的所述预设数量的所述第二预设属性向量的修正得分。
优选地,在所述目标对象为同一城市的房源的情况下,所述预设属性包括:房屋面积、房屋价格、首付及房屋装修类型中的至少两者。
本发明第二方面提供一种对话状态获取系统,所述对话状态获取系统包括:拟合装置,用于对目标对象的多个样本进行拟合,以获取所述目标对象的多个聚类及所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率,其中所述样本为第一预设属性向量,该第一预设属性向量包括相互关联的多个预设属性的属性值,以及所述每个聚类的多元分布为属于所述每个聚类的所述第一预设属性向量的分布;以及向量获取装置,用于基于所述多个聚类中的每个聚类的多元分布、所述每个聚类的先验概率及吉布斯采样方法,获取属于特定聚类的特定预设属性向量,所述特定预设属性向量为满足所述用户对话条件的所述目标对象的预设状态。
优选地,所述拟合装置包括:拟合模块,用于采用多个高斯混合模型分别对所述多个样本进行拟合,以获取针对所述多个高斯混合模型的拟合损失,其中所述多个高斯混合模型中的聚类数量不同;指标确定模块,用于基于所述针对所述多个高斯混合模型的拟合损失及所述多个高斯混合模型的聚类数量,采用赤池信息量准则确定所述多个高斯混合模型的赤池信息量准则指标;以及模型筛选模块,用于筛选与所述赤池信息量准则指标的最小值相对应的高斯混合模型,以获取所述目标对象的多个聚类及所述多个聚类中的每个聚类的多元高斯分布。
优选地,所述向量获取装置包括:采样模块,用于采用所述吉布斯采样方法获取属于所述每个聚类的预设数量的第二预设属性向量,其中所述第二预设属性向量包括所述多个预设属性的属性值;取值模块,用于基于所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率,确定对应于所述每个聚类的所述预设数量的所述第二预设属性向量的目标函数的取值,其中所述目标函数为在观测到所述用户对话条件下的聚类及第二预设属性向量的概率函数;以及最值筛选模块,用于从所述目标函数的取值中,筛选出所述取值的最大值所对应的特定聚类的所述第二预设属性向量。
优选地,所述取值模块包括:概率确定模块,用于确定所述预设数量的所述第二预设属性向量在所述用户对话条件下的槽位分布;得分确定模块,用于基于所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率,确定在所述每个聚类下的所述预设数量的所述第二预设属性向量的修正得分;以及取值确定模块,用于基于所述预设数量的所述第二预设属性向量在所述用户对话条件下的槽位分布及所述每个聚类下的所述预设数量的所述第二预设属性向量的修正得分,确定所述对应于所述每个聚类的所述预设数量的所述第二预设属性向量的目标函数的取值。
优选地,所述得分确定模块包括:第一概率确定单元,用于基于所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率,确定在用户画像条件下所述每个聚类的概率;第二概率确定单元,用于基于所述多个聚类中的每个聚类的多元分布、所述每个聚类的先验概率及所述每个聚类的所述预设数量的所述第二预设属性向量,确定所述预设数量的所述第二预设属性向量的概率及所述预设数量的所述第二预设属性向量在所述每个聚类条件下的概率;以及得分确定单元,用于基于所述在用户画像条件下所述每个聚类的概率、所述预设数量的所述第二预设属性向量的概率及所述预设数量的所述第二预设属性向量在所述每个聚类条件下的概率,确定在所述每个聚类下的所述预设数量的所述第二预设属性向量的修正得分。
优选地,在所述目标对象为同一城市的房源的情况下,所述预设属性包括:房屋面积、房屋价格、首付及房屋装修类型中的至少两者。
通过上述技术方案,本发明创造性地对目标对象(例如房源)的多个样本(每个样本为包括相互关联的多个预设属性的属性值的预设属性向量)进行拟合,以获取所述目标对象的多个聚类、所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率;然后根据每个聚类的多元分布、每个聚类的先验概率及吉布斯采样方法,获取属于特定聚类的特定预设属性向量,从而可获取满足所述用户对话条件的所述目标对象的最优状态,由此,本发明可在人机辅助场景中快速推理得到满足用户对话的最优状态,以实现精准的对话状态追踪。
本发明第三方面还提供一种机器可读存储介质,所述机器可读存储介质上存储有指令,该指令用于使得机器执行上述的对话状态获取方法。
本发明第四方面还提供一种电子设备,所述电子设备包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现所述的对话状态获取方法。
本发明的其它特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本发明实施例的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本发明实施例,但并不构成对本发明实施例的限制。在附图中:
图1是本发明一实施例提供的对话状态获取方法的流程图;
图2是本发明一实施例提供的获取属于特定聚类的特定预设属性向量的流程图;
图3是本发明一实施例提供的确定对应于所述每个聚类的所述预设数量的所述第二预设属性向量的目标函数的取值的流程图;以及
图4是本发明一实施例提供的确定在所述每个聚类下的所述预设数量的第二预设属性向量的修正得分的流程图。
具体实施方式
以下结合附图对本发明的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。
在本发明的各个实施例中,“XX条件下”与“已知XX的条件下”表示相同的含义。
图1是本发明一实施例提供的对话状态获取方法的流程图。如图1所示,所述对话状态获取方法可包括步骤S101-S102。
以房源为例,由于不同的预设地理位置(例如不同城市)的房源有很大的偏差(例如,每个城市的房源的不同属性(即槽位)之间的依赖关系很可能相差很大),而同一城市里面不同位置的房源的偏差比较小,故可以天然的通过城市维度将房源进行整体的切分。在下文描述的本发明各个实施例中,仅以同一城市中的房源为例进行说明(因为对于不同城市而言,对话状态获取方法的过程是相同的)。
在同一预设地理位置(例如同一城市)中,虽然同一城市里面不同位置的房源的偏差比较小,但不同类型的房源的属性(即槽位)的联合分布相差很大。本发明各个实施例的一个目的是拟合一套关于房源的多个预设属性(即预设槽位,例如房屋面积、房屋价格及房屋装修类型(例如精装、简装等)等)的联合概率分布,具体地,由于同一城市且同一类型的房源的属性(即槽位)的联合分布可近似服从多元高斯分布,故可通过多元高斯分布对数据库中的属于同一城市且同一类型的多个样本进行拟合。
在这种情况下,在执行步骤S101之前,首先需要按照城市维度将已有房源进行区分;然后按照预设属性列表(即预设槽位列表)将同一城市的所有房源构建为相应样本(即预设属性向量)。其中,房源的各个预设属性之间存在一定的内在联系,比如,价格与面积等属性之间,面积越大,价格越高。并且,房源的各个预设属性可有多个属性值。具体地,连续型数值类的属性(即槽位)可作为一维向量;标签类属性(即槽位)可按照属性值的种类数构建对应的0/1多维变量(例如“装修”的值对应“精装”、“简装”和“清水”,则“装修”这个槽位被归纳为3维多分类标签(one-hot向量))。例如,在按照面积、价格及装修类型属性列表构建样本的情况下,样本1可为{100平、200万、精装};样本2可为{50平、120万、简装}等。
步骤S101,对目标对象的多个样本进行拟合,以获取所述目标对象的多个聚类、所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率。
其中,所述多个样本中的每一者为第一预设属性向量,该第一预设属性向量包括相互关联的多个预设属性的属性值,以及所述每个聚类的多元分布为属于所述每个聚类的所述第一预设属性向量的分布。所述多个聚类可指代不同的房源类型(例如学区房、豪宅、经济房等)。
在所述目标对象为同一城市的房源的情况下,所述预设属性可包括:房屋面积、房屋价格、首付及房屋装修类型中的至少两者。
对于步骤S101,所述对目标对象的多个样本进行拟合可包括:采用多个高斯混合模型分别对所述多个样本进行拟合,以获取针对所述多个高斯混合模型的拟合损失,其中所述多个高斯混合模型中的聚类数量不同;基于所述针对所述多个高斯混合模型的拟合损失及所述多个高斯混合模型的聚类数量,采用赤池信息量准则确定所述多个高斯混合模型的赤池信息量准则指标;以及筛选与所述赤池信息量准则指标的最小值相对应的高斯混合模型,以获取所述目标对象的多个聚类及所述多个聚类中的每个聚类的多元高斯分布。
以房源为例,将每个城市的房源类型数量(GMM隐状态数量)作为超参数进行多次尝试,采用AIC(Akaike information criterion,赤池信息量准则)将赤池信息量准则指标的最小值所对应的类型数量设定为最终的聚类数量。
具体而言,使用聚类数量为k1、k2……、kn的n个高斯混合模型(GMM)对同一城市房源的多个样本(例如,同一城市所有房源的高维样本,由于每个样本涉及多个预设属性相,故每个样本均为高维样本)进行生成式拟合。注意:由于各个预设属性之间相互关联,故设置高斯分布的各个参数之间不独立,且每个聚类的高斯分布均值向量与协方差矩阵均不同。在拟合过程中,可获取针对任一GMM(聚类数量为km)的拟合损失ssem,然后根据每个GMM的拟合损失ssem及相应的聚类数量km,采用赤池信息量准则可计算得到该GMM(聚类数量为km)的AIC指标;采用类似的方式对其他各个GMM分别计算相应的AIC指标。在得到每个GMM的AIC指标的情况下,从各个AIC指标中筛选出最小值,并确定该最小值所对应的特定GMM及与该特定GMM相应的聚类数量、各个聚类与各个聚类的多元高斯分布Gaussian(μi,∑i)。
具体地,GMM的建模符号可按照如下内容定义为:
Figure BDA0002783562470000091
z:代表房源类型/聚类的取值,如一共用m种房源类型,那么z∈{1,2,..,m}。
Figure BDA0002783562470000092
代表房源的预设属性向量(可简称为向量),向量维度大小(预设属性的个数)以及每一维度的业务意义(预设属性)可事先确定,每一维度的值代表其对应属性的取值(可称为属性值)。
o:代表可观测到的文本数据内容,如用户对话为“还是这个100平的房子不错、也只能买这套200万的了”,该用户对话即为可观测到的文本数据内容。
Gaussian(μi,∑i):代表房源类型z=i时关于
Figure BDA0002783562470000093
的多元高斯(Gaussian)分布。在已知
Figure BDA0002783562470000094
的情况下,z与o独立,故
Figure BDA0002783562470000095
上述步骤S101可实现以下目的:通过GMM算法可对房源属性和房源类型集合进行联合分布拟合。
步骤S102,基于所述多个聚类中的每个聚类的多元分布、所述每个聚类的先验概率及吉布斯采样方法,获取属于特定聚类的特定预设属性向量,所述特定预设属性向量为满足所述用户对话条件的所述目标对象的预设状态。
对于步骤S102,所述获取属于特定聚类的特定预设属性向量可包括步骤S201-S203,如图2所示。
步骤S102中的获取属于特定聚类的特定预设属性向量的实质是指求取
Figure BDA0002783562470000101
即在用户对话条件下的属于聚类z的预设属性向量
Figure BDA0002783562470000102
的概率
Figure BDA0002783562470000103
(目标函数)最大时所对应
Figure BDA0002783562470000104
其中,在用户对话条件下的属于聚类z的预设属性向量
Figure BDA0002783562470000105
的概率
Figure BDA0002783562470000106
满足以下公式(1):
Figure BDA0002783562470000107
由于在对
Figure BDA0002783562470000108
进行求解的过程中需要对房源属性和房源类别
Figure BDA0002783562470000109
进行穷举,所以此最优化过程所面临的计算复杂度是指数级别,而在本发明中可考虑采用吉布斯采样的方式来对目标函数进行近似估计。采用吉布斯采样可达到以下效果:(1)可对复杂联合概率分布进行采样,而且可以方便推到出各个随机变量的条件分布;(2)因为目标是求得使
Figure BDA00027835624700001010
最大的
Figure BDA00027835624700001011
取值,故相对越容易采样到天然越大的概率。
接下来,判断
Figure BDA00027835624700001012
是否可以通过吉布斯采样来估计。具体地,通过吉布斯采样估计
Figure BDA00027835624700001013
的先决条件是需要满足各随机变量条件分布均可推导,也就是说,
Figure BDA00027835624700001014
Figure BDA00027835624700001015
可计算(其中
Figure BDA00027835624700001016
代表排除第k个元素后的
Figure BDA00027835624700001017
向量)。
Figure BDA00027835624700001018
可计算的描述可参见下文步骤S401中的P(z|dmp)计算过程的描述(于此不再进行赘述),因此只需证明
Figure BDA00027835624700001019
可以计算得到,则对于
Figure BDA00027835624700001020
的过程就可以通过吉布斯采样的方式来估计。
具体证明过程如下:
Figure BDA0002783562470000111
上述公式中,
Figure BDA0002783562470000112
表示第二预设属性向量
Figure BDA0002783562470000113
在房源聚类z条件下的概率(具体计算过程详见步骤S402);
Figure BDA0002783562470000114
表示在观测到用户对话的文本数据内容o条件下的房源属性向量
Figure BDA0002783562470000115
的概率(具体计算过程详见步骤S302);P(o)表示用户对话的文本数据内容o的概率(该项可以通过归一化的方式确定);P(z)、
Figure BDA00027835624700001119
分别表示已知用户画像dmp后,用户倾向于房源类型/聚类z、
Figure BDA00027835624700001120
的概率(具体计算过程详见步骤S401);
Figure BDA0002783562470000116
表示房源属性向量
Figure BDA0002783562470000117
房源类别z以及观测文本o的联合概率,
Figure BDA0002783562470000118
表示对xk(向量
Figure BDA0002783562470000119
中的第k个预设属性)分别为不同属性值时的
Figure BDA00027835624700001110
进行求和;以及
Figure BDA00027835624700001111
表示属于房源聚类
Figure BDA00027835624700001112
的向量
Figure BDA00027835624700001113
的概率(可由数据库中的所述多个样本的实际情况确定)。因为z的种类和xk的取值种类有限(通常比较少),故上式计算复杂度偏低,易于实现。
步骤S201,采用所述吉布斯采样方法获取属于所述每个聚类的预设数量的第二预设属性向量。
其中,所述第二预设属性向量可包括所述多个预设属性的属性值。
设定预设属性向量的初始值
Figure BDA00027835624700001114
根据上述公式(2)可得到第一轮迭代采样过程所需的
Figure BDA00027835624700001115
然后
Figure BDA00027835624700001116
获取
Figure BDA00027835624700001117
与z(1)(具体获取过程不是本发明的主要改进内容,于此不对其进行说明,可参见吉布斯采样方法的相应处理过程);采用类似的方式可在其他各轮迭代采样过程中获取不同的
Figure BDA00027835624700001118
与z。每一轮迭代采样过程可形成一个预设属性向量。其中,所述预设数量即为迭代采样过程的轮数,其可根据实际情况被确定。
假设有随机变量(即预设属性)X和Y,其中X的取值为a1、a2、a3;如果已知P(X=a1|Y,z,o)=0.2,P(X=a2|Y,z,o)=0.3,P(X=a3|Y,z,o)=0.5,那么通过吉布斯采样方法采样是指重新为目标对象(例如房源)分配样本,具体地,“使用一个0~1的均匀随机数生成器,用它生成一个0~1之间的数,如果该数小于0.2,那么就认为X|Y,z,o采样到a1(在已知Y,z,o的条件下,X可采样得到a1);如果该数小大于0.2且小于0.5,那么X|Y,z,o采样到a2;如果该数大于0.5那么就认为X|Y,z,o采样到a3”。对于变量Y的采样也是如此,于此不再赘述。
步骤S202,基于所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率,确定对应于所述每个聚类的所述预设数量的所述第二预设属性向量的目标函数的取值。
其中,所述目标函数为在观测到所述用户对话条件下的聚类及第二预设属性向量的概率函数。
对于步骤S202,所述确定对应于所述每个聚类的所述预设数量的所述第二预设属性向量的目标函数的取值可包括步骤S301-S303,如图3所示。
步骤S301,确定所述预设数量的所述第二预设属性向量在所述用户对话条件下的槽位分布。
一旦接收到用户对话(即文本数据内容o),即可通过命名实体识别可返回代表在观测到文本数据内容o条件下的房源属性向量
Figure BDA0002783562470000121
的概率
Figure BDA0002783562470000122
即所述预设数量的所述第二预设属性向量在所述用户对话条件下的槽位分布(条件概率)。
步骤S302,基于所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率,确定在所述每个聚类下的所述预设数量的所述第二预设属性向量的修正得分。
具体地,可通过贝叶斯方法对属性值预测引入先验矫正,即确定在所述每个聚类下的所述预设数量的第二预设属性向量的修正得分
Figure BDA0002783562470000131
具体可表示为下式(3)。
Figure BDA0002783562470000132
对于步骤S302,所述确定在所述每个聚类下的所述预设数量的第二预设属性向量的修正得分可包括步骤S401-S403,如图4所示。
步骤S401,基于所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率,确定在用户画像条件下所述每个聚类的概率。
用户画像dmp由用户对房源的各个属性取值所得到的属性值的集合(类似于向量
Figure BDA0002783562470000133
)构成(可事先通过用户搜索等其他渠道可获取的先验内容)。在已知用户画像dmp的条件下,用户倾向于房源类型z的概率P(z|dpm)∝P(z)*P(dmp|z),其中P(z)是各个房源类型/聚类的先验概率。通过GMM对多个样本进行生成式拟合,可以得到P(z)及相应的多元高斯分布;通过多元高斯分布可计算得到P(dmp|z)概率(因为dmp也被表达成一个房屋属性向量如{50平、120万、简装},故可通过多元高斯模型计算其对应概率值),故P(z|dmp)可由P(z)与P(dmp|z)相乘并归一化后计算得到。为了方便起见,在各个实施例中可用P(z)表示P(z|dmp),其代表已知用户画像dmp后,用户倾向于房屋类型z的概率。
步骤S402,基于所述多个聚类中的每个聚类的多元分布、所述每个聚类的先验概率及所述每个聚类的所述预设数量的所述第二预设属性向量,确定所述预设数量的所述第二预设属性向量的概率及所述预设数量的所述第二预设属性向量在所述每个聚类条件下的概率。
类似于上述步骤S401,根据所述多个聚类中的每个聚类的多元分布及所述每个聚类的所述预设数量的所述第二预设属性向量,计算第二预设属性向量
Figure BDA0002783562470000134
在房源聚类
Figure BDA0002783562470000135
条件下的概率
Figure BDA0002783562470000137
;然后将
Figure BDA0002783562470000136
与每个聚类的先验概率
Figure BDA0002783562470000141
代入公式
Figure BDA0002783562470000142
可确定所述预设数量的所述第二预设属性向量的概率
Figure BDA0002783562470000143
类似地,根据所述多个聚类中的每个聚类的多元分布及所述每个聚类的所述预设数量的所述第二预设属性向量,还可计算第二预设属性向量
Figure BDA0002783562470000144
在房源聚类z条件下的概率
Figure BDA0002783562470000145
步骤S403,基于所述在用户画像条件下所述每个聚类的概率、所述预设数量的所述第二预设属性向量的概率及所述预设数量的所述第二预设属性向量在所述每个聚类条件下的概率,确定在所述每个聚类下的所述预设数量的所述第二预设属性向量的修正得分。
将步骤S401得到的P(z)及步骤S402得到的
Figure BDA0002783562470000146
Figure BDA0002783562470000147
代入上述公式(3),可得到在所述每个聚类下的所述预设数量的第二预设属性向量的修正得分
Figure BDA0002783562470000148
上述步骤S401-S403(即步骤S302)结合房源聚类的先验概率与当前属性的置信度
Figure BDA0002783562470000149
即在已知房源类型的情况下当前槽位分布所对应的概率)来得出当前聚类z下当前属性向量
Figure BDA00027835624700001410
的修正得分
Figure BDA00027835624700001411
步骤S303,基于所述预设数量的所述第二预设属性向量在所述用户对话条件下的槽位分布及所述每个聚类下的所述预设数量的所述第二预设属性向量的修正得分,确定所述对应于所述每个聚类的所述预设数量的所述第二预设属性向量的目标函数的取值。
根据步骤S301得到的所述预设数量的所述第二预设属性向量在所述用户对话条件下的槽位分布
Figure BDA00027835624700001412
及步骤S302得到的所述每个聚类下的所述预设数量的所述第二预设属性向量的修正得分
Figure BDA00027835624700001413
可计算对应于所述每个聚类的所述预设数量的所述第二预设属性向量的目标函数
Figure BDA00027835624700001414
的取值。
通过上述步骤S301-S303(即步骤S202)可得到对应于所述每个聚类的所述预设数量的所述第二预设属性向量的目标函数
Figure BDA0002783562470000151
的取值。
步骤S203,从所述目标函数的取值中,筛选出所述取值的最大值所对应的特定聚类的所述第二预设属性向量。
具体地,将迭代过程中使
Figure BDA0002783562470000152
最大的
Figure BDA0002783562470000153
作为估计得到的最优
Figure BDA0002783562470000154
与z(即通过吉布斯采样方法快速给出全局最优的DST状态解),从而推理得出满足用户对话条件的以及属于特定聚类z的特定预设属性向量
Figure BDA0002783562470000155
(在实际业务使用时,如用户对话为“还是这个100平的房子不错、也只能买这套200万的了”,则
Figure BDA0002783562470000156
指房屋面积(100平)及房屋价格(200万);对于z只是房屋的数据聚类结果可通过人工检测的方式归纳出z类别的具体实际意义)。
通过上述步骤S201-S203可获取属于特定聚类的特定预设属性向量,即可精确地确定用户需求,从而可在购房用户与经纪人对话过程中智能地辅助经纪人确定用户的真实需求,进而可促进双方的沟通效率及成单率。
综上所述,本发明创造性地对目标对象(例如房源)的多个样本(每个样本为包括相互关联的多个预设属性的属性值的预设属性向量)进行拟合,以获取所述目标对象的多个聚类、所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率;然后根据每个聚类的多元分布、每个聚类的先验概率及吉布斯采样方法,获取属于特定聚类的特定预设属性向量,从而获取满足所述用户对话条件的所述目标对象的最优状态,由此,本发明可在人机辅助场景中快速推理得到满足用户对话的最优状态,以实现精准的对话状态追踪。
本发明第二方面提供一种对话状态获取系统,所述对话状态获取系统包括:拟合装置,用于对目标对象的多个样本进行拟合,以获取所述目标对象的多个聚类、所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率,其中所述多个样本中的每一者为第一预设属性向量,该第一预设属性向量包括相互关联的多个预设属性的属性值,以及所述每个聚类的多元分布为属于所述每个聚类的所述第一预设属性向量的分布;以及向量获取装置,用于基于所述多个聚类中的每个聚类的多元分布、所述每个聚类的先验概率及吉布斯采样方法,获取属于特定聚类的特定预设属性向量,所述特定预设属性向量为满足所述用户对话条件的所述目标对象的预设状态。
优选地,所述拟合装置包括:拟合模块,用于采用多个高斯混合模型分别对所述多个样本进行拟合,以获取针对所述多个高斯混合模型的拟合损失,其中所述多个高斯混合模型中的聚类数量不同;指标确定模块,用于基于所述针对所述多个高斯混合模型的拟合损失及所述多个高斯混合模型的聚类数量,采用赤池信息量准则确定所述多个高斯混合模型的赤池信息量准则指标;以及模型筛选模块,用于筛选与所述赤池信息量准则指标的最小值相对应的高斯混合模型,以获取所述目标对象的多个聚类及所述多个聚类中的每个聚类的多元高斯分布。
优选地,所述向量获取装置包括:采样模块,用于采用所述吉布斯采样方法获取属于所述每个聚类的预设数量的第二预设属性向量,其中所述第二预设属性向量包括所述多个预设属性的属性值;取值模块,用于基于所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率,确定对应于所述每个聚类的所述预设数量的所述第二预设属性向量的目标函数的取值,其中所述目标函数为在观测到所述用户对话条件下的聚类及第二预设属性向量的概率函数;以及最值筛选模块,用于从所述目标函数的取值中,筛选出所述取值的最大值所对应的特定聚类的所述第二预设属性向量。
优选地,所述取值模块包括:概率确定模块,用于确定所述预设数量的所述第二预设属性向量在所述用户对话条件下的槽位分布;得分确定模块,用于基于所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率,确定在所述每个聚类下的所述预设数量的第二预设属性向量的修正得分;以及取值确定模块,用于基于所述预设数量的所述第二预设属性向量在所述用户对话条件下的槽位分布及所述每个聚类下的所述预设数量的所述第二预设属性向量的修正得分,确定所述对应于所述每个聚类的所述预设数量的所述第二预设属性向量的目标函数的取值。
优选地,所述得分确定模块包括:第一概率确定单元,用于基于所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率,确定在用户画像条件下所述每个聚类的概率;第二概率确定单元,用于基于所述多个聚类中的每个聚类的多元分布、所述每个聚类的先验概率及所述每个聚类的所述预设数量的所述第二预设属性向量,确定所述预设数量的所述第二预设属性向量的概率及所述预设数量的所述第二预设属性向量在所述每个聚类条件下的概率;以及得分确定单元,用于基于所述在用户画像条件下所述每个聚类的概率、所述预设数量的所述第二预设属性向量的概率及所述预设数量的所述第二预设属性向量在所述每个聚类条件下的概率,确定在所述每个聚类下的所述预设数量的所述第二预设属性向量的修正得分。
优选地,在所述目标对象为同一城市的房源的情况下,所述预设属性包括:房屋面积、房屋价格、首付及房屋装修类型中的至少两者。
有关本发明提供的对话状态获取系统的具体细节及益处可参阅上述针对对话状态获取方法的描述,于此不再赘述。
本发明另一实施例还提供一种机器可读存储介质,所述机器可读存储介质上存储有指令,该指令用于使得机器执行上述的对话状态获取方法。
本发明再一实施例还提供一种电子设备,所述电子设备包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现所述的对话状态获取方法。
以上结合附图详细描述了本发明实施例的可选实施方式,但是,本发明实施例并不限于上述实施方式中的具体细节,在本发明实施例的技术构思范围内,可以对本发明实施例的技术方案进行多种简单变型,这些简单变型均属于本发明实施例的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合。为了避免不必要的重复,本发明实施例对各种可能的组合方式不再另行说明。
本领域技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得单片机、芯片或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
此外,本发明实施例的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明实施例的思想,其同样应当视为本发明实施例所公开的内容。

Claims (10)

1.一种对话状态获取方法,其特征在于,所述对话状态获取方法包括:
对目标对象的多个样本进行拟合,以获取所述目标对象的多个聚类、所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率,其中所述样本为第一预设属性向量,该第一预设属性向量包括相互关联的多个预设属性的属性值,以及所述每个聚类的多元分布为属于所述每个聚类的所述第一预设属性向量的分布;以及
基于所述多个聚类中的每个聚类的多元分布、所述每个聚类的先验概率及吉布斯采样方法,获取属于特定聚类的特定预设属性向量,所述特定预设属性向量为满足所述用户对话条件的所述目标对象的预设状态。
2.根据权利要求1所述的对话状态获取方法,其特征在于,所述对目标对象的多个样本进行拟合包括:
采用多个高斯混合模型分别对所述多个样本进行拟合,以获取针对所述多个高斯混合模型的拟合损失,其中所述多个高斯混合模型中的聚类数量不同;
基于所述针对所述多个高斯混合模型的拟合损失及所述多个高斯混合模型的聚类数量,采用赤池信息量准则确定所述多个高斯混合模型的赤池信息量准则指标;以及
筛选与所述赤池信息量准则指标的最小值相对应的高斯混合模型,以获取所述目标对象的多个聚类及所述多个聚类中的每个聚类的多元高斯分布。
3.根据权利要求1所述的对话状态获取方法,其特征在于,所述获取属于特定聚类的特定预设属性向量包括:
采用所述吉布斯采样方法获取属于所述每个聚类的预设数量的第二预设属性向量,其中所述第二预设属性向量包括所述多个预设属性的属性值;
基于所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率,确定对应于所述每个聚类的所述预设数量的所述第二预设属性向量的目标函数的取值,其中所述目标函数为在观测到所述用户对话条件下的聚类及第二预设属性向量的概率函数;以及
从所述目标函数的取值中,筛选出所述取值的最大值所对应的特定聚类的所述第二预设属性向量。
4.根据权利要求3所述的对话状态获取方法,其特征在于,所述确定对应于所述每个聚类的所述预设数量的所述第二预设属性向量的目标函数的取值包括:
确定所述预设数量的所述第二预设属性向量在所述用户对话条件下的槽位分布;
基于所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率,确定在所述每个聚类下的所述预设数量的所述第二预设属性向量的修正得分;以及
基于所述预设数量的所述第二预设属性向量在所述用户对话条件下的槽位分布及所述每个聚类下的所述预设数量的所述第二预设属性向量的修正得分,确定所述对应于所述每个聚类的所述预设数量的所述第二预设属性向量的目标函数的取值。
5.根据权利要求4所述的对话状态获取方法,其特征在于,所述确定在所述每个聚类下的所述预设数量的所述第二预设属性向量的修正得分包括:
基于所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率,确定在用户画像条件下所述每个聚类的概率;
基于所述多个聚类中的每个聚类的多元分布、所述每个聚类的先验概率及所述每个聚类的所述预设数量的所述第二预设属性向量,确定所述预设数量的所述第二预设属性向量的概率及所述预设数量的所述第二预设属性向量在所述每个聚类条件下的概率;以及
基于所述在用户画像条件下所述每个聚类的概率、所述预设数量的所述第二预设属性向量的概率及所述预设数量的所述第二预设属性向量在所述每个聚类条件下的概率,确定在所述每个聚类下的所述预设数量的所述第二预设属性向量的修正得分。
6.根据权利要求1所述的对话状态获取方法,其特征在于,在所述目标对象为同一城市的房源的情况下,所述预设属性包括:房屋面积、房屋价格、首付及房屋装修类型中的至少两者。
7.一种对话状态获取系统,其特征在于,所述对话状态获取系统包括:
拟合装置,用于对目标对象的多个样本进行拟合,以获取所述目标对象的多个聚类、所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率,其中所述样本为第一预设属性向量,该第一预设属性向量包括相互关联的多个预设属性的属性值,以及所述每个聚类的多元分布为属于所述每个聚类的所述第一预设属性向量的分布;以及
向量获取装置,用于基于所述多个聚类中的每个聚类的多元分布、所述每个聚类的先验概率及吉布斯采样方法,获取属于特定聚类的特定预设属性向量,所述特定预设属性向量为满足所述用户对话条件的所述目标对象的预设状态。
8.根据权利要求7所述的对话状态获取系统,其特征在于,所述拟合装置包括:
拟合模块,用于采用多个高斯混合模型分别对所述多个样本进行拟合,以获取针对所述多个高斯混合模型的拟合损失,其中所述多个高斯混合模型中的聚类数量不同;
指标确定模块,用于基于所述针对所述多个高斯混合模型的拟合损失及所述多个高斯混合模型的聚类数量,采用赤池信息量准则确定所述多个高斯混合模型的赤池信息量准则指标;以及
模型筛选模块,用于筛选与所述赤池信息量准则指标的最小值相对应的高斯混合模型,以获取所述目标对象的多个聚类及所述多个聚类中的每个聚类的多元高斯分布。
9.一种机器可读存储介质,其特征在于,所述机器可读存储介质上存储有指令,该指令用于使得机器执行上述权利要求1-6中任一项权利要求所述的对话状态获取方法。
10.一种电子设备,其特征在于,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述权利要求1-6中任一项权利要求所述的对话状态获取方法。
CN202011290076.4A 2020-11-17 2020-11-17 对话状态获取方法、系统、可读存储介质及电子设备 Active CN112395400B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011290076.4A CN112395400B (zh) 2020-11-17 2020-11-17 对话状态获取方法、系统、可读存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011290076.4A CN112395400B (zh) 2020-11-17 2020-11-17 对话状态获取方法、系统、可读存储介质及电子设备

Publications (2)

Publication Number Publication Date
CN112395400A true CN112395400A (zh) 2021-02-23
CN112395400B CN112395400B (zh) 2022-12-13

Family

ID=74607193

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011290076.4A Active CN112395400B (zh) 2020-11-17 2020-11-17 对话状态获取方法、系统、可读存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN112395400B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003090117A1 (en) * 2002-04-18 2003-10-30 British Telecommunications Public Limited Company Data analysis method
CN107423282A (zh) * 2017-05-24 2017-12-01 南京大学 基于混合特征的文本中语义连贯性主题与词向量并发提取方法
CN109508423A (zh) * 2018-12-14 2019-03-22 平安科技(深圳)有限公司 基于语义识别的房源推荐方法、装置、设备及存储介质
CN110633726A (zh) * 2018-12-25 2019-12-31 北京时光荏苒科技有限公司 一种房源识别方法、装置、存储介质及电子设备
CN111079001A (zh) * 2019-11-26 2020-04-28 贝壳技术有限公司 装修推荐信息生成方法、装置、存储介质及电子设备
CN111832289A (zh) * 2020-07-13 2020-10-27 重庆大学 一种基于聚类和高斯lda的服务发现方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003090117A1 (en) * 2002-04-18 2003-10-30 British Telecommunications Public Limited Company Data analysis method
CN107423282A (zh) * 2017-05-24 2017-12-01 南京大学 基于混合特征的文本中语义连贯性主题与词向量并发提取方法
CN109508423A (zh) * 2018-12-14 2019-03-22 平安科技(深圳)有限公司 基于语义识别的房源推荐方法、装置、设备及存储介质
CN110633726A (zh) * 2018-12-25 2019-12-31 北京时光荏苒科技有限公司 一种房源识别方法、装置、存储介质及电子设备
CN111079001A (zh) * 2019-11-26 2020-04-28 贝壳技术有限公司 装修推荐信息生成方法、装置、存储介质及电子设备
CN111832289A (zh) * 2020-07-13 2020-10-27 重庆大学 一种基于聚类和高斯lda的服务发现方法

Also Published As

Publication number Publication date
CN112395400B (zh) 2022-12-13

Similar Documents

Publication Publication Date Title
Luan et al. Scientific information extraction with semi-supervised neural tagging
CN110413752B (zh) 基于对话逻辑的多轮口语理解方法、系统、装置
Lee Structured discriminative model for dialog state tracking
CN111353106B (zh) 推荐方法和装置、电子设备和存储介质
Sun et al. A generalized rule based tracker for dialogue state tracking
CN108962224A (zh) 口语理解和语言模型联合建模方法、对话方法及系统
GB2559617A (en) A dialogue system, a dialogue method and a method of adapting a dialogue system
CN110990555B (zh) 端到端检索式对话方法与系统及计算机设备
Shen et al. Semi-supervised intent discovery with contrastive learning
CN112989002B (zh) 一种基于知识图谱的问答处理方法、装置及设备
CN112200664A (zh) 基于ernie模型和dcnn模型的还款预测方法
Yu et al. Constrained markov bayesian polynomial for efficient dialogue state tracking
CN114090401B (zh) 处理用户行为序列的方法及装置
CN117829298A (zh) 一种多跳时序知识图谱问答方法及系统
Lee et al. Optimizing generative dialog state tracker via cascading gradient descent
CN117876929B (zh) 一种渐进式多尺度上下文学习的时序目标定位方法
CN111161238A (zh) 图像质量评价方法及装置、电子设备、存储介质
CN112417890B (zh) 一种基于多样化语义注意力模型的细粒度实体分类方法
CN117575008A (zh) 训练样本生成方法、模型训练方法、知识问答方法及设备
CN112395400B (zh) 对话状态获取方法、系统、可读存储介质及电子设备
Ren et al. Markovian discriminative modeling for cross-domain dialog state tracking
Lee et al. Dialog history construction with long-short term memory for robust generative dialog state tracking
CN112416754B (zh) 一种模型评测方法、终端、系统及存储介质
CN115455142A (zh) 文本检索方法、计算机设备和存储介质
CN113342974B (zh) 一种网络安全实体重叠关系的识别方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant