CN112395400B - 对话状态获取方法、系统、可读存储介质及电子设备 - Google Patents
对话状态获取方法、系统、可读存储介质及电子设备 Download PDFInfo
- Publication number
- CN112395400B CN112395400B CN202011290076.4A CN202011290076A CN112395400B CN 112395400 B CN112395400 B CN 112395400B CN 202011290076 A CN202011290076 A CN 202011290076A CN 112395400 B CN112395400 B CN 112395400B
- Authority
- CN
- China
- Prior art keywords
- cluster
- preset
- preset attribute
- probability
- clusters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Human Computer Interaction (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computational Linguistics (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及人工智能技术领域,公开一种对话状态获取方法及系统。所述对话状态获取方法包括:对目标对象的多个样本进行拟合,以获取目标对象的多个聚类、每个聚类的多元分布及每个聚类的先验概率,其中每个样本为包括相互关联的多个预设属性的属性值的第一预设属性向量,以及每个聚类的多元分布为属于每个聚类的第一预设属性向量的分布;以及基于每个聚类的多元分布、所述每个聚类的先验概率及吉布斯采样方法,获取属于特定聚类的特定预设属性向(其为满足所述用户对话条件的所述目标对象的预设状态)。本发明可在人机辅助场景中快速推理得到满足用户对话的最优状态,以实现精准的对话状态追踪。
Description
技术领域
本发明涉及人工智能技术领域,具体地涉及一种对话状态获取方法、对话状态获取系统、可读存储介质及电子设备。
背景技术
目前的智能对话场景中,DST(Dialogue State Tracking,对话状态追踪)是用于概括从对话初始时刻到当前时刻的整体信息的一种技术,其目的在于为系统动作决策提供充分的数据支撑。通常,DST的核心技术手段是确定对话过程中的关键槽位分布,具体地,DST的过程就是根据截止至t-1时刻的对话槽位分布和当前t时刻nlu观测结果(主要包括t时刻的槽位分布)来推断截止至t时刻的对话槽位分布。
在一般的任务型人机对话中,DST所采用的最常用且有效的方法之一是通过话术澄清方式将不确定的槽位内容进行确定(比如在买房场景中,系统在对话中发现用户可接受的房屋总价:50%概率为100w,50%概率为300w,那么通过向用户澄清询问可以有效确定房屋总价)。这种话术澄清方式适用于单个槽位与相应的槽位值的澄清场景。
然而,咨询助手的IM场景(人机辅助场景,即人与人之间的对话,机器对其中一方进行对话辅助提示)所涉及的逻辑复杂且槽位及槽位值的种类繁多,即其涉及多种内容推理、运算等场景(需要设立各种背景知识、常识、习惯等因素),而且对话轮数偏长。由于各个槽位之间相互关联,无法进行话术澄清(并且在IM场景中,被辅助者几乎不会采纳澄清话术),这会使DST实现难度大增。如果在对话过程中对槽位值的置信分布产生歧义(无法通过澄清解决),会对后面继续追踪状态及其他依赖状态而执行的操作产生很大影响。
发明内容
本发明的目的是提供一种对话状态获取方法及、对话状态获取系统、可读存储介质及电子设备,其在人机辅助场景中快速推理得到满足用户对话的最优状态,以实现精准的对话状态追踪。
为了实现上述目的,本发明第一方面提供一种对话状态获取方法,所述对话状态获取方法包括:对目标对象的多个样本进行拟合,以获取所述目标对象的多个聚类、所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率,其中所述样本为第一预设属性向量,该第一预设属性向量包括相互关联的多个预设属性的属性值,以及所述每个聚类的多元分布为属于所述每个聚类的所述第一预设属性向量的分布;以及基于所述多个聚类中的每个聚类的多元分布、所述每个聚类的先验概率及吉布斯采样方法,获取属于特定聚类的特定预设属性向量,所述特定预设属性向量为满足所述用户对话条件的所述目标对象的预设状态。
优选地,所述对目标对象的多个样本进行拟合包括:采用多个高斯混合模型分别对所述多个样本进行拟合,以获取针对所述多个高斯混合模型的拟合损失,其中所述多个高斯混合模型中的聚类数量不同;基于所述针对所述多个高斯混合模型的拟合损失及所述多个高斯混合模型的聚类数量,采用赤池信息量准则确定所述多个高斯混合模型的赤池信息量准则指标;以及筛选与所述赤池信息量准则指标的最小值相对应的高斯混合模型,以获取所述目标对象的多个聚类及所述多个聚类中的每个聚类的多元高斯分布。
优选地,所述获取属于特定聚类的特定预设属性向量包括:采用所述吉布斯采样方法获取属于所述每个聚类的预设数量的所述第二预设属性向量,其中所述第二预设属性向量包括所述多个预设属性的属性值;基于所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率,确定对应于所述每个聚类的所述预设数量的所述第二预设属性向量的目标函数的取值,其中所述目标函数为在观测到所述用户对话条件下的聚类及第二预设属性向量的概率函数;以及从所述目标函数的取值中,筛选出所述取值的最大值所对应的特定聚类的所述第二预设属性向量。
优选地,所述确定对应于所述每个聚类的所述预设数量的所述第二预设属性向量的目标函数的取值包括:确定所述预设数量的所述第二预设属性向量在所述用户对话条件下的槽位分布;基于所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率,确定在所述每个聚类下的所述预设数量的所述第二预设属性向量的修正得分;以及基于所述预设数量的所述第二预设属性向量在所述用户对话条件下的槽位分布及所述每个聚类下的所述预设数量的所述第二预设属性向量的修正得分,确定所述对应于所述每个聚类的所述预设数量的所述第二预设属性向量的目标函数的取值。
优选地,所述确定在所述每个聚类下的所述预设数量的所述第二预设属性向量的修正得分包括:基于所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率,确定在用户画像条件下所述每个聚类的概率;基于所述多个聚类中的每个聚类的多元分布、所述每个聚类的先验概率及所述每个聚类的所述预设数量的所述第二预设属性向量,确定所述预设数量的所述第二预设属性向量的概率及所述预设数量的所述第二预设属性向量在所述每个聚类条件下的概率;以及基于所述在用户画像条件下所述每个聚类的概率、所述预设数量的所述第二预设属性向量的概率及所述预设数量的所述第二预设属性向量在所述每个聚类条件下的概率,确定在所述每个聚类下的所述预设数量的所述第二预设属性向量的修正得分。
优选地,在所述目标对象为同一城市的房源的情况下,所述预设属性包括:房屋面积、房屋价格、首付及房屋装修类型中的至少两者。
本发明第二方面提供一种对话状态获取系统,所述对话状态获取系统包括:拟合装置,用于对目标对象的多个样本进行拟合,以获取所述目标对象的多个聚类及所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率,其中所述样本为第一预设属性向量,该第一预设属性向量包括相互关联的多个预设属性的属性值,以及所述每个聚类的多元分布为属于所述每个聚类的所述第一预设属性向量的分布;以及向量获取装置,用于基于所述多个聚类中的每个聚类的多元分布、所述每个聚类的先验概率及吉布斯采样方法,获取属于特定聚类的特定预设属性向量,所述特定预设属性向量为满足所述用户对话条件的所述目标对象的预设状态。
优选地,所述拟合装置包括:拟合模块,用于采用多个高斯混合模型分别对所述多个样本进行拟合,以获取针对所述多个高斯混合模型的拟合损失,其中所述多个高斯混合模型中的聚类数量不同;指标确定模块,用于基于所述针对所述多个高斯混合模型的拟合损失及所述多个高斯混合模型的聚类数量,采用赤池信息量准则确定所述多个高斯混合模型的赤池信息量准则指标;以及模型筛选模块,用于筛选与所述赤池信息量准则指标的最小值相对应的高斯混合模型,以获取所述目标对象的多个聚类及所述多个聚类中的每个聚类的多元高斯分布。
优选地,所述向量获取装置包括:采样模块,用于采用所述吉布斯采样方法获取属于所述每个聚类的预设数量的第二预设属性向量,其中所述第二预设属性向量包括所述多个预设属性的属性值;取值模块,用于基于所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率,确定对应于所述每个聚类的所述预设数量的所述第二预设属性向量的目标函数的取值,其中所述目标函数为在观测到所述用户对话条件下的聚类及第二预设属性向量的概率函数;以及最值筛选模块,用于从所述目标函数的取值中,筛选出所述取值的最大值所对应的特定聚类的所述第二预设属性向量。
优选地,所述取值模块包括:概率确定模块,用于确定所述预设数量的所述第二预设属性向量在所述用户对话条件下的槽位分布;得分确定模块,用于基于所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率,确定在所述每个聚类下的所述预设数量的所述第二预设属性向量的修正得分;以及取值确定模块,用于基于所述预设数量的所述第二预设属性向量在所述用户对话条件下的槽位分布及所述每个聚类下的所述预设数量的所述第二预设属性向量的修正得分,确定所述对应于所述每个聚类的所述预设数量的所述第二预设属性向量的目标函数的取值。
优选地,所述得分确定模块包括:第一概率确定单元,用于基于所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率,确定在用户画像条件下所述每个聚类的概率;第二概率确定单元,用于基于所述多个聚类中的每个聚类的多元分布、所述每个聚类的先验概率及所述每个聚类的所述预设数量的所述第二预设属性向量,确定所述预设数量的所述第二预设属性向量的概率及所述预设数量的所述第二预设属性向量在所述每个聚类条件下的概率;以及得分确定单元,用于基于所述在用户画像条件下所述每个聚类的概率、所述预设数量的所述第二预设属性向量的概率及所述预设数量的所述第二预设属性向量在所述每个聚类条件下的概率,确定在所述每个聚类下的所述预设数量的所述第二预设属性向量的修正得分。
优选地,在所述目标对象为同一城市的房源的情况下,所述预设属性包括:房屋面积、房屋价格、首付及房屋装修类型中的至少两者。
通过上述技术方案,本发明创造性地对目标对象(例如房源)的多个样本(每个样本为包括相互关联的多个预设属性的属性值的预设属性向量)进行拟合,以获取所述目标对象的多个聚类、所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率;然后根据每个聚类的多元分布、每个聚类的先验概率及吉布斯采样方法,获取属于特定聚类的特定预设属性向量,从而可获取满足所述用户对话条件的所述目标对象的最优状态,由此,本发明可在人机辅助场景中快速推理得到满足用户对话的最优状态,以实现精准的对话状态追踪。
本发明第三方面还提供一种机器可读存储介质,所述机器可读存储介质上存储有指令,该指令用于使得机器执行上述的对话状态获取方法。
本发明第四方面还提供一种电子设备,所述电子设备包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现所述的对话状态获取方法。
本发明的其它特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本发明实施例的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本发明实施例,但并不构成对本发明实施例的限制。在附图中:
图1是本发明一实施例提供的对话状态获取方法的流程图;
图2是本发明一实施例提供的获取属于特定聚类的特定预设属性向量的流程图;
图3是本发明一实施例提供的确定对应于所述每个聚类的所述预设数量的所述第二预设属性向量的目标函数的取值的流程图;以及
图4是本发明一实施例提供的确定在所述每个聚类下的所述预设数量的第二预设属性向量的修正得分的流程图。
具体实施方式
以下结合附图对本发明的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。
在本发明的各个实施例中,“XX条件下”与“已知XX的条件下”表示相同的含义。
图1是本发明一实施例提供的对话状态获取方法的流程图。如图1所示,所述对话状态获取方法可包括步骤S101-S102。
以房源为例,由于不同的预设地理位置(例如不同城市)的房源有很大的偏差(例如,每个城市的房源的不同属性(即槽位)之间的依赖关系很可能相差很大),而同一城市里面不同位置的房源的偏差比较小,故可以天然的通过城市维度将房源进行整体的切分。在下文描述的本发明各个实施例中,仅以同一城市中的房源为例进行说明(因为对于不同城市而言,对话状态获取方法的过程是相同的)。
在同一预设地理位置(例如同一城市)中,虽然同一城市里面不同位置的房源的偏差比较小,但不同类型的房源的属性(即槽位)的联合分布相差很大。本发明各个实施例的一个目的是拟合一套关于房源的多个预设属性(即预设槽位,例如房屋面积、房屋价格及房屋装修类型(例如精装、简装等)等)的联合概率分布,具体地,由于同一城市且同一类型的房源的属性(即槽位)的联合分布可近似服从多元高斯分布,故可通过多元高斯分布对数据库中的属于同一城市且同一类型的多个样本进行拟合。
在这种情况下,在执行步骤S101之前,首先需要按照城市维度将已有房源进行区分;然后按照预设属性列表(即预设槽位列表)将同一城市的所有房源构建为相应样本(即预设属性向量)。其中,房源的各个预设属性之间存在一定的内在联系,比如,价格与面积等属性之间,面积越大,价格越高。并且,房源的各个预设属性可有多个属性值。具体地,连续型数值类的属性(即槽位)可作为一维向量;标签类属性(即槽位)可按照属性值的种类数构建对应的0/1多维变量(例如“装修”的值对应“精装”、“简装”和“清水”,则“装修”这个槽位被归纳为3维多分类标签(one-hot向量))。例如,在按照面积、价格及装修类型属性列表构建样本的情况下,样本1可为{100平、200万、精装};样本2可为{50平、120万、简装}等。
步骤S101,对目标对象的多个样本进行拟合,以获取所述目标对象的多个聚类、所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率。
其中,所述多个样本中的每一者为第一预设属性向量,该第一预设属性向量包括相互关联的多个预设属性的属性值,以及所述每个聚类的多元分布为属于所述每个聚类的所述第一预设属性向量的分布。所述多个聚类可指代不同的房源类型(例如学区房、豪宅、经济房等)。
在所述目标对象为同一城市的房源的情况下,所述预设属性可包括:房屋面积、房屋价格、首付及房屋装修类型中的至少两者。
对于步骤S101,所述对目标对象的多个样本进行拟合可包括:采用多个高斯混合模型分别对所述多个样本进行拟合,以获取针对所述多个高斯混合模型的拟合损失,其中所述多个高斯混合模型中的聚类数量不同;基于所述针对所述多个高斯混合模型的拟合损失及所述多个高斯混合模型的聚类数量,采用赤池信息量准则确定所述多个高斯混合模型的赤池信息量准则指标;以及筛选与所述赤池信息量准则指标的最小值相对应的高斯混合模型,以获取所述目标对象的多个聚类及所述多个聚类中的每个聚类的多元高斯分布。
以房源为例,将每个城市的房源类型数量(GMM隐状态数量)作为超参数进行多次尝试,采用AIC(Akaike information criterion,赤池信息量准则)将赤池信息量准则指标的最小值所对应的类型数量设定为最终的聚类数量。
具体而言,使用聚类数量为k1、k2……、kn的n个高斯混合模型(GMM)对同一城市房源的多个样本(例如,同一城市所有房源的高维样本,由于每个样本涉及多个预设属性相,故每个样本均为高维样本)进行生成式拟合。注意:由于各个预设属性之间相互关联,故设置高斯分布的各个参数之间不独立,且每个聚类的高斯分布均值向量与协方差矩阵均不同。在拟合过程中,可获取针对任一GMM(聚类数量为km)的拟合损失ssem,然后根据每个GMM的拟合损失ssem及相应的聚类数量km,采用赤池信息量准则可计算得到该GMM(聚类数量为km)的AIC指标;采用类似的方式对其他各个GMM分别计算相应的AIC指标。在得到每个GMM的AIC指标的情况下,从各个AIC指标中筛选出最小值,并确定该最小值所对应的特定GMM及与该特定GMM相应的聚类数量、各个聚类与各个聚类的多元高斯分布Gaussian(μi,∑i)。
z:代表房源类型/聚类的取值,如一共用m种房源类型,那么z∈{1,2,..,m}。
o:代表可观测到的文本数据内容,如用户对话为“还是这个100平的房子不错、也只能买这套200万的了”,该用户对话即为可观测到的文本数据内容。
上述步骤S101可实现以下目的:通过GMM算法可对房源属性和房源类型集合进行联合分布拟合。
步骤S102,基于所述多个聚类中的每个聚类的多元分布、所述每个聚类的先验概率及吉布斯采样方法,获取属于特定聚类的特定预设属性向量,所述特定预设属性向量为满足所述用户对话条件的所述目标对象的预设状态。
对于步骤S102,所述获取属于特定聚类的特定预设属性向量可包括步骤S201-S203,如图2所示。
由于在对进行求解的过程中需要对房源属性和房源类别进行穷举,所以此最优化过程所面临的计算复杂度是指数级别,而在本发明中可考虑采用吉布斯采样的方式来对目标函数进行近似估计。采用吉布斯采样可达到以下效果:(1)可对复杂联合概率分布进行采样,而且可以方便推到出各个随机变量的条件分布;(2)因为目标是求得使最大的取值,故相对越容易采样到天然越大的概率。
接下来,判断是否可以通过吉布斯采样来估计。具体地,通过吉布斯采样估计的先决条件是需要满足各随机变量条件分布均可推导,也就是说,和可计算(其中代表排除第k个元素后的向量)。可计算的描述可参见下文步骤S401中的P(z|dmp)计算过程的描述(于此不再进行赘述),因此只需证明可以计算得到,则对于的过程就可以通过吉布斯采样的方式来估计。
具体证明过程如下:
上述公式中,表示第二预设属性向量在房源聚类z条件下的概率(具体计算过程详见步骤S402);表示在观测到用户对话的文本数据内容o条件下的房源属性向量的概率(具体计算过程详见步骤S302);P(o)表示用户对话的文本数据内容o的概率(该项可以通过归一化的方式确定);P(z)、分别表示已知用户画像dmp后,用户倾向于房源类型/聚类z、的概率(具体计算过程详见步骤S401);表示房源属性向量房源类别z以及观测文本o的联合概率,表示对xk(向量中的第k个预设属性)分别为不同属性值时的进行求和;以及表示属于房源聚类的向量的概率(可由数据库中的所述多个样本的实际情况确定)。因为z的种类和xk的取值种类有限(通常比较少),故上式计算复杂度偏低,易于实现。
步骤S201,采用所述吉布斯采样方法获取属于所述每个聚类的预设数量的第二预设属性向量。
其中,所述第二预设属性向量可包括所述多个预设属性的属性值。
设定预设属性向量的初始值根据上述公式(2)可得到第一轮迭代采样过程所需的然后获取与z(1)(具体获取过程不是本发明的主要改进内容,于此不对其进行说明,可参见吉布斯采样方法的相应处理过程);采用类似的方式可在其他各轮迭代采样过程中获取不同的与z。每一轮迭代采样过程可形成一个预设属性向量。其中,所述预设数量即为迭代采样过程的轮数,其可根据实际情况被确定。
假设有随机变量(即预设属性)X和Y,其中X的取值为a1、a2、a3;如果已知P(X=a1|Y,z,o)=0.2,P(X=a2|Y,z,o)=0.3,P(X=a3|Y,z,o)=0.5,那么通过吉布斯采样方法采样是指重新为目标对象(例如房源)分配样本,具体地,“使用一个0~1的均匀随机数生成器,用它生成一个0~1之间的数,如果该数小于0.2,那么就认为X|Y,z,o采样到a1(在已知Y,z,o的条件下,X可采样得到a1);如果该数小大于0.2且小于0.5,那么X|Y,z,o采样到a2;如果该数大于0.5那么就认为X|Y,z,o采样到a3”。对于变量Y的采样也是如此,于此不再赘述。
步骤S202,基于所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率,确定对应于所述每个聚类的所述预设数量的所述第二预设属性向量的目标函数的取值。
其中,所述目标函数为在观测到所述用户对话条件下的聚类及第二预设属性向量的概率函数。
对于步骤S202,所述确定对应于所述每个聚类的所述预设数量的所述第二预设属性向量的目标函数的取值可包括步骤S301-S303,如图3所示。
步骤S301,确定所述预设数量的所述第二预设属性向量在所述用户对话条件下的槽位分布。
步骤S302,基于所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率,确定在所述每个聚类下的所述预设数量的所述第二预设属性向量的修正得分。
对于步骤S302,所述确定在所述每个聚类下的所述预设数量的第二预设属性向量的修正得分可包括步骤S401-S403,如图4所示。
步骤S401,基于所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率,确定在用户画像条件下所述每个聚类的概率。
用户画像dmp由用户对房源的各个属性取值所得到的属性值的集合(类似于向量)构成(可事先通过用户搜索等其他渠道可获取的先验内容)。在已知用户画像dmp的条件下,用户倾向于房源类型z的概率P(z|dpm)∝P(z)*P(dmp|z),其中P(z)是各个房源类型/聚类的先验概率。通过GMM对多个样本进行生成式拟合,可以得到P(z)及相应的多元高斯分布;通过多元高斯分布可计算得到P(dmp|z)概率(因为dmp也被表达成一个房屋属性向量如{50平、120万、简装},故可通过多元高斯模型计算其对应概率值),故P(z|dmp)可由P(z)与P(dmp|z)相乘并归一化后计算得到。为了方便起见,在各个实施例中可用P(z)表示P(z|dmp),其代表已知用户画像dmp后,用户倾向于房屋类型z的概率。
步骤S402,基于所述多个聚类中的每个聚类的多元分布、所述每个聚类的先验概率及所述每个聚类的所述预设数量的所述第二预设属性向量,确定所述预设数量的所述第二预设属性向量的概率及所述预设数量的所述第二预设属性向量在所述每个聚类条件下的概率。
类似于上述步骤S401,根据所述多个聚类中的每个聚类的多元分布及所述每个聚类的所述预设数量的所述第二预设属性向量,计算第二预设属性向量在房源聚类条件下的概率;然后将与每个聚类的先验概率代入公式可确定所述预设数量的所述第二预设属性向量的概率
步骤S403,基于所述在用户画像条件下所述每个聚类的概率、所述预设数量的所述第二预设属性向量的概率及所述预设数量的所述第二预设属性向量在所述每个聚类条件下的概率,确定在所述每个聚类下的所述预设数量的所述第二预设属性向量的修正得分。
步骤S303,基于所述预设数量的所述第二预设属性向量在所述用户对话条件下的槽位分布及所述每个聚类下的所述预设数量的所述第二预设属性向量的修正得分,确定所述对应于所述每个聚类的所述预设数量的所述第二预设属性向量的目标函数的取值。
根据步骤S301得到的所述预设数量的所述第二预设属性向量在所述用户对话条件下的槽位分布及步骤S302得到的所述每个聚类下的所述预设数量的所述第二预设属性向量的修正得分可计算对应于所述每个聚类的所述预设数量的所述第二预设属性向量的目标函数的取值。
步骤S203,从所述目标函数的取值中,筛选出所述取值的最大值所对应的特定聚类的所述第二预设属性向量。
具体地,将迭代过程中使最大的作为估计得到的最优与z(即通过吉布斯采样方法快速给出全局最优的DST状态解),从而推理得出满足用户对话条件的以及属于特定聚类z的特定预设属性向量(在实际业务使用时,如用户对话为“还是这个100平的房子不错、也只能买这套200万的了”,则指房屋面积(100平)及房屋价格(200万);对于z只是房屋的数据聚类结果可通过人工检测的方式归纳出z类别的具体实际意义)。
通过上述步骤S201-S203可获取属于特定聚类的特定预设属性向量,即可精确地确定用户需求,从而可在购房用户与经纪人对话过程中智能地辅助经纪人确定用户的真实需求,进而可促进双方的沟通效率及成单率。
综上所述,本发明创造性地对目标对象(例如房源)的多个样本(每个样本为包括相互关联的多个预设属性的属性值的预设属性向量)进行拟合,以获取所述目标对象的多个聚类、所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率;然后根据每个聚类的多元分布、每个聚类的先验概率及吉布斯采样方法,获取属于特定聚类的特定预设属性向量,从而获取满足所述用户对话条件的所述目标对象的最优状态,由此,本发明可在人机辅助场景中快速推理得到满足用户对话的最优状态,以实现精准的对话状态追踪。
本发明第二方面提供一种对话状态获取系统,所述对话状态获取系统包括:拟合装置,用于对目标对象的多个样本进行拟合,以获取所述目标对象的多个聚类、所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率,其中所述多个样本中的每一者为第一预设属性向量,该第一预设属性向量包括相互关联的多个预设属性的属性值,以及所述每个聚类的多元分布为属于所述每个聚类的所述第一预设属性向量的分布;以及向量获取装置,用于基于所述多个聚类中的每个聚类的多元分布、所述每个聚类的先验概率及吉布斯采样方法,获取属于特定聚类的特定预设属性向量,所述特定预设属性向量为满足所述用户对话条件的所述目标对象的预设状态。
优选地,所述拟合装置包括:拟合模块,用于采用多个高斯混合模型分别对所述多个样本进行拟合,以获取针对所述多个高斯混合模型的拟合损失,其中所述多个高斯混合模型中的聚类数量不同;指标确定模块,用于基于所述针对所述多个高斯混合模型的拟合损失及所述多个高斯混合模型的聚类数量,采用赤池信息量准则确定所述多个高斯混合模型的赤池信息量准则指标;以及模型筛选模块,用于筛选与所述赤池信息量准则指标的最小值相对应的高斯混合模型,以获取所述目标对象的多个聚类及所述多个聚类中的每个聚类的多元高斯分布。
优选地,所述向量获取装置包括:采样模块,用于采用所述吉布斯采样方法获取属于所述每个聚类的预设数量的第二预设属性向量,其中所述第二预设属性向量包括所述多个预设属性的属性值;取值模块,用于基于所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率,确定对应于所述每个聚类的所述预设数量的所述第二预设属性向量的目标函数的取值,其中所述目标函数为在观测到所述用户对话条件下的聚类及第二预设属性向量的概率函数;以及最值筛选模块,用于从所述目标函数的取值中,筛选出所述取值的最大值所对应的特定聚类的所述第二预设属性向量。
优选地,所述取值模块包括:概率确定模块,用于确定所述预设数量的所述第二预设属性向量在所述用户对话条件下的槽位分布;得分确定模块,用于基于所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率,确定在所述每个聚类下的所述预设数量的第二预设属性向量的修正得分;以及取值确定模块,用于基于所述预设数量的所述第二预设属性向量在所述用户对话条件下的槽位分布及所述每个聚类下的所述预设数量的所述第二预设属性向量的修正得分,确定所述对应于所述每个聚类的所述预设数量的所述第二预设属性向量的目标函数的取值。
优选地,所述得分确定模块包括:第一概率确定单元,用于基于所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率,确定在用户画像条件下所述每个聚类的概率;第二概率确定单元,用于基于所述多个聚类中的每个聚类的多元分布、所述每个聚类的先验概率及所述每个聚类的所述预设数量的所述第二预设属性向量,确定所述预设数量的所述第二预设属性向量的概率及所述预设数量的所述第二预设属性向量在所述每个聚类条件下的概率;以及得分确定单元,用于基于所述在用户画像条件下所述每个聚类的概率、所述预设数量的所述第二预设属性向量的概率及所述预设数量的所述第二预设属性向量在所述每个聚类条件下的概率,确定在所述每个聚类下的所述预设数量的所述第二预设属性向量的修正得分。
优选地,在所述目标对象为同一城市的房源的情况下,所述预设属性包括:房屋面积、房屋价格、首付及房屋装修类型中的至少两者。
有关本发明提供的对话状态获取系统的具体细节及益处可参阅上述针对对话状态获取方法的描述,于此不再赘述。
本发明另一实施例还提供一种机器可读存储介质,所述机器可读存储介质上存储有指令,该指令用于使得机器执行上述的对话状态获取方法。
本发明再一实施例还提供一种电子设备,所述电子设备包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现所述的对话状态获取方法。
以上结合附图详细描述了本发明实施例的可选实施方式,但是,本发明实施例并不限于上述实施方式中的具体细节,在本发明实施例的技术构思范围内,可以对本发明实施例的技术方案进行多种简单变型,这些简单变型均属于本发明实施例的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合。为了避免不必要的重复,本发明实施例对各种可能的组合方式不再另行说明。
本领域技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得单片机、芯片或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
此外,本发明实施例的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明实施例的思想,其同样应当视为本发明实施例所公开的内容。
Claims (10)
1.一种对话状态获取方法,其特征在于,所述对话状态获取方法包括:
对目标对象的多个样本进行拟合,以获取所述目标对象的多个聚类、所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率,其中所述样本为第一预设属性向量,该第一预设属性向量包括相互关联的多个预设属性的属性值,以及所述每个聚类的多元分布为属于所述每个聚类的所述第一预设属性向量的分布;以及
基于所述多个聚类中的每个聚类的多元分布、所述每个聚类的先验概率及吉布斯采样方法,获取属于特定聚类的特定预设属性向量,所述特定预设属性向量为满足用户对话条件的所述目标对象的预设状态,
在所述目标对象为同一城市的房源的情况下,所述预设属性包括:房屋面积、房屋价格、首付及房屋装修类型中的至少两者,
其中,所述对目标对象的多个样本进行拟合包括:
采用多个高斯混合模型分别对所述多个样本进行拟合,以获取针对所述多个高斯混合模型的拟合损失,其中所述多个高斯混合模型中的聚类数量不同;
基于所述针对所述多个高斯混合模型的拟合损失及所述多个高斯混合模型的聚类数量,采用赤池信息量准则确定所述多个高斯混合模型的赤池信息量准则指标;以及
筛选与所述赤池信息量准则指标的最小值相对应的高斯混合模型,以获取所述目标对象的多个聚类及所述多个聚类中的每个聚类的多元高斯分布。
2.根据权利要求1所述的对话状态获取方法,其特征在于,所述获取属于特定聚类的特定预设属性向量包括:
采用所述吉布斯采样方法获取属于所述每个聚类的预设数量的第二预设属性向量,其中所述第二预设属性向量包括所述多个预设属性的属性值;
基于所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率,确定对应于所述每个聚类的所述预设数量的所述第二预设属性向量的目标函数的取值,其中所述目标函数为在观测到所述用户对话条件下的聚类及第二预设属性向量的概率函数;以及
从所述目标函数的取值中,筛选出所述取值的最大值所对应的特定聚类的所述第二预设属性向量。
3.根据权利要求2所述的对话状态获取方法,其特征在于,所述确定对应于所述每个聚类的所述预设数量的所述第二预设属性向量的目标函数的取值包括:
确定所述预设数量的所述第二预设属性向量在所述用户对话条件下的槽位分布;
基于所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率,确定在所述每个聚类下的所述预设数量的所述第二预设属性向量的修正得分;以及
基于所述预设数量的所述第二预设属性向量在所述用户对话条件下的槽位分布及所述每个聚类下的所述预设数量的所述第二预设属性向量的修正得分,确定所述对应于所述每个聚类的所述预设数量的所述第二预设属性向量的目标函数的取值。
4.根据权利要求3所述的对话状态获取方法,其特征在于,所述确定在所述每个聚类下的所述预设数量的所述第二预设属性向量的修正得分包括:
基于所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率,确定在用户画像条件下所述每个聚类的概率;
基于所述多个聚类中的每个聚类的多元分布、所述每个聚类的先验概率及所述每个聚类的所述预设数量的所述第二预设属性向量,确定所述预设数量的所述第二预设属性向量的概率及所述预设数量的所述第二预设属性向量在所述每个聚类条件下的概率;以及
基于所述在用户画像条件下所述每个聚类的概率、所述预设数量的所述第二预设属性向量的概率及所述预设数量的所述第二预设属性向量在所述每个聚类条件下的概率,确定在所述每个聚类下的所述预设数量的所述第二预设属性向量的修正得分。
5.一种对话状态获取系统,其特征在于,所述对话状态获取系统包括:
拟合装置,用于对目标对象的多个样本进行拟合,以获取所述目标对象的多个聚类、所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率,其中所述样本为第一预设属性向量,该第一预设属性向量包括相互关联的多个预设属性的属性值,以及所述每个聚类的多元分布为属于所述每个聚类的所述第一预设属性向量的分布;以及
向量获取装置,用于基于所述多个聚类中的每个聚类的多元分布、所述每个聚类的先验概率及吉布斯采样方法,获取属于特定聚类的特定预设属性向量,所述特定预设属性向量为满足用户对话条件的所述目标对象的预设状态,
在所述目标对象为同一城市的房源的情况下,所述预设属性包括:房屋面积、房屋价格、首付及房屋装修类型中的至少两者,
其中,所述拟合装置包括:
拟合模块,用于采用多个高斯混合模型分别对所述多个样本进行拟合,以获取针对所述多个高斯混合模型的拟合损失,其中所述多个高斯混合模型中的聚类数量不同;
指标确定模块,用于基于所述针对所述多个高斯混合模型的拟合损失及所述多个高斯混合模型的聚类数量,采用赤池信息量准则确定所述多个高斯混合模型的赤池信息量准则指标;以及
模型筛选模块,用于筛选与所述赤池信息量准则指标的最小值相对应的高斯混合模型,以获取所述目标对象的多个聚类及所述多个聚类中的每个聚类的多元高斯分布。
6.根据权利要求5所述的对话状态获取系统,其特征在于,所述向量获取装置包括:
采样模块,用于采用所述吉布斯采样方法获取属于所述每个聚类的预设数量的第二预设属性向量,其中所述第二预设属性向量包括所述多个预设属性的属性值;
取值模块,用于基于所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率,确定对应于所述每个聚类的所述预设数量的所述第二预设属性向量的目标函数的取值,其中所述目标函数为在观测到所述用户对话条件下的聚类及第二预设属性向量的概率函数;以及
最值筛选模块,用于从所述目标函数的取值中,筛选出所述取值的最大值所对应的特定聚类的所述第二预设属性向量。
7.根据权利要求6所述的对话状态获取系统,其特征在于,所述取值模块包括:
概率确定模块,用于确定所述预设数量的所述第二预设属性向量在所述用户对话条件下的槽位分布;
得分确定模块,用于基于所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率,确定在所述每个聚类下的所述预设数量的第二预设属性向量的修正得分;以及
取值确定模块,用于基于所述预设数量的所述第二预设属性向量在所述用户对话条件下的槽位分布及所述每个聚类下的所述预设数量的所述第二预设属性向量的修正得分,确定所述对应于所述每个聚类的所述预设数量的所述第二预设属性向量的目标函数的取值。
8.根据权利要求7所述的对话状态获取系统,其特征在于,所述得分确定模块包括:
第一概率确定单元,用于基于所述多个聚类中的每个聚类的多元分布及所述每个聚类的先验概率,确定在用户画像条件下所述每个聚类在用户画像条件下所述每个聚类的概率;
第二概率确定单元,用于基于所述多个聚类中的每个聚类的多元分布、所述每个聚类的先验概率及所述每个聚类的所述预设数量的所述第二预设属性向量,确定所述预设数量的所述第二预设属性向量的概率及所述预设数量的所述第二预设属性向量在所述每个聚类条件下的概率;以及
得分确定单元,用于基于所述在用户画像条件下所述每个聚类的概率、所述预设数量的所述第二预设属性向量的概率及所述预设数量的所述第二预设属性向量在所述每个聚类条件下的概率,确定在所述每个聚类下的所述预设数量的所述第二预设属性向量的修正得分。
9.一种机器可读存储介质,其特征在于,所述机器可读存储介质上存储有指令,该指令用于使得机器执行上述权利要求1-4中任一项权利要求所述的对话状态获取方法。
10.一种电子设备,其特征在于,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述权利要求1-4中任一项权利要求所述的对话状态获取方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011290076.4A CN112395400B (zh) | 2020-11-17 | 2020-11-17 | 对话状态获取方法、系统、可读存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011290076.4A CN112395400B (zh) | 2020-11-17 | 2020-11-17 | 对话状态获取方法、系统、可读存储介质及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112395400A CN112395400A (zh) | 2021-02-23 |
CN112395400B true CN112395400B (zh) | 2022-12-13 |
Family
ID=74607193
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011290076.4A Active CN112395400B (zh) | 2020-11-17 | 2020-11-17 | 对话状态获取方法、系统、可读存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112395400B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003090117A1 (en) * | 2002-04-18 | 2003-10-30 | British Telecommunications Public Limited Company | Data analysis method |
CN107423282A (zh) * | 2017-05-24 | 2017-12-01 | 南京大学 | 基于混合特征的文本中语义连贯性主题与词向量并发提取方法 |
CN109508423A (zh) * | 2018-12-14 | 2019-03-22 | 平安科技(深圳)有限公司 | 基于语义识别的房源推荐方法、装置、设备及存储介质 |
CN110633726A (zh) * | 2018-12-25 | 2019-12-31 | 北京时光荏苒科技有限公司 | 一种房源识别方法、装置、存储介质及电子设备 |
CN111079001A (zh) * | 2019-11-26 | 2020-04-28 | 贝壳技术有限公司 | 装修推荐信息生成方法、装置、存储介质及电子设备 |
CN111832289A (zh) * | 2020-07-13 | 2020-10-27 | 重庆大学 | 一种基于聚类和高斯lda的服务发现方法 |
-
2020
- 2020-11-17 CN CN202011290076.4A patent/CN112395400B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003090117A1 (en) * | 2002-04-18 | 2003-10-30 | British Telecommunications Public Limited Company | Data analysis method |
CN107423282A (zh) * | 2017-05-24 | 2017-12-01 | 南京大学 | 基于混合特征的文本中语义连贯性主题与词向量并发提取方法 |
CN109508423A (zh) * | 2018-12-14 | 2019-03-22 | 平安科技(深圳)有限公司 | 基于语义识别的房源推荐方法、装置、设备及存储介质 |
CN110633726A (zh) * | 2018-12-25 | 2019-12-31 | 北京时光荏苒科技有限公司 | 一种房源识别方法、装置、存储介质及电子设备 |
CN111079001A (zh) * | 2019-11-26 | 2020-04-28 | 贝壳技术有限公司 | 装修推荐信息生成方法、装置、存储介质及电子设备 |
CN111832289A (zh) * | 2020-07-13 | 2020-10-27 | 重庆大学 | 一种基于聚类和高斯lda的服务发现方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112395400A (zh) | 2021-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Luan et al. | Scientific information extraction with semi-supervised neural tagging | |
Lee | Structured discriminative model for dialog state tracking | |
CN111046187B (zh) | 基于对抗式注意力机制的一样本知识图谱关系学习方法及系统 | |
CN114492363B (zh) | 一种小样本微调方法、系统及相关装置 | |
Sun et al. | A generalized rule based tracker for dialogue state tracking | |
CN110990555B (zh) | 端到端检索式对话方法与系统及计算机设备 | |
CN111353106A (zh) | 推荐方法和装置、电子设备和存储介质 | |
CN113268609A (zh) | 基于知识图谱的对话内容推荐方法、装置、设备及介质 | |
CN109948140B (zh) | 一种词向量嵌入方法及装置 | |
CN111813923B (zh) | 文本摘要方法、电子设备及存储介质 | |
Shen et al. | Semi-supervised intent discovery with contrastive learning | |
CN111611395B (zh) | 一种实体关系的识别方法及装置 | |
CN112989002B (zh) | 一种基于知识图谱的问答处理方法、装置及设备 | |
CN112200664A (zh) | 基于ernie模型和dcnn模型的还款预测方法 | |
Chien et al. | Self Attention in Variational Sequential Learning for Summarization. | |
CN116910307A (zh) | 一种跨模态视频文本检索方法、系统、设备及介质 | |
CN114090401B (zh) | 处理用户行为序列的方法及装置 | |
Lee et al. | Generative adversarial networks for de novo molecular design | |
CN117829298A (zh) | 一种多跳时序知识图谱问答方法及系统 | |
CN116150306A (zh) | 问答机器人的训练方法、问答方法及装置 | |
CN111161238A (zh) | 图像质量评价方法及装置、电子设备、存储介质 | |
CN112395400B (zh) | 对话状态获取方法、系统、可读存储介质及电子设备 | |
Parker et al. | Named entity recognition through deep representation learning and weak supervision | |
CN117575008A (zh) | 训练样本生成方法、模型训练方法、知识问答方法及设备 | |
CN117251685A (zh) | 一种基于知识图谱的标准化政务数据构建方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |