CN113761139A - 一种意图预判的方法和装置 - Google Patents

一种意图预判的方法和装置 Download PDF

Info

Publication number
CN113761139A
CN113761139A CN202010796464.3A CN202010796464A CN113761139A CN 113761139 A CN113761139 A CN 113761139A CN 202010796464 A CN202010796464 A CN 202010796464A CN 113761139 A CN113761139 A CN 113761139A
Authority
CN
China
Prior art keywords
intention
user
features
mode
prejudgment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010796464.3A
Other languages
English (en)
Inventor
高毅
赵月明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Wodong Tianjun Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Wodong Tianjun Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Wodong Tianjun Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN202010796464.3A priority Critical patent/CN113761139A/zh
Publication of CN113761139A publication Critical patent/CN113761139A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种意图预判的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:获取用户的个性化特征数据和系统关键特征数据;对用户的个性化特征数据和系统关键特征数据进行模式识别以得到抽象特征;对抽象特征进行统计分析以得到指定模式特征;根据指定模式特征对用户进行意图预判。该实施方式能够大大地缩小进行意图预判时需要拟合的数据范围,从而提高意图预判的准确率。

Description

一种意图预判的方法和装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种意图预判的方法和装置。
背景技术
在智能客服领域,如果智能客服系统能对新加入咨询的用户,在用户尚未描述问题之前就能够进行更加精准的意图预判,将会显著提升用户体验。例如:在用户刚进入咨询界面时,智能客服系统即直接为用户呈现出可能咨询的问题列表,或直接为用户呈现最可能的问答对,或直接为用户提供最可能咨询问题的详情页面(如预判到用户80%概率可能咨询订单物流情况,则直接呈现出物流进度),等等,均可以为用户带来更好的体验。
目前,意图预判的主要技术方案多是根据当前系统综合特征训练分类模型以进行意图预判,或通过手工编写规则,根据触发条件来进行意图预判。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
1、对于通过分类模型来进行意图预判的技术方案来说,直接使用当前系统中各种综合特征来训练分类模型,由于系统中各种特征过于复杂,系统中可能存在成千上万个特征数据,故而从海量的数据直接预判出用户潜在意图非常的困难,模型预测的准确率难以提升;
2、对于通过手工编写规则来进行意图预判的技术方案来说,由于规则难以编写和维护,而且规则的适用场景可能随着时间变化而失效,故而进行用户意图预判的准确率不高。
发明内容
有鉴于此,本发明实施例提供一种意图预判的方法和装置,能够大大地缩小进行意图预判时需要拟合的数据范围,从而提高意图预判的准确率。
为实现上述目的,根据本发明实施例的一个方面,提供了一种意图预判的方法。
一种意图预判的方法,包括:获取用户的个性化特征数据和系统关键特征数据;对所述用户的个性化特征数据和系统关键特征数据进行模式识别以得到抽象特征;对所述抽象特征进行统计分析以得到指定模式特征;根据所述指定模式特征对所述用户进行意图预判。
可选地,所述指定模式特征包括异常模式特征和高频模式特征,并且,对所述抽象特征进行统计分析以得到指定模式特征包括:对所述抽象特征进行异常检测以得到异常模式特征,并将所述抽象特征中除所述异常模式特征之外的特征作为正常模式特征;将所述正常模式特征中,特征出现的频次大于设定的特征频次阈值的特征作为高频模式特征;将所述异常模式特征和所述高频模式特征作为指定模式特征。
可选地,根据所述指定模式特征对所述用户进行意图预判之后,还包括:将根据所述指定模式特征对所述用户进行意图预判的结果作为第一预判结果;根据预设的预判规则对所述用户进行意图预判以得到第二预判结果;将所述第一预判结果与所述第二预判结果进行融合,以对所述用户进行意图预判。
可选地,将所述第一预判结果与所述第二预判结果进行融合包括:通过设置所述第一预判结果与所述第二预判结果的优先级,以将所述第一预判结果与所述第二预判结果进行融合。
可选地,还包括:显示意图预判的结果,并采集所述用户的反馈数据,所述反馈数据用于对意图预判模型进行优化调整。
可选地,所述意图预判模型的训练过程包括:定义与业务相关的抽象特征类型以及用户的意图分类;使用自动搜集机制实时搜集线上数据以得到用户选择的意图类型;获取用户的个性化特征数据和系统关键特征数据,并进行模式识别以得到抽象特征;对所述抽象特征进行统计分析以得到指定模式特征;将所述指定模式特征作为输入,所述用户选择的意图类型作为输出,训练所述意图预判模型。
根据本发明实施例的另一方面,提供了一种意图预判的装置。
一种意图预判的装置,包括:数据获取模块,用于获取用户的个性化特征数据和系统关键特征数据;模式识别模块,用于对所述用户的个性化特征数据和系统关键特征数据进行模式识别以得到抽象特征;特征提取模块,用于对所述抽象特征进行统计分析以得到指定模式特征;特征判断模块,用于根据所述指定模式特征对所述用户进行意图预判。
可选地,所述指定模式特征包括异常模式特征和高频模式特征,并且,所述特征提取模块还用于:对所述抽象特征进行异常检测以得到异常模式特征,并将所述抽象特征中除所述异常模式特征之外的特征作为正常模式特征;将所述正常模式特征中,特征出现的频次大于设定的特征频次阈值的特征作为高频模式特征;将所述异常模式特征和所述高频模式特征作为指定模式特征。
可选地,还包括第二预判模块,用于:在根据所述指定模式特征对所述用户进行意图预判之后,将根据所述指定模式特征对所述用户进行意图预判的结果作为第一预判结果;根据预设的预判规则对所述用户进行意图预判以得到第二预判结果;将所述第一预判结果与所述第二预判结果进行融合,以对所述用户进行意图预判。
可选地,所述第二预判模块还用于:通过设置所述第一预判结果与所述第二预判结果的优先级,以将所述第一预判结果与所述第二预判结果进行融合。
可选地,还包括预判交互模块,用于:显示意图预判的结果,并采集所述用户的反馈数据,所述反馈数据用于对意图预判模型进行优化调整。
可选地,所述意图预判模型的训练过程包括:定义与业务相关的抽象特征类型以及用户的意图分类;使用自动搜集机制实时搜集线上数据以得到用户选择的意图类型;获取用户的个性化特征数据和系统关键特征数据,并进行模式识别以得到抽象特征;对所述抽象特征进行统计分析以得到指定模式特征;将所述指定模式特征作为输入,所述用户选择的意图类型作为输出,训练所述意图预判模型。
根据本发明实施例的又一方面,提供了一种意图预判的电子设备。
一种意图预判的电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例所提供的意图预判的方法。
根据本发明实施例的再一方面,提供了一种计算机可读介质。
一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明实施例所提供的意图预判的方法。
上述发明中的一个实施例具有如下优点或有益效果:通过获取用户的个性化特征数据和系统关键特征数据;对用户的个性化特征数据和系统关键特征数据进行模式识别以得到抽象特征;对抽象特征进行统计分析以得到指定模式特征;根据指定模式特征对用户进行意图预判,能够大大地缩小进行意图预判时需要拟合的数据范围,从而提高意图预判的准确率。根据本发明实施例的技术方案,可以实现基于模式识别得到的抽象特征,发现系统运行过程中出现的异常模式特征和高频模式特征,这些特征可以更好地体现用户的需求,从而根据这些特征进行用户意图预判可以提高意图预判的准确率;并且,还可结合设定的预判规则来进行意图预判,从而进一步地提高意图预判的准确率;另外,在进行意图预判得到结果后,采集用户的反馈数据,通过用户反馈数据对模型进行优化调整,从而更进一步地提高意图预判模型的准确率。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明实施例的意图预判的方法的主要步骤示意图;
图2是本发明实施例的意图预判系统的实现原理示意图;
图3是根据本发明实施例的意图预判的装置的主要模块示意图;
图4是本发明实施例可以应用于其中的示例性系统架构图;
图5是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
目前,进行用户意图预判方面的主要技术方案如下:
1、根据当前系统综合特征训练分类模型以进行意图预判
目前,典型的做法是把意图预判作为一个分类问题。把意图预判作为系统数百个特征与问题分类之间的映射关系。其大致的流程如下:从历史对话消息中,挖掘出用户咨询的问题及问题标签等信息,从系统中追溯出用户的各种特征,如用户性别、年龄范围、常购商品、下单情况、物流情况、咨询情况等等数据,通过训练模型来拟合原始特征与问题标签之间的关系;
2、手工编写规则,根据触发条件来进行意图预判
如果有比较明显的规则能够大概率命中用户的意图,同样可以配置规则来预判用户的意图。例如:用户订单超过3天未送到,而用户从订单页面点击进入咨询,则大概率是咨询订单的物流情况。
但是,上述两种方案存在预测准确率低的缺陷。为了解决现有技术中存在的该技术问题,本发明提供了一种意图预判的方法和装置,主要从个性化数据及整体系统基础数据的模式识别的角度来提升用户意图的预判准确率。主要思路是:不再把预判流程作为系统特征与意图之间直接的映射关系,而从用户的个性化数据与系统整体运行状态中去发现异常模式或高频模式,进而从异常模式或高频模式去推导用户的潜在意图。这样能够大大地缩小模型需要拟合的数据范围,从而提高意图预判的准确率。
而整个系统能够构造为自动化执行的方案,首先能够实时监测系统整体数据的标准模式及高频模式,分析人工咨询数据中的典型的问题类型,统计出高频模式、异常模式,自动统计其模式类型与咨询问题类型之间对应关系,这样能实现自动动态调整的目的,避免像手工规则那样固定不变。
在本发明的实施例介绍中,出现的术语解释如下:
意图:intent,在进行智能客服咨询时,表示用户需要咨询的目的;
预判:predict,在用户进行咨询之前,预先判断用户咨询的意图;
模式:模式就是在现实世界中或人类设计作品或抽象的想法中存在的规律性;
特征:feature,作为模型训练的输入参数,如订单量、持续时间等;
模型:model,用户描述特征与输出之间关系的数学模型,能根据一组输入特征,输出对应的概率值;
异常检测:Anomaly detection,首先定义一组系统处于“正常”情况时的数据,如CPU利用率、内存利用率、文件校验和等,然后进行分析确定是否出现异常;
XGBoost:是一套优化的分布式梯度提升模型库,非常高效、灵活和可移植,在结构化特征训练领域里,非常简便而强大;
CNN:convolutional neural network,卷积神经网络。
图1是根据本发明实施例的意图预判的方法的主要步骤示意图。如图1所示,本发明实施例的意图预判的方法主要包括如下的步骤S101至步骤S104。
步骤S101:获取用户的个性化特征数据和系统关键特征数据;
步骤S102:对用户的个性化特征数据和系统关键特征数据进行模式识别以得到抽象特征;
步骤S103:对抽象特征进行统计分析以得到指定模式特征;
步骤S104:根据指定模式特征对用户进行意图预判。
根据上述的步骤S101至步骤S104,即可通过对用户的个性化特征数据和系统关键特征数据进行处理来发现指定模式特征,并根据指定模式特征来进行意图预判,能够大大地缩小进行意图预判时需要拟合的数据范围,从而提高意图预判的准确率。
根据本发明的一个实施例,指定模式特征包括异常模式特征和高频模式特征,并且,对抽象特征进行统计分析以得到指定模式特征具体可以包括以下步骤:
对抽象特征进行异常检测以得到异常模式特征,并将抽象特征中除异常模式特征之外的特征作为正常模式特征;
将正常模式特征中,特征出现的频次大于设定的特征频次阈值的特征作为高频模式特征;
将异常模式特征和高频模式特征作为指定模式特征。
根据该实施例的技术方案,可以实现基于模式识别得到的抽象特征,发现系统运行过程中出现的异常模式特征和高频模式特征,这些特征可以更好地体现用户的需求,从而根据这些特征进行用户意图预判可以提高意图预判的准确率。
根据本发明的另一个实施例,在根据指定模式特征对用户进行意图预判之后,还可以包括:
将根据指定模式特征对用户进行意图预判的结果作为第一预判结果;
根据预设的预判规则对用户进行意图预判以得到第二预判结果;
将第一预判结果与第二预判结果进行融合,以对用户进行意图预判。
根据该实施例,可以将通过意图预判算法模型进行意图预判的第一预判结果,与根据设定的预判规则进行意图预判的第二预判结果进行融合,从而更进一步地提高意图预判的准确率。其中,预设的预判规则是根据业务情况进行设定的,预判规则例如:用户订单超过3天未送到,且用户从订单页面点击进入咨询,则用户意图预判为咨询订单的物流情况。
根据本发明的实施例,在将第一预判结果与第二预判结果进行融合时,一种实施方式例如是:通过设置第一预判结果与第二预判结果的优先级,以将第一预判结果与第二预判结果进行融合。
根据本发明的又一个实施例,在进行意图预判得到结果后,还可以显示意图预判的结果,并采集用户的反馈数据,反馈数据用于对意图预判模型进行优化调整。在显示意图预判结果后,若用户对结果进行了点击,或者用户主动反馈问题“已解决”或“未解决”,这些都可作为用户的反馈数据进行采集,并根据这些反馈数据对意图预判模型进行优化调整。如此,即可通过用户反馈数据对模型进行调整,从而提高意图预判模型的准确率。
在本发明的实施例中,意图预判模型的训练过程可以包括以下步骤:
定义与业务相关的抽象特征类型以及用户的意图分类;
使用自动搜集机制实时搜集线上数据以得到用户选择的意图类型;
获取用户的个性化特征数据和系统关键特征数据,并进行模式识别以得到抽象特征;
对抽象特征进行统计分析以得到指定模式特征;
将指定模式特征作为输入,用户选择的意图类型作为输出,训练意图预判模型。
下面结合具体实施例介绍本发明的意图预判系统的实施过程。图2是本发明实施例的意图预判系统的实现原理示意图。如图2所示,本发明实施例的意图预判系统主要包括用户数据管理模块、系统关键特征数据管理模块、模式识别及特征提取模块、意图预测模块、规则维护模块和预判交互模块。其中:
用户数据管理模块:用于定义与用户咨询意图强相关的一组观察特征集合,如用户年龄、性别、常购清单、消费水平、信用、评论特征、客服咨询频次等等;
系统关键特征数据管理模块:用于定义一组整体系统影响全局的关键数据特征,从整体上反应出系统状态,如电商系统最近优惠促销信息、出现大规模优惠券异常等等状态信息;
模式识别及特征提取模块:主要负责统计系统关键特征数据及用户的个性化特征数据,如系统总体下单量、物流配送量、用户平均下单量、用户咨询量、用户投诉量,单个用户下单与咨询时间数量及比例、单个用户咨询频次、商品的单个日子的咨询频次等基础数据。然后,对这些特征数据进行模式识别,以得到每个抽象特征的数据范围分布特征。之后,再通过异常检测方法(如IQR、Z-score等)得到每个抽象特征的异常数据,并将这些异常数据作为异常模式特征,将剩下的每个抽象特征的正常波动范围内的特征数据作为正常模式特征;然后,根据每个抽象特征出现的频次从正常模式特征中获取到高频模式特征,将异常模式特征和高频模式特征作为要进行进一步处理的指定模式特征。例如:某款手机在下午3~5点时间范围内下单量1000~1200之间,则对于某款手机在下午3~5点时间范围内下单量这一抽象特征来说,其正常模式特征值即为1000~1200之间。高频模式属于正常模式范围内的数据,但有更强的统计特征,例如:某款手机在下午3点~5点下单量为1000~1200之间,并且其中200单搭配销售手机壳。其中,IQR(interquartile range)是四分位距,又称四分差,是描述统计学中的一种方法,以确定第三四分位数和第一四分位数的区别,与方差、标准差一样,表示统计资料中各变量分散情形;Z-score是Z分数,也叫标准分数(standardscore),是一个数与平均数的差再除以标准差的过程,在统计学中,标准分数是一个观测或数据点的值高于被观测值或测量值的平均值的标准偏差的符号数;
意图预测模块:用于根据模式识别及特征提取模块的处理结果,通过分类模型来判断用户的高频意图;
规则维护模块:用于维护预设的意图预判规则,并判断用户此次进行客服咨询的行为是否符合意图预判规则。意图预判规则作为强类型或需要直接控制情况下的补充手段;
预判交互模块:负责与前端用户进行交互,包括用户刚进入客服咨询时,读取意图预测模块的预判结果与规则维护模块的预判结果,将预判到意图对应的相似问法、或高概率的咨询问答对、或高概率的意图的进一步详情展示给用户。用户如果点击了问法或反馈按钮,则收集用户的点击数据作为用户反馈,将用户反馈回流到意图预测模块,以便进一步提高预判模型的准确率。另外,还可以对用户反馈进行统计分析,分析出明显的策略问题,比如某个规则已经设置不合理了,进而可对规则进行调整,以更好地提高意图预测的准确率。
下面将介绍本发明实施例的意图预判模型的实现原理和训练过程。本发明实施例的意图预判模型本质上是一个分类模型,但是与传统的直接分类模型不同,不直接使用原始的数据特征来拟合用户意图,而使用模式识别及特征提取模块的识别结果来进行判断。模式识别及特征提取模块首先对主要的特征(包括系统关键特征和用户的个性化特征)做了模式范围的判定与是否异常的输出,这样获取到的是异常模式特征和高频模式特征,通过这些特征来拟合用户咨询的常见意图分类标签。
假设原始的特征是用户订单数量、用户下单等待时间等特征,而经过模式识别及特征提取模块的处理之后,转换为更高级更明确的特征,在本发明的实施例中,即为异常模式特征和高频模式特征这些指定模式特征,例如:
1)订单派送时间是否超过正常范围(如90%用户都在24小时内派送成功);
2)订单地址是否与用户通用地址有所差异;
3)用户是否触发过催单操作、催单操作次数与频率及是否存在处理周期异常;
4)用户最近咨询话题分类、是否触发申诉,等。
本发明的意图预判模型在进行训练时,首先需要进行特征定义和意图分类。结合业务情况,预先拟定与业务息息相关的数百个领域的抽象特征类型,选取与客服咨询密切相关的模式识别能获取到结果的特征。如上述实施例中的“订单派送时间是否超过正常范围”。在用户咨询的所有可能的意图分类中,筛选出能够通过提前预判的意图分类,如物流状态查询、退款状态咨询、申请价格保护操作等等。
然后,进行训练样本数据的搜集。可先人工标注一批基础数据,并使用自动搜集机制进行数据的收集。设定实时搜集机制,如用户在咨询时触发选取的意图类型,那么查找用户当前的各种基础数据,并通过模式识别及特征提取模块进行特征抽象化处理及特征统计分析以得到指定模式特征。并持续一段时间后,待搜集到足够量的指定模式特征与意图分类标签(如几百万或几千万组训练数据)后,即可作为训练样本,进行意图预判模型的训练。
由于训练样本数据中的指定模式特征与意图分类标签主要为结构化的数据,故可采用XGBoost模型来拟合分类关系,也可以采用深度学习模型(如CNN等)来实现模型结构。将指定模式特征作为输入,用户选择的意图类型作为输出,训练意图预判模型。
下面介绍本发明实施例的意图预判系统进行线上意图预判的实现流程。在本发明的实施例中,以电商平台的客服咨询系统对用户进行意图预判为例,线上预判流程需要结合图2中的各个模块,对接整体系统数据与用户的个性化数据来实现,主要包括以下步骤:
1、用户进入客服咨询,则意图预判系统触发执行,由预判交互模块读取用户近期相关的个性化数据,如订单量、购买商品品类、商品名称、物流、咨询历史等,以及系统关键特征数据,如系统当前的促销信息,系统的优惠券信息等;
2、通过模式识别及特征提取模块得到当前用户和系统的指定模式特征,包括异常模式特征和高频模式特征;
3、将当前用户和系统的指定模式特征输入意图预判模型,输出意图预判模型的分类结果作为第一预判结果;
4、获取规则维护模块进行意图预判的结果作为第二预判结果;
5、将第一预判结果和第二预判结果进行融合,其中,在进行结果融合时可按照一定策略融合,例如:通过设置第一预判结果与第二预判结果的优先级来进行结果融合;又如:可以选择阈值+规则优先级的方式来进行结果融合;
6、预判交互模块将最高概率的N个意图预判结果的问法或问答对或内容详情(具体内容,可根据不同意图分类来配置不同策略)展示给用户;
7、将用户是否点击或查看推送的意图预判结果作为反馈数据,收集反馈数据并发送到意图预判模型,从而进一步提高模型和策略的准确率。
其中,在本发明的实施例中,在上述步骤5中将第一预判结果和第二预判结果进行融合时,若选择阈值+规则优先级的方式来进行结果融合,则其可能的实施方式例如包括:
1)为预设的意图预测规则指定优先级高、中、低,如果触发了高优先级规则,那么无条件地在靠前位置展示高优先级规则对应的预判结果;
2)为意图预判模型输出的预判意图得分指定阈值,将高于阈值的预判意图作为预判结果,且将其排列在高优先级规则对应的预判结果之后进行展示;
3)若没有命中意图预测规则,只有意图预判模型输出的预判意图,那么将意图预判模型输出的多个预判意图按照预判意图得分高低进行排序作为预判结果进行展示;
4)若意图预测规则与意图预判模型的输出混合存在,那么根据设置的规则的优先级和意图预测模型的预判意图结果的优先级进行结果展示。
图3是根据本发明实施例的意图预判的装置的主要模块示意图。如图3所示,本发明实施例的意图预判的装置300主要包括数据获取模块301、模式识别模块302、特征提取模块303和特征判断模块304。
数据获取模块301,用于获取用户的个性化特征数据和系统关键特征数据;
模式识别模块302,用于对所述用户的个性化特征数据和系统关键特征数据进行模式识别以得到抽象特征;
特征提取模块303,用于对所述抽象特征进行统计分析以得到指定模式特征;
特征判断模块304,用于根据所述指定模式特征对所述用户进行意图预判。
根据本发明的一个实施例,指定模式特征包括异常模式特征和高频模式特征,并且,特征提取模块303还可以用于:
对所述抽象特征进行异常检测以得到异常模式特征,并将所述抽象特征中除所述异常模式特征之外的特征作为正常模式特征;
将所述正常模式特征中,特征出现的频次大于设定的特征频次阈值的特征作为高频模式特征;
将所述异常模式特征和所述高频模式特征作为指定模式特征。
根据本发明的另一个实施例,意图预判的装置300还可以包括第二预判模块(图中未示出),用于:
在根据所述指定模式特征对所述用户进行意图预判之后,将根据所述指定模式特征对所述用户进行意图预判的结果作为第一预判结果;
根据预设的预判规则对所述用户进行意图预判以得到第二预判结果;
将所述第一预判结果与所述第二预判结果进行融合,以对所述用户进行意图预判。
根据本发明的又一个实施例,第二预判模块(图中未示出)还可以用于:
通过设置所述第一预判结果与所述第二预判结果的优先级,以将所述第一预判结果与所述第二预判结果进行融合。
根据本发明的又一个实施例,意图预判的装置300还可以包括预判交互模块(图中未示出),用于:
显示意图预判的结果,并采集所述用户的反馈数据,所述反馈数据用于对意图预判模型进行优化调整。
根据本发明的再一个实施例,意图预判模型的训练过程可以包括:
定义与业务相关的抽象特征类型以及用户的意图分类;
使用自动搜集机制实时搜集线上数据以得到用户选择的意图类型;
获取用户的个性化特征数据和系统关键特征数据,并进行模式识别以得到抽象特征;
对所述抽象特征进行统计分析以得到指定模式特征;
将所述指定模式特征作为输入,所述用户选择的意图类型作为输出,训练所述意图预判模型。
根据本发明实施例的技术方案,通过获取用户的个性化特征数据和系统关键特征数据;对用户的个性化特征数据和系统关键特征数据进行模式识别以得到抽象特征;对抽象特征进行统计分析以得到指定模式特征;根据指定模式特征对用户进行意图预判,能够大大地缩小进行意图预判时需要拟合的数据范围,从而提高意图预判的准确率。根据本发明实施例的技术方案,可以实现基于模式识别得到的抽象特征,发现系统运行过程中出现的异常模式特征和高频模式特征,这些特征可以更好地体现用户的需求,从而根据这些特征进行用户意图预判可以提高意图预判的准确率;并且,还可结合设定的预判规则来进行意图预判,从而进一步地提高意图预判的准确率;另外,在进行意图预判得到结果后,采集用户的反馈数据,通过用户反馈数据对模型进行优化调整,从而更进一步地提高意图预判模型的准确率。
图4示出了可以应用本发明实施例的意图预判的方法或意图预判的装置的示例性系统架构400。
如图4所示,系统架构400可以包括终端设备401、402、403,网络404和服务器405。网络404用以在终端设备401、402、403和服务器405之间提供通信链路的介质。网络404可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备401、402、403通过网络404与服务器405交互,以接收或发送消息等。终端设备401、402、403上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备401、402、403可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器405可以是提供各种服务的服务器,例如对用户利用终端设备401、402、403所浏览的购物类网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果(例如目标推送信息、产品信息--仅为示例)反馈给终端设备。
需要说明的是,本发明实施例所提供的意图预判的方法一般由服务器405执行,相应地,意图预判的装置一般设置于服务器405中。
应该理解,图4中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面参考图5,其示出了适于用来实现本发明实施例的终端设备或服务器的计算机系统500的结构示意图。图5示出的终端设备或服务器仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,计算机系统500包括中央处理单元(CPU)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有系统500操作所需的各种程序和数据。CPU 501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
以下部件连接至I/O接口505:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。在该计算机程序被中央处理单元(CPU)501执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中,例如,可以描述为:一种处理器包括数据获取模块、模式识别模块、特征提取模块和特征判断模块。其中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定,例如,数据获取模块还可以被描述为“用于获取用户的个性化特征数据和系统关键特征数据的模块”。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:获取用户的个性化特征数据和系统关键特征数据;对所述用户的个性化特征数据和系统关键特征数据进行模式识别以得到抽象特征;对所述抽象特征进行统计分析以得到指定模式特征;根据所述指定模式特征对所述用户进行意图预判。
根据本发明实施例的技术方案,通过获取用户的个性化特征数据和系统关键特征数据;对用户的个性化特征数据和系统关键特征数据进行模式识别以得到抽象特征;对抽象特征进行统计分析以得到指定模式特征;根据指定模式特征对用户进行意图预判,能够大大地缩小进行意图预判时需要拟合的数据范围,从而提高意图预判的准确率。根据本发明实施例的技术方案,可以实现基于模式识别得到的抽象特征,发现系统运行过程中出现的异常模式特征和高频模式特征,这些特征可以更好地体现用户的需求,从而根据这些特征进行用户意图预判可以提高意图预判的准确率;并且,还可结合设定的预判规则来进行意图预判,从而进一步地提高意图预判的准确率;另外,在进行意图预判得到结果后,采集用户的反馈数据,通过用户反馈数据对模型进行优化调整,从而更进一步地提高意图预判模型的准确率。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (14)

1.一种意图预判的方法,其特征在于,包括:
获取用户的个性化特征数据和系统关键特征数据;
对所述用户的个性化特征数据和系统关键特征数据进行模式识别以得到抽象特征;
对所述抽象特征进行统计分析以得到指定模式特征;
根据所述指定模式特征对所述用户进行意图预判。
2.根据权利要求1所述的方法,其特征在于,所述指定模式特征包括异常模式特征和高频模式特征,并且,对所述抽象特征进行统计分析以得到指定模式特征包括:
对所述抽象特征进行异常检测以得到异常模式特征,并将所述抽象特征中除所述异常模式特征之外的特征作为正常模式特征;
将所述正常模式特征中,特征出现的频次大于设定的特征频次阈值的特征作为高频模式特征;
将所述异常模式特征和所述高频模式特征作为指定模式特征。
3.根据权利要求1所述的方法,其特征在于,根据所述指定模式特征对所述用户进行意图预判之后,还包括:
将根据所述指定模式特征对所述用户进行意图预判的结果作为第一预判结果;
根据预设的预判规则对所述用户进行意图预判以得到第二预判结果;
将所述第一预判结果与所述第二预判结果进行融合,以对所述用户进行意图预判。
4.根据权利要求3所述的方法,其特征在于,将所述第一预判结果与所述第二预判结果进行融合包括:
通过设置所述第一预判结果与所述第二预判结果的优先级,以将所述第一预判结果与所述第二预判结果进行融合。
5.根据权利要求1或3所述的方法,其特征在于,还包括:
显示意图预判的结果,并采集所述用户的反馈数据,所述反馈数据用于对意图预判模型进行优化调整。
6.根据权利要求5所述的方法,其特征在于,所述意图预判模型的训练过程包括:
定义与业务相关的抽象特征类型以及用户的意图分类;
使用自动搜集机制实时搜集线上数据以得到用户选择的意图类型;
获取用户的个性化特征数据和系统关键特征数据,并进行模式识别以得到抽象特征;
对所述抽象特征进行统计分析以得到指定模式特征;
将所述指定模式特征作为输入,所述用户选择的意图类型作为输出,训练所述意图预判模型。
7.一种意图预判的装置,其特征在于,包括:
数据获取模块,用于获取用户的个性化特征数据和系统关键特征数据;
模式识别模块,用于对所述用户的个性化特征数据和系统关键特征数据进行模式识别以得到抽象特征;
特征提取模块,用于对所述抽象特征进行统计分析以得到指定模式特征;
特征判断模块,用于根据所述指定模式特征对所述用户进行意图预判。
8.根据权利要求7所述的装置,其特征在于,所述指定模式特征包括异常模式特征和高频模式特征,并且,所述特征提取模块还用于:
对所述抽象特征进行异常检测以得到异常模式特征,并将所述抽象特征中除所述异常模式特征之外的特征作为正常模式特征;
将所述正常模式特征中,特征出现的频次大于设定的特征频次阈值的特征作为高频模式特征;
将所述异常模式特征和所述高频模式特征作为指定模式特征。
9.根据权利要求7所述的装置,其特征在于,还包括第二预判模块,用于:
在根据所述指定模式特征对所述用户进行意图预判之后,将根据所述指定模式特征对所述用户进行意图预判的结果作为第一预判结果;
根据预设的预判规则对所述用户进行意图预判以得到第二预判结果;
将所述第一预判结果与所述第二预判结果进行融合,以对所述用户进行意图预判。
10.根据权利要求9所述的装置,其特征在于,所述第二预判模块还用于:
通过设置所述第一预判结果与所述第二预判结果的优先级,以将所述第一预判结果与所述第二预判结果进行融合。
11.根据权利要求7或9所述的装置,其特征在于,还包括预判交互模块,用于:
显示意图预判的结果,并采集所述用户的反馈数据,所述反馈数据用于对意图预判模型进行优化调整。
12.根据权利要求11所述的装置,其特征在于,所述意图预判模型的训练过程包括:
定义与业务相关的抽象特征类型以及用户的意图分类;
使用自动搜集机制实时搜集线上数据以得到用户选择的意图类型;
获取用户的个性化特征数据和系统关键特征数据,并进行模式识别以得到抽象特征;
对所述抽象特征进行统计分析以得到指定模式特征;
将所述指定模式特征作为输入,所述用户选择的意图类型作为输出,训练所述意图预判模型。
13.一种意图预判的电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6中任一所述的方法。
14.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-6中任一所述的方法。
CN202010796464.3A 2020-08-10 2020-08-10 一种意图预判的方法和装置 Pending CN113761139A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010796464.3A CN113761139A (zh) 2020-08-10 2020-08-10 一种意图预判的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010796464.3A CN113761139A (zh) 2020-08-10 2020-08-10 一种意图预判的方法和装置

Publications (1)

Publication Number Publication Date
CN113761139A true CN113761139A (zh) 2021-12-07

Family

ID=78785676

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010796464.3A Pending CN113761139A (zh) 2020-08-10 2020-08-10 一种意图预判的方法和装置

Country Status (1)

Country Link
CN (1) CN113761139A (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140044243A1 (en) * 2012-08-08 2014-02-13 24/7 Customer, Inc. Method and apparatus for intent prediction and proactive service offering
CN104778176A (zh) * 2014-01-13 2015-07-15 阿里巴巴集团控股有限公司 一种数据搜索处理方法及装置
CN107870984A (zh) * 2017-10-11 2018-04-03 北京京东尚科信息技术有限公司 识别搜索词的意图的方法和装置
CN108228559A (zh) * 2016-12-22 2018-06-29 苏宁云商集团股份有限公司 一种用于用户业务的人机交互实现方法及系统
WO2018149326A1 (zh) * 2017-02-16 2018-08-23 阿里巴巴集团控股有限公司 一种自然语言问句答案的生成方法、装置及服务器
CN108628882A (zh) * 2017-03-20 2018-10-09 北京京东尚科信息技术有限公司 用于预判问题的方法和系统
CN108763506A (zh) * 2018-05-30 2018-11-06 北京顺丰同城科技有限公司 一种消息推送处理方法及装置
CN109493166A (zh) * 2018-10-23 2019-03-19 深圳智能思创科技有限公司 一种针对电子商务导购场景任务型对话系统的构建方法
WO2019153522A1 (zh) * 2018-02-09 2019-08-15 卫盈联信息技术(深圳)有限公司 智能交互方法、电子装置及存储介质
CN110413746A (zh) * 2019-06-25 2019-11-05 阿里巴巴集团控股有限公司 对用户问题进行意图识别的方法及装置
CN111401041A (zh) * 2020-03-23 2020-07-10 北京奇艺世纪科技有限公司 一种问题预测方法、装置、电子设备及存储介质

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140044243A1 (en) * 2012-08-08 2014-02-13 24/7 Customer, Inc. Method and apparatus for intent prediction and proactive service offering
CN104778176A (zh) * 2014-01-13 2015-07-15 阿里巴巴集团控股有限公司 一种数据搜索处理方法及装置
CN108228559A (zh) * 2016-12-22 2018-06-29 苏宁云商集团股份有限公司 一种用于用户业务的人机交互实现方法及系统
WO2018149326A1 (zh) * 2017-02-16 2018-08-23 阿里巴巴集团控股有限公司 一种自然语言问句答案的生成方法、装置及服务器
CN108628882A (zh) * 2017-03-20 2018-10-09 北京京东尚科信息技术有限公司 用于预判问题的方法和系统
CN107870984A (zh) * 2017-10-11 2018-04-03 北京京东尚科信息技术有限公司 识别搜索词的意图的方法和装置
WO2019153522A1 (zh) * 2018-02-09 2019-08-15 卫盈联信息技术(深圳)有限公司 智能交互方法、电子装置及存储介质
CN108763506A (zh) * 2018-05-30 2018-11-06 北京顺丰同城科技有限公司 一种消息推送处理方法及装置
CN109493166A (zh) * 2018-10-23 2019-03-19 深圳智能思创科技有限公司 一种针对电子商务导购场景任务型对话系统的构建方法
CN110413746A (zh) * 2019-06-25 2019-11-05 阿里巴巴集团控股有限公司 对用户问题进行意图识别的方法及装置
CN111401041A (zh) * 2020-03-23 2020-07-10 北京奇艺世纪科技有限公司 一种问题预测方法、装置、电子设备及存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
NURHAYATI 等: "Optical character recognition feature implementation in cooking recipe application using tesseract Google project", 2014 INTERNATIONAL CONFERENCE ON CYBER AND IT SERVICE MANAGEMENT (CITSM), 31 December 2014 (2014-12-31) *
杨春妮;冯朝胜;: "结合句法特征和卷积神经网络的多意图识别模型", 计算机应用, no. 07, 20 March 2018 (2018-03-20) *
罗琼;林若钦;: "海量用户需求数据的高效预判筛选仿真", 计算机仿真, no. 12, 15 December 2019 (2019-12-15) *

Similar Documents

Publication Publication Date Title
CN110135901A (zh) 一种企业用户画像构建方法、系统、介质和电子设备
CN110929136A (zh) 一种个性化推荐方法和装置
CN112241327A (zh) 分享信息处理方法、装置、存储介质与电子设备
CN113780329A (zh) 用于识别数据异常的方法、装置、服务器和介质
CN111582314A (zh) 目标用户确定方法、装置及电子设备
CN110717597A (zh) 利用机器学习模型获取时序特征的方法和装置
CN111104590A (zh) 信息推荐方法、装置、介质及电子设备
CN112131479A (zh) 数据的处理方法、装置、设备和存储介质
CN112950359A (zh) 一种用户识别方法和装置
CN110866625A (zh) 促销指标信息生成方法和装置
CN115935185A (zh) 一种推荐模型的训练方法及装置
CN110569424A (zh) 一种信息推介的方法和装置
CN110895761B (zh) 一种售后服务申请信息的处理方法和装置
CN111144694B (zh) 基于触点分析的运营流程管理方法和装置
US20210295357A1 (en) Predictive decision making based on influence identifiers and learned associations
CN111857875A (zh) 用于显示插件的方法及装置
CN112989175A (zh) 一种物品推送方法、装置、设备及介质
CN113761139A (zh) 一种意图预判的方法和装置
CN115936764A (zh) 一种产品推广方法和装置
CN115860872A (zh) 一种目标物品确定方法、装置、电子设备及存储介质
CN113763112A (zh) 一种信息推送方法及装置
CN111178696B (zh) 一种业务处理时长超时预警方法和装置
CN111125514B (zh) 用户行为分析的方法、装置、电子设备和存储介质
CN111899057A (zh) 基于边缘云节点数据收集的客户画像数据聚类分析系统
CN111782776A (zh) 一种通过填槽实现意图识别的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination