CN106548368A - 基于用户遗忘曲线的消费者意图识别方法 - Google Patents
基于用户遗忘曲线的消费者意图识别方法 Download PDFInfo
- Publication number
- CN106548368A CN106548368A CN201610899104.XA CN201610899104A CN106548368A CN 106548368 A CN106548368 A CN 106548368A CN 201610899104 A CN201610899104 A CN 201610899104A CN 106548368 A CN106548368 A CN 106548368A
- Authority
- CN
- China
- Prior art keywords
- consumer
- user
- moment
- intention
- commodity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Landscapes
- Business, Economics & Management (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了基于用户遗忘曲线的消费者意图识别方法,每个用户都有一个ID存储其相应的用户数据,其中存储有用户的意图网络信息,用户语句输入,基于LDA技术提取关键词之后通过Word2vec工具进行语义分析,将内容映射到网络中形成对用户的描绘;通过Word2vec计算初始时刻t0提取的关键词集合K和消费者谈及商品的集合P之间的相关性得到消费者的初始意图强度值S0,再将S0代入基于用户遗忘曲线的意图强度模型计算出消费者在时刻tn的意图强度值Sn,客服机器人通过此较消费者对不同商品的意图强度值Sn,来准确识别消费者想要获取的商品信息。本发明有效避免了网络客服机器人答非所问的情况,有利于网络购物的推广。
Description
技术领域
本发明涉及一种消费者意图识别方法,特别是一种基于用户遗忘曲线的消费者意图识别方法。
背景技术
随着网络的发展,网络购物已经悄然兴起,人们通过网络来选购各种物品已经越来越成为一种时尚,这也直接导致了对网络客服人员的大量需求,网络客服机器人由此应用而生,但是传统的网络客服机器人常常对消费者的意图了解不清楚,出现答非所问的情况,这就会阻碍消费者对商品信息的获取,不利于网络购物的发展。而现有客服机器人对消费者意图不了解的主要原因是因为现有系统对消费者意图的识别没有参考时间参数和遗忘参数,因为消费者对商品进行询问的时候往往会询问多个商品,并且常常是问了一个问题以后,隔几个小时,甚至几天或者更长时间再来问下一个问题,这时候机器人对消费者的购买意图的识别就会产生混乱,出现答非所问的情况。
发明内容
为解决上述问题,本发明的目的在于提供一种基于用户遗忘曲线的消费者意图识别方法。
本发明解决其问题所采用的技术方案是:基于用户遗忘曲线的消费者意图识别方法,每个用户都有一个ID存储其相应的用户数据,其中存储有用户的意图网络信息,用户语句输入,基于LDA技术提取关键词之后通过Word2vec工具进行语义分析,将内容映射到网络中形成对用户的描绘;通过Word2vec计算初始时刻t0提取的关键词集合K和消费者谈及商品的集合P之间的相关性得到消费者的初始意图强度值S0,再将S0代入基于用户遗忘曲线的意图强度模型计算出消费者在时刻tn的意图强度值Sn,客服机器人通过比较消费者对不同商品的意图强度值Sn,来准确识别消费者想要获取的商品信息。本发明中每个消费者均有一个ID,所述ID存储有相应的用户数据,这样不但便于消费者意图的分析而且方便相应数据的提取和存储。
进一步,所述基于用户遗忘曲线的意图强度模型包括单阶段模型和多阶段模型,单阶段模型在客服机器人与消费者进行短时间交流的时候使用,客服机器人与消费者的短时间交流是指消费者前后两次询问的间隔时间不大于T1;多阶段模型在客服机器人与消费者进行长时间联系的时候使用,长时间联系是指消费者在对某一商品的前后两次询问的时间间隔大于T2。
进一步,单阶段模型的计算公式为其中Sn为消费者在时刻tn的意图强度值,S0为消费者在初始时刻t0的初始意图强度值,K为消费者的意图强度值的衰减速率,Sn′为在时刻tn消费者意识强度值的增加值,n+1为消费者的询问次数,n=0时,即t0时刻消费者第一次询问,S0通过Word2vec计算t0时刻提取的关键词集合和消费者谈及商品的集合之间的相关性得出,Sn′通过Word2vec计算tn时刻提取的关键词集合K和消费者谈及商品的集合P之间的相关性得出,tn、t0以及n通过实时数据以及客服记录得出,k通过对艾宾浩斯——遗忘曲线进行数学拟合得出,在以上数据得出的基础上可以得出消费者在时刻tn的意图强度值Sn。
进一步,多阶段模型的计算公式为其中Sn为消费者在时刻tn的意图强度值,Sn-1为消费者在时刻tn-1的意图强度值,kn为消费者在第n+1次询问时的意图强度值的衰减速率,Sn′为在时刻tn消费者意识强度值的增加值,Sn-1、tn、tn-1以及n通过实时数据以及客服记录得出,Sn′通过Word2vec计算tn时刻提取的关键词集合和消费者谈及商品的集合之间的相关性得出,n+1为消费者的询问次数,n=0时,即t0时刻消费者第一次询问,kn的计算公式为其中θ为引入的惰性因子为已知参数,K0通过对艾宾浩斯——遗忘曲线进行数学拟合得出,通过以上数据可以得出消费者在时刻tn的意图强度值Sn。
进一步,由于用户对产品产生兴趣之后随着时间的推移会存在一个现象,即相同的刺激对用户兴趣度的影响会逐渐减小,并逐渐趋于一个稳定值,因此在Sn′为时刻tn消费者意识强度值的增加值的基础上通过e-n来调节关键词对商品的刺激增加值。
进一步,惰性因子θ为正数,惰性因子θ的值越大,逼过公式计算出来的Kn越准确。
本发明的有益效果是:本发明是基于用户遗忘曲线的消费者意图识别方法,本发明通过艾宾浩斯——遗忘曲线在消费者意图识别系统中引入时间参数和遗忘参数来计算出消费者的意图强度值Sn,客服机器人通过比较消费者对不同商品的意图强度值Sn,来准确识别消费者想要获取的商品信息,使得网络客服机器人对消费者的意图识别更加准确,有效避免了网络客服机器人答非所问的情况,有利于网络购物的推广。
附图说明
下面结合附图和实例对本发明作进一步说明。
图1是用户商品意图多阶段变化图。
具体实施方式
对电商客服机器人而言,准确地度量用户对商品的意图是重点之一。用户对商品意图的心理变化和人类学习遗忘具有相似性,在问答系统中,用户语句中不断谈到商品和涉及商品相关问题等则表明用户对商品的意图强度较强,随着谈话的增多,不再谈及则对商品的意图逐渐衰退至较低强度状态。德国心理学家艾宾浩斯发现了人类的遗忘规律,他描述了随着时间的推移人们记忆量的变化,并根据这一变化可以画出描述这一变化的曲线,称为“艾宾浩斯遗忘曲线”。如果对知识点反复学习则会调整记忆衰减速度,巩固次数越多衰减越慢,最终人们的记忆量会逐渐趋于一个稳定值。
客服机器人和用户聊天是一个“短时间频繁”和“长时间”联系的过程,实际中用户对某一商品产生兴趣之后会和机器人沟通询问一些相关信息,对话时间可以分为两种状态:(1)对话过程持续时间短的只有几分钟,可能中途会有间隔,从开始到结束历时几小时;(2)用户对商品的兴趣不是很强烈的时候,用户会聊一下,然后隔好几天都没有信息,但是突然有天又询问这一商品,这样用户对商品兴趣就历时比较久,时间单位能达到星期或更久。依据这一特点,本发明结合遗忘曲线建立用户商品意图识别“单阶段+多阶段”模型。对遗忘曲线进行数学拟合可以得到其函数表达式:P(t,k)=p0e-kt(t>0),其中k是衰减的速率,其值越大表示记忆遗忘或衰减得越快,p0为记忆的初始值。
在用户和机器人的短时间频繁对话中,用户对商品的意图强度的衰减被认为是衰减速率不变,即用户商品意图强度的衰减符合单条记忆曲线衰减规律,用户商品意图强度为:
式5.1中SA(tn,pj)表示用户A在第n个时刻tn下对商品pj的意图强度,式5.2表示用户A在初始的t0时刻对商品pj的意图强度。用户的意图强度值,通过Word2vec计算t0时刻提取的关键词集合K和顾客谈及商品集合P之间的相关性计算得到,这里用户的遗忘速率为k(A)。由于用户对产品产生兴趣之后随着时间的推移会存在一个现象,即相同的刺激对用户兴趣度的影响会逐渐减小,并逐渐趋于一个稳定值,在刺激的基础上通过e-n来调节关键词对商品的刺激增加值,其中n∈(0,1,2,…),累计语句输入次数为N,n=N-1。
图1是用户商品意图多阶段变化图,如图1所示,当用户和机器人的交流时间跨度比较久,则将用户和机器人的交流看作是多阶段模型,用户语句中呈现的对某一商品刺激相当于人们重复学习某一知识,用户的遗忘速率会随着时间段进行变化,例如在时间tn-1,tn下其遗忘速率分别为k(A,n-1),k(A,n),如图所示用户的商品意图强度分很多阶段,第n个阶段用户的最初商品意图强度表示为式5.3:
对多阶段模型,最重要的是要寻找衰减速率k(A,n-1)和k(A,n)之间的关系,得到k(A,n)的表示,从图1可以发现遗忘速率为k(A,n)的以遗忘曲线通过向左下方平移可以是的端点和遗忘速率为k(An-1)的曲线重合,在时间段(tn-1,tn)之间两者之间的遗忘值相差一个β值,β表示为:
可以得到β的取值能取到最大为另外,依据式5.4,其中令η=tn-tn-1,根据数学运算可以得到:
上式中只要确定β的值,k(A,n)就能确定,这时引入惰性因子θ,将β能取的最大值划分为θ段来反映遗忘速率的调整,
即:
将式5.6代入式5.5就可以得到k(A,n)的表达式即:
由5.7可以发现,当k(A,n-1),时间段η,惰性因子θ确定的时候,就能得到k(A,n),从而各个阶段的用户商品意图的强度都能计算了。
以上方法要计算出用户的商品意图强度,需要通过利用文件训练Word2vec生成词向量,在关键词提取部分计算特征值时生成词向量文件。
以上所述,只是本发明的较佳实施例而已,本发明并不局限于上述实施方式,只要其以相同的手段达到本发明的技术效果,都应属于本发明的保护范围。
Claims (6)
1.基于用户遗忘曲线的消费者意图识别方法,其特征在于:每个用户都有一个ID存储其相应的用户数据,其中存储有用户的意图网络信息,用户语句输入,基于LDA技术提取关键词之后通过Word2vec工具进行语义分析,将内容映射到网络中形成对用户的描绘;通过Word2vec计算初始时刻t0提取的关键词集合K和消费者谈及商品的集合P之间的相关性得到消费者的初始意图强度值S0,再将S0代入基于用户遗忘曲线的意图强度模型计算出消费者在时刻tn的意图强度值Sn,客服机器人通过比较消费者对不同商品的意图强度值Sn,来准确识别消费者想要获取的商品信息。
2.根据权利要求1所述的基于用户遗忘曲线的消费者意图识别方法,其特征在于:所述基于用户遗忘曲线的意图强度模型包括单阶段模型和多阶段模型,单阶段模型在客服机器人与消费者进行短时间交流的时候使用,客服机器人与消费者的短时间交流是指消费者前后两次询问的间隔时间不大于T1;多阶段模型在客服机器人与消费者进行长时间联系的时候使用,长时间联系是指消费者在对某一商品的前后两次询问的时间间隔大于T2。
3.根据权利要求2所述的基于用户遗忘曲线的消费者意图识别方法,其特征在于:单阶段模型的计算公式为其中Sn为消费者在时刻tn的意图强度值,S0为消费者在初始时刻t0的初始意图强度值,K为消费者的意图强度值的衰减速率,Sn′为在时刻tn消费者意识强度值的增加值,n+1为消费者的询问次数,n=0时,即t0时刻消费者第一次询问,S0通过Word2vec计算t0时刻提取的关键词集合和消费者谈及商品的集合之间的相关性得出,Sn′通过Word2vec计算tn时刻提取的关键词集合K和消费者谈及商品的集合P之间的相关性得出,tn、t0以及n通过实时数据以及客服记录得出,k通过对艾宾浩斯——遗忘曲线进行数学拟合得出,在以上数据得出的基础上可以得出消费者在时刻tn的意图强度值Sn。
4.根据权利要求2所述的基于用户遗忘曲线的消费者意图识别方法,其特征在于:多阶段模型的计算公式为其中Sn为消费者在时刻tn的意图强度值,Sn-1为消费者在时刻tn-1的意图强度值,kn为消费者在第n+1次询问时的意图强度值的衰减速率,Sn′为在时刻tn消费者意识强度值的增加值,Sn-1、tn、tn-1以及n通过实时数据以及客服记录得出,Sn′通过Word2vec计算tn时刻提取的关键词集合和消费者谈及商品的集合之间的相关性得出,n+1为消费者的询问次数,n=0时,即t0时刻消费者第一次询问,kn的计算公式为其中θ为引入的惰性因子为已知参数,k0通过对艾宾浩斯——遗忘曲线进行数学拟合得出,通过以上数据可以得出消费者在时刻tn的意图强度值Sn。
5.根据权利要求3或4任一所述的基于用户遗忘曲线的消费者意图识别方法,其特征在于:由于用户对产品产生兴趣之后随着时间的推移会存在一个现象,即相同的刺激对用户兴趣度的影响会逐渐减小,并逐渐趋于一个稳定值,因此在Sn′为时刻tn消费者意识强度值的增加值的基础上通过e-n来调节关键词对商品的刺激增加值。
6.根据权利要求4所述的基于用户遗忘曲线的消费者意图识别方法,其特征在于:惰性因子θ为正数,惰性因子θ的值越大,通过公式计算出来的kn越准确。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610899104.XA CN106548368A (zh) | 2016-10-14 | 2016-10-14 | 基于用户遗忘曲线的消费者意图识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610899104.XA CN106548368A (zh) | 2016-10-14 | 2016-10-14 | 基于用户遗忘曲线的消费者意图识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106548368A true CN106548368A (zh) | 2017-03-29 |
Family
ID=58369031
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610899104.XA Pending CN106548368A (zh) | 2016-10-14 | 2016-10-14 | 基于用户遗忘曲线的消费者意图识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106548368A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107357835A (zh) * | 2017-06-22 | 2017-11-17 | 电子科技大学 | 一种基于主题模型和遗忘规律的兴趣预测挖掘方法及系统 |
CN109002561A (zh) * | 2018-08-27 | 2018-12-14 | 山东师范大学 | 基于样本关键词学习的文本自动分类方法、系统及介质 |
CN111416728A (zh) * | 2019-01-08 | 2020-07-14 | 北京京东尚科信息技术有限公司 | 会话结束预测、在线客服服务的方法、系统、设备及介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102693502A (zh) * | 2012-06-04 | 2012-09-26 | 南京中兴软创科技股份有限公司 | 面向用户消费行为的时间推移数据分析模型的建立方法 |
CN102792327A (zh) * | 2010-02-04 | 2012-11-21 | 宝洁公司 | 用于进行消费者调查的方法 |
CN102800006A (zh) * | 2012-07-23 | 2012-11-28 | 姚明东 | 基于客户购物意图挖掘的实时商品推荐方法 |
-
2016
- 2016-10-14 CN CN201610899104.XA patent/CN106548368A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102792327A (zh) * | 2010-02-04 | 2012-11-21 | 宝洁公司 | 用于进行消费者调查的方法 |
CN102693502A (zh) * | 2012-06-04 | 2012-09-26 | 南京中兴软创科技股份有限公司 | 面向用户消费行为的时间推移数据分析模型的建立方法 |
CN102800006A (zh) * | 2012-07-23 | 2012-11-28 | 姚明东 | 基于客户购物意图挖掘的实时商品推荐方法 |
Non-Patent Citations (2)
Title |
---|
于洪涛,崔瑞飞,董芹芹: ""基于遗忘曲线的微博用户兴趣模型"", 《计算机工程与设计》 * |
印桂生,崔晓晖,马志强: ""遗忘曲线的协同过滤推荐模型"", 《哈尔滨工程大学学报》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107357835A (zh) * | 2017-06-22 | 2017-11-17 | 电子科技大学 | 一种基于主题模型和遗忘规律的兴趣预测挖掘方法及系统 |
CN107357835B (zh) * | 2017-06-22 | 2020-11-03 | 电子科技大学 | 一种基于主题模型和遗忘规律的兴趣预测挖掘方法及系统 |
CN109002561A (zh) * | 2018-08-27 | 2018-12-14 | 山东师范大学 | 基于样本关键词学习的文本自动分类方法、系统及介质 |
CN111416728A (zh) * | 2019-01-08 | 2020-07-14 | 北京京东尚科信息技术有限公司 | 会话结束预测、在线客服服务的方法、系统、设备及介质 |
CN111416728B (zh) * | 2019-01-08 | 2023-12-05 | 北京汇钧科技有限公司 | 会话结束预测、在线客服服务的方法、系统、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lalwani et al. | Implementation of a Chatbot System using AI and NLP | |
US20220222920A1 (en) | Content processing method and apparatus, computer device, and storage medium | |
Song et al. | Spectral representation of behaviour primitives for depression analysis | |
CN106462608B (zh) | 改进语言模型的知识源个性化 | |
Milojević | Power law distributions in information science: Making the case for logarithmic binning | |
CN107886949A (zh) | 一种内容推荐方法及装置 | |
CN106484829B (zh) | 一种微博排序模型的建立及微博多样性检索方法 | |
CN111708869B (zh) | 人机对话的处理方法及装置 | |
CN106548368A (zh) | 基于用户遗忘曲线的消费者意图识别方法 | |
CN109726387A (zh) | 人机交互方法和系统 | |
CN108268450B (zh) | 用于生成信息的方法和装置 | |
CN110046228A (zh) | 短文本主题识别方法和系统 | |
CN113160819B (zh) | 用于输出动画的方法、装置、设备、介质和产品 | |
CN110083764A (zh) | 一种协同过滤算法冷启动问题的解决方法 | |
CN109065073A (zh) | 基于深度svm网络模型的语音情感识别方法 | |
CN111192082B (zh) | 产品卖点的分析方法、终端设备及计算机可读存储介质 | |
Su et al. | Answer acquisition for knowledge base question answering systems based on dynamic memory network | |
Gaston | Interpreting Judeo-Christianity in America | |
Zhao et al. | Improved MFCC Feature Extraction Combining Symmetric ICA Algorithm for Robust Speech Recognition. | |
CN117113087A (zh) | 模型训练方法、装置、电子设备以及存储介质 | |
CN105426382A (zh) | 一种基于Personal Rank的情绪上下文感知的音乐推荐方法 | |
CN116662495A (zh) | 问答处理方法、训练问答处理模型的方法及装置 | |
de Bayser et al. | Learning multi-party turn-taking models from dialogue logs | |
CN116775815B (zh) | 对话数据的处理方法、装置、电子设备及存储介质 | |
CN112633381B (zh) | 音频识别的方法及音频识别模型的训练方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170329 |
|
RJ01 | Rejection of invention patent application after publication |