CN107025228A - 一种问题推荐方法及设备 - Google Patents

一种问题推荐方法及设备 Download PDF

Info

Publication number
CN107025228A
CN107025228A CN201610065638.2A CN201610065638A CN107025228A CN 107025228 A CN107025228 A CN 107025228A CN 201610065638 A CN201610065638 A CN 201610065638A CN 107025228 A CN107025228 A CN 107025228A
Authority
CN
China
Prior art keywords
feature
characteristic
acquisition
probability
described problem
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610065638.2A
Other languages
English (en)
Other versions
CN107025228B (zh
Inventor
姜晓燕
代斌
杨旭
褚崴
赵耀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Network Technology Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201610065638.2A priority Critical patent/CN107025228B/zh
Priority to JP2018538883A priority patent/JP7007279B2/ja
Priority to PCT/CN2017/071704 priority patent/WO2017129033A1/zh
Priority to EP17743648.2A priority patent/EP3410310A4/en
Priority to TW106102678A priority patent/TWI772287B/zh
Publication of CN107025228A publication Critical patent/CN107025228A/zh
Priority to US16/046,800 priority patent/US20180330226A1/en
Application granted granted Critical
Publication of CN107025228B publication Critical patent/CN107025228B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Educational Administration (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Probability & Statistics with Applications (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
  • Telephone Function (AREA)
  • Pens And Brushes (AREA)

Abstract

本发明公开了一种问题推荐方法及设备,该方法包括:在样本采集周期内,获取问题并获取所述问题对应的问题特征;对所述问题特征进行处理,处理后的问题特征在预设的数值区间内;根据各个所述问题及其在所述问题中的第二概率和指定的推荐阈值确定推荐的问题;其中,各个所述问题及其在所述问题中的第二概率是通过所述处理后的问题特征和第一概率得到的;所述第一概率是通过所述问题特征得到的。应用本申请的方法,通过对以往问题特征计算得到需要向用户推荐的问题,提高了向用户推荐问题的准确率。

Description

一种问题推荐方法及设备
技术领域
本申请涉及通信技术领域,特别涉及一种问题推荐方法,本申请同时还涉及一种问题推荐设备。
背景技术
随着双十一、双十二等电商节日的兴起,越来越多人开始网上购物,但“节日经济”对电商也造成了双重冲击即销量和客服的压力暴增。企业的客服一般分为人工客服和自助客服,客服压力的增加促使企业使用更多的人工客服,投入的成本也随之越来越多。
因此,需要自助客服系统具有更大的处理能力,才能满足客服需求。自助客服系统,能够自动处理解决用户的问题。而自助客服的系统中待处理数据量的增加,使现有的方法已经不能够处理全量数据。现有的算法随着问题增加,其计算效率下降。并且大部分特征是稀疏的,而现有技术适用于处理稠密特征,这样,系统中问题特征量增加的同时,对用户问题的预测精度就会下降。另外现有技术中的模型单一,效果受限。所以,随着信息的不断爆炸,现在的机器学习模型已经不能满足需求。
因此,本领域技术人员亟待解决的技术问题就是如何通过对以往问题特征计算得到需要向用户推荐的问题,提高向用户推荐问题的准确率,进而在自助客服节点解决用户问题,减少用户进入人工客服,降低人工客服成本。
发明内容
本发明提供了一种问题推荐方法,用于提高向用户推荐问题的准确率。所述方法包括以下步骤:
在样本采集周期内,获取问题并获取所述问题对应的问题特征;
对所述问题特征进行处理,处理后的问题特征在预设的数值区间内;
根据各个所述问题及其在所述问题中的第二概率和指定的推荐阈值确定推荐的问题;
其中,各个所述问题及其在所述问题中的第二概率是通过所述处理后的问题特征和第一概率得到的;所述第一概率是通过所述问题特征得到的。
优选地,所述问题特征包括数值型特征和文本型特征,所述数值型特征为连续的,所述文本型特征为不连续的。
优选地,所述获取问题,具体包括:
在特征获取周期内获取所述问题;
若存在特征获取周期内未获取的问题,则所述未获取的问题的值为空;
若不存在特征获取周期内未获取的问题,则以获取的问题作为所述问题。
优选地,所述获取所述问题对应的问题特征,具体包括:
在特征获取周期内获取问题特征;
若存在特征获取周期内未获取的问题特征,且该问题特征为所述数值型特征时,则以获取的与问题对应的问题特征的数值的均值作为问题特征;
若存在特征获取周期内未获取的问题特征,且该问题特征为所述文本型问题特征时,则以获取的与问题对应的问题特征中出现频率最高的作为问题特征;
若不存在特征获取周期内未获取的问题特征,则以获取的问题特征作为所述问题特征。
优选地,对所述问题特征进行处理,具体包括:
若所述问题特征为数值型问题特征,则对问题特征进行归一化处理;
若所述问题特征为文本型问题特征,则对问题特征进行向量化处理,向量化处理后的问题特征为数值型问题特征。
优选地,所述第二概率是通过对所述处理后的问题特征和所述第一概率进行深度神经网络DNN计算得到的。
相应的本申请还提出了一种问题推荐设备,所述设备包括:
获取模块:在样本采集周期内,获取问题并获取所述问题对应的问题特征;
处理模块:对所述问题特征进行处理,处理后的问题特征在指定的数值区间内;
确定模块:根据各个所述问题及其在所述问题中的第二概率和指定的推荐阈值确定推荐的问题;
其中,各个所述问题及其在所述问题中的第二概率是通过所述处理后的问题特征和第一概率得到的;所述第一概率是通过所述问题特征得到的。
优选地,所述问题特征包括数值型特征和文本型特征,所述数值型特征为连续的,所述文本型特征为不连续的。
优选地,所述获取模块具体用于:
在特征获取周期内获取所述问题;
若存在特征获取周期内未获取的问题,则所述未获取的问题的值为空;
若不存在特征获取周期内未获取的问题,则以获取的问题作为所述问题。
优选地,所述获取模块具体用于:
在特征获取周期内获取问题特征;
若存在特征获取周期内未获取的问题特征,且该问题特征为所述数值型特征时,则以获取的与问题对应的问题特征的数值的均值作为问题特征;
若存在特征获取周期内未获取的问题特征,且该问题特征为所述文本型问题特征时,则以获取的与问题对应的问题特征中出现频率最高的作为问题特征;
若不存在特征获取周期内未获取的问题特征,则以获取的问题特征作为所述问题特征。
优选地,所述处理模块具体用于:
若所述问题特征为数值型问题特征,则对问题特征进行归一化处理;
若所述问题特征为文本型问题特征,则对问题特征进行向量化处理,向量化处理后的问题特征为数值型问题特征。
优选地,所述第二概率是通过对所述处理后的问题特征和所述第一概率进行深度神经网络DNN计算得到的。
由此可见,通过应用本申请的技术方案,对问题特征进行处理和分类计算,然后对得到的结果进行进一步的深度计算,即可准确地输出各个所述问题和第二概率。本申请提高了向用户推荐问题的准确率。本申请可处理稠密性的问题特征值,同时适合处理大规模的稀疏数据,提高了预测精度。
附图说明
图1为本申请提出的一种问题推荐方法的流程示意图;
图2为本申请具体实施例所提出的一种DNN模型示意图;
图3为本申请提出的一种问题推荐设备的结构示意图。
具体实施方式
有鉴于现有技术中的问题,本发明提出了问题推荐方法,该方法应用于问题推荐系统中,结合机器学习模型和深度神经网络模型DNN进行模型训练。该系统能够根据历史记录为用户推荐其所需的问题,并且擅长处理稀疏型和稠密性的问题特征,可用于提高向用户推荐问题的准确率。
如图1所示,为本申请提出了的一种核验信息处理方法流程示意图,包括以下步骤:
S101,在样本采集周期内,获取问题并获取所述问题对应的问题特征。
本申请旨在向需要问题推荐服务的用户推荐问题。用户可以是该需要问题推荐的用户和其他用户。本发明的系统中存在用户的历史记录,在历史记录中包含各个问题以及对应的问题特征。问题推荐系统通常包括收集层、处理层、存储层和输出层。收集层负责收集其他设备发送的问题及问题特征。处理层利用收集到的问题及问题特征进行模型训练。存储层负责数据存储,其中存储了用户的历史记录。输出层进行问题及问题特征的输出。本申请中的问题推荐系统可以在服务器上实现,优选采用分布式服务器。并且本申请可以使用一个服务器,也可以使用多个服务器组成的集群。
所述问题特征包括数值型特征和文本型特征,所述数值型特征为连续的,比如,数值型特征为使用过某个应用软件的次数,数值9代表使用过9次,所述文本型特征为不连续的,比如,文本型特征为发票状态,对应未开发票和已开发票。因为历史记录中的问题和问题特征都具有一定的时效性,所以设置样本采集周期,以采集一段时期之内问题及问题特征,比如一周内、一个月内。其他设备向系统发送问题及问题特征时,由于不同设备的IP不同,一些问题、问题特征的获取时间较长,可能导致系统在很长时间内不能获取完毕。
为了更高效地对数据进行处理,在本申请的优选实施例中,设定特征获取周期,在特征获取周期内获取所述问题。若存在特征获取周期内未获取的问题,则所述未获取的问题的值为空,若不存在特征获取周期内未获取的问题,则以获取的问题作为所述问题。在特征获取周期内获取问题特征,若存在特征获取周期内未获取的问题特征,且该问题特征为所述数值型特征时,则以获取的与问题对应的问题特征的数值的均值作为问题特征,若存在特征获取周期内未获取的问题特征,且该问题特征为所述文本型问题特征时,则以获取的与问题对应的问题特征中出现频率最高的作为问题特征,若不存在特征获取周期内未获取的问题特征,则以获取的问题特征作为所述问题特征。
在获取问题及其对应的问题特征之后,推荐系统通过对问题特征进行筛选,以删除一些特征,比如删除所有用户都相同的问题特征、容易超出特征获取周期的问题特征和与经营业务无关的问题特征。经过筛选得到的特征可以为后续建立分类模型作准备。
S102,对所述问题特征进行处理,处理后的问题特征在预设的数值区间内。
在获取问题和对应的问题特征后,问题推荐系统对问题特征进行处理。若所述问题特征为数值型问题特征,则对问题特征进行归一化处理以使处理后的问题特征在指定的数值区间内;若所述问题特征为文本型问题特征,则对问题特征进行向量化处理,以使处理后的问题特征为数值型问题特征并在指定的数值区间内。
在本申请的优选实施例中,若问题特征是数值型特征,可以采用百分位分箱算法进行归一化处理,使所有问题特征在经过处理后都处在指定的数值区间内。在进行百分位分箱算法处理时,将原始数值归纳到100个箱中,然后对箱进行编码,比如0.01,0.02......1.00。经过处理的数值型问题特征处于0至1的数值区间内。
由于文本型问题特征是以文字的形式呈现的,无法参与计算。所以,需要对文本型问题特征进行向量化处理,将问题特征由文本型特征转化为数值型特征。可以采用one hot编码处理文本型特征,计算各个特征的频率,从而按频率给出one hot编码。举例来说,文本型特征为发票状态,对应未开发票和已开发票,经过向量化处理后,得到数值型特征0和1,处于0至1的数值区间内。
问题特征经过处理后,处于指定的数值区间内,以便于参与后续计算。需要说明的是,本申请需要得到处于指定数值区域内的问题特征,故进行上述百分位分箱算法和向量化处理方法仅为本申请优选实施例提出的示例,本申请的保护范围并不限于此,以上仅为本申请优选实施例提出的示例,在此基础上还可以选择其他方式来进行计算,以使本申请适用于更多的应用领域,这些改进都属于本发明的保护范围。
S103,根据各个所述问题及其在所述问题中的第二概率和指定的推荐阈值确定推荐的问题。
在获取问题和对应的问题特征后,本申请还需要对问题特征进行简单分类模型计算,可以采用决策树算法,从而得到第一概率。在进行决策树计算时,首先需要有两轮采样过程。第一轮对问题特征进行随机采样,得到决策树可处理的问题特征。第二轮进行重要特征采样,根据所述可处理的问题特征计算权重。
在当今数据接口越来越多的情况下,数据集的原始变量、衍生变量会越来越多,因此信息值IV(Information Value)在实际数据应用中十分重要。信息值IV用来表示每一个变量对目标变量来说有多少“信息”的量,从而使得特征选择变得简单快速。
在进行特征选择时,总是在将特征的重要程度量化之后再进行选择,而如何量化特征,就成了各种方法间最大的不同。在信息增益中,重要性的衡量标准就是看特征能够为分类系统带来多少信息,带来的信息越多,该特征越重要。因此对于一个特征而言,信息增益为系统存在该特征和不存在该特征时候的信息量各是多少,两者的差值就是这个特征给系统带来的信息量,即信息增益IG(Information Gain)。
因为信息值IV和信息增益IG都可以表示问题特征对应的权重,所以,所述权重为信息值IV和/或信息增益IG,根据权重选出重要特征,然后根据所述重要特征建立分类模型。然后,通过分类模型对筛选得到的问题特征进行分析得到第一概率。将各个问题特征经过决策树计算后得到的相应概率作为所述第一概率。
需要说明的是,本申请进行以上基于决策树算法得到的各个问题特征对应概率值的过程仅为本申请优选实施例提出的示例,除此之外还可以选择比如逻辑回归计算等的其他计算方法,以使本申请适用于更多的应用领域,这些改进都属于本发明的保护范围。
在得到处理后的问题特征和第一概率后,对这两者进行计算,得到各个所述问题及其在所述问题中的第二概率。在优选的实施例中,所述各个所述问题及其在所述问题中的第二概率通过DNN计算得到。问题推荐系统中的深度神经网络DNN(Deep Neural Network),包括输入节点和计算节点。DNN计算包括以下步骤:(1)输入节点获取所述处理后的问题特征和第一概率。(2)计算节点通过全连接层、激活函数ReLu和多分类损失函数softmax loss对处理后的问题特征和第一概率进行计算,得到第二概率。
在具体的应用场景中,操作步骤如图2所示:
a.由输入层获取所述处理后的问题特征和第一概率。
在DNN训练前,可以使用决策树对数据进行初步分类,同时可以通过第一概率控制深度神经网络DNN中网络节点所占的权重。
b.由中间层即计算层进行问题推荐,计算层通过全连接层、激活函数ReLu和多分类损失函数softmax loss对所述处理后的问题特征和第一概率进行计算,得到各个问题特征对应的问题及第二概率。
利用激活函数ReLu进行计算,使一部分网络中神经元的输出为0,因而造就了网络的稀疏性,并且减少了参数的相互依存关系,缓解了过拟合问题的发生。同时,使计算节点的计算量较小,有利于提高系统推荐问题的效率。另外,DNN训练可以使用GPU,能够针对矩阵计算进行加速,进一步提高计算速度。除激活函数ReLu之外,还可以使用sigmoid层进行计算。
c.输出层输出各个所述问题及其对应的第二概率。
需要说明的是,本申请是由第一概率和处理后得到的数值型问题特征,得到第二概率,本申请提出的计算方式是DNN计算,本申请的保护范围并不限于此,以上仅为优选实施例提出的示例,在此基础上还可以选择其他方式来进行计算,以使本申请适用于更多的应用领域,这些改进都属于本发明的保护范围。
在本申请的优选实施例中,问题推荐系统根据各个所述问题及其在所述问题中的第二概率和指定的的推荐阈值,确定推荐的问题。然后根据阈值得到阈值内的问题特征,进而以该问题特征对应的问题作为推荐的问题。比如在阈值内得到六个问题的问题特征,则系统推荐这六个问题。本发明在针对各个用户对应的历史记录中的问题和问题特征进行计算,进而确定待推荐的问题之后,当用户访问问题推荐系统的时候直接调用相应的结果。通过本申请中的问题推荐系统,用户能够直接获取与之相关性非常高的问题。
为达到以上技术目的,本申请还提出了一种问题推荐设备,如图3所示,所述设备包括:
获取模块310:在样本采集周期内,获取问题并获取所述问题对应的问题特征;
处理模块320:对所述问题特征进行处理,处理后的问题特征在指定的数值区间内;
确定模块330:根据各个所述问题及其在所述问题中的第二概率和指定的推荐阈值确定推荐的问题;
其中,各个所述问题及其在所述问题中的第二概率是通过所述处理后的问题特征和第一概率得到的;所述第一概率是通过所述问题特征得到的。
在优选的实施例中,所述问题特征包括数值型特征和文本型特征,所述数值型特征为连续的,所述文本型特征为不连续的。
在优选的实施例中,所述获取模块具体用于:
在特征获取周期内获取所述问题;
若存在特征获取周期内未获取的问题,则所述未获取的问题的值为空;
若不存在特征获取周期内未获取的问题,则以获取的问题作为所述问题。
在优选的实施例中,所述获取模块具体用于:
在特征获取周期内获取问题特征;
若存在特征获取周期内未获取的问题特征,且该问题特征为所述数值型特征时,则以获取的与问题对应的问题特征的数值的均值作为问题特征;
若存在特征获取周期内未获取的问题特征,且该问题特征为所述文本型问题特征时,则以获取的与问题对应的问题特征中出现频率最高的作为问题特征;
若不存在特征获取周期内未获取的问题特征,则以获取的问题特征作为所述问题特征。
在优选的实施例中,所述处理模块具体用于:
若所述问题特征为数值型问题特征,则对问题特征进行归一化处理;
若所述问题特征为文本型问题特征,则对问题特征进行向量化处理,向量化处理后的问题特征为数值型问题特征。
在优选的实施例中,所述第二概率是通过对所述处理后的问题特征和所述第一概率进行深度神经网络DNN计算得到的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本申请可以通过硬件实现,也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施场景所述的方法。
本领域技术人员可以理解附图只是一个优选实施场景的示意图,附图中的模块或流程并不一定是实施本申请所必须的。
本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中,也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
上述本申请序号仅仅为了描述,不代表实施场景的优劣。
以上公开的仅为本申请的几个具体实施场景,但是,本申请并非局限于此,任何本领域的技术人员能思之的变化都应落入本申请的保护范围。

Claims (12)

1.一种问题推荐方法,其特征在于,该方法包括:
在样本采集周期内,获取问题并获取所述问题对应的问题特征;
对所述问题特征进行处理,处理后的问题特征在预设的数值区间内;
根据各个所述问题及其在所述问题中的第二概率和指定的推荐阈值确定推荐的问题;
其中,各个所述问题及其在所述问题中的第二概率是通过所述处理后的问题特征和第一概率得到的;所述第一概率是通过所述问题特征得到的。
2.如权利要求1所述的方法,其特征在于,所述问题特征包括数值型特征和文本型特征,所述数值型特征为连续的,所述文本型特征为不连续的。
3.如权利要求1所述的方法,其特征在于,所述获取问题,具体包括:
在特征获取周期内获取所述问题;
若存在特征获取周期内未获取的问题,则所述未获取的问题的值为空;
若不存在特征获取周期内未获取的问题,则以获取的问题作为所述问题。
4.如权利要求2所述的方法,其特征在于,所述获取所述问题对应的问题特征,具体包括:
在特征获取周期内获取问题特征;
若存在特征获取周期内未获取的问题特征,且该问题特征为所述数值型特征时,则以获取的与问题对应的问题特征的数值的均值作为问题特征;
若存在特征获取周期内未获取的问题特征,且该问题特征为所述文本型问题特征时,则以获取的与问题对应的问题特征中出现频率最高的作为问题特征;
若不存在特征获取周期内未获取的问题特征,则以获取的问题特征作为所述问题特征。
5.如权利要求2所述的方法,其特征在于,对所述问题特征进行处理,具体包括:
若所述问题特征为数值型问题特征,则对问题特征进行归一化处理;
若所述问题特征为文本型问题特征,则对问题特征进行向量化处理,向量化处理后的问题特征为数值型问题特征。
6.如权利要求1所述的方法,其特征在于,所述第二概率是通过对所述处理后的问题特征和所述第一概率进行深度神经网络DNN计算得到的。
7.一种问题推荐设备,其特征在于,所述设备包括:
获取模块:在样本采集周期内,获取问题并获取所述问题对应的问题特征;
处理模块:对所述问题特征进行处理,处理后的问题特征在指定的数值区间内;
确定模块:根据各个所述问题及其在所述问题中的第二概率和指定的推荐阈值确定推荐的问题;
其中,各个所述问题及其在所述问题中的第二概率是通过所述处理后的问题特征和第一概率得到的;所述第一概率是通过所述问题特征得到的。
8.如权利要求7所述的问题推荐设备,其特征在于,所述问题特征包括数值型特征和文本型特征,所述数值型特征为连续的,所述文本型特征为不连续的。
9.如权利要求7所述的问题推荐设备,其特征在于,所述获取模块具体用于:
在特征获取周期内获取所述问题;
若存在特征获取周期内未获取的问题,则所述未获取的问题的值为空;
若不存在特征获取周期内未获取的问题,则以获取的问题作为所述问题。
10.如权利要求8所述的问题推荐设备,其特征在于,所述获取模块具体用于:
在特征获取周期内获取问题特征;
若存在特征获取周期内未获取的问题特征,且该问题特征为所述数值型特征时,则以获取的与问题对应的问题特征的数值的均值作为问题特征;
若存在特征获取周期内未获取的问题特征,且该问题特征为所述文本型问题特征时,则以获取的与问题对应的问题特征中出现频率最高的作为问题特征;
若不存在特征获取周期内未获取的问题特征,则以获取的问题特征作为所述问题特征。
11.如权利要求8所述的问题推荐设备,其特征在于,所述处理模块具体用于:
若所述问题特征为数值型问题特征,则对问题特征进行归一化处理;
若所述问题特征为文本型问题特征,则对问题特征进行向量化处理,向量化处理后的问题特征为数值型问题特征。
12.如权利要求7所述的问题推荐设备,其特征在于,所述第二概率是通过对所述处理后的问题特征和所述第一概率进行深度神经网络DNN计算得到的。
CN201610065638.2A 2016-01-29 2016-01-29 一种问题推荐方法及设备 Active CN107025228B (zh)

Priority Applications (6)

Application Number Priority Date Filing Date Title
CN201610065638.2A CN107025228B (zh) 2016-01-29 2016-01-29 一种问题推荐方法及设备
JP2018538883A JP7007279B2 (ja) 2016-01-29 2017-01-19 質問を推薦する方法及び装置
PCT/CN2017/071704 WO2017129033A1 (zh) 2016-01-29 2017-01-19 一种问题推荐方法及设备
EP17743648.2A EP3410310A4 (en) 2016-01-29 2017-01-19 Question recommendation method and device
TW106102678A TWI772287B (zh) 2016-01-29 2017-01-24 問題推薦方法及設備
US16/046,800 US20180330226A1 (en) 2016-01-29 2018-07-26 Question recommendation method and device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610065638.2A CN107025228B (zh) 2016-01-29 2016-01-29 一种问题推荐方法及设备

Publications (2)

Publication Number Publication Date
CN107025228A true CN107025228A (zh) 2017-08-08
CN107025228B CN107025228B (zh) 2021-01-26

Family

ID=59397449

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610065638.2A Active CN107025228B (zh) 2016-01-29 2016-01-29 一种问题推荐方法及设备

Country Status (6)

Country Link
US (1) US20180330226A1 (zh)
EP (1) EP3410310A4 (zh)
JP (1) JP7007279B2 (zh)
CN (1) CN107025228B (zh)
TW (1) TWI772287B (zh)
WO (1) WO2017129033A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108764273A (zh) * 2018-04-09 2018-11-06 中国平安人寿保险股份有限公司 一种数据处理的方法、装置、终端设备及存储介质
CN112528010A (zh) * 2020-12-15 2021-03-19 建信金融科技有限责任公司 知识推荐方法、装置、计算机设备及可读存储介质

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108363745B (zh) * 2018-01-26 2020-06-30 阿里巴巴集团控股有限公司 机器人客服转人工客服的方法和装置
US11586417B2 (en) * 2018-09-28 2023-02-21 Qualcomm Incorporated Exploiting activation sparsity in deep neural networks
CN111353093B (zh) * 2018-12-24 2023-05-23 北京嘀嘀无限科技发展有限公司 问题推荐方法、装置、服务器及可读存储介质
CN109711982A (zh) * 2019-01-04 2019-05-03 深圳壹账通智能科技有限公司 面核提问方法、装置、计算机设备和可读存储介质
CN110263133B (zh) * 2019-05-07 2023-11-24 平安科技(深圳)有限公司 基于知识图谱的问答方法、电子装置、设备及存储介质
CN112819019B (zh) * 2019-11-15 2023-06-20 财团法人资讯工业策进会 分类模型生成装置及其分类模型生成方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150088850A1 (en) * 2012-10-11 2015-03-26 Go Daddy Operating Company, LLC Optimizing search engine ranking by recommending content including frequently searched questions
CN104572734A (zh) * 2013-10-23 2015-04-29 腾讯科技(深圳)有限公司 问题推荐方法、装置及系统
CN105279288A (zh) * 2015-12-04 2016-01-27 深圳大学 一种基于深度神经网络的在线内容推荐方法

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09128401A (ja) * 1995-10-27 1997-05-16 Sharp Corp 動画像検索装置及びビデオ・オン・デマンド装置
US7409335B1 (en) * 2001-06-29 2008-08-05 Microsoft Corporation Inferring informational goals and preferred level of detail of answers based on application being employed by the user
US6922680B2 (en) * 2002-03-19 2005-07-26 Koninklijke Philips Electronics N.V. Method and apparatus for recommending an item of interest using a radial basis function to fuse a plurality of recommendation scores
US20050089878A1 (en) * 2003-02-14 2005-04-28 Debe Derek A. Method for determining functional sites in a protein
US20100235343A1 (en) * 2009-03-13 2010-09-16 Microsoft Corporation Predicting Interestingness of Questions in Community Question Answering
CN101986298A (zh) * 2010-10-28 2011-03-16 浙江大学 用于在线论坛的信息实时推荐方法
US9916538B2 (en) * 2012-09-15 2018-03-13 Z Advanced Computing, Inc. Method and system for feature detection
US9249287B2 (en) * 2012-02-24 2016-02-02 Nec Corporation Document evaluation apparatus, document evaluation method, and computer-readable recording medium using missing patterns
CN104462156B (zh) * 2013-09-25 2018-12-28 阿里巴巴集团控股有限公司 一种基于用户行为的特征提取、个性化推荐方法和系统
US9911088B2 (en) * 2014-05-01 2018-03-06 Microsoft Technology Licensing, Llc Optimizing task recommendations in context-aware mobile crowdsourcing
US10943181B2 (en) * 2015-06-26 2021-03-09 Microsoft Technology Licensing, Llc Just in time classifier training
CN105095477A (zh) * 2015-08-12 2015-11-25 华南理工大学 一种基于多指标评分的推荐算法
CN105243389A (zh) * 2015-09-28 2016-01-13 北京橙鑫数据科技有限公司 公司名称的行业分类标签的确定方法和装置
US10861106B1 (en) * 2016-01-14 2020-12-08 Intuit Inc. Computer generated user interfaces, computerized systems and methods and articles of manufacture for personalizing standardized deduction or itemized deduction flow determinations

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150088850A1 (en) * 2012-10-11 2015-03-26 Go Daddy Operating Company, LLC Optimizing search engine ranking by recommending content including frequently searched questions
CN104572734A (zh) * 2013-10-23 2015-04-29 腾讯科技(深圳)有限公司 问题推荐方法、装置及系统
CN105279288A (zh) * 2015-12-04 2016-01-27 深圳大学 一种基于深度神经网络的在线内容推荐方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
赵美雪: "基于用户兴趣模型的个性化推荐算法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108764273A (zh) * 2018-04-09 2018-11-06 中国平安人寿保险股份有限公司 一种数据处理的方法、装置、终端设备及存储介质
CN108764273B (zh) * 2018-04-09 2023-12-05 中国平安人寿保险股份有限公司 一种数据处理的方法、装置、终端设备及存储介质
CN112528010A (zh) * 2020-12-15 2021-03-19 建信金融科技有限责任公司 知识推荐方法、装置、计算机设备及可读存储介质
CN112528010B (zh) * 2020-12-15 2022-09-02 建信金融科技有限责任公司 知识推荐方法、装置、计算机设备及可读存储介质

Also Published As

Publication number Publication date
US20180330226A1 (en) 2018-11-15
CN107025228B (zh) 2021-01-26
JP2019511764A (ja) 2019-04-25
TWI772287B (zh) 2022-08-01
EP3410310A1 (en) 2018-12-05
EP3410310A4 (en) 2019-01-02
WO2017129033A1 (zh) 2017-08-03
JP7007279B2 (ja) 2022-01-24
TW201800987A (zh) 2018-01-01

Similar Documents

Publication Publication Date Title
CN107025228A (zh) 一种问题推荐方法及设备
Panda et al. Toward scalable, efficient, and accurate deep spiking neural networks with backward residual connections, stochastic softmax, and hybridization
CN108898476A (zh) 一种贷款客户信用评分方法和装置
CN107798604A (zh) 基于机器学习的择时入股方法及终端设备
CN111967971A (zh) 银行客户数据处理方法及装置
CN110347724A (zh) 异常行为识别方法、装置、电子设备及介质
CN112580555B (zh) 一种自发微表情识别方法
CN112163558A (zh) 时间序列数据的特征提取方法、装置、设备及存储介质
CN106897282A (zh) 一种用户群的分类方法和设备
Śniegula et al. Study of machine learning methods for customer churn prediction in telecommunication company
CN117056591B (zh) 基于动态预测的电力缴费渠道智能推荐方法及系统
CN108765137A (zh) 一种信贷需求预测方法和系统、存储介质
CN116883065A (zh) 商户风险预测方法及装置
CN111738863A (zh) 用户数据筛选方法、装置及系统
CN111222993A (zh) 基金推荐方法及装置
CN114723067B (zh) 一种基于用户隐私保护的联邦混合过滤推荐方法
CN113656692B (zh) 基于知识迁移算法的产品推荐方法、装置、设备及介质
CN107315807A (zh) 人才推荐方法和装置
CN117236900B (zh) 基于流程自动化的个税数据处理方法及系统
CN111859115B (zh) 用户分配方法和系统、数据处理设备及用户分配设备
CN116662922A (zh) 对象类型识别方法以及相关设备
Wang et al. User Satisfaction Prediction Based on Adaptive Feature Interaction Extraction
CN117494692A (zh) 凭证生成方法、计算机设备及计算机存储介质
Manju et al. Evaluation of Optimizers for Predicting Epilepsy Seizures
CN116188171A (zh) 基于统计结构化本地差分隐私的理财产品推荐方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1240341

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20211112

Address after: No. 699, Wangshang Road, Binjiang District, Hangzhou, Zhejiang

Patentee after: Alibaba (China) Network Technology Co., Ltd

Address before: P.O. Box 847, 4th floor, Grand Cayman capital building, British Cayman Islands

Patentee before: Alibaba Group Holdings Limited

TR01 Transfer of patent right