CN115659058B - 问题生成的方法和装置 - Google Patents

问题生成的方法和装置 Download PDF

Info

Publication number
CN115659058B
CN115659058B CN202211714287.5A CN202211714287A CN115659058B CN 115659058 B CN115659058 B CN 115659058B CN 202211714287 A CN202211714287 A CN 202211714287A CN 115659058 B CN115659058 B CN 115659058B
Authority
CN
China
Prior art keywords
standard
vector
feature
user
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211714287.5A
Other languages
English (en)
Other versions
CN115659058A (zh
Inventor
嵇望
安毫亿
陈默
张羽
梁青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Yuanchuan Xinye Technology Co ltd
Original Assignee
Hangzhou Yuanchuan Xinye Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Yuanchuan Xinye Technology Co ltd filed Critical Hangzhou Yuanchuan Xinye Technology Co ltd
Priority to CN202211714287.5A priority Critical patent/CN115659058B/zh
Publication of CN115659058A publication Critical patent/CN115659058A/zh
Application granted granted Critical
Publication of CN115659058B publication Critical patent/CN115659058B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例公开了一种问题生成的方法和装置。该问题生成的方法包括:依据标准问题,获取标准问题的词语级向量;通过对用户画像和用户行为轨迹进行编码,得到用户画像的特征向量和用户行为轨迹的特征向量;依据标准问题点击详情、标准问题对应的多级标签体系、词语级向量、用户画像的特征向量和用户行为轨迹的特征向量对问题推荐模型进行训练,得到训练后的问题推荐模型;依据用户请求信息中的用户行为轨迹和用户画像通过训练后的问题推荐模型从标准问题数据集中得到目标问题。本发明提供的方案能够实现有效捕捉层级依赖关系,通过共享信息,相互补充来提升问题推荐的精确度的技术效果。

Description

问题生成的方法和装置
技术领域
本发明涉及计算机技术应用领域,尤其涉及一种问题生成的方法和装置。
背景技术
通过使用智能手机利用各种软件,比如购物、移动支付、交通出行等APP,在网络上完成各种货币交易、生活服务等,在现在的生活中非常普遍,当使用上述软件遇到问题的时候,客户最希望的是能够第一时间在客服界面上看到自己想咨询的问题,然后直接找到答案。如果第一眼没有看到想要的问题,那就希望在和“客服”交互过程中以最少的交互次数获取到需要的答案。现有的问题推荐模型都是根据用户画像信息,历史订单信息、历史访问页面等用户业务行为轨迹数据来给用户推荐相关标准问题,这就导致并不会准确为客户提供准确的问题。
针对上述由于相关技术无法精确的基于用户的轨迹行为来推荐给用户想要询问的问题,目前尚未提出有效的解决方案。
发明内容
为解决上述技术问题,本发明实施例期望提供一种问题生成的方法和装置,以至少解决由于相关技术无法精确的基于用户的轨迹行为来推荐给用户想要询问的问题。
本发明的技术方案是这样实现的:
第一方面,本发明实施例提供一种问题生成的方法,包括:获取问题推荐数据集中的用户画像、用户行为轨迹、标准问题点击详情、标准问题和标准问题对应的多级标签体系;依据标准问题,获取标准问题的词语级向量;通过对用户画像和用户行为轨迹进行编码,得到用户画像的特征向量和用户行为轨迹的特征向量;依据标准问题点击详情、标准问题对应的多级标签体系、词语级向量、用户画像的特征向量和用户行为轨迹的特征向量对问题推荐模型进行训练,得到训练后的问题推荐模型;依据用户请求信息中的用户行为轨迹和用户画像通过训练后的问题推荐模型从标准问题数据集中得到目标问题。
可选的,依据标准问题,获取标准问题的词语级向量包括:依据标准问题生成标准问题文本;对标准问题文本进行编码,得到标准问题文本的词语级向量。
进一步地,可选的,对标准问题文本进行编码,得到标准问题文本的词语级向量包括:
Figure 769048DEST_PATH_IMAGE001
其中
Figure 530331DEST_PATH_IMAGE002
,R为词语级向量集合,其中n表示输入文本的长度,d表示标准问题文本中每一个字向量的维度,Q为标准问题文本,
Figure 856270DEST_PATH_IMAGE003
为BERT函数的参数。
可选的,通过对用户画像和用户行为轨迹进行编码,得到用户画像的特征向量和用户行为轨迹的特征向量包括:分别获取用户画像的用户画像特征和用户行为轨迹的用户行为特征;对用户画像特征和用户行为特征中的类别特征以及数值特征值作为特征编码进行嵌入编码, 得到用户画像的特征向量和用户行为轨迹的特征向量。
可选的,依据标准问题点击详情、标准问题对应的多级标签体系、词语级向量、用户画像的特征向量和用户行为轨迹的特征向量对问题推荐模型进行训练,得到训练后的问题推荐模型包括:依据用户画像的特征向量和用户行为轨迹的特征向量进行多级标签体系中的一级标签和二级标签的第一预测任务;依据用户画像的特征向量、用户行为轨迹的特征向量和词语级向量进行标准问题的预测任务;通过深度神经网络对预测任务进行特征编码,得到第一指定层网络编码后的特征表示;通过交叉网络对预测任务进行特征编码,得到第二指定层网络编码后的特征表示;将第一指定层网络编码后的特征表示和第二指定层网络编码后的特征表示连接,并通过前反馈神经网络进行任务预测;通过门机制,将上层标签预测有用的特征传递到下一层预测任务中,将上层的特征和本层的特征进行融合以产生本层的层次化特征,用于本层的预测分类任务;通过第一预测分类任务完成问题推荐一级标签的预测任务,通过第二预测分类任务完成问题推荐二级标签的预测任务,通过第三预测分类任务完成问题推荐标准问题的预测任务,完成问题推荐模型的训练,得到训练后的问题推荐模型。
进一步地,可选的,通过深度神经网络对预测任务进行特征编码,得到第一指定层网络编码后的特征表示包括:
Figure 488239DEST_PATH_IMAGE004
其中,x0为所述用户画像的特征向量和所述用户行为轨迹的特征向量连接后的特征向量,
Figure 372757DEST_PATH_IMAGE005
为第一指定层网络编码后的特征表示,
Figure 886915DEST_PATH_IMAGE006
为第一指定层的上一层网络编码后的特征表示,
Figure 954228DEST_PATH_IMAGE007
为权重参数,
Figure 971862DEST_PATH_IMAGE008
为偏置项,ReLu为非线性函数,
Figure 794325DEST_PATH_IMAGE009
为DNN网络的层数。
可选的,将第一指定层网络编码后的特征表示和第二指定层网络编码后的特征表示连接,并通过前反馈神经网络进行任务预测包括:
Figure 530200DEST_PATH_IMAGE010
其中,
Figure 640019DEST_PATH_IMAGE011
为交叉网络层中第L1层的特征输出表示,
Figure 43318DEST_PATH_IMAGE012
为交叉网络的层数,
Figure 974365DEST_PATH_IMAGE013
为DNN网络中第L2层的特征输出表示,
Figure 197536DEST_PATH_IMAGE014
Figure 872231DEST_PATH_IMAGE015
Figure 130037DEST_PATH_IMAGE016
连接后的特征向量,
Figure 464941DEST_PATH_IMAGE017
为DNN网络的层数,
Figure 440988DEST_PATH_IMAGE018
为权重参数,
Figure 450532DEST_PATH_IMAGE019
为偏置项,p为预测概率。
可选的,通过门机制,将上层标签预测有用的特征传递到下一层预测任务中,将上层的特征和本层的特征进行融合以产生本层的层次化特征,用于本层的预测分类任务包括:
Figure 297265DEST_PATH_IMAGE020
其中,
Figure 570115DEST_PATH_IMAGE021
表示第m层的标签层次化特征表示,
Figure 502299DEST_PATH_IMAGE022
表示m层的独立特征表示,门控机制GM的计算过程如下:
Figure 79648DEST_PATH_IMAGE023
其中,
Figure 249730DEST_PATH_IMAGE024
Figure 224639DEST_PATH_IMAGE025
Figure 909698DEST_PATH_IMAGE026
Figure 526624DEST_PATH_IMAGE027
为权重参数,b为偏置项,
Figure 551212DEST_PATH_IMAGE028
为上层对应的中间表示,
Figure 195558DEST_PATH_IMAGE029
表示元素乘法,
Figure 367913DEST_PATH_IMAGE030
表示拼接操作。
第二方面,本发明实施例提供一种问题生成的装置,包括:获取模块,用于获取问题推荐数据集中的用户画像、用户行为轨迹、标准问题点击详情、标准问题和标准问题对应的多级标签体系;第一向量获取模块,用于依据标准问题,获取标准问题的词语级向量;第二向量获取模块,用于通过对用户画像和用户行为轨迹进行编码,得到用户画像的特征向量和用户行为轨迹的特征向量;模型训练模块,用于依据标准问题点击详情、标准问题对应的多级标签体系、词语级向量、用户画像的特征向量和用户行为轨迹的特征向量对问题推荐模型进行训练,得到训练后的问题推荐模型;问题生成模块,用于依据用户请求信息中的用户行为轨迹和用户画像通过训练后的问题推荐模型从标准问题数据集中得到目标问题。
可选的,第一向量获取模块包括:文本生成单元,用于依据标准问题生成标准问题文本;向量获取单元,用于对标准问题文本进行编码,得到标准问题文本的词语级向量。
本发明实施例提供了一种问题生成的方法和装置。通过获取问题推荐数据集中的用户画像、用户行为轨迹、标准问题点击详情、标准问题和标准问题对应的多级标签体系;依据标准问题,获取标准问题的词语级向量;通过对用户画像和用户行为轨迹进行编码,得到用户画像的特征向量和用户行为轨迹的特征向量;依据标准问题点击详情、标准问题对应的多级标签体系、词语级向量、用户画像的特征向量和用户行为轨迹的特征向量对问题推荐模型进行训练,得到训练后的问题推荐模型;依据用户请求信息中的用户行为轨迹和用户画像通过训练后的问题推荐模型从标准问题数据集中得到目标问题,从而能够实现有效捕捉层级依赖关系,通过共享信息,相互补充来提升问题推荐的精确度的技术效果。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明实施例一提供的一种问题生成的方法的流程示意图;
图2为本发明实施例一提供的一种问题生成的方法中问题生成的示意图;
图3为本发明实施例一提供的一种问题生成的方法中模型训练的示意图;
图4为本发明实施例二提供的一种问题生成的装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于限定特定顺序。
还需要说明是,本发明下述各个实施例可以单独执行,各个实施例之间也可以相互结合执行,本发明实施例对此不作具体限制。
实施例一
第一方面,本发明实施例提供一种问题生成的方法,图1为本发明实施例一提供的一种问题生成的方法的流程示意图;如图1所示,本申请实施例提供的问题生成的方法包括:
步骤S100,获取问题推荐数据集中的用户画像、用户行为轨迹、标准问题点击详情、标准问题和标准问题对应的多级标签体系;
步骤S102,依据标准问题,获取标准问题的词语级向量;
可选的,步骤S102中依据标准问题,获取标准问题的词语级向量包括:依据标准问题生成标准问题文本;对标准问题文本进行编码,得到标准问题文本的词语级向量。
进一步地,可选的,对标准问题文本进行编码,得到标准问题文本的词语级向量包括:
Figure 522951DEST_PATH_IMAGE031
其中
Figure 402045DEST_PATH_IMAGE032
,R为词语级向量集合,其中n表示输入文本的长度,d表示标准问题文本中每一个字向量的维度,Q为标准问题文本,
Figure 984336DEST_PATH_IMAGE033
为BERT函数的参数。
步骤S104,通过对用户画像和用户行为轨迹进行编码,得到用户画像的特征向量和用户行为轨迹的特征向量;
可选的,步骤S104中通过对用户画像和用户行为轨迹进行编码,得到用户画像的特征向量和用户行为轨迹的特征向量包括:分别获取用户画像的用户画像特征和用户行为轨迹的用户行为特征;对用户画像特征和用户行为特征中的类别特征以及数值特征值作为特征编码进行嵌入编码, 得到用户画像的特征向量和用户行为轨迹的特征向量。
步骤S106,依据标准问题点击详情、标准问题对应的多级标签体系、词语级向量、用户画像的特征向量和用户行为轨迹的特征向量对问题推荐模型进行训练,得到训练后的问题推荐模型;
可选的,步骤S106中依据标准问题点击详情、标准问题对应的多级标签体系、词语级向量、用户画像的特征向量和用户行为轨迹的特征向量对问题推荐模型进行训练,得到训练后的问题推荐模型包括:依据用户画像的特征向量和用户行为轨迹的特征向量进行多级标签体系中的一级标签和二级标签的第一预测任务;依据用户画像的特征向量、用户行为轨迹的特征向量和词语级向量进行标准问题的预测任务;通过深度神经网络对预测任务进行特征编码,得到第一指定层网络编码后的特征表示;通过交叉网络对预测任务进行特征编码,得到第二指定层网络编码后的特征表示;将第一指定层网络编码后的特征表示和第二指定层网络编码后的特征表示连接,并通过前反馈神经网络进行任务预测;通过门机制,将上层标签预测有用的特征传递到下一层预测任务中,将上层的特征和本层的特征进行融合以产生本层的层次化特征,用于本层的预测分类任务;通过第一预测分类任务完成问题推荐一级标签的预测任务,通过第二预测分类任务完成问题推荐二级标签的预测任务,通过第三预测分类任务完成问题推荐标准问题的预测任务,完成问题推荐模型的训练,得到训练后的问题推荐模型。
其中,标准问题点击详情用于表示在模型训练过程中标准问题是否被点击。进一步地,可选的,通过深度神经网络对预测任务进行特征编码,得到第一指定层网络编码后的特征表示包括:
Figure 643988DEST_PATH_IMAGE034
其中,x0为所述用户画像的特征向量和所述用户行为轨迹的特征向量连接后的特征向量,
Figure 337137DEST_PATH_IMAGE035
为第一指定层网络编码后的特征表示,
Figure 852431DEST_PATH_IMAGE036
为第一指定层的上一层网络编码后的特征表示,
Figure 871202DEST_PATH_IMAGE037
为权重参数,
Figure 486991DEST_PATH_IMAGE038
为偏置项,ReLu为非线性函数,
Figure 983832DEST_PATH_IMAGE039
为DNN网络的层数。
可选的,将第一指定层网络编码后的特征表示和第二指定层网络编码后的特征表示连接,并通过前反馈神经网络进行任务预测包括:
Figure 103097DEST_PATH_IMAGE040
其中,
Figure 27191DEST_PATH_IMAGE041
为交叉网络层中第L1层的特征输出表示,
Figure 894391DEST_PATH_IMAGE042
为交叉网络的层数,
Figure 929343DEST_PATH_IMAGE043
为DNN网络中第L2层的特征输出表示,
Figure 637536DEST_PATH_IMAGE044
为DNN网络的层数,
Figure 732531DEST_PATH_IMAGE045
Figure 588491DEST_PATH_IMAGE046
Figure 427134DEST_PATH_IMAGE047
连接后的特征向量,
Figure 52151DEST_PATH_IMAGE048
为权重参数,
Figure 285424DEST_PATH_IMAGE049
为偏置项,p为预测概率。
可选的,通过门机制,将上层标签预测有用的特征传递到下一层预测任务中,将上层的特征和本层的特征进行融合以产生本层的层次化特征,用于本层的预测分类任务包括:
Figure 363101DEST_PATH_IMAGE050
其中,
Figure 739856DEST_PATH_IMAGE051
表示第m层的标签层次化特征表示,
Figure 219379DEST_PATH_IMAGE052
表示m层的独立特征表示,门控机制GM的计算过程如下:
Figure 328280DEST_PATH_IMAGE053
其中,
Figure 391789DEST_PATH_IMAGE054
Figure 837814DEST_PATH_IMAGE055
Figure 437422DEST_PATH_IMAGE056
Figure 248383DEST_PATH_IMAGE057
为权重参数,b为偏置项,
Figure 35074DEST_PATH_IMAGE058
为上层对应的中间表示,
Figure 19210DEST_PATH_IMAGE059
表示元素乘法,
Figure 738905DEST_PATH_IMAGE060
表示拼接操作。
步骤S108,依据用户请求信息中的用户行为轨迹和用户画像通过训练后的问题推荐模型从标准问题数据集中得到目标问题。
综上,结合步骤S100至步骤S108,图2为本发明实施例一提供的一种问题生成的方法中问题生成的示意图;如图2所示,本申请实施例提供的问题的生成方法中通过获取问题推荐数据集中的用户画像、用户行为轨迹、标准问题点击详情、标准问题,以及标准问题对应的多级标签体系,对标准问题文本进行分词,获得标准问题文本的词语级向量表示,对用户行为轨迹和用户画像进行特征编码,获得用户行为轨迹及用户画像的特征向量表示,将标准问题文本的词语级向量表示、用户行为轨迹及用户画像的特征向量表示输入多级标签的问题推荐模型中进行模型训练,寻找最优参数,保存最优模型,依据该最优模型根据用户行为轨迹和用户画像从标准问题数据集中找到用户最想询问的标准问题(即,本申请实施例中的目标问题)。
本申请实施例提供的问题的生成方法在模型训练过程具体实施如下:
步骤一:对问句文本
Figure 225162DEST_PATH_IMAGE061
使用BERT来对Q进行编码,得到文本的特征向量表示E,如公式所示:
Figure 499148DEST_PATH_IMAGE062
其中
Figure 21396DEST_PATH_IMAGE063
,R为词语级向量集合,其中n表示输入文本的长度,d表示文本中每一个字向量的维度,
Figure 595597DEST_PATH_IMAGE064
为BERT函数的参数。
步骤二:对用户行为特征和用户画像特征中的类别特征进行embedding的编码,数值特征直接使用其值作为特征编码,编码后的用户行为特征表示为
Figure 748361DEST_PATH_IMAGE065
,编码后的用户画像特征表示为
Figure 775223DEST_PATH_IMAGE066
其中,如图3所示,图3为本发明实施例一提供的一种问题生成的方法中模型训练的示意图。
步骤三:在进行标准问题一级标签和二级标签预测任务时:
Figure 334118DEST_PATH_IMAGE067
其中,x0为所述用户画像的特征向量和所述用户行为轨迹的特征向量连接后的特征向量;
在进行标准问题的预测任务时:
Figure 762825DEST_PATH_IMAGE068
步骤四:使用深度神经网络DNN对
Figure 148807DEST_PATH_IMAGE069
进行特征编码,则第i层网络编码后的特征表示
Figure 600648DEST_PATH_IMAGE070
Figure 464699DEST_PATH_IMAGE071
其中,
Figure 747913DEST_PATH_IMAGE072
为第一指定层网络编码后的特征表示,
Figure 304796DEST_PATH_IMAGE073
为第一指定层的上一层网络编码后的特征表示,
Figure 742468DEST_PATH_IMAGE074
为权重参数,
Figure 410210DEST_PATH_IMAGE075
为偏置项,ReLu为非线性函数,
Figure 547930DEST_PATH_IMAGE076
为DNN网络的层数。
步骤五:使用交叉网络对
Figure 275715DEST_PATH_IMAGE077
进行特征编码,则第j层网络编码后的特征表示
Figure 498886DEST_PATH_IMAGE078
Figure 970319DEST_PATH_IMAGE079
其中,
Figure 664343DEST_PATH_IMAGE080
为权重参数,
Figure 297449DEST_PATH_IMAGE081
为偏置项。
步骤六:将左侧和右侧得到的两个特征表示直接concat起来,使用一个前馈神经网络来进行任务的预测,具体的计算过程如下:
Figure 7917DEST_PATH_IMAGE082
Figure 283040DEST_PATH_IMAGE083
其中,
Figure 129773DEST_PATH_IMAGE084
为交叉网络层中第L1层的特征输出表示,
Figure 402623DEST_PATH_IMAGE085
为交叉网络的层数,
Figure 600386DEST_PATH_IMAGE086
为DNN网络中第L2层的特征输出表示,
Figure 906297DEST_PATH_IMAGE087
为DNN网络的层数,
Figure 607537DEST_PATH_IMAGE088
Figure 51288DEST_PATH_IMAGE089
Figure 470768DEST_PATH_IMAGE090
连接后的特征向量,
Figure 822114DEST_PATH_IMAGE091
为权重参数,
Figure 643440DEST_PATH_IMAGE092
为偏置项,p为预测概率。
步骤七:在多任务学习框架下,我们通过门机制,将上层标签预测有用的特征传递到下一层预测任务中,将上层的特征和本层的特征进行融合以产生本层的层次化特征,用于本层的预测分类任务,具体的计算过程如下:
Figure 320409DEST_PATH_IMAGE093
其中,
Figure 928983DEST_PATH_IMAGE094
表示第m层的标签层次化特征表示,
Figure 84020DEST_PATH_IMAGE095
表示m层的独立特征表示,门控机制GM(gating mechanism)的计算过程如下:
Figure 759852DEST_PATH_IMAGE096
其中,
Figure 607723DEST_PATH_IMAGE097
Figure 1795DEST_PATH_IMAGE098
Figure 694944DEST_PATH_IMAGE099
Figure 490862DEST_PATH_IMAGE100
为权重参数,b为偏置项,
Figure 680273DEST_PATH_IMAGE101
为上层对应的中间表示,
Figure 561641DEST_PATH_IMAGE102
表示元素乘法,
Figure 324061DEST_PATH_IMAGE103
表示拼接操作。
步骤八:最后我们使用
Figure 177747DEST_PATH_IMAGE104
来完成问题推荐一级标签的预测任务,
Figure 101841DEST_PATH_IMAGE105
来完成问题推荐二级标签的预测任务,
Figure 204926DEST_PATH_IMAGE106
来完成问题推荐标准问题的推荐预测任务,在训练过程中我们使用负对数似然函数来作为损失函数。则最终的Loss函数为一级标签、二级标签和标准问题预测的多任务loss之和
Figure 3993DEST_PATH_IMAGE107
为:
Figure 774502DEST_PATH_IMAGE108
其中
Figure 72760DEST_PATH_IMAGE109
表示任务的个数。
步骤九:使用问题推荐数据集对一种融合多级标签知识的多任务问题推荐方法进行模型训练,选择在开发集上F1指标最好的模型进行保存,该模型能够精准的推荐给用户他想要询问的标准问题。
本发明实施例提供了一种问题生成的方法,通过获取问题推荐数据集中的用户画像、用户行为轨迹、标准问题点击详情、标准问题和标准问题对应的多级标签体系;依据标准问题,获取标准问题的词语级向量;通过对用户画像和用户行为轨迹进行编码,得到用户画像的特征向量和用户行为轨迹的特征向量;依据标准问题点击详情、标准问题对应的多级标签体系、词语级向量、用户画像的特征向量和用户行为轨迹的特征向量对问题推荐模型进行训练,得到训练后的问题推荐模型;依据用户请求信息中的用户行为轨迹和用户画像通过训练后的问题推荐模型从标准问题数据集中得到目标问题,从而能够实现有效捕捉层级依赖关系,通过共享信息,相互补充来提升问题推荐的精确度的技术效果。
实施例二
第二方面,本发明实施例提供一种问题生成的装置,图4为本发明实施例二提供的一种问题生成的装置的示意图,如图4所示,本申请实施例提供的问题生成的装置包括:获取模块40,用于获取问题推荐数据集中的用户画像、用户行为轨迹、标准问题点击详情、标准问题和标准问题对应的多级标签体系;第一向量获取模块42,用于依据标准问题,获取标准问题的词语级向量;第二向量获取模块44,用于通过对用户画像和用户行为轨迹进行编码,得到用户画像的特征向量和用户行为轨迹的特征向量;模型训练模块46,用于依据标准问题点击详情、标准问题对应的多级标签体系、词语级向量、用户画像的特征向量和用户行为轨迹的特征向量对问题推荐模型进行训练,得到训练后的问题推荐模型;问题生成模块48,用于依据用户请求信息中的用户行为轨迹和用户画像通过训练后的问题推荐模型从标准问题数据集中得到目标问题。
可选的,第一向量获取模块42包括:文本生成单元,用于依据标准问题生成标准问题文本;向量获取单元,用于对标准问题文本进行编码,得到标准问题文本的词语级向量。
本发明实施例提供了一种问题生成的装置,通过获取问题推荐数据集中的用户画像、用户行为轨迹、标准问题点击详情、标准问题和标准问题对应的多级标签体系;依据标准问题,获取标准问题的词语级向量;通过对用户画像和用户行为轨迹进行编码,得到用户画像的特征向量和用户行为轨迹的特征向量;依据标准问题点击详情、标准问题对应的多级标签体系、词语级向量、用户画像的特征向量和用户行为轨迹的特征向量对问题推荐模型进行训练,得到训练后的问题推荐模型;依据用户请求信息中的用户行为轨迹和用户画像通过训练后的问题推荐模型从标准问题数据集中得到目标问题,从而能够实现有效捕捉层级依赖关系,通过共享信息,相互补充来提升问题推荐的精确度的技术效果。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。

Claims (6)

1.一种问题生成的方法,其特征在于,包括:
获取问题推荐数据集中的用户画像、用户行为轨迹、标准问题点击详情、标准问题和标准问题对应的多级标签体系;
依据所述标准问题,获取所述标准问题的词语级向量;
通过对所述用户画像和所述用户行为轨迹进行编码,得到所述用户画像的特征向量和所述用户行为轨迹的特征向量;
依据所述标准问题点击详情、所述标准问题对应的多级标签体系、所述词语级向量、所述用户画像的特征向量和所述用户行为轨迹的特征向量对问题推荐模型进行训练,得到训练后的所述问题推荐模型;
依据用户请求信息中的用户行为轨迹和用户画像通过训练后的所述问题推荐模型从标准问题数据集中得到目标问题;
所述依据所述标准问题,获取所述标准问题的词语级向量包括:依据所述标准问题生成标准问题文本;对所述标准问题文本进行编码,得到所述标准问题文本的词语级向量;
其中,所述对所述标准问题文本进行编码,得到所述标准问题文本的词语级向量包括:
Figure QLYQS_1
其中
Figure QLYQS_2
,R为词语级向量集合,其中n表示输入文本的长度,d表示所述标准问题文本中每一个字向量的维度,Q为所述标准问题文本,
Figure QLYQS_3
为BERT函数的参数;
所述依据所述标准问题点击详情、所述标准问题对应的多级标签体系、所述词语级向量、所述用户画像的特征向量和所述用户行为轨迹的特征向量对问题推荐模型进行训练,得到训练后的所述问题推荐模型包括:依据所述用户画像的特征向量和所述用户行为轨迹的特征向量进行所述多级标签体系中的一级标签和二级标签的第一预测任务;依据所述用户画像的特征向量、所述用户行为轨迹的特征向量和所述词语级向量进行标准问题的预测任务;通过深度神经网络对所述预测任务进行特征编码,得到第一指定层网络编码后的特征表示;通过交叉网络对所述预测任务进行特征编码,得到第二指定层网络编码后的特征表示;将所述第一指定层网络编码后的特征表示和所述第二指定层网络编码后的特征表示连接,并通过前反馈神经网络进行任务预测;通过门机制,将上层标签预测有用的特征传递到下一层预测任务中,将上层的特征和本层的特征进行融合以产生本层的层次化特征,用于本层的预测分类任务;通过第一预测分类任务完成问题推荐一级标签的预测任务,通过第二预测分类任务完成问题推荐二级标签的预测任务,通过第三预测分类任务完成问题推荐标准问题的预测任务,完成问题推荐模型的训练,得到训练后的所述问题推荐模型。
2.根据权利要求1所述的问题生成的方法,其特征在于,所述通过对所述用户画像和所述用户行为轨迹进行编码,得到所述用户画像的特征向量和所述用户行为轨迹的特征向量包括:
分别获取所述用户画像的用户画像特征和所述用户行为轨迹的用户行为特征;
对所述用户画像特征和所述用户行为特征中的类别特征以及数值特征值作为特征编码进行嵌入编码, 得到所述用户画像的特征向量和所述用户行为轨迹的特征向量。
3.根据权利要求1所述的问题生成的方法,其特征在于,所述通过深度神经网络对所述预测任务进行特征编码,得到第一指定层网络编码后的特征表示包括:
Figure QLYQS_4
其中,x0为所述用户画像的特征向量和所述用户行为轨迹的特征向量连接后的特征向量,
Figure QLYQS_5
为第一指定层网络编码后的特征表示,
Figure QLYQS_6
为第一指定层的上一层网络编码后的特征表示,
Figure QLYQS_7
为权重参数,
Figure QLYQS_8
为偏置项,ReLu为非线性函数,
Figure QLYQS_9
为DNN网络的层数。
4.根据权利要求1所述的问题生成的方法,其特征在于,所述将所述第一指定层网络编码后的特征表示和所述第二指定层网络编码后的特征表示连接,并通过前反馈神经网络进行任务预测包括:
Figure QLYQS_10
Figure QLYQS_11
其中,
Figure QLYQS_13
为交叉网络层中第L1层的特征输出表示,
Figure QLYQS_16
为交叉网络的层数,
Figure QLYQS_18
为DNN网络中第L2层的特征输出表示,
Figure QLYQS_14
为DNN网络的层数,
Figure QLYQS_17
Figure QLYQS_19
Figure QLYQS_20
连接后的特征向量,
Figure QLYQS_12
为权重参数,
Figure QLYQS_15
为偏置项,p为预测概率。
5.根据权利要求1所述的问题生成的方法,其特征在于,所述通过门机制,将上层标签预测有用的特征传递到下一层预测任务中,将上层的特征和本层的特征进行融合以产生本层的层次化特征,用于本层的预测分类任务包括:
Figure QLYQS_21
其中,
Figure QLYQS_22
表示第m层的标签层次化特征表示,
Figure QLYQS_23
表示m层的独立特征表示,门控机制GM的计算过程如下:
Figure QLYQS_24
其中,
Figure QLYQS_25
Figure QLYQS_26
Figure QLYQS_27
Figure QLYQS_28
为权重参数,b为偏置项,
Figure QLYQS_29
为上层对应的中间表示,
Figure QLYQS_30
表示元素乘法,
Figure QLYQS_31
表示拼接操作。
6.一种问题生成的装置,其特征在于,包括:
获取模块,用于获取问题推荐数据集中的用户画像、用户行为轨迹、标准问题点击详情、标准问题和标准问题对应的多级标签体系;
第一向量获取模块,用于依据所述标准问题,获取所述标准问题的词语级向量;
第二向量获取模块,用于通过对所述用户画像和所述用户行为轨迹进行编码,得到所述用户画像的特征向量和所述用户行为轨迹的特征向量;
模型训练模块,用于依据所述标准问题点击详情、所述标准问题对应的多级标签体系、所述词语级向量、所述用户画像的特征向量和所述用户行为轨迹的特征向量对问题推荐模型进行训练,得到训练后的所述问题推荐模型;
问题生成模块,用于依据用户请求信息中的用户行为轨迹和用户画像通过训练后的所述问题推荐模型从标准问题数据集中得到目标问题;
所述第一向量获取模块包括:文本生成单元,用于依据所述标准问题生成标准问题文本;向量获取单元,用于对所述标准问题文本进行编码,得到所述标准问题文本的词语级向量;
其中,所述对所述标准问题文本进行编码,得到所述标准问题文本的词语级向量包括:
Figure QLYQS_32
其中
Figure QLYQS_33
,R为词语级向量集合,其中n表示输入文本的长度,d表示所述标准问题文本中每一个字向量的维度,Q为所述标准问题文本,
Figure QLYQS_34
为BERT函数的参数;
所述依据所述标准问题点击详情、所述标准问题对应的多级标签体系、所述词语级向量、所述用户画像的特征向量和所述用户行为轨迹的特征向量对问题推荐模型进行训练,得到训练后的所述问题推荐模型包括:依据所述用户画像的特征向量和所述用户行为轨迹的特征向量进行所述多级标签体系中的一级标签和二级标签的第一预测任务;依据所述用户画像的特征向量、所述用户行为轨迹的特征向量和所述词语级向量进行标准问题的预测任务;通过深度神经网络对所述预测任务进行特征编码,得到第一指定层网络编码后的特征表示;通过交叉网络对所述预测任务进行特征编码,得到第二指定层网络编码后的特征表示;将所述第一指定层网络编码后的特征表示和所述第二指定层网络编码后的特征表示连接,并通过前反馈神经网络进行任务预测;通过门机制,将上层标签预测有用的特征传递到下一层预测任务中,将上层的特征和本层的特征进行融合以产生本层的层次化特征,用于本层的预测分类任务;通过第一预测分类任务完成问题推荐一级标签的预测任务,通过第二预测分类任务完成问题推荐二级标签的预测任务,通过第三预测分类任务完成问题推荐标准问题的预测任务,完成问题推荐模型的训练,得到训练后的所述问题推荐模型。
CN202211714287.5A 2022-12-30 2022-12-30 问题生成的方法和装置 Active CN115659058B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211714287.5A CN115659058B (zh) 2022-12-30 2022-12-30 问题生成的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211714287.5A CN115659058B (zh) 2022-12-30 2022-12-30 问题生成的方法和装置

Publications (2)

Publication Number Publication Date
CN115659058A CN115659058A (zh) 2023-01-31
CN115659058B true CN115659058B (zh) 2023-04-11

Family

ID=85023013

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211714287.5A Active CN115659058B (zh) 2022-12-30 2022-12-30 问题生成的方法和装置

Country Status (1)

Country Link
CN (1) CN115659058B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114443942A (zh) * 2020-11-04 2022-05-06 航天信息股份有限公司 一种标准问题推荐方法、装置、介质和设备

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3055379C (en) * 2017-03-10 2023-02-21 Eduworks Corporation Automated tool for question generation
US11080598B2 (en) * 2018-05-15 2021-08-03 Sap Se Automated question generation using semantics and deep learning
CN110399492A (zh) * 2019-07-22 2019-11-01 阿里巴巴集团控股有限公司 针对用户问句的问题分类模型的训练方法和装置
CN114175017A (zh) * 2019-10-30 2022-03-11 深圳市欢太科技有限公司 模型构建方法、分类方法、装置、存储介质及电子设备
CN111400471B (zh) * 2020-03-13 2022-09-27 江苏满运软件科技有限公司 问题推荐方法、系统、电子设备和存储介质
EP4002141A4 (en) * 2020-05-29 2022-09-28 BOE Technology Group Co., Ltd. QUESTION RECOMMENDATION METHOD, APPARATUS AND SYSTEM, AND ELECTRONIC DEVICE AND COMPUTER READABLE RECORDING MEDIA
CN114254070A (zh) * 2020-09-25 2022-03-29 阿里巴巴集团控股有限公司 问题推荐方法和装置
CN112464100B (zh) * 2020-12-14 2023-04-28 未来电视有限公司 信息推荐模型训练方法、信息推荐方法、装置及设备
CN112667714B (zh) * 2021-03-17 2021-06-01 腾讯科技(深圳)有限公司 基于深度学习的用户画像优化方法、装置及存储介质
CN114398909A (zh) * 2022-01-18 2022-04-26 中国平安人寿保险股份有限公司 用于对话训练的问题生成方法、装置、设备和存储介质
CN115455169B (zh) * 2022-10-31 2023-04-18 杭州远传新业科技股份有限公司 一种基于词汇知识和语义依存的知识图谱问答方法和系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114443942A (zh) * 2020-11-04 2022-05-06 航天信息股份有限公司 一种标准问题推荐方法、装置、介质和设备

Also Published As

Publication number Publication date
CN115659058A (zh) 2023-01-31

Similar Documents

Publication Publication Date Title
Chen et al. Deep reinforcement learning in recommender systems: A survey and new perspectives
Burgess et al. Can genetic programming improve software effort estimation? A comparative evaluation
CN114912433B (zh) 文本层级多标签分类方法、装置、电子设备以及存储介质
Meng et al. Decision making with intuitionistic linguistic preference relations
Cao et al. Hybrid computational model for forecasting Taiwan construction cost index
CN111309887B (zh) 一种训练文本关键内容提取模型的方法和系统
CN109447698A (zh) 一种基于神经网络的推荐算法
CN110795944A (zh) 推荐内容处理方法及装置、情感属性确定方法及装置
CN110110372B (zh) 一种用户时序行为自动切分预测方法
Zhao et al. Revolutionizing finance with llms: An overview of applications and insights
CN116757652B (zh) 一种基于大语言模型的在线招聘推荐系统及方法
CN110362663A (zh) 自适应多感知相似度检测和解析
WO2023231513A1 (zh) 对话内容的生成方法及装置、存储介质、终端
Wang et al. Are you for real? detecting identity fraud via dialogue interactions
CN117390141A (zh) 一种农业社会化服务质量用户评价数据分析方法
CN110489730A (zh) 文本处理方法、装置、终端及存储介质
Bashir et al. Hesitant probabilistic fuzzy preference relations in decision making
Wu et al. A Group Decision‐Making Approach Based on DST and AHP for New Product Selection under Epistemic Uncertainty
CN115659058B (zh) 问题生成的方法和装置
Oladipupo et al. A Decision‐Making Approach for Ranking Tertiary Institutions’ Service Quality Using Fuzzy MCDM and Extended HiEdQUAL Model
CN117235264A (zh) 文本处理方法、装置、设备和计算机可读存储介质
Sarigiannidis et al. A novel lexicon-based approach in determining sentiment in financial data using learning automata
Ocampo et al. A sustainable manufacturing strategy from different strategic responses under uncertainty
Javadi et al. OpinionConv: Conversational Product Search with Grounded Opinions
CN114692649A (zh) 一种利用多视角信息的自动回答文本生成方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant