CN117407418A - 信息获取方法、装置、计算机设备、存储介质和程序产品 - Google Patents
信息获取方法、装置、计算机设备、存储介质和程序产品 Download PDFInfo
- Publication number
- CN117407418A CN117407418A CN202311147941.3A CN202311147941A CN117407418A CN 117407418 A CN117407418 A CN 117407418A CN 202311147941 A CN202311147941 A CN 202311147941A CN 117407418 A CN117407418 A CN 117407418A
- Authority
- CN
- China
- Prior art keywords
- search
- information
- feature vector
- historical
- result list
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000004590 computer program Methods 0.000 claims abstract description 26
- 230000006399 behavior Effects 0.000 claims description 133
- 238000012549 training Methods 0.000 claims description 55
- 238000012545 processing Methods 0.000 claims description 16
- 238000004140 cleaning Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 5
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 238000012512 characterization method Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及一种信息获取方法、装置、计算机设备、存储介质和计算机程序产品。应用于人工智能技术领域。方法包括:接收包括用户标识和搜索信息的内容搜索请求,根据搜索信息,获取第一搜索特征向量;根据用户标识,获取用户在第一预设时长中的至少一个历史搜索行为信息对应的第二搜索特征向量;根据第一搜索特征向量和第二搜索特征向量,确定针对搜索信息的搜索结果列表。采用本方法能够对搜索结果列表中的搜索结果进行优化,提高了搜索效率,在提高了搜索效率的同时,提高了搜索的准确性。
Description
技术领域
本申请涉及人工智能技术领域,特别是涉及一种信息获取方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
随着金融科技不断发展,银行正在重新构建商务模式,线下网点数不断减少,与此同时,使用手机银行服务的用户不断增加。据统计,手机可办理95%以上的银行零售业务,越来越多客户偏爱数字化、移动式的服务体验。
传统技术中,各个银行的手机银行APP多采用传统关键字,以得到对应的搜索结果列表。
但是传统方式中搜索结果列表中搜索结果的排序方式仅仅只是基于关键字确定的,存在一定的局限性,从而影响了搜索效率。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高搜索效率的信息获取方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种信息获取方法。所述方法包括:
接收用户的内容搜索请求,所述内容搜索请求包括用户标识和搜索信息;
根据所述搜索信息,获取所述搜索信息对应的第一搜索特征向量;
根据所述用户标识,获取用户在第一预设时长中的至少一个历史搜索行为信息对应的第二搜索特征向量;所述历史搜索行为信息包括历史搜索信息、所述历史搜索信息对应的搜索结果以及所述用户对所述搜索结果的行为信息;
根据所述第一搜索特征向量和所述第二搜索特征向量,确定针对所述搜索信息的搜索结果列表;所述搜索结果列表包括多个搜索结果,多个搜索结果中排序优先级最高的为所述目标搜索结果。
在其中一个实施例中,所述根据所述用户标识,获取用户在第一预设时长中的至少一个历史搜索行为信息对应的第二搜索特征向量,包括:
根据所述用户标识,获取用户在第一预设时长中的至少一个历史搜索行为信息;
根据每个历史搜索行为信息,获取每个历史搜索行为信息对应的历史特征向量;
将每个历史特征向量进行向量拼接处理,得到所述第二搜索特征向量。
在其中一个实施例中,所述根据所述第一搜索特征向量和所述第二搜索特征向量,确定针对所述搜索信息的搜索结果列表,包括:
将所述第一搜索特征向量输入至训练后的第一搜索预测模型,得到针对所述搜索信息的初步搜索结果列表;
将所述初步搜索结果列表和所述第二搜索特征向量,输入至训练后的第二搜索预测模型,得到针对所述搜索信息的搜索结果列表。
在其中一个实施例中,所述将所述第一搜索特征向量输入至训练后的第一搜索预测模型,得到针对所述搜索信息的初步搜索结果列表,包括:
将所述第一搜索特征向量输入至训练后的第一搜索预测模型,得到多个搜索结果以及每个搜索结果的概率值;
根据每个搜索结果的概率值,获取第一数量的搜索结果;所述第一数量的搜索结果是依据每个搜索结果的概率值进行从大至小的排序得到;
根据所述第一数量的搜索结果,生成针对所述搜索信息的初步搜索结果列表。
在其中一个实施例中,第二搜索预测模型的训练过程,包括:
获取历史搜索行为数据集;所述历史搜索行为数据集包括第二预设时长中所有的历史搜索信息、使用训练后的第一搜索预测模型预测得到的搜索结果列表、以及用户对搜索结果列表中搜索结果的行为信息;
根据所述历史搜索行为数据集,构建训练样本集;
基于所述训练样本集,对训练前的第二搜索预测模型进行训练,得到训练后的第二资源预测模型。
在其中一个实施例中,所述根据所述历史搜索行为数据集,构建训练样本集,包括:
对所述历史搜索行为数据集进行数据清洗,以得到清洗后的历史搜索行为数据集;
根据清洗后的历史搜索行为数据集中的历史搜索信息,获取针对每个历史搜索信息的第三搜索特征向量;
根据用户对搜索结果列表中搜索结果的行为信息,对使用训练后的第一搜索预测模型预测得到的搜索结果列表进行重新排序;
根据每个第三搜索特征向量和对应的重新排序后的搜索结果列表,构成所述训练样本集。
第二方面,本申请还提供了一种信息获取装置。所述装置包括:
内容搜索请求获取模块,用于接收用户的内容搜索请求,所述内容搜索请求包括用户标识和搜索信息;
第一搜索特征向量获取模块,用于根据所述搜索信息,获取所述搜索信息对应的第一搜索特征向量;
第二搜索特征向量获取模块,用于根据所述用户标识,获取用户在第一预设时长中的至少一个历史搜索行为信息对应的第二搜索特征向量;所述历史搜索行为信息包括历史搜索信息、所述历史搜索信息对应的搜索结果以及所述用户对所述搜索结果的行为信息;
搜索结果列表确定模块,用于根据所述第一搜索特征向量和所述第二搜索特征向量,确定针对所述搜索信息的搜索结果列表;所述搜索结果列表包括多个搜索结果,多个搜索结果中排序优先级最高的为所述目标搜索结果。
第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
接收用户的内容搜索请求,所述内容搜索请求包括用户标识和搜索信息;
根据所述搜索信息,获取所述搜索信息对应的第一搜索特征向量;
根据所述用户标识,获取用户在第一预设时长中的至少一个历史搜索行为信息对应的第二搜索特征向量;所述历史搜索行为信息包括历史搜索信息、所述历史搜索信息对应的搜索结果以及所述用户对所述搜索结果的行为信息;
根据所述第一搜索特征向量和所述第二搜索特征向量,确定针对所述搜索信息的搜索结果列表;所述搜索结果列表包括多个搜索结果,多个搜索结果中排序优先级最高的为所述目标搜索结果。
第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
接收用户的内容搜索请求,所述内容搜索请求包括用户标识和搜索信息;
根据所述搜索信息,获取所述搜索信息对应的第一搜索特征向量;
根据所述用户标识,获取用户在第一预设时长中的至少一个历史搜索行为信息对应的第二搜索特征向量;所述历史搜索行为信息包括历史搜索信息、所述历史搜索信息对应的搜索结果以及所述用户对所述搜索结果的行为信息;
根据所述第一搜索特征向量和所述第二搜索特征向量,确定针对所述搜索信息的搜索结果列表;所述搜索结果列表包括多个搜索结果,多个搜索结果中排序优先级最高的为所述目标搜索结果。
第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
接收用户的内容搜索请求,所述内容搜索请求包括用户标识和搜索信息;
根据所述搜索信息,获取所述搜索信息对应的第一搜索特征向量;
根据所述用户标识,获取用户在第一预设时长中的至少一个历史搜索行为信息对应的第二搜索特征向量;所述历史搜索行为信息包括历史搜索信息、所述历史搜索信息对应的搜索结果以及所述用户对所述搜索结果的行为信息;
根据所述第一搜索特征向量和所述第二搜索特征向量,确定针对所述搜索信息的搜索结果列表;所述搜索结果列表包括多个搜索结果,多个搜索结果中排序优先级最高的为所述目标搜索结果。
上述信息获取方法、装置、计算机设备、存储介质和计算机程序产品,接收包括用户标识和搜索信息的内容搜索请求,根据搜索信息,获取搜索信息对应的第一搜索特征向量;根据用户标识,获取用户在第一预设时长中的至少一个历史搜索行为信息对应的第二搜索特征向量;根据第一搜索特征向量和第二搜索特征向量,确定针对搜索信息的搜索结果列表,相对于传统技术中采用传统关键字,以得到对应的搜索结果列表的方式,本方法中通过搜索信息与历史搜索行为数据共同确定了搜索结果列表,实现了对搜索结果列表中的搜索结果进行优化,提高了搜索效率,并且,在提高了搜索效率的同时,提高了搜索的准确性。
附图说明
图1为一个实施例中信息获取方法的应用环境图;
图2为一个实施例中信息获取方法的流程示意图;
图3为一个实施例中第二搜索预测模型的训练的流程示意图;
图4为另一个实施例中信息获取方法的流程示意图;
图5为一个实施例中信息获取装置的结构框图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的信息获取方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。
服务器104在接收到用户通过终端102发送的内容搜索请求的情况下,根据内容搜索请求中的搜索信息,获取搜索信息对应的第一搜索特征向量;根据内容搜索请求中的用户标识,获取用户在第一预设时长中的至少一个历史搜索行为对应的第二搜索特征向量,以根据第一搜索特征向量和第二搜索特征向量,确定针对搜索信息的搜索结果列表,将搜索结果列表发送至终端102。
其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种信息获取方法,以该方法应用于图1中的服务器104为例进行说明,包括以下步骤:
步骤202,接收用户的内容搜索请求,所述内容搜索请求包括用户标识和搜索信息。
其中,内容搜索请求可以包括用户标识和搜索信息。搜索信息可以为用户输入的信息,包括搜索关键字。用户标识具有唯一性,是用户唯一的身份ID,相同的身份ID会被认定为同一用户。在具体实践中,用户标识可以为账号信息。
在具体实践中,用户可以在终端中,启动手机银行APP,在手机银行APP的搜索框,输入信息,以根据输入信息,生成内容搜索请求,发送至服务器。
示例性地,服务器可以在接收到用户通过终端发送的内容搜索请求,以获取内容搜索请求中的用户标识和搜索信息。
步骤204,根据所述搜索信息,获取所述搜索信息对应的第一搜索特征向量。
其中,搜索信息可以包括搜索关键词。
示例性地,服务器可以根据搜索信息,以获取搜索信息对应的第一搜索特征向量。具体地,可以通过分词工具将搜索信息进行分词处理,以对分词处理后的搜索信息进行特征化处理,得到第一搜索特征向量,其中,特征化处理包括归一化处理、标准化处理或缺失值填充处理中的至少一个。
步骤206,根据所述用户标识,获取用户在第一预设时长中的至少一个历史搜索行为信息对应的第二搜索特征向量;所述历史搜索行为信息包括历史搜索信息、所述历史搜索信息对应的搜索结果以及所述用户对所述搜索结果的行为信息。
其中,历史搜索行为信息可以包括历史搜索信息、历史搜索信息对应的搜索结果以及用户对搜索结果的行为信息。用户对搜索结果的行为信息可以包括用户的点击操作或者用户的未点击操作。
在具体实践中,服务器可以将获取的至少一个历史搜索行为信息进行预处理,以得到待处理数据,以根据待处理数据,获取对应的第二搜索特征向量。具体地,预处理方式可以为数据清洗,以剔除空值与异常值。
示例性地,服务器可以根据用户标识,获取用户在第一预设时长中的至少一个历史搜索行为信息,以根据至少一个历史搜索行为信息,获取对应的第二搜索特征向量。具体地,第一预设时长的大小可以基于实际情况进行设置,本发明在此不作限定。
步骤208,根据所述第一搜索特征向量和所述第二搜索特征向量,确定针对所述搜索信息的搜索结果列表;所述搜索结果列表包括多个搜索结果,多个搜索结果中排序优先级最高的为所述目标搜索结果。
其中,第一搜索特征向量为针对内容搜索请求中的搜索信息的特征向量。第二搜索特征向量为针对用户在第一预设时长中的至少一个历史搜索行为信息的特征向量。搜索结果列表可以包括多个搜索结果,其中,目标搜索结果为多个搜索结果中排序优先级最高的搜索结果。具体地,搜索结果列表中的多个搜索结果可以按照一定的排列顺序进行排序。
在具体实践中,可以根据第一搜索特征向量,确定初步的搜索结果列表;以根据初步的搜索结果列表和第二搜索特征向量,确定针对搜索信息的搜索结果列表。
示例性地,服务器可以根据第一搜索特征向量和第二搜索特征向量,确定针对搜索信息的搜索结果列表。
上述信息获取方法中,接收包括用户标识和搜索信息的内容搜索请求,根据搜索信息,获取搜索信息对应的第一搜索特征向量;根据用户标识,获取用户在第一预设时长中的至少一个历史搜索行为信息对应的第二搜索特征向量;根据第一搜索特征向量和第二搜索特征向量,确定针对搜索信息的搜索结果列表,相对于传统技术中采用传统关键字,以得到对应的搜索结果列表的方式,本方法中通过搜索信息与历史搜索行为数据共同确定了搜索结果列表,实现了对搜索结果列表中的搜索结果进行优化,提高了搜索效率,在提高了搜索效率的同时,提高了搜索的准确性。
在一个实施例中,步骤206,包括:
步骤2062,根据所述用户标识,获取用户在第一预设时长中的至少一个历史搜索行为信息。
步骤2064,根据每个历史搜索行为信息,获取每个历史搜索行为信息对应的历史特征向量。
其中,历史搜索行为信息可以包括历史搜索信息、历史搜索信息对应的多个搜索结果以及用户对多个搜索结果的行为信息。行为信息可以包括用户进行点击操作或未点击操作。
示例性地,服务器可以根据用户标识,获取用户在第一预设时长中的至少一个历史搜索行为信息,以根据每个历史搜索行为信息,获取每个历史搜索行为信息对应历史特征向量。具体地,可以将每一个历史搜索行为信息进行数据清洗,以得到清洗后的历史搜索行为信息,将清洗后的历史搜索行为信息进行特征化处理,得到每个历史搜索行为信息对应的历史特征向量。
步骤2066,将每个历史特征向量进行向量拼接处理,得到所述第二搜索特征向量。
其中,向量拼接操作可以为按行拼接操作或者按列拼接操作。具体采用按行拼接操作还是按列拼接操作,可以基于实际情况进行设置,本发明在此不作限定。
示例性地,服务器可以为将每个历史特征向量进行向量拼接处理,得到第二搜索特征向量。具体地,可以将每个特征向量进行按行拼接操作或者按列拼接操作,以得到第二搜索特征向量。
在上述实施例中,通过对在第一预设时长内的每个历史特征向量进行向量拼接操作,实现了将每个历史特征向量的一个整合,使得第二搜索特征向量具体更全面、更丰富的特征,从而实现了根据第一搜索特征向量和第二搜索特征向量,确定搜索结果列表,实现了对搜索结果列表中的搜索结果进行优化,提高了搜索效率,在提高了搜索效率的同时,提高了搜索的准确性。
在一个实施例中,步骤208,包括:
步骤2082,将所述第一搜索特征向量输入至训练后的第一搜索预测模型,得到针对所述搜索信息的初步搜索结果列表。
其中,初步搜索结果列表包括多个搜索结果。
在具体实践中,第一搜索预测模型可以为一个排序模型,可以采用通过比较两两之间的先后顺序进行排序的模型,也可以为优化搜索列表进行排序的模型。具体地,第一搜索预测模型可以包括但不限于pairwise的模型、listwise的模型等。
在具体实践中,若在银行业务中的手机银行APP中进行搜索,因为手机银行APP中的搜索需求会相对较小,那么第一搜索预测模型可以为分类模型,来识别输入的搜索信息属于哪一个类型的可能性。
在一些实施例中,第一搜索预测模型的训练方式可以基于实际情况进行训练,本发明在此不作限定。
在一个实施例中,所述将所述第一搜索特征向量输入至训练后的第一搜索预测模型,得到针对所述搜索信息的初步搜索结果列表,包括:将所述第一搜索特征向量输入至训练后的第一搜索预测模型,得到多个搜索结果以及每个搜索结果的概率值;根据每个搜索结果的概率值,获取第一数量的搜索结果;所述第一数量的搜索结果是依据每个搜索结果的概率值进行从大至小的排序得到;根据所述第一数量的搜索结果,生成针对所述搜索信息的初步搜索结果列表。
其中,训练后的第一搜索预测模型是通过深度学习训练得到,用于进行针对搜索信息的预测,以得到多个搜索结果和每个搜索结果对应的概率值。概率值的范围为0-1之间的数值。
第一数量的搜索结果是依据每个搜索结果的概率值进行从大至小的排序得到。具体地,第一数量的大小可以基于实际情况进行设定,本发明在此不作限定。
示例性地,服务器将第一搜索特征向量输入至训练后的第一搜索预测模型,得到多个搜索结果以及每个搜索结果的概率值;根据每个搜索结果的概率值,获取第一数量的搜索结果;根据第一数量的搜索结果,生成针对搜索信息的初步搜索结果列表。具体地,初步搜索结果列表中搜索结果的排列顺序是基于每个搜索结果的概率值得到的。
在上述实施例中,通过训练后的第一搜索预测模型,进行预测,得到多个搜索结果以及搜索结果对应的概率值,以实现对搜索结果的初步筛选,根据初步筛选结果,得到初步搜索结果列表,从而根据第二搜索特征向量实现了对初步搜索结果的优化,提高了搜索的准确性。
步骤2084,将所述初步搜索结果列表和所述第二搜索特征向量,输入至训练后的第二搜索预测模型,得到针对所述搜索信息的搜索结果列表。
其中,训练后的第二搜索预测模型是通过深度学习训练得到的。第二搜索预测模型可以为一个排序模型。
在具体实践中,第二搜索预测模型可以为一个深度学习模型。
在上述实施例中,通过使用第一搜索预测模型对第一搜索特征向量进行预测,得到初步搜索结果列表,以根据初步搜索结果列表、第二搜索特征向量和训练后的第二搜索预测模型,得到搜索结果列表,实现了对搜索结果列表中的搜索结果进行优化,提高了搜索的准确性。
在一个实施例中,参考图3,示出了第二搜索预测模型的训练的流程示意图,包括:
步骤302,获取历史搜索行为数据集;所述历史搜索行为数据集包括第二预设时长中的所有历史搜索信息、使用训练后的第一搜索预测模型预测得到的搜索结果列表、以及用户对搜索结果列表中搜索结果的行为信息;
其中,历史搜索行为数据集包括第二预设时长中的所有历史搜索信息、使用训练后的第一搜索预测模型预测得到的搜索结果列表、以及用户对搜索结果列表中搜索结果的行为信息。第二预设时长的大小可以大于第一预设时长。具体地,第二预设时长的大小可以基于实际情况进行设定,本发明在此不作限制。
步骤304,根据所述历史搜索行为数据集,构建训练样本集。
步骤306,基于所述训练样本集,对训练前的第二搜索预测模型进行训练,得到训练后的第二资源预测模型。
示例性地,服务器可以根据历史搜索行为数据集,构建训练样本集,以通过训练样本集对训练前的第二搜索预测模型进行训练,得到训练后的第二资源预测模型。具体地,可以将历史搜索行为数据集进行预处理,以根据预处理后的历史搜索行为数据集,构建训练样本集。
在具体实践中,可以设定一个训练次数阈值。服务器可以根据训练此时是否满足训练次数阈值,来确定第二搜索预测模型是否训练完成。
在一些实施例中,服务器可以采用训练样本集中的一部分数据作为训练数据,另一部分数据作为测试数据,通过训练数据对训练前的第二资源预测模型进行训练,通过测试数据对训练前的第二资源预测模型进行测试。
在上述实施例中,通过历史搜索行为数据集对第二搜索预测模型进行训练,使得第二搜索预测模型更适用于真实情况下对搜索结果列表的预测,提高了搜索的准确性。
在一个实施例中,步骤304,包括:
步骤3042,对所述历史搜索行为数据集进行数据清洗,以得到清洗后的历史搜索行为数据集。
步骤3044,根据清洗后的历史搜索行为数据集中的历史搜索信息,获取针对每个历史搜索信息的第三搜索特征向量。
示例性地,服务器可以对历史搜索行为数据集进行数据清洗,以得到清洗后的历史搜索行为数据集,从而获取针对每个历史搜索信息的第三搜索特征向量。具体地,可以对清洗后的历史搜索行为数据集中的每个历史搜索信息,进行特征化处理,得到针对每个历史搜索信息的第三搜索特征向量。
步骤3046,根据用户对搜索结果列表中搜索结果的行为信息,对使用训练后的第一搜索预测模型预测得到的搜索结果列表进行重新排序。
步骤3048,根据每个第三搜索特征向量和对应的重新排序后的搜索结果列表,构成所述训练样本集。
其中,训练样本集可以包括多组训练样本,每一组训练样本对应一个第三搜索特征向量和对应的重新排序后的搜索结果列表。
在上述实施例中,根据历史搜索信息对应的搜索结果列表中搜索结果的行为信息,对搜索结果列表重新排序,以基于每一个搜索信息对应的第三搜索特征向量和重新排序后的搜索结果列表,构成训练样本集,以根据训练样本集,对第二搜索预测模型进行训练,使得训练后的第二搜索预测模型更符合真实情况下的预测,提高了搜索的准确性。
在一些实施例中,服务器可以按照预设周期,获取行为信息,根据行为信息,更新第二搜索预测模型。其中,行为信息为使用训练后的第二搜索预测模型得到的搜索结果列表,以及针对该搜索结果列表的操作信息,以实现每当获取到新的搜索结果列表时,根据对该搜索结果列表的操作信息,对第二搜索预测模型进行更新。
为了更好地理解本发明实施例中信息获取的完整过程,以一完整示例加以说明,参考图4,示出另一个实施例中信息获取方法的流程示意图。
步骤402,获取历史搜索行为数据集,并对历史搜索行为数据集进行数据清洗。
其中,历史搜索行为数据集包括第二预设时长中的所有历史搜索信息、使用训练后的第一搜索预测模型预测得到的搜索结果列表、以及用户对搜索结果列表中搜索结果的行为信息;
步骤404,根据清洗后的历史搜索行为数据集中的历史搜索信息,获取针对每个历史搜索信息的第三搜索特征向量;根据用户对搜索结果列表中搜索结果的行为信息,对使用训练后的第一搜索预测模型预测得到的搜索结果列表进行重新排序;根据每个第三搜索特征向量和对应的重新排序后的搜索结果列表,构成训练样本集。
步骤406,基于训练样本集,对训练前的第二搜索预测模型进行训练,得到训练后的第二资源预测模型。
步骤408,接收用户的内容搜索请求,内容搜索请求包括用户标识和搜索信息。
步骤410,根据搜索信息,获取搜索信息对应的第一搜索特征向量。
步骤412,根据用户标识,获取用户在第一预设时长中的至少一个历史搜索行为信息;根据每个历史搜索行为信息,获取每个历史搜索行为信息对应的历史特征向量;将每个历史特征向量进行向量拼接处理,得到第二搜索特征向量。
步骤414,将第一搜索特征向量输入至训练后的第一搜索预测模型,得到针对搜索信息的初步搜索结果列表。
步骤416,将初步搜索结果列表和第二搜索特征向量,输入至训练后的第二搜索预测模型,得到针对搜索信息的搜索结果列表。
本实施例中,接收包括用户标识和搜索信息的内容搜索请求,根据搜索信息,获取搜索信息对应的第一搜索特征向量;根据用户标识,获取用户在第一预设时长中的至少一个历史搜索行为信息对应的第二搜索特征向量;根据第一搜索特征向量和第二搜索特征向量,确定针对搜索信息的搜索结果列表,相对于传统技术中采用传统关键字,以得到对应的搜索结果列表的方式,本方法中通过搜索信息与历史搜索行为数据共同确定了搜索结果列表,实现了对搜索结果列表中的搜索结果进行优化,提高了搜索效率,并且,在提高了搜索效率的同时,提高了搜索的准确性。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的信息获取方法的信息获取装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个信息获取装置实施例中的具体限定可以参见上文中对于信息获取方法的限定,在此不再赘述。
在一个实施例中,如图5所示,提供了一种信息获取装置,包括:内容搜索请求获取模块502、第一搜索特征向量获取模块504、第二搜索特征向量获取模块506和搜索结果列表确定模块508,其中:
内容搜索请求获取模块502,用于接收用户的内容搜索请求,所述内容搜索请求包括用户标识和搜索信息;
第一搜索特征向量获取模块504,用于根据所述搜索信息,获取所述搜索信息对应的第一搜索特征向量;
第二搜索特征向量获取模块506,用于根据所述用户标识,获取用户在第一预设时长中的至少一个历史搜索行为信息对应的第二搜索特征向量;所述历史搜索行为信息包括历史搜索信息、所述历史搜索信息对应的搜索结果以及所述用户对所述搜索结果的行为信息;
搜索结果列表确定模块508,用于根据所述第一搜索特征向量和所述第二搜索特征向量,确定针对所述搜索信息的搜索结果列表;所述搜索结果列表包括多个搜索结果,多个搜索结果中排序优先级最高的为所述目标搜索结果。
在一些实施例中,第二搜索特征向量获取模块506,包括:
历史搜索行为信息获取子模块,用于根据所述用户标识,获取用户在第一预设时长中的至少一个历史搜索行为信息;
历史特征向量获取子模块,用于根据每个历史搜索行为信息,获取每个历史搜索行为信息对应的历史特征向量;
第二搜索特征向量得到模块,用于将每个历史特征向量进行向量拼接处理,得到所述第二搜索特征向量。
在一些实施例中,搜索结果列表确定模块508,包括
初步搜索结果列表得到子模块,用于将所述第一搜索特征向量输入至训练后的第一搜索预测模型,得到针对所述搜索信息的初步搜索结果列表;
搜索结果列表得到子模块,用于将所述初步搜索结果列表和所述第二搜索特征向量,输入至训练后的第二搜索预测模型,得到针对所述搜索信息的搜索结果列表。
在一些实施例中,初步搜索结果列表得到子模块,包括:
搜索结果和概率值得到单元,用于将所述第一搜索特征向量输入至训练后的第一搜索预测模型,得到多个搜索结果以及每个搜索结果的概率值;
搜索结果获取单元,用于根据每个搜索结果的概率值,获取第一数量的搜索结果;所述第一数量的搜索结果是依据每个搜索结果的概率值进行从大至小的排序得到;
初步搜索结果列表生成单元,用于根据所述第一数量的搜索结果,生成针对所述搜索信息的初步搜索结果列表。
在一些实施例中,信息获取装置,包括:
搜索行为数据集获取模块,用于获取历史搜索行为数据集;所述历史搜索行为数据集包括第二预设时长中所有的历史搜索信息、使用训练后的第一搜索预测模型预测得到的搜索结果列表、以及用户对搜索结果列表中搜索结果的行为信息;
训练样本集构建模块,用于根据所述历史搜索行为数据集,构建训练样本集;
第二资源预测模型得到模块,用于基于所述训练样本集,对训练前的第二搜索预测模型进行训练,得到训练后的第二资源预测模型。
在一些实施例中,训练样本集构建模块,包括:
数据集清洗子模块,用于对所述历史搜索行为数据集进行数据清洗,以得到清洗后的历史搜索行为数据集;
第三搜索特征向量获取子模块,用于根据清洗后的历史搜索行为数据集中的历史搜索信息,获取针对每个历史搜索信息的第三搜索特征向量;
重新排序子模块,用于根据用户对搜索结果列表中搜索结果的行为信息,对使用训练后的第一搜索预测模型预测得到的搜索结果列表进行重新排序;
训练样本集构建子模块,用于根据每个第三搜索特征向量和对应的重新排序后的搜索结果列表,构成所述训练样本集。
上述信息获取装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储历史搜索信息、历史搜索信息对应的搜索结果以及对应的行为信息。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种信息获取方法。
该计算机设备的显示单元用于形成视觉可见的画面,可以是显示屏、投影装置或虚拟现实成像装置。显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
接收用户的内容搜索请求,所述内容搜索请求包括用户标识和搜索信息;
根据所述搜索信息,获取所述搜索信息对应的第一搜索特征向量;
根据所述用户标识,获取用户在第一预设时长中的至少一个历史搜索行为信息对应的第二搜索特征向量;所述历史搜索行为信息包括历史搜索信息、所述历史搜索信息对应的搜索结果以及所述用户对所述搜索结果的行为信息;
根据所述第一搜索特征向量和所述第二搜索特征向量,确定针对所述搜索信息的搜索结果列表;所述搜索结果列表包括多个搜索结果,多个搜索结果中排序优先级最高的为所述目标搜索结果。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
接收用户的内容搜索请求,所述内容搜索请求包括用户标识和搜索信息;
根据所述搜索信息,获取所述搜索信息对应的第一搜索特征向量;
根据所述用户标识,获取用户在第一预设时长中的至少一个历史搜索行为信息对应的第二搜索特征向量;所述历史搜索行为信息包括历史搜索信息、所述历史搜索信息对应的搜索结果以及所述用户对所述搜索结果的行为信息;
根据所述第一搜索特征向量和所述第二搜索特征向量,确定针对所述搜索信息的搜索结果列表;所述搜索结果列表包括多个搜索结果,多个搜索结果中排序优先级最高的为所述目标搜索结果。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
接收用户的内容搜索请求,所述内容搜索请求包括用户标识和搜索信息;
根据所述搜索信息,获取所述搜索信息对应的第一搜索特征向量;
根据所述用户标识,获取用户在第一预设时长中的至少一个历史搜索行为信息对应的第二搜索特征向量;所述历史搜索行为信息包括历史搜索信息、所述历史搜索信息对应的搜索结果以及所述用户对所述搜索结果的行为信息;
根据所述第一搜索特征向量和所述第二搜索特征向量,确定针对所述搜索信息的搜索结果列表;所述搜索结果列表包括多个搜索结果,多个搜索结果中排序优先级最高的为所述目标搜索结果。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (10)
1.一种信息获取方法,其特征在于,所述方法包括:
接收用户的内容搜索请求,所述内容搜索请求包括用户标识和搜索信息;
根据所述搜索信息,获取所述搜索信息对应的第一搜索特征向量;
根据所述用户标识,获取用户在第一预设时长中的至少一个历史搜索行为信息对应的第二搜索特征向量;所述历史搜索行为信息包括历史搜索信息、所述历史搜索信息对应的搜索结果以及所述用户对所述搜索结果的行为信息;
根据所述第一搜索特征向量和所述第二搜索特征向量,确定针对所述搜索信息的搜索结果列表;所述搜索结果列表包括多个搜索结果,多个搜索结果中排序优先级最高的为所述目标搜索结果。
2.根据权利要求1所述的方法,其特征在于,所述根据所述用户标识,获取用户在第一预设时长中的至少一个历史搜索行为信息对应的第二搜索特征向量,包括:
根据所述用户标识,获取用户在第一预设时长中的至少一个历史搜索行为信息;
根据每个历史搜索行为信息,获取每个历史搜索行为信息对应的历史特征向量;
将每个历史特征向量进行向量拼接处理,得到所述第二搜索特征向量。
3.根据权利要求1所述的方法,其特征在于,所述根据所述第一搜索特征向量和所述第二搜索特征向量,确定针对所述搜索信息的搜索结果列表,包括:
将所述第一搜索特征向量输入至训练后的第一搜索预测模型,得到针对所述搜索信息的初步搜索结果列表;
将所述初步搜索结果列表和所述第二搜索特征向量,输入至训练后的第二搜索预测模型,得到针对所述搜索信息的搜索结果列表。
4.根据权利要求3所述的方法,其特征在于,所述将所述第一搜索特征向量输入至训练后的第一搜索预测模型,得到针对所述搜索信息的初步搜索结果列表,包括:
将所述第一搜索特征向量输入至训练后的第一搜索预测模型,得到多个搜索结果以及每个搜索结果的概率值;
根据每个搜索结果的概率值,获取第一数量的搜索结果;所述第一数量的搜索结果是依据每个搜索结果的概率值进行从大至小的排序得到;
根据所述第一数量的搜索结果,生成针对所述搜索信息的初步搜索结果列表。
5.根据权利要求3所述的方法,其特征在于,第二搜索预测模型的训练过程,包括:
获取历史搜索行为数据集;所述历史搜索行为数据集包括第二预设时长中的所有历史搜索信息、使用训练后的第一搜索预测模型预测得到的搜索结果列表、以及用户对搜索结果列表中搜索结果的行为信息;
根据所述历史搜索行为数据集,构建训练样本集;
基于所述训练样本集,对训练前的第二搜索预测模型进行训练,得到训练后的第二资源预测模型。
6.根据权利要求5所述的方法,其特征在于,所述根据所述历史搜索行为数据集,构建训练样本集,包括:
对所述历史搜索行为数据集进行数据清洗,以得到清洗后的历史搜索行为数据集;
根据清洗后的历史搜索行为数据集中的历史搜索信息,获取针对每个历史搜索信息的第三搜索特征向量;
根据用户对搜索结果列表中搜索结果的行为信息,对使用训练后的第一搜索预测模型预测得到的搜索结果列表进行重新排序;
根据每个第三搜索特征向量和对应的重新排序后的搜索结果列表,构成所述训练样本集。
7.一种信息获取装置,其特征在于,所述装置包括:
内容搜索请求获取模块,用于接收用户的内容搜索请求,所述内容搜索请求包括用户标识和搜索信息;
第一搜索特征向量获取模块,用于根据所述搜索信息,获取所述搜索信息对应的第一搜索特征向量;
第二搜索特征向量获取模块,用于根据所述用户标识,获取用户在第一预设时长中的至少一个历史搜索行为信息对应的第二搜索特征向量;所述历史搜索行为信息包括历史搜索信息、所述历史搜索信息对应的搜索结果以及所述用户对所述搜索结果的行为信息;
搜索结果列表确定模块,用于根据所述第一搜索特征向量和所述第二搜索特征向量,确定针对所述搜索信息的搜索结果列表;所述搜索结果列表包括多个搜索结果,多个搜索结果中排序优先级最高的为所述目标搜索结果。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311147941.3A CN117407418A (zh) | 2023-09-06 | 2023-09-06 | 信息获取方法、装置、计算机设备、存储介质和程序产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311147941.3A CN117407418A (zh) | 2023-09-06 | 2023-09-06 | 信息获取方法、装置、计算机设备、存储介质和程序产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117407418A true CN117407418A (zh) | 2024-01-16 |
Family
ID=89493300
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311147941.3A Pending CN117407418A (zh) | 2023-09-06 | 2023-09-06 | 信息获取方法、装置、计算机设备、存储介质和程序产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117407418A (zh) |
-
2023
- 2023-09-06 CN CN202311147941.3A patent/CN117407418A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11782991B2 (en) | Accelerated large-scale similarity calculation | |
CN115758271A (zh) | 数据处理方法、装置、计算机设备和存储介质 | |
CN117407418A (zh) | 信息获取方法、装置、计算机设备、存储介质和程序产品 | |
CN114490996B (zh) | 意图识别方法、装置、计算机设备和存储介质 | |
CN116861071A (zh) | 资讯推送方法、装置、计算机设备、存储介质和程序产品 | |
CN116881122A (zh) | 测试案例生成方法、装置、设备、存储介质和程序产品 | |
CN115659022A (zh) | 资源推送数据处理方法、装置、计算机设备和存储介质 | |
CN116910604A (zh) | 用户分类方法、装置、计算机设备、存储介质和程序产品 | |
CN118069044A (zh) | 芯片数据存储方法、装置、设备、介质和产品 | |
CN118113642A (zh) | 芯片运算方法、装置、计算机设备和存储介质 | |
CN117314036A (zh) | 工单分配方法、装置、设备、存储介质和程序产品 | |
CN117033625A (zh) | 网关日志分类方法、装置、设备、介质和产品 | |
CN115630973A (zh) | 用户数据处理方法、装置、计算机设备和存储介质 | |
CN116866419A (zh) | 信息推送方法、装置、计算机设备和存储介质 | |
CN117407504A (zh) | 运维处理方法、装置、设备、存储介质和程序产品 | |
CN118229251A (zh) | 邮件检索展示方法、装置、计算机设备和存储介质 | |
CN117112724A (zh) | 搜索推送方法、装置、设备、存储介质和计算机程序产品 | |
CN117216164A (zh) | 金融数据同步处理方法、装置、设备、介质和程序产品 | |
CN115689477A (zh) | 业务方案生成方法、装置、计算机设备和存储介质 | |
CN118035423A (zh) | 信息查询方法、装置、计算机设备和存储介质 | |
CN117390258A (zh) | 金融业务推荐方法、装置、计算机设备和存储介质 | |
CN117036041A (zh) | 业务信息推送方法、装置、计算机设备和存储介质 | |
CN117390098A (zh) | 数据分析方法、装置、计算机设备和存储介质 | |
CN117634751A (zh) | 数据要素评估方法、装置、计算机设备以及存储介质 | |
CN117350801A (zh) | 虚拟产品推荐方法、装置、计算机设备、存储介质和产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |