CN111984689A - 信息检索的方法、装置、设备以及存储介质 - Google Patents
信息检索的方法、装置、设备以及存储介质 Download PDFInfo
- Publication number
- CN111984689A CN111984689A CN202010851832.XA CN202010851832A CN111984689A CN 111984689 A CN111984689 A CN 111984689A CN 202010851832 A CN202010851832 A CN 202010851832A CN 111984689 A CN111984689 A CN 111984689A
- Authority
- CN
- China
- Prior art keywords
- retrieval
- target
- determining
- candidate
- target user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
- G06F16/24578—Query processing with adaptation to user needs using ranking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
- G06F16/2246—Trees, e.g. B+trees
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了信息检索的方法、装置、设备以及存储介质,涉及智能检索、智能推荐、深度学习等领域。具体实现方案为:确定目标用户的特征信息;获取检索网络的候选检索路径;利用匹配模型确定所述目标用户的特征信息和所述候选检索路径的匹配程度,根据所述匹配程度在所述候选检索路径中确定出目标检索路径;利用所述目标检索路径确定与所述目标用户匹配的目标检索结果。目标检索结果可以作为个性化推荐内容推荐给目标用户,由于数据库中的所有推荐内容均可以通过检索路径检索到,由此保证了推荐结果的泛化。另一方面,通过对候选检索路径的筛选,可以提高推荐速度。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及智能检索、智能推荐、深度学习等领域。
背景技术
在线个性化推荐系统的能够根据目标用户的喜好推荐个性化内容,需要在约500毫秒内从百万量级的内容库中召回十条左右内容显示给目标用户。
相关技术依赖于目标用户的历史记录在数据库中确定检索内容,存在精度以及泛化能力不足的缺陷。
发明内容
本申请提供了一种信息检索的方法、装置、设备以及存储介质。
根据本申请的一方面,提供了一种信息检索的方法,包括:
确定目标用户的特征信息;
获取至少一条候选检索路径,候选检索路径用于在数据库中确定出候选检索结果;
利用匹配模型确定目标用户的特征信息和候选检索路径的匹配程度,根据匹配程度在候选检索路径中确定出目标检索路径;
利用目标检索路径确定与目标用户匹配的目标检索结果。
根据本申请的另一方面,提供了一种信息检索的装置,包括:
目标用户特征信息确定模块,用于确定目标用户的特征信息;
候选检索路径获取模块,用于获取至少一条候选检索路径,候选检索路径用于在数据库中确定出候选检索结果;
目标检索路径确定模块,用于利用匹配模型确定目标用户的特征信息和候选检索路径的匹配程度,根据匹配程度在候选检索路径中确定出目标检索路径;
目标检索结果确定模块,用于利用目标检索路径确定与目标用户匹配的目标检索结果。
第三方面,本申请实施例提供一种电子设备,包括:
至少一个处理器;以及
与至少一个处理器通信连接的存储器;其中,
存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行本申请任意一项实施例所提供的方法。
第四方面,本申请实施例提供一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行本申请任意一项实施例所提供的方法。
根据本申请的技术利用检索网络规划出得到目标检索结果的多条候选路径。再利用匹配模型对多条候选检索路径进行分析评判,最终利用筛选出的目标检索路径得到与目标用户相关度最高的目标检索结果。由于采用了检索网络和匹配模型,可以对候选检索路径进行筛选,兼顾了检索泛化能力以及检索的准确度。
应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是根据本申请信息检索的方法的流程图;
图2是根据本申请检索网络的示意图;
图3是根据本申请检索网络的示意图;
图4是根据本申请确定目标检索路径的流程图;
图5是根据本申请确定目标检索结果的流程图;
图6是根据本申请匹配模型的示意图;
图7是根据本申请对匹配模型进行训练更新的流程图;
图8是根据本申请对正负样本进行上溯的示意图;
图9是根据本申请构建检索网络的流程图;
图10是可以实现本申请实施例的信息检索的方法的场景图;
图11是根据本申请信息检索的装置的示意图;
图12是用来实现本申请实施例的信息检索的方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
如图1所示,本申请提供一种信息检索的方法,可以包括以下步骤:
S101:确定目标用户的特征信息;
S102:获取至少一条候选检索路径,候选检索路径用于在数据库中确定出候选检索结果;
S103:利用匹配模型确定目标用户的特征信息和候选检索路径的匹配程度,根据匹配程度在候选检索路径中确定出目标检索路径;
S104:利用目标检索路径确定出与目标用户匹配的目标检索结果。
上述方法可以通过智能设备的应用程序实现,例如在目标用户登录应用程序后,可以根据目标用户的特征在数据库进行自动检索,确定出用户感兴趣的内容作为目标检索结果,显示给目标用户。
目标用户的特征信息可以包括目标用户的年龄、性别以及通过目标用户的浏览日志提取的浏览习惯等。例如,目标用户A的特征信息可以包括:25岁的男性,经常浏览体育类视频和电影资讯类图文信息。目标用户B的特征信息包括:40岁的男性,每天浏览财经新闻。
上述体育类视频、电影资讯类图文信息和财经新闻等可以存储在数据库中。多条候选检索路径可以组成检索网络。即,检索网络可以包括多条候选检索路径,每条候选检索路径最终可以检索到至少一项候选检索结果。检索网络可以在数据库中进行检索,从而保证检索覆盖率达到100%。
检索网络可以包括至少一个树形检索结构。树形检索结构的每一个分支即可以对应一个候选检索路径。检索网络中各候选检索路径的根节点、子节点和叶子节点可以是不同抽象程度的多级检索结果。例如,根节点可以是体育赛事、子节点可以是足球、叶子节点可以是中国足球联赛。
另外,检索网络也可以独立个体,例如体育赛事、中国足球联赛等。
以检索网络为树形检索结构为例,匹配模型可以对树形检索结构中的节点进行分析,得到节点与目标用户的匹配分数。根据该匹配分数将节点进行排序,可根据在候选检索路径中确定出目标检索路径,根据目标检索路径即可确定出与目标用户匹配的目标检索结果。
结合图2所示实例,该示例中包括4个层级,匹配模型对子节点的第一层级进行打分。在得出足球节点的匹配分数最高的情况下,确定足球节点为候选检索路径,忽略其他检索路径。进而,匹配模型对足球节点的后续第二层级子节点进行打分,以此类推,最终确定出成年国家队和俱乐部队两个叶子节点,作为目标检索结果。
匹配模型可以基于目标用户对不同目标检索结果的操作历史训练得到的。例如,可以以目标用户点击的目标检索结果作为正样本。目标用户未点击的目标检索结果,以及未向目标用户显示的其他检索结果作为负样本。以目标用户对目标检索结果的查看时间或查看比例作为标签,对匹配模型进行训练。
通过上述方案,利用检索网络规划出得到目标检索结果的多条候选路径。再利用匹配模型对多条候选检索路径进行分析评判,最终利用筛选出目标检索路径,利用该目标检索路径得到与目标用户的喜好较为匹配的目标检索结果。由于采用了检索网络和匹配模型,可以对候选检索路径进行筛选,兼顾了检索泛化能力以及检索的准确度。
在一种实施方式中,候选检索路径组成至少一个树形检索结构,每个树形检索结构中包括多个节点;
每个候选检索路径包括从树形检索结构中的根节点到叶子节点的路径。
结合图2所示,检索网络可以是集束检索(Beam search)网络,在当前实施方式中,以体育作为集束检索网络中抽象程度最高的根节点。足球、篮球、电子竞技等作为抽象程度次高的子节点,以此类推。即,根节点、子节点和叶子节点可以分别对应不同抽象程度的检索结果。
实际场景下,不同抽象程度的节点(根节点、子节点和叶子节点)可以以特征嵌入(embedding)形式进行表示。
图2所示示例中是以体育赛事、娱乐等作为根节点。实际场景中并不限于此。在实际场景中,可以按照检索结果的类型构建集束检索网络。例如,候选检索网络可以包括多个,如图文类检索结果、视频类检索结果和短视频类检索结果等。其中,短视频类检索结果可以包括网民利用手机等设备自制的短视频和/或图形交换格式(GIF)的短视频等。
结合图3所示,图3是以图文类检索结果为例。图文类检索结果可以作为根节点。在该根节点下,第一层子节点可以包括体育赛事和娱乐新闻等。在第一层子节点下,还包括第二层子节点、第三层子节点等,直至叶子节点。图3中仅以体育赛事和娱乐新闻为示例进行说明,实际场景中并不限于此。
通过上述方案,检索网络可以得到多级检索结果,一方面兼顾在数据库进行检索的数量,另一方面利用抽象程度建立不同层级,可以提高检索速度。
结合图4所示,在一种实施方式中,步骤S103可以包括:
S1031:将目标用户的特征信息分别与至少一个树形检索结构的节点构成特征对;
S1032:将特征对分别输入匹配模型,得到各个特征对的匹配分数,筛选出匹配分数最高的至少一个特征对中的节点;
S1033:在筛选出的节点是叶子节点的情况下,根据匹配分数确定从根节点到节点的目标检索路径。
结合图3所示的候选检索结果示意图,例如包括图文类检索结果、视频类检索结果、短视频类检索结果共三个根节点。可以利用匹配模型确定三个根节点与目标用户的匹配分数。根据匹配分数的排序,可以筛选出分数排序最高的N个根节点,此处N为正整数,例如可以为1或2。
假设在N为1,且得分最高的根节点为图文类检索结果的情况下,检索网络被配置为仅对根节点为图文类检索结果所对应的子节点进行继续检索。基于此,可以实现检索内容的精简。
同理,利用匹配模型确定根节点为图文类检索结果的各子节点与目标用户的匹配分数。可以筛选出分数最高的M个子节点。此处M的取值可以根据实际情况确定,例如M可以和N的取值相同。在图3所示的实施例中,子节点包括三个层级,首先确定第一层级的各子节点的匹配分数。例如,筛选出分数最高的1个第一层级子节点为体育赛事,则仅对体育赛事下的第二层级子节点进行后续检索。
在图3中,最终得到的是国家队和俱乐部队等叶子节点。可以直接将叶子节点作为目标检索结果。
在一种实施方式中,子节点可以设置为三个层级。在此情况下,树形检索结构包括根节点以及叶子节点,共五个层级。通过对不同层级的检索结果的筛选,可以降低检索数量,相比于数据库十万级的检索数量,利用上述方案可以将检索数量下降至千级。
即,通过上述方案,在筛选出的节点不是叶子节点的情况下,将目标用户的特征信息分别与各个节点的子节点构成特征对,利用特征对重复执行输入匹配模型的步骤;在筛选出的节点是叶子节点的情况下,确定从根节点到节点的目标检索路径。通过上述方案,利用匹配模型对候选检索路径的节点进行打分,从而筛选出目标检索路径。基于此可以实现对于候选检索结果的筛选,降低检索数量级。
如图5所示,在一种实施方式中,步骤S104可以包括:
S1041:根据目标检索路径确定出至少一个候选检索结果;
S1042:利用匹配模型确定至少一个候选检索结果中每个候选检索结果与目标用户的匹配分数;
S1043:根据匹配分数从候选检索结果中确定目标检索结果。
利用目标检索路径得到叶子节点对应的至少一个候选检索结果后,还可以进一步利用匹配模型确定各叶子节点与目标用户的匹配分数,从而筛选出分数最高的S个叶子节点。将S个叶子节点所对应的检索结果确定为目标检索结果。
此处S的取值可以根据实际情况确定,例如S可以和N相同。S、N和M均取正整数。
通过上述方案,可以在得到多个候选检索结果的情况下,进一步筛选与目标用户最匹配的检索结果。
在一种实施方式中,匹配模型可以包括第一子模型、第二子模型和第三子模型;
第一子模型被配置为:确定节点所对应的特征信息;
第二子模型被配置为:根据节点所对应的特征信息和目标用户的特征信息,生成目标用户对节点的兴趣度的预测值;
第三子模型被配置为:根据兴趣度的预测值得到匹配程度。
结合图6所示,第一子模型接收候选检索路径的节点,确定出节点的特征信息,将节点的特征信息和目标用户的特征信息发送至第二子模型。
第二子模型可以包括特征融合子模型、第一兴趣度子模型和第二兴趣度子模型。其中特征融合子模型用于将节点的特征信息、目标用户的特征进行融合计算。例如,可以采用特征信息求和或特征信息求哈达玛积(Hadamard Product)等方式进行融合计算,得到融合计算结果。
将进行融合后的特征信息分别输入第一兴趣度子模型和第二兴趣度子模型。第一兴趣度子模型和第二兴趣度子模型可以是卷积神经网络模型或深度神经网络模型等。融合后的特征信息可以包括融合计算结果、节点的特征信息和目标用户的特征信息。
其中,第一兴趣度子模型可以是用于计算点击率的模型,其输出结果为第一兴趣度的预测值。第二兴趣度模型可以是用于计算查看时长的模型,其输出结果为第二兴趣度的预测值。即,本实施例中,通过点击率和查看时长表征兴趣度。
另外,还可以对兴趣度子模型进行扩展,例如,还可以包括第三兴趣度子模型,第三兴趣度模型可以是用于计算查看比例的模型。例如一部影片时长90分钟,在观看45分钟的情况下,查看比例可以是1/2。或者,一份文档为9页,在查看3页的情况下,查看比例可以是1/3。
第三子模型将第一兴趣度的预测值和第二兴趣度的预测值进行归一化计算,即可得到节点的分数。该分数即可表示该节点与目标用户的匹配程度。
在对匹配模型进行训练时,可以采用目标用户的特征信息样本和各节点的特征信息样本,以及点击率标签和查看时长标签对匹配模型进行训练。从而使得训练好的匹配模型可以实现打分功能。
通过上述方案,基于点击率和查看时长等训练出的匹配模型可以得到更为客观的分数。
在一种实施方式中,兴趣度包括:点击率、查看时长、查看比例中的至少一种。由此可以得到更丰富的兴趣度指标。
如图7所示,在一种实施方式中,还可以包括以下步骤:
S701:根据目标用户对目标检索结果的兴趣度确定正样本和负样本,正样本包括目标用户点击查看的检索结果,负样本包括已进行显示且目标用户未点击查看的检索结果,以及随机获取的未显示的其他检索结果;
S702:利用候选检索路径确定正样本和负样本所对应的各级节点;
S703:根据正样本、负样本、正样本所对应的各级节点、以及负样本所对应的各级节点对匹配模型进行训练更新。
目标检索结果可以作为最终在应用程序界面上展示给用户的内容。目标用户对目标检索结果的兴趣度可以包括是否点击目标检索结果,查看已点击的目标检索结果的时长或比例。
结合图8所示,通过兴趣度可以确定出正样本和负样本。正样本可以包括用户点击查看的目标检索结果(对应图8中的点击正例),负样本可以包括已进行显示且用户未点击查看的目标检索结果(对应图8中的展现未点击负例),以及随机获取的未显示的其他检索结果(对应图8中的随机负例)。
对于正样本和负样本,在检索网络中进行上溯,以得到与正样本和负样本相关的多级候选检索结果。
利用正样本和负样本,以及与正样本和负样本相关的多级候选检索结果对匹配模型进行训练,从而实现匹配模型的不断更新。
对于更新后的匹配模型,可以以小时级别的颗粒度配送至线上检索服务。
通过上述方案,利用检索网络可以得到正、负样本的上溯节点。从而利用正、负样本以及对应的上溯节点对匹配模型进行训练更新,可以实现对于匹配模型的优化。
如图9所示,候选检索路径的构建方式可以包括:
S901:在数据库中,确定所有数据的初始特征信息;数据作为能通过候选检索路径检索到的检索结果;
S902:根据目标用户的特征信息,利用匹配模型,对初始特征信息进行更新,得到更新的特征信息;
S903:对更新的特征信息进行聚类,得到不同抽象程度的检索结果;
S904:利用不同抽象程度的检索结果构建候选检索路径。
数据库中的所有数据可以是实时更新的多媒体文件,例如可以包括图文类文件、视频类文件和短视频类文件等。确定所有数据的初始特征信息,初始特征信息可以是根据多媒体文件内容、文件制作方、文件封面、或文件标签等分析出的特征信息。
将目标用户的特征信息和初始特征信息输入至匹配模型,利用匹配模型,采用将上述两类特征信息相互关联的方式对初始特征信息进行更新,得到更新的特征信息。
对更新的特征信息进行聚类,例如可以采用k均值聚类算法(k-means clusteringalgorithm)对更新的特征信息进行聚类,从而可以得到不同抽象程度的多级数据,多级数据即为前述不同抽象程度的多级检索结果。根据不同抽象程度的多级数据构建树形检索结构,例如可以得到图2或图3所示的树形检索结构。
通过上述方案,可以将每个候选检索结果与目标用户建立关联,并且对候选检索结果进行聚类处理,得到不同抽象程度的多级候选检索结果。从而可以在检索时,有较佳的泛化效果,同时可以兼顾检索速度。
在一种实施方式中,目标检索结果用于推荐给目标用户。
本申请的上述方法可以应用于个性化推荐系统。个性化推荐系统要求在约500毫秒内从百万量级的数据库中召回数千条目标用户喜好的内容,再经过排序和/或策略调整等方式选出十条左右内容推荐给用户。
相关技术利用双塔结构得到推荐内容。基于用户点击的内容进行向量近邻度量检索以筛选出推荐结果。例如,用户点击了A队的足球赛集锦,则个性化推荐系统利用双塔结构在数据库中进行向量近邻度量检索,确定出与A队的足球赛集锦相关度最高的其他视频或图文,推荐给该用户。虽然可以做到信息推荐,但是难以表达用户和内容特征的非线性关系,并且存在过度依赖拟合的情况,使得推荐效果受限。
采用本申请的上述方法进行个性化推荐时,由于用户特征中包括性别、年龄、历史数据等多种因素。其中,历史数据不仅包括用户是否点击了推荐内容,还可以通过对推荐内容的查看时长或查看比例等反应出用户对于所点击的推荐内容的喜好程度。通过将用户特征与各个待推荐的内容一起,联合对匹配模型进行联合学习,使得训练好的匹配模型可以对新出现的待内容进行匹配打分,进而根据打分结果确定推荐内容。另外,由于候选检索路径是以根节点、子节点、叶子节点的形式存在的。因此,利用匹配模型还可以实现对于候选路径的筛选。
在得到目标检索结果,即推荐内容后,可以根据推荐内容的更新时间、观看热度或者再次利用匹配模型进行打分等策略进行排序,筛选出排序在前的若干检索结果推荐给用户。
基于本申请的上述方案,一方面可以在筛选候选检索路径时,做到数量和速度的平衡。即,由于数据库中的所有推荐内容均可以通过检索路径检索到,由此保证了推荐结果的泛化。同时可以基于匹配模型进行对检索路径由根节点、子节点直至叶子节点进行筛选,从而可以过滤匹配性较低的推荐结果。提高推荐速度,满足500毫秒的要求。
更重要的是,由于每一层的节点通过匹配模型和用户特征建立了对应关系。由此可以相对弱化推荐结果和用户历史行为的相关性。即,降低了利用向量近邻度量检索导致的过度依赖用户历史行为进行拟合导致的推荐效果差的风险。通过候选检索路径和匹配模型相配合进行信息推荐,降低对历史相关性的强调转而兼顾用户的个人信息、用户对内容的点击率和用户的兴趣度,从而带来了个性化推荐系统的产品体验和规模指标的显著增长。
如图10所示,本申请提供一种信息检索的方法,包括以下步骤:
根据目标用户的请求,确定目标用户的特征信息。目标用户的请求可以是用户登录APP,或用户的显示刷新指令等。
将目标用户的特征信息输入集束检索(Beam search)模型,得到目标用户的特征信息和各第一级子节点的匹配对(user-node pair)。图10中,叶子节点表示为items/item,非叶子节点表示为node。
匹配模型根据匹配对,对个第一级子节点进行打分(user-node score)。保留分值最高的M个第一级子节点。
集束检索网络对分值最高的M个第一级子节点进行向下检索,得到目标用户的特征信息和M个第一级子节的第二级子节点的匹配对。匹配模型继续对匹配对打分,直至确定出分数最高的S个叶子节点。将分数最高的S个叶子节点作为目标检索结果,向目标用户进行显示。
与此同时,根据目标用户的历史数据确定出目标用户的特征信息样本和目标检索结果样本的匹配对(user-item样本)。将目标用户的特征信息样本和目标检索结果样本的匹配对发送至检索网络,在检索网络中进行上溯以得到与目标检索结果样本相关的多级候选检索结果。基于此,可以确定出目标用户的特征信息样本和多级候选检索结果的匹配对(user-node样本)。利用目标用户的特征信息样本和目标检索结果样本的匹配对,以及目标用户的特征信息样本和多级候选检索结果的匹配对对匹配模型进行训练。
另外,对于数据库中更新的多媒体文件,可以利用匹配模型将多媒体文件和目标用户进行关联学习。关联学习后可以更新多媒体文件的特征信息,对多媒体文件的特征信息进行聚类,可以构建集束检索网络,或者对已有的集束检索网络进行更新。
更新的集束检索网络和匹配模型,可以以小时为间隔进行线上部署。
如图11所示,在一种实施方式中,本申请提供一种信息检索的装置,可以包括以下组件:
目标用户特征信息确定模块1101,用于确定目标用户的特征信息;
候选检索路径获取模块1102,用于获取至少一条候选检索路径,候选检索路径用于在数据库中确定出候选检索结果;
目标检索路径确定模块1103,用于利用匹配模型确定目标用户的特征信息和候选检索路径的匹配程度,根据匹配程度在候选检索路径中确定出目标检索路径;
目标检索结果确定模块1104,用于利用目标检索路径确定与目标用户匹配的目标检索结果。
在一种实施方式中,候选检索路径组成至少一个树形检索结构,每个树形检索结构中包括多个节点;
每个候选检索路径包括从树形检索结构中的根节点到叶子节点的路径。
在一种实施方式中,目标检索路径确定模块1103,包括:
特征对构建子模块,用于将目标用户的特征信息分别与至少一个树形检索结构的节点构成特征对;
节点筛选子模块,用于将特征对分别输入匹配模型,得到各个特征对的匹配分数,筛选出匹配分数最高的至少一个特征对中的节点;
目标检索路径确定执行子模块,用于在筛选出的节点是叶子节点的情况下,根据匹配分数确定从根节点到节点的目标检索路径。
在一种实施方式中,目标检索结果确定模块1104,包括:
候选检索结果确定子模块,用于根据目标检索路径确定出至少一个候选检索结果;
匹配分数确定子模块,用于利用匹配模型确定至少一个候选检索结果中每个候选检索结果与目标用户的匹配分数;
目标检索结果确定执行子模块,用于根据匹配分数从候选检索结果中确定目标检索结果。
在一种实施方式中,匹配模型包括第一子模型、第二子模型和第三子模型;
第一子模型被配置为:确定节点所对应的特征信息;
第二子模型被配置为:根据节点所对应的特征信息和目标用户的特征信息,生成目标用户对节点的兴趣度的预测值;
第三子模型被配置为:根据兴趣度的预测值得到匹配程度。
在一种实施方式中,兴趣度包括:点击率、查看时长、查看比例中的至少一种。
在一种实施方式中,该装置还包括:
样本确定模块,用于根据目标用户对目标检索结果的兴趣度确定正样本和负样本,正样本包括目标用户点击查看的检索结果,负样本包括已进行显示且目标用户未点击查看的检索结果,以及随机获取的未显示的其他检索结果;
样本上溯模块,用于利用候选检索路径确定正样本和负样本所对应的各级节点;
匹配模型更新模块,用于根据正样本、负样本、正样本所对应的各级节点、以及负样本所对应的各级节点对匹配模型进行训练更新。
在一种实施方式中,该装置还包括:
数据初始特征信息确定模块,用于在数据库中,确定所有数据的初始特征信息;数据作为能通过候选检索路径检索到的检索结果;
特征信息更新模块,用于根据目标用户的特征信息,利用匹配模型,对初始特征信息进行更新,得到更新的特征信息;
聚类模块,用于对更新的特征信息进行聚类,得到不同抽象程度的检索结果;
检索网络构建模块,用于利用不同抽象程度的检索结果构建候选检索路径。
在一种实施方式中,目标检索结果用于推荐给目标用户。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图12所示,是根据本申请实施例的信息检索的方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图12所示,该电子设备包括:一个或多个处理器1210、存储器1220,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图12中以一个处理器1210为例。
存储器1220即为本申请所提供的非瞬时计算机可读存储介质。其中,存储器存储有可由至少一个处理器执行的指令,以使至少一个处理器执行本申请所提供的信息检索的方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的信息检索的方法。
存储器1220作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的信息检索的方法对应的程序指令/模块(例如,附图11所示的目标用户特征信息确定模块1101、候选检索路径获取模块1102、目标检索路径确定模块1103和目标检索结果确定模块1104)。处理器1210通过运行存储在存储器1220中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的信息检索的方法。
存储器1220可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据信息检索的方法的电子设备的使用所创建的数据等。此外,存储器1220可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器1220可选包括相对于处理器1210远程设置的存储器,这些远程存储器可以通过网络连接至信息检索的方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
信息检索的方法的电子设备还可以包括:输入装置1230和输出装置1240。处理器1210、存储器1220、输入装置1230和输出装置1240可以通过总线或者其他方式连接,图12中以通过总线连接为例。
输入装置1230可接收输入的数字或字符信息,以及产生与信息检索的方法的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置1240可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
Claims (20)
1.一种信息检索的方法,包括:
确定目标用户的特征信息;
获取至少一条候选检索路径,所述候选检索路径用于在数据库中确定出候选检索结果;
利用匹配模型确定所述目标用户的特征信息和所述候选检索路径的匹配程度,根据所述匹配程度在所述候选检索路径中确定出目标检索路径;
利用所述目标检索路径确定与所述目标用户匹配的目标检索结果,所述目标检索结果用于推荐给所述目标用户。
2.根据权利要求1所述的方法,其中,所述候选检索路径组成至少一个树形检索结构,每个树形检索结构中包括多个节点;
每个候选检索路径包括从所述树形检索结构中的根节点到叶子节点的路径。
3.根据权利要求2所述的方法,其中,所述利用匹配模型确定所述目标用户的特征信息和所述候选检索路径的匹配程度,根据所述匹配程度在所述候选检索路径中确定出目标检索路径,包括:
将所述目标用户的特征信息分别与所述至少一个树形检索结构的节点构成特征对;
将特征对分别输入所述匹配模型,得到各个特征对的匹配分数,筛选出匹配分数最高的至少一个特征对中的节点;
在筛选出的节点是叶子节点的情况下,根据所述匹配分数确定从根节点到所述节点的目标检索路径。
4.根据权利要求3所述的方法,所述利用所述目标检索路径确定与所述目标用户匹配的目标检索结果,包括:
根据所述目标检索路径确定出至少一个候选检索结果;
利用所述匹配模型确定所述至少一个候选检索结果中每个候选检索结果与所述目标用户的匹配分数;
根据所述匹配分数从所述候选检索结果中确定目标检索结果。
5.根据权利要求2或3所述的方法,其中,所述匹配模型包括第一子模型、第二子模型和第三子模型;
所述第一子模型被配置为:确定所述节点所对应的特征信息;
所述第二子模型被配置为:根据所述节点所对应的特征信息和所述目标用户的特征信息,生成所述目标用户对所述节点的兴趣度的预测值;
所述第三子模型被配置为:根据所述兴趣度的预测值得到匹配程度。
6.根据权利要求5所述的方法,其中,所述兴趣度包括:点击率、查看时长、查看比例中的至少一种。
7.根据权利要求2或3所述的方法,还包括:
根据所述目标用户对所述目标检索结果的兴趣度确定正样本和负样本,所述正样本包括所述目标用户点击查看的检索结果,所述负样本包括已进行显示且所述目标用户未点击查看的检索结果,以及随机获取的未显示的其他检索结果;
利用所述候选检索路径确定所述正样本和负样本所对应的各级节点;
根据所述正样本、负样本、正样本所对应的各级节点、以及负样本所对应的各级节点对所述匹配模型进行训练更新。
8.根据权利要求2所述的方法,其中,所述候选检索路径的构建方式包括:
在数据库中,确定所有数据的初始特征信息;所述数据作为能通过所述候选检索路径检索到的检索结果;
根据目标用户的特征信息,利用所述匹配模型,对所述初始特征信息进行更新,得到更新的特征信息;
对所述更新的特征信息进行聚类,得到不同抽象程度的检索结果;
利用所述不同抽象程度的检索结果构建候选检索路径。
9.根据权利要求1所述的方法,其中,所述目标检索结果用于推荐给所述目标用户。
10.一种信息检索的装置,包括:
目标用户特征信息确定模块,用于确定目标用户的特征信息;
候选检索路径获取模块,用于获取至少一条候选检索路径,所述候选检索路径用于在数据库中确定出候选检索结果;
目标检索路径确定模块,用于利用匹配模型确定所述目标用户的特征信息和所述候选检索路径的匹配程度,根据所述匹配程度在所述候选检索路径中确定出目标检索路径;
目标检索结果确定模块,用于利用所述目标检索路径确定与所述目标用户匹配的目标检索结果。
11.根据权利要求10所述的装置,其中,所述候选检索路径组成至少一个树形检索结构,每个树形检索结构中包括多个节点;
每个候选检索路径包括从所述树形检索结构中的根节点到叶子节点的路径。
12.根据权利要求11所述的装置,其中,所述目标检索路径确定模块,包括:
特征对构建子模块,用于将所述目标用户的特征信息分别与所述至少一个树形检索结构的节点构成特征对;
节点筛选子模块,用于将特征对分别输入所述匹配模型,得到各个特征对的匹配分数,筛选出匹配分数最高的至少一个特征对中的节点;
目标检索路径确定执行子模块,用于在筛选出的节点是叶子节点的情况下,根据所述匹配分数确定从根节点到所述节点的目标检索路径。
13.根据权利要求12所述的装置,其中,所述目标检索结果确定模块,包括:
候选检索结果确定子模块,用于根据所述目标检索路径确定出至少一个候选检索结果;
匹配分数确定子模块,用于利用所述匹配模型确定所述至少一个候选检索结果中每个候选检索结果与所述目标用户的匹配分数;
目标检索结果确定执行子模块,用于根据所述匹配分数从所述候选检索结果中确定目标检索结果。
14.根据权利要求11或12所述的装置,其中,所述匹配模型包括第一子模型、第二子模型和第三子模型;
所述第一子模型被配置为:确定所述节点所对应的特征信息;
所述第二子模型被配置为:根据所述节点所对应的特征信息和所述目标用户的特征信息,生成所述目标用户对所述节点的兴趣度的预测值;
所述第三子模型被配置为:根据所述兴趣度的预测值得到匹配程度。
15.根据权利要求14所述的装置,其中,所述兴趣度包括:点击率、查看时长、查看比例中的至少一种。
16.根据权利要求11或12所述的装置,还包括:
样本确定模块,用于根据所述目标用户对所述目标检索结果的兴趣度确定正样本和负样本,所述正样本包括所述目标用户点击查看的检索结果,所述负样本包括已进行显示且所述目标用户未点击查看的检索结果,以及随机获取的未显示的其他检索结果;
样本上溯模块,用于利用所述候选检索路径确定所述正样本和负样本所对应的各级节点;
匹配模型更新模块,用于根据所述正样本、负样本、正样本所对应的各级节点、以及负样本所对应的各级节点对所述匹配模型进行训练更新。
17.根据权利要求11所述的装置,还包括:
数据初始特征信息确定模块,用于在数据库中,确定所有数据的初始特征信息;所述数据作为能通过所述候选检索路径检索到的检索结果;
特征信息更新模块,用于根据目标用户的特征信息,利用所述匹配模型,对所述初始特征信息进行更新,得到更新的特征信息;
聚类模块,用于对所述更新的特征信息进行聚类,得到不同抽象程度的检索结果;
检索网络构建模块,用于利用所述不同抽象程度的检索结果构建候选检索路径。
18.根据权利要求10所述的装置,其中,所述目标检索结果用于推荐给所述目标用户。
19.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至9中任一项所述的方法。
20.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1至9中任一项所述的方法。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010851832.XA CN111984689B (zh) | 2020-08-21 | 2020-08-21 | 信息检索的方法、装置、设备以及存储介质 |
EP21164240.0A EP3819791A3 (en) | 2020-08-21 | 2021-03-23 | Information search method and apparatus, device and storage medium |
US17/209,981 US11714816B2 (en) | 2020-08-21 | 2021-03-23 | Information search method and apparatus, device and storage medium |
KR1020210038452A KR102526040B1 (ko) | 2020-08-21 | 2021-03-25 | 정보 검색 방법, 장치, 기기, 저장 매체 및 컴퓨터 프로그램 |
JP2021084776A JP7222022B2 (ja) | 2020-08-21 | 2021-05-19 | 情報検索方法、装置、設備、記憶媒体、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010851832.XA CN111984689B (zh) | 2020-08-21 | 2020-08-21 | 信息检索的方法、装置、设备以及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111984689A true CN111984689A (zh) | 2020-11-24 |
CN111984689B CN111984689B (zh) | 2023-07-25 |
Family
ID=73443105
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010851832.XA Active CN111984689B (zh) | 2020-08-21 | 2020-08-21 | 信息检索的方法、装置、设备以及存储介质 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11714816B2 (zh) |
EP (1) | EP3819791A3 (zh) |
JP (1) | JP7222022B2 (zh) |
KR (1) | KR102526040B1 (zh) |
CN (1) | CN111984689B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112818228A (zh) * | 2021-01-29 | 2021-05-18 | 北京百度网讯科技有限公司 | 向用户推荐对象的方法、装置、设备和介质 |
CN113343147A (zh) * | 2021-06-18 | 2021-09-03 | 北京百度网讯科技有限公司 | 信息处理方法、装置、设备、介质及程序产品 |
CN113553483A (zh) * | 2021-07-02 | 2021-10-26 | 广联达科技股份有限公司 | 构件检索方法、装置、电子设备及可读存储介质 |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113407851B (zh) * | 2021-07-15 | 2024-05-03 | 北京百度网讯科技有限公司 | 基于双塔模型的确定推荐信息的方法、装置、设备和介质 |
CN113609176B (zh) * | 2021-08-06 | 2024-03-19 | 北京百度网讯科技有限公司 | 一种信息生成方法、装置、设备及存储介质 |
CN113641718B (zh) * | 2021-08-12 | 2024-06-07 | 北京百度网讯科技有限公司 | 模型生成方法、搜索推荐方法、装置、设备和介质 |
CN113656467B (zh) * | 2021-08-20 | 2023-07-25 | 北京百度网讯科技有限公司 | 搜索结果的排序方法、装置和电子设备 |
CN113449198B (zh) * | 2021-08-31 | 2021-12-10 | 腾讯科技(深圳)有限公司 | 特征提取模型的训练方法、装置、设备及存储介质 |
CN113781236A (zh) * | 2021-09-01 | 2021-12-10 | 深圳华云信息系统有限公司 | 基金产品推荐方法、装置、电子设备及存储介质 |
CN113836417A (zh) * | 2021-09-26 | 2021-12-24 | 北京爱奇艺科技有限公司 | 一种负样本的确定方法、装置、电子设备及存储介质 |
CN113704507B (zh) * | 2021-10-26 | 2022-02-11 | 腾讯科技(深圳)有限公司 | 数据处理方法、计算机设备以及可读存储介质 |
CN114329189B (zh) * | 2021-12-13 | 2022-10-14 | 北京五八信息技术有限公司 | 内容信息的推荐方法、装置、电子设备及可读介质 |
CN114428907B (zh) * | 2022-01-27 | 2024-05-28 | 北京百度网讯科技有限公司 | 信息搜索方法、装置、电子设备及存储介质 |
CN114817725B (zh) * | 2022-04-28 | 2022-10-14 | 杭州核新软件技术有限公司 | 一种行为决策逻辑识别方法及系统 |
KR102452323B1 (ko) * | 2022-05-31 | 2022-10-07 | 한화시스템(주) | 다기능 콘솔의 메뉴 추천 장치 및 그 방법 |
CN114861071B (zh) * | 2022-07-01 | 2022-10-18 | 北京百度网讯科技有限公司 | 对象推荐方法和装置 |
CN115329683B (zh) * | 2022-10-17 | 2022-12-13 | 中国民航大学 | 航空行李在线装载规划方法、装置、设备及介质 |
CN117142156B (zh) * | 2023-10-30 | 2024-02-13 | 深圳市金环宇电线电缆有限公司 | 基于自动定位的线缆码垛控制方法、装置、设备及介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101639831A (zh) * | 2008-07-29 | 2010-02-03 | 华为技术有限公司 | 一种搜索方法、装置及系统 |
JP2010267081A (ja) * | 2009-05-14 | 2010-11-25 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索方法及び装置及びプログラム |
CN103116588A (zh) * | 2011-11-17 | 2013-05-22 | 腾讯科技(深圳)有限公司 | 一种个性化推荐方法及系统 |
US20140169673A1 (en) * | 2011-07-29 | 2014-06-19 | Ke-Yan Liu | Incremental image clustering |
CN105389718A (zh) * | 2015-12-07 | 2016-03-09 | 深圳市天行家科技有限公司 | 一种汽车后服务推荐方法和系统 |
CN107491534A (zh) * | 2017-08-22 | 2017-12-19 | 北京百度网讯科技有限公司 | 信息处理方法和装置 |
CN110659362A (zh) * | 2019-09-17 | 2020-01-07 | 武汉鼎森电子科技有限公司 | 一种自动调节候选范围的推荐方法和系统 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7664746B2 (en) * | 2005-11-15 | 2010-02-16 | Microsoft Corporation | Personalized search and headlines |
US7533096B2 (en) * | 2006-07-12 | 2009-05-12 | International Business Machines Corporation | Computer-based method for finding similar objects using a taxonomy |
JP4910582B2 (ja) | 2006-09-12 | 2012-04-04 | ソニー株式会社 | 情報処理装置および方法、並びに、プログラム |
US9009177B2 (en) * | 2009-09-25 | 2015-04-14 | Microsoft Corporation | Recommending points of interests in a region |
WO2012057744A1 (en) | 2010-10-27 | 2012-05-03 | Hewlett-Packard Development Company, L.P. | Providing control over a personalized category of information |
JP5695966B2 (ja) | 2011-05-10 | 2015-04-08 | 日本電信電話株式会社 | 興味推定装置、方法及びプログラム |
US8386457B2 (en) * | 2011-06-22 | 2013-02-26 | International Business Machines Corporation | Using a dynamically-generated content-level newsworthiness rating to provide content recommendations |
WO2013063718A1 (en) * | 2011-11-01 | 2013-05-10 | Yahoo! Inc. | Method or system for recommending personalized content |
JP2015531909A (ja) * | 2012-07-20 | 2015-11-05 | インタートラスト テクノロジーズ コーポレイション | 情報ターゲティングシステムおよび方法 |
JP6003705B2 (ja) * | 2013-02-14 | 2016-10-05 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
US10102307B2 (en) * | 2013-03-15 | 2018-10-16 | Oath Inc. | Method and system for multi-phase ranking for content personalization |
CN108664515B (zh) | 2017-03-31 | 2019-09-17 | 北京三快在线科技有限公司 | 一种搜索方法及装置,电子设备 |
JP6944320B2 (ja) | 2017-09-19 | 2021-10-06 | ヤフー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
JP7181693B2 (ja) | 2018-02-02 | 2022-12-01 | 日本放送協会 | ニュース素材分類装置、プログラム及び学習モデル |
JP6916136B2 (ja) | 2018-03-22 | 2021-08-11 | 株式会社日立ソリューションズ | 検索支援装置、検索支援方法、及び検索支援プログラム |
JP7140561B2 (ja) | 2018-06-15 | 2022-09-21 | ヤフー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
CN110046276B (zh) | 2019-04-19 | 2021-04-20 | 北京搜狗科技发展有限公司 | 一种语音中关键词的检索方法和装置 |
CN110880124A (zh) | 2019-09-29 | 2020-03-13 | 清华大学 | 转化率评估方法及装置 |
-
2020
- 2020-08-21 CN CN202010851832.XA patent/CN111984689B/zh active Active
-
2021
- 2021-03-23 EP EP21164240.0A patent/EP3819791A3/en not_active Ceased
- 2021-03-23 US US17/209,981 patent/US11714816B2/en active Active
- 2021-03-25 KR KR1020210038452A patent/KR102526040B1/ko active IP Right Grant
- 2021-05-19 JP JP2021084776A patent/JP7222022B2/ja active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101639831A (zh) * | 2008-07-29 | 2010-02-03 | 华为技术有限公司 | 一种搜索方法、装置及系统 |
JP2010267081A (ja) * | 2009-05-14 | 2010-11-25 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索方法及び装置及びプログラム |
US20140169673A1 (en) * | 2011-07-29 | 2014-06-19 | Ke-Yan Liu | Incremental image clustering |
CN103116588A (zh) * | 2011-11-17 | 2013-05-22 | 腾讯科技(深圳)有限公司 | 一种个性化推荐方法及系统 |
CN105389718A (zh) * | 2015-12-07 | 2016-03-09 | 深圳市天行家科技有限公司 | 一种汽车后服务推荐方法和系统 |
CN107491534A (zh) * | 2017-08-22 | 2017-12-19 | 北京百度网讯科技有限公司 | 信息处理方法和装置 |
CN110659362A (zh) * | 2019-09-17 | 2020-01-07 | 武汉鼎森电子科技有限公司 | 一种自动调节候选范围的推荐方法和系统 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112818228A (zh) * | 2021-01-29 | 2021-05-18 | 北京百度网讯科技有限公司 | 向用户推荐对象的方法、装置、设备和介质 |
CN112818228B (zh) * | 2021-01-29 | 2023-08-04 | 北京百度网讯科技有限公司 | 向用户推荐对象的方法、装置、设备和介质 |
CN113343147A (zh) * | 2021-06-18 | 2021-09-03 | 北京百度网讯科技有限公司 | 信息处理方法、装置、设备、介质及程序产品 |
CN113343147B (zh) * | 2021-06-18 | 2024-01-19 | 北京百度网讯科技有限公司 | 信息处理方法、装置、设备、介质及程序产品 |
CN113553483A (zh) * | 2021-07-02 | 2021-10-26 | 广联达科技股份有限公司 | 构件检索方法、装置、电子设备及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
EP3819791A3 (en) | 2021-10-06 |
KR20210040868A (ko) | 2021-04-14 |
CN111984689B (zh) | 2023-07-25 |
JP2021182392A (ja) | 2021-11-25 |
EP3819791A2 (en) | 2021-05-12 |
JP7222022B2 (ja) | 2023-02-14 |
US20210216561A1 (en) | 2021-07-15 |
US11714816B2 (en) | 2023-08-01 |
KR102526040B1 (ko) | 2023-04-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111984689B (zh) | 信息检索的方法、装置、设备以及存储介质 | |
US11580104B2 (en) | Method, apparatus, device, and storage medium for intention recommendation | |
CN112507715A (zh) | 确定实体之间关联关系的方法、装置、设备和存储介质 | |
CN112632403B (zh) | 推荐模型的训练方法、推荐方法、装置、设备和介质 | |
CN111831854A (zh) | 视频标签的生成方法、装置、电子设备和存储介质 | |
CN111597446B (zh) | 基于人工智能的内容推送方法、装置、服务器和存储介质 | |
CN111506803B (zh) | 内容推荐方法、装置、电子设备及存储介质 | |
CN111563198B (zh) | 一种物料召回方法、装置、设备及存储介质 | |
CN111091006A (zh) | 一种实体意图体系的建立方法、装置、设备和介质 | |
CN112559901B (zh) | 资源推荐的方法、装置、电子设备、存储介质及计算机程序产品 | |
CN112052397B (zh) | 用户特征生成方法、装置、电子设备及存储介质 | |
CN112749330A (zh) | 信息推送方法、装置、计算机设备和存储介质 | |
CN111310058B (zh) | 资讯主题的推荐方法、装置、终端及存储介质 | |
CN112182348A (zh) | 语义匹配判定方法、装置、电子设备、计算机可读介质 | |
US11843843B2 (en) | Bullet screen key content jump method and bullet screen jump method | |
CN111400456A (zh) | 资讯推荐方法及装置 | |
CN116823410B (zh) | 数据处理方法、对象处理方法、推荐方法及计算设备 | |
CN111444438B (zh) | 召回策略的准召率的确定方法、装置、设备及存储介质 | |
CN112650919A (zh) | 实体资讯分析方法、装置、设备及存储介质 | |
CN111949820A (zh) | 视频关联兴趣点的处理方法、装置及电子设备 | |
CN111125445A (zh) | 社区主题生成方法、装置、电子设备及存储介质 | |
CN112101012B (zh) | 互动领域确定方法、装置、电子设备及存储介质 | |
CN112052402B (zh) | 信息推荐方法、装置、电子设备及存储介质 | |
CN112328892B (zh) | 信息推荐方法、装置、设备及计算机存储介质 | |
CN111274497B (zh) | 社区推荐及模型训练方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |