CN116070114A - 数据集的构建方法、装置、电子设备及存储介质 - Google Patents

数据集的构建方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN116070114A
CN116070114A CN202211697819.9A CN202211697819A CN116070114A CN 116070114 A CN116070114 A CN 116070114A CN 202211697819 A CN202211697819 A CN 202211697819A CN 116070114 A CN116070114 A CN 116070114A
Authority
CN
China
Prior art keywords
search
retrieval
historical
score
history
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211697819.9A
Other languages
English (en)
Inventor
叶小卫
卢正阳
吴航波
叶昌斌
何夏芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Corp Ltd
Original Assignee
China Telecom Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Corp Ltd filed Critical China Telecom Corp Ltd
Priority to CN202211697819.9A priority Critical patent/CN116070114A/zh
Publication of CN116070114A publication Critical patent/CN116070114A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种数据集的构建方法、装置、电子设备及存储介质,通过获取历史检索请求、与历史检索请求对应的历史关键词组、用户身份属性、历史检索对象以及针对历史检索对象的用户行为信息,然后获取用户身份属性对应的身份基准分值、用户行为信息对应的用户行为分值以及历史关键词组在历史检索对象中的数量占比,根据身份基准分值、用户行为分值以及数量占比对历史检索对象的期望进行计算,获得历史检索对象对应的检索期望值和检索期望度,将历史关键词组分别与检索期望值和检索期望度进行数据关联,构建与历史检索对象对应的检索数据集,检索数据集作为检索模型的训练样本,检索模型用于根据用户输入的检索请求对检索对象进行检索。

Description

数据集的构建方法、装置、电子设备及存储介质
技术领域
本发明涉及模型数据处理领域,特别是涉及一种数据集的构建方法、一种数据集的构建装置、一种电子设备以及一种计算机可读存储介质。
背景技术
在信息化时代,人们可以随时随地利用互联网获知有用的信息,例如用户可以登录检索网站,并在检索网站中输入检索内容,服务器接收到用户输入指令之后,可以反馈与输入检索内容相应的检索结果。
然而,现有的检索技术中往往采用以下两种方式获得检索结果:一种方式是提取用户输入的检索内容的关键字,对关键字进行简单地全文检索,仅按照检索结果的关键词数量的高低次序显示检索结果,导致检索的精准度低,且用户需要从大量的检索结果中逐一查看并选择匹配的检索结果,浪费了用户大量时间。另一种方式是由相关技术人员按照历史输入的关键词,模拟大量关键词,然后人为地修正与关键词管理的各个检索结果,导致检索的人力成本过高、检索效率低下。
发明内容
本发明实施例是提供一种数据集的构建方法、装置、电子设备以及计算机可读存储介质,以解决或部分解决现有技术简单地通过检索关键词数量返回检索结果导致检索精度低、检索效率低下,依赖于人工管理不同检索结果,使得检索人力成本过高的问题。
本发明实施例公开了一种数据集的构建方法,所述方法包括:
获取历史检索请求以及与所述历史检索请求对应的历史请求信息,所述历史请求信息至少包括历史关键词组、用户身份属性、历史检索对象以及针对所述历史检索对象的用户行为信息;
获取所述用户身份属性对应的身份基准分值、所述用户行为信息对应的用户行为分值以及所述历史关键词组在所述历史检索对象中的数量占比;
根据所述身份基准分值、所述用户行为分值以及所述数量占比对所述历史检索对象的期望进行计算,获得所述历史检索对象对应的检索期望信息,所述检索期望信息包括检索期望值和检索期望度;
将所述历史关键词组分别与所述检索期望值和所述检索期望度进行数据关联,构建与所述历史检索对象对应的检索数据集,所述检索数据集作为检索模型的训练样本,所述检索模型用于根据用户输入的检索请求对检索对象进行检索。
可选地,所述方法还包括:
获取实时检索请求以及所述实时检索请求对应的实时请求信息;
将所述实时请求信息输入所述检索模型进行内容检索,输出大于或等于预设检索期望值和预设检索期望度的目标检索对象。
可选地,所述方法还包括:
获取新增对象请求以及所述新增对象请求对应的新增请求信息,所述新增请求信息包括新增检索对象和新增关键词组;
将所述新增关键词组与所述历史关键词组进行数量比对,获得相应的数量比对值,并将大于或等于所述检索期望值的数量比对值与所述检索期望度相乘,输出针对所述新增检索对象的新增检索期望度。
可选地,所述将所述历史关键词组分别与所述检索期望值和所述检索期望度进行数据关联,构建与所述历史检索对象对应的检索数据集,包括:
将所述历史关键词组、所述检索期望值以及所述检索期望度进行数据关联,将所述历史关键词组和所述历史检索对象进行对象关联,构建与所述历史检索对象对应的检索数据集。
可选地,所述获取所述用户身份属性对应的身份基准分值、所述用户行为信息对应的用户行为分值以及所述历史关键词组在所述历史检索对象中的数量占比,包括:
从预设身份基准分值列表中提取多个所述用户身份属性对应的第一分值,将分值最高的第一分值作为所述身份基准分值;
从预设用户行为分值列表中提取多个所述用户行为信息对应的第二分值,将分值最高的第二分值作为所述用户行为分值;
通过分词工具对所述历史搜索对象进行分词操作,获得关键词集合,计算所述历史关键词组的各个关键词在所述关键词集合中的数量占比。
可选地,所述根据所述身份基准分值、所述用户行为分值以及所述数量占比对所述历史检索对象的期望进行计算,获得所述历史检索对象对应的检索期望信息,包括:
在预设时间区间内对所述身份基准分值、所述用户行为分值以及所述数量占比进行聚合计算,获得与所述历史检索对象对应的检索期望值,并将所述检索期望值输入至单调有界函数,获得与所述历史检索对象对应的检索期望度。
可选地,所述单调有界函数包括类反正切函数,所述将所述检索期望值输入至单调有界函数,获得与所述历史检索对象对应的检索期望度,包括:
将所述检索期望值输入至所述类反正切函数,输出常数值,将所述常数值作为与所述历史检索对象对应的检索期望度。
本发明还公开了一种数据集的构建装置,所述装置包括:
历史请求信息获取模块,用于获取历史检索请求以及与所述历史检索请求对应的历史请求信息,所述历史请求信息至少包括历史关键词组、用户身份属性、历史检索对象以及针对所述历史检索对象的用户行为信息;
分值获取模块,用于获取所述用户身份属性对应的身份基准分值、所述用户行为信息对应的用户行为分值以及所述历史关键词组在所述历史检索对象中的数量占比;
期望计算模块,用于根据所述身份基准分值、所述用户行为分值以及所述数量占比对所述历史检索对象的期望进行计算,获得所述历史检索对象对应的检索期望信息,所述检索期望信息包括检索期望值和检索期望度;
检索数据集构建模块,用于将所述历史关键词组分别与所述检索期望值和所述检索期望度进行数据关联,构建与所述历史检索对象对应的检索数据集,所述检索数据集作为检索模型的训练样本,所述检索模型用于根据用户输入的检索请求对检索对象进行检索。
可选地,所述装置还包括:
实时请求信息获取模块,用于获取实时检索请求以及所述实时检索请求对应的实时请求信息;
目标检索对象输出模块,用于将所述实时请求信息输入所述检索模型进行内容检索,输出大于或等于预设检索期望值和预设检索期望度的目标检索对象。
可选地,所述装置还包括:
新增请求信息获取模块,用于获取新增对象请求以及所述新增对象请求对应的新增请求信息,所述新增请求信息包括新增检索对象和新增关键词组;
新增检索期望度输出模块,用于将所述新增关键词组与所述历史关键词组进行数量比对,获得相应的数量比对值,并将大于或等于所述检索期望值的数量比对值与所述检索期望度相乘,输出针对所述新增检索对象的新增检索期望度。
可选地,所述检索数据集构建模块具体用于:
将所述历史关键词组、所述检索期望值以及所述检索期望度进行数据关联,将所述历史关键词组和所述历史检索对象进行对象关联,构建与所述历史检索对象对应的检索数据集。
可选地,所述分值获取模块具体用于:
从预设身份基准分值列表中提取多个所述用户身份属性对应的第一分值,将分值最高的第一分值作为所述身份基准分值;
从预设用户行为分值列表中提取多个所述用户行为信息对应的第二分值,将分值最高的第二分值作为所述用户行为分值;
通过分词工具对所述历史搜索对象进行分词操作,获得关键词集合,计算所述历史关键词组的各个关键词在所述关键词集合中的数量占比。
可选地,所述期望计算模块,包括:
期望计算子模块,用于在预设时间区间内对所述身份基准分值、所述用户行为分值以及所述数量占比进行聚合计算,获得与所述历史检索对象对应的检索期望值,并将所述检索期望值输入至单调有界函数,获得与所述历史检索对象对应的检索期望度。
可选地,所述单调有界函数包括类反正切函数,所述期望计算子模块具体用于:
将所述检索期望值输入至所述类反正切函数,输出常数值,将所述常数值作为与所述历史检索对象对应的检索期望度。
本发明实施例还公开了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,所述处理器、所述通信接口以及所述存储器通过所述通信总线完成相互间的通信;
所述存储器,用于存放计算机程序;
所述处理器,用于执行存储器上所存放的程序时,实现如本发明实施例所述的方法。
本发明实施例还公开了一种计算机可读存储介质,其上存储有指令,当由一个或多个处理器执行时,使得所述处理器执行如本发明实施例所述的方法。
本发明实施例包括以下优点:
在本发明实施例中,获取历史检索请求以及与历史检索请求对应的历史请求信息,历史请求信息至少包括历史关键词组、用户身份属性、历史检索对象以及针对历史检索对象的用户行为信息,获取用户身份属性对应的身份基准分值、用户行为信息对应的用户行为分值以及历史关键词组在历史检索对象中的数量占比,根据身份基准分值、用户行为分值以及数量占比对历史检索对象的期望进行计算,获得历史检索对象对应的检索期望信息,检索期望信息包括检索期望值和检索期望度,将历史关键词组分别与检索期望值和检索期望度进行数据关联,构建与历史检索对象对应的检索数据集,检索数据集作为检索模型的训练样本,检索模型用于根据用户输入的检索请求对检索对象进行检索,从而通过根据用户身份属性对应的身份基准分值、用户行为信息对应的用户行为分值以及历史关键词组在历史检索对象中的数量占比进行期望计算,实现从用户需求和业务需求的角度出发,对历史检索请求的数据进行自动化分析和归类,并且将历史关键词组分别与检索期望值和检索期望度进行数据关联,构建与历史检索对象对应的检索数据集,采用该检索数据集训练检索模型,大大增加了检索的精准度、提高检索效率,同时减低检索人力成本。
附图说明
图1是本发明实施例中提供的一种数据集的构建方法的步骤流程图;
图2是本发明实施例中提供的一种构建检索模型的步骤流程图;
图3是本发明实施例中提供的一种基于新增对象请求优化检索系统的示意图;
图4是本发明实施例中提供的一种数据集的构建装置的结构框图;
图5是本发明实施例中提供的一种电子设备的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
作为一种示例,现有的检索技术往往为:用户在检索页面的输入框中输入检索内容,将检索内容进行分词处理,获得至少一个关键词,然后从数据库中选取所有包含该关键词的检索结果,然后按照所有检索结果中出现该关键词的数量或者频次的大小顺序显示各个检索结果,这种简单的按照关键词出现频次的检索方式不仅检索精度低,而且当检索结果的数量太多时,用户需要花费大量的时间挑选符合其需求的检索结果,使得检索效率低下,或者,现有技术为了提高检索精度,采用人工干预的方式,如人工地分析历史检索数据,然后模拟大量关键词,将模拟的关键词与检索结果进行关联,达到人为修正检索结果的过程,使得检索结果更加贴合用户需求,然而,这种人工干预的方式需要耗费大量的人力资源,并且当检索数据量较大时,人工处理的效率低下。
对此,本发明实施例的核心发明点之一在于获取历史检索请求以及与历史检索请求对应的历史请求信息,历史请求信息至少包括历史关键词组、用户身份属性、历史检索对象以及针对历史检索对象的用户行为信息,获取用户身份属性对应的身份基准分值、用户行为信息对应的用户行为分值以及历史关键词组在历史检索对象中的数量占比,根据身份基准分值、用户行为分值以及数量占比对历史检索对象的期望进行计算,获得历史检索对象对应的检索期望信息,检索期望信息包括检索期望值和检索期望度,将历史关键词组分别与检索期望值和检索期望度进行数据关联,构建与历史检索对象对应的检索数据集,检索数据集作为检索模型的训练样本,检索模型用于根据用户输入的检索请求对检索对象进行检索,从而通过根据用户身份属性对应的身份基准分值、用户行为信息对应的用户行为分值以及历史关键词组在历史检索对象中的数量占比进行期望计算,实现从用户需求和业务需求的角度出发,对历史检索请求的数据进行自动化分析和归类,并且将历史关键词组分别与检索期望值和检索期望度进行数据关联,构建与历史检索对象对应的检索数据集,采用该检索数据集训练检索模型,大大增加了检索的精准度、提高检索效率,同时减低检索人力成本。
参照图1,示出了本发明实施例中提供的一种数据集的构建方法的步骤流程图,具体可以包括如下步骤:
步骤101,获取历史检索请求以及与所述历史检索请求对应的历史请求信息,所述历史请求信息至少包括历史关键词组、用户身份属性、历史检索对象以及针对所述历史检索对象的用户行为信息;
在本发明实施例中,检索模型可以采集全部或者随机抽取多个历史检索请求以及与历史检索请求对应的历史请求信息,历史请求信息至少包括历史关键词组、用户身份属性、历史检索对象以及针对历史检索对象的用户行为信息。
可选地,历史检索请求可以为所有用户账户所属用户终端历史发送的用于检索各种信息的请求,如用户在检索页面中输入的检索内容,并点击搜索控件时所生成的请求,历史请求信息可以为用户账户所属用户终端发送历史检索请求时所携带的信息,其可以包括历史关键词组、用户身份属性、历史检索对象以及针对历史检索对象的用户行为信息。
其中,历史关键词组可以为采用分词工具对检索内容进行分词后获得的关键词集合,如检索内容为:“如何在不使用工具的前提下绘制圆形”,采用分词工具对检索内容进行分词操作之后,可以获得关键词组为{不使用,工具,绘制,圆形};用户身份属性可以为用户账户所关联的账号身份,如在教学系统中,用户账户A为教师身份属性、用户账户B为学生身份属性、用户账户C为游客身份属性,在企业办公系统中,用户账户D为普通职工身份属性、用户账户E为主管身份属性等等,在不同场景下用户身份属性相应变化,并且同一用户账户在不同系统或者场景下可以具有多种身份属性,如用户账户A登录教学系统时,其身份属性为教师身份属性,而登录购物应用程序时,其身份属性为游客身份属性;历史检索对象可以为检索模型接收到历史检索请求之后所返回的检索结果所关联的对象,如检索模型接收到用户在检索页面输入的“如何在不使用工具的前提下绘制圆形”的历史检索请求,返回了多个绘制圆形的教学文档,该教学文档即为检索对象;用户行为信息可以为用户在检索页面中对检索结果执行的用户操作以及操作时间点,如用户在检索结果显示界面中对多个检索对象进行筛选操作,或者在检索对象对应的对象显示界面中进行点赞、评论、收藏、转发等等用户操作以及执行用户操作时的时间点。
在一种示例中,先随机抽取历史检索请求①、历史检索请求②以及历史检索请求③,然后分别获取发出历史检索请求①、历史检索请求②以及历史检索请求③的用户账户的通用身份属性集合、用户账户对检索结果的用户行为及其操作时间以及与用户行为关联的关键词组和关联对象。
步骤102,获取所述用户身份属性对应的身份基准分值、所述用户行为信息对应的用户行为分值以及所述历史关键词组在所述历史检索对象中的数量占比;
在本发明实施例中,在获取到历史检索请求对应的历史关键词组、用户身份属性、历史检索对象以及针对历史检索对象的用户行为信息之后,可以分别提取与用户身份属性对应的身份基准分值、用户行为信息对应的用户行为分值以及历史关键词组在历史检索对象中的数量占比。
在具体实现中,从预设身份基准分值列表中提取多个用户身份属性对应的第一分值,将分值最高的第一分值作为身份基准分值,从预设用户行为分值列表中提取多个用户行为信息对应的第二分值,将分值最高的第二分值作为用户行为分值,通过分词工具对历史搜索对象进行分词操作,获得关键词集合,计算历史关键词组的各个关键词在关键词集合中的数量占比。
可选地,预设身份基准分值列表可以为与用户账户关联的按照实际需求提前设置的用户身份属性与分值之间的映射表,例如,与用户账户A关联的预设身份基准分值列表①可以为{“学生身份属性对应于7分”,“游客身份属性对应于2分”,“普通职工身份属性对应于2分”},与用户账户B关联的预设身份基准分值列表②可以为{“教师身份属性对应于10分”,“主管身份属性对应于7分”},其中,预设身份基准分值列表中与当前用户账户对应的分值为第一分值,例如,当前用户账户A为学生身份属性时,用户账户A的用户身份属性所对应的第一分值为7分,当用户账户A为普通职工身份属性时,用户账户A的用户身份属性所对应的第一分值为2分,而身份基准分值可以为用户账户中用户身份属性所对应的第一分值最高的分值,例如,用户账户A包括学生身份属性和普通职工身份属性,并且从预设身份基准分值列表中获知学生身份属性对应的第一分值为7分,普通职工身份属性对应的第一分值为2分,则将7分作为身份基准分值。
预设用户行为分值列表,预设用户行为分值列表可以为与用户账户关联的按照实际需求提前设置的用户行为信息与分值之间的映射表,例如,与用户账户A关联的预设用户行为分值列表可以为{“筛选检索结果对应于5分”,“点击进入检索对象对应于2分”,“点击进入检索对象并点赞对应于6分”,“转发检索对象对应于3分”},其中,预设用户行为分值列表中与各个用户行为信息对应的分值为第二分值,例如,用户行为信息为筛选操作时,用户行为信息对应的第二分值为5分,用户行为信息为进入点赞操作时,用户行为信息对应的第二分值为6分,而用户行为分值可以为各个用户行为信息对应的第二分值最高的分值,例如,用户账户A的用户行为分值包括筛选操作和点赞操作,从预设用户行为分值列表中获知筛选操作对应的第二分值为5分,点赞操作对应的第二分值为6分,则将6分作为用户行为分值。
数量占比可以为检索对象中出现的不同关键词数量在用户搜索的检索结果中不同关键词数量的占比。
在本发明实施例中,预设身份基准分值列表和预设用户行为分值列表中的分值可以按照具体场景或者具体需求进行设置,本发明对此不作限制。
步骤103,根据所述身份基准分值、所述用户行为分值以及所述数量占比对所述历史检索对象的期望进行计算,获得所述历史检索对象对应的检索期望信息,所述检索期望信息包括检索期望值和检索期望度;
在本发明实施例中,从预设身份基准分值列表中提取相应的身份基准分值、从预设用户行为分值列表中提取相应的用户行为分值以及计算出关键词或者关键词组的数量占比后,可以依据所提取和计算的分值对历史检索对象的期望进行计算,从而获得与历史检索对象对应的以及满足用户需求的检索期望信息。
可选地,检索期望信息可以为各个检索对象所对应的期望信息,其可以包括检索期望值和检索期望度,检索期望值和检索期望度的数值越高,说明检索对象与用户需求或业务需求越匹配,因此,可以依据检索期望值和检索期望度调整检索对象在检索结果页面中的显示位置,减少用户在大量检索结果中选中符合自身需求的检索对象,提高检索效率。
在具体实现中,在预设时间区间内对身份基准分值、用户行为分值以及数量占比进行聚合计算,获得与历史检索对象对应的检索期望值,并将检索期望值输入至单调有界函数,获得与历史检索对象对应的检索期望度。
可选地,预设时间区间可以为提前设置的操作统计时间区间(T1,T2),检索期望值为检索对象对应关键字组的期望度值
Figure BDA0004024192870000101
检索期望值的具体聚合计算过程可以为:在预设时间区间内可以将身份基准分值、用户行为分值以及数量占比进行相乘,得到基于时间维度的乘积,并将该乘积作为检索期望值。
检索期望度可以为将检索期望值输入至单调有界函数中,如类反正切函数,所输出的常数值,检索期望度的具体计算过程可以为:获得检索期望值之后,设置一个定义域为区间[0,+∞)的类反正切函数y=M×arctan(x),以其上界为100%,M为大于0的一个常数,将检索期望值作为x输入至类反正切函数,则M可以通过检索期望值和百分比来求得的常数值,将该常数值作为与历史检索对象对应的检索期望度。
步骤104,将所述历史关键词组分别与所述检索期望值和所述检索期望度进行数据关联,构建与所述历史检索对象对应的检索数据集,所述检索数据集作为检索模型的训练样本,所述检索模型用于根据用户输入的检索请求对检索对象进行检索。
在本发明实施例中,将关键词组、检索期望值以及检索期望度进行数据关联,将历史关键词组和历史检索对象进行对象关联,构建与历史检索对象对应的检索数据集,检索数据集作为检索模型的训练样本,检索模型用于根据用户输入的检索请求对检索对象进行检索。
可选地,将关键词组、检索期望值以及检索期望度进行数据关联,将历史关键词组和历史检索对象进行对象关联可以构建出形式为:[关键词组,检索期望值,检索期望度,历史检索对象]的检索数据集,件检索数据集作为训练样本,对检索模型进行训练,使得检索模型可以针对不同用户账户输出满足其用户需求的检索对象,同时在检索过程中,可以不断地进行优化,增加检索模型的精度。
参照图2示出了本发明实施例提供的一种构建检索模型的步骤流程图,首先采集用户属性、用户行为以及检索内容本身属性,然后分析检索结果对象期望度,并建立检索数据集,同时根据检索数据集构建基于人群行为的期望模型,最后可以采用期望模型进行智能结果检索,从而按照期望模型输出的检索期望值和检索期望度的大小顺序显示多个检索结果。
在本发明的一种实施例中,获取实时检索请求以及实时检索请求对应的实时请求信息,将实时请求信息输入检索模型进行内容检索,输出大于或等于检索期望值和检索期望度的目标检索对象。
具体的,可以提前设置针对实时检索请求的预设检索期望值和预设检索期望度,在获取实时检索请求对应的实时请求信息时,实时请求信息可以包括检索内容,采用分词工具对检索内容进行分词处理,获得关键字组,然后将关键字组与检索数据集中的关键字组进行关键字比对,若实时检索请求与检索数据集存在多个相同的关键字组,则将检索数据集中检索期望值大于或等于预设检索期望值,以及检索数据集中检索期望度大于或等于预设检索期望度的关键字组作为目标关键字组,并输出与目标关键字组关联的目标检索对象。
在本发明的另一种实施例中,如果存在与实时检索请求不匹配的内容,则可以通过传统的检索方式返回检索对象,待收集更多信息数据后,通过机器学习方式,重复前面的步骤,进行模型扩充和优化。
在本发明的另一种实施例中,获取新增对象请求以及新增对象请求对应的新增请求信息,新增请求信息包括新增检索对象和新增关键词组,将新增关键词组与历史关键词组进行数量比对,获得相应的数量比对值,并将大于或等于检索期望值的数量比对值与检索期望度相乘,输出针对新增检索对象的新增检索期望度。
具体的,参照图3示出了本发明实施例提供的一种基于新增对象请求优化检索系统的示意图,当检索模型接收到新内容:新检索对象①和新检索对象②时,可以通过分词工具分别获取新检索对象①和新检索对象②的关键字组,然后关键字组与检索数据集中的关键字组进行关键字比对,并分别提取将预设检索期望值大于或等于检索数据集中检索期望值的数据,最后复制其检索期望值,将检索期望值与预设检索期望度相乘,获得新检索对象对应的①乘积a和新检索对象对应的②乘积b,将乘积a和乘积b作为新增检索期望度,从而对配置了检索模型的检索系统进行扩充,使得智能化内容检索系统可以不断地进行实时优化,在面对新增检索对象时,可以自动输出对应的检索期望值和检索期望度,增加检索准确度。
本发明实施例中可能会涉及到对用户数据的使用,在实际应用中,可以在符合所在国的适用法律法规要求的情况下(例如,用户明确同意、对用户切实通知等),在适用法律法规允许的范围内在本文描述的方案中使用用户特定的个人数据。
需要说明的是,本发明实施例包括但不限于上述示例,可以理解的是,本领域技术人员在本发明实施例的思想指导下,还可以根据实际需求进行设置,本发明对此不作限制。
在本发明实施例中,获取历史检索请求以及与历史检索请求对应的历史请求信息,历史请求信息至少包括历史关键词组、用户身份属性、历史检索对象以及针对历史检索对象的用户行为信息,获取用户身份属性对应的身份基准分值、用户行为信息对应的用户行为分值以及历史关键词组在历史检索对象中的数量占比,根据身份基准分值、用户行为分值以及数量占比对历史检索对象的期望进行计算,获得历史检索对象对应的检索期望信息,检索期望信息包括检索期望值和检索期望度,将历史关键词组分别与检索期望值和检索期望度进行数据关联,构建与历史检索对象对应的检索数据集,检索数据集作为检索模型的训练样本,检索模型用于根据用户输入的检索请求对检索对象进行检索,从而通过根据用户身份属性对应的身份基准分值、用户行为信息对应的用户行为分值以及历史关键词组在历史检索对象中的数量占比进行期望计算,实现从用户需求和业务需求的角度出发,对历史检索请求的数据进行自动化分析和归类,并且将历史关键词组分别与检索期望值和检索期望度进行数据关联,构建与历史检索对象对应的检索数据集,采用该检索数据集训练检索模型,大大增加了检索的精准度、提高检索效率,同时减低检索人力成本。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
参照图4,示出了本发明实施例中提供的一种数据集的构建装置的结构框图,具体可以包括如下模块:
历史请求信息获取模块401,用于获取历史检索请求以及与所述历史检索请求对应的历史请求信息,所述历史请求信息至少包括历史关键词组、用户身份属性、历史检索对象以及针对所述历史检索对象的用户行为信息;
分值获取模块402,用于获取所述用户身份属性对应的身份基准分值、所述用户行为信息对应的用户行为分值以及所述历史关键词组在所述历史检索对象中的数量占比;
期望计算模块403,用于根据所述身份基准分值、所述用户行为分值以及所述数量占比对所述历史检索对象的期望进行计算,获得所述历史检索对象对应的检索期望信息,所述检索期望信息包括检索期望值和检索期望度;
检索数据集构建模块404,用于将所述历史关键词组分别与所述检索期望值和所述检索期望度进行数据关联,构建与所述历史检索对象对应的检索数据集,所述检索数据集作为检索模型的训练样本,所述检索模型用于根据用户输入的检索请求对检索对象进行检索。
在一种可选实施例中,所述装置还包括:
实时请求信息获取模块,用于获取实时检索请求以及所述实时检索请求对应的实时请求信息;
目标检索对象输出模块,用于将所述实时请求信息输入所述检索模型进行内容检索,输出大于或等于预设检索期望值和预设检索期望度的目标检索对象。
在一种可选实施例中,所述装置还包括:
新增请求信息获取模块,用于获取新增对象请求以及所述新增对象请求对应的新增请求信息,所述新增请求信息包括新增检索对象和新增关键词组;
新增检索期望度输出模块,用于将所述新增关键词组与所述历史关键词组进行数量比对,获得相应的数量比对值,并将大于或等于所述检索期望值的数量比对值与所述检索期望度相乘,输出针对所述新增检索对象的新增检索期望度。
在一种可选实施例中,所述检索数据集构建模404块具体用于:
将所述历史关键词组、所述检索期望值以及所述检索期望度进行数据关联,将所述历史关键词组和所述历史检索对象进行对象关联,构建与所述历史检索对象对应的检索数据集。
在一种可选实施例中,所述分值获取模块402具体用于:
从预设身份基准分值列表中提取多个所述用户身份属性对应的第一分值,将分值最高的第一分值作为所述身份基准分值;
从预设用户行为分值列表中提取多个所述用户行为信息对应的第二分值,将分值最高的第二分值作为所述用户行为分值;
通过分词工具对所述历史搜索对象进行分词操作,获得关键词集合,计算所述历史关键词组的各个关键词在所述关键词集合中的数量占比。
在一种可选实施例中,所述期望计算模块403包括:
期望计算子模块,用于在预设时间区间内对所述身份基准分值、所述用户行为分值以及所述数量占比进行聚合计算,获得与所述历史检索对象对应的检索期望值,并将所述检索期望值输入至单调有界函数,获得与所述历史检索对象对应的检索期望度。
在一种可选实施例中,所述单调有界函数包括类反正切函数,所述期望计算子模块具体用于:
将所述检索期望值输入至所述类反正切函数,输出常数值,将所述常数值作为与所述历史检索对象对应的检索期望度。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
另外,本发明实施例还提供了一种电子设备,包括:处理器,存储器,存储在存储器上并可在处理器上运行的计算机程序,该计算机程序被处理器执行时实现上述数据集的构建方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述数据集的构建方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
图5为实现本发明各个实施例的一种电子设备的结构框图。
该电子设备500包括但不限于:射频单元501、网络模块502、音频输出单元503、输入单元504、传感器505、显示单元506、用户输入单元507、接口单元508、存储器509、处理器510、以及电源511等部件。本领域技术人员可以理解,图5中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。在本发明实施例中,电子设备包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载终端、可穿戴设备、以及计步器等。
应理解的是,本发明实施例中,射频单元501可用于收发信息或通话过程中,信号的接收和发送,具体的,将来自基站的下行数据接收后,给处理器510处理;另外,将上行的数据发送给基站。通常,射频单元501包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元501还可以通过无线通信系统与网络和其他设备通信。
电子设备通过网络模块502为用户提供了无线的宽带互联网访问,如帮助用户收发电子邮件、浏览网页和访问流式媒体等。
音频输出单元503可以将射频单元501或网络模块502接收的或者在存储器509中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元503还可以提供与电子设备500执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元503包括扬声器、蜂鸣器以及受话器等。
输入单元504用于接收音频或视频信号。输入单元504可以包括图形处理器(Graphics Processing Unit,GPU)5041和麦克风5042,图形处理器5041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元506上。经图形处理器5041处理后的图像帧可以存储在存储器509(或其它存储介质)中或者经由射频单元501或网络模块502进行发送。麦克风5042可以接收声音,并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元501发送到移动通信基站的格式输出。
电子设备500还包括至少一种传感器505,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板5061的亮度,接近传感器可在电子设备500移动到耳边时,关闭显示面板5061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别电子设备姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;传感器505还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等,在此不再赘述。
显示单元506用于显示由用户输入的信息或提供给用户的信息。显示单元506可包括显示面板5061,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板5061。
用户输入单元507可用于接收输入的数字或字符信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元507包括触控面板5071以及其他输入设备5072。触控面板5071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板5071上或在触控面板5071附近的操作)。触控面板5071可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器510,接收处理器510发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板5071。除了触控面板5071,用户输入单元507还可以包括其他输入设备5072。具体地,其他输入设备5072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
进一步的,触控面板5071可覆盖在显示面板5061上,当触控面板5071检测到在其上或附近的触摸操作后,传送给处理器510以确定触摸事件的类型,随后处理器510根据触摸事件的类型在显示面板5061上提供相应的视觉输出。虽然在图5中,触控面板5071与显示面板5061是作为两个独立的部件来实现电子设备的输入和输出功能,但是在某些实施例中,可以将触控面板5071与显示面板5061集成而实现电子设备的输入和输出功能,具体此处不做限定。
接口单元508为外部装置与电子设备500连接的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元508可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到电子设备500内的一个或多个元件或者可以用于在电子设备500和外部装置之间传输数据。
存储器509可用于存储软件程序以及各种数据。存储器509可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器509可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器510是电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器509内的软件程序和/或模块,以及调用存储在存储器509内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体监控。处理器510可包括一个或多个处理单元;优选的,处理器510可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器510中。
电子设备500还可以包括给各个部件供电的电源511(比如电池),优选的,电源511可以通过电源管理系统与处理器510逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
另外,电子设备500包括一些未示出的功能模块,在此不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。
本领域普通技术人员可以意识到,结合本发明实施例中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种数据集的构建方法,其特征在于,所述方法包括:
获取历史检索请求以及与所述历史检索请求对应的历史请求信息,所述历史请求信息至少包括历史关键词组、用户身份属性、历史检索对象以及针对所述历史检索对象的用户行为信息;
获取所述用户身份属性对应的身份基准分值、所述用户行为信息对应的用户行为分值以及所述历史关键词组在所述历史检索对象中的数量占比;
根据所述身份基准分值、所述用户行为分值以及所述数量占比对所述历史检索对象的期望进行计算,获得所述历史检索对象对应的检索期望信息,所述检索期望信息包括检索期望值和检索期望度;
将所述历史关键词组分别与所述检索期望值和所述检索期望度进行数据关联,构建与所述历史检索对象对应的检索数据集,所述检索数据集作为检索模型的训练样本,所述检索模型用于根据用户输入的检索请求对检索对象进行检索。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取实时检索请求以及所述实时检索请求对应的实时请求信息;
将所述实时请求信息输入所述检索模型进行内容检索,输出大于或等于预设检索期望值和预设检索期望度的目标检索对象。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取新增对象请求以及所述新增对象请求对应的新增请求信息,所述新增请求信息包括新增检索对象和新增关键词组;
将所述新增关键词组与所述历史关键词组进行数量比对,获得相应的数量比对值,并将大于或等于所述检索期望值的数量比对值与所述检索期望度相乘,输出针对所述新增检索对象的新增检索期望度。
4.根据权利要求1所述的方法,其特征在于,所述将所述历史关键词组分别与所述检索期望值和所述检索期望度进行数据关联,构建与所述历史检索对象对应的检索数据集,包括:
将所述历史关键词组、所述检索期望值以及所述检索期望度进行数据关联,将所述历史关键词组和所述历史检索对象进行对象关联,构建与所述历史检索对象对应的检索数据集。
5.根据权利要求1所述的方法,其特征在于,所述获取所述用户身份属性对应的身份基准分值、所述用户行为信息对应的用户行为分值以及所述历史关键词组在所述历史检索对象中的数量占比,包括:
从预设身份基准分值列表中提取多个所述用户身份属性对应的第一分值,将分值最高的第一分值作为所述身份基准分值;
从预设用户行为分值列表中提取多个所述用户行为信息对应的第二分值,将分值最高的第二分值作为所述用户行为分值;
通过分词工具对所述历史搜索对象进行分词操作,获得关键词集合,计算所述历史关键词组的各个关键词在所述关键词集合中的数量占比。
6.根据权利要求1所述的方法,其特征在于,所述根据所述身份基准分值、所述用户行为分值以及所述数量占比对所述历史检索对象的期望进行计算,获得所述历史检索对象对应的检索期望信息,包括:
在预设时间区间内对所述身份基准分值、所述用户行为分值以及所述数量占比进行聚合计算,获得与所述历史检索对象对应的检索期望值,并将所述检索期望值输入至单调有界函数,获得与所述历史检索对象对应的检索期望度。
7.根据权利要求6所述的方法,其特征在于,所述单调有界函数包括类反正切函数,所述将所述检索期望值输入至单调有界函数,获得与所述历史检索对象对应的检索期望度,包括:
将所述检索期望值输入至所述类反正切函数,输出常数值,将所述常数值作为与所述历史检索对象对应的检索期望度。
8.一种数据集的构建装置,其特征在于,所述装置包括:
历史请求信息获取模块,用于获取历史检索请求以及与所述历史检索请求对应的历史请求信息,所述历史请求信息至少包括历史关键词组、用户身份属性、历史检索对象以及针对所述历史检索对象的用户行为信息;
分值获取模块,用于获取所述用户身份属性对应的身份基准分值、所述用户行为信息对应的用户行为分值以及所述历史关键词组在所述历史检索对象中的数量占比;
期望计算模块,用于根据所述身份基准分值、所述用户行为分值以及所述数量占比对所述历史检索对象的期望进行计算,获得所述历史检索对象对应的检索期望信息,所述检索期望信息包括检索期望值和检索期望度;
检索数据集构建模块,用于将所述历史关键词组分别与所述检索期望值和所述检索期望度进行数据关联,构建与所述历史检索对象对应的检索数据集,所述检索数据集作为检索模型的训练样本,所述检索模型用于根据用户输入的检索请求对检索对象进行检索。
9.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,所述处理器、所述通信接口以及所述存储器通过所述通信总线完成相互间的通信;
所述存储器,用于存放计算机程序;
所述处理器,用于执行存储器上所存放的程序时,实现如权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其上存储有指令,当由一个或多个处理器执行时,使得所述处理器执行如权利要求1-7任一项所述的方法。
CN202211697819.9A 2022-12-28 2022-12-28 数据集的构建方法、装置、电子设备及存储介质 Pending CN116070114A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211697819.9A CN116070114A (zh) 2022-12-28 2022-12-28 数据集的构建方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211697819.9A CN116070114A (zh) 2022-12-28 2022-12-28 数据集的构建方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN116070114A true CN116070114A (zh) 2023-05-05

Family

ID=86172638

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211697819.9A Pending CN116070114A (zh) 2022-12-28 2022-12-28 数据集的构建方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN116070114A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116561434A (zh) * 2023-06-28 2023-08-08 平安银行股份有限公司 一种数据检索推荐方法、装置、存储介质及设备
CN117743606A (zh) * 2024-02-21 2024-03-22 天云融创数据科技(北京)有限公司 一种基于大数据的智能检索方法及系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116561434A (zh) * 2023-06-28 2023-08-08 平安银行股份有限公司 一种数据检索推荐方法、装置、存储介质及设备
CN117743606A (zh) * 2024-02-21 2024-03-22 天云融创数据科技(北京)有限公司 一种基于大数据的智能检索方法及系统
CN117743606B (zh) * 2024-02-21 2024-04-30 天云融创数据科技(北京)有限公司 一种基于大数据的智能检索方法及系统

Similar Documents

Publication Publication Date Title
CN110472145B (zh) 一种内容推荐方法和电子设备
CN107958042B (zh) 一种目标专题的推送方法及移动终端
CN116070114A (zh) 数据集的构建方法、装置、电子设备及存储介质
CN109033156B (zh) 一种信息处理方法、装置及终端
CN109561211B (zh) 一种信息显示方法及移动终端
CN111125523B (zh) 搜索方法、装置、终端设备及存储介质
CN113190646B (zh) 一种用户名样本的标注方法、装置、电子设备及存储介质
CN111159338A (zh) 一种恶意文本的检测方法、装置、电子设备及存储介质
CN111753520B (zh) 一种风险预测方法、装置、电子设备及存储介质
CN111125307A (zh) 一种聊天记录查询方法及电子设备
CN110597957B (zh) 一种文本信息检索的方法及相关装置
CN109472825B (zh) 一种对象搜索方法及终端设备
CN108595107B (zh) 一种界面内容处理方法及移动终端
WO2021073434A1 (zh) 对象行为的识别方法、装置及终端设备
CN117609617A (zh) 职位信息的推荐方法、装置、电子设备及存储介质
CN108459813A (zh) 一种搜索方法及移动终端
CN112329462B (zh) 一种数据排序方法、装置、电子设备及存储介质
CN111353422B (zh) 信息提取方法、装置及电子设备
CN111277675B (zh) 群成员的排序方法及电子设备
CN108108017B (zh) 一种搜索信息处理方法及移动终端
CN111859240A (zh) 一种图片导出的方法、相关装置及存储介质
CN109168154B (zh) 一种用户行为信息收集方法、装置及移动终端
CN110909190B (zh) 数据搜索方法、装置、电子设备及存储介质
CN118212008A (zh) 一种针对全量客户的目标业务空间确定方法和装置
CN112150174B (zh) 一种广告配图方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination