CN113032819A - 搜索提示词的确定方法、系统以及信息处理方法 - Google Patents
搜索提示词的确定方法、系统以及信息处理方法 Download PDFInfo
- Publication number
- CN113032819A CN113032819A CN201911251642.8A CN201911251642A CN113032819A CN 113032819 A CN113032819 A CN 113032819A CN 201911251642 A CN201911251642 A CN 201911251642A CN 113032819 A CN113032819 A CN 113032819A
- Authority
- CN
- China
- Prior art keywords
- candidate
- data
- word set
- words
- server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 115
- 230000010365 information processing Effects 0.000 title claims abstract description 9
- 238000003672 processing method Methods 0.000 title claims abstract description 8
- 238000012163 sequencing technique Methods 0.000 claims abstract description 17
- 238000012545 processing Methods 0.000 claims description 32
- 238000012549 training Methods 0.000 claims description 32
- 230000015654 memory Effects 0.000 claims description 28
- 230000006399 behavior Effects 0.000 claims description 27
- 238000004458 analytical method Methods 0.000 claims description 18
- 230000002776 aggregation Effects 0.000 claims description 16
- 238000004220 aggregation Methods 0.000 claims description 16
- 238000004891 communication Methods 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 12
- 238000010586 diagram Methods 0.000 description 19
- 230000004931 aggregating effect Effects 0.000 description 9
- 238000013500 data storage Methods 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 238000007477 logistic regression Methods 0.000 description 6
- 238000010801 machine learning Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000011451 sequencing strategy Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Bioethics (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种搜索提示词的确定方法、系统以及信息处理方法。其中,该方法包括:客户端设备接收服务器发送的模型参数和第一候选提示词集合,第一候选提示词集合中包括服务器基于客户端上传的指定类型数据从候选提示词集合中选择的候选提示词;客户端设备依据模型参数更新本地学习模型,并基于更新后的本地学习模型确定所述第一候选提示词集合中的候选提示词的排序结果;所述客户端设备基于所述排序结果从所述第一候选提示词集合中确定目标提示词;展示目标提示词。
Description
技术领域
本申请涉及数据处理领域,具体而言,涉及一种搜索提示词的确定方法、系统以及信息处理方法。
背景技术
在电商商品推荐、搜索广告、信息流推荐等推荐系统中,由于推荐算法的需要,该系统往往会收集大量用户信息,如用户的搜索记录、用户的点击记录、用户的年龄、性别、所在位置等,并提供唯一可标识的编号上传到企业服务器,以帮助服务器端进行模型的训练,进而进行更精准的推荐。
随着互联网的发展,用户数据隐私保护越来越成为互联网企业面临的重要问题,传统的个性化搜索词建议需要收集用户的搜索和点击历史,并保存在云端,为大规模数据泄露产生了风险,将用户数据以唯一可标识的形式存储在服务器的方式,为用户数据隐私保护提供挑战,而非个性化搜索词建议的效果较差,此外,为了保护用户数据隐私,用户的个人数据都需要经过用户明确授权后才可以上传和使用,也为服务器端的数据收集带来了不确定性。
为了企业服务商使用用户数据的同时更好地为用户提供隐私保护,相关技术出现了以下方法,1、差分隐私技术,2、通过共享模型获取数据,零售商之间不共享明文数据的方法,3、在端上执行模型预测,服务器只进行参数聚合的方法,但这些方法难以适应产品级的搜索。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种搜索提示词的确定方法、系统以及信息处理方法,以至少解决无法同时兼顾个性化搜索词的搜索效果以及非个性化搜索词建议方案的安全性的技术问题。
根据本申请实施例的一个方面,提供了一种搜索提示词的确定方法,包括:客户端设备接收服务器发送的模型参数和第一候选提示词集合,所述第一候选提示词集合中包括所述服务器基于所述客户端上传的指定类型数据从候选提示词集合中选择的候选提示词;所述客户端设备依据所述模型参数更新本地学习模型,并基于更新后的本地学习模型确定所述第一候选提示词集合中的候选提示词的排序结果;所述客户端设备基于所述排序结果从所述第一候选提示词集合中确定目标提示词;展示所述目标提示词。
根据本申请实施例的另一方面,还提供了一种搜索提示词的确定方法,包括:服务器获取不同客户端设备中学习模型的模型参数,不同客户端设备运行有服务器提供的同一类型搜索引擎;服务器对不同客户端设备对应的模型参数进行聚合处理,得到目标模型参数;服务器接收客户端设备上报的指定类型数据,并基于该指定类型数据从候选提示词集合中选择候选提示词,得到第一候选提示词集合;服务器将第一候选提示词集合和目标模型参数发送至客户端设备。
根据本申请实施例的另一方面,还提供了一种搜索提示词的确定方法,包括:客户端设备接收服务器发送的候选提示词集合;客户端设备将候选提示词集合输入至学习模型中进行分析,得到候选提示词的评分指标;客户端设备依据评分指标从候选提示词集合中确定目标提示词;展示目标提示词。
根据本申请实施例的另一方面,还提供了一种搜索提示词的确定系统,包括:客户端设备和服务器,其中,服务器,用于基于客户端设备上传的指定类型数据从候选提示词集合中选择的提示词,得到第一候选提示词集合,以及向客户端设备发送模型参数;客户端设备,用于接收模型参数和第一候选提示词集合;依据模型参数更新本地学习模型,并基于更新后的本地学习模型确定所述第一候选提示词集合中的候选提示词的排序结果;基于排序结果从第一候选提示词集合中确定目标提示词;展示目标提示词。
根据本申请实施例的另一方面,还提供了一种系统,包括:处理器;以及存储器,与处理器连接,用于为处理器提供处理以下处理步骤的指令:接收服务器发送的模型参数和第一候选提示词集合,所述第一候选提示词集合中包括所述服务器基于所述客户端上传的指定类型数据从候选提示词集合中选择的候选提示词;依据所述模型参数更新本地学习模型,并基于更新后的本地学习模型确定所述第一候选提示词集合中的候选提示词的排序结果;基于所述排序结果从所述第一候选提示词集合中确定目标提示词;展示所述目标提示词。
根据本申请实施例的另一方面,还提供了另一种搜索提示词的确定方法,包括:客户端设备接收来自服务器的第一候选提示词集合,其中,该第一候选提示词集合为所述服务器基于第一学习模型从预设候选提示词集合选择的候选提示词确定的;所述客户端设备基于本地的第二学习模型从所述第一候选提示词集合中确定目标提示词;展示所述目标提示词。
根据本申请实施例的另一方面,还提供了另一种搜索提示词的确定方法,包括:客户端设备接收来自服务器的第一候选提示词集合,其中,该第一候选提示词集合中的候选提示词是按照预先确定的顺序进行排列的;所述客户端设备基于所述第一候选提示词集合中候选提示词的排序结果,确定目标提示词;展示所述目标提示词。
在本申请实施例中,客户端设备接收服务器发送的模型参数和第一候选提示词集合,第一候选提示词集合中包括服务器基于客户端上传的指定类型数据从候选提示词集合中选择的候选提示词;客户端设备依据模型参数更新本地学习模型,并基于更新后的本地学习模型确定第一候选提示词集合中的候选提示词的排序结果;客户端设备基于排序结果从第一候选提示词集合中确定目标提示词;展示目标提示词。采用上述方案,达到了不直接采用用户个性化数据为用户提供搜索建议的目的,从而实现了基于用户数据为用户提供搜索建议时保护用户隐私的技术效果,进而解决了无法同时兼顾个性化搜索词的搜索效果以及非个性化搜索词建议方案的安全性的技术问题。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1a是根据本申请实施例的一种信息处理方法的流程图;
图1b是根据本申请实施例的一种搜索提示词的确定方法的计算机终端的硬件结构框图;
图2a是根据本申请实施例的一种搜索提示词的确定方法的流程图;
图2b是根据本申请实施例的一种搜索提示词的确定方法的应用场景示意图;
图3是根据本申请实施例的另一种搜索提示词的确定方法的流程图;
图4是根据本申请实施例的另一种搜索提示词的确定方法的流程图;
图5是根据本申请实施例的一种搜索提示词的确定系统的示意图;
图6是根据本申请实施例的另一种搜索提示词的确定方法的流程图;
图7是根据本申请实施例的另一种搜索提示词的确定方法的流程图;
图8是根据本申请实施例的一种客户端设备的示意图;
图9是根据本申请实施例的另一种客户端设备的示意图;
图10是根据本申请实施例的另一种搜索提示词的确定系统的示意图;
图11是根据本申请实施例的一种搜索提示词的确定装置的示意图;
图12是根据本申请实施例的另一种搜索提示词的确定装置的示意图;
图13是根据本申请实施例的另一种搜索提示词的确定装置的示意图;
图14是根据本申请实施例的另一种搜索提示词的确定装置的示意图;
图15是根据本申请实施例的另一种搜索提示词的确定装置的示意图;
图16是根据本申请实施例的信息处理装置的示意图;以及
图17是根据本申请实施例的计算机终端的硬件结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
首先,在对本申请实施例进行描述的过程中出现的部分名词或术语适用于如下解释:
模型参数:是模型内部的配置变量,其值可以根据数据进行估计。模型参数的值定义了可使用的模型。其是从数据估计或获悉的,通常不由编程者手动设置,并且被保存为学习模型的一部分。通常由过去的训练数据中总结得出。
差分隐私算法:一种通过加入随机扰动下的数据隐私的保护方法。
联邦学习算法:一种客户端和服务器端联动的超大规模分布式训练的机器学习算法。
《通用数据保护条例》:欧盟发布并已执行的用户数据保护条例。
相关技术中,在确定提示搜索词时,有两种方式:传统的个性化搜索词建议和非个性化搜索词建议,其中,个性化搜索词建议方案:将用户搜索记录、点击记录保存在云端,具有大规模数据的泄露风险,并将受限于愈加严苛的隐私保护法;而非个性化搜索词建议方案,虽然隐私安全性较好,但是搜索词推荐的效果较差。
为解决上述问题,本申请实施例中利用客户端和服务器进行联邦学习的方式确定搜索提示词,具体原理如图1a所示,包括以下几个步骤:S11,客户端设备接收来自服务器的第一数据,其中,该第一数据为服务器基于第一学习模型对指定类型数据进行分析后确定的;S12,客户端设备基于本地的第二学习模型对第一数据进行处理,得到第二数据;S13,输出第二数据。例如,在客户端侧将发送至服务器侧的通信数据进行匿名化处理,同时服务器端采用数据聚合的方式消除由差分隐私技术导致的样本数据噪声,保证数据可用性。基于以上原理,本申请提供了以下几个实施例,以对搜索提示词的确定过程进行详细说明。
实施例1
根据本申请实施例,提供了一种搜索提示词的确定方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。图1b示出了一种用于实现搜索提示词的确定方法的计算机终端(或移动设备)的硬件结构框图。如图1b所示,计算机终端10(或移动设备10)可以包括一个或多个(图中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输装置。本领域普通技术人员可以理解,图1b所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图1b中所示更多或者更少的组件,或者具有与图1b所示不同的配置。
存储器104可用于存储应用软件的软件程序以及模块,如本申请实施例中的搜索提示词的确定方法对应的程序指令/数据存储装置,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的应用程序的搜索提示词的确定方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
显示器可以例如触摸屏式的液晶显示器(LCD),该液晶显示器可使得用户能够与计算机终端10(或移动设备)的用户界面进行交互。
在上述运行环境下,本申请提供了如图2a所示的搜索提示词的确定方法。该方法包括:
S21,客户端设备接收服务器发送的模型参数和第一候选提示词集合,第一候选提示词集合中包括服务器基于客户端上传的指定类型数据从候选提示词集合中选择的候选提示词。模型参数包括但不限于机器学习模型中的权重、偏置参数值等。
需要说明的是,服务器用于向客户端设备提供搜索引擎,用户在客户端设备上基于搜索引擎进行信息的搜索。
服务器发送的模型参数为对同一搜索引擎下的各个客户端设备上报的模型参数进行聚合后得到的模型参数。这样,可以使得客户端设备可以获得比较可靠的模型参数。其中,聚合的含义包括但不限于将多个模型参数进行组合,或者将各个模型参数取平均值,或者将各个模型参数进行加权平均得到。
第一候选提示词集合中的候选提示词为服务器从本地维护的候选提示词集合中选择得到的,具体地,根据客户端上传的指定类型数据得到选择条件,根据选择条件从候选提示词集合中选择候选提示词,其中,候选提示词集合中的候选词可以为用户输入搜索词后客户端本地存储的相关推荐候选词。指定类型数据可以包括匿名数据,该匿名数据为采用隐私保护算法对采集到的用户的个性化数据进行处理后得到的数据。上述选择条件包括但不限于:点击率等。另外,需要说明的是服务器在选择候选提示词时,除了利用上述方法选择外,还可以利用机器学习模型选择得到,使用粗粒度用户特征及相关的搜索词曝光和点击日志训练逻辑回归等机器学习模型,其中,粗粒度用户特征包括:年龄、性别、购买力等特征。
另外,在本申请的一些实施例中,客户端设备在将数据上传至服务器时,其上传的数据粒度是可以根据用户需求进行配置的,即可以从粗粒度数据(即匿名化数据)和细粒度数据(即个性化数据)中选择一种数据上传,例如:客户端设备接收用户的选择指令;基于该选择指令确定选择指令对应的数据粒度;然后基于选中的数据粒度将相应粒度的数据进行上传,其中,客户端设备接收用户的选择指令的实现方式有多种,例如直接在命令输入框中输入指令,又例如:客户端设备展示一个交互界面,该交互界面中设置有用于选择粗粒度和细粒度数据的选项;基于用户选中的选项确定最终选择的数据粒度。
S22,客户端设备依据模型参数更新本地学习模型,并基于更新后的本地学习模型确定第一候选提示词集合中的候选提示词的排序结果。
获取排序结果的方式有多种,例如:客户端设备将第一候选提示词集合中的候选提示词输入至本地学习模型进行分析,得到候选提示词的评分指标;客户端设备基于评分指标对第一候选提示词集合中的候选提示词进行排序,得到排序结果;其中,评分指标用于对候选词进行评分,并根据评分结果向用户推荐候选词。本地学习模型需要不断进行更新,以准确训练出评分指标,正如上面所述,可以依据来自服务器的模型参数更新本地学习模型。
其中,在利用本地学习模型确定排序结果时,可以分为两个阶段:1),利用本地存储的用户的个性化数据(细粒度特征)确定目标提示词是否被点击(选中):用户ID,用户搜索词记录,城市、当前位置、年龄、性别、购买力等特征,及用户已输入的搜索词前缀,系统曝光的搜索词列表,用户点击的搜索词等数据,对本地学习模型进行训练,训练完成后,该本地学习模型可以输出是否点击目标提示词的输出结果,即确定目标提示词是否被选中。2)统计用于指示搜索词是否被选中的输出结果,并基于统计结果确定目标提示词的使用频率;基于使用频率确定上述评分指标,例如,可以利用使用频率和评分指标的映射关系确定当前使用频率对应的评分指标,其中,使用频率越高,评分指标越大;或者,还可以将使用频率直接作为评分指标。
S23,客户端设备基于评分指标从第一候选提示词集合中确定目标提示词。
例如,基于评分指标对第一候选提示词集合中的候选提示词进行排序,得到排序结果,将排序结果中排序靠前的N个候选提示词作为目标提示词。
在本申请的一些实施例中,目标提示词的评分指标可以从多个维度去获取,例如,将与提示词对应的不同类型的数据输入至本地学习模型中,输出多个评分指标,此时可以对各个评分指标的评分进行加权平均,以确定目标提示词的最终评分指标。在本申请的另一些实施例中,可以将不同类型的数据输入至本地学习模型中,利用本地学习模型内部处理过程,输出一个最终的评分指标。
S24,展示目标提示词。
需要说明的是,目标提示词即为向用户推荐的搜索提示词,用户可以根据目标提示词进行信息的搜索。
具体地,可以通过客户端设备的显示界面中展示目标提示词,例如,在搜索框的下拉列表中展示目标提示词,以供用户选择。
在本申请的一些实施例中,上述指定类型数据可以通过以下方式确定:客户端设备获取目标对象的个性化数据,其中,该个性化数据中至少包括目标对象的搜索行为信息和用于唯一标识目标对象的身份信息;客户端设备采用隐私保护算法对个性化数据进行处理,得到非个性化数据,并将非个性化数据作为指定类型数据。
在一种实施例中,目标对象为用户,目标对象的个性化数据为用户的细粒度特征数据,个性化数据中用于唯一标识目标对象的身份信息可以包括用户ID、设备ID、IP、用户的词嵌入向量、用户当前位置、用户的年龄、用户的性别等特征信息,个性化数据中的搜索行为信息可以包括当前输入的关键词和历史搜索行为日志信息,具体地,可以包括根据购买数据得到的购买力、用户搜索词记录、用户已输入的搜索词前缀、系统曝光的搜索词列表、用户点击的搜索词等特征信息。
需要说明的是,为了防止占用过多内存,客户端设备只存储预设期限内的部分数据,例如,近3个月内的数据。
此外,为了保护用户的隐私,客户端设备获取目标对象的个性化数据后,采用隐私保护算法对个性化数据进行处理,具体地,可以采用差分隐私算法,也可以采用其他隐私保护的噪声算法,去除个性化数据中上报给服务器后可以唯一确定用户的数据,得到非个性化数据,并将得到的非个性化数据作为指定类型数据上报给服务器,具体地,上报给服务器后可以唯一确定用户的数据包括但不限于用户ID、设备ID、IP、用户的词嵌入向量等数据。
根据本申请上述实施例,客户端设备向服务器发送指定类型数据之前,该方法还包括:客户端设备基于个性化数据对本地学习模型进行训练,并统计当前统计周期内本地学习模型的训练次数;客户端设备比较训练次数和预设阈值;客户端设备在训练次数大于预设阈值时,确定允许向服务器发送指定类型数据。
需要说明的是,本地学习模型用于获取候选提示词的评分指标,训练本地学习模型的基础数据为非个性化数据,不断采用获取的非个性化数据对模型进行训练以及更新,以获取可以准确获取评分指标的模型。当训练次数达到预设阈值的情况下,说明本地模型符合要求,将模型参数上传至服务器,并允许向服务器发送指定类型数据。
根据本申请上述实施例,搜索行为信息包括:目标对象针对提示词的历史选择记录、目标对象输入的搜索词前缀、服务器曝光的提示词列表。
需要说明的是,目标对象针对提示词进行选择时,会产生选择记录,搜索行为信息包括用户的历史选择数据;用户在进行搜索时,会首先输入搜索词的前缀,搜索行为信息包括用户输入的搜索词前缀;在用户输入搜索词前,服务器可以提供提示词列表,以供用户选择,搜索行为信息包括服务器曝光的提示词列表。此外,搜索行为信息还包括其他与用户搜索行为相关的数据。
根据本申请上述实施例,客户端设备基于评分指标从第一候选提示词集合中确定目标提示词,包括:客户端设备基于评分指标对第一候选提示词集合中的候选提示词进行排序,将排序靠前的N个候选提示词作为目标提示词。
需要说明的是,根据确定的评价指标和选择的排序算法对第一候选提示词集合中的候选提示词进行排序,具体地,排序方法可以为点对方法、成对方法以及列表方法,排序后将靠前的候选提示词作为目标提示词并予以展示,以供用户选择。
此外,在展示目标关键词后,将展示的目标提示词进行保存,并将用户点击了哪些目标提示词等信息进行存储,为后续进行个性化数据的采集提供数据基础。
根据本申请上述实施例,客户端设备接收的模型参数为对客户端设备的本地学习模型的模型参数和其他客户端设备的学习模型的模型参数进行聚合得到的,其他客户端设备与客户端设备共享服务器提供的同一类型搜索引擎。
需要说明的是,服务器对多个客户端提供搜索引擎,服务器接收同一类型搜索引擎的多个客户端上传的学习模型的模型参数,对模型参数进行聚合,具体地,可以使用联邦平均更新算法进行聚合,也可以采用其他分布式算法进行聚合,并将聚合得到的模型参数作为发送至客户端设备的模型参数,以更新客户端设备的本地学习模型。
如图2b所示,在本申请的一些可选实施例中,客户端设备2向用户展示搜索框20,其中,用户在输入关键词(即搜索词)“参数”后,客户端设备向服务器3请求最新的模型参数,其中,该最新的模型参数为服务器基于客户端设备2和与服务器通信连接的其他客户端设备上传的模型参数聚合得到的;客户端设备基于接收的最新的模型参数对本地学习模型进行更新,并利用更新后的本地学习模型确定当前关键词对应的候选提示词集合,从候选提示词集合中利用图2a所示的方案确定目标提示词并展示,即在搜索框20的下拉框中展示“参数是什么”“参数方程”和“参数方程求导”等搜索提示词;客户端设备2在确定目标提示词后,可以对本地学习模型最终的输出结果进行反馈,并依据反馈结果调整本地学习模型的模型参数;将调整后的模型参数上传至服务器3。其中,在客户端设备2上传模型参数时,需要对其进行匿名化处理,得到匿名数据,并将匿名数据发送至服务器3。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
实施例2
本申请提供了如图3所示的搜索提示词的确定方法。图3是根据本申请实施例二的搜索提示词的确定方法的流程图。
S31,服务器获取不同客户端设备中学习模型的模型参数,不同客户端设备运行有服务器提供的同一类型搜索引擎。
需要说明的是,服务器用于向客户端提供搜索引擎,用户在客户端上基于搜索引擎进行信息的搜索,服务器接收同一类型搜索引擎的多个客户端上传的学习模型的模型参数。
S32,服务器对不同客户端设备对应的模型参数进行聚合处理,得到目标模型参数。
具体地,可以使用联邦平均更新算法进行聚合,也可以采用其他分布式算法进行聚合,并将聚合得到的模型参数作为发送至客户端设备的模型参数,以更新客户端设备的本地学习模型。
S33,服务器接收客户端设备上报的指定类型数据,并基于该指定类型数据从候选提示词集合中选择候选提示词,得到第一候选提示词集合。
需要说明的是,指定类型数据为采用隐私保护算法对采集到的用户的个性化数据进行处理后得到的数据,其中,个性化数据中至少包括目标对象的搜索行为信息和用于唯一标识目标对象的身份信息。
候选提示词集合中的候选词可以为用户输入搜索词后客户端本地存储的相关推荐候选词,根据客户端上传的指定类型数据从候选提示词集合中选择候选提示词,得到第一候选提示词集合。
S34,服务器将第一候选提示词集合和目标模型参数发送至客户端设备。
具体地,将第一候选提示词集合和目标模型参数发送至客户端设备,以依据模型参数更新本地学习模型,并将第一候选提示词集合中的候选提示词输入至本地学习模型进行分析,得到候选提示词的评分指标,以对候选词进行评分,并根据评分结果向用户推荐候选词。
在本申请的一些实施例中,在基于该指定类型数据从候选提示词中选择候选提示词,得到第一候选提示词集合时,可以通过以下方式实现:基于指定类型数据对候选提示词集合中的候选提示词进行排序;将排序靠前的N个候选提示词作为选择的候选提示词。
需要说明的是,根据客户端上传的指定类型数据得到选择条件,根据选择条件从候选提示词集合中选择候选提示词,得到第一候选提示词集合,例如,可以根据指定类型数据得到候选词的点击率、热度等选择条件,对候选提示词集合中的候选词进行排序,取TopN个候选提示词作为选择的候选提示词,以构成第一候选提示词集合;其中,在进行排序之前,还可以对不同类型的体现选择条件的数据采用学习模型进行分类,例如:该学习模型可以为基于逻辑回归算法等的学习模型,可以用于对客户端上传的数据进行分类,然后基于分类后的数据对预设候选提示词进行排序。例如,服务器将接收的非个性化数据(即匿名化数据,例如候选词的点击率、热度等数据)进行分类,然后基于不同类型的数据对预设候选提示词进行排序,取Top N个候选提示词作为选择的候选提示词,以构成第一候选提示词集合。
本申请实施例的优选实施方式可以参见实施例中的相关描述,此处不再赘述。
实施例3
本申请提供了如图4所示的搜索提示词的确定方法。图4是根据本申请实施例三的搜索提示词的确定方法的流程图。
S41,客户端设备接收服务器发送的候选提示词集合。
需要说明的是,服务器用于向客户端提供搜索引擎,用户在客户端上基于搜索引擎进行信息的搜索。候选提示词集合中的候选词可以为用户输入搜索词后客户端本地存储的相关推荐候选词。
S42,客户端设备将候选提示词集合输入至学习模型中进行分析,得到候选提示词的评分指标。
需要说明的是,客户端设备的学习模型用于获取候选提示词的评分指标,候选提示词的评分指标用于对候选词进行评分,并根据评分结果向用户推荐候选词。
S43,客户端设备依据评分指标从候选提示词集合中确定目标提示词。
需要说明的是,评分指标可以为多个,可以根据不同的评分指标从第一候选提示词中确定不同的目标提示词,也可以对各个评分指标的评分进行加权平均,以确定目标提示词。
S44,展示目标提示词。
需要说明的是,目标提示词即为向用户推荐的搜索提示词,用户可以根据目标提示词进行信息的搜索。
具体地,可以通过客户端设备的显示界面中展示目标提示词,例如,在搜索框的下拉列表中展示目标提示词,以供用户选择。
实施例4
本申请提供了如图5所示的搜索提示词的确定系统。图5是根据本申请实施例四的搜索提示词的确定系统的示意图。
具体地,包括进行数据交互的服务端和客户端,服务端包括指定类型数据存储模块、非个性化排序模型训练模块、非个性化排序模块、个性化模型参数聚合模块以及数据存储和分发模块。客户端包括个性化数据存储模块、数据匿名模块、个性化模块训练模块和个性化排序模块。
其中,在服务端,指定类型数据存储模块用于接受客户端发送的指定类型数据,具体地,指定类型数据为采用隐私保护算法对采集到的用户的个性化数据进行处理后得到的数据,包括处理后的年龄、性别、购买力等粗粒度用户特征数据,及用户已输入的搜索词前缀,系统曝光的搜索词列表,用户点击的搜索词等数据,不包括用户ID,设备ID,IP等可能唯一确定用户的数据。
非个性化排序模型训练模块用于使用指定类型数据进行非个性化排序模型的训练。
个性化模块训练模块用于基于客户端上传的指定类型数据从候选提示词集合中选择的候选提示词,并回传到客户端。
个性化模型参数聚合模块用于接收客户端上报的经隐私保护算法处理的后模型参数,使用联邦平均更新算法等算法对个性化模块训练模块进行更新。
数据存储和分发模块用于存储个性化模型参数聚合模块处理后得到的模型参数,并下发更新提醒到客户端。
在客户端,个性化数据存储模块用于存储用户的个性化数据,个性化数据中至少包括目标对象的搜索行为信息和用于唯一标识目标对象的身份信息,具体地,个性化数据中用于唯一标识目标对象的身份信息可以包括用户ID、设备ID、IP、用户的词嵌入向量、用户当前位置、用户的年龄、用户的性别等特征信息,个性化数据中的搜索行为信息可以包括当前输入的关键词和历史搜索行为日志信息,具体地,可以包括根据购买数据得到的购买力、用户搜索词记录、用户已输入的搜索词前缀、系统曝光的搜索词列表、用户点击的搜索词等特征信息。
个性化模型训练模块用于根据个性化数据训练个性化排序模型,当模型更新次数达到预设次数的情况下,将得到的模型发送到数据匿名模块进行模型参数的上报。
数据匿名模块用于采用隐私保护算法对个性化数据进行处理,具体地,可以采用差分隐私算法,也可以采用其他隐私保护的噪声算法,去除个性化数据中上报给服务器后可以唯一确定用户的数据,得到非个性化数据。
个性化排序模块用于采用评分指标对服务器回传的候选词进行排序,得到排序结果,将排序结果的前N个词作为目标提示词,即为向用户推荐的搜索提示词,通过客户端设备的显示界面中展示目标提示词,例如,在搜索框的下拉列表中展示目标提示词,以供用户选择目标提示词并进行信息的搜索。
通过本申请实施例,采用数据去ID化、差分隐私技术等隐私保护算法保证数据匿名性,同时根据数据聚合算法消除由差分隐私技术导致的样本数据噪声,保证了数据可用性。此外,用联邦学习算法使得客户端和服务器采训练的排序模型的有效性,采用双层排序策略保证了推荐的目标提示词的有效性。
实施例5
本申请实施例还提供了一种搜索提示词的确定方法,如图6所示,该方法包括:
步骤S61,客户端设备接收来自服务器的第一候选提示词集合,其中,该第一候选提示词集合为服务器基于第一学习模型从预设候选提示词集合选择的候选提示词确定的;
第一学习模型可以为基于逻辑回归算法等的学习模型,该第一学习模型可以用于对客户端上传的数据进行分类,然后基于分类后的数据对预设候选提示词进行排序。例如,服务器将接收的非个性化数据(即匿名化数据,例如候选词的点击率、热度等数据)进行分类,然后基于不同类型的数据对预设候选提示词进行排序,取Top N个候选提示词作为选择的候选提示词,以构成第一候选提示词集合。
步骤S62,客户端设备基于本地的第二学习模型从第一候选提示词集合中确定目标提示词;
步骤S63,展示目标提示词。
本申请实施例的优选实施方式可以参见实施例1-4中的相关描述,例如,本申请实施例中的第二学习模型可以为实施例1中的客户端设备本地的学习模型,因此,客户端设备的具体功能或执行步骤可以与实施例1中的相同,又例如,本申请实施例中客户端设备在采用第二学习模型确定目标提示词之前,还可以从服务器侧接收聚合后的模型参数,该聚合后的模型参数可以为上述客户端设备与其他客户端设备上传的模型参数。关于其他相关实现过程,此处不再赘述。
实施例6
本申请实施例还提供一种搜索提示词的确定方法,如图7所示,该方法包括:
步骤S71,客户端设备接收来自服务器的第一候选提示词集合,其中,该第一候选提示词集合中的候选提示词是按照预先确定的顺序进行排列的;
可选地,该第一候选提示词集合为服务器基于第一学习模型从预设候选提示词集合选择的候选提示词确定的;第一学习模型可以为基于逻辑回归算法等的学习模型,该第一学习模型可以用于对客户端上传的数据进行分类,然后基于分类后的数据对预设候选提示词进行排序。例如,服务器将接收的非个性化数据(即匿名化数据,例如候选词的点击率、热度等数据)进行分类,然后基于不同类型的数据对预设候选提示词进行排序,取Top N个候选提示词作为选择的候选提示词,以构成第一候选提示词集合。
步骤S72,客户端设备基于第一候选提示词集合中候选提示词的排序结果,确定目标提示词;
可选地,客户端设备在确定目标提示词时,可以直接利用第一候选提示词集合中的排序结果,例如,取前N个候选提示词作为目标提示词。
在本申请的另一些实施例中,还可以基于排序结果确定一个候选目标提示词,然后基于预设规则从候选目标提示词中确定最终的目标提示词,其中,预设规则可以参见实施例1中的相关描述,例如:客户端设备依据从服务器接收的模型参数更新本地学习模型,并基于更新后的本地学习模型对候选目标提示词进行再次排序,得到排序结果;客户端设备基于二次排序后得到的排序结果从第一候选提示词集合中确定最终的目标提示词。
步骤S73,展示目标提示词。
本申请实施例的优选实施方式可以参见实施例1-5中的相关描述,此处不再赘述。
实施例7
本申请实施例还提供一种客户端设备,如图8所示,该设备包括:
通信模块,用于接收来自服务器的第一数据,其中,该第一数据为服务器基于第一学习模型对指定类型数据进行分析后确定的。
具体地,通信模块为支持服务器和客户端设备之间的数据通信的模块,指定类型数据可以为采集用户的个性化数据,对用户的个性数据线进行隐私保护处理后得到的数据。
第一学习模型可以为使用用户特征数据、展示数据以及用户反馈数据训练得到的机器学习模型。例如,在搜索场景下,第一学习模型可以为使用用户特征数据、相关的搜索词曝光和点击日志训练得到的数据。在网页重排场景下,第一学习模型可以为使用用户特征数据、相关的关键词和网页重排结果训练得到的数据。
处理器,用于基于本地的第二学习模型对第一数据进行处理,得到第二数据。
具体地,第二学习模型可以为排序模型,客户端设备基于排序模型对第一数据进行选择,按照预设规则对选择的结果进行排序,并从选取部分排序结果,得到第二数据。例如,预设规则可以为使用频率,根据使用频率对选择的结果进行排序,并从中选择靠前的N个候选提示词作为第二数据。
数据输出模块,用于输出第二数据。
具体地,数据输出模块可以为打印机以及显示器等装置,在数据输出模块为显示器的情况下,可以为客户端设备的显示器,具体地,可以通过客户端设备的显示界面中展示第二数据,可以下拉列表的方式展示第二数据,以供用户选择,还可以采用滚动展示的方式展示第二数据,以供用户选择。
实施例8
本申请实施例还提供一种客户端设备,如图9所示,该设备包括:
通信模块,用于接收服务器发送的模型参数和第一候选提示词集合,第一候选提示词集合中包括服务器基于客户端上传的指定类型数据从候选提示词集合中选择的候选提示词。
需要说明的是,服务器用于向客户端设备提供搜索引擎,用户在客户端上基于搜索引擎进行信息的搜索,通信模块用户支持二者之间的数据传输。
服务器发送的模型参数为对同一搜索引擎下的各个客户端上报的模型参数进行聚合后得到的模型参数。
第一候选提示词集合中的候选提示词从候选提示词集合中选择得到,具体地,根据客户端上传的指定类型数据得到选择条件,根据选择条件从候选提示词集合中选择候选提示词,其中,候选提示词集合中的候选词可以为用户输入搜索词后客户端本地存储的相关推荐候选词,指定类型数据为采用隐私保护算法对采集到的用户的个性化数据进行处理后得到的数据。
处理器,用于依据模型参数更新本地学习模型,并基于更新后的本地学习模型确定第一候选提示词集合中的候选提示词的排序结果;基于排序结果从第一候选提示词集合中确定目标提示词。
需要说明的是,本地学习模型用于获取候选提示词的评分指标,评分指标用于对候选词进行评分,并根据评分结果向用户推荐候选词。本地学习模型需要不断进行更新,以准确训练出评分指标,可以依据模型参数更新本地学习模型。
显示器,用于展示目标提示词。
需要说明的是,目标提示词即为向用户推荐的搜索提示词,用户可以根据目标提示词进行信息的搜索。
具体地,显示器可以为客户端设备的显示器,可以通过客户端设备的显示界面中展示目标提示词,例如,在搜索框的下拉列表中展示目标提示词,以供用户选择。
实施例9
本申请提供了如图10所示的搜索提示词的确定系统。图10是根据本申请实施例五的搜索提示词的确定系统的示意图。
客户端设备和服务器,其中,服务器,用于基于客户端设备上传的指定类型数据从候选提示词集合中选择的提示词,得到第一候选提示词集合,以及向客户端设备发送模型参数。
需要说明的是,服务器用于向客户端提供搜索引擎,用户在客户端上基于搜索引擎进行信息的搜索。
候选提示词集合中的候选词可以为用户输入搜索词后客户端本地存储的相关推荐候选词。根据客户端上传的指定类型数据得到选择条件,根据选择条件从候选提示词集合中选择候选提示词,得到第一候选提示词集合。
向客户端设备发送模型参数为服务器接对一类型搜索引擎的多个客户端上传的学习模型的模型参数进行聚合后得到的模型参数。
客户端设备,用于接收模型参数和第一候选提示词集合;依据模型参数更新本地学习模型,并将第一候选提示词集合中的候选提示词输入至本地学习模型进行分析,得到候选提示词的评分指标;基于评分指标从第一候选提示词集合中确定目标提示词;展示目标提示词。
需要说明的是,客户端设备的本地学习模型用于获取候选提示词的评分指标,评分指标用于对候选词进行评分,并根据评分结果向用户推荐候选词。本地学习模型需要不断进行更新,以准确训练出评分指标,可以依据模型参数更新本地学习模型。
评分指标可以为多个,可以根据不同的评分指标从第一候选提示词中确定不同的目标提示词,也可以对各个评分指标的评分进行加权平均,以确定目标提示词。
具体地,可以通过客户端设备的显示界面中展示目标提示词,例如,在搜索框的下拉列表中展示目标提示词,以供用户选择。
实施例10
根据本申请实施例,还提供了一种用于实施上述搜索提示词的确定方法的装置,如图11所示,该装置包括:
第一接收单元111,用于采用客户端设备接收服务器发送的模型参数和第一候选提示词集合,第一候选提示词集合中包括服务器基于客户端上传的指定类型数据从候选提示词集合中选择的候选提示词。
需要说明的是,服务器用于向客户端提供搜索引擎,用户在客户端上基于搜索引擎进行信息的搜索。
服务器发送的模型参数为对同一搜索引擎下的各个客户端上报的模型参数进行聚合后得到的模型参数。
第一候选提示词集合中的候选提示词从候选提示词集合中选择得到,具体地,根据客户端上传的指定类型数据得到选择条件,根据选择条件从候选提示词集合中选择候选提示词,其中,候选提示词集合中的候选词可以为用户输入搜索词后客户端本地存储的相关推荐候选词,指定类型数据为采用隐私保护算法对采集到的用户的个性化数据进行处理后得到的数据。
更新单元112,用于采用客户端设备依据模型参数更新本地学习模型,并将第一候选提示词集合中的候选提示词输入至本地学习模型进行分析,得到候选提示词的评分指标。
需要说明的是,客户端设备的本地学习模型用于获取候选提示词的评分指标,评分指标用于对候选词进行评分,并根据评分结果向用户推荐候选词。本地学习模型需要不断进行更新,以准确训练出评分指标,可以依据模型参数更新本地学习模型。
第一确定单元113,用于通过客户端设备基于评分指标从第一候选提示词集合中确定目标提示词。
需要说明的是,评分指标可以为多个,可以根据不同的评分指标从第一候选提示词中确定不同的目标提示词,也可以对各个评分指标的评分进行加权平均,以确定目标提示词。
第一展示单元114,用于展示目标提示词。
需要说明的是,目标提示词即为向用户推荐的搜索提示词,用户可以根据目标提示词进行信息的搜索。
具体地,可以通过客户端设备的显示界面中展示目标提示词,例如,在搜索框的下拉列表中展示目标提示词,以供用户选择。
根据本申请上述实施例,该装置还包括:第一获取单元,用于通过客户端设备获取目标对象的个性化数据,其中,该个性化数据中至少包括目标对象的搜索行为信息和用于唯一标识目标对象的身份信息;处理单元,用于通过客户端设备采用隐私保护算法对个性化数据进行处理,得到非个性化数据,并将非个性化数据作为指定类型数据。
在一种实施例中,目标对象为用户,目标对象的个性化数据为用户的细粒度特征数据,个性化数据中用于唯一标识目标对象的身份信息可以包括用户ID、设备ID、IP、用户的词嵌入向量、用户当前位置、用户的年龄、用户的性别等特征信息,个性化数据中的搜索行为信息可以包括当前输入的关键词和历史搜索行为日志信息,具体地,可以包括根据购买数据得到的购买力、用户搜索词记录、用户已输入的搜索词前缀、系统曝光的搜索词列表、用户点击的搜索词等特征信息。
需要说明的是,为了防止占用过多内存,客户端设备只存储预设期限内的部分数据,例如,近3个月内的数据。
此外,为了保护用户的隐私,客户端设备获取目标对象的个性化数据后,采用隐私保护算法对个性化数据进行处理,具体地,可以采用差分隐私算法,也可以采用其他隐私保护的噪声算法,去除个性化数据中上报给服务器后可以唯一确定用户的数据,得到非个性化数据,并将得到的非个性化数据作为指定类型数据上报给服务器,具体地,上报给服务器后可以唯一确定用户的数据包括但不限于用户ID、设备ID、IP、用户的词嵌入向量等数据。
根据本申请上述实施例,该装置还包括:训练单元,用于在客户端设备向服务器发送指定类型数据之前,通过客户端设备基于个性化数据对本地学习模型进行训练,并统计当前统计周期内本地学习模型的训练次数;比较单元,用于采用客户端设备比较训练次数和预设阈值;第二确定单元,用于在训练次数大于预设阈值时,通过客户端设备确定允许向服务器发送指定类型数据。
需要说明的是,本地学习模型用于获取候选提示词的评分指标,训练本地学习模型的基础数据为非个性化数据,不断采用获取的非个性化数据对模型进行训练以及更新,以获取可以准确获取评分指标的模型。当训练次数达到预设阈值的情况下,说明本地模型符合要求,将模型参数上传至服务器,并允许向服务器发送指定类型数据。
根据本申请上述实施例,搜索行为信息包括:目标对象针对提示词的历史选择记录、目标对象输入的搜索词前缀、服务器曝光的提示词列表。
需要说明的是,目标对象针对提示词进行选择时,会产生选择记录,搜索行为信息包括用户的历史选择数据;用户在进行搜索时,会首先输入搜索词的前缀,搜索行为信息包括用户输入的搜索词前缀;在用户输入搜索词前,服务器可以提供提示词列表,以供用户选择,搜索行为信息包括服务器曝光的提示词列表。此外,搜索行为信息还包括其他与用户搜索行为相关的数据。
根据本申请上述实施例,第一确定单元113包括:第一排序模块,用于通过客户端设备基于评分指标对第一候选提示词集合中的候选提示词进行排序,将排序靠前的N个候选提示词作为目标提示词。
需要说明的是,根据确定的评价指标和选择的排序算法对第一候选提示词集合中的候选提示词进行排序,具体地,排序方法可以为点对方法、成对方法以及列表方法,排序后将靠前的候选提示词作为目标提示词并予以展示,以供用户选择。
此外,在展示目标关键词后,将展示的目标提示词进行保存,并将用户点击了哪些目标提示词等信息进行存储,为后续进行个性化数据的采集提供数据基础。
根据本申请上述实施例,客户端设备接收的模型参数为对客户端设备的本地学习模型的模型参数和其他客户端设备的学习模型的模型参数进行聚合得到的,其他客户端设备与客户端设备共享服务器提供的同一类型搜索引擎。
需要说明的是,服务器对多个客户端提供搜索引擎,服务器接收同一类型搜索引擎的多个客户端上传的学习模型的模型参数,对模型参数进行聚合,具体地,可以使用联邦平均更新算法进行聚合,也可以采用其他分布式算法进行聚合,并将聚合得到的模型参数作为发送至客户端设备的模型参数,以更新客户端设备的本地学习模型。
此处需要说明的是,上述单元和模块对应于实施例1中的步骤,上述单元和模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述单元和模块作为装置的一部分可以运行在实施例一提供的计算机终端10中。
实施例11
根据本申请实施例,还提供了一种用于实施上述搜索提示词的确定方法的装置,如图12所示,该装置包括:
第二获取单121,用于通过服务器获取不同客户端设备中学习模型的模型参数,其中,不同客户端设备运行有服务器提供的同一类型搜索引擎。
需要说明的是,服务器用于向客户端提供搜索引擎,用户在客户端上基于搜索引擎进行信息的搜索,服务器接收同一类型搜索引擎的多个客户端上传的学习模型的模型参数。
聚合单元122,用于通过服务器对不同客户端设备对应的模型参数进行聚合处理,得到目标模型参数。
具体地,可以使用联邦平均更新算法进行聚合,也可以采用其他分布式算法进行聚合,并将聚合得到的模型参数作为发送至客户端设备的模型参数,以更新客户端设备的本地学习模型。
选择单元123,用于通过服务器接收客户端设备上报的指定类型数据,并基于该指定类型数据从候选提示词集合中选择候选提示词,得到第一候选提示词集合。
需要说明的是,指定类型数据为采用隐私保护算法对采集到的用户的个性化数据进行处理后得到的数据,其中,个性化数据中至少包括目标对象的搜索行为信息和用于唯一标识目标对象的身份信息。
候选提示词集合中的候选词可以为用户输入搜索词后客户端本地存储的相关推荐候选词,根据客户端上传的指定类型数据从候选提示词集合中选择候选提示词,得到第一候选提示词集合。
发送单元124,用于通过服务器将第一候选提示词集合和目标模型参数发送至客户端设备。
具体地,将第一候选提示词集合和目标模型参数发送至客户端设备,以依据模型参数更新本地学习模型,并将第一候选提示词集合中的候选提示词输入至本地学习模型进行分析,得到候选提示词的评分指标,以对候选词进行评分,并根据评分结果向用户推荐候选词。
根据本申请上述实施例,选择单元123包括:第二排序模块,用于基于指定类型数据对候选提示词集合中的候选提示词进行排序;确定模块,用于将排序靠前的N个候选提示词作为选择的候选提示词。
需要说明的是,根据客户端上传的指定类型数据得到选择条件,根据选择条件从候选提示词集合中选择候选提示词,得到第一候选提示词集合,例如,可以根据指定类型数据得到候选词的点击率、热度等选择条件,对候选提示词集合中的候选词进行排序,取TopN个候选提示词作为选择的候选提示词,以构成第一候选提示词集合。
此处需要说明的是,上述单元和模块对应于实施例2中的步骤,上述单元和模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述单元和模块作为装置的一部分可以运行在实施例一提供的计算机终端10中。
实施例12
根据本申请实施例,还提供了一种用于实施上述搜索提示词的确定方法的装置,如图13所示,该装置包括:
第二接收单元131,用于采用客户端设备接收服务器发送的候选提示词集合。
需要说明的是,服务器用于向客户端提供搜索引擎,用户在客户端上基于搜索引擎进行信息的搜索。候选提示词集合中的候选词可以为用户输入搜索词后客户端本地存储的相关推荐候选词。
第一分析单元132,用于通过客户端设备将候选提示词集合输入至学习模型中进行分析,得到候选提示词的评分指标。
需要说明的是,客户端设备的学习模型用于获取候选提示词的评分指标,候选提示词的评分指标用于对候选词进行评分,并根据评分结果向用户推荐候选词。
第三确定单元133,用于通过客户端设备依据评分指标从候选提示词集合中确定目标提示词。
需要说明的是,评分指标可以为多个,可以根据不同的评分指标从第一候选提示词中确定不同的目标提示词,也可以对各个评分指标的评分进行加权平均,以确定目标提示词。
第二展示单元134,用于展示目标提示词。
需要说明的是,目标提示词即为向用户推荐的搜索提示词,用户可以根据目标提示词进行信息的搜索。
具体地,可以通过客户端设备的显示界面中展示目标提示词,例如,在搜索框的下拉列表中展示目标提示词,以供用户选择。
此处需要说明的是,上述确定模块和发送模块对应于实施例3中的步骤,上述模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中。
实施例13
根据本申请实施例,还提供了一种用于实施上述搜索提示词的确定方法的装置,如图14所示,该装置包括:
第三接收单元141,用于通过客户端设备接收来自服务器的第一候选提示词集合,其中,该第一候选提示词集合为服务器基于第一学习模型从预设候选提示词集合选择的候选提示词确定的。
第一学习模型可以为基于逻辑回归算法等的学习模型,该第一学习模型可以用于对客户端上传的数据进行分类,然后基于分类后的数据对预设候选提示词进行排序。例如,服务器将接收的非个性化数据(即匿名化数据,例如候选词的点击率、热度等数据)进行分类,然后基于不同类型的数据对预设候选提示词进行排序,取Top N个候选提示词作为选择的候选提示词,以构成第一候选提示词集合。
第四确定单元142,用于通过客户端设备基于本地的第二学习模型从第一候选提示词集合中确定目标提示词。
第三展示单元143,用于展示目标提示词。
具体地,可以通过客户端设备的显示界面中展示目标提示词,例如,在搜索框的下拉列表中展示目标提示词,以供用户选择。
此处需要说明的是,上述确定模块和发送模块对应于实施例5中的步骤,上述模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中。
实施例14
根据本申请实施例,还提供了一种用于实施上述搜索提示词的确定方法的装置,如图15所示,该装置包括:
第四接收单元151,用于采用客户端设备接收来自服务器的第一候选提示词集合,其中,该第一候选提示词集合中的候选提示词是按照预先确定的顺序进行排列的。
可选地,该第一候选提示词集合为服务器基于第一学习模型从预设候选提示词集合选择的候选提示词确定的;第一学习模型可以为基于逻辑回归算法等的学习模型,该第一学习模型可以用于对客户端上传的数据进行分类,然后基于分类后的数据对预设候选提示词进行排序。例如,服务器将接收的非个性化数据(即匿名化数据,例如候选词的点击率、热度等数据)进行分类,然后基于不同类型的数据对预设候选提示词进行排序,取Top N个候选提示词作为选择的候选提示词,以构成第一候选提示词集合。
第五确定单元152,用于通过客户端设备基于第一候选提示词集合中候选提示词的排序结果,确定目标提示词。
可选地,客户端设备在确定目标提示词时,可以直接利用第一候选提示词集合中的排序结果,例如,取前N个候选提示词作为目标提示词。
在本申请的另一些实施例中,还可以基于排序结果确定一个候选目标提示词,然后基于预设规则从候选目标提示词中确定最终的目标提示词,其中,预设规则可以参见实施例1中的相关描述,例如:客户端设备依据从服务器接收的模型参数更新本地学习模型,并基于更新后的本地学习模型对候选目标提示词进行再次排序,得到排序结果;客户端设备基于二次排序后得到的排序结果从第一候选提示词集合中确定最终的目标提示词。
第三展示单元153,用于展示目标提示词。
具体地,可以通过客户端设备的显示界面中展示目标提示词,例如,在搜索框的下拉列表中展示目标提示词,以供用户选择。
此处需要说明的是,上述确定模块和发送模块对应于实施例6中的步骤,上述模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中。
实施例15
根据本申请实施例,还提供了一种用于实施上述信息处理方法的装置,如图16所示,该装置包括:
第五接收单元161,用于客户端设备接收来自服务器的第一数据,其中,该第一数据为服务器基于第一学习模型对指定类型数据进行分析后确定的。
具体地,指定类型数据可以为采集用户的个性化数据,对用户的个性数据线进行隐私保护处理后得到的数据。
其中,用户的个性化数据包括用户ID、城市、当前位置、年龄、性别等特征,及用户输入的信息,具体地,在搜索场景下,用户输入的信息可以包括用户输入的搜索词以及用户点击的搜索词等数据,在网页重排场景下,用户输入的信息还可以包括用户输入的网页重排的关键词。
需要说明的是,用户输入信息后,系统会基于输入信息展示相应的数据,用户还会对展示数据进行进一步的反馈,第一学习模型可以为使用用户特征数据、展示数据以及用户反馈数据训练得到的机器学习模型。例如,在搜索场景下,第一学习模型可以为使用用户特征数据、相关的搜索词曝光和点击日志训练得到的数据。在网页重排场景下,第一学习模型可以为使用用户特征数据、相关的关键词和网页重排结果训练得到的数据。
在服务器中的第一学习模型中输入指定类型的数据,第一学习模型基于指定类型数据进行数据分析,得到分析结果。例如,在搜索场景下,输入用户的个性化数据后,第一学习模型可以输出是否点击搜索词对应的提示词的结果,也即,输出提示词是否被选中的结果。得到第一数据后,服务器将第一数据发送至客户端设备,客户端设备接收第一数据,以对第一数据进行进一步的处理。
处理单元162,用于客户端设备基于本地的第二学习模型对第一数据进行处理,得到第二数据。
具体地,第二学习模型可以为排序模型,客户端设备基于排序模型对第一数据进行选择,按照预设规则对选择的结果进行排序,并从选取部分排序结果,得到第二数据。例如,预设规则可以为使用频率,根据使用频率对选择的结果进行排序,并从中选择靠前的N个候选提示词作为第二数据。
输出单元163,用于输出第二数据。
可选地,可以采用展示的方式输出第二数据,具体地,可以通过客户端设备的显示界面中展示第二数据,可以下拉列表的方式展示第二数据,以供用户选择,还可以采用滚动展示的方式展示第二数据,以供用户选择。
实施例16
根据本申请实施例,还提供了一种系统,该系统包括:
处理器;以及
存储器,与处理器连接,用于为处理器提供处理以下处理步骤的指令:
接收服务器发送的模型参数和第一候选提示词集合,第一候选提示词集合中包括服务器基于客户端上传的指定类型数据从候选提示词集合中选择的候选提示词。
需要说明的是,服务器发送的模型参数为对同一搜索引擎下的各个客户端上报的模型参数进行聚合后得到的模型参数。
第一候选提示词集合中的候选提示词从候选提示词集合中选择得到,具体地,根据客户端上传的指定类型数据得到选择条件,根据选择条件从候选提示词集合中选择候选提示词,其中,候选提示词集合中的候选词可以为用户输入搜索词后客户端本地存储的相关推荐候选词,指定类型数据为采用隐私保护算法对采集到的用户的个性化数据进行处理后得到的数据。
依据模型参数更新本地学习模型,并将第一候选提示词集合中的候选提示词输入至本地学习模型进行分析,得到候选提示词的评分指标。
需要说明的是,客户端设备的本地学习模型用于获取候选提示词的评分指标,评分指标用于对候选词进行评分,并根据评分结果向用户推荐候选词。本地学习模型需要不断进行更新,以准确训练出评分指标,可以依据模型参数更新本地学习模型。
基于评分指标从第一候选提示词集合中确定目标提示词。
需要说明的是,评分指标可以为多个,可以根据不同的评分指标从第一候选提示词中确定不同的目标提示词,也可以对各个评分指标的评分进行加权平均,以确定目标提示词。
实施例17
本申请的实施例可以提供一种计算机终端,该计算机终端可以是计算机终端群中的任意一个计算机终端设备。可选地,在本实施例中,上述计算机终端也可以替换为移动终端等终端设备。
可选地,在本实施例中,上述计算机终端可以位于计算机网络的多个网络设备中的至少一个网络设备。
在本实施例中,上述计算机终端可以执行应用程序的搜索提示词的确定方法中以下步骤的程序代码:客户端设备接收服务器发送的模型参数和第一候选提示词集合,第一候选提示词集合中包括服务器基于客户端上传的指定类型数据从候选提示词集合中选择的候选提示词;客户端设备依据模型参数更新本地学习模型,并将第一候选提示词集合中的候选提示词输入至本地学习模型进行分析,得到候选提示词的评分指标;客户端设备基于评分指标从第一候选提示词集合中确定目标提示词;展示目标提示词。
可选地,图17是根据本申请实施例的一种计算机终端的结构框图。如图17所示,该计算机终端A可以包括:一个或多个(图中仅示出一个)处理器、存储器。
其中,存储器可用于存储软件程序以及模块,如本申请实施例中的搜索提示词的确定方法和装置对应的程序指令/模块,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的搜索提示词的确定方法。存储器可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至终端A。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:客户端设备接收服务器发送的模型参数和第一候选提示词集合,第一候选提示词集合中包括服务器基于客户端上传的指定类型数据从候选提示词集合中选择的候选提示词;客户端设备依据模型参数更新本地学习模型,并将第一候选提示词集合中的候选提示词输入至本地学习模型进行分析,得到候选提示词的评分指标;客户端设备基于评分指标从第一候选提示词集合中确定目标提示词;展示目标提示词。
可选的,上述处理器还可以执行如下步骤的程序代码:客户端设备获取目标对象的个性化数据,其中,该个性化数据中至少包括目标对象的搜索行为信息和用于唯一标识目标对象的身份信息;客户端设备采用隐私保护算法对个性化数据进行处理,得到非个性化数据,并将非个性化数据作为指定类型数据。
可选的,上述处理器还可以执行如下步骤的程序代码:客户端设备向服务器发送指定类型数据之前,客户端设备基于个性化数据对本地学习模型进行训练,并统计当前统计周期内本地学习模型的训练次数;客户端设备比较训练次数和预设阈值;客户端设备在训练次数大于预设阈值时,确定允许向服务器发送指定类型数据。
可选的,上述处理器还可以执行如下步骤的程序代码:客户端设备基于评分指标对第一候选提示词集合中的候选提示词进行排序,将排序靠前的N个候选提示词作为目标提示词。
可选的,上述处理器还可以执行如下步骤的程序代码:客户端设备接收的模型参数为对客户端设备的本地学习模型的模型参数和其他客户端设备的学习模型的模型参数进行聚合得到的,其他客户端设备与客户端设备共享服务器提供的同一类型搜索引擎。
本申请实施例中,采用客户端设备接收服务器发送的模型参数和第一候选提示词集合,第一候选提示词集合中包括服务器基于客户端上传的指定类型数据从候选提示词集合中选择的候选提示词;客户端设备依据模型参数更新本地学习模型,并将第一候选提示词集合中的候选提示词输入至本地学习模型进行分析,得到候选提示词的评分指标;客户端设备基于评分指标从第一候选提示词集合中确定目标提示词;展示目标提示词的方式,通过基于客户端上传的指定类型数据从候选提示词集合中选择的候选提示词,并基于评分指标从第一候选提示词集合中确定目标提示词,达到了不直接采用用户个性化数据为用户提供搜索建议的目的,进而解决了无法同时兼顾个性化搜索词的搜索效果以及非个性化搜索词建议方案的安全性的技术问题。
本领域普通技术人员可以理解,图17所示的结构仅为示意,计算机终端也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌声电脑以及移动互联网设备(MobileInternet Devices,MID)、PAD等终端设备。图17其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图17中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图17所示不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(RandomAccess Memory,RAM)、磁盘或光盘等。
实施例18
本申请的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于保存上述实施例一所提供的搜索提示词的确定方法所执行的程序代码。
可选地,在本实施例中,上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:客户端设备接收服务器发送的模型参数和第一候选提示词集合,第一候选提示词集合中包括服务器基于客户端上传的指定类型数据从候选提示词集合中选择的候选提示词;客户端设备依据模型参数更新本地学习模型,并将第一候选提示词集合中的候选提示词输入至本地学习模型进行分析,得到候选提示词的评分指标;客户端设备基于评分指标从第一候选提示词集合中确定目标提示词;展示目标提示词。
可选的,上述处理器还可以执行如下步骤的程序代码:客户端设备获取目标对象的个性化数据,其中,该个性化数据中至少包括目标对象的搜索行为信息和用于唯一标识目标对象的身份信息;客户端设备采用隐私保护算法对个性化数据进行处理,得到非个性化数据,并将非个性化数据作为指定类型数据。
可选的,上述处理器还可以执行如下步骤的程序代码:客户端设备向服务器发送指定类型数据之前,客户端设备基于个性化数据对本地学习模型进行训练,并统计当前统计周期内本地学习模型的训练次数;客户端设备比较训练次数和预设阈值;客户端设备在训练次数大于预设阈值时,确定允许向服务器发送指定类型数据。
可选的,上述处理器还可以执行如下步骤的程序代码:客户端设备基于评分指标对第一候选提示词集合中的候选提示词进行排序,将排序靠前的N个候选提示词作为目标提示词。
可选的,上述处理器还可以执行如下步骤的程序代码:客户端设备接收的模型参数为对客户端设备的本地学习模型的模型参数和其他客户端设备的学习模型的模型参数进行聚合得到的,其他客户端设备与客户端设备共享服务器提供的同一类型搜索引擎。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (17)
1.一种搜索提示词的确定方法,包括:
客户端设备接收服务器发送的模型参数和第一候选提示词集合,所述第一候选提示词集合中包括所述服务器基于所述客户端上传的指定类型数据从候选提示词集合中选择的候选提示词;
所述客户端设备依据所述模型参数更新本地学习模型,并基于更新后的本地学习模型确定所述第一候选提示词集合中的候选提示词的排序结果;
所述客户端设备基于所述排序结果从所述第一候选提示词集合中确定目标提示词;
展示所述目标提示词。
2.根据权利要求1所述的方法,其中,所述方法还包括:
所述客户端设备获取目标对象的个性化数据,其中,该个性化数据中至少包括目标对象的搜索行为信息和用于唯一标识所述目标对象的身份信息;
所述客户端设备采用隐私保护算法对所述个性化数据进行处理,得到非个性化数据,并将所述非个性化数据作为所述指定类型数据。
3.根据权利要求2所述的方法,其中,客户端设备向服务器发送指定类型数据之前,所述方法还包括:
所述客户端设备基于所述个性化数据对所述本地学习模型进行训练,并统计当前统计周期内所述本地学习模型的训练次数;
所述客户端设备比较所述训练次数和预设阈值;
所述客户端设备在所述训练次数大于所述预设阈值时,确定允许向所述服务器发送所述指定类型数据。
4.根据权利要求2所述的方法,其中,所述搜索行为信息包括:所述目标对象针对提示词的历史选择记录、所述目标对象输入的搜索词前缀、所述服务器曝光的提示词列表。
5.根据权利要求1所述的方法,其中,基于更新后的本地学习模型确定所述第一候选提示词集合中的候选提示词的排序结果,包括:
所述客户端设备将所述第一候选提示词集合中的候选提示词输入至所述本地学习模型进行分析,得到所述候选提示词的评分指标;
所述客户端设备基于所述评分指标对所述第一候选提示词集合中的候选提示词进行排序,得到所述排序结果;
所述客户端设备基于所述排序结果从所述第一候选提示词集合中确定目标提示词,包括:将所述排序结果中排序靠前的N个候选提示词作为所述目标提示词。
6.根据权利要求1所述的方法,其中,所述客户端设备接收的模型参数为对所述客户端设备的本地学习模型的模型参数和其他客户端设备的学习模型的模型参数进行聚合得到的,所述其他客户端设备与所述客户端设备共享所述服务器提供的同一类型搜索引擎。
7.一种搜索提示词的确定方法,包括:
服务器获取不同客户端设备中学习模型的模型参数,其中,所述不同客户端设备运行有所述服务器提供的同一类型搜索引擎;
所述服务器对不同客户端设备对应的所述模型参数进行聚合处理,得到目标模型参数;
所述服务器接收所述客户端设备上报的指定类型数据,并基于该指定类型数据从候选提示词集合中选择候选提示词,得到第一候选提示词集合;
所述服务器将所述第一候选提示词集合和所述目标模型参数发送至所述客户端设备。
8.根据权利要求7所述的方法,其中,基于该指定类型数据从候选提示词中选择候选提示词,得到第一候选提示词集合,包括:
基于所述指定类型数据对所述候选提示词集合中的候选提示词进行排序;
将排序靠前的N个候选提示词作为选择的候选提示词。
9.一种搜索提示词的确定方法,包括:
客户端设备接收服务器发送的候选提示词集合;
所述客户端设备将所述候选提示词集合输入至学习模型中进行分析,得到所述候选提示词的评分指标;
所述客户端设备依据所述所述评分指标从所述候选提示词集合中确定目标提示词;
展示所述目标提示词。
10.一种搜索提示词的确定方法,包括:
客户端设备接收来自服务器的第一候选提示词集合,其中,该第一候选提示词集合为所述服务器基于第一学习模型从预设候选提示词集合选择的候选提示词确定的;
所述客户端设备基于本地的第二学习模型从所述第一候选提示词集合中确定目标提示词;
展示所述目标提示词。
11.一种搜索提示词的确定方法,包括:
客户端设备接收来自服务器的第一候选提示词集合,其中,该第一候选提示词集合中的候选提示词是按照预先确定的顺序进行排列的;
所述客户端设备基于所述第一候选提示词集合中候选提示词的排序结果,确定目标提示词;
展示所述目标提示词。
12.一种信息处理方法,包括:
客户端设备接收来自服务器的第一数据,其中,该第一数据为所述服务器基于第一学习模型对指定类型数据进行分析后确定的;
所述客户端设备基于本地的第二学习模型对所述第一数据进行处理,得到第二数据;
输出所述第二数据。
13.一种客户端设备,包括:
通信模块,用于接收来自服务器的第一数据,其中,该第一数据为所述服务器基于第一学习模型对指定类型数据进行分析后确定的;
处理器,用于基于本地的第二学习模型对所述第一数据进行处理,得到第二数据;
数据输出模块,用于输出所述第二数据。
14.一种客户端设备,包括:
通信模块,用于接收服务器发送的模型参数和第一候选提示词集合,所述第一候选提示词集合中包括所述服务器基于客户端上传的指定类型数据从候选提示词集合中选择的候选提示词;
处理器,用于依据所述模型参数更新本地学习模型,并基于更新后的本地学习模型确定所述第一候选提示词集合中的候选提示词的排序结果;基于所述排序结果从所述第一候选提示词集合中确定目标提示词;
显示器,用于展示所述目标提示词。
15.一种搜索提示词的确定系统,包括:客户端设备和服务器,其中,
所述服务器,用于基于所述客户端设备上传的指定类型数据从候选提示词集合中选择的提示词,得到第一候选提示词集合,以及向所述客户端设备发送模型参数;
所述客户端设备,用于接收服务器发送的模型参数和第一候选提示词集合,所述第一候选提示词集合中包括所述服务器基于所述客户端上传的指定类型数据从候选提示词集合中选择的候选提示词;依据所述模型参数更新本地学习模型,并基于更新后的本地学习模型确定所述第一候选提示词集合中的候选提示词的排序结果;基于所述排序结果从所述第一候选提示词集合中确定目标提示词;展示所述目标提示词。
16.一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至6中任意一项所述的搜索提示词的确定方法。
17.一种系统,包括:
处理器;以及
存储器,与所述处理器连接,用于为所述处理器提供处理以下处理步骤的指令:
接收服务器发送的模型参数和第一候选提示词集合,所述第一候选提示词集合中包括所述服务器基于客户端上传的指定类型数据从候选提示词集合中选择的候选提示词;依据所述模型参数更新本地学习模型,并基于更新后的本地学习模型确定所述第一候选提示词集合中的候选提示词的排序结果;基于所述排序结果从所述第一候选提示词集合中确定目标提示词;展示所述目标提示词。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911251642.8A CN113032819A (zh) | 2019-12-09 | 2019-12-09 | 搜索提示词的确定方法、系统以及信息处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911251642.8A CN113032819A (zh) | 2019-12-09 | 2019-12-09 | 搜索提示词的确定方法、系统以及信息处理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113032819A true CN113032819A (zh) | 2021-06-25 |
Family
ID=76451351
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911251642.8A Pending CN113032819A (zh) | 2019-12-09 | 2019-12-09 | 搜索提示词的确定方法、系统以及信息处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113032819A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114428907A (zh) * | 2022-01-27 | 2022-05-03 | 北京百度网讯科技有限公司 | 信息搜索方法、装置、电子设备及存储介质 |
CN117272988A (zh) * | 2023-11-13 | 2023-12-22 | 荣耀终端有限公司 | 优化提示词的方法、电子设备 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103631929A (zh) * | 2013-12-09 | 2014-03-12 | 江苏金智教育信息技术有限公司 | 一种用于搜索的智能提示的方法、模块和系统 |
CN104424300A (zh) * | 2013-08-30 | 2015-03-18 | 北京千橡网景科技发展有限公司 | 个性化搜索提示方法及装置 |
CN105912669A (zh) * | 2012-09-20 | 2016-08-31 | 北京奇虎科技有限公司 | 用于补全搜索词及建立个体兴趣模型的方法及装置 |
WO2017041372A1 (zh) * | 2015-09-07 | 2017-03-16 | 百度在线网络技术(北京)有限公司 | 基于人工智能的人机交互方法和系统 |
US9785798B1 (en) * | 2015-01-23 | 2017-10-10 | Nacho Cove Inc. | Privacy-protecting inter-user digital communication message search |
CN108227955A (zh) * | 2017-12-29 | 2018-06-29 | 北京奇虎科技有限公司 | 一种基于用户历史搜索推荐输入联想的方法及装置 |
CN109213920A (zh) * | 2017-06-29 | 2019-01-15 | 阿里巴巴集团控股有限公司 | 搜索方法、客户端、服务器和存储介质 |
US20190227980A1 (en) * | 2018-01-22 | 2019-07-25 | Google Llc | Training User-Level Differentially Private Machine-Learned Models |
-
2019
- 2019-12-09 CN CN201911251642.8A patent/CN113032819A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105912669A (zh) * | 2012-09-20 | 2016-08-31 | 北京奇虎科技有限公司 | 用于补全搜索词及建立个体兴趣模型的方法及装置 |
CN104424300A (zh) * | 2013-08-30 | 2015-03-18 | 北京千橡网景科技发展有限公司 | 个性化搜索提示方法及装置 |
CN103631929A (zh) * | 2013-12-09 | 2014-03-12 | 江苏金智教育信息技术有限公司 | 一种用于搜索的智能提示的方法、模块和系统 |
US9785798B1 (en) * | 2015-01-23 | 2017-10-10 | Nacho Cove Inc. | Privacy-protecting inter-user digital communication message search |
WO2017041372A1 (zh) * | 2015-09-07 | 2017-03-16 | 百度在线网络技术(北京)有限公司 | 基于人工智能的人机交互方法和系统 |
CN109213920A (zh) * | 2017-06-29 | 2019-01-15 | 阿里巴巴集团控股有限公司 | 搜索方法、客户端、服务器和存储介质 |
CN108227955A (zh) * | 2017-12-29 | 2018-06-29 | 北京奇虎科技有限公司 | 一种基于用户历史搜索推荐输入联想的方法及装置 |
US20190227980A1 (en) * | 2018-01-22 | 2019-07-25 | Google Llc | Training User-Level Differentially Private Machine-Learned Models |
Non-Patent Citations (2)
Title |
---|
WANG, X等: "A Picture is Worth a Thousand Words: Share Your Real-Time View on the Road", 《 IEEE TRANSACTIONS ON VEHICULAR TECHNOLOGY》, vol. 66, no. 4, 1 April 2017 (2017-04-01), pages 2902 - 2914, XP011645883, DOI: 10.1109/TVT.2016.2592685 * |
皮俊波;陈珂;陈刚;董金祥;: "基于用户兴趣模型两段式排序的隐私保护方法", 浙江大学学报(工学版), no. 09, 15 September 2010 (2010-09-15) * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114428907A (zh) * | 2022-01-27 | 2022-05-03 | 北京百度网讯科技有限公司 | 信息搜索方法、装置、电子设备及存储介质 |
WO2023142399A1 (zh) * | 2022-01-27 | 2023-08-03 | 北京百度网讯科技有限公司 | 信息搜索方法、装置、电子设备 |
CN114428907B (zh) * | 2022-01-27 | 2024-05-28 | 北京百度网讯科技有限公司 | 信息搜索方法、装置、电子设备及存储介质 |
CN117272988A (zh) * | 2023-11-13 | 2023-12-22 | 荣耀终端有限公司 | 优化提示词的方法、电子设备 |
CN117272988B (zh) * | 2023-11-13 | 2024-04-19 | 荣耀终端有限公司 | 优化提示词的方法、电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2017202248B2 (en) | Intent prediction based recommendation system | |
CN105447730B (zh) | 目标用户定向方法及装置 | |
KR101895536B1 (ko) | 어플리케이션 사용에 따른 어플리케이션 추천 서버 및 단말, 그리고 어플리케이션 추천 방법 | |
US9600600B2 (en) | Method and system for evaluating query suggestions quality | |
US10332184B2 (en) | Personalized application recommendations | |
US9754306B2 (en) | Recommendation engine with profile analysis | |
US9262742B2 (en) | User list identification | |
US10402465B1 (en) | Content authority ranking using browsing behavior | |
US20090216639A1 (en) | Advertising selection and display based on electronic profile information | |
US9864951B1 (en) | Randomized latent feature learning | |
US9836554B2 (en) | Method and system for providing query suggestions including entities | |
CN107784066A (zh) | 信息推荐方法、装置、服务器及存储介质 | |
US20110066507A1 (en) | Context Enhanced Marketing of Content and Targeted Advertising to Mobile Device Users | |
US20120023085A1 (en) | Social graph search system | |
US20130238390A1 (en) | Informing sales strategies using social network event detection-based analytics | |
US20180247247A1 (en) | Method and system for search provider selection based on performance scores with respect to each search query | |
US20170046735A1 (en) | Visitor Identification based on Feature Selection | |
KR20120076477A (ko) | 상점 추천 방법 및 시스템 | |
US11900424B2 (en) | Automatic rule generation for next-action recommendation engine | |
US20150348059A1 (en) | System and method for determining the shopping phase of a shopper | |
US20150248720A1 (en) | Recommendation engine | |
KR101870980B1 (ko) | 애플리케이션 추천 시스템, 방법 및 그에 대한 기록매체 | |
CN113032819A (zh) | 搜索提示词的确定方法、系统以及信息处理方法 | |
US10474688B2 (en) | System and method to recommend a bundle of items based on item/user tagging and co-install graph | |
CN111177564B (zh) | 一种产品推荐方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |