CN113869063A - 数据推荐方法、装置、电子设备及存储介质 - Google Patents

数据推荐方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN113869063A
CN113869063A CN202111182460.7A CN202111182460A CN113869063A CN 113869063 A CN113869063 A CN 113869063A CN 202111182460 A CN202111182460 A CN 202111182460A CN 113869063 A CN113869063 A CN 113869063A
Authority
CN
China
Prior art keywords
target
feature vector
data
determining
displaying
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111182460.7A
Other languages
English (en)
Inventor
姚利军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vivo Mobile Communication Co Ltd
Original Assignee
Vivo Mobile Communication Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vivo Mobile Communication Co Ltd filed Critical Vivo Mobile Communication Co Ltd
Priority to CN202111182460.7A priority Critical patent/CN113869063A/zh
Publication of CN113869063A publication Critical patent/CN113869063A/zh
Priority to PCT/CN2022/124028 priority patent/WO2023061276A1/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Abstract

本申请提供了一种数据推荐方法、装置、电子设备及存储介质。该方法包括:在显示目标页面的情况下,确定目标页面对应的词向量;将词向量输入至深度学习模型中,确定与词向量匹配的目标数据;显示目标数据。这样,当用户在线上提交业务相关的数据时,不需要用户通过较为繁琐的操作对数据进行定位,而是在显示目标页面的情况下,直接显示目标数据,减少了用户对数据进行定位的操作步骤,向用户推荐相关数据,以此提高了数据上传的便捷性。

Description

数据推荐方法、装置、电子设备及存储介质
技术领域
本申请属于互联网技术领域,具体涉及一种数据推荐方法、装置、电子设备及存储介质。
背景技术
随着移动互联网的快速发展,越来越多的用户选择使用电子设备办理线上业务。然而,当用户在线上提交业务相关的数据时,例如,用户在线上提交业务相关的文件时,需要人工对电子设备存储的所有数据进行查看,定位到相关数据后,再上传数据。
在上述过程中,用户需要通过较为繁琐的操作查询业务相关的数据,这降低了数据上传的便捷性。
发明内容
本申请实施例的目的是一种数据推荐方法、装置、电子设备及存储介质,能够解决用户需要通过较为繁琐的操作对数据进行定位,进而降低数据上传的便捷性的问题。
第一方面,本申请实施例提供了一种数据推荐方法,该方法包括:
在显示目标页面的情况下,确定所述目标页面对应的词向量;
将所述词向量输入至深度学习模型中,确定与所述词向量匹配的目标数据;
显示所述目标数据。
第二方面,本申请实施例提供了一种数据推荐装置,该装置包括:
第一确定模块,用于在显示目标页面的情况下,确定所述目标页面对应的词向量;
第二确定模块,用于将所述词向量输入深度学习模型中,确定与所述词向量匹配的目标数据;
第一显示模块,用于显示所述目标数据。
第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。
第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。
第五方面,本申请实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的方法。
本申请实施例中,在显示目标页面的情况下,确定目标页面对应的词向量;将词向量输入至深度学习模型中,确定与词向量匹配的目标数据;显示目标数据。这样,当用户在线上提交业务相关的数据时,不需要用户通过较为繁琐的操作对数据进行定位,而是在显示目标页面的情况下,直接显示目标数据,减少了用户对数据进行定位的操作步骤,向用户推荐相关数据,以此提高了数据上传的便捷性。
附图说明
图1是本申请实施例提供的深度学习模型的示意图;
图2是本申请实施例提供的文件分析模型的示意图;
图3是本申请实施例提供的用户行为模型的示意图;
图4是本申请实施例提供的数据推荐方法的流程图;
图5是本申请实施例提供的数据推荐方法的应用场景图之一;
图6是本申请实施例提供的数据推荐方法的应用场景图之二;
图7是本申请实施例提供的数据推荐方法的流程示意图;
图8是本申请实施例提供的数据推荐装置的结构图;
图9是本申请实施例提供的电子设备的结构图;
图10是本申请实施例提供的电子设备的硬件结构图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
为更好理解本申请提供的方案,首先对以下内容进行描述:
请查阅图1,图1是本申请实施例提供的深度学习模型的示意图,如图1所示,上述深度学习模型可以为DSSM模型,一般而言,DSSM模型由2个网络模型在一个联邦学习环境得到,其中,联邦学习是一种机器学习技术。DSSM模型又称双塔模式,其中,一个网络模型可以是文件分析模型,另一个网络模型可以是用户行为模型。
请参阅图2和图3,如图2所示,DSSM模型中的一个网络模型是文件分析模型。文件分析模型的训练过程为:获取训练文件的文件类型和关键词,将上述文件类型和关键词转换成词向量,上述词向量又称为语义嵌入向量,其中,可以使用词嵌入技术得到语义嵌入向量。将语义嵌入向量作为文件分析模型的训练样本,使得文件分析模型输出文件特征向量,应理解,该文件特征向量与训练文件相关联。
其中,在获取训练文件的文件类型和关键词的过程中,可以基于文件类型和关键词确定训练文件的安全等级,确定安全等级较高的隐私文件。
其中,在文件分析模型的训练过程中,将训练文件与对应的文件特征向量存储至预设的映射表,也就是说,该映射表存储有文件特征向量与训练文件之间的映射关系。
如图3所示,DSSM模型中的一个网络模型是用户行为模型。用户行为模型的训练过程为:将可以表征用户行为的相关信息作为训练信息,例如显示页面对应的语义嵌入向量、用户的操作数据和用户的上传文件等;将这些训练信息作为用户行为模型的训练样本,使得用户行为模型输出行为特征向量,应理解,该行为特征向量用于表征用户的操作行为,该操作行为包括用户在特定场景中对于文件选择的偏好。
在DSSM模型的训练过程中,可以将行为特征向量和文件特征向量存储至预设的数据库,并基于行为特征向量和文件特征向量之间的关联性,调整行为特征向量的存储位置和文件特征向量的存储位置。
例如,在文件分析模型的一次训练过程中,该文件分析模型的输入是身份文件,输出是该身份文件对应的文件特征向量;在用户行为模型的一次训练过程中,若用户行为模型的输入包括身份文件和用户的操作数据,则可以将用户行为模型输出的行为特征向量与该身份文件对应的文件特征向量存储至数据库,并在数据库中调整该行为特征向量的存储位置与文件特征向量的存储位置,以减小该行为特征向量与该文件特征向量之间的欧式距离。
下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的数据推荐方法进行详细地说明。
本申请实施例中涉及的数据可以是文件、用户信息或账户信息等,出于清楚阐述技术方案的目的,以下以数据为文件的实施场景进行方案的阐述,应理解,在此并不对数据进行具体的限定。
请参阅图4,图4是本申请实施例提供的数据推荐方法的流程图。本申请实施例提供的数据推荐方法包括以下步骤:
S101,在显示目标页面的情况下,确定所述目标页面对应的词向量。
上述目标页面可以是数据上传页面,上述词向量即语义嵌入向量。数据上传页面可以是某网站的,也可以是某应用程序的。其中,对于一个应用程序而言,该应用程序关联的目标页面对应的词向量可以是相同的,也可以是不同的,这里不做具体限定。不同应用程序也可以有相同的目标页面,例如,不同银行应用程序都有身份证上传页面,对于不同应用程序而言,该应用程序的目标页面对应的词向量可以是相同的,也可以是不同的,这里不做具体限定。
一种可选地实施方式为,目标页面可以是预先设置的,若当前显示页面为预设页面,则确定当前显示页面为目标页面;另一种可选地实施方式为,对当前显示页面进行光学字符识别(optical character recognition,OCR),若检测到特定字段,例如“文件上传”、“图片上传”等,则确定当前显示页面为目标页面。
为便于理解,请参阅图5,图5是本申请实施例提供的数据推荐方法的应用场景图之一。图5示出的就是一种目标页面的场景。
应理解,关于如何确定该目标页面对应的词向量的具体技术方案,请参阅后续实施例。
目标页面对应的词向量可以有一个或多个,通常情况下,词向量的个数为多个。
S102,将所述词向量输入至深度学习模型中,确定与所述词向量匹配的目标数据。
如上所述,可以将目标页面对应的词向量输入至训练完成的DSSM模型中,确定与词向量匹配的目标数据。其中,上述目标数据也就是深度学习模型推荐的与上述词向量匹配度较高的数据。具体的技术方案,请参阅后续实施例。
S103,显示所述目标数据。
本步骤中,在确定目标数据后,在当前页面显示目标数据。
本实施例中,在显示目标页面的情况下,确定目标页面对应的词向量;将词向量输入至深度学习模型中,确定与词向量匹配的目标数据;显示目标数据。这样,当用户在线上提交业务相关的数据时,不需要用户通过较为繁琐的操作对数据进行定位,而是在显示目标页面的情况下,直接显示目标数据,减少了用户对数据进行定位的操作步骤,向用户推荐相关数据,以此提高了数据上传的便捷性。
可选地,所述将所述词向量输入至深度学习模型中,确定与所述词向量匹配的目标数据包括:
将所述词向量输入至深度学习模型中,得到第一目标特征向量;
确定所述第一目标特征向量在数据库中对应的至少一个第二目标特征向量;
将所述第二目标特征向量对应的数据确定为所述目标数据。
本实施例中,可以将词向量输入至用户行为分析模型中,得到第一目标特征向量,其中,该第一目标特征向量为表征用户行为的行为特征向量。
本实施例中,预先设置有数据库,该数据库存储有第一特征向量和第二特征向量,在得到第一目标特征向量后,可以在数据库中对该第一目标特征向量使用最邻近搜索算法或者其他方法,确定该第一目标特征向量对应的至少一个第二目标特征向量。其中,上述第二目标特征向量为文件特征向量,第二目标特征向量用于表征文件。
如上所述,在文件分析模型的训练过程中,需要将训练文件与对应的文件特征向量存储至预设的映射表。
本实施例中,在得到第二目标特征向量之后,将第二目标特征向量输入至预设的映射表中,得到对应的目标数据,其中,映射表存储有第二目标特征向量与数据之间的映射关系,进一步的,将通过映射表查询得到的数据确定为目标数据。
可选地,所述确定所述第一目标特征向量在数据库中对应的至少一个第二目标特征向量包括:
确定所述第一目标特征向量在所述数据库中的存储位置;
基于所述存储位置,使用最邻近搜索算法,得到所述第一目标特征向量与第二特征向量之间的欧式距离;
将所述欧式距离小于或等于预设阈值的第二特征向量确定为所述第二目标特征向量。
本实施例中,在得到第一目标特征向量后,确定第一目标特征向量在数据库中的存储位置。应理解,数据库存储有第一特征向量和第二特征向量,第一目标特征向量为第一特征向量,第二目标特征向量为第二特征向量,其中,第一特征向量为表征用户行为的行为特征向量,第二特征向量为表征文件的文件特征向量。
在该存储位置的基础上,使用最邻近搜索算法,得到第一目标特征向量与第二特征向量之间的欧式距离,上述欧式距离用于表征向量之间的距离。在其他实施例中,也可以使用其他方法计算向量之间的欧式距离,在此不作具体限定。
进一步的,将欧式距离小于或等于预设阈值的第二特征向量确定为第二目标特征向量,其中,第二目标特征向量可以为多个。
本实施例中,基于第一目标特征向量与第二特征向量之间的欧式距离,确定与第一目标特征向量相关联的第二目标特征向量。
可选地,所述显示所述目标数据包括:
按照欧式距离从小到大的顺序,显示所述第二目标特征向量对应的目标数据。
应理解,一个第二目标特征向量对应一个目标数据。本实施例中,在得到第二目标特征向量后,按照各个第二目标特征向量与第一目标特征向量之间的欧式距离从小到大的顺序,显示第二目标特征向量对应的目标数据。也就是说,显示的第一个目标数据对应的第二目标特征向量与第一目标特征向量之间的欧式距离最小,显示的最后一个目标数据对应的第二目标特征向量与第一目标特征向量之间的欧式距离最大。
应理解,在DSSM模型的训练过程中,若行为特征向量与文件特征向量之间的相关性越强,则这两个特征向量之间的欧式距离越短。
本实施例中,对目标数据进行排序显示,将与第一目标特征向量强相关的第二目标特征向量对应的目标数据排序在前,以此优先显示与目标页面具有关联性的目标数据,用户不需要执行相关操作来查询目标数据,进而提高了数据上传的便捷性。
可选地,所述显示所述目标数据包括:
获取所述目标数据对应的数据类型和关键词;
在所述数据类型为预设类型和/或所述关键词包括预设字段的情况下,在所述目标数据的预设区域显示提醒标识。
本实施例中,在确定第二目标特征向量对应的目标数据之后,获取目标数据对应的数据类型和关键词。
一种可选地实施方式为,在数据类型为预设类型的情况下,表明目标数据的内容涉及隐私信息,将目标数据确定为隐私数据,目标数据的安全等级较高。
另一种可选地实施方式为,在关键词包括预设字段的情况下,将目标数据确定为隐私数据。其中,上述关键词可以是数据名称中的关键词,或者,对数据文件进行OCR处理后得到的关键词。
另一种可选地实施方式为,在数据类型为预设类型且关键词包括预设字段的情况下,将目标数据确定为隐私数据。
进一步的,在目标数据的预设区域显示提醒标识,该提醒标识包括但不限于文字、图像或图形。
本实施例中,根据目标数据的数据类型和关键词,确定涉及隐私信息的目标数据,并在隐私数据的预设区域显示提醒标识提醒用户,提高后续的数据上传过程的安全性。
为便于理解,请参阅图6,图6是本申请实施例提供的数据推荐方法的应用场景图之二。如图6所示,目标数据的预设区域显示有虚线框,该虚线框即为提醒标识,提醒用户该文件为隐私数据。在图6所示的场景中,若目标数据为图片文件,则直接显示该图片;若目标数据为文件,则显示文件预览图。
可选地,所述显示所述目标数据之后,所述方法包括:
接收用户对所述目标数据的输入;
在所述目标页面对应的应用程序为目标应用程序的情况下,显示提醒信息。
上述输入可以是用户对目标数据的触控输入或滑动输入或其他类型的输入。
本实施例中,在接收到用户对目标数据的输入后,检测目标页面对应的应用程序和目标对应的安全等级。在目标页面对应的应用程序为目标应用程序,且目标数据为隐私数据的情况下,显示提醒信息。
应理解,可以通过应用程序的类别判断目标页面关联的应用程序是否为目标应用程序,可选地,上述目标应用程序为非政企类应用程序,例如通讯类应用程序或影视类应用程序。
应理解,上述提醒信息可以是文字信息或语音信息。示例性的,上述提醒信息可以是在目标页面显示的弹窗,弹窗内容为“当前为隐私文件,继续选择可能导致隐私泄露”这一文字信息。
在其他实施例中,若目标页面对应的应用程序不是目标应用程序,或目标数据不是隐私数据,则在接收到用户对目标数据的输入后,不会显示提醒信息。
本实施例中,在目标页面对应的应用程序为目标应用程序,且目标数据为隐私数据的情况下,显示提醒信息,以此防止用户泄露隐私数据,进而提高数据上传的安全性。
以下,具体阐述确定目标页面对应的词向量的技术方案:
可选地,所述确定所述目标页面对应的词向量包括:
对所述目标页面进行光学字符识别处理,得到文本信息;
对所述文本信息进行关键词提取,得到关键词信息;
对所述关键词信息进行词嵌入处理,得到所述词向量。
本实施例中,在显示目标页面的情况下,对目标页面进行OCR处理,识别得到该目标页面对应的文本信息,该文本信息包括目标页面显示的文字。
提取该文本信息的关键词,得到关键词信息。其中,可以使用TF-IDF算法提取关键词或者使用文档主题生成模型(Latent Dirichlet Allocation,LDA)算法提取关键词过程其他方式,本实施例在此不作具体限定。
在得到关键词信息后,对关键词信息进行词嵌入处理,得到该关键词信息对应的词向量。
为便于理解整体方案,请参阅图7,图7是本申请实施例提供的数据推荐方法的流程示意图。
如图7所示,在显示文件上传页面的情况下,确定文件上传页面对应的语义嵌入向量,其中,上述文件上传页面即目标页面,上述语义嵌入向量即词向量。将语义嵌入向量输入至训练完成的深度学习模型,得到行为特征向量,其中。上述深度学习模型即深度学习模型。在预设的数据库中对行为特征向量进行查询,得到文件特征向量,其中,上述行为特征向量即第一目标特征向量,上述文件特征向量即第二目标特征向量。使用预设的映射表确定该文件特征向量对应的待上传文件,上述待上传文件即数据。进一步的,显示待上传文件。在接收到对待上传文件的输入的情况下,判断文件上传页面对应的应用程序是否为目标应用程序,且待上传文件是否为隐私文件。若文件上传页面对应的应用程序是目标应用程序,且待上传文件是隐私文件,则显示提醒信息。若文件上传页面对应的应用程序不是目标应用程序,和/或待上传文件不是隐私文件,则将待上传文件上传至文件上传页面。
如图8所示,数据推荐装置200包括:
第一确定模块201,用于在显示目标页面的情况下,确定所述目标页面对应的词向量;
第二确定模块202,用于将所述词向量输入深度学习模型中,确定与所述词向量匹配的目标数据;
第一显示模块203,用于显示所述目标数据。
可选地,所述第二确定模块202,具体用于:
将所述词向量输入至深度学习模型中,得到第一目标特征向量;
确定所述第一目标特征向量在数据库中对应的至少一个第二目标特征向量;
将所述第二目标特征向量对应的数据确定为所述目标数据。
可选地,所述第二确定模块202,还具体用于:
确定所述第一目标特征向量在所述数据库中的存储位置;
基于所述存储位置,使用最邻近搜索算法,得到所述第一目标特征向量与第二特征向量之间的欧式距离;
将所述欧式距离小于或等于预设阈值的第二特征向量确定为所述第二目标特征向量。
可选地,所述第一显示模块203,具体用于:
按照欧式距离从小到大的顺序,显示所述第二目标特征向量对应的目标数据。
可选地,所述第一显示模块204,还具体用于:
获取所述目标数据对应的数据类型和关键词;
在所述数据类型为预设类型和/或所述关键词包括预设字段的情况下,在所述目标数据的预设区域显示提醒标识。
可选地,所述数据推荐装置200还包括:
接收模块,用于接收用户对所述目标数据的输入;
第二显示模块,用于在所述目标页面对应的应用程序为目标应用程序的情况下,显示提醒信息。
可选地,所述第一确定模块202,具体用于:
对所述目标页面进行光学字符识别处理,得到文本信息;
对所述文本信息进行关键词提取,得到关键词信息;
对所述关键词信息进行词嵌入处理,得到所述词向量。
本申请实施例中,在显示目标页面的情况下,确定目标页面对应的词向量;将词向量输入至深度学习模型中,确定与词向量匹配的目标数据;显示目标数据。这样,当用户在线上提交业务相关的数据时,不需要用户通过较为繁琐的操作对数据进行定位,而是在显示目标页面的情况下,直接显示目标数据,减少了用户对数据进行定位的操作步骤,向用户推荐相关数据,以此提高了数据上传的便捷性。
本申请实施例中的数据推荐装置可以是装置,也可以是终端中的部件、集成电路、或芯片。该装置可以是移动电子设备,也可以为非移动电子设备。示例性的,移动电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本或者个人数字助理(personaldigital assistant,PDA)等,非移动电子设备可以为服务器、网络附属存储器(NetworkAttached Storage,NAS)、个人计算机(personal computer,PC)、电视机(television,TV)、柜员机或者自助机等,本申请实施例不作具体限定。
本申请实施例中的数据推荐装置可以为具有操作系统的装置。该操作系统可以为安卓(Android)操作系统,可以为ios操作系统,还可以为其他可能的操作系统,本申请实施例不作具体限定。
本申请实施例提供的数据推荐装置能够实现图4方法实施例实现的各个过程,为避免重复,这里不再赘述。
可选地,如图9所示,本申请实施例还提供一种电子设备300,包括处理器301,存储器302,存储在存储器302上并可在所述处理器301上运行的程序或指令,该程序或指令被处理器301执行时实现上述数据推荐方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
需要说明的是,本申请实施例中的电子设备包括上述所述的移动电子设备和非移动电子设备。
图10为实现本申请实施例的一种电子设备的硬件结构示意图。
该电子设备1000包括但不限于:射频单元1001、网络模块1002、音频输出单元1003、输入单元1004、传感器1005、显示单元1006、用户输入单元1007、接口单元1008、存储器1009、以及处理器1010等部件。
本领域技术人员可以理解,电子设备1000还可以包括给各个部件供电的电源(比如电池),电源可以通过电源管理系统与处理器1010逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图10中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置,在此不再赘述。
其中,处理器1010,还用于在显示目标页面的情况下,确定所述目标页面对应的词向量;
将所述词向量输入至深度学习模型中,确定与所述词向量匹配的目标数据;
显示单元1006,还用于显示所述目标数据。
其中,处理器1010,还用于将所述词向量输入至深度学习模型中,得到第一目标特征向量;
确定所述第一目标特征向量在数据库中对应的至少一个第二目标特征向量。
其中,处理器1010,还用于确定所述第一目标特征向量在所述数据库中的存储位置;
基于所述存储位置,使用最邻近搜索算法,得到所述第一目标特征向量与第二特征向量之间的欧式距离;
将所述欧式距离小于或等于预设阈值的第二特征向量确定为所述第二目标特征向量。
其中,显示单元1006,还用于按照欧式距离从小到大的顺序,显示所述第二目标特征向量对应的目标数据。
其中,处理器1010,还用于获取所述目标数据对应的数据类型和关键词;
显示单元1006,还用于在所述数据类型为预设类型和/或所述关键词包括预设字段的情况下,在所述目标数据的预设区域显示提醒标识。
其中,用户输入单元1007,还用于接收用户所述目标数据的输入;
显示单元1006,还用于在所述目标页面对应的应用程序为目标应用程序的情况下,显示提醒信息。
其中,处理器1010,还用于对所述目标页面进行光学字符识别处理,得到文本信息;
对所述文本信息进行关键词提取,得到关键词信息;
对所述关键词信息进行词嵌入处理,得到所述词向量。
本申请实施例中,在显示目标页面的情况下,确定目标页面对应的词向量;将词向量输入至深度学习模型中,确定与词向量匹配的目标数据;显示目标数据。这样,当用户在线上提交业务相关的数据时,不需要用户通过较为繁琐的操作对数据进行定位,而是在显示目标页面的情况下,直接显示目标数据,减少了用户对数据进行定位的操作步骤,向用户推荐相关数据,以此提高了数据上传的便捷性。
应理解的是,本申请实施例中,输入单元1004可以包括图形处理器(GraphicsProcessing Unit,GPU)10041和麦克风10042,图形处理器10041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元1006可包括显示面板10061,可以采用液晶显示器、有机发光二极管等形式来配置显示面板10071。用户输入单元1007包括触控面板10071以及其他输入设备10072。触控面板10071,也称为触摸屏。触控面板10071可包括触摸检测装置和触摸控制器两个部分。其他输入设备10072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。存储器1009可用于存储软件程序以及各种数据,包括但不限于应用程序和操作系统。处理器1010可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器1010中。
本申请实施例还提供一种可读存储介质,所述可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述数据推荐方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
其中,所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质,包括计算机可读存储介质,如计算机只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等。
本申请实施例另提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现上述数据推荐方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
应理解,本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外,需要指出的是,本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。

Claims (16)

1.一种数据推荐方法,其特征在于,包括:
在显示目标页面的情况下,确定所述目标页面对应的词向量;
将所述词向量输入至深度学习模型中,确定与所述词向量匹配的目标数据;
显示所述目标数据。
2.根据权利要求1所述的方法,其特征在于,所述将所述词向量输入至深度学习模型中,确定与所述词向量匹配的目标数据包括:
将所述词向量输入至深度学习模型中,得到第一目标特征向量,所述第一目标特征向量用于表征用户行为;
确定所述第一目标特征向量在数据库中对应的至少一个第二目标特征向量;所述数据库存储有第一特征向量和第二特征向量,所述第一特征向量和所述第二特征向量基于所述深度学习模型生成;
将所述第二目标特征向量对应的数据确定为所述目标数据。
3.根据权利要求2所述的方法,其特征在于,所述确定所述第一目标特征向量在数据库中对应的至少一个第二目标特征向量包括:
确定所述第一目标特征向量在所述数据库中的存储位置;
基于所述存储位置,使用最邻近搜索算法,得到所述第一目标特征向量与第二特征向量之间的欧式距离;
将所述欧式距离小于或等于预设阈值的第二特征向量确定为所述第二目标特征向量。
4.根据权利要求3所述的方法,其特征在于,所述显示所述目标数据包括:
按照欧式距离从小到大的顺序,显示所述第二目标特征向量对应的目标数据。
5.根据权利要求1所述的方法,其特征在于,所述显示所述目标数据包括:
获取所述目标数据对应的数据类型和关键词;
在所述数据类型为预设类型和/或所述关键词包括预设字段的情况下,在所述目标数据的预设区域显示提醒标识。
6.根据权利要求1所述的方法,其特征在于,所述显示所述目标数据之后,所述方法还包括:
接收用户对所述目标数据的输入;
在所述目标页面对应的应用程序为目标应用程序的情况下,显示提醒信息。
7.根据权利要求1所述的方法,其特征在于,所述确定所述目标页面对应的词向量包括:
对所述目标页面进行光学字符识别处理,得到文本信息;
对所述文本信息进行关键词提取,得到关键词信息;
对所述关键词信息进行词嵌入处理,得到所述词向量。
8.一种数据推荐装置,其特征在于,所述装置包括:
第一确定模块,用于在显示目标页面的情况下,确定所述目标页面对应的词向量;
第二确定模块,用于将所述词向量输入深度学习模型中,确定与所述词向量匹配的目标数据;
第一显示模块,用于显示所述目标数据。
9.根据权利要求8所述的装置,其特征在于,所述第二确定模块,具体用于:
将所述词向量输入至深度学习模型中,得到第一目标特征向量,所述第一目标特征向量用于表征用户行为;
确定所述第一目标特征向量在数据库中对应的至少一个第二目标特征向量;所述数据库存储有第一特征向量和第二特征向量,所述第一特征向量和所述第二特征向量基于所述深度学习模型生成;
将所述第二目标特征向量对应的数据确定为所述目标数据。
10.根据权利要求9所述的装置,其特征在于,所述第二确定模块,还具体用于:
确定所述第一目标特征向量在所述数据库中的存储位置;
基于所述存储位置,使用最邻近搜索算法,得到所述第一目标特征向量与第二特征向量之间的欧式距离;
将所述欧式距离小于或等于预设阈值的第二特征向量确定为所述第二目标特征向量。
11.根据权利要求10所述的装置,其特征在于,所述第一显示模块,具体用于:
按照欧式距离从小到大的顺序,显示所述第二目标特征向量对应的目标数据。
12.根据权利要求8所述的装置,其特征在于,所述第一显示模块,还具体用于:
获取所述目标数据对应的数据类型和关键词;
在所述数据类型为预设类型和/或所述关键词包括预设字段的情况下,在所述目标数据的预设区域显示提醒标识。
13.根据权利要求8所述的装置,其特征在于,所述装置还包括:
接收模块,用于接收用户对所述目标数据的输入;
第二显示模块,用于在所述目标页面对应的应用程序为目标应用程序的情况下,显示提醒信息。
14.根据权利要求8所述的装置,其特征在于,所述第一确定模块,具体用于:
对所述目标页面进行光学字符识别处理,得到文本信息;
对所述文本信息进行关键词提取,得到关键词信息;
对所述关键词信息进行词嵌入处理,得到所述词向量。
15.一种电子设备,其特征在于,包括处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1-7中任一项所述的数据推荐方法的步骤。
16.一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1-7中任一项所述的数据推荐方法的步骤。
CN202111182460.7A 2021-10-11 2021-10-11 数据推荐方法、装置、电子设备及存储介质 Pending CN113869063A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202111182460.7A CN113869063A (zh) 2021-10-11 2021-10-11 数据推荐方法、装置、电子设备及存储介质
PCT/CN2022/124028 WO2023061276A1 (zh) 2021-10-11 2022-10-09 数据推荐方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111182460.7A CN113869063A (zh) 2021-10-11 2021-10-11 数据推荐方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN113869063A true CN113869063A (zh) 2021-12-31

Family

ID=78998970

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111182460.7A Pending CN113869063A (zh) 2021-10-11 2021-10-11 数据推荐方法、装置、电子设备及存储介质

Country Status (2)

Country Link
CN (1) CN113869063A (zh)
WO (1) WO2023061276A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023061276A1 (zh) * 2021-10-11 2023-04-20 维沃移动通信有限公司 数据推荐方法、装置、电子设备及存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117421486B (zh) * 2023-12-18 2024-03-19 杭州金智塔科技有限公司 基于球树算法和联邦学习的推荐模型更新系统及方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106649603B (zh) * 2016-11-25 2020-11-10 北京资采信息技术有限公司 一种基于网页文本数据情感分类的指定信息推送方法
WO2019183788A1 (zh) * 2018-03-27 2019-10-03 华为技术有限公司 一种基于场景推荐应用的方法及装置
CN111444447A (zh) * 2018-12-29 2020-07-24 北京奇虎科技有限公司 内容推荐页面的展现方法及装置
CN111723260B (zh) * 2019-03-19 2023-08-04 百度在线网络技术(北京)有限公司 推荐内容的获取方法、装置、电子设备及可读存储介质
CN113869063A (zh) * 2021-10-11 2021-12-31 维沃移动通信有限公司 数据推荐方法、装置、电子设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023061276A1 (zh) * 2021-10-11 2023-04-20 维沃移动通信有限公司 数据推荐方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
WO2023061276A1 (zh) 2023-04-20

Similar Documents

Publication Publication Date Title
US11120078B2 (en) Method and device for video processing, electronic device, and storage medium
US10878044B2 (en) System and method for providing content recommendation service
US20150169710A1 (en) Method and apparatus for providing search results
CN110740389B (zh) 视频定位方法、装置、计算机可读介质及电子设备
CN111381751A (zh) 一种文本处理方法及装置
US20150339348A1 (en) Search method and device
CN110019675B (zh) 一种关键词提取的方法及装置
WO2023061276A1 (zh) 数据推荐方法、装置、电子设备及存储介质
US20200050906A1 (en) Dynamic contextual data capture
CN109144285B (zh) 一种输入方法和装置
CN112099704A (zh) 信息显示方法、装置、电子设备和可读存储介质
WO2021254251A1 (zh) 输入显示方法、装置及电子设备
CN111708943B (zh) 一种搜索结果展示方法、装置和用于搜索结果展示的装置
EP3910496A1 (en) Search method and device
CN111538830A (zh) 法条检索方法、装置、计算机设备及存储介质
CN113037925B (zh) 信息处理方法、信息处理装置、电子设备和可读存储介质
US20130230248A1 (en) Ensuring validity of the bookmark reference in a collaborative bookmarking system
KR20150135059A (ko) 검색을 수행하는 방법 및 장치
CN115061580A (zh) 输入方法、装置、电子设备及可读存储介质
CN114065057A (zh) 搜索结果确定方法、展示方法、装置、设备和介质
CN114237405A (zh) 消息更正方法、装置和电子设备
CN113515701A (zh) 信息推荐方法及装置
CN112287131A (zh) 信息交互方法、信息交互装置
CN112307273A (zh) 信息查询方法、装置及电子设备
CN113593614A (zh) 图像处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination