CN114491259A - 一种数据推荐方法、装置、终端及存储介质 - Google Patents
一种数据推荐方法、装置、终端及存储介质 Download PDFInfo
- Publication number
- CN114491259A CN114491259A CN202210095096.9A CN202210095096A CN114491259A CN 114491259 A CN114491259 A CN 114491259A CN 202210095096 A CN202210095096 A CN 202210095096A CN 114491259 A CN114491259 A CN 114491259A
- Authority
- CN
- China
- Prior art keywords
- data
- similarity
- fuzzy
- reference data
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 60
- 238000004590 computer program Methods 0.000 claims description 20
- 238000004364 calculation method Methods 0.000 claims description 16
- 238000012545 processing Methods 0.000 claims description 11
- 238000012937 correction Methods 0.000 claims description 8
- 230000009193 crawling Effects 0.000 claims description 7
- 238000013480 data collection Methods 0.000 claims description 7
- 238000011156 evaluation Methods 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 description 13
- 241000272814 Anser sp. Species 0.000 description 10
- 238000004422 calculation algorithm Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请适用于数据推荐技术领域,提供一种数据推荐方法、装置、终端及存储介质,其中方法包括:获取同一对象的不同来源的描述数据,所述描述数据中包括模糊数据及权威数据;将所述描述数据之间进行相似度比对,并基于相似度比对结果,从所述模糊数据中选取符合设定条件的数据作为参照数据,得到包含所述参照数据的相似度数据字典;获取给定数据;在基于所述给定数据从所述相似度数据字典中匹配出目标参照数据时,将所述目标参照数据对应的目标权威数据确定为推荐数据。该方案能够解决现有技术中心存在的基于个人输入习惯而产生的信息输入不完整、不准确甚至错误的技术问题。
Description
技术领域
本申请属于数据处理技术领域,尤其涉及一种数据推荐方法、装置、终端及存储介质。
背景技术
随着数字化技术和移动互联网的普及,人们与移动互联网越来越密不可分,人们通过移动终端接入互联网获取传递信息、与他人沟通。随之带来的,是传统营销行业,特别是B2B领域营销的革命性变革。
但是,在数字化时代,营销仍然面临诸多问题,其中的一类主要问题就是:一部分通过数字化媒介和渠道从受众处获得的反馈信息质量不高。原因在于,某些类型的数据对于营销线索分析有较高价值,但从营销受众处收集此类信息时,只能通过受众自身主动填写的方式获取,在每个个体填写信息时,可能会基于个人输入习惯而产生信息输入不完整、不准确甚至错误的情况。而缺乏有效技术手段保证信息填写正确、完整和真实,会导致收集到的此类信息存在错误或者质量不高等问题,给后续的营销线索分析工作带来困难。
发明内容
本申请实施例提供了一种数据推荐方法、装置、终端及存储介质,以解决现有技术中存在基于个人输入习惯而产生的信息输入不完整、不准确甚至错误的技术问题。
第一方面,本申请实施例提供了一种数据推荐方法,包括:
获取同一对象的不同来源的描述数据,所述描述数据中包括模糊数据及权威数据;
将所述描述数据之间进行相似度比对,并基于相似度比对结果,从所述模糊数据中选取符合设定条件的数据作为参照数据,得到包含所述参照数据的相似度数据字典;
获取给定数据;
在基于所述给定数据从所述相似度数据字典中匹配出目标参照数据时,将所述目标参照数据对应的目标权威数据确定为推荐数据。
第二方面,本申请实施例提供了一种推荐装置,包括:
数据获取模块,用于获取同一对象的不同来源的描述数据,所述描述数据中包括模糊数据及权威数据;
数据质量提升模块,用于将所述描述数据之间进行相似度比对,并基于相似度比对结果,从所述模糊数据中选取符合设定条件的数据作为参照数据,得到包含所述参照数据的相似度数据字典;
数据处理模块,获取给定数据,在基于所述给定数据从所述相似度数据字典中匹配出目标参照数据时,将所述目标参照数据对应的目标权威数据确定为推荐数据。
第三方面,本申请实施例提供了一种终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述方法的步骤。
第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在终端上运行时,使得终端执行上述第一方面所述方法的步骤。
可以理解的是,上述第二方面至第五方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
本申请实施例与现有技术相比存在的有益效果是:通过对获取的模糊数据及权威数据进行相似度比对,以得到符合设定条件的参照数据,通过构建包含参照数据的相似度数据字典以为客户的输入信息提供推荐数据匹配标准。当客户输入信息,在相似度数据字典中查找与客户输入信息相匹配的目标参照数据,并把目标参照数据对应的目标权威数据确定为推荐数据,推荐数据为权威数据,数据完整;并且目标参照数据为经过相似度比对后的模糊数据,目标参照数据所对应的权威数据准确且无误。通过该方法以解决现有技术中心存在的基于个人输入习惯而产生的信息输入不完整、不准确甚至错误的技术问题。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种数据推荐方法的流程图一;
图2是本申请实施例提供的一种数据推荐方法的流程图二;
图3是本申请实施例提供的一种数据推荐装置的结构示意图;
图4是本申请实施例提供的一种终端的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
具体实现中,本申请实施例中描述的终端包括但不限于诸如具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的移动电话、膝上型计算机或平板计算机之类的其它便携式设备。还应当理解的是,在某些实施例中,所述设备并非便携式通信设备,而是具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的台式计算机。
在接下来的讨论中,描述了包括显示器和触摸敏感表面的终端。然而,应当理解的是,终端可以包括诸如物理键盘、鼠标和/或控制杆的一个或多个其它物理用户接口设备。
终端支持各种应用程序,例如以下中的一个或多个:绘图应用程序、演示应用程序、文字处理应用程序、网站创建应用程序、盘刻录应用程序、电子表格应用程序、游戏应用程序、电话应用程序、视频会议应用程序、电子邮件应用程序、即时消息收发应用程序、锻炼支持应用程序、照片管理应用程序、数码相机应用程序、数字摄影机应用程序、web浏览应用程序、数字音乐播放器应用程序和/或数字视频播放器应用程序。
可以在终端上执行的各种应用程序可以使用诸如触摸敏感表面的至少一个公共物理用户接口设备。可以在应用程序之间和/或相应应用程序内调整和/或改变触摸敏感表面的一个或多个功能以及终端上显示的相应信息。这样,终端的公共物理架构(例如,触摸敏感表面)可以支持具有对用户而言直观且透明的用户界面的各种应用程序。
应理解,本实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
为了说明本申请的技术方案,下面通过具体实施例来进行说明。
参见图1,图1是本申请实施例提供的一种数据推荐方法的流程图一。如图1所示,一种数据推荐方法,该方法包括以下步骤:
步骤101,获取同一对象的不同来源的描述数据,描述数据中包括模糊数据及权威数据。
该同一对象可指代任一事物,该描述数据为互联网存量数据,指的是描述该对象的任意数据。描述数据可分为模糊数据及权威数据,权威数据指该对象的官方名称,模糊数据为指代描述该对象的任意数据。以腾讯公司的名称为例,腾讯公司名称的权威数据为深圳市腾讯计算机系统有限公司,模糊数据为腾讯、腾讯公司、鹅厂等数据。
作为一可选的实施方式,其中,获取同一对象的不同来源的描述数据,包括:
设定模糊数据的搜索范围和数据类型;启动网络数据收集工具,按照数据类型在搜索范围内爬取得到模糊数据。
该搜索范围可包括网络论坛、社交媒体、咨讯媒体等互联网载体;数据类型可为文本、图片等形式。
启动网络数据收集工具,可在互联网上基于爬虫系统获取模糊数据。该模糊数据符合数据类型且在搜索范围内爬取得到。该模糊数据质量参差不齐,例如,包含标准规范的企业名称,也包含各种错误、简略缩写、别名等形式的企业名称。
作为另一可选的实施方式,其中,获取同一对象的不同来源的描述数据,包括:
设定权威数据的权威站点;启动网络数据收集工具,在权威站点爬取得到权威数据。
该权威站点为官方数据的来源网站,可包括企业官网、企查查、天眼查等网站;在权威网站启动爬虫系统爬取官方、准确的数据。
步骤102,将描述数据之间进行相似度比对,并基于相似度比对结果,从模糊数据中选取符合设定条件的数据作为参照数据,得到包含参照数据的相似度数据字典。
该相似度的比对不仅可采用文本相似度算法,还可综合采用互联网数据关联度算法、数据规则算法等多重智能算法,共同进行相似度比对,以基于比对结果在模糊数据中选取完整、准确的参照数据。并构建参照数据的集合,作为相似度数据字典。该相似度数据字典可基于不断更新的参照数据保持更新。
该设定条件指模糊数据筛选的规则,例如,基于描述数据中,数据两两比对的所有结果,综合筛选、整理所有结果中,选取相似度高于阈值的高相似度对应的模糊数据。
步骤103,获取给定数据。
给定数据指代客户提供的数据信息。
作为一可选的实施方式,其中,获取给定数据,包括:
提供标准数据接口,标准数据接口中连接用户端工具表单或应用程序接口;基于标准数据接口,获取用户通过工具表单或应用程序接口录入的给定数据。
该工具表单一般为一对一的形式采集客户的数据信息,该应用程序接口通常为批量传递的方式获取客户的数据信息。提供数据接口以供客户端接入并录入客户的数据信息。
步骤104,在基于给定数据从相似度数据字典中匹配出目标参照数据时,将目标参照数据对应的目标权威数据确定为推荐数据。
该目标参照数据为数据字典中与给定数据匹配的参照数据,该目标权威数据为与该目标参照数据对应的权威数据。
作为一可选的实施方式,其中,在基于给定数据从相似度数据字典中匹配出目标参照数据时,将目标参照数据对应的目标权威数据确定为推荐数据,包括:
将给定数据与相似度数据字典进行比较并匹配目标参照数据;输出目标参照数据对应的目标权威数据作为推荐数据。
因该目标参照数据为筛选出的准确的参照数据,因此,若给定数据与目标参照数据匹配,则目标参照数据对应的目标权威数据为与给定数据对应的准确且无误的官方数据。
作为另一可选的实施方式,其中,在基于给定数据从相似度数据字典中匹配出目标参照数据时,将目标参照数据对应的目标权威数据确定为推荐数据,包括:
获取用户输入的对推荐数据的修正内容;基于修正内容,对目标参照数据进行正确性评估,并基于正确性评估结果对相似度数据字典进行内容修正。
该修正内容为当用户判断推荐数据错误时,人工反馈并对推荐数据进行修正时输入的内容。基于给定数据对其对应的目标参照数据进行正确性评估,以删去、调整相似度数据字典内的目标参照数据。并基于该修正内容的反馈不断更新相似度数据字典。
在本申请实施例中,通过对获取的模糊数据及权威数据进行相似度比对,以得到符合设定条件的参照数据,通过构建包含参照数据的相似度数据字典以为客户的输入信息提供推荐数据匹配标准。当客户输入信息,在相似度数据字典中查找与客户输入信息相匹配的目标参照数据,并把目标参照数据对应的目标权威数据确定为推荐数据,推荐数据为权威数据,数据完整;并且目标参照数据为经过相似度比对后的模糊数据,目标参照数据所对应的权威数据准确且无误。通过该方法以解决现有技术中心存在的基于个人输入习惯而产生的信息输入不完整、不准确甚至错误的技术问题。本申请实施例中还提供了数据推荐方法的不同实施方式。
参见图2,图2是本申请实施例提供的一种数据推荐方法的流程图二。如图2所示,一种数据推荐方法,该方法包括以下步骤:
步骤201,获取同一对象的不同来源的描述数据,描述数据中包括模糊数据及权威数据。
该步骤的实现过程与前述实施方式中步骤101的实现方式相同,此处不再赘述。
步骤202,对不同来源的模糊数据进行两两相似度计算,基于两两相似度计算的最终计算结果从模糊数据中筛选出相似度符合第一设定条件的第一参照数据。
在进行相似度计算之前,可先对获取模糊数据进行清洗和整理,初步筛选和整理出可能符合要求的模糊数据,删除与权威数据差别较大的模糊数据,以便随后进行的相似度计算。
在本实施方式中,对不同来源的模糊数据,可依照上述比对方法,例如文本相似度算法、互联网数据关联度算法、数据规则算法等多重智能算法两两比对。并采用第一设定条件筛选模糊数据,该第一设定条件指的是基于两两比对的所有结果,综合筛选、整理的所有结果中,相似度高于阈值的高相似度对应的模糊数据。该高相似度对应的模糊数据作为第一参照数据。
以腾讯公司的企业名称为例,将腾讯、鹅厂、腾讯公司等模糊数据,两两进行相似度比对。腾讯与腾讯公司文字相似度较高,并且出现位置的前后文语境相似度较高;而鹅厂分别与腾讯或腾讯公司的文字相似度不高,但出现位置的前后文语境相似度较高。并采用上述第一设定条件进行判断,第一设定条件中的相似度需综合考虑该文字相似度和该前后文语境相似度,比如文字相似度和前后文语境相似度比重均为百分之五十。由于腾讯与腾讯公司的文字相似度以及前后文相似度均较高,且鹅厂分别与腾讯和腾讯公司的前后文语境相似度较高,即最终计算结果中的腾讯、腾讯公司、鹅厂的相似度均为高于阈值的高相似度,因此把高相似度的模糊数据腾讯、鹅厂、腾讯公司共同作为第一参照数据。
在其他实施方式中,可采用以上比对方法且采用不同的比对方式,基于每一模糊数据的参数,集合起来一起比对,选出第一参照数据;或采用将多个模糊数据分为一组的形式,在组内进行两两比对,组内的模糊数据不与其他组内的模糊数据进行比对,并基于第一设定条件,根据最终计算结果即模糊数据的相似度,具体可参考上述例子的两两比对方法,选出每一组内的第一参照数据,并将每一组内的参照数据进行集合,以减少模糊数据之间的比对次数;亦或可采用不同于上述任一种的比对方式、比对方法,皆在本申请的保护范围内。
步骤203,将每一模糊数据与权威数据进行相似度计算,基于相似度计算结果从模糊数据中筛选出相似度符合第二设定条件的第二参照数据。
在本实施方式中,对于不同来源的模糊数据,把每一模糊数据与权威数据进行比对。基于比对结果,采用第二设定条件筛选相似度,该第二设定条件指的是选取相似度大于阈值的模糊数据。该相似度大于阈值的模糊数据作为第二参照数据。
以腾讯公司的企业名称为例,将腾讯、鹅厂、腾讯公司等模糊数据,分别与权威数据深圳市腾讯计算机系统有限公司进行比对。腾讯和腾讯公司皆与深圳市腾讯计算机系统有限公司文字相似度较高,并且出现位置的前后文语境相似度较高;而鹅厂与深圳市腾讯计算机系统有限公司的文字相似度不高,且出现位置的前后文语境相似度一般。采用第二设定条件,将相似度大于阈值的腾讯、腾讯公司作为第二参照数据。
步骤204,构建包含第一参照数据和第二参照数据的相似度数据字典。
构建第一参照数据与第二参照数据的集合,作为相似度数据字典。
基于上述腾讯公司的例子,构建第一参照数据腾讯、鹅厂、腾讯公司,和第二参照数据腾讯、腾讯公司的集合,则相似度数据字典包括腾讯、鹅厂、腾讯公司。
步骤205,获取给定数据。
该步骤的实现过程与前述实施方式中步骤103的实现方式相同,此处不再赘述。
步骤206,在基于给定数据从相似度数据字典中匹配出目标参照数据时,将目标参照数据对应的目标权威数据确定为推荐数据。
该步骤的实现过程与前述实施方式中步骤104的实现方式相同,此处不再赘述。在本申请实施例中,进一步采用对模糊数据进行两两相似度计算,以及将每一模糊数据与权威数据进行相似度计算的设定条件,依次筛选高相似度的第一参照数据和高于阈值相似度的第二参照数据,并构建包含第一参照数据和第二参照数据的相似度数据字典,以更完整、准确且无误的选取参照数据及相似度数据字典。当客户输入信息,在相似度数据字典中查找与客户输入信息相匹配的目标参照数据,并把目标参照数据对应的目标权威数据确定为推荐数据,推荐数据为权威数据,数据完整;并且目标参照数据为经过相似度比对后的模糊数据,目标参照数据所对应的权威数据准确且无误。通过该方法以解决现有技术中心存在的基于个人输入习惯而产生的信息输入不完整、不准确甚至错误的技术问题。
参见图3,图3是本申请实施例提供的一种数据推荐装置的结构图,为了便于说明,仅示出了与本申请实施例相关的部分。
该数据推荐装置300包括:
数据获取模块301,用于获取同一对象的不同来源的描述数据,所述描述数据中包括模糊数据及权威数据;
数据质量提升模块302,用于将所述描述数据之间进行相似度比对,并基于相似度比对结果,从所述模糊数据中选取符合设定条件的数据作为参照数据,得到包含所述参照数据的相似度数据字典;
数据处理模块303,获取给定数据,在基于所述给定数据从所述相似度数据字典中匹配出目标参照数据时,将所述目标参照数据对应的目标权威数据确定为推荐数据;
其中,数据获取模块301具体用于:
设定所述模糊数据的搜索范围和数据类型;
启动网络数据收集工具,按照所述数据类型在所述搜索范围内爬取得到所述模糊数据。
其中,数据获取模块301还具体用于:
设定所述权威数据的权威站点;
启动网络数据收集工具,在所述权威站点爬取得到所述权威数据。
其中,数据质量提升模块302具体用于:
将第三格式的可信数据进行去格式化处理;
将去格式化后的所述可信数据确定为所述对照数据。
其中,数据处理模块303,具体用于:
提供标准数据接口,所述标准数据接口中连接用户端工具表单或应用程序接口;
基于所述标准数据接口,获取用户通过所述工具表单或所述应用程序接口录入的所述给定数据。
其中,数据处理模块303,还具体用于:
将所述给定数据与所述相似度数据字典进行比较并匹配所述目标参照数据;
输出所述目标参照数据对应的目标权威数据作为推荐数据。
其中,数据处理模块303,进一步具体用于:
获取用户输入的对所述推荐数据的修正内容;
基于所述修正内容,对所述目标参照数据进行正确性评估,并基于正确性评估结果对所述相似度数据字典进行内容修正。
本申请实施例提供的数据推荐装置能够实现上述数据推荐方法的实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
图4是本申请实施例提供的一种终端的结构图。如该图所示,该实施例的终端4包括:至少一个处理器40(图4中仅示出一个)、存储器41以及存储在所述存储器41中并可在所述至少一个处理器40上运行的计算机程序42,所述处理器40执行所述计算机程序42时实现上述任意各个方法实施例中的步骤。
所述终端4可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端4可包括,但不仅限于,处理器40、存储器41。本领域技术人员可以理解,图4仅仅是终端4的示例,并不构成对终端4的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端还可以包括输入输出设备、网络接入设备、总线等。
所述处理器40可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器41可以是所述终端4的内部存储单元,例如终端4的硬盘或内存。所述存储器41也可以是所述终端4的外部存储设备,例如所述终端4上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器41还可以既包括所述终端4的内部存储单元也包括外部存储设备。所述存储器41用于存储所述计算机程序以及所述终端所需的其他程序和数据。所述存储器41还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置/终端和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序产品来实现,当计算机程序产品在终端上运行时,使得所述终端执行时实现可实现上述各个方法实施例中的步骤。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
Claims (10)
1.一种数据推荐方法,其特征在于,包括:
获取同一对象的不同来源的描述数据,所述描述数据中包括模糊数据及权威数据;
将所述描述数据之间进行相似度比对,并基于相似度比对结果,从所述模糊数据中选取符合设定条件的数据作为参照数据,得到包含所述参照数据的相似度数据字典;
获取给定数据;
在基于所述给定数据从所述相似度数据字典中匹配出目标参照数据时,将所述目标参照数据对应的目标权威数据确定为推荐数据。
2.如权利要求1所述的数据推荐方法,其特征在于,所述将所述描述数据之间进行相似度比对,并基于相似度比对结果,从所述模糊数据中选取符合设定条件的数据作为参照数据,得到包含所述参照数据的相似度数据字典,包括:
对不同来源的所述模糊数据进行两两相似度计算,基于所述两两相似度计算的最终计算结果从所述模糊数据中筛选出相似度符合第一设定条件的第一参照数据;
将每一所述模糊数据与所述权威数据进行相似度计算,基于相似度计算结果从所述模糊数据中筛选出相似度符合第二设定条件的第二参照数据;
构建包含所述第一参照数据和所述第二参照数据的相似度数据字典。
3.如权利要求1所述的数据推荐方法,其特征在于,所述获取同一对象的不同来源的描述数据,包括:
设定所述模糊数据的搜索范围和数据类型;
启动网络数据收集工具,按照所述数据类型在所述搜索范围内爬取得到所述模糊数据。
4.如权利要求1所述的数据推荐方法,其特征在于,所述获取同一对象的不同来源的描述数据,包括:
设定所述权威数据的权威站点;
启动网络数据收集工具,在所述权威站点爬取得到所述权威数据。
5.如权利要求1所述的数据推荐方法,其特征在于,所述获取给定数据,包括:
提供标准数据接口,所述标准数据接口中连接用户端工具表单或应用程序接口;
基于所述标准数据接口,获取用户通过所述工具表单或所述应用程序接口录入的所述给定数据。
6.如权利要求1所述的数据推荐方法,其特征在于,所述在基于所述给定数据从所述相似度数据字典中匹配出目标参照数据时,将所述目标参照数据对应的目标权威数据确定为推荐数据,包括:
将所述给定数据与所述相似度数据字典进行比较并匹配所述目标参照数据;
输出所述目标参照数据对应的目标权威数据作为推荐数据。
7.如权利要求1所述的数据推荐方法,其特征在于,所述在基于所述给定数据从所述相似度数据字典中匹配出目标参照数据时,将所述目标参照数据对应的目标权威数据确定为推荐数据之后,还包括:
获取用户输入的对所述推荐数据的修正内容;
基于所述修正内容,对所述目标参照数据进行正确性评估,并基于正确性评估结果对所述相似度数据字典进行内容修正。
8.一种数据推荐装置,其特征在于,包括:
数据获取模块,用于获取同一对象的不同来源的描述数据,所述描述数据中包括模糊数据及权威数据;
数据质量提升模块,用于将所述描述数据之间进行相似度比对,并基于相似度比对结果,从所述模糊数据中选取符合设定条件的数据作为参照数据,得到包含所述参照数据的相似度数据字典;
数据处理模块,获取给定数据,在基于所述给定数据从所述相似度数据字典中匹配出目标参照数据时,将所述目标参照数据对应的目标权威数据确定为推荐数据。
9.一种终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210095096.9A CN114491259A (zh) | 2022-01-26 | 2022-01-26 | 一种数据推荐方法、装置、终端及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210095096.9A CN114491259A (zh) | 2022-01-26 | 2022-01-26 | 一种数据推荐方法、装置、终端及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114491259A true CN114491259A (zh) | 2022-05-13 |
Family
ID=81476123
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210095096.9A Pending CN114491259A (zh) | 2022-01-26 | 2022-01-26 | 一种数据推荐方法、装置、终端及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114491259A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115238180A (zh) * | 2022-07-25 | 2022-10-25 | 深圳市天龙世纪科技发展有限公司 | 互联网大数据的信息推荐方法以及ai系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106503022A (zh) * | 2015-09-08 | 2017-03-15 | 北京邮电大学 | 推送推荐信息的方法和装置 |
CN111400591A (zh) * | 2020-03-11 | 2020-07-10 | 腾讯科技(北京)有限公司 | 资讯信息推荐方法、装置、电子设备及存储介质 |
CN111783107A (zh) * | 2020-07-09 | 2020-10-16 | 杭州安恒信息技术股份有限公司 | 一种多源可信数据接入方法、装置及设备 |
CN113129050A (zh) * | 2020-01-14 | 2021-07-16 | 阿里健康信息技术有限公司 | 数据对象推荐方法及装置 |
CN113314207A (zh) * | 2021-06-28 | 2021-08-27 | 挂号网(杭州)科技有限公司 | 一种对象推荐方法、装置、存储介质及电子设备 |
CN113688126A (zh) * | 2021-08-25 | 2021-11-23 | 云从科技集团股份有限公司 | 确定源数据与标准数据的映射关系的方法、系统和介质 |
-
2022
- 2022-01-26 CN CN202210095096.9A patent/CN114491259A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106503022A (zh) * | 2015-09-08 | 2017-03-15 | 北京邮电大学 | 推送推荐信息的方法和装置 |
US20180020250A1 (en) * | 2015-09-08 | 2018-01-18 | Tencent Technology (Shenzhen) Company Limited | Recommendation information pushing method, server, and storage medium |
CN113129050A (zh) * | 2020-01-14 | 2021-07-16 | 阿里健康信息技术有限公司 | 数据对象推荐方法及装置 |
CN111400591A (zh) * | 2020-03-11 | 2020-07-10 | 腾讯科技(北京)有限公司 | 资讯信息推荐方法、装置、电子设备及存储介质 |
CN111783107A (zh) * | 2020-07-09 | 2020-10-16 | 杭州安恒信息技术股份有限公司 | 一种多源可信数据接入方法、装置及设备 |
CN113314207A (zh) * | 2021-06-28 | 2021-08-27 | 挂号网(杭州)科技有限公司 | 一种对象推荐方法、装置、存储介质及电子设备 |
CN113688126A (zh) * | 2021-08-25 | 2021-11-23 | 云从科技集团股份有限公司 | 确定源数据与标准数据的映射关系的方法、系统和介质 |
Non-Patent Citations (1)
Title |
---|
杨晶等: "一种改进的新浪微博好友推荐算法", 《常州大学学报(自然科学版)》, vol. 25, no. 3, 31 July 2013 (2013-07-31), pages 66 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115238180A (zh) * | 2022-07-25 | 2022-10-25 | 深圳市天龙世纪科技发展有限公司 | 互联网大数据的信息推荐方法以及ai系统 |
CN115238180B (zh) * | 2022-07-25 | 2023-08-15 | 新疆伊能众诚高科有限公司 | 互联网大数据的信息推荐方法以及ai系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Serafino et al. | True scale-free networks hidden by finite size effects | |
CN111079022B (zh) | 基于联邦学习的个性化推荐方法、装置、设备及介质 | |
US20130212105A1 (en) | Information processing apparatus, information processing method, and program | |
CN112668320A (zh) | 基于词嵌入的模型训练方法、装置、电子设备及存储介质 | |
WO2022095382A1 (zh) | 基于知识图谱的电子卡片生成推送方法、装置 | |
CN108510321A (zh) | 一种房产用户画像的构建方法及装置 | |
CN111932308A (zh) | 数据推荐方法、装置和设备 | |
CN112181386B (zh) | 一种基于软件持续集成的代码构建方法、装置及终端 | |
CN112487021A (zh) | 业务数据的关联分析方法、装置及设备 | |
CN114491259A (zh) | 一种数据推荐方法、装置、终端及存储介质 | |
CN111666481A (zh) | 数据挖掘方法、装置、计算机可读介质及电子设备 | |
CN111198941A (zh) | 一种问题发现方法、装置及电子设备、存储介质 | |
CN110598112A (zh) | 一种题目推荐方法、装置、终端设备及存储介质 | |
CN110688582B (zh) | 一种应用推荐方法、应用推荐装置及终端设备 | |
CN110659419B (zh) | 确定目标用户的方法及相关装置 | |
CN111310016B (zh) | 标签挖掘方法、装置、服务器和存储介质 | |
CN113918630A (zh) | 一种数据同步方法、装置、计算机设备及存储介质 | |
CN108460159B (zh) | 一种信息的回复方法、终端设备及计算机可读存储介质 | |
CN107578297B (zh) | 会员信息聚合方法以及装置 | |
Batiuk et al. | Intelligent System for Socialization of Individual's with Shared Interests based on NLP, Machine Learning and SEO Technologies. | |
CN108021648B (zh) | 一种搜题的方法、装置及智能终端 | |
CN111339124A (zh) | 显示数据方法、装置、电子设备和计算机可读介质 | |
CN113362097A (zh) | 一种用户确定方法和装置 | |
CN113868438B (zh) | 信息可信度的校准方法、装置、计算机设备及存储介质 | |
CN113269600B (zh) | 一种信息发送的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |