CN107451141A - 一种数据推荐的处理交互方法、装置及系统 - Google Patents
一种数据推荐的处理交互方法、装置及系统 Download PDFInfo
- Publication number
- CN107451141A CN107451141A CN201610371807.5A CN201610371807A CN107451141A CN 107451141 A CN107451141 A CN 107451141A CN 201610371807 A CN201610371807 A CN 201610371807A CN 107451141 A CN107451141 A CN 107451141A
- Authority
- CN
- China
- Prior art keywords
- data
- interactive device
- developer
- recommendation
- metadata tag
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/907—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种数据推荐的处理交互方法、装置及系统,涉及数据处理领域,解决了如何在节约用户搜索时间的基础上向用户推荐高质量的数据的问题。本发明的系统包括:交互装置及数据处理装置;所述交互装置用于将获取的开发者使用的数据信息以及确定的其所处状态对应的状态数据发送给数据处理装置,并接收数据处理装置向交互装置推荐的数据;所述数据处理装置用于根据交互装置获取的数据信息以及交互装置所处的状态向交互装置推荐数据。本发明主要应用于元数据推荐领域。
Description
技术领域
本发明涉及数据处理领域,特别是涉及一种数据推荐的处理交互方法、装置及系统。
背景技术
元数据又称中介数据、中继数据,为描述数据的数据,主要是描述数据属性的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。传统的元数据管理系统一般只提供基于各种查询条件的元数据搜索,元数据的推荐系统在业内还很少见。
在现有技术中,由于元数据推荐系统的匮乏,导致高质量的数据得不到有效推广和充分利用,使数据价值被掩埋;同时开发者在元数据系统中进行数据搜索时产生的大量搜索历史记录得不到有效利用,致使元数据平台的能力不能充分发挥,开发者每次都需要进行重复、繁重的元数据搜索,尤其在开发者想要搜索某个数据的类似数据时,需要花费更多的周折;此外,数据开发者受限于已知的数据范围,无法快捷方便的发现相同业务领域的其他数据,不利于开发者对数据的深层次理解以及对数据的创新应用。
因此,在数据处理技术快速发展的今天,如何高效的进行数据推荐,给用户提供高质量的数据成为数据管理过程中亟待解决的问题。
发明内容
有鉴于此,本发明提出了一种数据推荐的处理交互方法、装置及系统,主要目的在于解决如何在节约用户搜索时间的基础上向用户推荐高质量的数据的问题。
依据本发明的第一个方面,本发明提供一种数据推荐的处理交互系统,该系统包括:
交互装置及数据处理装置;
所述交互装置用于将获取的开发者使用的数据信息以及确定的其所处状态对应的状态数据发送给数据处理装置,并接收数据处理装置向交互装置推荐的数据;
所述数据处理装置用于根据交互装置获取的数据信息以及交互装置所处的状态向交互装置推荐数据。
依据本发明的第二个方面,本发明提供一种数据推荐的处理方法,该方法主要应用于数据处理装置一侧,包括:
数据处理装置提取用于进行数据推荐的基础信息,所述基础信息用于在数据推荐过程中进行数据匹配;
根据交互装置所处状态确定对应的预设推荐逻辑,所述预设推荐逻辑使用所述基础信息中的至少一种基础信息进行数据推荐;
根据确定的预设推荐逻辑及其使用的基础信息向交互装置进行数据推荐。
依据本发明的第三个方面,本发明提供一种数据推荐的交互方法,该方法主要应用于交互装置一侧,包括:
交互装置获取开发者使用的数据信息;
将所述数据信息发送给数据处理装置,以便数据处理装置从所述数据信息中提取用于进行数据推荐的基础信息;
接收数据处理装置推荐的数据向开发者进行推荐。
依据本发明的第四个方面,本发明提供一种数据推荐的交互方法,该方法主要应用于交互装置一侧,包括:
交互装置确定当前所处的状态;
将确定的所述状态所对应的状态数据发送给数据处理装置,以便数据处理装置根据所述状态数据确定交互装置当前所处的状态;
接收数据处理装置发送的对应交互装置当前所处状态的推荐数据。
依据本发明的第五个方面,本发明提供一种数据推荐的处理装置,该数据处理装置包括:
提取单元,用于提取进行数据推荐的基础信息,所述基础信息用于在数据推荐过程中进行数据匹配;
逻辑确定单元,用于根据交互装置所处状态确定对应的预设推荐逻辑,所述预设推荐逻辑使用所述基础信息中的至少一种基础信息进行数据推荐;
处理单元,用于根据确定的预设推荐逻辑及其使用的基础信息向交互装置进行数据推荐。
依据本发明的第六个方面,本发明提供一种数据推荐的交互装置,该交互装置包括:
获取单元,用于获取开发者使用的数据信息;
第一发送单元,用于将所述数据信息发送给数据处理装置,以便数据处理装置从所述数据信息中提取用于进行数据推荐的基础信息;
第一接收单元,用于接收数据处理装置推荐的数据向开发者进行推荐。
依据本发明的第七个方面,本发明提供一种数据推荐的交互装置,该交互装置,包括:
状态确定单元,用于根据交互装置所展示的内容确定当前所处的状态;
第二发送单元,用于将确定的所述状态所对应的状态数据发送给数据处理装置,以便数据处理装置根据所述状态数据确定交互装置当前所处的状态;
第二接收单元,用于接收数据处理装置发送的对应交互装置当前所处状态的推荐数据。
借由上述技术方案,本发明实施例提供的一种数据推荐的处理交互方法、装置及系统,能够在大量数据以及与开发者或用户有关的数据中提取用于进行数据推荐的基础信息,所述基础信息用于在数据推荐过程中进行数据匹配;然后根据交互装置侧的开发者或用户所处的状态,确定对应的预设推荐逻辑,通常对于交互装置处于不同的状态使用不同的推荐逻辑进行数据推荐,所述预设推荐逻辑使用所述基础信息中的至少一种基础信息进行数据推荐;最后根据确定的预设推荐逻辑及其使用的基础信息进行数据推荐,由于在进行数据推荐时避免了从海量数据中进行搜索,而是在与开发者或用户有关的数据中获取推荐数据,因此能够在大规模复杂的数据场景中,更加快捷的向用户推荐高质量的数据。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的一种数据推荐的处理交互系统的组成框图;
图2示出了本发明实施例提供的一种数据推荐的处理方法的流程图;
图3示出了本发明实施例提供的一种数据推荐的交互方法的流程图;
图4示出了本发明实施例提供的一种数据推荐的交互方法的流程图;
图5示出了本发明实施例提供的一种完整的数据推荐逻辑的示意图;
图6示出了本发明实施例提供的一种数据处理装置的组成框图;
图7示出了本发明实施例提供的一种数据处理装置的组成框图;
图8示出了本发明实施例提供的一种数据推荐的交互装置的组成框图;
图9示出了本发明实施例提供的一种数据推荐的交互装置的组成框图。
具体实施方式
下面将参照附图更加详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
在元数据领域推荐系统匮乏的今天,高质量的数据没办法第一时间展现在开发者眼前,同时开发者在元数据系统中进行数据搜索时,大量搜索历史记录得不得有效利用,致使元数据平台的能力不能充分发挥,开发者每次都需要进行重复、繁重的元数据搜索,尤其开发者想要搜索某个数据的类似数据时,需要花费更多的周折。
为了解决上述问题,本发明实施例提供一种数据推荐的处理交互系统,如图1所述,该系统包括:
交互装置11及数据处理装置12;
交互装置11用于将获取的开发者使用的数据信息以及确定的其所处状态所对应的状态数据发送给数据处理装置12,并接收数据处理装置12向交互装置11推荐的数据;
数据处理装置12用于根据交互装置11获取的数据信息以及交互装置11当前所处的状态向交互装置11推荐数据。
进一步的,所述系统中的交互装置11具有图8所示装置的功能,用于获取开发者使用的数据信息;将所述数据信息发送给数据处理装置12,以便数据处理装置12从所述数据信息中提取用于进行数据推荐的基础信息;接收数据处理装置12推荐的数据向开发者进行推荐。
所述系统中的交互装置11除了具有图8所示装置的功能外,还具有图9所示装置的功能,用于确定交互装置11当前所处的状态;将确定的所述状态所对应的状态数据发送给数据处理装置12,以便数据处理装置12根据所述状态数据确定交互装置11当前所处的状态;接收数据处理装置12发送的对应交互装置11当前所处状态的推荐数据。
进一步的,所述系统中的数据处理装置12具有图6及图7所示装置的功能,用于提取进行数据推荐的基础信息,所述基础信息用于在数据推荐过程中进行数据匹配;根据交互装置11所处状态确定对应的预设推荐逻辑,所述预设推荐逻辑使用所述基础信息中的至少一种基础信息进行数据推荐;根据确定的预设推荐逻辑及其使用的基础信息向交互装置11进行数据推荐。
本发明实施例提供的一种数据推荐的处理交互系统,能够在大量数据以及与开发者或用户有关的数据中提取用于进行数据推荐的基础信息,所述基础信息用于在数据推荐过程中进行数据匹配;然后根据交互装置侧的开发者或用户所处的状态,确定对应的预设推荐逻辑,通常对于交互装置处于不同的状态使用不同的推荐逻辑进行数据推荐,所述预设推荐逻辑使用所述基础信息中的至少一种基础信息进行数据推荐;最后根据确定的预设推荐逻辑及其使用的基础信息进行数据推荐,由于在进行数据推荐时避免了从海量数据中进行搜索,而是在与开发者或用户有关的数据中获取推荐数据,因此能够在大规模复杂的数据场景中,更加快捷的向用户推荐高质量的数据。
由于本发明实施例提供的数据推荐的处理交互系统,不仅会涉及交互装置一侧的数据推荐的交互方法,而且还会涉及数据处理装置一侧的数据推荐的处理方法,因此为了能够更好的阐述所述系统在进行数据推荐时所具有的功能,本发明实施例将分别对所述系统中的数据处理装置一侧的方法以及交互装置一侧的方法进行说明。
本发明实施例提供了一种数据推荐的处理方法,能够在大规模复杂的数据场景中,更加快捷的向用户推荐高质量的数据。该方法应用于数据处理装置,如图2所示,该方法包括:
201、数据处理装置提取用于进行数据推荐的基础信息,所述基础信息用于在数据推荐过程中进行数据匹配。
随着大数据时代的到来,用户需要在海量的数据中查询到自身需要的数据信息,但是在传统的数据系统例如元数据管理系统中,开发者或用户需要基于各种查询条件进行元数据搜索。但是在现有的这些数据系统中,数据开发者受限于自身已知的数据范围,尤其是自身输入的查询条件的限制,例如自身输入的关键词、搜索范围等限制,通常使数据开发者无法快捷方便的发现相同业务领域的其他数据。因此,本发明实施例在进行数据推荐时,首先需要执行步骤201:提取用于进行数据推荐的基础信息,所述基础信息包括开发者自身产生的数据信息以及与开发者存在关系的数据信息,并且所述基础信息用于在数据推荐过程中进行数据匹配。
202、根据交互装置所处状态确定对应的预设推荐逻辑,所述预设推荐逻辑使用所述基础信息中的至少一种基础信息进行数据推荐。
由于现有的数据系统需要根据开发者或用户输入的查询条件进行数据推荐,因此进行数据推荐时使用的推荐逻辑比较单一,只是基于开发者或用户的查询条件进行查询,导致数据推荐的效果取决于查询条件的优劣与否。基于上述原因,本发明实施例在进行数据推荐时为了获得更加高质量的推荐结果,还需要根据用户或开发者在交互装置一侧所处的状态来确定具体的推荐逻辑,不同的推荐逻辑使用不同的基础信息,但是每个推荐逻辑都使用基础信息中的至少一种基础信息进行数据推荐。
203、根据确定的预设推荐逻辑及其使用的基础信息向交互装置进行数据推荐。
当通过步骤201提取到进行数据推荐的基础信息,并且通过步骤202确定了与交互装置所处状态相对应的预设推荐逻辑之后,就可以执行步骤203:根据确定的预设推荐逻辑及其使用的基础信息进行数据推荐。由于步骤201提取的基础信息是开发者自身产生的数据信息以及与开发者存在关系的数据信息,同时步骤202确定的推荐逻辑是与开发者在交互装置一侧所处的状态有关的推荐逻辑,因此结合所述推荐逻辑及其使用的基础信息进行数据推荐时,能够更加精确的向开发者或用户进行数据推荐。
与上述图2所示的方法相对应,本发明实施例提供了一种数据推荐的交互方法,该方法应用于交互装置一侧,如图3所示,该方法包括:
301、交互装置获取开发者使用的数据信息。
通常开发者或用户在交互装置一侧进行操作时,会涉及到大量的数据信息,这些数据信息能够从侧面反映出开发者与这些数据之间的关系程度,尤其对于开发者操作的历史数据进行研究,能够推断出开发者对数据的喜好及需求,因此可以参考开发者使用的数据信息向开发者推荐数据。由于开发者或用户通常在交互装置一侧进行一系列涉及数据信息的操作,如浏览数据表、搜索关键词、创建数据表等,因此本发明实施例需要执行步骤301交互装置获取开发者使用的数据信息。
302、将所述数据信息发送给数据处理装置,以便数据处理装置从所述数据信息中提取用于进行数据推荐的基础信息。
当交互装置获取到开发者使用的数据信息后,需要将所述数据信息发送给数据处理装置。由于开发者在交互装置一侧操作时涉及的数据信息量大,而且对于历史数据信息而言,其中往往会存在大量的无效数据,如开发者输入错误的数据信息、开发者创建错误的数据信息或浏览错误的数据信息等,因此若盲目的从大量的数据信息中选择特定的数据向交互装置一侧的开发者推荐时,往往不会达到有效的推荐效果。因此,这些数据信息还需要经过数据处理装置进行提取,得到具有代表性的基础信息,这些基础信息可以用来向交互装置进行数据推荐。
303、接收数据处理装置推荐的数据向开发者进行推荐。
当交互装置将开发者使用的数据信息发送给数据处理装置后,数据处理装置会从大量的数据信息中提取出具有代表性的基础信息,并将该基础信息与交互装置所处的状态相结合,向交互装置推荐数据。其中,交互装置所处的状态也就是开发者在交互装置一侧操作时的状态,如开发者在交互装置上搜索关键词或在交互装置上浏览数据表等;而数据处理装置会将开发者在交互装置上搜索的关键词或浏览的数据表的信息与提取的基础信息进行匹配,由于基础信息与开发者有关,并且是与开发者有关的具有代表性的数据信息,因此交互装置会接收到数据处理装置推荐的匹配成功的数据,这些数据很大程度上能够满足开发者的需求或喜好,从而实现根据交互装置所处的状态向开发者推荐数据的目的。
与图2所示的方法相对应以及对图3所示的方法的补充,本发明实施例还提供了一种数据推荐的交互方法,该方法应用于交互装置一侧,如图4所示,该方法包括:
401、交互装置确定当前所处的状态。
开发者或用户在交互装置通常会进行多种类型的操作,如开发者在交互装置上搜索数据信息或者在交互装置上浏览数据信息,这些不同的操作会在交互装置上展示出不同的内容,使交互装置处于不同的状态。因此,作为一种可选的实施方式,本发明实施例中的交互装置可以根据其所展示的内容确定当前所处的状态,这个确定过程可以由开发者或用户根据交互装置展示的内容自行选择其所处的状态,当然也可以由交互装置根据其展示的内容来自行确定当前所处的状态。例如,当开发者在交互装置上搜索数据信息时,交互装置上通常会展示出搜索的界面、搜索的关键词信息、甚至是与关键词信息具有关联的其他关键词信息;或者,当开发者在交互装置上浏览数据信息时,交互装置上通常会展示出数据表、文档等文本信息。由于开发者在交互装置上进行的操作不同,使得交互装置上展示的内容也不同,因此交互装置可以根据其展示的内容确定当前所处的状态。当交互装置展示了开发者输入的关键词信息时,可以确定交互装置当前所处的状态是搜索关键词的状态;当交互装置展示了数据表或文档等文本信息时,可以确定交互装置当前所处的状态是浏览数据的状态。而在交互装置处于不同的状态下,向交互装置推荐的数据往往不同,当交互装置处于搜索关键词的状态时,需要向交互装置推荐与搜索的关键词相关联和匹配的数据;当交互装置处于浏览数据表的状态时,需要向交互装置推荐与浏览的数据表相关联的数据。因此,在向交互装置推荐数据时,首先需要通过交互装置确定当前所处的状态。因此需要执行步骤401交互装置确定当前所处的状态。
402、将确定的所述状态所对应的状态数据发送给数据处理装置,以便数据处理装置根据所述状态数据确定交互装置当前所处的状态。
当交互装置确定当前所处的状态时,就需要将确定的状态所对应的状态数据发送给数据处理装置,以便数据处理装置根据所述状态数据确定交互装置当前所处的状态。本发明实施例中的状态数据用以描述状态,不同的状态对应不同的状态数据。具体地,状态数据可以用状态标识来表示,例如,对于交互装置处于搜索关键词的状态时,本发明实施例中其对应的状态标识可以是“state-search”;当交互装置处于浏览数据表的状态时,本发明实施例中其对应的状态标识可以是“state-scan”,数据处理装置能够根据接收的状态标识确定交互装置当前所处的状态。
403、接收数据处理装置发送的对应交互装置当前所处状态的推荐数据。
当交互装置将当前所处的状态对应的状态数据发送给数据处理装置后,数据处理装置会根据具体的状态数据确定交互装置当前所处的状态,并将所述状态与用于进行数据推荐的基础信息相结合,从基础信息中选择与所述状态相匹配的推荐数据发送给交互装置。由于基础信息是由数据处理装置从交互装置侧使用的大量数据信息中提取的与开发者或用户相关的具有代表性的数据信息,因此,交互装置接收到数据处理装置发送的推荐数据在很大程度上能够满足开发者的需求或喜好,从而实现根据交互装置所处的状态向开发者推荐数据的目的。
本发明实施例提供的一种数据推荐的处理交互方法,能够在大量数据以及与开发者或用户有关的数据中提取用于进行数据推荐的基础信息,所述基础信息用于在数据推荐过程中进行数据匹配;然后根据交互装置侧的开发者或用户所处的状态,确定对应的预设推荐逻辑,通常对于交互装置处于不同的状态使用不同的推荐逻辑进行数据推荐,所述预设推荐逻辑使用所述基础信息中的至少一种基础信息进行数据推荐;最后根据确定的预设推荐逻辑及其使用的基础信息进行数据推荐,由于在进行数据推荐时避免了从海量数据中进行搜索,而是在与开发者或用户有关的数据中获取推荐数据,因此能够在大规模复杂的数据场景中,更加快捷的向用户推荐高质量的数据。
为了更好的对上述图2、图3及图4所示的方法进行理解,作为对上述实施方式的细化和扩展,本发明实施例将针对图2、图3及图4中的步骤进行详细说明。
由于在本发明实施例中,开发者通常在交互装置上进行操作,并且在操作时会涉及到大量的数据信息,这些数据信息往往与开发者的喜好或需求息息相关。因此,数据处理装置在向交互装置进行数据推荐时不仅需要参考开发者产生或使用的数据,同时还需要参考与开发者具有关系的其他开发者产生的数据,也就是提取用于进行数据推荐的基础信息,具体的需要从交互装置返回给数据处理装置的大量数据信息中,提取用于进行数据推荐的开发者行为历史信息、预设推荐范围内的元数据标签和/或用于缩小推荐范围的关系数据。这里需要说明的是,在交互装置返回给数据处理装置的大量数据信息中提取的开发者行为历史信息、预设推荐范围内的元数据标签或者关系数据,这三类信息中的任何一类信息,都可以在向交互装置进行数据推荐的过程中使用,即使单独使用其中的一类信息也可以在某一方面或者一定程度上提高数据推荐的准确性。作为优选的实施方式,在向交互装置进行数据推荐时,数据处理装置也可以同时使用开发者行为历史信息、预设推荐范围内的元数据标签以及关系数据,从而达到更加准确的数据推荐效果。
其中,交互装置获取的并发送给数据处理装置的数据信息通常包括:开发者搜索的关键词、浏览的数据表、创建的数据表和/或创建数据表时所依赖的数据表,交互装置发送给数据处理装置的数据信息的类型越全面,数据处理装置提取的用于进行数据推荐的基础信息就越具有代表性,使得后续向交互装置推荐的数据就越准确。而数据处理装置从这些数据信息中提取的开发者行为历史信息是开发者曾经使用或产生或依赖的数据信息,为进行精确数据推荐的最为关键的部分;预设推荐范围内的元数据标签需要与开发者行为历史信息结合使用,便可以进行近似数据的匹配,其特点是匹配范围较广;而关系数据用以缩小匹配广度,以便精确快捷的进行数据搜索与推荐。在本发明实施例中,预设推荐范围内的元数据标签通常指的是除去临时表、表大小低于10MB的表、开发者自己的表、开发者最近一周使用的表、无下游依赖的表(若某一数据表不直接产生其他的数据表,则该数据表为无下游依赖的表)之外的数据表的元数据标签。设置所述预设推荐范围是为了在进行数据推荐时能够避免数据重复搜索与推荐。以下将针对这三部分基础信息的提取进行说明。
对于数据处理装置提取开发者行为历史信息而言,主要是提取下列三种数据信息:
(1)提取开发者在预设时间内的搜索关键词;
此步骤在具体执行过程中,主要是获取开发者在预设时间内的搜索关键词的历史记录,其中,预设时间可以根据需求进行设定,若需求为希望搜索得到与最近半年有关的数据时,可以设定预设时间为6个月。在本发明实施例中,可以取1个月作为预设时间,也就是获取开发者在1个月内的搜索关键词历史记录;然后从搜索关键词的历史记录中剔除无效关键词后得到有效搜索关键词;所述无效关键词包括:停用词和特殊字符。
当得到1个月内的有效搜索关键词后,就可以利用加权算法统计有效搜索关键词的权值。本发明实施例对具体的加权算法不作限制,作为一种可选的实施方式,可以使用TF-I DF算法统计有效搜索关键词的权值,根据TF-I DF算法的计算公式可知,需要通过计算得到有效搜索关键词的词频以及逆向文件频率,其中某一个有效搜索关键词的词频等于该有效搜索关键词在1个月内的有效搜索关键词中出现的频率;其逆向文件频率等于数据表的总数目除以包含该有效搜索关键词的文件的数目,再将得到的商取对数得到。当然,作为一种简单的处理方式,还可以将有效搜索关键词的词频作为其权值参与到后续的处理中。
当统计出有效搜索关键词的权值后,为了更加精确的进行有效搜索关键词的排序,本发明实施例还需要将时间的影响考虑到其中,具体的可以根据有效搜索关键词对应的权值以及搜索时间计算有效搜索关键词的时间加权值。其中,需要将有效搜索关键词对应的搜索时间转换为yyyyMMdd的数字,按照公式yyyyMMdd/时间因子+(权值*权值因子)计算有效搜索关键词的时间加权值,最后按照计算的时间加权值由大到小的顺序,在有效搜索关键词中提取出第一预设个数的搜索关键词作为开发者在1个月的预设时间内的搜索关键词,该第一预设个数可以为10个,也就是提取出开发者在1个月的预设时间内最具有代表性(最常使用或最关注)的10个关键词。这里需要说明的是,若通过加权算法统计有效搜索关键词的权值时,是简单的以有效搜索关键词的词频作为加权算法的统计结果,则计算有效搜索关键词的时间加权值时,是以公式yyyyMMdd/时间因子+(词频*词频因子)计算的。其中,时间加权值以100为最佳,公式中的词频因子可以根据不同的情况作出调整,在调整时主要基于以下一方面考虑:如果要降低词频对于有效搜索关键词的代表性的影响,则可以将词频因子设定为小于1的值,如果要加强词频对于有效搜索关键词的代表性的影响,则可以将词频因子设定为大于1的值。
(2)提取开发者创建的表的元数据提取关键词;
此步骤在具体执行过程中,主要是获取开发者创建的表的元数据标签,元数据标签来源于数据表的表名、表comment(表注释)、字段comment(字段注释),获取到开发者创建的表的元数据标签后,需要统计获取的所述元数据标签在全量元数据标签(全局标签)中的权值,也就是使用加权算法统计开发者创建的表的元数据标签在所有数据表的标签中的权值。当然,作为一种简单的处理方式,也可以直接统计开发者创建的表的元数据标签在所有数据表的标签中出现的词频。具体的统计方法与上述统计开发者在预设时间内的搜索关键的权值类似,此处不再赘述。
当统计出开发者创建的表的元数据标签的权值后,就可以按照统计的元数据标签的权值由大到小的顺序,在获取的所述元数据标签中提取出第二预设个数的元数据标签作为开发者创建的表的元数据提取关键词。其中,第二预设个数可以为10个,也就是在开发者创建的表的元数据标签中选取在全局标签中最具代表性的10个元数据标签作为开发者创建的表的元数据提取关键词。
(3)提取开发者依赖的表的元数据提取关键词。
首先需要说明的是,开发者依赖的表指的是开发者在开发表A时,是在利用表B的基础上直接开发了表A,则表B是开发者依赖的表。此步骤在具体执行过程中,主要是获取开发者依赖的表的元数据标签,元数据标签来源于数据表的表名、表comment(表注释)、字段comment(字段注释),获取到开发者依赖的表的元数据标签后,需要统计获取的所述元数据标签在全量元数据标签(全局标签)中的权值,也就是使用加权算法统计开发者依赖的表的元数据标签在所有数据表的标签中的权值。当然,作为一种简单的处理方式,也可以直接统计开发者依赖的表的元数据标签在所有数据表的标签中出现的词频。具体的统计方法与上述统计开发者在预设时间内的搜索关键的权值类似,此处不再赘述。
当统计出开发者依赖的表的元数据标签的权值后,就可以按照统计的元数据标签的权值由大到小的顺序,在获取的所述元数据标签中提取出第三预设个数的元数据标签作为开发者依赖的表的元数据提取关键词。其中,第三预设个数可以为10个,也就是在开发者依赖的表的元数据标签中选取在全局标签中最具代表性的10个元数据标签作为开发者依赖的表的元数据提取关键词。
对于提取预设推荐范围内的元数据标签而言,为了在进行数据推荐时能够避免数据重复搜索与推荐,主要是在除去临时表、表大小低于10MB的表、开发者自己的表、开发者最近一周使用的表、无下游依赖的表之后,在其他数据表的表信息中提取作为元数据标签的关键词:(1)提取表名作为元数据标签的关键词;(2)提取表comment作为元数据标签的关键词;(3)提取字段comment作为元数据标签的关键词。当获取到这些作为元数据标签的关键词之后,同样需要使用加权算法统计这些元数据标签的关键词在数据表中的权值,具体的统计方法与上述统计开发者在预设时间内的搜索关键的权值类似,此处不再赘述。最后按照所述作为元数据标签的关键词的权值由大到小的顺序,在每个数据表中提取第四预设个数的元数据标签的关键词作为预设推荐范围内的元数据标签。其中,第四预设个数可以为10个,也就是在预设推荐范围内的数据表的元数据标签中选取在全局标签中最具代表性的10个元数据标签作为全量(预设推荐范围内)元数据标签。这里需要说明的是,在统计提取的元数据标签的关键词的权值时,由于表名、表comment相比字段comment更能概况出数据表的作用,因此在最终确定来源于表名和表comment的元数据标签的关键词的权值时,需要将计算的权值加上预设的数值,该数值可以设定,数值越大说明来源于表名和表comment的元数据标签的关键词越具有代表性,在本发明实施例中可以将来源于表名和表comment的元数据标签的关键词的权值加0.05。
对于提取关系数据而言,由于在六度空间理论中,任何两个人中间最多经过5个人既可产生联系,因此在通过关系数据缩小数据搜索范围时,开发者关系的深度不宜太深,否则达不到缩小搜索范围的目的。在本发明实施例中,根据开发者关系深度的情况,可以在开发者中选取具有预设层次关系的开发者形成用于缩小推荐范围的关系数据。本发明实施例根据实际测验,可以选取3层深度的关系数据用于进行数据推荐。例如,若开发者甲开发了数据表A,开发者乙在数据表A的基础上开发了数据表B,开发者丙在数据表B的基础上开发了数据表C,那么开发者甲乙丙为三层深度的开发者关系,其各自开发的数据表A、B、C为具有三层深度的关系数据。
当通过上述实施方式提取出用于进行数据推荐的基础信息之后,还需要使用推荐逻辑进行数据推荐。本发明实施例区别于现有技术中只是基于用户输入的查询条件进行数据搜索查询,而是需要根据交互装置当前所处的状态确定对应的预设推荐逻辑,通常所述推荐逻辑需要结合不同的基础信息进行数据推荐。本发明实施例中预设的推荐逻辑从交互装置所处的状态来看,可以分为三种:(1)无上下文,基于开发者行为历史的推荐;(2)基于搜索的关键词进行推荐;(3)基于具体的数据表进行推荐。
由于本发明实施例在向交互装置推荐数据时,不仅需要使用从交互装置侧获取的大量数据信息中提取的与开发者或用户相关的具有代表性的基础信息,而且还需要结合不同状态下对应的推荐逻辑进行推荐。因此,本发明实施例的数据处理装置还需要在确定交互装置当前所处的状态之后,才能正确的向交互装置进行数据推荐。具体的,数据处理装置需要接收交互装置发送的与交互装置所处的状态相对应的状态数据。在本发明实施例中,预设的推荐逻辑所对应的交互装置的状态通常有三种:1、交互装置处于当前无上下文的状态;2、交互装置处于搜索关键词的状态;3、交互装置处于浏览数据表的状态。当交互装置确定当前处于无上下文的状态时,会将无上下文的状态所对应的状态数据(可以为state-nul l)发送给数据处理装置;当交互装置确定当前处于搜索关键词的状态时,会将搜索关键词的状态所对应的状态数据(可以为state-search)发送给数据处理装置;当交互装置确定当前处于浏览数据表的状态时,会将浏览数据表的状态所对应的状态数据(可以为state-scan)发送给数据处理装置。数据处理装置根据接收的状态数据可以确定交互装置当前所处的状态,从而选择与所述状态相对应的推荐逻辑进行数据推荐。其中,状态对应的状态数据除了用本发明实施例中举例的状态标识进行表示外,还可以通过其他形式表示,例如可以用“state-IDX”来表示,X可以为阿拉伯数字编号或者英文字母编号等。
当数据处理装置通过上述方式提取到用于进行数据推荐的基础信息以及通过交互装置所处的状态确定相应的推荐逻辑之后,就可以从基础信息中选择出特定的数据推荐给交互装置。具体的:
当交互装置所处的状态为当前无上下文状态时,一般来讲,当开发者或用户处于一个网站的首页时,即处于无当前上下文的状态,此时,推荐系统会进行一次最完整的推荐逻辑处理,如图5所示,即结合提取的用户行为历史信息,在提取的预设推荐范围内的元数据标签中进行匹配,并使用提取的关系数据缩小搜索范围,将搜索范围缩小后匹配成功的元数据标签所对应的数据向交互装置一侧的开发者进行推荐。
当交互装置所处的状态为开发者搜索关键词时,也就是当开发者或用户在进行关键词的搜索时,搜索的关键词即是当前上下文,可以反映出开发者的意图。此时,推荐系统则根据用户搜的的关键词在提取的预设推荐范围内的元数据标签中进行匹配,并使用提取的关系数据缩小搜索范围,将搜索范围缩小后匹配成功的元数据标签所对应的数据向交互装置的开发者进行推荐。这里需要说明的是,目前类似于面向全社会的数据推荐尚未形成,一般的数据使用范围受限于企业内部,所以默认来讲,所有预设推荐范围内的数据都会参与到推荐中来,因此为了避免搜索结果产生重复的数据,需要将当前页的搜索结果数据排除,待将来面向全社会的数据推荐形成时,可以被推荐的数据必定是经过精心挑选的,或由广告主投放决定。
当交互装置所处的状态为开发者浏览数据表时,也就是当开发者或用户在浏览某个具体的数据表时,该数据表即是当前上下文,此时,推荐系统将提取的该数据表的元数据标签在提取的预设推荐范围内的元数据标签进行匹配,将匹配成功的元数据标签所对应的数据向交互装置的开发者进行推荐。
对于交互装置而言,当开发者在交互装置上处于一个网页并且没有进行操作时,交互装置会收到数据处理装置推荐的数据,并将该数据展示给开发者,该数据是由数据处理装置通过将开发者行为历史信息与预设推荐范围内的元数据标签进行匹配,并使用关系数据缩小搜索范围后得到的;当开发者在交互装置上搜索关键词时,交互装置会接收到数据处理装置推荐的数据,该数据是由数据处理装置通过将该搜索的关键词与预设推荐范围内的元数据标签进行匹配,并使用关系数据缩小搜索范围后得到的;当开发者在交互装置上浏览数据表时,交互装置会接收到数据处理装置推荐的数据,该数据是由数据处理装置通过将交互装置浏览的数据表的标签与预设推荐范围内的元数据标签进行匹配后得到的。
由于本发明实施例中推荐系统可以根据交互装置所处的不同状态采用不同的推荐逻辑,并结合相应的基础信息进行数据推荐,并且这些基础信息都是与开发者息息相关的数据信息,因此能够更加准确的向开发者推荐开发者可能需要的数据。
进一步的,作为对上述图2所示方法的实现,本发明实施例提供了一种数据推荐的处理装置,该装置称为数据处理装置,如图6所示,该数据处理装置包括:提取单元61、逻辑确定单元62以及处理单元63,其中,
提取单元61,用于提取进行数据推荐的基础信息,所述基础信息用于在数据推荐过程中进行数据匹配;
逻辑确定单元62,用于根据交互装置所处状态确定对应的预设推荐逻辑,所述预设推荐逻辑使用所述基础信息中的至少一种基础信息进行数据推荐;
处理单元63,用于根据确定的预设推荐逻辑及其使用的基础信息向交互装置进行数据推荐。
进一步的,如图7所示,提取单元61包括:
第一提取子单元611,用于提取用于进行数据推荐的开发者行为历史信息;
第二提取子单元612,用于提取预设推荐范围内的元数据标签;
第三提取子单元613,用于提取用于缩小推荐范围的关系数据。
进一步的,第一提取子单元611用于提取开发者创建的表的元数据提取关键词、开发者依赖的表的元数据提取关键词和/或开发者在预设时间内的搜索关键词共同构成开发者行为历史信息。
进一步的,如图7所示,第一提取子单元611包括:
第一获取模块6111,用于获取开发者在预设时间内的搜索关键词的历史记录,从搜索关键词的历史记录中剔除无效关键词后得到有效搜索关键词;所述无效关键词包括:停用词和特殊字符;
第一统计模块6112,用于利用加权算法统计有效搜索关键词的权值;
第一计算模块6113,用于根据有效搜索关键词对应的权值以及搜索时间计算有效搜索关键词的时间加权值;
第一提取模块6114,用于根据计算的时间加权值,在有效搜索关键词中提取出第一预设个数的搜索关键词作为开发者在预设时间内的搜索关键词。
进一步的,如图7所示,第一提取子单元611还包括:
第二获取模块6115,用于获取开发者创建的表的元数据标签;
第二统计模块6116,用于统计获取的所述元数据标签在全量元数据标签中的权值;
第二提取模块6117,用于根据统计的元数据标签的权值,在获取的所述元数据标签中提取出第二预设个数的元数据标签作为开发者创建的表的元数据提取关键词。
进一步的,如图7所示,第一提取子单元611还包括:
第三获取模块6118,用于获取开发者依赖的表的元数据标签;
第三统计模块6119,用于统计获取的所述元数据标签在全量元数据标签中的权值;
第三提取模块6120,用于根据统计的元数据标签的权值,在获取的所述元数据标签中提取出第三预设个数的元数据标签作为开发者依赖的表的元数据提取关键词。
进一步的,如图7所示,第二提取子单元612包括:
第四获取模块6121,用于在数据表的表信息中提取作为元数据标签的关键词;
第四统计模块6122,用于利用加权算法统计所述作为元数据标签的关键词的权值;
第四提取模块6123,用于根据所述作为元数据标签的关键词的权值,在每个数据表中提取第四预设个数的元数据标签的关键词作为预设推荐范围内的元数据标签。
进一步的,第四统计模块6122用于在所述作为元数据标签的关键词来源于表信息中的表名或者表注释时,将所述作为元数据标签的关键词的权值加上预设的数值。
进一步的,第三提取子单元613用于根据开发者关系深度的情况,在开发者中选取具有预设层次关系的开发者形成用于缩小推荐范围的关系数据。
进一步的,处理单元63用于当交互装置处于当前无上下文的状态时,将开发者行为历史信息与预设推荐范围内的元数据标签进行匹配,并使用提取的关系数据缩小搜索范围,将搜索范围缩小后匹配成功的元数据标签所对应的数据向交互装置进行推荐;
处理单元63还用于当交互装置处于搜索关键词的状态时,将交互装置搜索的关键词与预设推荐范围内的元数据标签进行匹配,并使用提取的关系数据缩小搜索范围,将搜索范围缩小后匹配成功的元数据标签所对应的数据向交互装置进行推荐;
处理单元63还用于当交互装置处于浏览数据表的状态时,将交互装置浏览的数据表的标签与预设推荐范围内的元数据标签进行匹配,将匹配成功的元数据标签所对应的数据向交互装置进行推荐。
进一步的,作为对上述图3所示方法的实现,本发明实施例提供了一种数据推荐的交互装置,如图8所示,该交互装置包括:获取单元81、第一发送单元82以及第一接收单元83,其中,
获取单元81,用于获取开发者使用的数据信息;
第一发送单元82,用于将所述数据信息发送给数据处理装置,以便数据处理装置从所述数据信息中提取用于进行数据推荐的基础信息;
第一接收单元83,用于接收数据处理装置推荐的数据向开发者进行推荐。
进一步的,数据处理装置从第一发送单元82发送的数据信息中提取的进行数据推荐的基础信息包括:开发者行为历史信息、预设推荐范围内的元数据标签和/或用于缩小推荐范围的关系数据。
进一步的,第一接收单元83用于在交互装置处于当前无上下文的状态时,接收数据处理装置通过将开发者行为历史信息与预设推荐范围内的元数据标签进行匹配,并使用关系数据缩小搜索范围后得到的匹配成功的元数据标签所对应的数据。
进一步的,第一接收单元83用于在交互装置处于搜索关键词的状态时,接收数据处理装置通过将交互装置搜索的关键词与预设推荐范围内的元数据标签进行匹配,并使用关系数据缩小搜索范围后得到的匹配成功的元数据标签所对应的数据。
进一步的,第一接收单元83用于在交互装置处于浏览数据表的状态时,接收数据处理装置通过将交互装置浏览的数据表的标签与预设推荐范围内的元数据标签进行匹配后得到的匹配成功的元数据标签所对应的数据。
进一步的,作为对上述图4所示方法的实现,本发明实施例提供了一种数据推荐的交互装置,如图9所示,该交互装置包括:状态确定单元91、第二发送单元92及第二接收单元93,其中,
状态确定单元91,用于确定交互装置当前所处的状态;
第二发送单元92,用于将确定的所述状态所对应的状态数据发送给数据处理装置,以便数据处理装置根据所述状态数据确定交互装置当前所处的状态;
第二接收单元93,用于接收数据处理装置发送的对应交互装置当前所处状态的推荐数据。
进一步的,状态确定单元91确定的状态包括:交互装置处于当前无上下文的状态、交互装置处于搜索关键词的状态和/或交互装置处于浏览数据表的状态。
进一步的,第二接收单元93用于当交互装置处于当前无上下文的状态时,接收数据处理装置发送的对应无上下文的状态的推荐数据。
进一步的,第二接收单元93用于当交互装置处于搜索关键词的状态时,接收数据处理装置发送的对应搜索关键词的状态的推荐数据。
进一步的,第二接收单元93用于当交互装置处于浏览数据表的状态时,接收数据处理装置发送的对应浏览数据表的状态的推荐数据。
本发明实施例提供的一种数据推荐的处理交互装置,能够在大量数据以及与开发者或用户有关的数据中提取用于进行数据推荐的基础信息,所述基础信息用于在数据推荐过程中进行数据匹配;然后根据交互装置侧的开发者或用户所处的状态,确定对应的预设推荐逻辑,通常对于交互装置处于不同的状态使用不同的推荐逻辑进行数据推荐,所述预设推荐逻辑使用所述基础信息中的至少一种基础信息进行数据推荐;最后根据确定的预设推荐逻辑及其使用的基础信息进行数据推荐,由于在进行数据推荐时避免了从海量数据中进行搜索,而是在与开发者或用户有关的数据中获取推荐数据,因此能够在大规模复杂的数据场景中,更加快捷的向用户推荐高质量的数据。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
可以理解的是,上述方法及装置中的相关特征可以相互参考。另外,上述实施例中的“第一”、“第二”等是用于区分各实施例,而并不代表各实施例的优劣。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的发明名称(如确定网站内链接等级的装置)中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
Claims (37)
1.一种数据推荐的处理交互系统,其特征在于,所述系统包括:
交互装置及数据处理装置;
所述交互装置用于将获取的开发者使用的数据信息以及确定的其所处状态对应的状态数据发送给数据处理装置,并接收数据处理装置向交互装置推荐的数据;
所述数据处理装置用于根据交互装置获取的数据信息以及交互装置所处的状态向交互装置推荐数据。
2.根据权利要求1所述的系统,其特征在于,
所述交互装置获取开发者使用的数据信息;
将所述数据信息发送给数据处理装置,以便数据处理装置从所述数据信息中提取用于进行数据推荐的基础信息;
接收数据处理装置推荐的数据向开发者进行推荐。
3.根据权利要求1所述的系统,其特征在于,
所述交互装置确定当前所处的状态;
将确定的所述状态所对应的状态数据发送给数据处理装置,以便数据处理装置根据所述状态数据确定交互装置当前所处的状态;
接收数据处理装置发送的对应交互装置当前所处状态的推荐数据。
4.根据权利要求1所述的系统,其特征在于,
所述数据处理装置提取用于进行数据推荐的基础信息,所述基础信息用于在数据推荐过程中进行数据匹配;
根据交互装置所处状态确定对应的预设推荐逻辑,所述预设推荐逻辑使用所述基础信息中的至少一种基础信息进行数据推荐;
根据确定的预设推荐逻辑及其使用的基础信息向交互装置进行数据推荐。
5.一种数据推荐的处理方法,所述方法应用于数据处理装置,其特征在于,所述方法包括:
数据处理装置提取用于进行数据推荐的基础信息,所述基础信息用于在数据推荐过程中进行数据匹配;
根据交互装置所处状态确定对应的预设推荐逻辑,所述预设推荐逻辑使用所述基础信息中的至少一种基础信息进行数据推荐;
根据确定的预设推荐逻辑及其使用的基础信息向交互装置进行数据推荐。
6.根据权利要求5所述的方法,其特征在于,提取用于进行数据推荐的基础信息包括:
提取用于进行数据推荐的开发者行为历史信息、预设推荐范围内的元数据标签和/或用于缩小推荐范围的关系数据。
7.根据权利要求6所述的方法,其特征在于,提取开发者行为历史信息包括:
提取开发者创建的表的元数据提取关键词、开发者依赖的表的元数据提取关键词和/或开发者在预设时间内的搜索关键词共同构成开发者行为历史信息。
8.根据权利要求7所述的方法,其特征在于,提取开发者在预设时间内的搜索关键词包括:
获取开发者在预设时间内的搜索关键词的历史记录,从搜索关键词的历史记录中剔除无效关键词后得到有效搜索关键词;所述无效关键词包括:停用词和特殊字符;
利用加权算法统计有效搜索关键词的权值;
根据有效搜索关键词对应的权值以及搜索时间计算有效搜索关键词的时间加权值;
根据计算的时间加权值,在有效搜索关键词中提取出第一预设个数的搜索关键词作为开发者在预设时间内的搜索关键词。
9.根据权利要求7所述的方法,其特征在于,提取开发者创建的表的元数据提取关键词包括:
获取开发者创建的表的元数据标签,统计获取的所述元数据标签在全量元数据标签中的权值;
根据统计的元数据标签的权值,在获取的所述元数据标签中提取出第二预设个数的元数据标签作为开发者创建的表的元数据提取关键词。
10.根据权利要求7所述的方法,其特征在于,提取开发者依赖的表的元数据提取关键词包括:
获取开发者依赖的表的元数据标签,统计获取的所述元数据标签在全量元数据标签中的权值;
根据统计的元数据标签的权值,在获取的所述元数据标签中提取出第三预设个数的元数据标签作为开发者依赖的表的元数据提取关键词。
11.根据权利要求6所述的方法,其特征在于,提取预设推荐范围内的元数据标签包括:
在数据表的表信息中提取作为元数据标签的关键词;
利用加权算法统计所述作为元数据标签的关键词的权值;
根据所述作为元数据标签的关键词的权值,在每个数据表中提取第四预设个数的关键词作为预设推荐范围内的元数据标签。
12.根据权利要求11所述的方法,其特征在于,利用加权算法统计所述作为元数据标签的关键词的权值包括:
若所述作为元数据标签的关键词来源于表信息中的表名或者表注释,则将所述作为元数据标签的关键词的权值加上预设的数值。
13.根据权利要求6所述的方法,其特征在于,提取用于缩小推荐范围的关系数据包括:
根据开发者关系深度的情况,在开发者中选取具有预设层次关系的开发者形成用于缩小推荐范围的关系数据。
14.根据权利要求6所述的方法,其特征在于,根据确定的预设推荐逻辑及其使用的基础信息向交互装置进行数据推荐包括:
当交互装置处于当前无上下文的状态时,将开发者行为历史信息与预设推荐范围内的元数据标签进行匹配,并使用提取的关系数据缩小搜索范围,将搜索范围缩小后匹配成功的元数据标签所对应的数据向交互装置进行推荐。
15.根据权利要求6所述的方法,其特征在于,根据确定的预设推荐逻辑及其使用的基础信息向交互装置进行数据推荐包括:
当交互装置处于搜索关键词的状态时,将交互装置搜索的关键词与预设推荐范围内的元数据标签进行匹配,并使用提取的关系数据缩小搜索范围,将搜索范围缩小后匹配成功的元数据标签所对应的数据向交互装置进行推荐。
16.根据权利要求6所述的方法,其特征在于,根据确定的预设推荐逻辑及其使用的基础信息向交互装置进行数据推荐包括:
当交互装置处于浏览数据表的状态时,将交互装置浏览的数据表的标签与预设推荐范围内的元数据标签进行匹配,将匹配成功的元数据标签所对应的数据向交互装置进行推荐。
17.一种数据推荐的交互方法,所述方法应用于交互装置,其特征在于,所述方法包括:
交互装置获取开发者使用的数据信息;
将所述数据信息发送给数据处理装置,以便数据处理装置从所述数据信息中提取用于进行数据推荐的基础信息;
接收数据处理装置推荐的数据向开发者进行推荐。
18.根据权利要求17所述的方法,其特征在于,用于进行数据推荐的基础信息包括:
用于进行数据推荐的开发者行为历史信息、预设推荐范围内的元数据标签和/或用于缩小推荐范围的关系数据。
19.根据权利要求18所述的方法,其特征在于,接收数据处理装置推荐的数据包括:
当交互装置处于当前无上下文的状态时,接收数据处理装置通过将开发者行为历史信息与预设推荐范围内的元数据标签进行匹配,并使用关系数据缩小搜索范围后得到的匹配成功的元数据标签所对应的数据。
20.根据权利要求18所述的方法,其特征在于,接收数据处理装置推荐的数据包括:
当交互装置处于搜索关键词的状态时,接收数据处理装置通过将交互装置搜索的关键词与预设推荐范围内的元数据标签进行匹配,并使用关系数据缩小搜索范围后得到的匹配成功的元数据标签所对应的数据。
21.根据权利要求18所述的方法,其特征在于,接收数据处理装置推荐的数据包括:
当交互装置处于浏览数据表的状态时,接收数据处理装置通过将交互装置浏览的数据表的标签与预设推荐范围内的元数据标签进行匹配后得到的匹配成功的元数据标签所对应的数据。
22.一种数据推荐的交互方法,所述方法应用于交互装置,其特征在于,所述方法包括:
交互装置确定当前所处的状态;
将确定的所述状态所对应的状态数据发送给数据处理装置,以便数据处理装置根据所述状态数据确定交互装置当前所处的状态;
接收数据处理装置发送的对应交互装置当前所处状态的推荐数据。
23.根据权利要求22所述的方法,其特征在于,接收数据处理装置发送的对应交互装置当前所处状态的推荐数据包括:
当交互装置处于当前无上下文的状态时,接收数据处理装置发送的对应无上下文的状态的推荐数据。
24.根据权利要求22所述的方法,其特征在于,接收数据处理装置发送的对应交互装置当前所处状态的推荐数据包括:
当交互装置处于搜索关键词的状态时,接收数据处理装置发送的对应搜索关键词的状态的推荐数据。
25.根据权利要求22所述的方法,其特征在于,接收数据处理装置发送的对应交互装置当前所处状态的推荐数据包括:
当交互装置处于浏览数据表的状态时,接收数据处理装置发送的对应浏览数据表的状态的推荐数据。
26.一种数据推荐的处理装置,其特征在于,所述装置包括:
提取单元,用于提取进行数据推荐的基础信息,所述基础信息用于在数据推荐过程中进行数据匹配;
逻辑确定单元,用于根据交互装置所处状态确定对应的预设推荐逻辑,所述预设推荐逻辑使用所述基础信息中的至少一种基础信息进行数据推荐;
处理单元,用于根据确定的预设推荐逻辑及其使用的基础信息向交互装置进行数据推荐。
27.根据权利要求26所述的装置,其特征在于,所述提取单元包括:
第一提取子单元,用于提取用于进行数据推荐的开发者行为历史信息;
第二提取子单元,用于提取预设推荐范围内的元数据标签;
第三提取子单元,用于提取用于缩小推荐范围的关系数据。
28.根据权利要求27所述的装置,其特征在于,所述第一提取子单元包括:
第一获取模块,用于获取开发者在预设时间内的搜索关键词的历史记录,从搜索关键词的历史记录中剔除无效关键词后得到有效搜索关键词;所述无效关键词包括:停用词和特殊字符;
第一统计模块,用于利用加权算法统计有效搜索关键词的权值;
第一计算模块,用于根据有效搜索关键词对应的权值以及搜索时间计算有效搜索关键词的时间加权值;
第一提取模块,用于根据计算的时间加权值,在有效搜索关键词中提取出第一预设个数的搜索关键词作为开发者在预设时间内的搜索关键词。
29.根据权利要求27所述的装置,其特征在于,所述第一提取子单元包括:
第二获取模块,用于获取开发者创建的表的元数据标签;
第二统计模块,用于统计获取的所述元数据标签在全量元数据标签中的权值;
第二提取模块,用于根据统计的元数据标签的权值,在获取的所述元数据标签中提取出第二预设个数的元数据标签作为开发者创建的表的元数据提取关键词。
30.根据权利要求27所述的装置,其特征在于,所述第一提取子单元包括:
第三获取模块,用于获取开发者依赖的表的元数据标签;
第三统计模块,用于统计获取的所述元数据标签在全量元数据标签中的权值;
第三提取模块,用于根据统计的元数据标签的权值,在获取的所述元数据标签中提取出第三预设个数的元数据标签作为开发者依赖的表的元数据提取关键词。
31.根据权利要求27所述的装置,其特征在于,所述第二提取子单元包括:
第四获取模块,用于在数据表的表信息中提取作为元数据标签的关键词;
第四统计模块,用于利用加权算法统计所述作为元数据标签的关键词的权值;
第四提取模块,用于根据所述作为元数据标签的关键词的权值,在每个数据表中提取第四预设个数的元数据标签的关键词作为预设推荐范围内的元数据标签。
32.根据权利要求27所述的装置,其特征在于,所述第三提取子单元用于根据开发者关系深度的情况,在开发者中选取具有预设层次关系的开发者形成用于缩小推荐范围的关系数据。
33.一种数据推荐的交互装置,其特征在于,所述装置包括:
获取单元,用于获取开发者使用的数据信息;
第一发送单元,用于将所述数据信息发送给数据处理装置,以便数据处理装置从所述数据信息中提取用于进行数据推荐的基础信息;
第一接收单元,用于接收数据处理装置推荐的数据向开发者进行推荐。
34.一种数据推荐的交互装置,其特征在于,所述装置包括:
状态确定单元,用于确定交互装置当前所处的状态;
第二发送单元,用于将确定的所述状态所对应的状态数据发送给数据处理装置,以便数据处理装置根据所述状态数据确定交互装置当前所处的状态;
第二接收单元,用于接收数据处理装置发送的对应交互装置当前所处状态的推荐数据。
35.根据权利要求34所述的装置,其特征在于,所述第二接收单元用于当交互装置处于当前无上下文的状态时,接收数据处理装置发送的对应无上下文的状态的推荐数据。
36.根据权利要求34所述的装置,其特征在于,所述第二接收单元用于当交互装置处于搜索关键词的状态时,接收数据处理装置发送的对应搜索关键词的状态的推荐数据。
37.根据权利要求34所述的装置,其特征在于,所述第二接收单元用于当交互装置处于浏览数据表的状态时,接收数据处理装置发送的对应浏览数据表的状态的推荐数据。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610371807.5A CN107451141B (zh) | 2016-05-30 | 2016-05-30 | 一种数据推荐的处理交互方法、装置及系统 |
TW106108189A TWI746527B (zh) | 2016-05-30 | 2017-03-13 | 資料推薦的處理互動方法、裝置及系統 |
PCT/CN2017/080857 WO2017206604A1 (zh) | 2016-05-30 | 2017-04-18 | 一种数据推荐的处理交互方法、装置及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610371807.5A CN107451141B (zh) | 2016-05-30 | 2016-05-30 | 一种数据推荐的处理交互方法、装置及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107451141A true CN107451141A (zh) | 2017-12-08 |
CN107451141B CN107451141B (zh) | 2021-01-29 |
Family
ID=60479661
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610371807.5A Active CN107451141B (zh) | 2016-05-30 | 2016-05-30 | 一种数据推荐的处理交互方法、装置及系统 |
Country Status (3)
Country | Link |
---|---|
CN (1) | CN107451141B (zh) |
TW (1) | TWI746527B (zh) |
WO (1) | WO2017206604A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109299473B (zh) * | 2018-11-15 | 2024-01-09 | 扬州大学 | 一种基于开发者画像的软件工程任务推荐方法 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101197929A (zh) * | 2006-12-08 | 2008-06-11 | 索尼株式会社 | 信息处理装置、显示控制处理方法、及显示控制处理程序 |
US20090299981A1 (en) * | 2008-06-03 | 2009-12-03 | Sony Corporation | Information processing device, information processing method, and program |
CN101615193A (zh) * | 2009-07-07 | 2009-12-30 | 北京大学 | 一种基于百科数据提取集成的查询系统 |
US20100291861A1 (en) * | 2009-05-15 | 2010-11-18 | Anzures Freddy A | Content Selection Based On Simulcast Data |
US20120192172A1 (en) * | 2008-09-04 | 2012-07-26 | International Business Machines Corporation | Updating a computer system |
CN102930041A (zh) * | 2012-11-12 | 2013-02-13 | 江苏外博资讯有限公司 | 一种基于用户行为信息的检索结果实时更新方法及其系统 |
CN103064863A (zh) * | 2011-10-24 | 2013-04-24 | 北京百度网讯科技有限公司 | 一种提供推荐信息的方法与设备 |
CN104166651A (zh) * | 2013-05-16 | 2014-11-26 | 阿里巴巴集团控股有限公司 | 基于对同类数据对象整合的数据搜索的方法和装置 |
CN104361085A (zh) * | 2014-11-14 | 2015-02-18 | 百度在线网络技术(北京)有限公司 | 信息推荐方法、装置、浏览器、服务器及系统 |
CN104424210A (zh) * | 2013-08-22 | 2015-03-18 | 腾讯科技(深圳)有限公司 | 一种信息推荐方法、系统及服务器 |
CN104899265A (zh) * | 2015-05-21 | 2015-09-09 | 广东小天才科技有限公司 | 信息推荐方法及系统 |
US20150271282A1 (en) * | 2008-09-25 | 2015-09-24 | Ebay Inc. | Methods and systems for activity-based recommendations |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002033628A2 (en) * | 2000-10-18 | 2002-04-25 | Johnson & Johnson Consumer Companies, Inc. | Intelligent performance-based product recommendation system |
US20120179717A1 (en) * | 2011-01-11 | 2012-07-12 | Sony Corporation | System and method for effectively providing entertainment recommendations to device users |
US20150066922A1 (en) * | 2013-08-30 | 2015-03-05 | Sony Network Entertainment International Llc | System and method for recommending multimedia content |
KR102199590B1 (ko) * | 2014-02-21 | 2021-01-07 | 삼성전자주식회사 | 관심정보에 따른 컨텐츠 추천장치 및 방법 |
TWM497823U (zh) * | 2014-11-28 | 2015-03-21 | Chen-Yong Lin | 具有廣告推播功能的社區管理系統 |
CN105511869A (zh) * | 2015-12-01 | 2016-04-20 | 福建工程学院 | 一种基于用户反馈的需求跟踪系统及方法 |
-
2016
- 2016-05-30 CN CN201610371807.5A patent/CN107451141B/zh active Active
-
2017
- 2017-03-13 TW TW106108189A patent/TWI746527B/zh not_active IP Right Cessation
- 2017-04-18 WO PCT/CN2017/080857 patent/WO2017206604A1/zh active Application Filing
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101197929A (zh) * | 2006-12-08 | 2008-06-11 | 索尼株式会社 | 信息处理装置、显示控制处理方法、及显示控制处理程序 |
US20090299981A1 (en) * | 2008-06-03 | 2009-12-03 | Sony Corporation | Information processing device, information processing method, and program |
US20120192172A1 (en) * | 2008-09-04 | 2012-07-26 | International Business Machines Corporation | Updating a computer system |
US20150271282A1 (en) * | 2008-09-25 | 2015-09-24 | Ebay Inc. | Methods and systems for activity-based recommendations |
US20100291861A1 (en) * | 2009-05-15 | 2010-11-18 | Anzures Freddy A | Content Selection Based On Simulcast Data |
CN101615193A (zh) * | 2009-07-07 | 2009-12-30 | 北京大学 | 一种基于百科数据提取集成的查询系统 |
CN103064863A (zh) * | 2011-10-24 | 2013-04-24 | 北京百度网讯科技有限公司 | 一种提供推荐信息的方法与设备 |
CN102930041A (zh) * | 2012-11-12 | 2013-02-13 | 江苏外博资讯有限公司 | 一种基于用户行为信息的检索结果实时更新方法及其系统 |
CN104166651A (zh) * | 2013-05-16 | 2014-11-26 | 阿里巴巴集团控股有限公司 | 基于对同类数据对象整合的数据搜索的方法和装置 |
CN104424210A (zh) * | 2013-08-22 | 2015-03-18 | 腾讯科技(深圳)有限公司 | 一种信息推荐方法、系统及服务器 |
CN104361085A (zh) * | 2014-11-14 | 2015-02-18 | 百度在线网络技术(北京)有限公司 | 信息推荐方法、装置、浏览器、服务器及系统 |
CN104899265A (zh) * | 2015-05-21 | 2015-09-09 | 广东小天才科技有限公司 | 信息推荐方法及系统 |
Non-Patent Citations (1)
Title |
---|
谭学清、何珊: ""音乐个性化推荐系统研究综述"", 《现代图书情报技术》 * |
Also Published As
Publication number | Publication date |
---|---|
WO2017206604A1 (zh) | 2017-12-07 |
CN107451141B (zh) | 2021-01-29 |
TWI746527B (zh) | 2021-11-21 |
TW201741911A (zh) | 2017-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230092123A1 (en) | Automated presentation of information using infographics | |
US10713291B2 (en) | Electronic document generation using data from disparate sources | |
Bilsel et al. | A fuzzy preference‐ranking model for a quality evaluation of hospital web sites | |
US8131748B2 (en) | Search query formulation | |
JP5647508B2 (ja) | ショートテキスト通信のトピックを識別するためのシステムおよび方法 | |
WO2015188699A1 (zh) | 推荐项目的方法和装置 | |
CN107609960A (zh) | 推荐理由生成方法及装置 | |
US20130297581A1 (en) | Systems and methods for customized filtering and analysis of social media content collected over social networks | |
US20130304818A1 (en) | Systems and methods for discovery of related terms for social media content collection over social networks | |
US20200294071A1 (en) | Determining user intents related to websites based on site search user behavior | |
US20130297694A1 (en) | Systems and methods for interactive presentation and analysis of social media content collection over social networks | |
US20130046584A1 (en) | Page reporting | |
WO2011080899A1 (ja) | 情報推薦方法 | |
US20120041769A1 (en) | Requests for proposals management systems and methods | |
ZA200608228B (en) | Product selection expert system | |
US20220284494A1 (en) | Configuring food-related information search and retrieval based on a predictive quality indicator | |
AU2009241626A1 (en) | Social network powered query refinement and recommendations | |
CN106062743A (zh) | 用于关键字建议的系统和方法 | |
CN112328857B (zh) | 一种产品知识聚合方法、装置、计算机设备及存储介质 | |
US20190272559A1 (en) | Detecting and resolving semantic misalignments between digital messages and external digital content | |
CN105786810A (zh) | 类目映射关系的建立方法与装置 | |
US20160132834A1 (en) | Personalized job search | |
CN107451141A (zh) | 一种数据推荐的处理交互方法、装置及系统 | |
CN107908649A (zh) | 一种文本分类的控制方法 | |
Belz et al. | Patentopia: A multi-stage patent extraction platform with disambiguation for certain semantic challenges |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |