CN109614419B

CN109614419B - 一种面向命名数据网络的知识服务路由挖掘方法

Info

Publication number: CN109614419B
Application number: CN201811480992.7A
Authority: CN
Inventors: 廖祝华; 张健; 滕增德; 肖浩; 刘毅志
Original assignee: Hunan University of Science and Technology
Current assignee: Hunan University of Science and Technology
Priority date: 2018-12-05
Filing date: 2018-12-05
Publication date: 2022-04-29
Anticipated expiration: 2038-12-05
Also published as: CN109614419A

Abstract

本发明公开了一种面向命名数据网络的知识服务路由挖掘方法，本发明在边缘路由器中发现、挖掘互联网络范围可访问应用和知识库中开放的知识及其相关对象如学习者与专家的语义层次命名和属性信息，在核心路由器中进一步挖掘和评估知识及其相关对象的路由索引及其路由特征，以扩展知识路由的发现和匹配能力。本发明能够让用户基于命名数据网络以个性化、高效地发现和获取网络范围内开放的关联性知识及广度和深度的知识，并发现和汇聚社交平台中标记具有相关领域知识的专家和群体，完成相关知识服务功能和活动，最终在新兴互联网络架构上构建以互联网为边界的开放式知识发现和个性化知识服务平台。

Description

一种面向命名数据网络的知识服务路由挖掘方法

技术领域

本发明涉及一种基于命名数据网络(NDN)实现互联网范围的知识服务的语义路由信息挖掘方法，具体涉及一种面向命名数据网络的知识服务路由挖掘方法。

背景技术

网络与信息技术使人们的知识发现、社会交往、信息交流和学习讨论更加方便和快捷。然而，很多知识服务软件、数据库和平台相互孤立，知识服务相关的社交圈、通信群则散落在不同的平台和网站中，相互间缺乏开放与对外服务的支持。而支撑这些组件、系统或平台的互联网络对于知识内容的访问主要是基于IP地址或域名。因此，面向网络范围的内容的知识服务平台获取互联网中相关知识前，通常需要先获知第三方系统或平台的全局地址，然后通过全局地址登录到第三方系统或平台，最后根据本地地址获取知识及相关对象。可是，由于很多第三方系统、平台的封闭性，目前面向互联网络的搜索引擎，主要只对开放的Web知识进行搜索，而对网络中其它大规模应用、数据库和平台中的内容则缺乏对地址未知的互联网知识的有效搜索方法。因而，互联网络中大规模相关知识搜索的广度和深度仍存在很大局限。此外，在物联网、移动网络、无线传感网等新型动态网络环境下，尤其缺乏知识生产者和消费者之间的路由能力，以及异地知识的发现与关联能力，海量分布式知识及相关对象则缺乏有效的全局共享与智能复用能力。因此，当前互联网中的信息、知识服务组件的合作、互动和个性化主要局限于具有全局知识视图的分布式系统之间，或者限于单个系统中，而对于整个网络仍缺乏开放、合作、个性化和动态的知识服务。

目前网络中人们对分布的知识服务需求，除了需要获取主题或关键词相关的知识，通常还需要获取与特定知识相关联的知识，以及在语义方面扩展的或更深度的知识。此外，甚至还需要汇聚具有共同兴趣的人员以相互交流、讨论，并连接在线的专家、教师进行答疑、归纳、总结和问题设置。

发明内容

为了解决现有技术存在的上述技术问题，本发明提供一种面向命名数据网络的知识服务路由挖掘方法，本发明能够使用户基于命名数据网络以个性化、高效地发现和获取网络范围内开放的关联性知识及广度和深度的知识，并发现和连接社交平台中标记具有相关领域知识的专家和群体，以完成相关知识服务功能和活动。

为了解决上述技术问题，本发明采用的技术方案为：

一种面向命名数据网络的知识服务路由挖掘方法，包括以下步骤：

1)对整个NDN网络构建统一的知识基本分类目录，将其通告到所有路由器的转发信息库中；

2)路由器监听并判断是否收到数据包，如果没有收到数据包，则转步骤3)；否则转步骤7)；

3)判断路由器类型，如果是边缘路由器，则转步骤4)，如果是核心路由器，则转步骤6)；

4)发现本地网络中可访问的知识源，并获取所发现知识源中的各种分布式应用的数据API、数据库的访问接口或Web服务的描述文档；

5)基于获取的访问接口或API，采用现有挖掘工具或方法挖掘数据源中的数据/知识的分面、分类信息以及对象名、属性名和属性值范围，获取各种知识及相关对象的语义层次命名，为个性化的知识服务发现提供精细的路由信息，并将挖掘到的层次命名信息添加到或扩展FIB表项的前缀字段；

6)根据用户兴趣和相应返回结果挖掘和评估FIB中相关表项对应结果的质量和特征信息，以增强语义路由能力；在FIB中将挖掘到的特征值添加或累加到FIB相关层次前缀或表项中，从而在路由匹配过程中增强NDN的语义路由能力和质量，处理过程中如果监听到数据包到达或挖掘处理结束，则转步骤2)；

7)判断数据包类型，如果是用户兴趣包，则对用户兴趣包进行路由扩展匹配并转发；否则如果收到的数据包是响应结果，则对返回结果进行汇聚和原路返回处理；处理结束后，转步骤2)。

优选地，所述步骤1)的具体步骤为：在NDN的路由器中，针对所应用领域的分类标准进行初步分类、分层，即对整个互联网范围内预计要访问领域的应用、数据库中的知识及其相关对象进行分面、分域和初步的分层，对知识及相关对象构建初始的多类别和多领域的层次分类目录，其中不同面的知识及相关对象采用相同的层次分类标准。

优选地，所述步骤4)的具体步骤为：

4.1对未分面、分类的知识及相关对象进行分面、分类或聚类，即将知识及相关对象归属到所属领域以及全局的分类中，再进行本地层次分类/聚类或命名，可选的增加属性信息及相关属性值域信息；

4.2对只能获取非语义层次标识的知识及相关对象，则基于响应结果挖掘和提取其语义层次标识；将其语义层次标识匹配和添加到已构造的层次分类目录中，以便为知识及相关对象构造标准化的语义层次命名，对已存在层次标识的知识及相关对象则将挖掘到的语义层次标识作为别名，从而为用户请求进行更好的全局语义路由；另外，根据知识及相关对象的分类、属性，甚至其内容的语义，标注不同知识及相关对象或分类之间的语义关联关系；

4.3对知识及相关对象进行语义层次命名，将其加入FIB表中，向相邻路由器通告层次命名信息。

优选地，所述步骤6)的具体步骤为：

6.1根据用户兴趣和返回的结果对以下特征进行路由挖掘：

6.1.1)匹配结果质量估计；结果返回过程中，对于FIB中的对应表项如果存在多个返回的匹配结果，则根据表项中的语义类别P和信息量A计算匹配度，估计兴趣命名对应的返回结果的质量；其中匹配度计算公式为：

公式中P_FIB为FIB中匹配的前缀长度，P_I为与P_FIB匹配的用户兴趣中层次命名的长度，A_m为被评价的某个匹配项的属性和特征信息与用户兴趣中的属性和特征要求的匹配度，α,β为权重系数；

6.1.2)结果信息量统计，路由节点根据CS中的缓存内容挖掘某个FIB表项的语义类别，并对不同语义类别统计返回结果的数据量级别，对于单个数据，则统计数据的分块数，不同语义类别的数据量级别将作为对应FIB表项的特征项；

6.1.3)频繁项集和访问频率统计，对FIB中各表项对应返回数据的访问频率、返回数据之间的频繁项集进行统计，统计结果用以评估FIB中层次命名表项的流行度，并挖掘返回结果中跨源或多用户之间的频繁项集，其中，判断数据集来自单个或多个用户的方法通过NDN数据包的签名字段中的私钥字符串的相异性来区分；

6.1.4)语义范围和属性值域估计，根据用户兴趣中的层次名字、属性约束和对应的返回内容，挖掘分类层次命名所包含内容的更细粒度分类、属性集和属性值域，或其它语义分类；

6.2将挖掘到的特征信息添加或特征值累加到对应的FIB表项中，将对应FIB表项及其关键特征项随FIB表项一起向相邻路由器进行通告。

优选地，所述步骤7)的具体步骤为：

7.1在用户端具体用户发出的兴趣类型包括：

7.1.1)知识获取：包括关联知识、深度知识和广度知识的发现或获取，具体兴趣格式为“知识层次命名+属性约束+RK或‘DK’、‘BK’”；其中RK表示获取关联知识，DK表示获取深度知识，BK表示获取广度知识；

7.1.2)问题收集：完成问题发现和获取，具体兴趣格式为“问题层次命名+属性约束+‘CQ’”，通过层次命名匹配及属性约束条件匹配来聚集多个问题或获取单个问题；

7.1.3)解答提交：完成向单一用户传送或向群体组播问题的解答信息，具体兴趣格式为“解答者层次命名+属性约束+‘AQ’”，具体是通过层次命名匹配及属性约束条件匹配到特定专家或其他知识服务提供者，向其提交问题的解答内容；

7.1.4)评改反馈：向单一学习者传送或群体组播要回送的评阅信息或反馈修改信息，兴趣格式为“学习者层次命名+属性约束+‘EC’”，精确匹配特定问题发送者，并向其回送关于问题解答或知识点理解的评改内容；

7.2当用户兴趣到达路由器进行转发匹配时，兴趣或者与FIB表项的Prefix字段值匹配，或者与其别名字段值匹配；其匹配算法在改进最长前缀匹配算法的基础上充分挖掘和扩充层次匹配算法，完成较为复杂的知识及相关对象的路由匹配，以获取需要的知识及相关对象：

7.2.1)关联匹配方法：目的是发现关联知识及相关对象，其过程是采用前缀包含匹配和语义约束条件匹配的方法，查找到参照知识的路由信息，在相关路由CS或数据源中再获取与参照知识存在某种语义关联关系的知识、知识提供者，或获取相关知识或其它知识及相关对象的列表，再根据具体表项的完全名字使用精确匹配方法获取具体实例；

7.2.2)广度匹配方法：目的是发现扩展知识及相关对象，具体过程是对兴趣中给定的层次分类在FIB中路由匹配其较下层的平行层，在相关路由CS或数据源中进行前缀层次匹配和语义约束条件匹配，以优先获取与给定分类较下层的平行层的热门、信息量大的知识及相关对象的列表，再通过具体表项的完全名字获取具体实例；

7.2.3)深度匹配方法：目的是发现兴趣中给定分类中更细分或下层的类别中更具体的知识及相关对象，具体过程是对兴趣中给定的层次分类在FIB中路由匹配其最下层的子层，在相关路由CS或数据源中进行包含层次匹配和语义约束条件匹配，以优先获取更深层次的热门、信息量大的知识及相关对象列表，再根据具体表项的完全名字使用精确匹配方法获取具体实例；

7.2.4)精确匹配方法：目的是获取精确的知识及相关对象，即为发现或返回与兴趣中具体层次命名精确匹配的对象，具体过程是路由匹配中要求兴趣的层次命名等于或包含在FIB的前缀表项中，而在相关路由CS或数据源中则基于属性值或特征值约束条件精确匹配；响应数据包返回是单播通信，即在数据源节点则精确地匹配对象命名和属性条件，并只返回一个对象，而返回路由中则也精确地匹配PIT表中的兴趣名字；

7.3根据在NDN中通信处理方式的不同，用户的请求主要有三类，分别是：及时返回的请求、可延期返回的请求、以及无返回的及时推送；它们分别通过三种通信模式实现，即Pull通信模式、订阅模式、Push通信模式，从而完成用户对各种知识及相关对象的获取以及用户对主要知识服务活动的发送和响应；

7.3.1)Pull模式：先发送请求，然后获取短时间内与请求匹配的信息，如知识、群组或收集问题；然后对响应结果进行聚合，即返回名字相同的数据包或前n个数据包，以返回知识及相关对象的列表或者返回部分相异的知识及相关对象的列表；

7.3.2)订阅模式：订阅兴趣包在路由器中的生存时间可以很长，具体路由将根据最长前缀匹配下一跳，或其它信息预测路由，订阅请求可发送或不发送到知识服务源或存在匹配结果的路由节点，而可暂存在某些路由节点中，只要在生存时间段内出现匹配的下一跳，则可继续路由转发；并在生存时间段内，返回所有或前n个结果；

7.3.2)Push模式：直接向特定知识及相关对象所处节点或知识服务提供者推送信息，而不是发送请求，目的节点选择回送数据已到达的通知；

7.3.4用户请求通过基于名字的路由算法转发到下一路由节点或数据源后，接收端将根据用户请求的层次命名、属性约束条件、特征要求进行匹配和回送相关结果，或根据匹配情况、特征信息选择并回送最优的相关结果。

本发明的技术效果在于：本发明在NDN网络边缘挖掘语义层次标识，把非语义层次标识转换为语义层次标识，即在各应用端通过中间件挖掘、分析并通告层次分类信息，实现基于用户兴趣的个性化知识(包括数据、信息，但内涵更广、更丰富)服务，如语义发现和关联知识、问题、答案及专家群体。在路由器中对层次路由索引的访问频率、信息量级别和频繁项集方面进行挖掘，并在路由中对相关的、深度的或广度的知识进行路由挖掘和智能匹配，以较高的精确度和召回率发现与关联用户需要的知识、问题和答案，或在线联系专家或相关社交群体以完成问题解答和评改。基于NDN对知识及相关对象的路由信息进行挖掘，设计个性化知识服务及语义聚合技术与平台，将面向整个网络更好地构建基于统一分类标准的、分布式的虚拟知识树，甚至知识图谱，进而能根据用户需求个性化地、动态地挖掘和发现大量相关的、地址未知的知识及相关对象，从而提供开放、自治、互动、合作和创新的知识服务。

附图说明

图1为本发明的结构示意图。

图2为本发明的流程图。

图3为本发明中的知识及相关对象描述模型。

图4为本发明中的NDN边缘知识命名挖掘流程。

图5为本发明中的NDN知识服务路由挖掘流程。

图6为本发明中的用户知识服务兴趣类型和定义。

图7为本发明中的知识服务语义层次和语义匹配。

图8为本发明中的用户兴趣的路由处理模式。

具体实施方式

下面结合附图和具体实施例对本发明作进一步的详细说明。

如图1所示，本发明面向NDN的知识服务路由挖掘系统结构主要包括用户交互模块、挖掘模块和路由模块，其中挖掘模块分别包括：NDN核心路由器上的路由挖掘和NDN边缘路由器上的层次命名数据挖掘(如基于软件API的挖掘、数据库访问接口挖掘和Web数据挖掘)。NDN路由器上的路由模块主要包括NDN路由组件和扩展匹配组件。而NDN的用户交互模块主要包括知识兴趣生成、解答组播分发、评改反馈回送和结果接收处理模块。本实施例对网络范围内不同应用中知识及相关对象的发现和获取需求采用统一的知识请求格式和响应形式。

如图2所示，本发明基于命名数据网络的知识服务路由挖掘方法的实施步骤包括：

1)对整个NDN网络初步构建统一的知识基本分类目录，然后将其通告到所有路由器的FIB中。

2)路由器监听并判断是否收到数据包，如果没有收到数据包，则转步骤3)，否则转步骤7)。

3)判断路由器类型，如果是边缘路由器，则转步骤4)，如果是核心路由器，则转步骤6)。

4)发现本地网络中可访问的知识源，并获取所发现知识源中的各种分布式应用的数据API、数据库的访问接口(如ODBC、JDBC)或Web服务的描述文档(如WSDL格式文件)。

5)基于获取的访问接口或API，采用现有挖掘工具或方法挖掘数据源中的数据/知识的分面、分类信息以及对象名、属性名和属性值范围，最终获取各种知识及相关对象的语义层次命名，以便为个性化的知识服务发现提供精细的路由信息。然后将挖掘到的层次命名信息添加到或扩展FIB表项的前缀字段。

6)根据用户兴趣和相应返回结果挖掘和评估FIB中相关表项对应结果的质量和特征信息，以增强语义路由能力。然后在FIB中将挖掘到的特征值添加或累加到FIB相关层次前缀或表项中，从而在路由匹配过程中增强NDN的语义路由能力和质量。处理过程中如果监听到数据包到达或挖掘处理结束，则转步骤2)。

7)判断数据包类型，如果是用户兴趣包，则对用户兴趣包进行路由扩展匹配并转发；否则如果收到的数据包是响应结果，则对返回结果进行汇聚和原路返回处理。处理结束后，转步骤2)。

本实施例中，步骤1)中为了便于用户基于层次命名访问边缘路由节点中各种知识及相关对象，本实施例将在NDN的路由器中，针对所应用领域的标准分类系统进行初步分类、分层，即对整个互联网范围内预计要访问领域的应用、数据库中的知识及其相关对象进行分面(即知识及相关对象的类型划分，如分为知识点、问题、解答以及专家、学习者或群体)、分域(即知识及相关对象的领域划分，如分为数学、物理和计算机)、分层(即知识及相关对象的领域的再次多层划分)，以对知识及相关对象构建初始的多类别和多领域的层次分类目录，其中不同面的知识及相关对象可以采用相同的层次分类标准。各知识及相关对象则为所匹配的面、域、分层中的叶子节点。而各子节点则包含有对象名、属性名和属性值范围信息。另外，根据知识及相关对象的分类、属性或其内容的语义，标注不同知识及相关对象或分类之间的语义关联关系。最终，对所有的知识及相关对象构建一个统一的层次描述模型，具体结构如图3所示。

本实施例中，步骤5)中面对互联网络中大量的知识密集型应用、数据库和平台，基于NDN的边缘挖掘知识及相关对象的层次命名信息的流程如图4所示。具体挖掘步骤为：1)在边缘路由节点中，对可访问的各种分布式应用的数据API、数据库的访问接口(如ODBC、JDBC)或Web服务的描述文档(如WSDL格式文档)，利用现有挖掘工具和方法挖掘数据/知识的分面、分类信息以及对象名、属性名和属性值范围，最终获取各种知识及相关对象的语义层次标识。而对只能获取非语义层次标识的对象，则基于响应结果或现有内容挖掘方法提取其语义层次标识。然后，将其语义层次标识匹配和添加到已构造的层次分类目录中，以便为知识及相关对象构造标准化的语义层次命名，而对已存在层次标识的知识及相关对象则将挖掘到的语义层次标识作为别名，从而为用户请求进行更好的全局语义路由。另外，根据知识及相关对象的分类、属性，甚至其内容的语义，标注不同知识及相关对象或分类之间的语义关联关系。2)在沿途每个核心路由器中，根据用户兴趣及ContentStore(CS)缓存的返回答案挖掘和评估FIB中相关表项对应结果的质量、特征信息，以增强语义路由能力。然后在FIB中将前述特征信息增加到相关层次命名或前缀表项中，从而在路由匹配过程中增强NDN的语义路由能力和质量。

本实施例中，步骤6)中主要根据用户兴趣和返回的结果对以下特征进行路由挖掘。具体NDN路由挖掘流程如图5所示，主要挖掘的特征包括：

1)匹配结果质量估计。结果返回过程中，对于FIB中的对应表项如果存在多个返回的匹配结果(包括别名匹配或其它非语义命名)，则根据表项中的语义类别P和信息量A计算匹配度，从而估计兴趣命名对应的返回结果的质量。其中匹配度计算公式为：

这里P_FIB为FIB中匹配的前缀长度，P_I为与P_FIB匹配的用户兴趣中层次命名的长度，A_m为被评价的某个匹配项的属性和特征信息与用户兴趣中的属性和特征要求的匹配度，α,β为权重系数。

2)结果信息量统计。路由节点根据CS中的缓存内容挖掘某个FIB表项的语义类别，并对不同语义类别统计返回结果的数据量级别(如非常多、比较多、一般、非常少)，对于单个数据，则统计数据的分块数。然后，不同语义类别的数据量级别将作为对应FIB表项的特征项。

3)频繁项集和访问频率统计。对FIB中各表项对应返回数据的访问频率、返回数据之间的频繁项集(数据为来自单个或多个用户、同源或跨源)进行统计，统计结果用以评估FIB中层次命名表项的流行度，并挖掘返回结果中跨源或多用户之间的频繁项集。其中，判断数据集来自单个或多个用户的方法可以是通过NDN数据包的签名字段中的私钥字符串的相异性来区分。

4)语义范围和属性值域估计。根据用户兴趣中的层次名字、属性约束和对应的返回内容，挖掘分类层次命名所包含内容的更细粒度分类、属性集和属性值域，或其它语义分类，从而能更好地对用户兴趣进行精准转发。

然后，将挖掘到的特征信息添加或特征值累加到对应的FIB表项中。接着，将对应FIB表项及其关键特征项随FIB表项一起向相邻路由器进行通告。

本实施例中，步骤7)中用户请求和返回结果中的名字通过知识及相关对象元模型描述，即能为其进行全局语义路由。另外，系统中用户获取知识及相关对象的请求(Quest)命名形式则统一为：Quest＝“面/域/层/名/属性+特征”，其中：

层＝第1层类名/第2层类名/......；

属性＝[属性值对1，属性值对2，......]；

特征＝[特征名1＝约束1，特征名2＝约束2，......]。

而NDN兴趣＝(Quest，Selector，Signature，Nonce)，其中Selector指定路由偏好、范围或者内容生产者过滤条件，Signature是对兴趣的签名信息，Nonce为随机数，主要作用是防止兴趣组播过程中的循环。

因此，通过该NDN兴趣中请求的层次化名字提供路由匹配条件，而加上属性约束和特征要求能便于在路由缓存或数据源中发现个性化的知识及相关对象。

在为NDN挖掘到语义路由信息之后，本实施例将使用户充分利用NDN的语义路由发现个性化的知识。图6是在用户端用户发出的具体兴趣类型及格式，主要包括：

1)知识获取：包括关联知识、深度知识和广度知识(或其相关对象)的发现或获取，具体兴趣格式为“知识层次命名+属性约束+RK(或‘DK’、‘BK’)”。其中RK表示获取关联知识，DK表示获取深度知识，BK表示获取广度知识，它们分别采用对应的匹配方法，具体见步骤7)；

2)问题收集：完成问题发现(如获取问题摘要、列表)和获取(如问题详细内容获取)，具体兴趣格式为“问题层次命名+属性约束+‘CQ’”，主要通过层次命名匹配及属性约束条件匹配来聚集多个问题或获取单个问题；

3)解答提交：完成向单一用户传送或向群体组播(特定前缀匹配)问题的解答信息，具体兴趣格式为“解答者层次命名+属性约束+‘AQ’”，具体是通过层次命名匹配及属性约束条件匹配到特定专家或其他知识服务提供者，然后向其提交问题的解答内容；

4)评改反馈：主要向单一学习者传送或群体组播要回送的评阅信息或反馈修改信息，具体兴趣格式为“学习者层次命名+属性约束+‘EC’”，具体是精确匹配特定问题发送者，并向其回送关于问题解答或知识点理解的评改内容。

另外，在本系统中还能实现知识及相关对象的发布/订阅，以及知识相关联的各种请求的NDN路由和转发处理。

本实施例中，步骤7)中对兴趣的路由扩展匹配时，兴趣与FIB表项的Prefix(前缀)字段值匹配，或与别名字段值匹配。其匹配算法在改进最长前缀匹配(LPM)算法的基础上充分挖掘和扩充层次匹配算法，完成较为复杂的知识及相关对象的路由匹配，具体匹配类型扩展如图7所示，以获取需要的知识及相关对象：

1)关联匹配方法。目的是发现关联知识及相关对象，具体过程是先采用前缀包含匹配和语义约束条件匹配的方法，查找到参照知识的路由信息，然后在相关路由CS或数据源中再获取与参照知识存在某种语义关联关系(如获取频繁项集的关联规则)的知识、知识提供者(包括社交群组、专家和智能软件)，或获取相关(与给定名字的知识存在某种语义关联)知识或其它知识及相关对象的列表，然后根据具体表项的完全名字使用精确匹配方法获取具体实例。

2)广度匹配方法。目的是发现扩展知识及相关对象，具体过程是先对兴趣中给定的层次分类在FIB中路由匹配其较下层的平行层，然后在相关路由CS或数据源中进行前缀层次匹配和语义约束条件匹配，以优先获取与给定分类较下层的平行层的热门、信息量大的知识及相关对象的列表，然后通过具体表项的完全名字获取具体实例。

3)深度匹配方法。目的是发现兴趣中给定分类中更为细分或下层的类别中更具体的知识及相关对象，具体过程是先对兴趣中给定的层次分类在FIB中路由匹配其最下层的子层，然后在相关路由CS或数据源中进行包含层次匹配和语义约束条件匹配，以优先获取更深层次的热门、信息量大的知识及相关对象列表，然后再根据具体表项的完全名字使用精确匹配方法获取具体实例。

进行上述匹配时，FIB可只保存前缀，但为了提高兴趣组播的有效性，前缀尽可能详细。

4)精确匹配方法。目的是获取精确的知识及相关对象，即为发现或返回与兴趣中具体层次命名精确匹配的对象，具体过程是路由匹配中要求兴趣的层次命名等于或包含在FIB的前缀表项中，而在相关路由CS或数据源中则基于属性值或特征值约束条件精确匹配。响应数据包返回是单播通信，即在数据源节点则精确地匹配对象命名和属性条件，并只返回一个对象，而返回路由中则也精确地匹配PIT表中的兴趣名字。

对于复杂的关联查询或匹配，先采用上述匹配方法中的一种，定位到参考对象所在缓存或源节点，然后查找与CS缓存或数据源中匹配的参考对象存在给定关联关系的其它知识及相关对象。另外，当选择下一跳时将根据FIB中相关表项的特征信息，为兴趣选择高质量的下一跳。

根据在NDN中的通信处理方式的不同，用户的请求主要有三类，分别是：及时返回的请求、可延期返回的请求、以及无返回的及时推送。它们分别通过三种通信模式实现：即Pull(拉)通信模式、订阅模式、Push(推)通信模式，具体处理方式见图8所示，从而通过这些通信模式完成用户对各种知识及相关对象的获取和用户对主要知识服务活动的发起和响应。

1)Pull(拉)模式：先发送请求，然后获取短时间内(如2分钟内)与请求匹配的信息，如知识、群组，或收集问题；然后对响应结果进行聚合，即返回名字相同的数据包或前n个数据包，以返回知识及相关对象列表或者返回部分相异的知识及相关对象列表。

2)订阅模式：订阅兴趣包在路由器中的生存时间可以很长(如1小时或1天内)，具体路由将根据最长前缀匹配下一跳，或其它信息预测路由，订阅请求可发送或不发送到知识服务源或存在匹配结果的路由节点，而可暂存在某些路由节点中，只要在生存时间段内出现匹配的下一跳，则可继续路由转发。并在生存时间段内返回所有或前n个结果。该模式主要用于获取在请求发送之后新生成的知识或新出现的单个专家或群体。

3)Push(推)模式：不发送请求，而是直接向特定知识及相关对象所处节点或知识服务提供者推送信息，如向特定群组发送对知识的理解和问题的解答，或回送问题，或将问题解答的评改信息分发给特定用户或群组(前提要求路由节点的PIT表长期保存了问题解答数据包转发到推送者的路径信息)，目的节点可选择回送数据已到达的通知。

上述模式的用户请求通过基于名字的路由算法转发到下一路由节点或数据源后，接收端将根据用户请求的层次命名、属性约束条件、特征要求(可选项)进行匹配和回送相关结果，或根据匹配情况、特征信息选择并回送最优的相关结果。

Claims

1.一种面向命名数据网络的知识服务路由挖掘方法，其特征在于步骤包括：

1)对整个命名数据网络构建统一的知识基本分类目录，将其通告到所有路由器的转发信息库中；

6)根据用户兴趣和相应返回结果挖掘与评估FIB中相关表项对应结果的质量和特征信息，以增强语义路由能力；在FIB中将挖掘到的特征值添加或累加到FIB相关层次前缀或表项中，从而在路由匹配过程中增强命名数据网络的语义路由能力和质量，处理过程中如果监听到数据包到达或挖掘处理结束，则转步骤2)；

2.根据权利要求1所述的面向命名数据网络的知识服务路由挖掘方法，其特征在于，所述步骤1)的具体步骤为：在命名数据网络的路由器中，针对所应用领域的分类标准进行初步分类、分层，即对整个互联网范围内预计要访问领域的应用、数据库中的知识及其相关对象进行分面、分域和初步的分层，对知识及相关对象构建初始的多类别和多领域的层次分类目录，其中不同面的知识及相关对象采用相同的层次分类标准。

3.根据权利要求1所述的面向命名数据网络的知识服务路由挖掘方法，其特征在于，所述步骤4)的具体步骤为：

4.1对未分面、分类的知识及相关对象进行分面、分类和聚类，即将知识及相关对象归属到所属领域以及全局的分类中，再进行本地层次分类/聚类与命名，可选的增加属性信息及相关属性值域信息；

4.根据权利要求1所述的面向命名数据网络的知识服务路由挖掘方法，其特征在于，所述步骤6)的具体步骤为：

6.1根据用户兴趣和返回的结果对以下特征进行路由挖掘：

公式中P_FIB为FIB中匹配的前缀长度，P_I为与P_FIB匹配的用户兴趣中层次命名的长度，A_m为被评价的某个匹配项的属性和特征信息与用户兴趣中的属性和特征要求的匹配度，α，β为权重系数；

6.1.2)结果信息量统计，路由节点根据内容缓存库CS(ContentStore)中的缓存内容挖掘某个FIB表项的语义类别，并对不同语义类别统计返回结果的数据量级别，对于单个数据，则统计数据的分块数，不同语义类别的数据量级别将作为对应FIB表项的特征项；

6.1.3)频繁项集和访问频率统计，对FIB中各表项对应返回数据的访问频率、返回数据之间的频繁项集进行统计，统计结果用以评估FIB中层次命名表项的流行度，并挖掘返回结果中跨源或多用户之间的频繁项集，其中，判断数据集来自单个或多个用户的方法通过命名数据网络数据包的签名字段中的私钥字符串的相异性来区分；

6.1.4)语义范围和属性值域估计，根据用户兴趣中的层次名字、属性约束和对应的返回内容，挖掘分类层次命名所包含内容的更细粒度分类、属性集和属性值域；

5.根据权利要求1所述的面向命名数据网络的知识服务路由挖掘方法，其特征在于，所述步骤7)的具体步骤为：

7.1在用户端具体用户发出的兴趣类型包括：

7.1.1)知识获取：包括关联知识、深度知识和广度知识的发现与获取，具体兴趣格式为“知识层次命名+属性约束+RK或‘DK’、‘BK’”；其中RK表示获取关联知识，DK表示获取深度知识，BK表示获取广度知识；

7.1.2)问题收集：完成问题发现和获取，具体兴趣格式为“问题层次命名+属性约束+‘CQ’”，通过层次命名匹配及属性约束条件匹配来聚集多个问题或获取单个问题；其中CQ表示收集问题；

7.1.3)解答提交：完成向单一用户传送或向群体组播问题的解答信息，具体兴趣格式为“解答者层次命名+属性约束+‘AQ’”，具体是通过层次命名匹配及属性约束条件匹配到特定专家或其他知识服务提供者，向其提交问题的解答内容；其中AQ表示问题解答；

7.1.4)评改反馈：向单一学习者传送或群体组播要回送的评阅信息或反馈修改信息，兴趣格式为“学习者层次命名+属性约束+‘EC’”，精确匹配特定问题发送者，并向其回送关于问题解答或知识点理解的评改内容；其中EC表示评阅修改反馈；

7.2.1)关联匹配方法：目的是发现关联知识及相关对象，其过程是采用前缀包含匹配和语义约束条件匹配的方法，查找到参照知识的路由信息，在相关路由CS(内容缓存库)或数据源中再获取与参照知识存在某种语义关联关系的知识、知识提供者，或获取相关知识及相关对象的列表，再根据具体表项的完全名字使用精确匹配方法获取具体实例；

7.2.2)广度匹配方法：目的是发现扩展知识及相关对象，具体过程是对兴趣中给定的层次分类在FIB中路由匹配其较下层的平行层，在相关路由CS(内容缓存库)或数据源中进行前缀层次匹配和语义约束条件匹配，以优先获取与给定分类中较下层的平行层的热门、信息量大的知识及相关对象的列表，再通过具体表项的完全名字获取具体实例；

7.2.3)深度匹配方法：目的是发现兴趣中给定分类中更加细分或下层的类别中更具体的知识及相关对象，具体过程是对兴趣中给定的层次分类在FIB中路由匹配其最下层的子层，在相关路由CS(内容缓存库)或数据源中进行包含层次匹配和语义约束条件匹配，以优先获取更深层次的热门、信息量大的知识及相关对象列表，再根据具体表项的完全名字使用精确匹配方法获取具体实例；

7.2.4)精确匹配方法：目的是获取精确的知识及相关对象，即为发现或返回与兴趣中具体层次命名精确匹配的对象，具体过程是路由匹配中要求兴趣的层次命名等于或包含在FIB的前缀表项中，而在相关路由CS(内容缓存库)或数据源中则基于属性值或特征值约束条件精确匹配；响应数据包返回是单播通信，即在数据源节点则精确地匹配对象命名和属性条件，并只返回一个对象，而返回路由中则也精确地匹配PIT表中的兴趣名字；

7.3根据在命名数据网络中通信处理方式的不同，用户的请求主要有三类，分别是：及时返回的请求、可延期返回的请求、以及无返回的及时推送；它们分别通过三种通信模式实现，即Pull通信模式、订阅模式、Push通信模式，从而完成用户对各种知识及相关对象的获取以及用户对主要知识服务活动的发送和响应；

7.3.1)Pull模式：先发送请求，然后获取短时间内与请求匹配的信息，如知识、群组和收集的问题；然后对响应结果进行聚合，即返回名字相同的数据包或前n个数据包，以返回知识及相关对象的列表或者返回部分相异的知识及相关对象的列表；

7.3.2)订阅模式：订阅兴趣包在路由器中的生存时间相对很长，具体路由将根据最长前缀匹配下一跳，或根据挖掘信息预测路由，订阅请求能够不发送到知识服务源或存在匹配结果的路由节点，而暂存在没有匹配结果的路由节点中，只要在生存时间段内出现匹配的下一跳，则继续路由转发；并在生存时间段内，返回所有或前n个结果；