CN101566987A

CN101566987A - 二次信息资源数据库系统及其资源处理方法

Info

Publication number: CN101566987A
Application number: CNA2008100939283A
Authority: CN
Inventors: 刘玉纯; 张冉; 严荟煌
Original assignee: BEIJING SRIHARVEST TECHNOLOGY DEVELOPMENT Co Ltd
Current assignee: BEIJING SRIHARVEST TECHNOLOGY DEVELOPMENT Co Ltd
Priority date: 2008-04-23
Filing date: 2008-04-23
Publication date: 2009-10-28

Abstract

一种二次信息资源数据库系统及其资源处理方法，它可根据数据库设计需求设置采集要素，编制检索命令；根据检索命令下载特定信息以及相关信息；统计各要素的数量值；通过统计要素的数量值计算出各种指标的数值；根据各统计要素的数值以及各指标的数值，生成分析报告。根据关联要素，将分析报告与特定信息和相关信息关联起来。最终，关联后的分析报告、特定信息和相关信息被存放在二次信息资源数据库中。该系统及方法按照事先设置的各类要素，生成二次信息资源数据库，这样对一次信息资源，及原始信息数据库的检索和分析结果，便可以重复利用，同时将不同类型的信息整合在一起，提高了信息的整体性、全面性，使用户使用信息时可以节约时间。

Description

二次信息资源数据库系统及其资源处理方法

技术领域

本发明涉及一种信息资源数据库及其资源处理方法，特别是一种经过加工的信息资源，以及存贮、检索这些信息的数据库及这些信息资源的处理方法。

背景技术

随着科学技术的发展，信息资源的地位越来越重要。当今的互联网已成为人们获取信息的最重要途径。利用Yahoo、Alltheweb、Google等功能强大、众所周知的搜索引擎，搜索信息易如囊中取物。因特网上信息技术所具有的广泛性、即时性和交互性是目前任何一种检索工具书、文献数据库所不能相比的。

然而由信息膨胀而产生的海量数据资源，使得信息用户无所适从，难以下手获得有用的信息。目前谁也说不清网上到底有多少有价值的数据库，有多少类型的数据库，有多少有价值的网址，甚至怎样才能利用这些资源。虽然计算机检索技术的发展，如百度、雅虎、google等门户网站上的信息搜索功能，以及各种数据库的检索功能，可以从海量数据中找出一些满足需求的信息，但是检索结果的单一性、孤立性，单个信息很难全面、准确地反映某个实体单位的真实情况，而且检索结果缺乏可重复利用性。再则普通检索技术，一般是针对原始数据的使用者开发的，而对于其他用户群体，如非专业人员、想全面了解某个事件的人群，特别是时间有限的使用者来说，使用起来极不方面。

发明内容

为了解决上述现有技术中的问题，本发明提供一种二次信息资源数据库系统，该数据库系统包括信息处理装置、二次信息资源数据库服务器、特定信息数据库及相关信息数据库，它们通过通信网络进行互相通信。

信息处理装置包括：要素设置模块、信息采集模块、信息分析模块和数据关联模块。

要素设置模块，用于设置采集要素，并按照采集要素匹配实体单位的名称集合或行业的工业分类名称集合，然后编制检索命令；该模块包括至少一个存贮单元，该存贮单元中存贮着多个实体单位或行业的名称及其注释，对应每个实体单位或行业都有一个注释，实体单位的注释中包括其母单位名称、子单位名称及关联单位名称的名称集合；行业的注释中包括该行业对应的工业分类名称集合。

信息采集模块，包括信息下载引擎，它根据检索命令从特定信息数据库中下载特定信息，以及从相关信息数据库中下载相关动态信息。

信息分析模块，包括数据统计器、多个指标计算器和分析报告生成器，数据统计器用于从特定信息中统计各要素的数值，每个计算器对应一个指标，该计算器按照该指标计算出各种指标数值，分析报告生成器，按照预先设定的模版，生成分析报告。

数据关联模块，将信息分析模块得出的分析报告与特定信息和相关信息，按照预先设置的关联要素关联起来。

本发明还提供一种二次信息资源处理方法，该方法包括如下步骤：根据数据库设计需求设置采集要素，并按照采集要素匹配实体单位的名称集合或行业的工业分类名称集合，然后编制检索命令；根据检索命令，信息采集模块分别从特定信息数据库中和相关信息数据库中，下载特定信息以及相关信息；按照事先设置的各类统计要素，数据统计器从采集得到的特定信息中，统计各要素的数量值；指标计算器按照指标计算公式，通过统计要素的数量值计算出各种指标的数值；信息分析模块的分析报告生成器，根据各统计要素的数值以及各指标的数值，生成分析报告；其生成的分析报告为各种指标数值及其图表和文字说明。根据关联要素，数据关联模块将分析报告与特定信息和相关信息关联起来，其关联要素为实体单位或行业的名称。最终，关联后的分析报告、特定信息和相关信息被存放在二次信息资源数据库中。

本发明按照事先设置的各类要素，生成二次信息资源数据库，这样对一次信息资源，及原始信息数据库的检索和分析结果，便可以重复利用，同时将不同类型的信息整合在一起，提高了信息的整体性、全面性，使用户使用信息时可以节约时间。

附图说明

图1为本发明的数据库系统的硬件结构图

图2为本发明的数据库系统的信息处理装置的功能模块图

图3为本发明的二次信息资源处理方法的工作流程图

具体实施方式

如图1所示，本发明的二次信息资源的数据库系统包括二次信息资源数据库服务器11、信息处理装置12、特定信息数据库13、相关信息数据14和通讯网络15。

服务器11包括至少一个存贮装置，它用于存贮加工后的各种二次信息，如包括一些统计、分析数据的分析报告，包括特定实体单位或行业的特定信息，以及包括特定实体单位或行业动态数据的相关信息等。

特定信息数据库为原始信息数据库，它可根据需求设置为标准、商标、经济、金融或知识产权等特定的、公开的原始数据库，它可以是本地数据库，也可以是互联网数据库。若是互联网上的数据库可以是免费的信息资源，也可以是以营利为目的收费数据库。

相关信息数据库可以是互联网上的免费信息资源。

信息处理装置12用于采集特定信息和相关信息，分析特定信息，形成分析报告，并将特定信息和相关信息与分析报告关联起来。它与服务器11相连，可向服务器11中存储特定信息、相关信息和分析报告等二次信息数据，并且它还与特定数据库13和相关数据库14相连，用于收集特定信息及相关信息。

通讯网络15用于连接二次信息资源数据库服务器11、信息处理装置12、特定信息数据库13、相关信息数据14，它可以为企业内部局域网，也可以为外部广域网。

如图2所示，是图1中信息处理装置12的功能模块图。装置12包括：要素设置模块120、采集模块121、分析模块122和关联模块123。

模块120用于设置采集要素和检索命令的编制。采集要素是指某些特定的实体单位、特定行业或特定地区的特定行业。模块120包括一个存贮着多个实体单位或行业的名称及其注释的存贮单元，其中每个实体单位或行业都对应有一个注释，实体单位的注释中标明其母单位名称、子单位名称及关联单位名称等名称集合；行业的注释中包括该行业对应的工业分类名称集合。本发明提供选择实体单位名称组合及行业划分，可根据需求划定最终所需的实体单位或行业信息的范围。检索命令是按照采集要素所匹配的实体单位名称集合，或行业的工业分类名称集合编制的。例如要采集一个特定实体单位的二次信息，该实体单位名称集合包括其母单位名称、子单位名称及关联单位名称，则检索命令是用表示并集的逻辑符号将三个单位名称联系起来的检索表达式。

模块121包括信息下载引擎，用于根据检索命令自动从特定数据库13和相关数据库14中，分别下载所选实体单位或行业的特定信息和相关信息。要采集的特定信息为所选实体单位或行业的特殊数据，如标准、商标、经济、金融、海关或知识产权等数据。要采集的相关信息包括：所选实体单位或行业即时的科技或经济信息、经营信息、市场信息等。

模块122包括数据统计器1220、多个指标计算器1221和分析报告生成器1222，它用于分析采集的特定信息的结果。统计器1220用于从特定信息中统计各要素的数值，所谓的统计要素是指所选实体单位或行业的一些可量化的特征，如发布的标准数量、获得的商标数量或海关的出口量等。为了衡量所选实体单位或行业的优劣，要设置多项指标，如发布的标准数量、获得的商标数量或海关的出口量分别占全行业的比重等；每个计算器1221对应一个指标，该计算器1221根据事先设置的各种指标和指标计算公式，通过所采集的特定信息的结果计算出各种指标的数值。报告生成器1222用于按照预先设定的模版，生成分析报告。分析报告包括各要素的统计数值、各种指标的数值及其生成的各类图表，以及参照各类数值范围生成相应的文字说明。

模块123中设置关联要素，用于将各种数据，如特定信息、相关信息和分析报告关联起来。它们之间相关联的纽带是实体单位或行业的名称。关联后的数据可以反复被检索，并重复利用。

如图3所示，为本发明的二次信息资源处理方法的较佳实施例的工作流程图。该方法包括如下步骤：

步骤S200，根据数据库的建库需求设置采集要素，如设置某些特定的实体单位、特定行业或特定地区的特定行业，作为采集要素进行建库。按照采集要素匹配实体单位的名称集合或行业的工业分类名称集合，然后编制检索命令。检索命令是按照采集要素所匹配的实体单位名称集合，或行业的工业分类名称集合编制的。例如要采集一个特定实体单位的二次信息，该实体单位名称集合包括其母单位名称、子单位名称及关联单位名称，则检索命令是用表示并集的逻辑符号将三个单位名称联系起来的检索表达式。

步骤S210，根据检索命令，分别从特定信息数据库13中和相关信息数据库14中，下载所选实体单位或行业的特定信息以及相关动态信息。

步骤S220，按照事先设置的各类统计要素，从采集得到的特定信息中，统计各要素的数量值；根据事先设置的各种指标启动其分别对应的指标计算器，计算器按照指标计算公式，通过统计要素的数量值计算出各种指标的数值；按照预先设定的模版，根据各统计要素的数值以及各指标的数值，生成分析报告，即生成包括各统计要素的数值、各指标的数值及其各类图表，并参照各类数值范围生成相应的文字说明的分析报告。预先设定的分析报告模版包括各统计要素数据表及其显示图、各指标数值表及其显示图和文字说明的标准语段。

步骤S230，根据关联要素，将含有各类图表及相应的文字说明的分析报告，与特定信息和相关信息关联起来，关联要素为实体单位或行业的名称。关联后的分析报告、特定信息和相关信息数据，成为一条记录下的三部分内容；特定信息和相关信息分别建立检索结果目录，便于浏览。

步骤S240，最终关联后的分析报告、特定信息和相关信息被存放在二次信息资源数据库中。二次信息资源数据库服务器可提供检索、查询服务，用户通过通讯网络查询该数据库中的信息。

Claims

1.一种二次信息资源数据库系统，该数据库系统包括信息处理装置、二次信息资源数据库服务器、特定信息数据库及相关信息数据库，它们通过通信网络进行互相通信，其特征在于信息处理装置包括：

要素设置模块，用于设置采集要素，并按照采集要素匹配实体单位的名称集合或行业的工业分类名称集合，然后编制检索命令；

信息采集模块，包括信息下载引擎，它根据检索命令从特定信息数据库中下载特定信息，以及从相关信息数据库中下载相关动态信息；

信息分析模块，包括数据统计器、多个指标计算器和分析报告生成器，数据统计器用于从特定信息中统计各要素的数值，每个计算器对应一个指标，该计算器按照该指标计算出各种指标数值，分析报告生成器，按照预先设定的模版，生成分析报告；

2.根据权利要求1所述的二次信息资源数据库系统，其特征在于其信息处理装置的要素设置模块包括至少一个存贮单元，该存贮单元中存贮着多个实体单位或行业的名称及其注释，对应每个实体单位或行业都有一个注释，实体单位的注释中包括其母单位名称、子单位名称及关联单位名称的名称集合；行业的注释中包括该行业对应的工业分类名称集合。

3.根据权利要求1所述的二次信息资源数据库系统，其特征在于其包括至少一个存贮装置，该存贮装置存贮加工后的各种二次信息。

4.根据权利要求1所述的二次信息资源数据库系统，其特征在于其特定信息数据库为原始信息数据库，可根据需求设置为标准、商标、经济、金融或知识产权等特定的、公开的原始数据库，可以是本地数据库，也可以是互联网数据库。

5.一种二次信息资源处理方法，其特征在于该方法包括如下步骤：

根据数据库设计需求设置采集要素，并按照采集要素匹配实体单位的名称集合或行业的工业分类名称集合，然后编制检索命令；

根据检索命令，信息采集模块分别从特定信息数据库中和相关信息数据库中，下载特定信息以及相关信息；

按照事先设置的各类统计要素，数据统计器从采集得到的特定信息中，统计各要素的数量值；指标计算器按照指标计算公式，通过统计要素的数量值计算出各种指标的数值；信息分析模块的分析报告生成器，根据各统计要素的数值以及各指标的数值，生成分析报告；

根据关联要素，数据关联模块将分析报告与特定信息和相关信息关联起来；

最终，关联后的分析报告、特定信息和相关信息被存放在二次信息资源数据库中。

6.根据权利要求5所述的二次信息资源处理方法，其特征在于其关联要素为实体单位或行业的名称。

7.根据权利要求5所述的二次信息资源处理方法，其特征在于其生成分析报告为各种指标数值及其图表和文字说明。