CN111930794A - 统计指标编码规范化管理系统及方法 - Google Patents

统计指标编码规范化管理系统及方法 Download PDF

Info

Publication number
CN111930794A
CN111930794A CN202010613268.8A CN202010613268A CN111930794A CN 111930794 A CN111930794 A CN 111930794A CN 202010613268 A CN202010613268 A CN 202010613268A CN 111930794 A CN111930794 A CN 111930794A
Authority
CN
China
Prior art keywords
index
statistical
coded data
user
code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010613268.8A
Other languages
English (en)
Inventor
李红梅
马林
姜昊
孙乐
权微
莫敏君
寇慧杰
刘单
刘洪文
包頔
王蓉蓉
李胤
张玥
曲婧婧
刘瑞雪
任会
薛荣坤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Economic Network Data Co ltd
Original Assignee
China Economic Network Data Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Economic Network Data Co ltd filed Critical China Economic Network Data Co ltd
Priority to CN202010613268.8A priority Critical patent/CN111930794A/zh
Publication of CN111930794A publication Critical patent/CN111930794A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1004Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's to protect a block of data words, e.g. CRC or checksum
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90344Query processing by using string matching techniques

Abstract

本发明的统计指标编码规范化管理系统,包括一个服务器和多个与服务器连接的客户端,其中,服务器具有指标数据库,每个客户端包括:数据获取模块,用于获取用户输入的多组统计指标编码数据;完备性校验模块、重复性校验模块和合规性校验模块,分别用于对用户输入的多组统计指标编码数据进行完备性校验、重复性校验、合规性校验;存储模块,用于将多组统计指标编码数据发送至服务器并存入指标数据库;检索模块,用于根据用户输入的检索指令获取目标统计指标编码数据;以及关联模块,用于获取主词编码和所有分组编码的分组类别码,在所述指标数据库内的统计指标编码数据中筛选出具有相同主词编码且具有相同分组类别码的统计指标编码数据。

Description

统计指标编码规范化管理系统及方法
技术领域
本发明涉及数据管理领域,特别是一种统计指标编码规范化管理方法及系统。
背景技术
目前,统计数据在使用中,存在信息孤岛现象,在将国民经济各部门的统计数据联合使用的过程中,缺少一套能将不同部门统计数据联通的规范和方法,经济研究人员在不同部门的异构统计数据库中查找统计数据时,还需要和数据库的技术管理人员了解数据库的逻辑结构、存储内容,并且随时面临不同部门的数据库结构变化导致的重复工作,耗时耗力,很不方便。由于不同的数据库有不同的管理规范、方法、术语、描述,不同统计数据库中是否存在相互关联的统计指标也需要经济研究人员自行挖掘。
发明内容
本发明提供了一种统计指标编码规范化管理系统及方法,能够对国民经济各部门的统计数据的统计指标通过编码进行关联和统一管理,从而便于对大量的统计指标进行检索和使用。
本发明的统计指标编码规范化管理系统,包括一个服务器和多个与所述服务器连接的客户端,其中,所述服务器具有指标数据库,每个所述客户端包括:
数据获取模块,用于获取用户输入的多组统计指标编码数据,每组统计指标编码数据具有多个项,该些项的全部或部分分别构成指标名称和指标编码,所述指标名称的项包括主名和别名,所述指标编码的项包括主词编码和分组编码,所述主词编码由主词类别码和主词顺序码构成,所述分组编码由分组类别码和分组顺序码构成,每组统计指标编码数据的别名和分组编码的数量是零个、一个或多个;
完备性校验模块,用于在获取用户输入的多组统计指标编码数据后,判断所述数据获取模块所获取的每组统计指标编码数据中包括主词编码、指标名称的主名在内的指定项的内容是否存在空缺,若是,则向用户发出提示,若否,则发出重复性校验指令;
重复性校验模块,用于在接收到重复性校验指令时,判断用户输入的多组统计指标编码数据中是否存在任一指标名称相同或指标编码相同的统计指标编码数据,若是,则向用户发出提示,若否,则发出合规性校验指令;
合规性校验模块,用于在接收到合规性校验指令时,根据统计指标编码数据的项调用对应的校验规则,并判断用户输入的多组统计指标编码数据中是否存在不符合对应的校验规则的内容,若是,则向用户发出提示,若否,则发出存储指令;
存储模块,用于在接收到存储指令时,将用户输入的多组统计指标编码数据发送至所述服务器并存入所述指标数据库;
检索模块,用于获取用户输入的关键词和检索指令,根据所述检索指令访问所述服务器,并将所述关键词与所述指标数据库中所存储的统计指标编码数据的对应的项的内容进行比较并判断是否一致,获取比较结果为一致的统计指标编码数据作为目标统计指标编码数据;以及
关联模块,用于获取所述目标统计指标编码数据的主词编码和所有分组编码的分组类别码,在所述指标数据库内的统计指标编码数据中筛选出具有相同主词编码且具有相同分组类别码的统计指标编码数据并展示给用户。
本发明的统计指标编码规范化管理系统采用C/S架构,即、客户端-服务器端架构,使不同用户通过客户端可以在服务器中提取到同一最新版本的数据,确保所有用户获取数据的一致性。且通过从各客户端输入统计指标编码数据,在客户端先进行完备性校验,确保数据的完整性,防止遗漏,然后进行重复性校验,确保存入指标数据库的统计指标编码数据中一个或多个代表同一含义的指标名称仅与一个对应的指标编码相关联,再进行合规性校验,确保统计指标编码数据的各项内容的正确性,继而确保了服务器的指标数据库中的数据及其关联的正确性,从而检索时能够正确地检索到目标数据及其关联的数据。
进一步地,在所述指标数据库中已存有统计指标编码数据时,所述重复性校验模块还用于将用户输入的每组统计指标编码数据与所述指标数据库中已存的统计指标编码数据进行比较,判断是否存在任一指标名称相同或指标编码相同的统计指标编码数据,若是,则向用户发出提示,若否,则发出存储指令。由此进一步确保了一个或多个代表同一含义的指标名称仅与一个对应的指标编码相对应,即、确保了数据的唯一性。
进一步地,所述指标数据库划分为多个存储统计指标编码数据的对应的项的内容的项数据库,所述存储模块将用户输入的多组统计指标编码数据发送至所述服务器并存入所述指标数据库时,将每组统计指标编码数据的每个项存入对应的项数据库中。由此,便于对各个项的内容进行管理和查询。
进一步地,所述客户端还包括分组统计模块,用于接收规定数量和分组筛选指令,获取所述指标数据库中的所有分组编码,并统计具有相同分组类别码的分组编码的数量,当具有相同分组类别码的分组编码的数量小于等于所述规定数量时发出提示。由此能够提示用户将具有数量少的分组编码的指标编码数据标记为停用,从而确保每个分组都有意义。
进一步地,所述服务器还包括存有统计数据的统计数据库,所述客户端还包括引用统计模块,所述引用统计模块用于统计每组统计指标编码数据的指标编码被所述统计数据库引用的次数。由此,确定各组统计指标编码数据的重要性。
本发明还提供一种统计指标编码规范化管理方法,包括以下步骤:
步骤101:建立一具有指标数据库的服务器,将多个客户端与该服务器连接;
步骤201:在所述客户端处获取用户输入的多组统计指标编码数据,每组统计指标编码数据具有多个项,该些项的全部或部分分别构成指标名称和指标编码,所述指标名称的项包括主名和别名,所述指标编码的项包括主词编码和分组编码,所述主词编码由主词类别码和主词顺序码构成,所述分组编码由分组类别码和分组顺序码构成,每组统计指标编码数据的别名和分组编码的数量是零个、一个或多个;
步骤202:判断用户输入的每组统计指标编码数据中,包括指标名称的主名和指标编码的主词编码在内的各个指定项的内容是否存在空缺,若是,则向用户发出提示后返回步骤201,若否,则进行步骤203;
步骤203:判断用户输入的多组统计指标编码数据中是否存在任一指标名称相同或指标编码相同的统计指标编码数据,若是,则向用户发出提示后返回步骤201,若否,则进行步骤204;
步骤204:根据统计指标编码数据的项调用对应的校验规则,并判断用户输入的多组统计指标编码数据中是否存在不符合对应的校验规则的内容,若是,则向用户发出提示后返回步骤201,若否,则进行步骤205;
步骤205:将用户输入的多组统计指标编码数据从客户端发送至服务器并存入指标数据库;
步骤206:将用户输入的关键词与指标数据库中统计指标编码数据的对应的项的内容进行比较并判断是否一致,获取比较结果为一致的统计指标编码数据作为目标统计指标编码数据;
步骤207:获取所述目标统计指标编码数据的主词编码和所有分组编码的分组类别码,并在所述指标数据库内的统计指标编码数据中筛选出具有相同主词编码和相同分组类别码的统计指标编码数据。
进一步地,步骤203中,若所述指标数据库中已存有统计指标编码数据,则还将用户输入的每组统计指标编码数据与所述指标数据库中已存的统计指标编码数据进行比较,判断是否存在任一指标名称相同或指标编码均相同的统计指标编码数据,若是,则向用户发出提示后返回步骤201,若否,则进行步骤204。由此进一步确保了一个或多个代表同一含义的指标名称仅与一个对应的指标编码相对应,即、确保了数据的唯一性。
进一步地,还包括以下步骤:将所述指标数据库划分为多个对统计指标编码数据的对应的项的内容进行存储的项数据库,在步骤205中,将用户输入的多组统计指标编码数据的各项内容存入对应的项数据库中。由此,便于对各个项的内容进行管理和查询。
进一步地,还包括以下步骤:接收用户输入的规定数量,获取所述指标数据库中的所有分组编码,并统计具有相同分组类别码的分组编码的数量,当具有相同分组类别码的分组编码的数量小于等于所述规定数量时发出提示。由此能够提示用户将具有数量少的分组编码的指标编码数据标记为停用,从而确保每个分组都有意义。
进一步地,还包括以下步骤:建立存有统计数据的统计数据库,统计每组统计指标编码数据的指标编码被所述统计数据库引用的次数。由此,确定各组统计指标编码数据的重要性。
附图说明
图1为本发明统计指标编码规范化管理系统及方法的一实施例中的统计指标编码数据的示意图;
图2为本发明统计指标编码规范化管理系统的结构示意图;
图3为本发明统计指标编码规范化管理方法的流程图;
图4为本发明统计指标编码规范化管理方法中对指标编码被引用次数进行统计的流程图。
具体实施方式
以下结合附图和下述实施方式进一步说明本发明,应理解,附图和下述实施方式仅用于说明本发明,而非限制本发明。
本发明提供了一种统计指标编码规范化管理系统及方法,能够对国民经济各部门的统计数据所应用的统计指标通过编码进行关联和统一管理,从而便于对大量的统计指标进行检索和使用。首先,结合图1对本发明一实施例中的统计指标编码数据的构成进行说明。图1为本实施例中的一组统计指标编码数据的示意图。一组统计指标编码数据具有多个项,该些项的全部或部分可分别构成指标名称和指标编码。其中,指标名称可包括多个项,其中一个项为主名,为必须项,其余项为别名,是内容可以为空的可选项。指标编码亦可包括多个项,其中一个项为主词编码,为必须项,其余项为分组编码,是内容可以为空的可选项。更具体而言,一个主词编码由一个主词类别码和一个主词顺序码构成,且一个分组编码由一个分组类别码和一个分组顺序码构成。也就是说,指标编码由主词类别码、主词顺序码、分组类别码(可为空)和分组顺序码(可为空)构成。由至少两个项构成的指标编码和至少两个项构成的指标名称最终构成一组统计指标编码数据,可理解为每组统计指标编码数据至少包含四个项,但不限于上述。例如,一组统计指标编码数据的项除了上述所例举的项之外,还可根据需求进一步包括表示主词释义、分组释义、来源、单位、地区、频度和标签等内容的项。其中,主词释义即为该组统计指标编码数据中的主词编码的文字释义,分组释义即为该组统计指标编码数据中对应的分组编码的文字释义。
图2为本发明统计指标编码规范化管理系统的结构示意图。如图2所示,本发明统计指标编码规范化管理系统包括一个服务器1和多个与服务器1连接的客户端2,即、构成了客户端-服务器端架构。为简化图示,图2中仅例示出4个用于上传或读取数据的客户端2,但数量不限于此。其中,服务器1具有用以存储如上述的统计指标编码数据的指标数据库11和用于存储海量的统计数据的统计数据库12。且更详细而言,指标数据库11根据如上述统计指标编码数据的项还进一步划分为多个项数据库,每个项数据库内存储对应的项的内容(例如主词库中存储主词编码、分组库中存储分组编码等,其他库同理)。统计数据库12进一步根据统计数据的分类划分为多个分类数据库,分类数据库中引用如上述的多组统计指标编码数据中的指标编码,并存有该指标编码所对应的统计指标在该分类下的统计数据。例如:统计数据库中,作为一个分类数据库的“各省年度库”引用了指标名称(主名或别名)为“第一产业增加值”的指标编码,并存有统计指标“第一产业增加值”在“各省年度”分类下的统计数据。
在需要更新指标数据库11内的统计指标编码数据时,用户以分批次的形式将统计指标编码数据输入客户端2,每批次可输入多组统计指标编码数据,这些统计指标编码数据在客户端2经过校验后,通过客户端2发送至服务器1并存储于指标数据库11内。具体而言,每个客户端2包括以下模块以实现上述更新统计指标编码数据的功能:用于获取本批次的统计指标编码数据的数据获取模块21、用于校验统计指标编码数据的完备性的完备性校验模块22、用于校验统计指标编码数据的重复性的重复性校验模块23、用于校验统计指标编码数据的合规性的合规性校验模块24以及用于将统计指标编码数据存入指标数据库11的存储模块25。
作为一较佳的实施方式,本发明的统计指标编码规范化管理系统中,服务器1中还设置有程序锁模块,当任一客户端2的存储模块25向服务器1的指标数据库11存入数据时,程序锁模块锁定指标数据库11从而其余客户端2不能向指标数据库录入数据。由此,即使在多人同时工作时也能确保录入指标数据库的数据不会发生重复。
在用户需要检索和查看所需的统计指标编码数据时,客户端2接收用户发出的相关指令,且根据指令与服务器1通信并从服务器1的指标数据库11内获取所需的统计指标编码数据。具体而言,每个客户端2包括以下模块以实现上述检索和查看所需的统计指标编码数据的功能:用于检索查询所需的统计指标编码数据的检索模块26和用于检索查询与目标统计指标编码数据相关的统计指标编码数据的关联模块27。
在用户需要统筹查看指标数据库11内存储的统计指标编码数据以便对其进行管理时,客户端2接收用户发出的相关指令,且根据指令与服务器1通信并从服务器1的指标数据库11内获取所需的统计指标编码数据,并经过处理后展示给用户。具体而言,每个客户端2包括以下模块以实现上述统筹查看已存储的统计指标编码数据的功能:用于统筹查看分组情况的分组统计模块、用于统筹查看主词释义和分组释义的重名统计模块、用于查看各组统计指标编码数据的指标编码被引用情况的引用统计模块以及用于标记不再使用的统计指标编码数据的停用模块(该些模块未图示)。
由此,多名用户能够从各自的客户端2将新的统计指标编码数据输入,并在客户端2处通过完备性、重复性和合规性校验,将确保内容正确的统计指标编码数据发送至服务器1并存入指标数据库11中,使得所有用户能够从各自的不同的客户端2获取同一最新版本的统计指标编码数据,此外,还能够通过各自的客户端2与服务器1通信而从指标数据库11中检索查询所需的统计指标编码数据,或统筹查看已存储的统计指标编码数据以便对其进行管理。藉此,实现了将不同部门的统计指标通过统一编码的形式集中存储和管理,通过编码体现各个统计指标之间的关联性,便于对海量的统计数据所涉及的大量的统计指标进行检索和使用。
以下,结合图1至图4所示,对客户端2的各个模块进行进一步的详细说明。数据获取模块21用于获取用户输入至客户端的一批次的多组统计指标编码数据,并将获取的统计指标编码数据发送至完备性校验模块22。
完备性校验模块22用于对数据获取模块21所获取的统计指标编码数据的各个指定项进行完备性校验,该指定项至少包括指标名称的主名和指标编码的主词编码。具体地,完备性校验模块22判断主词编码和指标名称的主名的内容是否存在空缺,若是,则向用户发出提示从而提示用户完善数据,若否,则向重复性校验模块23发出重复性校验指令。由此确保数据的完整性,防止遗漏。在本实施形态中,完备性校验模块22还对主词释义、来源、单位、地区和频度进行同样的完备性校验。
重复性校验模块23用于在接收到重复性校验指令时,对统计指标编码数据的各个指定项进行重复性校验,该指定项至少包括指标名称(即主名和别名)及指标编码(即主词编码和分组编码的组合)。具体地,重复性校验模块23判断本批次的多组统计指标编码数据中,是否存在任一指标名称相同或指标编码相同的统计指标编码数据。本发明中的“任一指标名称相同”指一组统计指标编码数据的主名或任一别名与另一组统计指标编码数据的主名或任一别名相同;本发明中的“指标编码相同”指一组统计指标编码数据的主词编码和分组编码的组合与另一组统计指标编码数据的主词编码和分组编码的组合相同。此外,在指标数据库中已存有统计指标编码数据时,重复性校验模块23还进一步将用户输入的每组统计指标编码数据与指标数据库中已存的指标编码数据进行比较,判断是否存在任一指标名称相同或指标编码相同的统计指标编码数据,若是,则向用户发出提示从而提示用户修改数据,若否,则向合规性校验模块24发出合规性校验指令。由此,确保了一个或多个代表同一含义的指标名称仅与一个对应的指标编码相关联,即、确保了数据关联的唯一性。在本实施形态中,重复性校验模块23还对地区和频度进行同样的重复性校验。
合规性校验模块24用于在接收到合规性校验指令时,对统计指标编码数据的各个项的内容进行合规性校验。具体地,根据统计指标编码数据的项调用对应的校验规则,并判断用户输入的多组统计指标编码数据中是否存在不符合对应的校验规则的内容,若是,则向用户发出提示从而提示用户修改数据,若否,则向存储模块25发出存储指令。由此,确保统计指标编码数据的各项内容的正确性,继而确保了指标数据库11中存储的数据及其关联性的正确性,从而检索时能够正确地检索到所需的数据。在本实施形态中,合规性校验模块24对指标名称、指标编码、单位、地区、频度进行合规性校验。需要说明的是,对于不同的项,其校验规则也不同,校验规则预先设置于各客户端内。在校验指标名称时,是判断指标名称中是否存在不允许出现的关键字和判断是否存在不允许同时存在的关键字;在校验指标编码时,是判断主词编码、分组编码是否符合编码字符长度要求;在校验单位时,是判断单位转换系数是否符合系数规则,例如不能为0;在校验地区时,是判断地区的编码是否符合地区编码规则,例如是否符合地区编码长度要求;在校验频度时,是判断频度的编码是否符合频度编码规则,例如是否符合频度编码长度要求。针对不同的项的校验规则也可不限于上述规则,技术人员可根据需要自行设定。
存储模块25用于在接收到存储指令时,将用户输入的本批次的多组统计指标编码数据通过网络发送至服务器1并存入指标数据库11。具体而言,存储模块25将统计指标编码数据存入服务器1的指标数据库11时,是根据不同的项,将本批次的多组统计指标编码数据的各项内容分别存储入对应的项数据库内。例如本实施形态中,存储模块25对于本批次的多组统计指标编码数据的各项内容,将指标名称存入指标名称库,将主词编码和主词释义存入主词库,将分组编码和分组释义存入分组库,将单位存入单位库,将地区存入地区库,将频度存入频度库,将标签存入标签库。由此,便于对各个项的内容进行管理和查询。
综上,通过数据获取模块21获取用户输入的统计指标编码数据后,由完备性校验模块22、重复性校验模块23和合规性校验模块24依次对数据进行校验,最后由存储模块25将确保完整且正确的数据存入指标数据库11,以供各个客户端2(图2中为四个)均能够通过访问服务器1来获取同一最新版本的数据。
在需要检索和查看所需的统计指标编码数据时,用户从客户端2输入关键词并发出检索指令,检索模块26用于获取用户输入的关键词和检索指令,根据检索指令访问服务器1,并将关键词与指标数据库11中所存储的统计指标编码数据的对应的项的内容进行比较并判断是否一致,获取比较结果为一致的统计指标编码数据作为目标统计指标编码数据。进一步地,检索模块26还用于根据预设的检索规则将用户输入的关键词与指标数据库中的数据进行比较,从而更为精准地获取用户所需的目标统计指标编码数据。较佳地,在本实施形态中,检索模块26在获取目标统计指标编码数据的同时,还发出相似指标关联指令。
关联模块27用于在接收到相似指标关联指令时,获取目标统计指标编码数据的主词编码和所有分组编码的分组类别码,并通过访问服务器1,在指标数据库11的统计指标编码数据中筛选出具有相同主词编码且具有相同分组类别码的统计指标编码数据并展示给用户,筛选出的统计指标编码数据即为与目标统计指标编码数据相似的指标编码数据。此外,用户也可以针对目标统计指标编码数据输入主词中类关联指令、主词关联指令或分组关联指令,则关联模块27还用于:在收到主词中类关联指令时,获取目标统计指标编码数据的主词类别码,并访问服务器1,在指标数据库11的主词库中筛选具有相同主词类别码的主词编码,并将筛选出的主词编码及对应的主词释义展示给用户;在收到主词关联指令时,获取目标统计指标编码数据的主词编码,并访问服务器1,将指标数据库11的主词库中的该主词编码及对应的主词释义展示给用户;在收到分组关联指令时,获取目标统计指标编码数据的所有分组编码,并访问服务器1,将指标数据库11的分组库中的各个分组编码及对应的分组释义分别展示给用户。用户可根据实际需求选择不同的指令,继而在筛选出的主词编码或分组编码的基础上进一步分析数据。需要说明的是,以上描述了对于通过检索得到的目标统计指标编码数据进行关联,但不限于此,用户也可以对于自行选定的目标统计指标编码数据发出相似指标关联指令、主词中类关联指令、主词关联指令或分组关联指令。
以下举例对于关联模块27接收到相似指标关联指令的情况进行说明,该示例仅为了更明晰地对关联模块进行说明,其具体细节不构成对本发明的限定。例如,目标统计指标编码具有主词编码AAA001和三个分组编码AAAA001、AAAB002、ABCD003,关联模块27获取其主词编码AAA001及所有分组编码的分组类别码AAAA、AAAB、ABCD,关联模块从分组库中依次筛选具有相同分组类别码的全部分组编码,例如有AAAA001、AAAB001、AAAB002、ABCD001、ABCD002、ABCD003等,从上述筛选出的分组编码所涉及的统计指标编码数据中,进一步筛选出主词编码同为AAA001且同样具有三组分组类别码分别为AAAA、AAAB、ABCD的统计指标编码数据,例如主词为AAA001且分组为AAAA001、AAAB001、ABCD002的统计指标编码数据,从而作为与目标统计指标编码数据相关联的统计指标编码数据展示给客户。
综上,通过检索模块26检索获取用户所需的目标统计指标编码数据后,可通过关联模块27对目标统计指标编码数据进一步关联出相似的统计指标编码数据,能够使用户从大量统计指标中的检索和查看到所需的统计指标,并通过自动向用户展示与其相似的统计指标,从而便于用户对于统计指标的使用。
在用户需要统筹查看指标数据库11内存储的统计指标编码数据以便对其进行管理时,用户可根据实际需求向客户端2输入分组筛选指令、分组统计指令、引用统计指令、重名统计指令。分组统计模块用于接收用户输入至客户端2的分组筛选指令,且用户在客户端2中预先设置有规定数量,分组统计模块在接收到分组筛选指令时访问服务器1,获取指标数据库11的分组库中的所有分组编码,并统计具有相同分组类别码的分组编码的数量,当具有相同分组类别码的分组编码的数量小于等于所述规定数量时,向用户发出提示,用户可根据实际情况判断是否将该统计指标编码数据标记为停用,从而确保每个分组都有意义。
较佳地,分组统计模块还用于在接收到用户输入至客户端2的分组统计指令时,访问服务器1,获取指标数据库11的分组库中的所有分组编码及所有统计指标编码数据中所涉及到的分组编码的组合(例如,一组统计指标编码数据具有三个分组编码时的这三个分组编码的组合),提取出所有分组类别码及分组类别码的组合,并统计各分组类别码及分组类别码的组合所涉及到的所有统计指标编码数据具有的指标名称和主词编码的数量。由此,用户能够从分组的角度对统计指标编码数据进行统筹查看和管理,通过对各分组类别码及分组类别码的组合所涉及的指标名称和主词编码的数量的统计判断分组编码及分组编码的组合的合理性,确保分组和分组组合的经济含义准确性和合理性。
在主词释义和分组释义均有录入的情况下,用户可以向客户端2输入重名统计指令。重名统计模块用于在接收到用户输入的重名统计指令时,访问服务器1,获取指标数据库11的主词库中的主词释义和分组库中的分组释义,并筛选出释义内容相同的两个或多个主词编码和/或分组编码,展示给用户。由此,便于用户综合判断各主词、分组的经济含义准确性和合理性。
参阅图4,引用统计模块用于接收用户向客户端2发出的引用统计指令,并访问服务器1,将存储于指标数据库11中的每组统计指标编码数据的指标编码与统计数据库12的各个分类数据库的内容进行匹配,当统计数据库12的分类数据库内存在该指标编码则匹配成功,此时引用统计模块记录该分类数据库的名称(例如上述的“各省年度库”),并将该指标编码的被引用次数加一。如此重复,直至所有统计指标编码数据的指标编码都与所述统计数据库内的各分类数据库匹配过为止,输出每组统计指标编码数据的指标编码被引用次数。用户可根据被引用次数判断该组统计指标编码数据的重要程度。
停用模块用于当用户根据实际情况将已经停用的统计指标编码数据标记为停用时,记录被标记的统计指标编码数据,且当记录的统计指标编码数据被统计数据库12引用时,向用户发出提示。
综上,客户端2通过分组统计模块、引用统计模块、重名统计模块以及停用模块,能够在用户需要统筹查看指标数据库11内存储的统计指标编码数据以便对其进行管理时,从服务器1的指标数据库11内获取所需的统计指标编码数据,并经过处理后展示给用户。
下面对本发明统计指标编码规范化管理方法进行说明。图3为本发明统计指标编码规范化管理方法的流程图,结合图1至图4所示,对本发明的统计指标编码规范化管理方法的步骤如下进行说明。
步骤101:建立一具有指标数据库和统计数据库的服务器1,将多个客户端2与该服务器1连接。
步骤201:在客户端2处获取用户输入至客户端2的一批次的多组统计指标编码数据,并将获取的统计指标编码数据发送至完备性校验模块22。
步骤202:判断用户输入的本批次的多组统计指标编码数据中,包括指标名称的主名和指标编码的主词编码在内的各个指定项的内容是否存在空缺,若是,则向用户发出提示后返回步骤201,若否,则进行步骤203。由此确保数据的完整性,防止遗漏。在本实施形态中,还对主词释义、来源、单位、地区和频度进行同样的完备性校验。
步骤203:判断用户输入的本批次的多组统计指标编码数据中是否存在任一指标名称相同或指标编码相同的统计指标编码数据,且在指标数据库中已存有统计指标编码数据时,还进一步将用户输入的本批次的每组统计指标编码数据与指标数据库中已存的指标编码数据进行比较,判断是否存在任一指标名称相同或指标编码相同的统计指标编码数据,若是,则向用户发出提示从而提示用户修改数据后返回步骤201,若否,则进行步骤204。由此进一步确保了一个或多个代表同一含义的指标名称仅与一个对应的指标编码相关联,即、确保了数据关联的唯一性。在本实施形态中,还对地区和频度进行同样的重复性校验。
步骤204:根据统计指标编码数据的项调用对应的校验规则,并判断用户输入的多组统计指标编码数据中是否存在不符合对应的校验规则的内容,若是,则向用户发出提示后返回步骤201,若否,则进行步骤205。由此,确保统计指标编码数据的各项内容的正确性,继而确保了服务器指标数据库中的数据及其关联的正确性,从而检索时能够正确地检索到所需的数据。本实施形态中,对指标名称、主词编码、分组编码、单位、地区、频度进行合规性校验。需要说明的是,对于不同的项,其校验规则也不同,校验规则预先设置于各客户端内。在校验指标名称时,是判断指标名称中是否存在不允许出现的关键字和判断是否存在不允许同时存在的关键字;在校验主词编码和分组编码时,是分别判断主词编码、分组编码是否符合编码字符长度要求;在校验单位时,是判断单位转换系数是否符合系数规则,例如不能为0;在校验地区时,是判断地区的编码是否符合地区编码规则,例如是否符合地区编码长度要求;在校验频度时,是判断频度的编码是否符合频度编码规则,例如是否符合频度编码长度要求。针对不同的项的校验规则也可不限于上述规则,技术人员可根据需要自行设定。
步骤205:将用户输入的本批次的多组统计指标编码数据从客户端2发送至服务器1并存入指标数据库11。较佳地,该步骤中,根据不同的项,将本批次的多组统计指标编码数据的各项内容分别存储入对应的项数据库内。例如本实施形态中,将指标名称存入指标名称库,将主词编码和主词释义存入主词库,将分组编码和分组释义存入分组库,将单位存入单位库,将地区存入地区库,将频度存入频度库,将标签存入标签库。
步骤206:获取用户输入的关键词和检索指令,根据检索指令通过访问服务器1,将关键词与指标数据库中统计指标编码数据的对应的项的内容进行比较并判断是否一致,获取比较结果为一致的统计指标编码数据作为目标统计指标编码数据,并执行步骤207。较佳地,步骤206中还根据预设的检索规则将用户输入的关键词与指标数据库中的数据进行比较,从而更为精准地获取用户所需的数据。
步骤207:对于在步骤206中得到目标统计指标编码数据,获取目标统计指标编码数据的主词编码和所有分组编码的分组类别码,并通过访问服务器1,在指标数据库11的统计指标编码数据中筛选出具有相同主词编码且具有相同分组类别码的统计指标编码数据并展示给用户,筛选出的统计指标编码数据即为与目标统计指标编码数据相似的指标编码数据。
除上述步骤以外,本发明的统计指标编码规范化管理方法还包括:当用户向客户端2输入分组筛选指令时,接收用户输入的分组筛选指令,且用户在客户端2中预先设置有规定数量,分组统计模块在接收到分组筛选指令时访问服务器1,获取指标数据库11的分组库中的所有分组编码,并统计具有相同分组类别码的分组编码的数量,当具有相同分组类别码的分组编码的数量小于等于所述规定数量时,向用户发出提示,用户可根据实际情况判断是否将该统计指标编码数据标记为停用,从而确保每个分组都有意义。
除上述步骤以外,本发明的统计指标编码规范化管理方法还包括:当用户向客户端2输入分组统计指令时,接收用户输入的分组统计指令,访问服务器1,获取指标数据库11的分组库中的所有分组编码及所有统计指标编码数据中所涉及到的分组编码的组合(例如,一组统计指标编码数据具有三个分组编码时的这三个分组编码的组合),提取出所有分组类别码及分组类别码的组合,并统计各分组类别码及分组类别码的组合所涉及到的所有统计指标编码数据具有的指标名称和主词编码的数量。由此,用户能够从分组的角度对统计指标编码数据进行统筹查看和管理,通过对各分组类别码及分组类别码的组合所涉及的指标名称和主词编码的数量的统计判断分组编码及分组编码的组合的合理性,确保人为规定的分组和分组组合的经济含义准确性和合理性。
在主词释义和分组释义均有录入的情况下,用户可以输入重名统计指令。除上述步骤以外,本发明的统计指标编码规范化管理方法还包括:当用户向客户端2输入重名统计指令时,接收用户输入的重名统计指令,访问服务器1,获取指标数据库11的主词库中的主词释义和分组库中的分组释义,并筛选出释义内容相同的两个或多个主词编码和/或分组编码,展示给用户。由此,便于用户综合判断人为规定的各主词、分组的经济含义准确性和合理性。
除上述步骤以外,本发明的统计指标编码规范化管理方法还包括:当用户向客户端2发出引用统计指令时,接收用户发出的引用统计指令,并访问服务器1,将存储于指标数据库11中的每组统计指标编码数据的指标编码与统计数据库12的各个分类数据库的内容进行匹配,当统计数据库12的分类数据库内存在该指标编码则匹配成功,此时引用统计模块记录该分类数据库的名称(例如上述的“各省年度库”),并将该指标编码的被引用次数加一。如此重复,直至所有统计指标编码数据的指标编码都与所述统计数据库内的各分类数据库匹配过为止,输出每组统计指标编码数据的指标编码被引用次数。用户可根据被引用次数判断该组统计指标编码数据的重要程度。
除上述步骤以外,本发明的统计指标编码规范化管理方法还包括:当用户根据实际情况将已经停用的统计指标编码数据标记为停用时,记录被标记的统计指标编码数据,且当记录的统计指标编码数据被统计数据库12引用时,向用户发出提示。
综上,本发明的统计指标编码规范化管理方法搭建客户端-服务器端架构,在客户端获取用户输入的统计指标编码数据后,依次对数据进行完备性校验、重复性校验和合规性校验,最后将确保完整且正确的数据从客户端经过网络发送至服务器并存入指标数据库,以供各个客户端均能够对同一版本的数据进行检索,实现了对国民经济各部门的统计指标通过指标编码进行关联和统一管理,便于对海量的统计指标和统计数据进行检索和使用。
在不脱离本发明的基本特征的宗旨下,本发明可体现为多种形式,因此本发明中的实施形态是用于说明而非限制,由于本发明的范围由权利要求限定而非由说明书限定,而且落在权利要求界定的范围,或其界定的范围的等价范围内的所有变化都应理解为包括在权利要求书中。

Claims (10)

1.一种统计指标编码规范化管理系统,其特征在于,包括一个服务器和多个与所述服务器连接的客户端,其中,所述服务器具有指标数据库,每个所述客户端包括:
数据获取模块,用于获取用户输入的多组统计指标编码数据,每组统计指标编码数据具有多个项,该些项的全部或部分分别构成指标名称和指标编码,所述指标名称的项包括主名和别名,所述指标编码的项包括主词编码和分组编码,所述主词编码由主词类别码和主词顺序码构成,所述分组编码由分组类别码和分组顺序码构成,每组统计指标编码数据的别名和分组编码的数量是零个、一个或多个;
完备性校验模块,用于在获取用户输入的多组统计指标编码数据后,判断所述数据获取模块所获取的每组统计指标编码数据中包括主词编码、指标名称的主名在内的指定项的内容是否存在空缺,若是,则向用户发出提示,若否,则发出重复性校验指令;
重复性校验模块,用于在接收到重复性校验指令时,判断用户输入的多组统计指标编码数据中是否存在任一指标名称相同或指标编码相同的统计指标编码数据,若是,则向用户发出提示,若否,则发出合规性校验指令;
合规性校验模块,用于在接收到合规性校验指令时,根据统计指标编码数据的项调用对应的校验规则,并判断用户输入的多组统计指标编码数据中是否存在不符合对应的校验规则的内容,若是,则向用户发出提示,若否,则发出存储指令;
存储模块,用于在接收到存储指令时,将用户输入的多组统计指标编码数据发送至所述服务器并存入所述指标数据库;
检索模块,用于获取用户输入的关键词和检索指令,根据所述检索指令访问所述服务器,并将所述关键词与所述指标数据库中所存储的统计指标编码数据的对应的项的内容进行比较并判断是否一致,获取比较结果为一致的统计指标编码数据作为目标统计指标编码数据;以及
关联模块,用于获取所述目标统计指标编码数据的主词编码和所有分组编码的分组类别码,在所述指标数据库内的统计指标编码数据中筛选出具有相同主词编码且具有相同分组类别码的统计指标编码数据并展示给用户。
2.根据权利要求1所述的统计指标编码规范化管理系统,其特征在于,在所述指标数据库中已存有统计指标编码数据时,所述重复性校验模块还用于将用户输入的每组统计指标编码数据与所述指标数据库中已存的统计指标编码数据进行比较,判断是否存在任一指标名称相同或指标编码相同的统计指标编码数据,若是,则向用户发出提示,若否,则发出存储指令。
3.根据权利要求1所述的统计指标编码规范化管理系统,其特征在于,所述指标数据库划分为多个存储统计指标编码数据的对应的项的内容的项数据库,所述存储模块将用户输入的多组统计指标编码数据发送至所述服务器并存入所述指标数据库时,将每组统计指标编码数据的每个项存入对应的项数据库中。
4.根据权利要求1至3中任一项所述的统计指标编码规范化管理系统,其特征在于,所述客户端还包括分组统计模块,用于接收规定数量和分组筛选指令,获取所述指标数据库中的所有分组编码,并统计具有相同分组类别码的分组编码的数量,当具有相同分组类别码的分组编码的数量小于等于所述规定数量时发出提示。
5.根据权利要求1所述的统计指标编码规范化管理系统,其特征在于,所述服务器还包括存有统计数据的统计数据库,所述客户端还包括引用统计模块,所述引用统计模块用于统计每组统计指标编码数据的指标编码被所述统计数据库引用的次数。
6.一种统计指标编码规范化管理方法,其特征在于,包括以下步骤:
步骤101:建立一具有指标数据库的服务器,将多个客户端与该服务器连接;
步骤201:在所述客户端处获取用户输入的多组统计指标编码数据,每组统计指标编码数据具有多个项,该些项的全部或部分分别构成指标名称和指标编码,所述指标名称的项包括主名和别名,所述指标编码的项包括主词编码和分组编码,所述主词编码由主词类别码和主词顺序码构成,所述分组编码由分组类别码和分组顺序码构成,每组统计指标编码数据的别名和分组编码的数量是零个、一个或多个;
步骤202:判断用户输入的每组统计指标编码数据中,包括指标名称的主名和指标编码的主词编码在内的各个指定项的内容是否存在空缺,若是,则向用户发出提示后返回步骤201,若否,则进行步骤203;
步骤203:判断用户输入的多组统计指标编码数据中是否存在任一指标名称相同或指标编码相同的统计指标编码数据,若是,则向用户发出提示后返回步骤201,若否,则进行步骤204;
步骤204:根据统计指标编码数据的项调用对应的校验规则,并判断用户输入的多组统计指标编码数据中是否存在不符合对应的校验规则的内容,若是,则向用户发出提示后返回步骤201,若否,则进行步骤205;
步骤205:将用户输入的多组统计指标编码数据从客户端发送至服务器并存入指标数据库;
步骤206:将用户输入的关键词与指标数据库中统计指标编码数据的对应的项的内容进行比较并判断是否一致,获取比较结果为一致的统计指标编码数据作为目标统计指标编码数据;
步骤207:获取所述目标统计指标编码数据的主词编码和所有分组编码的分组类别码,并在所述指标数据库内的统计指标编码数据中筛选出具有相同主词编码和相同分组类别码的统计指标编码数据。
7.根据权利要求6所述的统计指标编码规范化管理方法,其特征在于,
步骤203中,若所述指标数据库中已存有统计指标编码数据,则还将用户输入的每组统计指标编码数据与所述指标数据库中已存的统计指标编码数据进行比较,判断是否存在任一指标名称相同或指标编码均相同的统计指标编码数据,若是,则向用户发出提示后返回步骤201,若否,则进行步骤204。
8.根据权利要求6所述的统计指标编码规范化管理方法,其特征在于,还包括以下步骤:
将所述指标数据库划分为多个对统计指标编码数据的对应的项的内容进行存储的项数据库,在步骤205中,将用户输入的多组统计指标编码数据的各项内容存入对应的项数据库中。
9.根据权利要求6至8中任一项所述的统计指标编码规范化管理方法,其特征在于,还包括以下步骤:
接收用户输入的规定数量,获取所述指标数据库中的所有分组编码,并统计具有相同分组类别码的分组编码的数量,当具有相同分组类别码的分组编码的数量小于等于所述规定数量时发出提示。
10.根据权利要求6所述的统计指标编码规范化管理方法,其特征在于,还包括以下步骤:
建立存有统计数据的统计数据库,统计每组统计指标编码数据的指标编码被所述统计数据库引用的次数。
CN202010613268.8A 2020-06-30 2020-06-30 统计指标编码规范化管理系统及方法 Pending CN111930794A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010613268.8A CN111930794A (zh) 2020-06-30 2020-06-30 统计指标编码规范化管理系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010613268.8A CN111930794A (zh) 2020-06-30 2020-06-30 统计指标编码规范化管理系统及方法

Publications (1)

Publication Number Publication Date
CN111930794A true CN111930794A (zh) 2020-11-13

Family

ID=73316801

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010613268.8A Pending CN111930794A (zh) 2020-06-30 2020-06-30 统计指标编码规范化管理系统及方法

Country Status (1)

Country Link
CN (1) CN111930794A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112506901A (zh) * 2020-11-30 2021-03-16 深圳微众信用科技股份有限公司 一种数据质量测量方法、装置及介质
CN112734358A (zh) * 2020-12-25 2021-04-30 山东浪潮通软信息科技有限公司 业务系统的配置方法和装置
CN112948448A (zh) * 2021-02-04 2021-06-11 广州市城市规划勘测设计研究院 一种城市体检指标计算自动机

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105741196A (zh) * 2016-03-01 2016-07-06 万达信息股份有限公司 一种基于四个维度进行数据质量监测及评价方法
CN106920019A (zh) * 2015-12-24 2017-07-04 北京计算机技术及应用研究所 多类别编码管理系统
CN109145008A (zh) * 2018-08-16 2019-01-04 北京奥技异科技发展有限公司 基于kks编码规则和大数据架构的实时数据平台
CN109933591A (zh) * 2019-03-20 2019-06-25 普元信息技术股份有限公司 大数据环境下基于多方式结合实现数据编码优化管理的系统及方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106920019A (zh) * 2015-12-24 2017-07-04 北京计算机技术及应用研究所 多类别编码管理系统
CN105741196A (zh) * 2016-03-01 2016-07-06 万达信息股份有限公司 一种基于四个维度进行数据质量监测及评价方法
CN109145008A (zh) * 2018-08-16 2019-01-04 北京奥技异科技发展有限公司 基于kks编码规则和大数据架构的实时数据平台
CN109933591A (zh) * 2019-03-20 2019-06-25 普元信息技术股份有限公司 大数据环境下基于多方式结合实现数据编码优化管理的系统及方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112506901A (zh) * 2020-11-30 2021-03-16 深圳微众信用科技股份有限公司 一种数据质量测量方法、装置及介质
CN112734358A (zh) * 2020-12-25 2021-04-30 山东浪潮通软信息科技有限公司 业务系统的配置方法和装置
CN112948448A (zh) * 2021-02-04 2021-06-11 广州市城市规划勘测设计研究院 一种城市体检指标计算自动机

Similar Documents

Publication Publication Date Title
CN111930794A (zh) 统计指标编码规范化管理系统及方法
CA1288166C (en) Universal query analysis system
CN100483333C (zh) 实时数据入库
US11288242B2 (en) Similarity-based search engine
US7406477B2 (en) Database system with methodology for automated determination and selection of optimal indexes
CN105683956B (zh) 密集分组的维度数据
CN110874414B (zh) 一种基于数据联勤服务的政策解读方法
CN111046035B (zh) 数据自动化处理方法、系统、计算机设备及可读存储介质
CN104756106A (zh) 表征数据存储系统中的数据源
CN110659282B (zh) 数据路由的构建方法、装置、计算机设备和存储介质
CN111709613A (zh) 基于数据统计的任务自动分配方法、装置及计算机设备
CN111178005B (zh) 数据处理系统、方法及存储介质
CN112527783A (zh) 一种基于Hadoop的数据质量探查系统
US7813975B2 (en) System and method for processing account data
CN111913954A (zh) 智能数据标准目录生成方法和装置
US20040078361A1 (en) System and method for analyzing patent families
US20140229815A1 (en) Computerised data entry form processing
CN112786124B (zh) 一种问题排查方法、装置、存储介质及设备
CN116894152B (zh) 一种多源数据调研与实时分析方法
CN116842142B (zh) 一种医疗器械智能化检索系统
US20080148220A1 (en) System infrastructure structure formulation supporting system and supporting method
CN115982429A (zh) 一种基于流程控制的知识管理方法及系统
CN115510289B (zh) 一种数据立方体配置方法、装置、电子设备及存储介质
CN112100202B (zh) 一种产品识别及产品信息补全方法、存储介质及机器人
KR20140123647A (ko) 지식재산권 분석 시스템

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination