CN105808713B - 将线性结构信息加工为非线性结构的方法和装置 - Google Patents

将线性结构信息加工为非线性结构的方法和装置 Download PDF

Info

Publication number
CN105808713B
CN105808713B CN201610126313.0A CN201610126313A CN105808713B CN 105808713 B CN105808713 B CN 105808713B CN 201610126313 A CN201610126313 A CN 201610126313A CN 105808713 B CN105808713 B CN 105808713B
Authority
CN
China
Prior art keywords
information
node
function
block
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610126313.0A
Other languages
English (en)
Other versions
CN105808713A (zh
Inventor
韩朝晖
崔泉栋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Weihai Weifa Information Technology Co Ltd
Original Assignee
Weihai Weifa Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Weihai Weifa Information Technology Co Ltd filed Critical Weihai Weifa Information Technology Co Ltd
Priority to CN201610126313.0A priority Critical patent/CN105808713B/zh
Publication of CN105808713A publication Critical patent/CN105808713A/zh
Application granted granted Critical
Publication of CN105808713B publication Critical patent/CN105808713B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/258Data format conversion from or to a database

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及数据处理技术领域,具体地说是一种工作可靠、效率高的将线性结构信息加工为非线性结构的方法和装置,其特征在于设有线性结构信息切分及存储模块、制备数据结点模块、基础设置模块、制备功能主题模块、制备信息块元素模块;其中所述线性结构信息切分及存储模块用于在线性结构信息中检索特定标识,当检索到特定标识即将原有信息切分为独立的信息块,然后将这些独立的信息块分别制成独立的记录然后存入数据库;本发明与现有技术相比,能够将传统的线性结构信息加工为非线性结构信息,从而提高数据查找、处理的效率,具有结构合理、运行准确等显著的优点。

Description

将线性结构信息加工为非线性结构的方法和装置
技术领域:
本发明涉及数据处理技术领域,具体地说是一种工作可靠、效率高的将线性结构信息加工为非线性结构的方法和装置。
背景技术:
从技术角度分析,人们以纸张、书籍为载体所记录、保存的信息均具有明显的线性结构特征,这种结构最显著特点是信息内容按段落依次存放于某一载体或者存储空间内,并且这些信息一经存储其内部各段落的前驱、后继关系即相对固定,目前很多数据库、网页、电子书等电子载体在记录、保存信息时也大量沿用线性结构技术。
实践证明线性结构信息具有简单、易用等优点,但当某一线性结构信息体量较大时在各段落间做插入、删除等操作较为麻烦,而要在不同时间、空间的大量线性结构信息间检索、提取局部间互为关联的内容则更为困难,这无疑束缚了人类处理和获取信息的能力。
目前人们在网页中大量使用超文本技术,用超链接在不同空间信息间建立联系以提高线性结构信息检索效能,但超链接一般只是指向其他整篇的线性结构文本,而不同线性结构信息内局部与局部信息单元间的关联仍难建立。
发明内容:
本发明针对现有技术中存在的缺点和不足,提出了一种可以较方便地提取线性结构信息内部互相关联的局部信息,进而将这些局部信息按新主题重新归类组合成新的信息,从而更方便检索、使用信息的将线性结构信息加工为非线性结构的方法和装置。
本发明可以通过以下措施达到:
一种将线性结构信息加工为非线性结构的方法,其特征在于包括以下步骤:
步骤1:按标识将完整的线性结构信息切分为M(M为整数,M≥1)个独立的信息块,然后将这些信息块制成独立的记录分别存入数据库;
步骤2:按树结构制作数据结点,首先将结点的关键码制作为树结构的根元素,然后制作N(N为整数,N≥1)个功能主题元素作为根元素的子元素,当任一功能主题元素可进一步分解功能,则继续制作功能主题元素作为该功能主题元素的子元素,但当任一功能主题元素不能再进一步分解功能,则制作信息块元素作为该功能主题元素的子元素;
步骤3:按图结构构建各数据结点间的关系,若已制成数据结点分别为B1、B2、B3、B4……Bi,则各数据结点间的关系必须符合G=(V,E),其中G代表图结构,V是数据结点的有穷非空集合且V={B1、B2、B3、B4……Bi},E是边的集合;
步骤4:先预制标准化功能主题码,然后在功能主题码与各结点功能主题元素之间建立联系,各结点按需调用预先制备的功能主题码作为本结点内部的功能主题元素的数据;
步骤5:将已切分并存入数据库的信息块与结点内的信息块元素间建立联系,根据需要将数据库内的信息块导入信息块元素内,作为信息块元素的数据原料。
本发明步骤1中所述标识具体指标识段落的符号。
本发明步骤2中所述树结构具体指有向树。
本发明步骤3中所述的图结构具体指有向图。
本发明还提出了一种将线性结构信息加工为非线性结构的装置,其特征在于设有线性结构信息切分及存储模块、制备数据结点模块、基础设置模块、制备功能主题模块、制备信息块元素模块;其中
所述线性结构信息切分及存储模块用于在线性结构信息中检索特定标识,当检索到特定标识即按标识将原有信息切分为独立的信息块,然后将这些信息块分别制成独立的记录然后存入数据库;
所述制备数据结点模块,用于按树结构制备结点;用于按图结构组织各结点;用于修改、删除结点;修改结点间边的内容。
所述基础设置模块,用于制作一些标准化的功能主题码以备调用至各结点的各个功能主题元素内作为各功能主题的数据内容;
所述制备功能主题模块,用于将提前制备好的功能主题码导入功能主题内,从而为结点制作出各个功能主题;
所述制备信息块元素模块,用于向结点的信息块元素内导入、录入信息,用于修改、存储信息块元素内容。
本发明与现有技术相比,能够将传统的线性结构信息加工为非线性结构信息,从而提高数据查找、处理的效率,具有结构合理、运行准确等显著的优点。
附图说明:
附图1是本发明步骤1的原理图。
附图2是本发明步骤2的原理图。
附图3是本发明步骤3的原理图。
附图4是本发明步骤4的原理图。
附图5是本发明步骤5的原理图。
附图6是本发明实施例1中待处理信息示意图。
附图7是本发明实施例1中第一步的处理示意图。
附图8是本发明实施例1中第二步的处理示意图。
附图9是本发明实施例1中第二步的结果示意图。
附图10是本发明实施例1中第三步的处理示意图。
附图11是本发明实施例1中第四步的处理示意图。
附图12是本发明实施例1中第五步的处理示意图。
附图13是本发明的结构框图。
附图标记:线性结构信息切分及存储模块1、制备数据结点模块2、基础设置模块3、制备功能主题模块4、制备信息块元素模块5。
具体实施方式:
下面结合实施例对本发明作进一步的说明。
如附图1-5所示,本发明提出了一种将线性结构信息加工为非线性结构的方法,其特征在于包括以下步骤:
步骤1:按标识将完整的线性结构信息切分为M(M为整数,M≥1)个独立的信息块,然后将这些信息块制成独立的记录分别存入数据库;
步骤2:按树结构制作数据结点,首先将结点的关键码制作为树结构的根元素,然后制作N(N为整数,N≥1)个功能主题元素作为根元素的子元素,当任一功能主题元素可进一步分解功能,则继续制作功能主题元素作为该功能主题元素的子元素,但当任一功能主题元素不能再进一步分解功能,则制作信息块元素作为该功能主题元素的子元素;
步骤3:按图结构构建各数据结点间的关系,若已制成数据结点分别为B1、B2、B3、B4……Bi,则各数据结点间的关系必须符合G=(V,E),其中G代表图结构,V是数据结点的有穷非空集合且V={B1、B2、B3、B4……Bi},E是边的集合;
步骤4:先预制标准化功能主题码,然后在功能主题码与各结点功能主题元素之间建立联系,各结点按需调用预先制备的功能主题码作为本结点内部的功能主题元素的数据;
步骤5:将已切分并存入数据库的信息块与结点内的信息块元素间建立联系,根据需要将数据库内的信息块导入信息块元素内,作为信息块元素的数据原料。
本发明步骤1中所述标识具体指标识段落的符号。
本发明步骤2中所述树结构具体指有向树。
本发明步骤3中所述的图结构具体指有向图。
如附图13所示,本发明还提出了一种将线性结构信息加工为非线性结构的装置,其特征在于设有线性结构信息切分及存储模块1、制备数据结点模块2、基础设置模块3、制备功能主题模块4、制备信息块元素模块5;其中
所述线性结构信息切分及存储模块用于在线性结构信息中检索特定标识,当检索到特定标识即按标识将原有信息切分为独立的信息块,然后将这些信息块分别制成独立的记录然后存入数据库;
所述制备数据结点模块,用于按树结构制备结点;用于按图结构组织各结点;用于修改、删除结点;修改结点间边的内容。
所述基础设置模块,用于制作一些标准化的功能主题码以备调用至各结点的各个功能主题元素内作为各功能主题的数据内容;
所述制备功能主题模块,用于将提前制备好的功能主题码导入功能主题内,从而为结点制作出各个功能主题;
所述制备信息块元素模块,用于向结点的信息块元素内导入、录入信息,用于修改、存储信息块元素内容。
实施例1:
如图6(a)所示,《中华人民共和国刑法》共有四百五十二条法律条文,并且这些条文是按线性结构依次排列的。在《中华人民共和国刑法》全部四百五十二个法条中与“贪污罪”相关的法律条文至少有五条,分别是第一百八十三条、第二百七十条、第三百八十二条、第三百八十三条、第三百九十四条,因为五个条文分散在全部四百五十二个法条中的不同位置,人们要短时间内找到、找齐这五个法条非常困难。更麻烦的是,类似这种相互关联的很多小块信息不仅存在于同一线性结构信息内部的不同位置,更大量存在于不同线性结构信息内部的不同位置,如图6(b)所示的《最高人民法院、最高人民检察院关于办理妨害预防、控制突发传染病疫情等灾害的刑事案件具体应用法律若干问题的解释》这个文件,其中与“贪污罪”相关的法律条文有二个,分别是第十四条和第十八条,因为这两个条文内均没有“贪污罪”这三个字,按以往的经验人们要查找这二个法律条文先要了解并找到《最高人民法院、最高人民检察院关于办理妨害预防、控制突发传染病疫情等灾害的刑事案件具体应用法律若干问题的解释》这个文件,然后再通过全面阅读找出该文件内与“贪污罪”相关的这二个条文。目前现有的“超链接”等技术很难将上述与“贪污罪”相关的所有法律条文汇总到一起以方便应用,但我们发明的技术则可以很便捷地解决这些问题。
第一步,我们先将图6(a)所示的《中华人民共和国刑法》、图6(b)所示的《最高人民法院、最高人民检察院关于办理妨害预防、控制突发传染病疫情等灾害的刑事案件具体应用法律若干问题的解释》、图6(c)所示的《贪污罪相关理论》、图6(d)所示的《贪污罪立法修改记录》等线性结构信息分别放入线性结构信息切分及存储模块中,如图7(a)、图7(b)、图7(c)、图7(d)所示,在该模块中当检索到线性结构信息中有段落标识符即自动按段落标识将这些信息切分成独立的信息块,然后将这些独立的信息块分别制成独立的记录存入数据库。
第二步,如图8所示,在制备结点模块中先按树形结构和如下流程先制备出通用信息结点模型:首先将“贪污罪”的关键码制作为信息结点的根元素;然后制作四个功能主题元素作为根元素的子元素,当其中一个功能主题元素可进一步分解功能,则为该功能主题制作二个子功能主题元素;然后制作信息块元素作为相关功能主题元素的子元素。图9即是加工完成的“贪污罪”结点的结构图。
第三步,按图结构构建各数据结点间的关系,如图10所示,我们以B1代表“贪污罪”结点,B2代表“自首”结点、B3代表“假释”结点、B4代表“立功”结点、B5代表“受贿罪”,则各数据结点间的关系必须符合G=(V,E),其中G代表图结构,V是数据结点的有穷非空集合且V={B1、B2、B3、B4、B5},E={〈B1,B2〉、〈B1,B3〉、〈B1,B4〉、〈B3,B4〉、〈B4,B3〉、〈B5,B2〉、〈B5,B3〉、〈B5,B4〉}。
第四步,如图11所示,先预制标准化功能主题码“立法”、“解释”、“法理”、“历史”、“法理1”、“法理2”,然后在功能主题码与“贪污罪”信息结点的功能主题元素之间建立联系,调用“立法”、“解释”、“法理”、“历史”、“法理1”、“法理2”这些功能主题码作为“贪污罪”信息结点的功能主题元素的数据;
第五步,如图12所示,将已切分并存入数据库的信息块C2、C3、C4、C5、D1、D2、E1、E2、E3、E4、E5、F1、F2、F3、F4、F5与“贪污罪”信息结点内的信息块元素间建立联系,根据需要将数据库内信息块的数据导入信息块元素作为信息块元素的数据原料。
经过以上方法的处理后,原来呈线性结构的一条一条的法律信息变成了更为复杂的非线性结构,新生成的非线性结构可以使互相关联的多条法律信息非常直观的联系在一起,并且通过调整结点间的图结构关系数据结点间的关联也可以非常直观显现出来,这样人们检索信息将变得非常方便。

Claims (5)

1.一种将线性结构信息加工为非线性结构的方法,其特征在于包括以下步骤:
步骤1:按标识将完整的线性结构信息切分为M个独立的信息块,其中,M为整数,M≥1,然后将这些信息块制成独立的记录分别存入数据库;
步骤2:按树结构制作数据结点,首先将结点的关键码制作为树结构的根元素,然后制作N个功能主题元素作为根元素的子元素,N为整数,N≥1,当任一功能主题元素可进一步分解功能,则继续制作功能主题元素作为该功能主题元素的子元素,但当任一功能主题元素不能再进一步分解功能,则制作信息块元素作为该功能主题元素的子元素;
步骤3:按图结构构建各数据结点间的关系,若已制成数据结点分别为B1、B2、B3、B4……Bi,则各数据结点间的关系必须符合G=(V,E),其中G代表图结构,V是数据结点的有穷非空集合且V={B1、B2、B3、B4……Bi},E是边的集合;
步骤4:先预制标准化功能主题码,然后在功能主题码与各结点功能主题元素之间建立联系,各结点按需调用预先制备的功能主题码作为本结点内部的功能主题元素的数据;
步骤5:将已切分并存入数据库的信息块与结点内的信息块元素间建立联系,根据需要将数据库内的信息块导入信息块元素内作为信息块元素的数据原料。
2.根据权利要求1所述的一种将线性结构信息加工为非线性结构的方法,其特征在于步骤1中所述标识具体指标识段落的符号。
3.根据权利要求1所述的一种将线性结构信息加工为非线性结构的方法,其特征在于步骤2中所述树结构具体指有向树。
4.根据权利要求1所述的一种将线性结构信息加工为非线性结构的方法,其特征在于步骤3中所述的图结构具体指有向图。
5.一种利用如权利要求1-4中任意一项所述将线性结构信息加工为非线性结构方法的装置,其特征在于设有依次连接的线性结构信息切分及存储模块、制备数据结点模块、基础设置模块、制备功能主题模块、制备信息块元素模块;其中
所述线性结构信息切分及存储模块用于在线性结构信息中检索特定标识,当检索到特定标识即将原有信息切分为独立的信息块,然后将这些独立的信息块分别制成独立的记录然后存入数据库;
所述制备数据结点模块,用于按树结构制备结点;用于按图结构组织各结点;用于修改、删除结点;修改结点间边的内容;
所述基础设置模块,用于制作一些标准化的功能主题码以备调用至各结点的各个功能主题元素内作为各功能主题的数据内容;
所述制备功能主题模块,用于将提前制备好的标准化的功能主题码导入功能主题内,从而为结点制作出各个功能主题;
所述制备信息块元素模块,用于向结点的信息块元素内导入、录入信息,用于修改、存储信息块元素内容。
CN201610126313.0A 2016-03-07 2016-03-07 将线性结构信息加工为非线性结构的方法和装置 Active CN105808713B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610126313.0A CN105808713B (zh) 2016-03-07 2016-03-07 将线性结构信息加工为非线性结构的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610126313.0A CN105808713B (zh) 2016-03-07 2016-03-07 将线性结构信息加工为非线性结构的方法和装置

Publications (2)

Publication Number Publication Date
CN105808713A CN105808713A (zh) 2016-07-27
CN105808713B true CN105808713B (zh) 2017-09-29

Family

ID=56467783

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610126313.0A Active CN105808713B (zh) 2016-03-07 2016-03-07 将线性结构信息加工为非线性结构的方法和装置

Country Status (1)

Country Link
CN (1) CN105808713B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1218933A (zh) * 1997-11-14 1999-06-09 国际商业机器公司 因特网万维网页面的国际支持方法和系统
CN103678698A (zh) * 2013-12-27 2014-03-26 福建福昕软件开发股份有限公司北京分公司 一种提高pdf文档在线浏览加载速度的方法及其装置
CN105095964A (zh) * 2015-08-17 2015-11-25 杭州朗和科技有限公司 一种数据处理方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070271263A1 (en) * 2006-05-19 2007-11-22 Matchware A/S Displaying Data

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1218933A (zh) * 1997-11-14 1999-06-09 国际商业机器公司 因特网万维网页面的国际支持方法和系统
CN103678698A (zh) * 2013-12-27 2014-03-26 福建福昕软件开发股份有限公司北京分公司 一种提高pdf文档在线浏览加载速度的方法及其装置
CN105095964A (zh) * 2015-08-17 2015-11-25 杭州朗和科技有限公司 一种数据处理方法和装置

Also Published As

Publication number Publication date
CN105808713A (zh) 2016-07-27

Similar Documents

Publication Publication Date Title
CN103167172B (zh) 将多种聊天记录整合的方法和系统
CA2906475C (en) Method and apparatus for substitution scheme for anonymizing personally identifiable information
US9619492B2 (en) Data migration
CN107273482A (zh) 基于HBase的告警数据存储方法及装置
WO2015109250A1 (en) CREATING NoSQL DATABASE INDEX FOR SEMI-STRUCTURED DATA
CN104951515B (zh) 一种提取并分析Android手机行踪轨迹信息的方法
CN113688288B (zh) 数据关联分析方法、装置、计算机设备和存储介质
CN106469152A (zh) 一种基于etl的文件处理方法及系统
CN106610774A (zh) 网页表格编辑方法及装置
CN104217011A (zh) HBase二级索引表的查询方法和装置
CN106648977A (zh) 一种安卓系统文件的恢复方法及装置
CN110675028A (zh) 基于区块链的食品安全监管方法、装置、设备及系统
CN105808713B (zh) 将线性结构信息加工为非线性结构的方法和装置
CN104240107B (zh) 社群数据筛选系统及其方法
KR101264792B1 (ko) 개인정보 보호 시스템
CN111159192A (zh) 基于大数据的数据入库方法、装置、存储介质和处理器
CN104252488B (zh) 处理数据的方法和服务器
US9569061B2 (en) System and method for organizing field data obtained through a plurality of devices
CN109918439A (zh) 数据同步方法及其应用的环路检测方法和相关装置
CN106445943B (zh) 一种日志的展示方法及装置
CN106484794B (zh) 一种图形数据处理方法及系统
CN106031296A (zh) 消息处理方法以及支持该消息处理方法的电子设备
CN105404630A (zh) 信息处理方法及装置
Aouad et al. ANTS ROAD: a new tool for SQLite data recovery on android devices
CN104820671A (zh) 一种资料流的显示方法及电子设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant