CN104809145B - 层次式数据分析方法 - Google Patents

层次式数据分析方法 Download PDF

Info

Publication number
CN104809145B
CN104809145B CN201410562682.5A CN201410562682A CN104809145B CN 104809145 B CN104809145 B CN 104809145B CN 201410562682 A CN201410562682 A CN 201410562682A CN 104809145 B CN104809145 B CN 104809145B
Authority
CN
China
Prior art keywords
label
path information
tag path
analysis
obj ect
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410562682.5A
Other languages
English (en)
Other versions
CN104809145A (zh
Inventor
罗昌显
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hanwha Aerospace Co Ltd
Hanwha Precision Machinery Co Ltd
Original Assignee
Samsung Techwin Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Techwin Co Ltd filed Critical Samsung Techwin Co Ltd
Publication of CN104809145A publication Critical patent/CN104809145A/zh
Application granted granted Critical
Publication of CN104809145B publication Critical patent/CN104809145B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/137Hierarchical processing, e.g. outlines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/177Editing, e.g. inserting or deleting of tables; using ruled lines
    • G06F40/18Editing, e.g. inserting or deleting of tables; using ruled lines of spreadsheets

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

提供一种层次式数据分析方法,该方法通过对XML文件的标签层次式结构分析结果进行记录,从而无需每当需要对记录到XML文件的数据进行处理时都要重新对XML文件的标签层次结构进行分析,并且利用已记录好的标签层次结构分析结果来迅速执行对记录到XML文件的数据的处理的方法。根据本发明的层次式数据分析方法包括如下步骤:加载(load)基于可扩展标记语言(XML:eXtensible Markup Language)的第一分析对象文件;对包含于所加载的所述第一分析对象文件的多个标签(tag)的层次结构进行分析;利用所述分析的结果,将包含于所述第一分析对象文件的各个标签的标签路径信息的列表记录到存储单元。

Description

层次式数据分析方法
技术领域
本发明涉及一种层次式数据分析方法。更具体地讲,涉及一种在利用基于以可扩展标记语言(XML:eXtensible Markup Language)为基础的结构的数据等具有基于标签的层次式结构的数据来执行数据处理时,用于减少分析标签层次结构所需的运算量及运算时间的层次式数据分析方法。
背景技术
XML文件是广泛用于表示具有层次式结构的数据的文件格式。与超文本标记语言(HTML:HyperText Markup Language)等相比,XML文件的优点在于,具有用户可直接对标签结构进行定义的扩展性。
包含于XML文件的信息利用标签来表示各个信息之间的连接关系。这些标签具有树形的层次结构。因此,为了对包含于XML文件的信息进行分析,需要预先执行对作为各个标签的层次结构的树形结构进行设置的工作。众所周知,树的节点数量为N时,探索树所需的运算时间为O(log N)。虽然XML文件的树形结构有可能是被很好地分配的树形结构,但是在对具有高DEPTH的XML文件进行分析时,会需要更多的时间。因此,每次重新对具有高DEPTH的大容量XML文件的标签层次结构进行分析会浪费运算量和运算时间。
【现有技术文献】
第2013-0101153号韩国公开专利
第2008-0090647号韩国公开专利
发明内容
本发明要解决的技术问题在于,提供一种通过对XML文件等具有基于标签的层次式结构的数据的标签层次结构分析结果进行记录,从而无需每当需要对记录于XML文件的数据进行处理时都要重新对XML文件的标签层次结构进行分析,而是利用已记录的标签层次结构分析结果来迅速地对记录于XML文件的数据执行处理的方法。
本发明要解决的另一个技术问题在于,提供一种对分析对象文件的标签层次结构分析结果进行记录,并且分别按包含于分析对象文件的各个标签将从根标签到达相关的标签的路径作为所述标签层次结构分析结果来进行记录的方法。
本发明要解决的又一个技术问题在于,提供一种通过生成一眼就能够掌握位于分析对象文件的各个标签所适用的区域(即,位于初始标签(<tag>)和终止标签(</tag>)之间)的句子结构的形态的数据结构来进行表示和记录的方法。
本发明的技术问题不限于以上所述的技术问题,本领域技术人员通过以下的记载应该会清楚地理解未提及的其他的技术问题。
根据用于解决上述问题的本发明的一个实施例的层次式数据分析方法包括如下步骤:加载(load)包含数据的第一分析对象文件,所述数据具有基于标签的层次式结构;对包含于所加载的所述第一分析对象文件的多个标签(tag)的层次结构进行分析;利用所述分析的结果,将包含于所述第一分析对象文件的各个标签的标签路径信息的列表记录到存储单元。
根据一个实施例,所述各个标签的标签路径信息可意味着位于从所述第一分析对象文件的根(root)标签到所述各个标签的路径上的多个标签的依次排列。
根据一个实施例,所述记录的步骤可包括如下步骤:将关于包含于所述第一分析对象文件的第一标签的所述标签路径信息记录到存储单元;将特定的分隔符字符串连接(string concatenation)到关于所述第一标签的所述标签路径信息的末尾处;将关于包含于所述第一分析对象文件的第二标签的所述标签路径信息字符串连接到所述分隔符后。此时,所述第二标签可意味着在所述第一分析对象文件内位于紧挨所述第一标签后的初始标签。
根据一个实施例,所述记录的步骤可包括如下步骤:对将所述标签路径信息的列表作为第一轴且将在所述第一分析对象文件内记载于与所述列表所包含的各个标签路径信息对应的标签的区域的句子结构作为第二轴的二维数据进行显示。
根据一个实施例,所述层次式数据分析方法还可包括如下步骤:将所述二维数据存储到存储单元。此时,具有所述二维数据结构的数据优选为是能够根据棋盘式数据表(SPREAD SHEET)应用(Application)而被加载的数据。
根据一个实施例,所述层次式数据分析方法还可包括如下步骤:加载具有与所述第一分析对象文件相同的标签层次结构的第二分析对象文件;加载记录于所述存储单元的标签路径信息的列表;对将所加载的所述标签路径信息的列表作为第一轴且将在所述第二分析对象文件内记载于与所加载的所述列表所包含的各个标签路径信息对应的标签的区域的句子结构作为第二轴的二维数据进行显示。
根据一个实施例,所述层次式数据分析方法可包括如下步骤:从所述存储单元上删除记录于所述存储单元的标签路径信息的列表中的至少一部分的标签路径信息;加载未被删除的剩余标签路径信息;以所加载的所述剩余标签路径信息作为对象来检索特定标签的标签路径信息。此时,所述删除的步骤可包括如下步骤:接收关于检索范围指定标签的标签路径信息;删除除所述检索范围指定标签的标签路径信息及所述检索范围指定标签的下级标签的标签路径信息之外的所有标签路径信息。
根据一个实施例,所述层次式数据分析方法还可包括如下步骤:加载记录于所述存储单元的标签路径信息的整个列表;删除所加载的所述标签路径信息的列表中的至少一部分的标签路径信息;将未被删除的剩余标签路径信息作为对象来检索特定标签的标签路径信息。
根据如上所述的本发明,带来能够迅速分析XML文件的效果。
此外,能够带来如下效果:将XML文件的标签结构存储到存储单元,并且在之后需要处理具有相同的标签结构的其他的XML文件的数据时,通过加载存储在所述存储单元中的标签结构来直接掌握标签结构,并能够利用该结果来迅速处理所述其他的XML文件的数据处理。
此外,利用第一轴配置各自的标签的标签路径信息、第二轴配置各自的标签适用区域内的句子结构的数据结构来显示XML文件的分析结果,从而带来能够一眼掌握XML文件的结构的效果。具有所述第一轴、第二轴的数据结构通过棋盘式数据表(SPREAD SHEET)应用来被加载,从而可提高使用上的便利性。
附图说明
图1是根据本发明的一个实施例的层次式数据分析方法的顺序图。
图2是XML文件的标签结构示例。
图3是将图2中示出的文件的标签结构用树形表示的概念图。
图4是示出根据本发明的一个实施例的层次式数据分析方法来记录的标签路径信息的列表的图。
图5是可接着图1中示出的顺序图而执行的根据本发明的一个实施例的层次式数据分析方法的顺序图。
图6是可接着图1中示出的顺序图而执行的根据本发明的一个实施例的层次式数据分析方法的顺序图。
图7是示出可根据本发明的一个实施例而生成的基于两个轴的数据结构的图。
图8至图10是可接着图1中示出的顺序图而执行的根据本发明的一个实施例的层次式数据分析方法的顺序图。
图11是可在执行根据图8至图10的层次式数据分析方法时被显示的图形用户界面(GUI:Graphic User Interface)的示例。
图12是示出在通过图11中示出的GUI来执行检索时的标签路径信息的列表中的删除对象和检索对象的图。
图13是根据本发明的另一个实施例的层次式数据分析装置的构成图。
具体实施方式
以下,将参照附图对本发明的优选实施例进行详细描述。本发明的优点及特征以及实现这些的方法通过参照附图和详细描述的实施例将会变得清楚。然而,本发明不限于以下公开的实施例,而是可以以彼此不同的形态实现,本实施例只是为了完整地公开本发明且向本发明所属技术领域中具有通常的知识的技术人员完整地告知本发明的范围而提供的,本发明仅由权利要求书所记载的范围来确定。纵观说明书,相同的标号表示相同的构成要素。
除非另有定义,否则这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域的普通技术人员所通常理解的意思相同的意思。除非另外明确定义,否则在通用字典中定义的术语不应以理想的或者过于正式的含义来解释。本说明书中所使用的术语仅仅是为了描述实施例而使用,而不意图限制本发明。在本说明书中,除非上下文另外明确指出,否则单数形式包括复数形式。还应理解的是,当在本说明书中使用术语“包含”及/或“包括”时,所提到的构成要素、步骤、操作及/或元件不排除存在或附加一个以上的其它构成要素、步骤、操作及/或元件。
应该理解的是,尽管在这里可使用术语第一、第二等来描述不同的元件、构成要素及/或部分,但是这些元件、构成要素及/或部分不应该受这些术语的限制。这些术语仅是用来将一个元件、构成要素或部分与另一个元件、构成要素或部分区分开来。因此,应该理解的是,下面所提及的第一元件、第一构成要素或第一部分可被称作第二元件、第二构成要素或第二部分。
首先,参照图1对根据本发明的一个实施例的层次式数据分析方法进行说明。
首先加载(load)作为分析对象的基于XML的文件(S100)。所述加载意味着通过存储器读取存储于存储单元中的文件。所述加载将会在用户通过实现根据实施例的层次式数据分析方法的计算机程序而输入文件加载命令时加以执行。
能够被加载的文件包含具有基于标签(tag)的层次式结构的数据。即,所述文件内的数据具有通过标签(tag)而被表示的树形的层次结构。所述文件可以是诸如基于XML的文件、基于HTML的文件。
接下来,对加载的文件内的标签层次结构进行分析(S102)。此时,可使用通过读入数据来生成树形结构的递归算法。参照图2至图3,如果如图2所示的XML文件被加载,则会生成如图3所示的树形结构。标签包括初始标签和终止标签,优选为仅有两者当中的一个标签被输入到树形结构。具有相同的母标签的兄弟(sibling)标签优选为根据记载在所加载的文件的顺序而从左到右排列。根据这样的方式,在图3中将<Part>标签的子标签中最先出现的<CadRotations>标签作为<Part>标签的第一子标签来表示在最左侧。
接下来,利用生成的所述树形结构将包含于被加载的所述文件的各个标签的标签路径信息的列表记录到存储单元(S104)。例如,可将所述列表以文本文件格式记录到所述存储单元,也可将所述列表数据库化而记录到所述存储单元,也可将所述列表构成为棋盘式数据表(SPREAD SHEET)程序可读的文件格式而记录到所述存储单元,还可将所述列表构成为文件制作程序可读的文件格式而记录到所述存储单元。
所述存储单元可由硬盘、外置式硬盘、光盘、非易失性存储器、USB存储器等来构成。
包含于被加载的所述文件的各个标签的标签路径信息可通过前序走访preordertraverse)包含于所生成的所述树形结构的各个节点(记录有标签)来获得。所述前序走访是指最先探索根节点,并以左节点、右节点的顺序拜访的方式。图4中示出通过前序走访图3中示出的树形结构来获得的各个标签的标签路径信息的列表。
参照图4进行更详细的说明,最先显示作为根节点的PartsList标签的路径“PartsList”,之后显示作为根节点的子节点的Part标签的路径“PartsList>Part”。此外,对于Part标签的情况,具有两个属性(attribute)“@xmlns:xsd”、“@xmlns:xsi”,根据本实施例,除在标签的区域中记载的句子结构之外,还可提取属性(attribute)的值来显示,因此针对这样的情况还可显示标签内属性(attribute)的路径。即,可显示作为Part标签内的@xmlns:xsd attribute路径的“PartsList>Part>@xmlns:xsd”和作为Part标签内的@xmlns:xsi attribute的路径的“PartsList>Part>@xmlns:xsi”。除关于所述标签内属性(attribute)的特殊规则之外,通过前序走访树形结构,从而可按包含于被加载的所述文件的各个标签的顺序来构成所述列表。
如图4所示,对各个标签的标签路径信息进行记录,因而与在以树形结构来分析XML文件的状态下寻找特定标签的情况相比可以更节约时间。例如,在寻找“BodyColorID”标签时(图4中用粗体表示),在标签路径信息列表中可以立刻确认“BodyColorID”标签的层次信息,但是在树形结构中需要进行“BodyColorID”标签的检索及从根节点到被检索到的标签为止的路径信息的确认。
标签路径信息列表中的各个标签路径信息可根据特定的分隔符而被区分。所述分隔符可以是如图4所示的换行字符。即,可通过如下方式生成所述列表:记录关于包含于被加载的所述文件的第一标签的所述标签路径信息,将特定的分隔符字符串连接(stringconcatenation)到关于所述第一标签的所述标签路径信息的末尾处,并将关于包含于所述第一分析对象文件的第二标签的所述标签路径信息字符串连接到所述分隔符后。所述第二标签可以是在所述第一分析对象文件内位于紧挨第一标签后的初始标签。
根据一个实施例,如图5所示,包含于被加载的所述文件中的各个句子结构可分别按标签来显示(S106)。所述句子结构是指包含于被加载的文件内的不是标签的数据。
可生成二维数据,该二维数据将所述标签路径信息的列表作为第一轴,且将在所述第一分析对象文件内记载于与包含于所述列表的各个标签路径信息对应的标签的区域的句子结构作为第二轴。参照图5说明,可沿着第一轴显示第一标签的标签路径信息、第二标签的标签路径信息、…、第n标签的标签路径信息,沿着第二轴可显示记载于各个标签的区域(初始标签和终止标签之间)的句子结构。如果以这样的方式显示所加载的文件,则带来能够更直观地掌握包含于文件的数据的效果。
生成的所述二维数据不止显示一次,而是可被记录到存储单元,使得之后能够重新打开查看。例如,可将所述列表以文本文件格式记录到所述存储单元,也可将所述列表数据库化而记录到所述存储单元,也可将所述列表构成为棋盘式数据表(SPREAD SHEET)程序可读的文件格式而记录到所述存储单元,还可将所述列表构成为文件制作程序可读的文件格式而记录到所述存储单元。
图7是所述二维数据的构成示例。
根据一个实施例,在加载具有相同的标签层次结构的不同的文件而进行分析时,可再利用所记录的所述标签路径信息列表。例如,在记录有部件信息的大容量的第一XML文件和具有与所述第一XML文件相同的标签层次结构的大容量的第二XML文件存在时,通过加载关于第一XML文件的标签路径信息列表文件来用于分析第一XML文件,从而节约XML文件的标签层次结构分析所需的运算时间。参照图6对这些实施例进行更详细的说明。
在执行参照图1所说明的方法之后,加载第二分析对象文件(S107)。此外,加载记录于存储单元的标签路径信息列表(S109)。如上所述,由于第一分析对象文件和第二分析对象文件具有相同的标签层次结构,只是句子结构彼此不同,因此可利用第一分析对象文件的标签路径信息列表来处理第二分析对象文件。更具体地讲,在依次扫描所加载的第二分析对象文件的同时,将与包含于所述第一分析对象文件的标签路径信息列表的各个标签路径信息对应的标签和记载于所述标签的区域的句子结构进行匹配(S111)。这样的匹配结果是,可以以将所述标签路径信息的列表作为第一轴且将在所述第二分析对象文件内记载于与包含于所述列表的各个标签路径信息对应的标签的区域的句子结构作为第二轴的二维数据的形态进行显示。
所述二维数据不是一次性地生成后被删除,而是被记录到存储单元,使得之后能够重新读取(S113)。例如,可将所述列表以文本文件格式记录到所述存储单元,也可将所述列表数据库化而记录到所述存储单元,也可将所述列表构成为棋盘式数据表(SPREADSHEET)程序可读的文件格式而记录到所述存储单元,还可将所述列表构成为文件制作程序可读的文件格式而记录到所述存储单元。
以下,参照图8至图12对能够接着参照图1说明的方法执行的特定标签的标签路径信息的检索方法进行说明。根据本实施例的检索方法可利用根据参照图1说明的方法记录到存储单元的具有基于标签的层次式结构的输入数据的标签路径信息列表来检索包含于所述输入数据的特定标签的标签路径信息。
参照图8,对所述检索方法中的一个实施例进行说明。首先,从已经记录于存储单元的标签路径信息列表中删除一部分的标签路径信息(S120)。然后,将未被删除的剩余标签路径信息作为对象来检索特定标签的标签路径信息(S122)。此时,被删除的一部分的标签路径信息是作为检索对象的标签明确不存在的标签的标签路径信息,其可通过用户输入而被确定。例如,删除对象标签路径信息本身被用户指定,或者用于对删除对象标签路径信息进行定义的删除对象标签可被用户指定。以下,将参照图9至图10进行更详细的说明。
参照图9,对所述检索方法中的另一个实施例进行说明。图9是如下方法的顺序图:从存储单元上预先删除一部分的标签路径信息,通过存储器仅加载未被删除的剩余标签路径信息,并从所加载的标签路径信息中检索检索对象标签的标签路径信息。
首先,接收关于检索范围指定标签的信息(S130)。
关于检索范围指定标签的信息可通过为执行检索而被提供的图形用户界面(GUI:Graphic User Interface)来输入。图11示出所述GUI的一个示例。图11示出包含用于指定检索范围的编辑区域12及用于输入检索标签的标签名的编辑区域14的GUI 10。用于定义检索范围的检索范围指定标签的标签路径信息可被输入到用于指定检索范围的编辑区域12。编辑区域12中可输入两个以上的检索范围指定标签的标签路径信息。此外,编辑区域14中也可输入两个以上的标签名。
如图11所示,如果将“PartsList>Part>Shape”输入到编辑区域12,将“BodyColorID”作为标签名输入到编辑区域14,则可从以“PartsList>Part>Shape”开始的标签路径信息中检索出以“BodyColorID”结束的标签路径信息。此时,如图12所示,不是以“PartsList>Part>Shape”开始的标签路径信息20被删除,并从未被删除的标签路径信息30中检索出以“BodyColorID”结束的标签路径信息。在此情况下,与对记录于存储单元的整个标签路径信息执行检索的情况相比,可在更短的时间内完成检索。
此外,根据一个实施例,也可以由用户输入包含于标签路径信息列表的整个标签路径信息中应从检索对象被排除的范围。例如,GUI 10包含用于指定删除范围的编辑区域(未示出)以代替用于指定检索范围的编辑区域12,或者通过在用于指定检索范围的编辑区域12上增加来包含用于指定删除范围的编辑区域(未示出)。在用于指定删除范围的编辑区域上可输入用于定义删除范围的关于一个以上的删除范围指定标签的标签路径信息输入。在此情况下,在包含于标签路径信息列表的整个标签路径信息中,由所述删除范围指定标签的标签路径信息开始的所有标签路径信息被删除,并且会仅将未被删除的标签路径信息作为对象来检索出以输入到编辑区域14的标签名结束的标签路径信息。
再次回到图9,对根据本实施例的检索方法中的其余操作进行说明。在本实施例中,从存储单元上删除除输入的检索范围指定标签的标签路径信息及其下级标签的标签路径信息之外的其余标签路径信息(S132)。根据图11,如果存在用户输入,则除输入的检索范围指定标签的标签路径信息(PartsList>Part>Shape)及其下级标签的标签路径信息(PartsList>Part>Shape*)(*表示由一个以上的文字构成的字符串)之外的其余所有的标签路径信息被删除。
接下来,未被删除的剩余部分被加载到存储器等(S134)。接下来,从所加载的标签路径信息中检索出以被指定为检索对象的标签名结束的标签路径信息(S136)。
参照图10,对所述检索方法中的又一个实施例进行说明。在图10中,将记录于存储单元上的标签路径信息列表加载到模式存储器等(S140),接收检索范围指定标签(S142),并通过从被加载的标签路径信息列表中删除除输入的检索范围指定标签的标签路径信息及其下级标签的标签路径信息之外的其余标签路径信息来缩小检索范围(S144)。接下来,从标签路径信息中检索出以被指定为检索对象的标签名结束的标签路径信息(S146)。
图13是根据本发明的又一个实施例的层次式数据分析装置100的构成图。参照图13,根据本发明的层次式数据分析装置100可包括:系统总线102、处理器108、随机存取存储器(RAM:Random Access Memory)110、存储器104及用于与外部装置进行通信的网络接口106。用于实现参照图1至图12说明的根据本发明的实施例的层次式数据分析方法的计算机程序代码可被存储到存储器104而被加载到RAM 110,并且可由处理器108来执行。
本发明构思还可被实施为计算机可读记录介质上的计算机可读代码。计算机可读记录介质可包括计算机可读的存储介质及计算机刻度的发送介质。计算机可读记录介质可以是能够存储数据且之后能够被计算机系统读取所存储的数据的数据存储装置,例如,可以是ROM、RAM、CD-ROM、磁带、软盘、其他光学存储装置。计算机可读记录介质还可分布于通过网络连接的计算机系统上,从而计算机可读代码以分布处理方式被存储和执行。所述计算机可读记录介质可通过有线连接和无线连接来发送载波(carrier wave)或载波信号(carrier signal)。
以上虽然参照附图对本发明的实施例进行了说明,但本领域技术人员应该理解,在不改变本发明的技术思想或必要的特征的情况下,可实施为其他的具体形态。因此应该理解,以上的实施例在所有方面都为示例性的,而不是限制性的。

Claims (9)

1.一种层次式数据分析方法,包括如下步骤:
加载包含数据的第一分析对象文件,所述数据具有基于标签的层次式结构;
对包含于所加载的所述第一分析对象文件的多个标签的层次结构进行分析;
利用所述分析的结果,将包含于所述第一分析对象文件的各个标签的标签路径信息的列表记录到存储单元,
所述记录的步骤包括如下步骤:对将所述标签路径信息的列表作为第一轴且将在所述第一分析对象文件内记载于与所述列表所包含的各个标签路径信息对应的标签的区域的句子结构作为第二轴的二维数据进行显示。
2.根据权利要求1所述的层次式数据分析方法,其中,
所述各个标签的标签路径信息是位于从所述第一分析对象文件的根标签到所述各个标签的路径上的多个标签的依次排列。
3.根据权利要求1所述的层次式数据分析方法,其中,
所述记录的步骤包括如下步骤:
将关于包含于所述第一分析对象文件的第一标签的所述标签路径信息记录到存储单元;
将特定的分隔符字符串连接到关于所述第一标签的所述标签路径信息的末尾处;
将关于包含于所述第一分析对象文件的第二标签的所述标签路径信息字符串连接到所述分隔符后。
4.根据权利要求3所述的层次式数据分析方法,其中,
所述第二标签是在所述第一分析对象文件内位于紧挨所述第一标签后的初始标签。
5.根据权利要求1所述的层次式数据分析方法,还包括如下步骤:将所述二维数据存储到存储单元,
其中,具有所述二维数据结构的数据是能够根据棋盘式数据表应用而被加载的数据。
6.根据权利要求1所述的层次式数据分析方法,还包括如下步骤:
加载具有与所述第一分析对象文件相同的标签层次结构的第二分析对象文件;
加载记录于所述存储单元的标签路径信息的列表;
对将所加载的所述标签路径信息的列表作为第一轴且将在所述第二分析对象文件内记载于与所加载的所述列表所包含的各个标签路径信息对应的标签的区域的句子结构作为第二轴的二维数据进行显示。
7.根据权利要求1所述的层次式数据分析方法,还包括如下步骤:
从所述存储单元上删除记录于所述存储单元的标签路径信息的列表中的至少一部分的标签路径信息;
加载未被删除的剩余标签路径信息;
以所加载的所述剩余标签路径信息作为对象来检索特定标签的标签路径信息。
8.根据权利要求7所述的层次式数据分析方法,其中,
所述删除的步骤包括如下步骤:
接收关于检索范围指定标签的标签路径信息;
删除除所述检索范围指定标签的标签路径信息及所述检索范围指定标签的下级标签的标签路径信息之外的所有标签路径信息。
9.根据权利要求1所述的层次式数据分析方法,还包括如下步骤:
加载记录于所述存储单元的标签路径信息的整个列表;
删除所加载的所述标签路径信息的列表中的至少一部分的标签路径信息;
将未被删除的剩余标签路径信息作为对象来检索特定标签的标签路径信息。
CN201410562682.5A 2014-01-23 2014-10-21 层次式数据分析方法 Active CN104809145B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2014-0008488 2014-01-23
KR1020140008488A KR101974341B1 (ko) 2014-01-23 2014-01-23 계층적 데이터 분석 방법 및 그 프로그램이 기록된 기록 매체

Publications (2)

Publication Number Publication Date
CN104809145A CN104809145A (zh) 2015-07-29
CN104809145B true CN104809145B (zh) 2018-05-29

Family

ID=53693970

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410562682.5A Active CN104809145B (zh) 2014-01-23 2014-10-21 层次式数据分析方法

Country Status (2)

Country Link
KR (1) KR101974341B1 (zh)
CN (1) CN104809145B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102071266B1 (ko) 2016-06-21 2020-01-30 한국전자통신연구원 빌딩 에너지 관리 시스템 및 방법
KR102108272B1 (ko) * 2019-05-28 2020-05-08 한화시스템(주) 운용자 행위 기반의 소프트웨어 개발 산출문서 자동 생성 시스템 및 방법
CN116882366B (zh) * 2023-09-07 2024-01-19 粤芯半导体技术股份有限公司 标记型报文的结构转换方法、装置、电子产品和介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101887458A (zh) * 2010-07-06 2010-11-17 江苏大学 一种基于路径编码的xml文档索引方法
CN102768674A (zh) * 2012-06-12 2012-11-07 上海方正数字出版技术有限公司 一种基于路径结构的xml数据存储方法
CN103049494A (zh) * 2012-12-07 2013-04-17 华为技术有限公司 一种xml文档的表格存储方法及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7306520B2 (en) 2003-06-09 2007-12-11 Igt Gaming device including movable symbol indicator plates
JP5121146B2 (ja) * 2006-02-22 2013-01-16 株式会社東芝 構造化文書管理装置、構造化文書管理プログラムおよび構造化文書管理方法
US8156156B2 (en) 2006-04-06 2012-04-10 Universita Di Pisa Method of structuring and compressing labeled trees of arbitrary degree and shape
US9460064B2 (en) * 2006-05-18 2016-10-04 Oracle International Corporation Efficient piece-wise updates of binary encoded XML data
JP5905232B2 (ja) 2011-10-20 2016-04-20 三菱重工業株式会社 挿通孔の閉塞率評価システム、閉塞率評価方法及び閉塞率評価プログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101887458A (zh) * 2010-07-06 2010-11-17 江苏大学 一种基于路径编码的xml文档索引方法
CN102768674A (zh) * 2012-06-12 2012-11-07 上海方正数字出版技术有限公司 一种基于路径结构的xml数据存储方法
CN103049494A (zh) * 2012-12-07 2013-04-17 华为技术有限公司 一种xml文档的表格存储方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"一种改进的XML数据管理方案";赵圣猛;《中国优秀硕士学位论文全文数据库 信息科技辑》;20110115;论文正文第2.1节、2.5节、4.2节、6.2节 *

Also Published As

Publication number Publication date
KR101974341B1 (ko) 2019-05-02
CN104809145A (zh) 2015-07-29
KR20150088094A (ko) 2015-07-31

Similar Documents

Publication Publication Date Title
US9760602B1 (en) System for exploring data in a database
EP1764710A1 (en) Layout generation method, information processing device, and program
US9304672B2 (en) Representation of an interactive document as a graph of entities
US8990717B2 (en) Context-aware charting
US20120159312A1 (en) Representation of an interactive document as a graph of entities
KR101617696B1 (ko) 데이터 정규표현식의 마이닝 방법 및 장치
CN107038177A (zh) 自动生成抽取-转换-加载代码的方法和装置
US9286361B2 (en) Extract-transform-load processor controller
CN104809145B (zh) 层次式数据分析方法
CN107870915A (zh) 对搜索结果的指示
US20160154851A1 (en) Computing device, storage medium, and data search method
KR101244466B1 (ko) NoSQL 기반 데이터 모델링 방법
US20180121526A1 (en) Method, apparatus, and computer-readable medium for non-structured data profiling
WO2011074942A1 (en) System and method of converting data from a multiple table structure into an edoc format
CN109816754A (zh) 流程图的创建方法、显示方法及系统和存储介质
US9542502B2 (en) System and method for XML subdocument selection
JP7022472B1 (ja) データ管理システム、データ管理方法及びデータ管理プログラム
JP5273884B1 (ja) 構造解析装置及びプログラム
KR101679011B1 (ko) 데이터베이스에서 데이터 이동을 처리하는 방법 및 장치
US11429560B2 (en) Systems and methods for detection of automatable sheet modification actions
CN102369527B (zh) 一种链接关系表管理方法以及相关装置
EP4131129A1 (en) Report writing assistance system and report writing assistance method
CN105510963B (zh) 一种分析地震勘探辅助数据文件的方法
CN103577560A (zh) 一种输入数据库操作指令的方法和装置
JP6283442B1 (ja) 解析装置、解析方法、および解析プログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
C53 Correction of patent of invention or patent application
CB02 Change of applicant information

Address after: Gyeongnam Changwon City, South Korea

Applicant after: HANWHA TECHWIN Co.,Ltd.

Address before: Gyeongnam Changwon City, South Korea

Applicant before: Samsung Techwin Co.,Ltd.

COR Change of bibliographic data

Free format text: CORRECT: APPLICANT; FROM: SAMSUNG TAI KEWEI CO., LTD. TO: HANWHA TECHWIN CO., LTD.

Free format text: CORRECT: ADDRESS; FROM:

GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: Gyeongnam Changwon City, South Korea

Patentee after: HANWHA AEROSPACE Co.,Ltd.

Address before: Gyeongnam Changwon City, South Korea

Patentee before: HANWHA TECHWIN Co.,Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20190415

Address after: Gyeongnam Changwon City, South Korea

Patentee after: Hanwha Precision Machinery Co.,Ltd.

Address before: Gyeongnam Changwon City, South Korea

Patentee before: HANWHA AEROSPACE Co.,Ltd.