CN105824908A - 一种层次结构数据的快速采集方法 - Google Patents

一种层次结构数据的快速采集方法 Download PDF

Info

Publication number
CN105824908A
CN105824908A CN201610147444.7A CN201610147444A CN105824908A CN 105824908 A CN105824908 A CN 105824908A CN 201610147444 A CN201610147444 A CN 201610147444A CN 105824908 A CN105824908 A CN 105824908A
Authority
CN
China
Prior art keywords
data
treeview
acquisition method
hiberarchy
structured data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610147444.7A
Other languages
English (en)
Other versions
CN105824908B (zh
Inventor
徐享忠
张伟
汤再江
邵伟
朱敏洁
范锐
黄玺瑛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Academy of Armored Forces Engineering of PLA
Original Assignee
Academy of Armored Forces Engineering of PLA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Academy of Armored Forces Engineering of PLA filed Critical Academy of Armored Forces Engineering of PLA
Priority to CN201610147444.7A priority Critical patent/CN105824908B/zh
Publication of CN105824908A publication Critical patent/CN105824908A/zh
Application granted granted Critical
Publication of CN105824908B publication Critical patent/CN105824908B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/83Querying

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明提供一种层次结构数据的快速采集方法,其包括:以可扩展标记语言XML表示层次结构数据;将树状控件与编辑框控件进行组合;解析XML文档,将层次结构数据关联属性作为树状控件节点属性,与相应树状控件节点进行关联,并在树状控件中显示层次结构数据;将层次结构自动展开到用户先前采集的结果,便于在位编辑层次结构数据。本发明通过树状控件与编辑框控件的组合,可避免人为将层次结构扁平化为单一层次,并实现层次数据的在位编辑,用户从而可减少鼠标移动、点击次数,提高操作效率;将层次结构数据及其属性进行关联,可实现两者的统一采集及调整,避免多次操作带来的低效率以及信息不一致。

Description

一种层次结构数据的快速采集方法
技术领域
本发明涉及数据处理技术领域,尤其涉及一种层次结构数据的快速采集方法。
背景技术
层次数据(包括分类数据),指具有一定层次结构或分支结构的数据,它与关系数据相对。层次数据在现实世界中极为普遍和常见,如组织机构、学科专业、图书分类、职务分类、民族分类。层次数据可分为单一层次数据(如民族分类)和多层次数据(如组织机构、图书分类)。实际上,单一层次数据是多层次数据的特例。
由于层次数据的普遍性,在信息系统的数据采集中经常涉及层次数据。目前,信息系统对于层次数据的采集,通常有以下几种做法:
(1)将层次结构固定显示在数据采集界面,供用户操作,例如,某文件归档系统中的文件类型,如图1所示。
(2)弹出一个新的页面(或窗口),用树状控件显示层次数据,供用户操作,例如,某作者注册系统采集专业领域,点击右侧“添加或修改”将弹出“学科专业”页面,如图2所示。
(3)将层次结构扁平化为单一层次的数据,供用户操作,例如,某作者注册系统中的职称,如图3所示。
(4)将层次结构分解成为若干相互关联的单一层次,每个单一层次数据用组合框显示,上下层次显示的数据能够联动,以采集用户的操作结果,例如,某地理信息系统按照地名查询时采集地名,如图4所示。
(5)将层次结构分解成为若干相互不关联的单一层次,每个单一层次数据用组合框显示,上下层次显示的数据不能联动,以采集用户的操作结果,例如,某科研申报系统要求分别采集申报人的研究专长及该研究专长的属性编码,且两者不能自动关联,如图5所示。
但上述现有技术中的方案存在各种不足,概括起来:界面设计不够简洁,用户操作比较繁琐,容易引入人为错误。具体来说:
(1)图1所示的方案将层次结构固定显示在数据采集界面,不够灵活,界面利用率较低。
(2)图2所示的方案将层次结构固定显示在新弹出的数据采集界面,提高了界面利用率,用户却不得不移动鼠标,以改变输入焦点。
(3)图3所示的方案将层次结构扁平化为单一层次的数据,人为消除了数据的层次性,不便于用户输入及修改。
(4)图4所示的方案将层次结构被分解成为若干相互关联的单一层次,不便于用户输入及修改。
(5)图5所示的方案将层次结构被分解成为若干相互不关联的单一层次,不便于输入及修改,且很容易造成信息不一致性,还要求用户必须事先认真阅读“数据编码表”,避免填报错误,数据编码表任举一个实例,如图6所示。
发明内容
为解决上述技术问题,本发明提供一种层次结构数据的快速采集方法,具有快速采集及编辑层次数据的优势。
本发明是通过以下技术方案实现:
一种层次结构数据的快速采集方法,其包括如下步骤:
步骤1,以可扩展标记语言XML表示层次结构数据,建立XML文档;
步骤2,将树状控件与编辑框控件进行组合,即在数据采集界面的编辑框控件位置上动态创建树状控件;
且当树状控件失去焦点时,将其销毁,否则保留树状控件;
步骤3,利用事件驱动的解析器SAX或基于树的解析器DOM解析步骤1建立的XML文档,同时将层次结构数据关联属性作为步骤2创建的树状控件节点属性,与相应树状控件节点进行关联,并在树状控件中显示层次结构数据;用户完成层次数据采集后,树状控件将失去焦点并被销毁;
步骤4,当需要修改层次结构数据的采集结果时,通过步骤2、步骤3的方式,在编辑框控件位置上动态创建树状控件,显示层次结构,并自动在树状控件中查找用户此前输入的数值:若检索到相关树状控件节点,则展开该树状控件节点的层次结构,并将录入焦点放置在该树状控件节点供用户进行在位编辑;若未查找到相关树状控件节点,则提示用户并展开树状控件到树状控件的根节点上,供用户导航重新采集层次数据。
作为优选方案,上述层次结构的数据还包括:单一层次结构的数据;利用所述层次结构数据的快速采集方法进行快速处理。
作为优选方案,所述层次结构数据快速处理方法在浏览器/服务器结构B/S的页面,或客户端/服务器结构C/S的对话框中使用。
作为优选方案,所述层次结构数据的快速采集方法在表格中使用。
作为优选方案,所述步骤1中可扩展标记语言XML由记事本程序进行编辑,所述记事本程序包括:Notepad、Writer;或者由XMLSpy进行编辑。
作为优选方案,所述步骤3中树状控件节点属性支持用户自定义的数据结构UDT。
与现有的技术相比,本发明的有益效果是:
本发明可极大地改进用户体验,具体包括以下四个方面:
(1)美化界面布局。通过采集信息时才动态创建树状控件来显示层次数据,可避免将逻辑上紧密相关的层次数据人为分解为多个组合框进行分开显示(做法4),使得用户界面更为简洁,节省了宝贵的屏幕空间(做法1)。
(2)提高操作效率。通过树状控件与编辑框控件的组合,可避免人为将层次结构扁平化为单一层次,从而失去了数据原有的层次结构或次序语义(做法3);也可避免弹出新的页面或窗口(做法2),并实现层次数据的在位编辑,用户从而可减少鼠标移动、点击次数,提高操作效率。
(3)降低出错概率。将层次结构数据及其属性进行关联,可实现两者的统一采集及调整,避免多次操作带来的低效率以及信息不一致(做法5)。
(4)扩大应用范围。在将树状控件与编辑框控件进行组合时,编辑框控件本身既可以在对话框页面中,也可以在列表控件当中。因此,本发明也可应用于表格中层次数据的快速采集。
附图说明
图1为现有技术中层次结构固定显示在数据采集界面图;
图2为现有技术中层次结构固定显示在新弹出的数据采集界面图;
图3为现有技术中层次结构被人为扁平化为单一层次示意图;
图4为现有技术中层次结构被分解成为若干相互关联的单一层次示意图;
图5(a)为现有技术层次结构被分解成为若干相互不关联的单一层次中层次结构数据示意图;
图5(b)为现有技术层次结构被分解成为若干相互不关联的单一层次中层次结构属性示意图;
图6为图5(b)为现有技术层次结构被分解成为若干相互不关联的单一层次中数据编码表示意图;
图7为本发明的层次结构数据的快速采集方法流程图;
图8为本发明的层次结构管理构件的类图;
图9为本发明实施例一、实施例三的层次结构数据及其属性的快速录入示意图;
图10为本发明实施例一的层次数据的快速录入示意图;
图11为本发明实施例二的层次数据的快速录入示意图;
图12为本发明实施例四的人员类别示意图;
图13为本发明实施例四的单一层次数据的快速录入示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图7所示,本发明的层次结构数据的快速采集方法,其包括如下步骤:
(1)层次结构的表示。以可扩展标记语言(XML)对层次结构进行描述,便于层次结构的建立及维护。XML可由Notepad、Writer等记事本程序进行编辑,也可由XMLSpy等专业程序进行编辑;可由IE等浏览器程序进行有效性检查,也可由XMLSpy等专业程序进行有效性检查。
(2)树状控件的动态创建与销毁。将树状控件与编辑框控件进行组合,直接在编辑框控件的位置上创建树状控件,利用事件驱动的解析器(SAX)或基于树的解析器(DOM)解析相关XML文档,在树状控件中显示层次结构的数据;当树状控件失去焦点时,将其销毁。
在具体实现上,甲骨文(Oracle)、微软(Microsoft)、Sun以及许多第三方厂商都提供了XML解析器。本发明基于微软公司提供的XML文档的解析器(msxml3)以及树状控件CTreeCtrl,开发了构件,其类结构如图8所示。
(3)层次结构数据及其关联属性的快速录入。将层次数据关联属性作为树状控件节点属性,与该树状控件节点进行关联,并在树状控件中显示层次结构数据;以便用户通过导航快速采集层次结构数据及其属性。
即用户可快速导航层次结构,选取目标数据;用户可以查询某树状控件节点的特定属性。树状控件节点的属性支持用户自定义的数据结构(UDT)。
首先,在解析XML文档时,将各树状控件节点的属性与树状控件节点进行关联:
AttrRecm_AttrRec[m_nLimits];
m_AttrRec[m_nCount].m_strCode=str;
SetItemData(hItem,(DWORD)&m_AttrRec[m_nCount++]);
其次,展开、折叠层次结构,供用户操作选择目标数据:
再次,获取树状控件中当前树状控件节点的属性:
HTREEITEMhItem=GetSelectedItem();
AttrRec*AttrRec1=(AttrRec*)GetItemData(hItem);
(4)层次结构数据的在位编辑。在编辑框控件位置上动态创建树状控件,显示层次结构,自动在树状控件中查找用户此前输入的数值:若检索到相关树状控件节点,则展开该树状控件节点的层次结构,并将录入焦点放置在该树状控件节点供用户进行在位编辑;若未查找到相关树状控件节点,则提示用户并展开树状控件到树状控件的根节点上,供用户导航重新采集层次数据。
通常,用户在编辑层次结构数据时,会选择当前输入数值的邻近数据。为此,在用户编辑已采集的层次数据时,动态创建、显示该层次结构,在层次结构中查找当前输入数值并将焦点放置在当前的数值上,供用户实现在位编辑(IPE)。处理流程如图11所示。
实施例一:层次结构数据的快速采集
以某管理信息系统中人员职称的采集为例进行说明。
首先,根据需要编写“职称.xml”,并根据需要对各树状控件节点进行了编码,如“教授”的编码为“AAA”,“研究员”的编码为“ABA”,如图9所示。
其次,将树状控件与编辑框控件进行组合,直接在编辑框控件的位置上创建树状控件,在树状控件中显示层次结构的数据,用户可快速导航,选取所需数据,如图10所示。
实施例二:层次结构数据的在位编辑
在用户编辑已采集的层次数据时,动态创建、显示有关该层次结构,在层次结构中查找当前输入数值并将焦点放置在当前的数值上,供用户实现在位编辑(IPE)例如,在人员信息采集程序中修改人员职称信息时,对于人员当前职称为“副教授”,本发明将在树状结构中显示职称的层次结构,并自动检索到“副教授”节点,展开该层次结构,并将焦点放在该树状控件节点上,从而可大大提高操作效率,如图11所示。
实施例三:层次结构数据关联属性的快速录入
将层次数据关联属性作为树状控件节点的属性,与该树状控件节点进行关联;用户可以查询某树状控件节点的特定属性。树状控件节点的属性支持用户自定义的数据结构(UDT)。例如,“职称.xml”根据需要对各树状控件节点进行了编码,如“教授”的编码为“AAA”,“研究员”的编码为“ABA”,同样如图9所示;用户选取“教授”节点时,本发明可自动采集到该树状控件节点对应的属性编码“AAA”。
实施例四:单一层次数据的快速录入
单一层次结构的数据通常采用组合框控件进行管理。本发明将单一层次结构的数据当作一种特殊的层次结构,采用XML文档进行统一管理,从而可方便地实现单一层次数据的快速采集、在位编辑以及关联属性的快速录入。例如,在采集人员的类别信息时,首先根据需要编写“人员类别.xml”,如图12所示。
其次,将树状控件与编辑框控件进行组合,直接在编辑框控件的位置上创建树状控件,在树状控件中显示层次结构的数据,供用户选取所需数据,如图13所示。
除了在上述B/S(浏览器/服务器)结构的页面或C/S(客户端/服务器)结构的对话框中使用外,本发明也可用于在表格中嵌入树状控件,从而支持在EXCEL等电子表格中快速采集及编辑层次结构数据。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种层次结构数据的快速采集方法,其特征在于,包括如下步骤:
步骤1,以可扩展标记语言XML表示层次结构数据,建立XML文档;
步骤2,将树状控件与编辑框控件进行组合,即在数据采集界面的编辑框控件位置上动态创建树状控件;
且当树状控件失去焦点时,将其销毁,否则保留树状控件;
步骤3,利用事件驱动的解析器SAX或基于树的解析器DOM解析步骤1建立的XML文档,同时将层次结构数据关联属性作为步骤2创建的树状控件节点属性,与相应树状控件节点进行关联,并在树状控件中显示层次结构数据;用户完成层次数据采集后,树状控件将失去焦点并被销毁;
步骤4,当需要修改层次结构数据的采集结果时,通过步骤2、步骤3的方式,在编辑框控件位置上动态创建树状控件,显示层次结构,并自动在树状控件中查找用户此前输入的数值:若检索到相关树状控件节点,则展开该树状控件节点的层次结构,并将录入焦点放置在该树状控件节点供用户进行在位编辑;若未查找到相关树状控件节点,则提示用户并展开树状控件到树状控件的根节点上,供用户导航重新采集层次数据。
2.如权利要求1所述的层次结构数据的快速采集方法,其特征在于,
上述层次结构的数据还包括:单一层次结构的数据;利用所述层次结构数据的快速采集方法进行快速处理。
3.如权利要求1所述的层次结构数据的快速采集方法,其特征在于,
所述层次结构数据快速处理方法在浏览器/服务器结构B/S的页面,或客户端/服务器结构C/S的对话框中使用。
4.如权利要求1所述的层次结构数据的快速采集方法,其特征在于,
所述层次结构数据的快速采集方法在表格中使用。
5.如权利要求1所述的层次结构数据的快速采集方法,其特征在于,
所述步骤1中可扩展标记语言XML由记事本程序进行编辑,所述记事本程序包括:Notepad、Writer;或者由XMLSpy进行编辑。
6.如权利要求1所述的层次结构数据的快速采集方法,其特征在于,
所述步骤3中树状控件节点属性支持用户自定义的数据结构UDT。
CN201610147444.7A 2016-03-15 2016-03-15 一种层次结构数据的快速采集方法 Expired - Fee Related CN105824908B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610147444.7A CN105824908B (zh) 2016-03-15 2016-03-15 一种层次结构数据的快速采集方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610147444.7A CN105824908B (zh) 2016-03-15 2016-03-15 一种层次结构数据的快速采集方法

Publications (2)

Publication Number Publication Date
CN105824908A true CN105824908A (zh) 2016-08-03
CN105824908B CN105824908B (zh) 2020-07-24

Family

ID=56987662

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610147444.7A Expired - Fee Related CN105824908B (zh) 2016-03-15 2016-03-15 一种层次结构数据的快速采集方法

Country Status (1)

Country Link
CN (1) CN105824908B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107798101A (zh) * 2017-10-30 2018-03-13 广州市勤思网络科技有限公司 用户自由点选配置的网页数据采集方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050114314A1 (en) * 2003-11-26 2005-05-26 International Business Machines Corporation Index structure for supporting structural XML queries
CN101944027A (zh) * 2010-09-26 2011-01-12 北京神州泰岳软件股份有限公司 一种用户界面生成方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050114314A1 (en) * 2003-11-26 2005-05-26 International Business Machines Corporation Index structure for supporting structural XML queries
CN101944027A (zh) * 2010-09-26 2011-01-12 北京神州泰岳软件股份有限公司 一种用户界面生成方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张茂辉: "基于XML的层次化信息动态管理技术研究", 《中国优秀硕博士学位论文全文数据库(硕士) 信息科技辑》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107798101A (zh) * 2017-10-30 2018-03-13 广州市勤思网络科技有限公司 用户自由点选配置的网页数据采集方法及系统

Also Published As

Publication number Publication date
CN105824908B (zh) 2020-07-24

Similar Documents

Publication Publication Date Title
US11250209B2 (en) Document collaboration and consolidation tools and methods of use
CN101464905B (zh) 一种网页信息抽取的系统及方法
US7581170B2 (en) Visual and interactive wrapper generation, automated information extraction from Web pages, and translation into XML
US8135755B2 (en) Templates in a schema editor
US7219102B2 (en) Method, computer program product, and system converting relational data into hierarchical data structure based upon tagging trees
CN104133772A (zh) 一种自动生成测试数据的方法
Hogue Tree pattern inference and matching for wrapper induction on the World Wide Web
CN102388374A (zh) 存储数据的方法和装置
CN101477549A (zh) 知识库支持下的空间数据库设计方法
CN103605660A (zh) 一种变电站配置描述文件的图形化处理方法
CN104142985A (zh) 一种半自动化的垂直爬虫生成工具及方法
CN113177168B (zh) 一种基于Web元素属性特征的定位方法
CN103514292A (zh) 一种基于小样本半监督学习的网页数据抽取方法
CN108509199A (zh) 自动生成中文注释的方法、装置、设备及存储介质
CN103914488A (zh) 文档的采集、标识、关联、搜索及展现的系统
CN109902142A (zh) 一种基于编辑距离的字符串模糊匹配和查询方法
CN103020283B (zh) 一种基于背景知识的动态重构的语义检索方法
CN104699758A (zh) 一种图文库关联的指挥文书智能生成系统与方法
CN105468366A (zh) 一种基于Qt地面站的智能界面
CN111581212B (zh) 关系型数据库的数据存储方法、系统、服务器和存储介质
CN108766513B (zh) 一种智慧健康医疗数据结构化处理系统
CN105824908A (zh) 一种层次结构数据的快速采集方法
US20090193053A1 (en) Information management system
CN106649219B (zh) 一种通信卫星设计文件自动生成方法
US20080077641A1 (en) System and method for editing contract clauses in static web pages

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20200724

CF01 Termination of patent right due to non-payment of annual fee