CN104428763B - 将结构化及非结构化数据实现在xml文件的方法 - Google Patents

将结构化及非结构化数据实现在xml文件的方法 Download PDF

Info

Publication number
CN104428763B
CN104428763B CN201380036629.5A CN201380036629A CN104428763B CN 104428763 B CN104428763 B CN 104428763B CN 201380036629 A CN201380036629 A CN 201380036629A CN 104428763 B CN104428763 B CN 104428763B
Authority
CN
China
Prior art keywords
data
file
xml file
source
structuring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201380036629.5A
Other languages
English (en)
Other versions
CN104428763A (zh
Inventor
金荣根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Publication of CN104428763A publication Critical patent/CN104428763A/zh
Application granted granted Critical
Publication of CN104428763B publication Critical patent/CN104428763B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • G06F40/154Tree transformation for tree-structured or markup documents, e.g. XSLT, XSL-FO or stylesheets
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • G06F40/143Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/174Form filling; Merging

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

根据本发明的将结构化及非结构化数据实现在XML文件的方法,其特征在于包括:源HTML文件设计步骤,设计具备表单标签的源HTML文件;源XML文件设计步骤,利用使用者定义标签设计结构化的源XML文件;网页表单文件设计步骤,将所述使用者定义标签的绝对路径变量映射至所述源HTML文件从而设计网页表单文件;XSL文件生成步骤,对所述网页表单文件进行XSLT而自动生成XSL文件;数据输入步骤,将结构化数据和非结构化数据输入到所述网页表单文件;新XML文件生成步骤,用输入到所述网页表单文件的结构化数据和非结构化数据置换所述使用者定义标签的绝对路径变量而自动生成新XML文件;及,新XML文件显示步骤,结合所述新XML文件和所述XSL文件而自动显示所述新XML文件的内容。

Description

将结构化及非结构化数据实现在XML文件的方法
技术领域
本发明涉及一种将结构化及非结构化数据(structured and non-structureddata)实现(implementing)在XML文件的方法,涉及利用XML置换技术将存储在数据库(database)的结构化数据和存储在legacy文件的非结构化数据实现在XML文件的方法。
背景技术
因特网(internet)对分布在全世界的许多通信网进行相互连结,连结于因特网的电脑为了相互之间的通信使用叫做TCP/IP(传输控制协议/因特网互联协议,TransmissionControl Protocol/Internet Protocol)的通信协议。
另外,HTML作为万维网(WWW,World Wide Web)上所使用的数据形式之一,是记述超媒体(Hyper Media)文件的方式。其利用叫做SGML(标准通用标记语言,StandardGeneralized Markup Language)的标准化的文件形式定义超文本(hypertext)的逻辑结构,以普通文本(text)文件(file)的形式得到存储。
使用者为了利用像因特网浏览器(Internet Explorer)一样的浏览器(WebBrowser)来浏览特定网页(web page),通常需要输入相应网页的统一资源定位符(URL:Uniform Resource Locator,以下称为URL)的地址。因此,如果使用者不知道相应网页的统一资源定位符的地址,则难以接近目标文件。
因此,需要即使不一一熟知因特网网站(internet site)的URL信息也能在因特网上泛滥的庞大的量的信息中容易找出自己所要的信息的软件,而将所述软件通称为搜索引擎(Search Engine)。
搜索引擎的原理是,将叫做搜索机器人(Robot)或蜘蛛(Spider)程序的一定的搜索程序逛开设于因特网上的多个网站而将预先收集到的网站信息存储在数据库后,当使用者输入特定的搜索词时,在数据库中只将具有与所输入的搜索词一致的内容的网站进行选择并提供。更加详细说明如下,如果搜索引擎从使用者电脑接到关键词输入等搜索要求,则通过CGI(公共网关接口,Common Gateway Interface)来启动蜘蛛程序。
在此,CGI是指网络服务器(web server)和外部程序之间的标准接口(interface),所述网络服务器从设置在使用者电脑的浏览器得到数据的输入,根据所输入的数据使设置在外部的程序运行,从所运行的程序接收运行结果。启动的蜘蛛程序从储存有各种网站(website)的统一资源定位符的地址及信息等的索引(Index)数据库接收搜索结果并变换成HTML形式,以变换的HTML文件形态传送至使用者电脑。
所述搜索引擎在因特网服务开始的初期使用了目录(directory)式搜索方式,所述目录式搜索方式采用如下方式:在搜索引擎侧对各因特网网站和网络(web)文件进行搜索及分类,从而构建为数据库,通过逐渐细化根据使用者的主题搜索或菜单(menu)搜索而已预先设定的主题分类来使接近最终资料得以实现。
但是,随着因万维网的规模日益急剧膨胀而因特网网站的数量激增,靠目录式搜索方式对所要信息的顺畅的搜索不再成为可能。换句话说,相应于急剧膨胀的万维网的规模,搜索引擎所持有的资料也应相应地增加,但是,如现有的搜索引擎一样通过手工作业确认一个网页并将经确认的网页储存于数据库的方式无法赶上万维网成长趋势。
基于所述理由,出现了引入所述搜索机器人的概念而自动将网页进行搜索和索引从而提供搜索服务的搜索引擎。所述搜索引擎使用关键词(搜索词)方式的搜索方法,对使用者输入的搜索词和相关的网上文件均进行搜索而提供给使用者的电脑等,但因所搜索的网络文件的量过多,从而有使用者在所搜索的结果画面中再找出自己所要的内容的不便。
另一方面,XML是可扩展标记语言(eXtensible Markup Language)的缩写,是将来在因特网时代必须使用的下一代因特网文件标准。其在1998年W3C(World Wide WebConsortium,万维网联盟)被指定为因特网标准文件,而XML具有人易于理解且机器易于处理的结构,是克服HTML的表达局限性的同时弥补SGML的缺点而造出来的语言。
至今为止在因特网上作为内容物(contents)的表达语言使用最多的HTML作为表达功能是合适的,但想要再使用或搜索文件时遇到了局限。XML作为解决此问题的下一代因特网语言引人瞩目的理由是因为XML是扩张性、互换性、信息的结构化均可能的语言。
另一方面,现有的因特网上的信息由结构化数据和非结构化数据组成,通常结构化数据储存于数据库而非结构化数据储存于legacy文件。
在此,与储存在数据库中的结构化数据相比,储存在所述legacy文件的非结构化数据有如下问题:其搜索不易,尤其,为了浏览所述legacy文件,应将legacy文件额外下载至客户端计算机(client computer),因此应设置有储存空间和专用阅览器(viewer)。
例如,以韩国申请号第10-1998-0006152号申请的因特网资料搜索及数据库化方法公开了如下内容:只对在因特网的信息中特定领域的资料另外进行数据库化,并能够实现利用所述另外的数据库的商用搜索服务。以韩国申请号第10-2008-0015282号申请的将追加链接(link)信息附加于根据使用者要求的HTML文件的网络浏览(web browsing)系统及网络浏览方法公开了如下内容:选择性地将追加链接信息进一步附加于根据使用者要求从特定网络服务器(web server)所接收并为浏览器(web browser)所解释的HTML文件,从而使使用者方便且有效地实现网上冲浪(web surfing)和搜索。而上述这些申请需要将搜索结果变换成HTML形式而传送至使用者电脑,从而数据搜索的迅速性降低,此外,在将搜索结果接收而变换成HTML形式的过程中产生错误时,有可能显示出不正确的搜索结果,并且,因为无法储存非结构化数据,所以有可能发生上述的各种问题。
发明内容
本发明是为了解决所述问题而发明的,其目的在于提供一种将结构化及非结构化数据实现在XML文件的方法,所述方法不利用文件对象模型(Document Object Model,DOM),而利用XML置换技术将结构化数据及非结构化数据迅速实现在动态的合适的可扩展标记语言(Well Formed XML(eXtensible Markup Language))文件。
为了达到所述目的,根据本发明的将结构化及非结构化数据实现在XML文件的方法,其特征在于包括:源HTML文件设计步骤,设计具备表单标签的源HTML文件;源XML文件设计步骤,利用使用者定义标签设计结构化的源XML文件;网页表单文件设计步骤,将所述使用者定义标签的绝对路径变量映射至所述源HTML文件从而设计网页表单文件;XSL文件生成步骤,对所述网页表单文件进行XSLT而自动生成XSL文件;数据输入步骤,将结构化数据和非结构化数据输入到所述网页表单文件;新XML文件生成步骤,用输入到所述网页表单文件的结构化数据和非结构化数据置换所述使用者定义标签的绝对路径变量而自动生成新XML文件;及,新XML文件显示步骤,结合所述新XML文件和所述XSL文件而自动显示所述新XML文件的内容。
此外,其特征在于:在所述源HTML文件设计步骤中,所述表单标签为数据空着的形式。
此外,其特征在于:在所述源XML文件设计步骤中,所述源XML文件利用XML树形结构将所述使用者定义标签的绝对路径变量储存为使用者定义标签值。
此外,其特征在于:在所述源XML文件设计步骤中,在将作为所述源XML文件的结构数据的一般数据和反复数据标在使用者定义标签值的情况下,为了区分所述一般数据和反复数据用相互不同的标记方式加以区分而进行标记。
此外,其特征在于:在所述源XML文件设计步骤中,当所述源XML文件的结构数据为反复数据时,对所述源XML文件的使用者定义标签而言,将所述反复数据通过用属性(attribute)加以区分来进行标记。
此外,其特征在于:在所述网页表单文件设计步骤中,指定所述表单标签的数据形式的同时映射所述使用者定义标签的绝对路径变量而设计所述网页表单文件。
此外,其特征在于,所述网页表单文件设计步骤包括:结构化数据表单标签设计工程,其设计结构化数据表单标签,所述结构化数据表单标签映射至所述使用者定义标签的绝对路径变量并接收所述结构化数据的输入;及,非结构化数据表单标签设计工程,其设计非结构化数据表单标签,所述非结构化数据表单标签映射至所述使用者定义标签的绝对路径变量并接收所述非结构化数据的输入。
此外,其特征在于:在所述XSL文件生成步骤中,所述XSL文件用所述使用者定义标签的绝对路径变量连结于所述网页表单文件。
此外,其特征在于:在所述XSL文件生成步骤中,在储存所述网页表单文件的情况下,通过在计算机系统上运行的XSL文件自动生成工具自动生成所述XSL文件。
此外,其特征在于:在所述新XML文件生成步骤中,在将结构化数据和非结构化数据输入而储存到所述网页表单文件的情况下,通过在服务器上运行的XML文件自动生成引擎自动生成所述新XML文件。
此外,其特征在于,所述新XML文件生成步骤包括:置换数据格式形成工程,其计算所述结构化数据和非结构化数据的置换数据值而形成置换数据格式;数据映射工程,其相互映射所述源XML文件的绝对路径变量值与所述结构化数据和非结构化数据的置换计算值;及,新XML文件生成工程,其用所述结构化数据和非结构化数据的置换计算值置换所述源XML文件的绝对路径变量值后重新储存而生成新XML文件。
此外,其特征在于:在所述置换数据格式形成工程中,所述置换数据格式包括结构化置换数据格式或非结构化置换数据格式,所述结构化置换数据格式或非结构化置换数据格式分别包括一般置换数据格式或反复置换数据格式。
此外,其特征在于:在所述置换数据格式形成工程中,所述置换数据格式在所述使用者定义标签的绝对路径变量和绝对路径变量值之间可包括区分所述绝对路径变量和绝对路径变量值的变量分隔符。
此外,其特征在于:在所述置换数据格式形成工程中,所述绝对路径变量值为所述结构化数据和非结构化数据的置换计算值。
并且,其特征在于:在所述置换数据格式形成工程中,所述置换数据格式在所述绝对路径变量值的末端包括分隔行(line)的行分隔符。
如上所述,根据本发明的将结构化及非结构化数据实现在XML文件的方法具有如下效果:不利用文件对象模型,而利用XML置换技术将结构化数据及非结构化数据迅速实现在使用容易的动态的合适的可扩展标记语言文件。
此外,因为根据本发明所生成的XML文件,结构化及非结构化数据的搜索容易,并直接在网页浏览器(Web Browser)显示,所以有不需要客户端的存储空间和专用阅览器(viewer)的效果。
此外,因为根据本发明所生成的XML文件容量小,所以有电力浪费少、下载时间少、因特网流量少的效果。
并且,如果将根据本发明所生成的万维网联盟标准XML文件存储在因特网上的服务器,如中间件(middleware)上,则有适用于直接向各种装置(PC、平板电脑、智能电话、智能TV等)提供服务,从而实现N-Screen用云计算(c loud comput ing)的效果。
附图说明
图1为根据本发明的将结构化及非结构化数据实现在XML文件的方法的框图。
图2为根据本发明的网页表单(Web Form)文件设计步骤的框图。
图3为根据本发明的新XML文件生成步骤的框图。
图4为概略地显示将结构化及非结构化数据置换于根据本发明的源XML文件而生成新XML文件的状况的图。
图5为概略地显示根据本发明将结构化及非结构化数据实现在XML文件的方法的图。
图6为显示根据本发明的源XML文件数据结构的图。
图7为显示根据本发明的网页表单文件的图。
图8为显示表单标签(form tag)的数据形态与源(source)的图,所述表单标签具备在图7的网页表单文件中。
图9为显示将网页表单文件变换为XSL文件的过程的图。
图10为显示根据本发明的XSL文件的结构的图。
图11为显示包括于图10中XSL本体(Body)的结构化数据及非结构化数据的图。
图12为显示根据本发明的XSL文件的XSL头部(Head)的源代码的图。
图13为显示根据本发明的XSL文件的XSL本体的源代码的图。
图14为显示根据本发明的XSL文件的XSL底部(Bottom)的源代码的图。
图15为显示变换根据本发明的网页表单文件的自我结束标签(Self Close Tag)的过程的图。
图16至图20为显示图7所示的网页表单文件的源变换的例子的图。
图21为置换数据格式的区分图。
图22为显示根据本发明的置换数据格式的图。
图23为显示利用根据本发明的置换数据格式而生成新XML文件的状况的图。
图24为适合于本发明的利用的系统的构成图。
标号说明
S10:源HTML文件设计步骤
S20:源XML文件设计步骤
S30:网页表单文件设计步骤
S31:结构化数据表单标签设计工程
S32:非结构化数据表单标签设计工程
S40:XSL文件生成步骤
S50:数据输入步骤
S60:新XML文件生成步骤
S61:置换数据格式形成工程
S62:数据映射(mapping)工程
S63:新XML文件生成工程
S70:新XML文件显示步骤
具体实施方式
实施发明的最优选方式
下面,参照附图详细说明本发明的实施例。首先,应注意对附图中相同的构成要素或部件尽可能使用相同的参照标号。说明本发明时,为了不模糊本发明的要旨,省略对相关的公知功能或构成的具体说明。
图4为概略地显示将结构化及非结构化数据置换于根据本发明的源XML文件而生成新XML文件的状况的图。
如图4所示,本发明涉及利用XML置换技术将存储在数据库的结构化数据与存储在诸如PDF、DOC、PPT文件等legacy文件的非结构化数据实现(implementing)在动态的合适的可扩展标记语言(Well Formed XML(eXtensible Markup Language))文件的技术,更详细而言涉及用所述结构化数据和非结构化数据的置换计算值置换具有使用者定义的标签(Tag)的XML文件的绝对路径变量(absolute path variable)值而将所述结构化数据和非结构化数据实现于合适的XML文件的方法。
本发明在网页浏览器(Web Browser)上通过已设计的网页表单(web form)文件从使用者接收结构化数据和非结构化数据的输入,将所述结构化数据及非结构化数据与预先定义的源XML文件进行映射(mapping)而置换数据,从而能够迅速自动生成新XML文件,在此,可通过将结构化数据和非结构化数据输入到所述网页表单文件而进行存储的同时运行的XML文件自动生成引擎来生成所述新XML文件。
图1为根据本发明的将结构化及非结构化数据实现在XML文件的方法的框图。
如图1所示,根据本发明的将结构化及非结构化数据实现在XML文件的方法包括源(source)HTML文件设计步骤S10、源XML文件设计步骤S20、网页表单文件设计步骤S30、XSL文件生成步骤S40、数据输入步骤S50、新XML文件生成步骤S60及新XML文件显示步骤S70。
图5为概略地显示根据本发明的将结构化及非结构化数据实现在XML文件的方法的图。
如图5所示,所述源HTML文件设计步骤S10为设计具备表单标签(form tag)的源HTML文件的步骤,所述表单标签为从使用者接收结构化数据和非结构化数据的输入的输入部。
所述源HTML文件设计步骤S10为设计没有数据的空形式的HTML文件的步骤,尤其,所述源HTML文件的表单标签为数据空着的形式,而对所述表单标签可在后述的网页表单文件设计步骤S30指定合适的数据形态。
所述源XML文件设计步骤S20是利用使用者定义标签来设计结构化的源XML文件的步骤。
在所述源XML文件设计步骤S20,所述源XML文件利用XML树形(tree)结构可将所述使用者定义标签的绝对路径变量储存为使用者定义标签值。
如图5所示,所述网页表单文件设计步骤S30是将定义在所述源XML文件的所述使用者定义标签的绝对路径变量映射至所述源HTML文件从而设计网页表单文件的步骤。
在此,所述网页表单文件是当具备在所述源HTML文件的表单标签的数据形式被指定时与所述使用者定义标签的绝对路径变量映射的HTM文件,所述网页表单文件通过所述表单标签可接收结构化的结构化数据和反复的非结构化数据的输入。
如图5所示,所述XSL文件生成步骤S40是对所述网页表单文件进行XSLT而自动生成XSL文件的步骤。
在此,所述XSL文件可用所述使用者定义标签的绝对路径变量连结于所述网页表单文件,当使用者对所述网页表单文件进行设计而储存时,如上所述,可通过作为计算机系统上运行的XSL文件自动生成工具的Xstyler工具(tool)自动生成。
所述数据输入步骤S50是将结构化数据和非结构化数据输入到所述网页表单文件的步骤。
具体而言,在所述数据输入步骤S50,可在网页浏览器(Web Browser)可打开所述网页表单文件,使用者为了生成新XML文件,可将结构化数据和非结构化数据分别输入到具备在所述网页表单文件的结构化数据表单标签和非结构化数据表单标签。
如图5所示,所述新XML文件生成步骤S60是用输入到所述网页表单文件的结构化数据和非结构化数据置换所述使用者定义标签的绝对路径变量而自动生成新XML文件的步骤。
在所述新XML文件生成步骤S60,使用者在网页浏览器(Web Browser)上将所述结构化数据和非结构化数据分别输入而储存到所述网页表单文件的情况下,通过在服务器(server)上运行的XML文件自动生成引擎可自动生成所述新XML文件。当然,在此,所述XML文件自动生成引擎可在使用者使用的计算机系统上运行。
如图5所示,所述新XML文件显示步骤S70是结合所述新XML文件和所述XSL文件而自动显示所述新XML文件的内容的步骤。
换句话说,在所述新XML文件显示步骤S70,能够将在所述新XML文件生成步骤S60中所生成的新XML文件和在所述XSL文件生成步骤S40中所生成的XSL文件相互结合而将所述新XML文件的内容用包括网页表单文件的各种HTML文件显示给使用者,在此,包括在所述新XML文件的非结构化数据通过变换规则变换而显示为所述HTML文件的内容。
实施发明的方式
下面,参照附图详细说明本发明的实施例。首先,应注意对附图中相同的构成要素或部件尽可能使用相同的参照标号。说明本发明时,为了不模糊本发明的要旨,省略对相关的公知功能或构成的具体说明。
图4为概略地显示将结构化及非结构化数据置换于根据本发明的源XML文件而生成新XML文件的状况的图。
如图4所示,本发明涉及利用XML置换技术将存储在数据库的结构化数据与存储在诸如PDF、DOC、PPT文件等legacy文件的非结构化数据实现在动态的合适的可扩展标记语言(Well Formed XML(eXtensible Markup Language))文件的技术,更详细而言涉及用所述结构化数据和非结构化数据的置换计算值置换具有使用者定义的标签(Tag)的XML文件的绝对路径变量值,而将所述结构化数据和非结构化数据实现在合适的XML文件的方法。
本发明在网页浏览器(Web Browser)上通过已设计的网页表单文件从使用者接收结构化数据和非结构化数据的输入,将所述结构化数据及非结构化数据与预先定义的源XML文件进行映射而置换数据,从而能够迅速自动生成新XML文件,在此,可通过将结构化数据和非结构化数据输入到所述网页表单文件而进行存储的同时运行的XML文件自动生成引擎来生成所述新XML文件。
图1为根据本发明的将结构化及非结构化数据实现在XML文件的方法的框图。
如图1所示,根据本发明的将结构化及非结构化数据实现在XML文件的方法包括源HTML文件设计步骤S10、源XML文件设计步骤S20、网页表单文件设计步骤S30、XSL文件生成步骤S40、数据输入步骤S50、新XML文件生成步骤S60及新XML文件显示步骤S70。
图5为概略地显示根据本发明的将结构化及非结构化数据实现在XML文件的方法的图。
如图5所示,所述源HTML文件设计步骤S10为设计具备表单标签的源HTML文件的步骤,所述表单标签为从使用者接收结构化数据和非结构化数据的输入的输入部。
所述源HTML文件设计步骤S10为设计没有数据的空形式的HTML文件的步骤,尤其,所述源HTML文件的表单标签为数据空着的形式,而对所述表单标签可在后述的网页表单文件设计步骤S30指定合适的数据形态。
具体而言,可通过作为计算机系统上运行的程序的Xstyler工具来设计所述源HTML文件,在本发明中所述Xstyler工具可设计所述源HTML文件、后述的源XML文件及网页表单文件,与此同时,所述Xstyler工具可起对所述网页表单文件进行XSLT而自动生成XSL文件的XSL文件自动生成工具(tool)的作用。
所述源XML文件设计步骤S20是利用使用者定义标签来设计结构化的源XML文件的步骤。
在所述源XML文件设计步骤S20,所述源XML文件利用XML树形结构可将所述使用者定义标签的绝对路径变量储存为使用者定义标签值。
图6为显示根据本发明的源XML文件数据结构的图。
具体而言,在所述源XML文件设计步骤S20,可将具有如图6所示的数据结构的源XML文件做成如下的XML文件,在此,具有子(Child)的标签a、b、c不具有绝对路径变量,而不具有子(Child)的标签a1、a2、a3、b1、b2、b3、c1、c2、c3可具有绝对路径变量。
设计所述源XML文件时,在将作为所述源XML文件的结构数据的一般数据和反复数据标在使用者定义标签值的情况下,为了区分所述一般数据和反复数据可用相互不同的标记方式对其加以区分而进行标记。
具体而言,在将所述一般数据和反复数据标在所述使用者定义标签值的情况下,优选地,对一般数据用“H_”、对反复数据用“H_LIST”通过区分进行标记。
另外,当所述源XML文件的结构数据为反复数据时,就所述源XML文件的使用者定义标签而言,可将所述反复数据通过用属性(attribute)加以区分来进行标记。
具体而言,在所述源XML文件设计步骤S20中,定义所述源XML文件的使用者定义标签时,优选地,将所述反复数据通过用“repeat=“y”的属性区分来进行标记。
下述的表1显示如上所述的、根据在所述源XML文件设计步骤S20中所定义的源XML文件数据种类的使用者定义标签和标签值的例。
表1
数据种类 区分 标签(Tag) 标签值(Tag Value)
一般数据 <a1> H_root/a1
反复数据 repeat="y" <c1 repeat="y"> H_LIST_root/c/c1
如图5所示,所述网页表单文件设计步骤S30是将定义在所述源XML文件的所述使用者定义标签的绝对路径变量映射至所述源HTML文件从而设计网页表单文件的步骤。
在此,所述网页表单文件是当具备在所述源HTML文件的表单标签的数据形式被指定时与所述使用者定义标签的绝对路径变量映射的HTM文件,所述网页表单文件通过所述表单标签可接收结构化的结构化数据和反复的非结构化数据的输入。
图2为根据本发明的网页表单文件设计步骤的框图。
具体而言,如图2所示,所述网页表单文件设计步骤S30可包括结构化数据表单标签设计工程S31和非结构化数据表单标签设计工程S32。
所述结构化数据表单标签设计工程S31是设计接收结构化数据的输入的结构化数据表单标签的工程,所述结构化数据表单标签可映射至定义在所述源XML文件的使用者定义标签的绝对路径变量。
图7为显示根据本发明的网页表单文件的图,图8为显示表单标签的数据形态与源的图,所述表单标签具备在图7的网页表单文件。
在所述结构化数据表单标签设计工程S31可多样地指定具备在所述源HTML文件的表单标签的数据形式。
例如,在网页表单文件设计为具有如图7所示的结构时,所述表单标签,如图8所示,可指定为具有Input Box、Teaxtarea、Checkbox、Radio Button、Select Box、RepeatTable的数据形式,此时与图7所示出的网页表单文件的表单标签进行映射的源XML文件的使用者定义标签值如下。
所述非结构化数据表单标签设计工程S32是设计接收非结构化数据的输入的非结构化数据表单标签的工程,所述非结构化数据表单标签可映射至定义在所述源XML文件的使用者定义标签的绝对路径变量。
通过所述非结构化数据表单标签在后述的数据输入步骤S50输入的反复的非结构化数据通过变换规则变换而存储于所述源XML文件的使用者定义标签值。
下述的表2显示用于将输入到网页表单文件的非结构化数据进行变换而存储于XML标签(Tag)的变换规则。
表2
HTML XML标签(Tag)
< &lt;
> &gt;
&lt; &amp;lt;
&gt; &amp;gt;
& &amp;
&nbsp; &#160;
如图5所示,所述XSL文件生成步骤S40是对所述网页表单文件进行XSLT而自动生成XSL文件的步骤。
在此,所述XSL文件可用所述使用者定义标签的绝对路径变量连结于所述网页表单文件,当使用者对所述网页表单文件进行设计而储存时,如上所述,可通过作为计算机系统上运行的XSL文件自动生成工具的Xstyler工具自动生成所述XSL文件。
图9为显示将网页表单文件变换为XSL文件的过程的图。
具体而言,对所述网页表单文件进行XSLT时,如图9所示,所述XSL文件自动生成工具生成XSL-标部(XSL-Header),此后,分别变换所述网页表单文件的头部(Head)和本体(Body)后,生成XSL-底部(XSL-Bottom),从而自动生成所述XSL文件。
图10为显示根据本发明的XSL文件的结构的图,图11为显示图10的XSL本体所包括的结构化数据及非结构化数据的图。此外,图12为显示根据本发明的XSL文件的XSL头部的源代码的图,图13为显示根据本发明的XSL文件的XSL本体的源代码的图,图14为显示根据本发明的XSL文件的XSL底部的源代码的图。
如此,如图10所示,通过所述XSL文件自动生成工具生成的XSL文件可包括XSL头部(XSL Head)、XSL本体(XSL Body)及XSL底部(XSL Bottom),在此,所述XSL本体如图11所示,可包括结构化的结构化数据和反复的非结构化数据,包括在所述XSL文件的各XSL头部、XSL本体及XSL底部可具有如图12至14所示的源代码。
另一方面,所述XSL文件自动生成工具在变换所述网页表单文件而生成XSL文件的过程中,通过变换规则对包括在网页表单文件的源代码中的自我结束标签(Self CloseTag)进行变换。
下述的表3显示用于变换网页表单文件的自我结束标签的变换规则。
表3
HTML XSL
<BR> <BR/>
<LI> <LI/>
<IMG...> <IMG.../>
<EMBED...> <EMBED.../>
<HR...> <HR.../>
<INPUT...> <INPUT.../>
<RARAM...> <RARAM.../>
<AREA...> <AREA.../>
<LINK...> <LINK.../>
<META...> <META.../>
图15为显示变换根据本发明的网页表单文件的自我结束标签的过程的图,图16至图20为显示图7所示的网页表单文件的源变换的例子的图。
所述XSL文件自动生成工具可用图15所示出的过程变换所述网页表单文件的自我结束标签,在此,如图16至20所示,对具备在所述网页表单文件的各表单标签可进行变换。
所述数据输入步骤S50是将结构化数据和非结构化数据输入到所述网页表单文件的步骤。
具体而言,在所述数据输入步骤S50,可在网页浏览器(Web Browser)打开所述网页表单文件,使用者为了生成新XML文件,将结构化数据和非结构化数据分别输入到具备在所述网页表单文件的结构化数据表单标签和非结构化数据表单标签。
如图5所示,所述新XML文件生成步骤S60是用输入到所述网页表单文件的结构化数据和非结构化数据置换所述使用者定义标签的绝对路径变量而自动生成新XML文件的步骤。
在所述新XML文件生成步骤S60,在使用者在网页浏览器(Web Browser)上将所述结构化数据和非结构化数据分别输入而储存到所述网页表单文件的情况下,通过在服务器上运行的XML文件自动生成引擎自动生成所述新XML文件。当然,在此,所述XML文件自动生成引擎可在使用者使用的计算机系统上运行。
图3为根据本发明的新XML文件生成步骤的框图。
如图3所示,所述新XML文件生成步骤S60可包括置换数据格式(format)形成工程S61、数据映射工程S62及新XML文件生成工程S63。
所述置换数据格式形成工程S61是计算输入到所述网页表单文件的结构化数据和非结构化数据的置换数据值而形成置换数据格式的工程。
图21为置换数据格式的区分图。
如图21所示,在所述置换数据格式形成工程S61,所述置换数据格式可包括用于置换结构化数据的结构化置换数据格式或用于置换非结构化数据的非结构化置换数据格式,在此,所述结构化置换数据格式或非结构化置换数据格式可分别包括用于置换一般数据的一般置换数据格式或用于置换反复数据的反复置换数据格式。
图22为显示根据本发明的置换数据格式的图。
具体而言,如图22所示,所述置换数据格式在所述使用者定义标签的绝对路径变量和绝对路径变量值之间可包括区分所述绝对路径变量和绝对路径变量值的变量分隔符(##^^##)和、在所述绝对路径变量值的末端分隔行(line)的行分隔符(∥^^∥),在此,所述绝对路径变量值可包括所述结构化数据和非结构化数据的置换计算值。
换句话说,例如,所述置换数据格式可区分为如下述表4所示,在此,所述结构化数据和非结构化数据的置换计算值显示为如下述表5所示。
表4
表5
所述数据映射工程S62是相互映射所述源XML文件的绝对路径变量值与所述结构化数据和非结构化数据的置换计算值的工程。
所述新XML文件生成工程S63是用所述结构化数据和非结构化数据的置换计算值置换所述源XML文件的绝对路径变量值后重新储存而生成新XML文件的工程。
图23为显示利用根据本发明的置换数据格式而生成新XML文件的状况的图。
换句话说,在所述新XML文件生成步骤S60,如图23所示,所述XML文件自动生成引擎先计算所述结构化数据和非结构化数据的置换数据值而形成置换数据格式,将所述结构化数据和非结构化数据的置换数据值与所述源XML文件的绝对路径变量值进行相互映射后,重新储存用所述置换计算值置换所述源XML文件的绝对路径变量值的源XML文件,从而可自动生所述成新XML文件。
如图5所示,所述新XML文件显示步骤S70是结合所述新XML文件和所述XSL文件而自动显示所述新XML文件的内容的步骤。
换句话说,在所述新XML文件显示步骤S70,能够将在所述新XML文件生成步骤S60中所生成的新XML文件和在所述XSL文件生成步骤S40中所生成的XSL文件相互结合而将所述新XML文件的内容用包括网页表单文件的各种HTML文件显示给使用者,在此,包括在所述新XML文件的非结构化数据通过变换规则变换而显示为所述HTML文件的内容。
下述的表6显示用于在HTML文件显示存储在XML标签的非结构化数据的变换规则。
表6
XML标签 HTML
&lt; <
&gt; >
&amp;lt; &lt;
&amp;gt; &gt;
&amp; &
&amp;nbsp; &#160;
下面,说明用于执行根据本发明的将结构化及非结构化数据实现在XML文件的方法的系统。
图24为适合于本发明的利用的系统的构成图。
如图24所示,用于执行根据本发明的将结构化及非结构化数据实现在XML文件的方法的系统可包括客户端计算机(client computer)、通过通信网与所述客户端计算机连结的网络服务器(web server)。
在此,所述客户端计算机通过运行Xstyler工具来能够使所述的根据本发明的源HTML文件设计步骤S10、源XML文件设计步骤S20、网页表单文件设计步骤S30及XSL文件生成步骤S40进行,所述Xstyler工具是用于源HTML文件的设计、源XML文件的设计、网页表单文件的设计、与所述网页表单文件联动的XSL文件的生成的程序,当使用者通过所述客户端计算机的输入装置将结构化数据及非结构化数据输入至在网页浏览器(Web Browser)上打开的网页表单文件而储存时,所述网络服务器运行用于生成并显示新XML文件的XML自动生成引擎,从而能够使所述的根据本发明的新XML文件生成步骤S60及新XML文件显示步骤S70进行。
以上,参照附图对根据本发明的结构化及非结构化数据实现在XML文件的方法进行了说明,但本发明并不限定于公开在本说明书的实施例和附图,毋庸置疑,本领域的从业人员在本发明的技术思想的范围内能够进行各种变形。
根据本发明,能够利用XML置换技术将结构化数据及非结构化数据迅速实现为动态的合适的可扩展标记语言文件,因此,能够更有效地应用于计算机应用领域。

Claims (14)

1.一种将结构化及非结构化数据实现在XML文件的方法,其特征在于包括:
源HTML文件设计步骤,设计具备表单标签的源HTML文件;
源XML文件设计步骤,利用使用者定义标签设计结构化的源XML文件;
网页表单文件设计步骤,将所述使用者定义标签的绝对路径变量映射至所述源HTML文件从而设计网页表单文件;
XSL文件生成步骤,对所述网页表单文件进行XSLT而自动生成XSL文件;
数据输入步骤,将结构化数据和非结构化数据输入到所述网页表单文件;
新XML文件生成步骤,从所述结构化的源XML文件用输入到所述网页表单文件的结构化数据和非结构化数据置换所述使用者定义标签的绝对路径变量而自动生成新XML文件;及
新XML文件显示步骤,结合所述新XML文件的内容和所述XSL文件的内容而自动显示所述新XML文件的内容,
所述新XML文件生成步骤包括:
置换数据格式形成工程,为了使得XML文件自动生成引擎用所述结构化数据和非结构化数据置换使用者定义标签的绝对路径变量值,对作为根据变换规则变换的值的置换计算值进行计算,从而形成置换数据格式;
数据映射工程,所述源XML文件自动生成引擎相互映射源XML文件的绝对路径变量值与所述结构化数据和非结构化数据的置换计算值;及
新XML文件生成工程,所述源XML文件自动生成引擎用所述结构化数据和非结构化数据的置换计算值置换所述源XML文件的绝对路径变量值后,重新储存而生成新XML文件。
2.根据权利要求1所述的将结构化及非结构化数据实现在XML文件的方法,其特征在于:在所述源HTML文件设计步骤中,所述表单标签为数据空着的形式。
3.根据权利要求1所述的将结构化及非结构化数据实现在XML文件的方法,其特征在于:在所述源XML文件设计步骤中,所述源XML文件利用XML树形结构将所述使用者定义标签的绝对路径变量储存为使用者定义标签值。
4.根据权利要求1所述的将结构化及非结构化数据实现在XML文件的方法,其特征在于:在所述源XML文件设计步骤中,在将作为所述源XML文件的结构数据的一般数据和反复数据标在使用者定义标签值的情况下,为了区分所述一般数据和反复数据用相互不同的标记方式加以区分而进行标记。
5.根据权利要求1所述的将结构化及非结构化数据实现在XML文件的方法,其特征在于:在所述源XML文件设计步骤中,当所述源XML文件的结构数据为反复数据时,对所述源XML文件的使用者定义标签而言,将所述反复数据通过用属性加以区分来进行标记。
6.根据权利要求1所述的将结构化及非结构化数据实现在XML文件的方法,其特征在于:在所述网页表单文件设计步骤中,指定所述表单标签的数据形式的同时映射所述使用者定义标签的绝对路径变量而设计所述网页表单文件。
7.根据权利要求6所述的将结构化及非结构化数据实现在XML文件的方法,其特征在于,所述网页表单文件设计步骤包括:
结构化数据表单标签设计工程,其设计结构化数据表单标签,所述结构化数据表单标签映射至所述使用者定义标签的绝对路径变量并接收所述结构化数据的输入;及
非结构化数据表单标签设计工程,其设计非结构化数据表单标签,所述非结构化数据表单标签映射至所述使用者定义标签的绝对路径变量并接收所述非结构化数据的输入。
8.根据权利要求1所述的将结构化及非结构化数据实现在XML文件的方法,其特征在于:在所述XSL文件生成步骤中,所述XSL文件用所述使用者定义标签的绝对路径变量连结于所述网页表单文件。
9.根据权利要求1所述的将结构化及非结构化数据实现在XML文件的方法,其特征在于:在所述XSL文件生成步骤中,在储存所述网页表单文件的情况下,通过在计算机系统上运行的XSL文件自动生成工具自动生成所述XSL文件。
10.根据权利要求1所述的将结构化及非结构化数据实现在XML文件的方法,其特征在于:在所述新XML文件生成步骤中,在将结构化数据和非结构化数据输入而储存到所述网页表单文件的情况下,通过在服务器上运行的XML文件自动生成引擎自动生成所述新XML文件。
11.根据权利要求10所述的将结构化及非结构化数据实现在XML文件的方法,其特征在于:在所述置换数据格式形成工程中,所述置换数据格式包括结构化置换数据格式或非结构化置换数据格式,所述结构化置换数据格式或非结构化置换数据格式分别包括一般置换数据格式或反复置换数据格式。
12.根据权利要求11所述的将结构化及非结构化数据实现在XML文件的方法,其特征在于:在所述置换数据格式形成工程中,所述置换数据格式在所述使用者定义标签的绝对路径变量和绝对路径变量值之间包括区分所述绝对路径变量和绝对路径变量值的变量分隔符。
13.根据权利要求12所述的将结构化及非结构化数据实现在XML文件的方法,其特征在于:在所述置换数据格式形成工程中,所述绝对路径变量值为所述结构化数据和非结构化数据的置换计算值。
14.根据权利要求12所述的将结构化及非结构化数据实现在XML文件的方法,其特征在于:在所述置换数据格式形成工程中,所述置换数据格式在所述绝对路径变量值的末端包括分隔行的行分隔符。
CN201380036629.5A 2012-07-12 2013-04-29 将结构化及非结构化数据实现在xml文件的方法 Active CN104428763B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR1020120075954A KR101416712B1 (ko) 2012-07-12 2012-07-12 정형 및 비정형 데이터를 xml 문서에 구현하는 방법
KR10-2012-0075954 2012-07-12
PCT/KR2013/003672 WO2014010819A1 (ko) 2012-07-12 2013-04-29 정형 및 비정형 데이터를 xml 문서에 구현하는 방법

Publications (2)

Publication Number Publication Date
CN104428763A CN104428763A (zh) 2015-03-18
CN104428763B true CN104428763B (zh) 2018-03-16

Family

ID=49916233

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380036629.5A Active CN104428763B (zh) 2012-07-12 2013-04-29 将结构化及非结构化数据实现在xml文件的方法

Country Status (7)

Country Link
US (1) US9626346B2 (zh)
EP (1) EP2874071A4 (zh)
JP (1) JP2015525925A (zh)
KR (1) KR101416712B1 (zh)
CN (1) CN104428763B (zh)
DE (1) DE202013012665U1 (zh)
WO (1) WO2014010819A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150096274A (ko) * 2014-02-14 2015-08-24 삼성전자주식회사 웹 브라우저에서 화상형성장치의 주소록을 활용하는 방법 및 이를 수행하기 위한 화상형성장치
US11113259B2 (en) 2017-08-02 2021-09-07 Tata Consultancy Services Limited Method and system for analyzing unstructured data for compliance enforcement
CN108228542A (zh) * 2017-12-14 2018-06-29 浪潮软件股份有限公司 一种非结构化文本的处理方法及装置
CN109657472B (zh) * 2018-10-11 2023-09-22 平安科技(深圳)有限公司 Sql注入漏洞检测方法、装置、设备及可读存储介质
KR102492262B1 (ko) * 2020-01-07 2023-01-27 주식회사 지오블루랩 Xml 문서 생성 방법 및 이를 구현하는 컴퓨팅 디바이스
KR20220156181A (ko) 2021-05-18 2022-11-25 (주)디엑스테크 전자 펜을 통한 비정형 문서의 기록 내용을 인식하여 데이터베이스화하는 문서 관리방법

Family Cites Families (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6182029B1 (en) * 1996-10-28 2001-01-30 The Trustees Of Columbia University In The City Of New York System and method for language extraction and encoding utilizing the parsing of text data in accordance with domain parameters
JPH11296541A (ja) * 1998-04-14 1999-10-29 Fujitsu Ltd 構造化データ管理システム及び構造化データ管理プログラムを記録したコンピュータ読み取り可能な記録媒体
US6487566B1 (en) * 1998-10-05 2002-11-26 International Business Machines Corporation Transforming documents using pattern matching and a replacement language
US6519597B1 (en) * 1998-10-08 2003-02-11 International Business Machines Corporation Method and apparatus for indexing structured documents with rich data types
US6874146B1 (en) * 1999-06-30 2005-03-29 Unisys Corporation Metadata driven system for effecting extensible data interchange based on universal modeling language (UML), meta object facility (MOF) and extensible markup language (XML) standards
US6763499B1 (en) * 1999-07-26 2004-07-13 Microsoft Corporation Methods and apparatus for parsing extensible markup language (XML) data streams
US6538673B1 (en) * 1999-08-23 2003-03-25 Divine Technology Ventures Method for extracting digests, reformatting, and automatic monitoring of structured online documents based on visual programming of document tree navigation and transformation
US6418448B1 (en) * 1999-12-06 2002-07-09 Shyam Sundar Sarkar Method and apparatus for processing markup language specifications for data and metadata used inside multiple related internet documents to navigate, query and manipulate information from a plurality of object relational databases over the web
US6920607B1 (en) * 1999-12-15 2005-07-19 Microsoft Corp. Methods and systems for dynamically creating user interfaces
US6557043B1 (en) * 1999-12-17 2003-04-29 International Business Machines Corporation Communication of structured document content between 3270 logical units
US6810429B1 (en) * 2000-02-03 2004-10-26 Mitsubishi Electric Research Laboratories, Inc. Enterprise integration system
FR2811782B1 (fr) * 2000-07-12 2003-09-26 Jaxo Europ Systeme de conversion de documents a structure arborescente par parcours selectif de ladite structure
US6606620B1 (en) * 2000-07-24 2003-08-12 International Business Machines Corporation Method and system for classifying semi-structured documents
US6804662B1 (en) * 2000-10-27 2004-10-12 Plumtree Software, Inc. Method and apparatus for query and analysis
US6725231B2 (en) * 2001-03-27 2004-04-20 Koninklijke Philips Electronics N.V. DICOM XML DTD/schema generator
US7500017B2 (en) * 2001-04-19 2009-03-03 Microsoft Corporation Method and system for providing an XML binary format
US6829745B2 (en) * 2001-06-28 2004-12-07 Koninklijke Philips Electronics N.V. Method and system for transforming an XML document to at least one XML document structured according to a subset of a set of XML grammar rules
US6961760B2 (en) * 2001-07-17 2005-11-01 International Business Machines Corporation Transforming data automatically between communications parties in a computing network
US7234105B2 (en) * 2001-09-20 2007-06-19 Sap Ag Methods and systems for providing a document with interactive elements to retrieve information for processing by business applications
US7146564B2 (en) * 2001-12-21 2006-12-05 Xmlcities, Inc. Extensible stylesheet designs using meta-tag and/or associated meta-tag information
US6950985B2 (en) * 2001-12-27 2005-09-27 Koninklijke Philips Electronics, N.V. Specifying DICOM semantic constraints in XML
US20040044961A1 (en) * 2002-08-28 2004-03-04 Leonid Pesenson Method and system for transformation of an extensible markup language document
JP2004280342A (ja) * 2003-03-14 2004-10-07 Dainippon Printing Co Ltd Xml変換システム、方法、プログラムおよび記録媒体
US7275216B2 (en) * 2003-03-24 2007-09-25 Microsoft Corporation System and method for designing electronic forms and hierarchical schemas
JP4133549B2 (ja) * 2003-04-25 2008-08-13 株式会社ジャストシステム 構造化文書ファイル管理装置および構造化文書ファイル管理方法
JP2005004726A (ja) * 2003-05-20 2005-01-06 Victor Co Of Japan Ltd 電子化サービスマニュアル生成方法、付加データ生成方法、電子化サービスマニュアル生成用プログラム、並びに付加データ生成用プログラム
US7168035B1 (en) * 2003-06-11 2007-01-23 Microsoft Corporation Building a view on markup language data through a set of components
US20050010896A1 (en) * 2003-07-07 2005-01-13 International Business Machines Corporation Universal format transformation between relational database management systems and extensible markup language using XML relational transformation
US7334187B1 (en) * 2003-08-06 2008-02-19 Microsoft Corporation Electronic form aggregation
KR100627587B1 (ko) * 2004-05-14 2006-09-25 김영근 웹브라우저 상에서 xml 문서를 생성하는 방법
KR20060019709A (ko) * 2004-08-30 2006-03-06 주식회사 팬택 엑스엠엘을 기반으로 하는 마크업 언어 변환 방법 및 이를구현한 이동 통신 단말기
US7584268B2 (en) * 2005-02-01 2009-09-01 Google Inc. Collaborative web page authoring
EP1722307A1 (fr) * 2005-05-09 2006-11-15 Amadeus s.a.s Méthode dynamique de génération de documents XML à partir d'une base de données
US8055997B2 (en) * 2006-06-26 2011-11-08 Lexmark International Technology, S.A. System and method for implementing dynamic forms
KR101180929B1 (ko) 2006-08-14 2012-09-07 현대자동차주식회사 차량의 전자제어 스로틀 제어장치 및 방법
US9122664B2 (en) * 2007-10-29 2015-09-01 International Business Machines Corporation Method for automatically creating transforms
JP2009276854A (ja) * 2008-05-12 2009-11-26 Canon Inc 情報処理装置、その制御方法及びプログラム
JP2010282327A (ja) * 2009-06-03 2010-12-16 Nec Corp フォーマット変換システムおよびフォーマット変換方法並びにプログラム
KR20120072045A (ko) * 2010-12-23 2012-07-03 한국전자통신연구원 Xslt 기반의 관리 명령어 변환 방법 및 상호 연동 지원을 위한 통합 게이트웨이 시스템
KR101122629B1 (ko) * 2011-11-18 2012-03-09 김춘기 데이터베이스의 데이터를 변환하여 xml 문서를 생성하는 방법
KR101166763B1 (ko) * 2011-12-02 2012-07-25 김춘기 웹 상에서 xml 문서의 데이터를 데이터베이스에 통합하는 방법

Also Published As

Publication number Publication date
KR20140008798A (ko) 2014-01-22
US9626346B2 (en) 2017-04-18
KR101416712B1 (ko) 2014-07-09
JP2015525925A (ja) 2015-09-07
EP2874071A4 (en) 2016-06-01
US20150149887A1 (en) 2015-05-28
WO2014010819A1 (ko) 2014-01-16
CN104428763A (zh) 2015-03-18
EP2874071A1 (en) 2015-05-20
DE202013012665U1 (de) 2018-08-09

Similar Documents

Publication Publication Date Title
CN104428763B (zh) 将结构化及非结构化数据实现在xml文件的方法
KR100461019B1 (ko) 소형 화면 단말기를 위한 웹 컨텐츠 변환 시스템 및 방법
KR101122629B1 (ko) 데이터베이스의 데이터를 변환하여 xml 문서를 생성하는 방법
US7801876B1 (en) Systems and methods for customizing behavior of multiple search engines
Frasincar et al. Specification framework for engineering adaptive web applications
CN102184266A (zh) 一种页面与数据分离的动态wap网站自动生成方法
US10031981B2 (en) Exporting data to web-based applications
US20110219017A1 (en) System and methods for citation database construction and for allowing quick understanding of scientific papers
JP2010282327A (ja) フォーマット変換システムおよびフォーマット変換方法並びにプログラム
Malki et al. Building Semantic Mashup.
EP2711838A1 (en) Documentation parser
JP2007115276A (ja) コンテンツデータ生成処理プログラムおよびコンテンツデータ生成処理プログラム記録媒体
CN103823855B (zh) 面向语义网的中文百科知识组织与集成方法
JP2012059212A (ja) 抽出装置、抽出方法及び抽出プログラム
KR102382850B1 (ko) Xml 웹문서 보안 방법
Habegger et al. Web services for information extraction from the web
KR100509921B1 (ko) 엑스엠엘 문서를 owl문서로 변환시키는 변환 장치 및방법
Han et al. Wike: A web information/knowledge extraction system for web service generation
Frasincar et al. XML-Based Automatic Web Presentation Generation.
Kaur et al. Research on the application of web mining technique based on XML for unstructured web data using LINQ
Al-Obaidy et al. Annotation: an approach for building semantic web library
Hambasan et al. Faceted search for mathematics
US20060123109A1 (en) Method for processing HTTP requests and HTML pages transmitted or received by a navigator to or from at least one web server, and associated server
Tvarozek et al. Reinventing the web browser for the semantic web
CN102567404A (zh) 一种wap网站在线网页转换方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant