CN100489862C - 标记性语言文档的解析方法、解析模块和用户终端 - Google Patents

标记性语言文档的解析方法、解析模块和用户终端 Download PDF

Info

Publication number
CN100489862C
CN100489862C CNB2007101230566A CN200710123056A CN100489862C CN 100489862 C CN100489862 C CN 100489862C CN B2007101230566 A CNB2007101230566 A CN B2007101230566A CN 200710123056 A CN200710123056 A CN 200710123056A CN 100489862 C CN100489862 C CN 100489862C
Authority
CN
China
Prior art keywords
substring
masurium
label
correspondence
event
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CNB2007101230566A
Other languages
English (en)
Other versions
CN101071446A (zh
Inventor
范颖锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CNB2007101230566A priority Critical patent/CN100489862C/zh
Publication of CN101071446A publication Critical patent/CN101071446A/zh
Application granted granted Critical
Publication of CN100489862C publication Critical patent/CN100489862C/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明涉及计算机技术领域,公开标记性语言文档的解析方法,该方法包括:在读入的文档内容中顺序获取起始字符为标签起始符,终止字符为标签结束符的子字符串;若所获取的子字符串相对于多个指定字符串,满足其中一个指定字符串对应的指定条件,则按照预定义的事件处理方法对所述子字符串中的相应内容进行处理。本发明还公开相应的解析模块和用户终端。本发明实施例具有节约内存资源,提高解析效率以及较好的扩展性等优点。

Description

标记性语言文档的解析方法、解析模块和用户终端
技术领域
本发明涉及计算机技术领域,尤其涉及标记性语言文档的解析技术。
背景技术
可扩展标记语言(eXtensible Markup Language,简称XML)是由万维网协会(World Wide Web Consortium,简称W3C)所定义的一种可以创建自定义标签的标记语言,主要用于定义数据本身的结构和数据类型。
当需要对XML文档中的数据信息进行处理时,必须先对XML文档进行解析,识别出XML文档的结构和其中的数据;现有技术中提供一种基于文档对象模型(Document Object Model,简称DOM)的解析方法,在对XML文档进行解析时,DOM解析器读入整个文档,然后在内存中创建与文档内容对应的对象模型,当解析完成时,内存中会生成与XML文档结构对应的DOM对象树,这样就可以根据树的结构,以节点形式对文档中的数据信息进行处理。
由于使用DOM解析XML文档时,会将整个XML文档解析为一个对象树,并存于内存;当XML文档较大,且只需要解析XML文档中一部分数据时,使用DOM进行文档解析的速度会比较慢,效率较低。
发明内容
本发明的实施例要解决的技术问题是提供一种标记性语言文档解析方法、文档解析模块和用户终端。
为解决上述技术问题,本发明的实施例提供以下技术方案:
一种标记性语言文档的解析方法,包括:
在读入的文档内容中顺序获取起始字符为标签起始符,终止字符为标签结束符的子字符串;
若所获取的子字符串相对于多个指定字符串,满足其中一个指定字符串对应的指定条件,则按照预定义的事件处理方法对所述子字符串中的相应内容进行处理。
一种文档解析模块,包括:
元素获取单元,用于在读入的文档内容中顺序获取起始字符为标签起始符,终止字符为标签结束符的子字符串;
元素处理单元,用于在元素获取单元所获取的子字符串相对于多个指定字符串,满足其中一个指定字符串对应的指定条件时,按照预定义的元素事件处理方法对所述子字符串中的相应内容进行处理。
一种用户终端,包括文档解析模块,所述文档解析模块具体包括:
元素获取单元,用于在读入的文档内容中,顺序获取起始字符为标签起始符,终止字符为标签结束符的子字符串;
元素处理单元,用于在元素获取单元所获取的子字符串相对于多个指定字符串,满足其中一个指定字符串对应的指定条件时,按照预定义的事件处理方法对所述子字符串中的相应内容进行处理。
从以上技术方案可以看出,本发明的实施例具有以下优点:
一、节约内存资源,提高解析效率:本发明实施例是在读入文档的过程中即对文档进行解析,不需要将整个文档先读入内存,而现有技术中,使用DOM解析文档时,需要先将整个文档读入内存,因此与现有技术相比,本发明实施例可以节约内存资源;此外,由于在读入文档的过程中即对文档进行解析,因此,解析模块在只接收到一部分文档时,也可以进行解析,而使用DOM解析文档时,需要将整个文档读入内存后才可以进行解析,也就是说,解析模块只有在获得完整的文档后,才能开始处理,因此,与现有技术相比,本发明实施例可以提高解析效率;
二、较好的扩展性:随着XML、WML、HTML等标准的进一步发展,可能不断扩展出新的元素、属性等,在本发明实施例中,对于所获取的子字符串,若相对于已列举的多个指定字符串,满足其中一个指定字符串对应的指定条件,则按照预定义的事件处理方法对所获取的字符串中的相应内容进行处理;当需要将加入对新的元素、属性等的解析时,只需要参照对其他字符串的处理,在将所扩展的新的元素、属性等内容的相关字符串增加到列举部分,而不用对已经定义的事件处理方法进行修改,实现起来较为简单,因此,本发明实施例具有较好的扩展性。
附图说明
图1是本发明标记性语言文档解析方法实施例一的流程图;
图2是本发明文档解析模块实施例的结构图。
具体实施方式
下面以无线标记语言(Wireless Markup Language,简称WML)文档的解析为例,对本发明标记性语言文档解析方法、文档解析模块及用户终端的推荐实施例进行详细说明。
请参考图1本发明标记性语言文档解析方法的实施例一的流程图,包括:
A1、设置剩余字符串的内容为当前读入的文档内容;
A2、在剩余字符串中顺序获取一个起始字符为标签起始符(通常是“<”),终止字符为标签结束符(通常是“>”)的子字符串;
WML是遵循XML规则,主要应用于无线领域的一种标记语言;与XML相同,WML的主要语法也是元素和标签:
元素是符合文档类型定义(DTD)的文档组成部分,可以分为根元素和子元素:根元素是文档中所有其他子元素的父节点,每个WML文档都包含唯一的根元素;根元素的子节点是子元素,子元素可以进一步拥有子节点,其子节点可以是其他子元素或文本;元素可以具有属性,元素的属性包括属性名和对应的属性值;属性值通常需要使用单引号或双引号括起来;当一个元素中包括多个属性时,各属性间通常用空格分隔;
大多数元素的标签是成对出现的,即起始标签和终止标签成对出现,用于规定元素所涵盖的范围,通常情况下,“标签起始符”、“元素名”和“标签终止符”组成起始标签,“标签起始符”、“终止标签标识符”、“元素名”和“标签终止符”组成终止标签,其中,终止标签标识符通常是“/”;例如,字符串“<wml>”即表示元素“wml”的起始标签,其中,符号“<”是标签起始符,“wml”是元素名,而“>”是标签终止符;字符串“</wml>”表示元素“wml”的终止标签,其中,符号“<”是标签起始符,“/”是终止标签标识符,“wml”是元素名,而“>”是标签终止符;
起始标签中还可以包括元素的属性,元素名和属性之间通常用空格分隔;
A3、若所获取的子字符串相对于多个指定字符串,满足其中一个指定字符串对应的指定条件,则按照预定义的事件处理方法对所述子字符串中的相应内容进行处理;
可以预先为元素定义元素事件处理方法,在文档解析过程中遇到元素时,可以按照元素事件处理方法进行响应;
还可以为文档中的文本定义文本事件处理方法,在文档解析过程中遇到文本时,可以按照文本事件处理方法进行响应;
所述的若所获取的子字符串相对于多个指定字符串,满足其中一个指定字符串对应的指定条件,则按照预定义的事件处理方法对所述子字符串中的相应内容进行处理在具体实现时,可以采用以下两种方法:
一种方法是:若所获取的子字符串相对于多个指定元素名,以其中一个指定元素名对应的“标签起始符”和“元素名”为起始字符串,或以对应的“终止标签标识符”、“元素名”和“标签终止符”为终止字符串,则按照预定义的元素开始事件处理方法,或元素终止事件处理方法对所述子字符串中的元素名进行处理;
另外一种方法是:在预置的元素名列表中,查找所获取的子字符串中是否包括其中一个元素名,若查找到,进一步判断所述子字符串是否以所查找到的元素名对应的“标签起始符”和“元素名”为起始字符串,或是否以对应的“终止标签标识符”、“元素名”和“标签终止符”为终止子符串,若是,按照预定义的元素开始事件处理方法,或元素终止事件处理方法对所述子字符串中的元素名进行处理;
A4、将剩余字符串的内容更新为当前读入文档内容中从所获取子字符串之后的部分,判断剩余字符串的首字符是否为标签起始符,若是,则返回执行A2;否则,执行A5;
A5、在剩余字符串中顺序查找一个标签起始符,获取以剩余字符串的首字符为起始字符,以所查找的标签起始符之前的字符为终止字符的子字符串,按照预定义的文本事件处理方法对所获取的子字符串进行处理;
A6、将剩余字符串的内容更新为当前读入文档内容中从所查找的标签起始符开始的部分,重复A2至A5,直到完成对整个WML文档的解析。
本发明标记性语言文档解析方法的实施例二:在本实施例中,主要通过XML简单应用程序接口(Simple API for XML,简称SAX)定义的接口函数,实现对WML文档的解析,包括:
B1、设置剩余字符串的内容为当前读入的文档内容;
B2、在剩余字符串中顺序获取一个起始字符为标签起始符,终止字符为标签结束符的子字符串;
B3、若所获取的子字符串相对于多个指定元素名,以其中一个指定元素名对应的“标签起始符”和“元素名”为起始字符串,或以对应的“终止标签标识符”、“元素名”和“标签终止符”为终止字符串,则按照预定义的元素开始事件处理方法,或元素终止事件处理方法对所述子字符串中的元素名进行处理;
SAX规范为元素和文本定义了以下几类事件:
文档开始事件(startDocument),解析到根元素开始标签时触发该事件;
文档结束事件(endDocument),解析到根元素结束标签时触发该事件;
元素开始事件(startElement),解析到元素开始标签时触发该事件;
元素结束事件(endElement),解析到元素结束标识时触发该事件;
文本事件(character),解析到文本时触发该事件;
可以分别为上述事件定义相应的事件处理方法;还可以进一步定义元素的属性获取方法以及属性处理方法;
在WML文件中,根元素开始标签是<wml>,根元素结束标签是</wml>,因此,若判断subString是以“<wml”为起始字符串,可以依次触发文档开始事件和元素开始事件,在触发元素开始事件时,将“wml”作为参数传递过去,按照已经定义的元素开始事件处理方法对wml开始标签进行处理;若判断subString是以“/wml>”为终止字符串,可以依次触发元素终止事件和文档终止事件,在触发元素终止事件时,将“wml”作为参数传递过去,按照已经定义的元素终止事件处理方法对wml终止标签进行处理;
另外,若subString以某一元素对应的“标签起始符”和“元素名”为起始字符串,可以进一步按照预定义的属性获取方法判断subString中是否包括元素属性,在判断结果为是时获取元素属性,并将获取的元素属性作为参数传递给元素开始事件,按照已经定义的属性处理方法对所述元素属性进行处理;
可参考以下的代码示例:
startDocument(){
   ...... //具体定义文档开始事件处理方法
}
startElement(parameter1,parameter2,parameter3,parameter4){
   ...... //具体定义元素开始事件处理方法,还可以进一步定义属性处理方法
}
endElement(parameter1,parameter2,parameter3){
   ...... //具体定义元素结束事件处理方法
}
endDocument(){
   ...... //具体定义文档结束事件处理方法
}
//主程序
main(){
……
if(subString.startsWith(″<wml″){//判断subString的起始字符是否为<wml
   defaulthandler.startDocument();//触发文档开始事件
   elementAttributes=parseGetAttributes(subString);//获取元素属性
   defaulthandler.startElement(namespaceURI,localName,″wml″,elementAttributes);
      //触发文档开始事件,以wml为参数
}
else if(subString.startsWith(″<head″){//判断subString的起始字符是否为<head
   elementAttributes=parseGetAttributes(subString);//获取元素属性
   defaulthandler.startElement(namespaceURI,localName,″head″,elementAttributes);
     //触发元素开始事件,以head和获取的元素属性为参数
}
……
else if(subString.endsWith(″/head>″){//判断subString的起始字符是否为/head>
   defaulthandler.endElement(namespaceURI,localName,″head″);
      //触发元素结束事件,以head为参数
}
else if(subString.endsWith(″/wml>″){//判断subString的起始字符是否为/wml>
   defaulthandler.endElement(namespaceURI,localName,″wml″);
      //触发元素结束事件,以wml为参数
   defaulthandler.endDocument();∥触发文档结束事件
}
……
}
B4将剩余字符串的内容更新为当前读入文档内容中从所获取子字符串之后的部分,判断剩余字符串的首字符是否为标签起始符,若是,则返回执行B2;否则,执行B5;
B5、在剩余字符串中顺序查找一个标签起始符,获取以剩余字符串的首字符为起始字符,以所查找的标签起始符之前的字符为终止字符的子字符串,按照已经定义的文本事件处理方法对所获取的子字符串进行处理;
B6、将剩余字符串的内容更新为当前读入文档内容中从所查找的标签起始符开始的部分,重复B2至B5,直到完成对整个WML文档的解析。
本发明标记性语言文档解析方法的实施例三;本实施例与实施例二类似,区别之处在于,将B3改为:
B3′、在预置的元素名列表中,查找所获取的子字符串中是否包括其中一个元素名,若查找到,进一步判断所述子字符串是否以所查找到的元素名对应的“标签起始符”和“元素名”为起始字符串,或是否以对应的“终止标签标识符”、“元素名”和“标签终止符”为终止子符串,若是,触发元素开始事件,或元素终止事件,将对应的元素名作为参数传递过去,按照预定义的元素开始事件处理方法,或元素终止事件处理方法对所述子字符串中的元素名进行处理。
值得说明的是,本发明文档解析方法各实施例可以自然推广应用于XML、超文本标记语言(HyperText Markup Language,简称HTML)等标记性语言文档的解析。
本发明还提供一种文档解析模块,参考图2,包括元素获取单元210、元素处理单元220、文本获取单元230和文本处理单元240:
元素获取单元210用于在读入的文档内容中,顺序获取起始字符为标签起始符,终止字符为标签结束符的子字符串;
元素处理单元220用于在元素获取单元210所获取的子字符串相对于多个指定字符串,满足其中一个指定字符串对应的指定条件时,按照预定义的元素事件处理方法对所述子字符串中的相应内容进行处理;
文本获取单元230用于在读入的文档内容中顺序获取标签结束符和标签起始符之间的子字符串;
文本处理单元240用于按照预定义的事件处理方法对文本获取单元230所获取的子字符串进行处理。
在本发明文档解析模块更多实施例中,所述在所获取的子字符串相对于多个指定字符串,满足其中一个指定字符串对应的指定条件时,按照预定义的事件处理方法对所述子字符串中的相应内容进行处理具体是指::若所获取的子字符串相对于多个指定元素名,以其中一个指定元素名对应的“标签起始符”和“元素名”为起始字符串,或以对应的“终止标签标识符”、“元素名”和“标签终止符”为终止字符串,则按照预定义的元素开始事件处理方法,或元素终止事件处理方法对所述子字符串中的元素名进行处理。
在本发明文档解析模块更多实施例中,所述在所获取的子字符串相对于多个指定字符串,满足其中一个指定字符串对应的指定条件时,按照预定义的事件处理方法对所述子字符串中的相应内容进行处理具体是指:在预置的元素名列表中,查找所获取的子字符串中是否包括其中一个元素名,若查找到,进一步判断所述子字符串是否以所查找到的元素名对应的“标签起始符”和“元素名”为起始字符串,或是否以对应的“终止标签标识符”、“元素名”和“标签终止符”为终止子符串,若是,按照预定义的元素开始事件处理方法,或元素终止事件处理方法对所述子字符串中的元素名进行处理。
本发明还提供一种用户终端,可以包括上述任一文档解析模块实施例中所述的文档解析模块;所述的用户终端的类型包括个人计算机、移动电话、个人数字助理、内容播放器等。
本发明上述实施例中所述的文档解析模块,适用于对HTML、XMI、WML等标记性语言文档进行解析。
以上对本发明实施例所提供的标记性语言文档解析方法、文档解析模块及用户终端进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (11)

1、一种标记性语言文档的解析方法,其特征在于,包括:
在读入的文档内容中顺序获取起始字符为标签起始符,终止字符为标签结束符的子字符串;
若所获取的子字符串相对于多个指定字符串,满足其中一个指定字符串对应的指定条件,则按照预定义的事件处理方法对所述子字符串中的相应内容进行处理。
2、如权利要求1所述的标记性语言文档的解析方法,其特征在于,所述若所获取的子字符串相对于多个指定字符串,满足其中一个指定字符串对应的指定条件,则按照预定义的事件处理方法对所述子字符串中的相应内容进行处理具体包括:
若所获取的子字符串相对于多个指定元素名,以其中一个指定元素名对应的“标签起始符”和“元素名”为起始字符串,或以对应的“终止标签标识符”、“元素名”和“标签终止符”为终止字符串,则按照预定义的元素开始事件处理方法,或元素终止事件处理方法对所述子字符串中的元素名进行处理。
3、如权利要求2所述的标记性语言文档的解析方法,其特征在于,所述若所获取的子字符串相对于多个指定字符串,满足其中一个指定字符串对应的指定条件,则按照预定义的事件处理方法对所述子字符串中的相应内容进行处理进一步还包括:
若所获取的子字符串以其中一个指定元素名对应的“标签起始符”和“元素名”为起始字符串,则进一步按照预定义的属性获取方法判断所述子字符串中是否包括元素属性,在判断结果为是时获取元素属性,并按照预定义的属性处理方法对所获取的元素属性进行处理。
4、如权利要求1所述的标记性语言文档的解析方法,其特征在于,所述若所获取的子字符串相对于多个指定字符串,满足其中一个指定字符串对应的指定条件,则按照预定义的事件处理方法对所述子字符串中的相应内容进行处理具体包括:
在预置的元素名列表中,查找所获取的子字符串中是否包括其中一个元素名,若查找到,则判断所述子字符串是否以所查找到的元素名对应的“标签起始符”和“元素名”为起始字符串,或以对应的“终止标签标识符”、“元素名”和“标签终止符”为终止子符串,若是,按照预定义的元素开始事件处理方法,或元素终止事件处理方法对所述子字符串中的元素名进行处理。
5、一种文档解析模块,其特征在于,包括:
元素获取单元,用于在读入的文档内容中顺序获取起始字符为标签起始符,终止字符为标签结束符的子字符串;
元素处理单元,用于在元素获取单元所获取的子字符串相对于多个指定字符串,满足其中一个指定字符串对应的指定条件时,按照预定义的元素事件处理方法对所述子字符串中的相应内容进行处理。
6、如权利要求5所述的文档解析模块,其特征在于,所述在所获取的子字符串相对于多个指定字符串,满足其中一个指定字符串对应的指定条件时,按照预定义的事件处理方法对所述子字符串中的相应内容进行处理具体是:
若所获取的子字符串相对于多个指定元素名,以其中一个指定元素名对应的“标签起始符”和“元素名”为起始字符串,或以对应的“终止标签标识符”、“元素名”和“标签终止符”为终止字符串,则按照预定义的元素开始事件处理方法,或元素终止事件处理方法对所述子字符串中的元素名进行处理。
7、如权利要求5所述的文档解析模块,其特征在于,所述在所获取的子字符串相对于多个指定字符串,满足其中一个指定字符串对应的指定条件时,按照预定义的事件处理方法对所述子字符串中的相应内容进行处理具体是:
在预置的元素名列表中,查找所获取的子字符串中是否包括其中一个元素名,若查找到,则判断所述子字符串是否以所查找到的元素名对应的“标签起始符”和“元素名”为起始字符串,或是否以对应的“终止标签标识符”、“元素名”和“标签终止符”为终止子符串,若是,按照预定义的元素开始事件处理方法,或元素终止事件处理方法对所述子字符串中的元素名进行处理。
8、一种用户终端,其特征在于,包括文档解析模块,所述文档解析模块具体包括:
元素获取单元,用于在读入的文档内容中,顺序获取起始字符为标签起始符,终止字符为标签结束符的子字符串;
元素处理单元,用于在元素获取单元所获取的子字符串相对于多个指定字符串,满足其中一个指定字符串对应的指定条件时,按照预定义的事件处理方法对所述子字符串中的相应内容进行处理。
9、如权利要求8所述的用户终端,其特征在于,所述在所获取的子字符串相对于多个指定字符串,满足其中一个指定字符串对应的指定条件时,按照预定义的事件处理方法对所述子字符串中的相应内容进行处理具体是:
若所获取的子字符串相对于多个指定元素名,以其中一个指定元素名对应的“标签起始符”和“元素名”为起始字符串,或以对应的“终止标签标识符”、“元素名”和“标签终止符”为终止字符串,则按照预定义的元素开始事件处理方法,或元素终止事件处理方法对所述子字符串中的元素名进行处理。
10、如权利要求8所述的用户终端,其特征在于,所述在所获取的子字符串相对于多个指定字符串,满足其中一个指定字符串对应的指定条件时,按照预定义的事件处理方法对所述子字符串中的相应内容进行处理具体是:
在预置的元素名列表中,查找所获取的子字符串中是否包括其中一个元素名,若查找到,则判断所述子字符串是否以所查找到的元素名对应的“标签起始符”和“元素名”为起始字符串,或是否以对应的“终止标签标识符”、“元素名”和“标签终止符”为终止子符串,若是,按照预定义的元素开始事件处理方法,或元素终止事件处理方法对所述子字符串中的元素名进行处理。
11、如权利要求8至10任一项所述的用户终端,其特征在于,所述用户终端具体是移动电话、个人数字助理、个人计算机或内容播放器。
CNB2007101230566A 2007-06-22 2007-06-22 标记性语言文档的解析方法、解析模块和用户终端 Active CN100489862C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2007101230566A CN100489862C (zh) 2007-06-22 2007-06-22 标记性语言文档的解析方法、解析模块和用户终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2007101230566A CN100489862C (zh) 2007-06-22 2007-06-22 标记性语言文档的解析方法、解析模块和用户终端

Publications (2)

Publication Number Publication Date
CN101071446A CN101071446A (zh) 2007-11-14
CN100489862C true CN100489862C (zh) 2009-05-20

Family

ID=38898669

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2007101230566A Active CN100489862C (zh) 2007-06-22 2007-06-22 标记性语言文档的解析方法、解析模块和用户终端

Country Status (1)

Country Link
CN (1) CN100489862C (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110077138A (zh) * 2019-04-24 2019-08-02 厦门联泰标识信息科技股份有限公司 用于高解析喷码机的多态喷印方法

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101458683B (zh) * 2007-12-14 2011-04-06 安凯(广州)微电子技术有限公司 一种过滤标记语言中非法标签的方法
CN103577578B (zh) * 2012-03-30 2017-04-05 北京奇虎科技有限公司 一种标记文件解析方法和装置
CN102651019B (zh) * 2012-03-30 2013-12-04 北京奇虎科技有限公司 一种标记文件解析方法和装置
CN104753891B (zh) * 2013-12-31 2019-04-05 中国移动通信集团湖南有限公司 一种xml报文解析方法及装置
CN107220034B (zh) * 2016-03-22 2020-10-16 阿里巴巴集团控股有限公司 一种程序代码标记方法及装置
CN108846069B (zh) * 2018-06-07 2022-07-19 创新先进技术有限公司 一种基于标记语言的文档执行方法及装置
CN112740635B (zh) * 2019-02-21 2022-04-05 华为技术有限公司 报文解析的方法、数据发送端、数据接收端和系统
CN112287177B (zh) * 2020-11-25 2021-07-13 城云科技(中国)有限公司 一种创建、变更、显示和查询对象标签的方法和装置
CN114329262B (zh) * 2021-12-20 2022-07-26 江苏云工场信息技术有限公司 一种基于cdn的动态文档生成方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110077138A (zh) * 2019-04-24 2019-08-02 厦门联泰标识信息科技股份有限公司 用于高解析喷码机的多态喷印方法
CN110077138B (zh) * 2019-04-24 2021-02-05 厦门联泰标识信息科技有限公司 用于高解析喷码机的多态喷印方法

Also Published As

Publication number Publication date
CN101071446A (zh) 2007-11-14

Similar Documents

Publication Publication Date Title
CN100489862C (zh) 标记性语言文档的解析方法、解析模块和用户终端
CN101361063B (zh) 支持基于规则的文档内容挖掘的系统与方法
CN101197849B (zh) 将互联网页面转换为无线应用协议页面的转换方法
US20020147748A1 (en) Extensible stylesheet designs using meta-tag information
JP4373721B2 (ja) マークアップ言語文書を符号化するための方法およびシステム
CA2381251A1 (en) System and method for language extraction and encoding
CN100550007C (zh) 基于要素的多个文件的分析系统和方法
CN101520770B (zh) 分析、转换和拆分结构化数据的方法和装置
CN101763255A (zh) 一种专用界面工具的格式转换方法及装置
US7318194B2 (en) Methods and apparatus for representing markup language data
CN102411602B (zh) 一种基于 fpga 实现的xml 并行投机解析方法
Bergholz Extending your markup: An XML tutorial
CN106897287B (zh) 网页发布时间抽取方法和用于网页发布时间抽取的装置
Kucuk et al. Application of metadata concepts to discovery of internet resources
CN1776673A (zh) 一种pdf文档到xml文档转换的方法
CN113297349B (zh) 一种基于知识图谱的ros软件包推荐方法及系统
CN111966930B (zh) 基于XPath序列的网页列表解析方法及系统
CN101876901B (zh) 一种用xml显示网管单盘分块状态的方法
Rousseau et al. Some ideas concerning the Semantic Web
WO2002082326A2 (en) Extensible stylesheet designs using meta-tag information
Šandrih et al. Towards Efficient and Unified XML/JSON Conversion-A New Conversion
US7562295B1 (en) Representing spelling and grammatical error state in an XML document
CN102567404A (zh) 一种wap网站在线网页转换方法及装置
Armstrong Working with XML
KR20020069795A (ko) 공용 문서 원형 정의를 활용하여 마크업 언어를 자유롭게인식할 수 있는 방법 및 그 방법에 의해 기록된 기록매체

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant