JP2001325248A - Document data processor - Google Patents

Document data processor

Info

Publication number
JP2001325248A
JP2001325248A JP2000144947A JP2000144947A JP2001325248A JP 2001325248 A JP2001325248 A JP 2001325248A JP 2000144947 A JP2000144947 A JP 2000144947A JP 2000144947 A JP2000144947 A JP 2000144947A JP 2001325248 A JP2001325248 A JP 2001325248A
Authority
JP
Japan
Prior art keywords
document data
tag
processing
parser
xml
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000144947A
Other languages
Japanese (ja)
Inventor
Nobuo Iwata
伸夫 岩田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2000144947A priority Critical patent/JP2001325248A/en
Publication of JP2001325248A publication Critical patent/JP2001325248A/en
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a document data processor having improved processing efficiency in contrast to a conventional document data processor which has a problem that the processing efficiency is low since the processing of an HTML parser is performed after the processing of an XML parser is performed. SOLUTION: In this document data processor, a CPU 11 reads document data and performs the processing as the XML parser. At the time of detecting a tag which is not an XML tag during the processing of the XML parser, the start tag processing part or end tag processing part of the HTML parser is activated and the pertinent part is processed. Further, at the time of finding the tag related to CDATA or a pre-format, a corresponding processing is performed.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、構造化された文書
データを表示等するための文書データ処理装置に係り、
特にXML(Extensible Markup Language)と、HTM
L(HyperText Markup Langage)との双方に対応可能な
文書データ処理装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a document data processing apparatus for displaying structured document data and the like.
In particular, XML (Extensible Markup Language) and HTM
The present invention relates to a document data processing device capable of supporting both L (HyperText Markup Language).

【0002】[0002]

【従来の技術】近年、インターネットで広く用いられる
文書データの形式としてHTMLと呼ばれるマーク付け
言語がある。HTMLは、SGML(Standard General
ized Markup Language)と呼ばれる、メタ言語文法に準
拠して記述されている。しかし、このSGMLにより記
述された文書の処理は、種々の指定処理が可能であるも
のの、処理が複雑になるため、XMLと呼ばれる簡略化
された言語が策定されつつある。また、このXMLに
は、文書中に文書の属性や特定の処理の対象となるデー
タ(直接表示はされないが処理装置で利用されるデー
タ)を含ませることができる。
2. Description of the Related Art In recent years, there is a markup language called HTML as a format of document data widely used on the Internet. HTML is SGML (Standard General
It is described in accordance with a meta-language grammar called "ized Markup Language". However, in the processing of a document described in SGML, various kinds of designation processing can be performed, but the processing becomes complicated. Therefore, a simplified language called XML is being formulated. In addition, the XML can include attributes of the document and data to be subjected to specific processing (data not directly displayed but used by the processing device) in the document.

【0003】このXMLにより記述された文書データ
は、HTMLと同様に取得されて処理されるのである
が、従来の文書データ処理装置としてのWebブラウザ
を含むパーソナルコンピュータでは、このXMLを直接
処理できないため、取得したXML文書を、HTMLに
変換する処理を行ってから、HTML文書として改めて
処理を行っている。
[0003] Document data described in XML is acquired and processed in the same manner as HTML. However, a personal computer including a Web browser as a conventional document data processing apparatus cannot directly process the XML. After the acquired XML document is converted into HTML, the process is performed again as an HTML document.

【0004】ところで、XMLやSGMLでは、文書フ
ァイル中または文書ファイルから参照される他のファイ
ルにDTD(Data Type Difinition)を設定してシンタ
ックスを宣言し、この宣言に従って文書データの処理を
行わせる。
In XML and SGML, a syntax is declared by setting a DTD (Data Type Definition) in a document file or another file referred to by the document file, and the document data is processed according to the declaration. .

【0005】例えば、SGMLでは、マーク付けのため
のタグ(特定の処理を行わせるべきコンテンツを囲むデ
ータ)をDTDを用いて定義できる。このSGMLで
は、終了を表すタグを省略して記載できるようにDTD
を用いた定義を作成できる。このように終了のタグを省
略した文書データを処理する場合、当該タグに対するコ
ンテンツであるか否かを判別し、そうでないコンテンツ
が見いだされた場合に、終了タグがあったものとして処
理する必要がある。具体的にHTMLの<P>(段落の開
始タグ)は、対応する終了タグ(</P>)を省略できるこ
とをDTDを用いて定義できる。さらにSGMLでは、
文書データ中に必須の開始タグを省略可能と定義するこ
ともできるようになっている。
For example, in SGML, a tag for marking (data surrounding content to be subjected to a specific process) can be defined using DTD. In this SGML, the DTD is used so that the tag indicating the end can be omitted and described.
You can create a definition using When processing document data in which the end tag is omitted in this way, it is necessary to determine whether or not the content is for the tag, and if content that is not found is found, it is necessary to process the content as if there was an end tag. is there. Specifically, <D> (start tag of paragraph) in HTML can be defined by using DTD to omit the corresponding end tag (</ P>). In SGML,
It is also possible to define that a required start tag can be omitted in the document data.

【0006】これに比べ、XMLは、開始タグと終了タ
グの種類が制限されるとともに、コンテンツのタイプも
参照データとタグとの関係でSGMLより限定的に定め
られている。すなわち、SGMLでは、コンテンツ中の
タグや(画像データなどに対する)参照データを処理す
るPCDATA(Parsed Character Data)と、タグを
無視して参照データのみを処理するRCDATA(Rapl
aceable Character Data)と、タグも参照データも単な
る文字列として扱うことができるCDATA(Characte
r Data)との3種類があったが、XMLでは、PCDA
TAのみが利用可能である。ここで、CDATAは、表
示や印刷の目的でなく、JavaScriptによるス
クリプトプログラムの記述に利用されている。
On the other hand, in XML, the types of the start tag and the end tag are restricted, and the type of the content is more limited than the SGML in relation to the reference data and the tag. That is, in SGML, PCDATA (Parsed Character Data) for processing tags and reference data (with respect to image data and the like) in content, and RCDATA (RaplPlatform) for processing only reference data ignoring tags.
ACEable Character Data) and CDATA (Characte) that can handle both tags and reference data as simple character strings.
r Data), but in XML, PCDA
Only TA is available. Here, CDATA is used not for the purpose of display and printing, but for description of a script program in JavaScript.

【0007】このため、従来の文書データ処理装置で
は、XMLとHTMLの双方に対応させるために、XM
Lデータを処理してHTMLデータに変換し、次に変換
後のHTMLデータを処理することとしている。
For this reason, in a conventional document data processing apparatus, in order to support both XML and HTML, an XML
The L data is processed and converted into HTML data, and then the converted HTML data is processed.

【0008】[0008]

【発明が解決しようとする課題】このように、上記従来
の文書データ処理装置では、XMLをHTMLへ変換す
るためにXMLパーザを実行し、さらにこのパーザの処
理結果に基づいてHTMLパーザを実行するので、処理
負荷が大きくなる。また、既存のHTML文書の多く
は、DTD定義が関連づけられていないものが多く、X
MLパーザが正常に動作しない場合がある。さらに、既
存のHTML文書では、終了タグが省略されているもの
が多く、XMLパーザがそのまま正常に処理できないと
いう問題点があった。
As described above, in the conventional document data processing apparatus, an XML parser is executed to convert XML to HTML, and an HTML parser is executed based on the processing result of the parser. Therefore, the processing load increases. In addition, many existing HTML documents do not have a DTD definition associated with them.
The ML parser may not operate properly. Further, in many existing HTML documents, the end tag is omitted in many cases, and there is a problem that the XML parser cannot process normally as it is.

【0009】さらに、近年のHTML文書データには、
JavaScriptのための<SCRIPT>タグや、スタイ
ルシートの指定のための<STYLE>タグ等が設定されてお
り、コンテンツがCDATAとして処理されることが前
提となっているものがある。さらに<PRE>タグと呼ばれ
るタグを用いて、スペースや改行をコンテンツ通りに表
示する手法が用いられたものもある。これらの文書デー
タは、XMLパーザではそのまま正常に処理することが
できない。
Further, recent HTML document data includes:
A <SCRIPT> tag for JavaScript, a <STYLE> tag for designating a style sheet, and the like are set, and some of them are based on the assumption that the content is processed as CDATA. Furthermore, there is a method that uses a tag called a <PRE> tag to display a space or a line feed according to the content. These document data cannot be processed normally by the XML parser.

【0010】本発明は上記実情に鑑みて為されたもの
で、HTML中に混在するXMLデータを正常に処理で
き、かつ処理効率を向上できる文書データ処理装置を提
供することを目的とする。
SUMMARY OF THE INVENTION The present invention has been made in view of the above circumstances, and has as its object to provide a document data processing apparatus capable of normally processing XML data mixed in HTML and improving processing efficiency.

【0011】[0011]

【課題を解決するための手段】上記従来例の問題点を解
決するための請求項1記載の発明は、文書データ処理装
置であって、HTMLにより記述された部分文書データ
とXMLにより記述された部分文書データの少なくとも
一方を含むタグ付き文書データ、を処理する文書データ
処理装置であって、所定の部分文書データをHTML文
書として処理し、出力するHTMLパーザ手段と、処理
対象となったタグ付き文書データを部分文書データごと
に順次解析し、解析の結果に応じて前記HTMLパーザ
手段を起動する動作と、当該解析された部分文書データ
をXML文書として処理する動作とのいずれかを選択的
に行うXMLパーザ手段と、を含むことを特徴としてい
る。
According to a first aspect of the present invention, there is provided a document data processing apparatus, comprising: a partial document data described in HTML and a partial document data described in XML; A document data processing apparatus for processing tagged document data including at least one of partial document data, comprising: HTML parser means for processing and outputting predetermined partial document data as an HTML document; The document data is sequentially analyzed for each partial document data, and an operation of activating the HTML parser means according to a result of the analysis and an operation of processing the analyzed partial document data as an XML document are selectively performed. And an XML parser for performing the processing.

【0012】このXMLパーザ手段により、XMLパー
ザの解析処理中に検出されたHTML部分の文書データ
がHTMLパーザにより処理され、処理効率を向上でき
る。また、上記従来例の問題点を解決するための請求項
2記載の発明は、請求項1記載の文書データ処理装置に
おいて、処理対象となったタグ付き文書データのデータ
型属性を取得する手段と、前記データ型属性に対応付け
て事前に定義されているデフォルトデータ型定義を取得
する手段とを含み、前記XMLパーザ手段が、前記取得
したデフォルトデータ型定義に従って処理を行うことを
特徴としている。これにより、DTD定義が関連づけら
れていない文書データに対してもデフォルトのDTDを
適用でき、正常に文書データを処理できる。
By this XML parsing means, the document data of the HTML portion detected during the parsing of the XML parser is processed by the HTML parser, so that the processing efficiency can be improved. According to a second aspect of the present invention, there is provided a document data processing apparatus, comprising: means for acquiring a data type attribute of tagged document data to be processed; Means for acquiring a default data type definition defined in advance in association with the data type attribute, wherein the XML parser performs processing according to the acquired default data type definition. As a result, the default DTD can be applied to document data to which no DTD definition is associated, and the document data can be processed normally.

【0013】さらに、XMLパーザ手段は、処理対象と
なったタグ付き文書データにXML宣言がない場合にの
み前記取得したデフォルトデータ型定義に従って処理を
行うことも好適である。
Further, it is preferable that the XML parsing means performs the processing according to the acquired default data type definition only when the tagged document data to be processed does not have an XML declaration.

【0014】また、上記従来例の問題点を解決するため
の請求項4記載の発明は、請求項1に記載の文書データ
処理装置であって、処理対象となったタグ付き文書デー
タと、当該文書データに関連づけられたデータ型定義と
を取得する手段と、前記タグ付き文書データのデータ型
属性を取得する手段と、前記データ型属性に対応付けて
事前に定義されているデフォルトデータ型定義を取得す
る手段とを含み、前記XMLパーザ手段が、前記取得し
たデータ型定義とデフォルトデータ型定義とに従って処
理を行うことを特徴としている。
According to a fourth aspect of the present invention, there is provided a document data processing apparatus as set forth in the first aspect, wherein the tagged document data to be processed includes: Means for obtaining a data type definition associated with the document data; means for obtaining a data type attribute of the tagged document data; and a default data type definition previously defined in association with the data type attribute. Acquiring means, wherein the XML parsing means performs processing according to the acquired data type definition and the default data type definition.

【0015】さらに、上記従来例の問題点を解決するた
めの請求項5記載の発明は、請求項1から4のいずれか
に記載の文書データ処理装置において、特殊タグごと
に、当該特殊タグに関連する部分文書データを処理する
パーザ手段と、前記特殊タグの情報と、当該特殊タグに
対応するパーザ手段とを少なくとも一組設定する手段を
含み、前記XMLパーザ手段は、タグ付き文書データを
解析し、当該解析の結果、前記特殊タグを検出すると、
当該特殊タグに対応するパーザ手段を起動することを特
徴としている。
According to a fifth aspect of the present invention, there is provided a document data processing apparatus as set forth in any one of the first to fourth aspects, wherein each special tag is assigned to the special tag. A parser for processing related partial document data; a unit for setting at least one set of information of the special tag and a parser corresponding to the special tag; wherein the XML parser analyzes the tagged document data. When the special tag is detected as a result of the analysis,
It is characterized in that parser means corresponding to the special tag is activated.

【0016】また、ここで前記特殊タグには、少なくと
もCDATAに関連するタグと、プレフォーマットに関
連するタグとのいずれかを含むことが好ましい。
It is preferable that the special tag includes at least one of a tag related to CDATA and a tag related to preformat.

【0017】さらに、上記従来例の問題点を解決するた
めの請求項7記載の発明は、請求項1から6のいずれか
に記載の文書データ処理装置において、さらに、各タグ
ごとの省略可否情報を格納する手段を含み、前記XML
パーザ手段は、省略可能に設定されたタグを検出する
と、タグが省略されているか否かを解析し、当該解析の
結果に基づいてタグが省略されているときには、当該省
略されたタグを補完して文書データを処理することを特
徴としている。これによりタグが省略された文書データ
に対しても正常な処理を行うことができる。
According to a seventh aspect of the present invention, there is provided a document data processing apparatus as set forth in any one of the first to sixth aspects, further comprising information on omission availability of each tag. , Wherein the XML
When the parser detects a tag set to be omissible, the parser analyzes whether or not the tag is omitted. If the tag is omitted based on a result of the analysis, the parser complements the omitted tag. And processing the document data. As a result, normal processing can be performed on document data from which tags have been omitted.

【0018】上記従来例の問題点を解決するための請求
項8記載の発明は、文書データ処理装置であって、第1
のルールで記述された部分文書データと第2のルールに
従って記述された部分文書データの少なくとも一方を含
む文書データ、を処理する文書データ処理装置であっ
て、所定の部分文書データを前記第1のルールに従って
処理し、出力する第1パーザ手段と、処理対象となった
文書データを部分文書データごとに順次解析し、解析の
結果に応じて前記第1パーザ手段を起動する動作と、当
該解析された部分文書データを第2のルールに従って処
理する動作とのいずれかを選択的に行う第2パーザ手段
と、を含むことを特徴としている。
An invention according to claim 8 for solving the problem of the conventional example is a document data processing apparatus, wherein
A document data processing apparatus for processing document data including at least one of partial document data described in accordance with the first rule and partial document data described in accordance with the second rule. A first parser for processing and outputting according to the rules, an operation of sequentially analyzing the document data to be processed for each partial document data, and activating the first parser in accordance with the result of the analysis; And second parser means for selectively performing one of the following operations on the partial document data according to the second rule.

【0019】[0019]

【発明の実施の形態】本発明の実施の形態について図面
を参照しながら説明する。本発明の実施の形態に係る文
書データ処理装置は、パーソナルコンピュータであり、
具体的には図1に示すように、CPU11と、ブートR
OM12と、RAM13と、ハードディスク14と、デ
ィスプレイ15と、操作部16と、LANインタフェー
ス17と、外部記憶装置18とから基本的に構成されて
いる。
Embodiments of the present invention will be described with reference to the drawings. A document data processing device according to an embodiment of the present invention is a personal computer,
Specifically, as shown in FIG.
It basically includes an OM 12, a RAM 13, a hard disk 14, a display 15, an operation unit 16, a LAN interface 17, and an external storage device 18.

【0020】CPU11は、電源投入直後にブートRO
M12に格納されているプログラムをRAM13上にロ
ードして実行する初期化処理を行う。この初期化処理に
より、CPU11は、ハードディスク14に格納された
オペレーティングシステムをRAM13上にロードし、
処理を開始する。そして、CPU11は、操作部16か
ら入力される指示により、文書データの処理を行うブラ
ウザをハードディスク14からRAM13上にロードし
て処理を行う。このブラウザの処理については、後に詳
しく説明する。
The CPU 11 starts the boot RO immediately after the power is turned on.
An initialization process for loading the program stored in M12 onto the RAM 13 and executing the program is performed. By this initialization process, the CPU 11 loads the operating system stored in the hard disk 14 onto the RAM 13 and
Start processing. Then, the CPU 11 loads a browser for processing document data from the hard disk 14 onto the RAM 13 according to an instruction input from the operation unit 16 and performs processing. This browser processing will be described later in detail.

【0021】ブートROM12は、CPU11の初期化
処理に関連するプログラムを格納している。RAM13
は、CPU11のワークメモリとして動作する。ハード
ディスク14は、CPU11が処理する各種プログラム
を格納している。またこのハードディスク14は、CP
U11の処理に必要なデータ(例えば事前に設定された
デフォルトDTD等)を格納している。
The boot ROM 12 stores programs related to the initialization processing of the CPU 11. RAM 13
Operates as a work memory of the CPU 11. The hard disk 14 stores various programs processed by the CPU 11. Also, this hard disk 14 has a CP
Data necessary for the processing of U11 (for example, a default DTD set in advance) is stored.

【0022】ディスプレイ15は、CPU11から入力
される指示により、種々のデータを表示出力する。操作
部16は、キーボードやマウス等であり、ユーザが行う
操作の内容をCPU11に伝達する。LANインタフェ
ース17は、LAN(LocalArea Network)又はインタ
ーネットを経由してWebサーバに接続されており、C
PU11から入力される指示によりネットワークを介し
てデータを送信し、また、ネットワークを介して到来す
るデータを受信してCPU11に出力する。
The display 15 displays and outputs various data according to an instruction input from the CPU 11. The operation unit 16 is a keyboard, a mouse, or the like, and transmits contents of an operation performed by the user to the CPU 11. The LAN interface 17 is connected to a Web server via a LAN (Local Area Network) or the Internet.
According to an instruction input from the PU 11, data is transmitted via the network, and data arriving via the network is received and output to the CPU 11.

【0023】外部記憶装置18は、フロッピー(登録商
標)ディスクや光磁気ディスク等、光学的又は電磁気的
にデータを保持し、コンピュータにより読み取り可能な
記録媒体等からデータを読み出してCPU11に出力す
る。CPU11は、この外部記憶装置18から読み出し
たデータをハードディスク14に処理プログラムとして
インストールする。
The external storage device 18 holds data optically or electromagnetically, such as a floppy (registered trademark) disk or a magneto-optical disk, reads data from a computer-readable recording medium or the like, and outputs the data to the CPU 11. The CPU 11 installs the data read from the external storage device 18 on the hard disk 14 as a processing program.

【0024】ここでCPU11の文書データ処理につい
て説明する。本実施の形態に係るCPU11が処理する
文書データ処理のためのブラウザプログラムは、図2に
示すように、TCP/IPプロトコル解析部21と、X
MLパーズ部22と、HTMLパーズ部23と、ブラウ
ザコア部24と、描画部25とから構成されている。ま
た、HTMLパーズ部23は、プレフォーマット処理部
31と、CDATA処理部32と、開始タグ処理部33
と、終了タグ処理部34とから構成されている。ここ
で、XMLパーズ部22が、本発明のXMLパーザ手段
又は第2パーザ手段に、HTMLパーズ部23が本発明
のHTMLパーザ手段又は第1パーザ手段にそれぞれ相
当している。また、プレフォーマット処理部31とCD
ATA処理部32とが本発明の特殊タグに対応するパー
ザ手段に相当し、プレフォーマット処理すべき文書デー
タは、特殊タグ「<PRE>」に関連づけられ、CDATA
に関連する特殊タグは、「<SCRIPT>」等である。
Here, the document data processing of the CPU 11 will be described. As shown in FIG. 2, a browser program for document data processing processed by the CPU 11 according to the present embodiment includes a TCP / IP
It comprises an ML parse unit 22, an HTML parse unit 23, a browser core unit 24, and a drawing unit 25. The HTML parse unit 23 includes a pre-format processing unit 31, a CDATA processing unit 32, and a start tag processing unit 33.
And an end tag processing unit 34. Here, the XML parse unit 22 corresponds to the XML parser unit or the second parser unit of the present invention, and the HTML parse unit 23 corresponds to the HTML parser unit or the first parser unit of the present invention. Also, the preformat processing unit 31 and the CD
The ATA processing unit 32 corresponds to parser means corresponding to the special tag of the present invention, and the document data to be pre-formatted is associated with the special tag “<PRE>”
Is a special tag such as “<SCRIPT>”.

【0025】TCP/IPプロトコル処理部21は、T
CP/IPプロトコルによってネットワークを経由して
文書データを取得し、XMLパーズ部22に出力する。
ここで、TCP/IPプロトコル処理部21が取得する
文書データは、具体的に図3で示すようなものである。
この図3において、文字「<」と、「>」とで囲まれてい
る部分(例えば先頭の<HTML>)がタグと呼ばれる。ま
た、このタグのうち、「</」で始まるものが終了タグで
あり、そうでないものが開始タグである。図3に示すよ
うに、本実施の形態の文書データ処理装置において想定
している文書データは、開始タグとコンテンツデータと
終了タグとからなる基本構造が入れ子になっているもの
である。すなわち、開始タグ<HTML>と、終了タグ</HTML
>の間のコンテンツには、さらに開始タグ<BODY>と、終
了タグ</BODY>とに囲まれたコンテンツがあり、さら
に、このコンテンツ内にも基本構造が複数含まれてい
る。尚、この図3の文書データにおいては、数多く存在
するHTML文書と同様に、例えば「<BR>」タグに対応
する終了タグが省略されている。
The TCP / IP protocol processing unit 21
The document data is acquired via the network by the CP / IP protocol and output to the XML parse unit 22.
Here, the document data acquired by the TCP / IP protocol processing unit 21 is specifically as shown in FIG.
In FIG. 3, a part (for example, <HTML> at the head) surrounded by characters “<” and “>” is called a tag. In addition, among these tags, those that start with “</” are end tags, and those that do not are start tags. As shown in FIG. 3, the document data assumed in the document data processing apparatus according to the present embodiment has a nested basic structure including a start tag, content data, and an end tag. That is, start tag <HTML> and end tag </ HTML
The content between <> includes content surrounded by a start tag <BODY> and an end tag </ BODY>, and the content also includes a plurality of basic structures. In the document data of FIG. 3, an end tag corresponding to, for example, a “<BR>” tag is omitted, as in the case of a large number of HTML documents.

【0026】また、図3には現れていないが、XMLに
おいては、「/>」で終了するタグは、便宜的に終了タグ
として扱われるのが一般的である。
Although not shown in FIG. 3, in XML, tags ending with "/>" are generally treated as end tags for convenience.

【0027】ここで、CPU11がTCP/IPプロト
コル処理部21で取得した文書データに対して行うXM
Lパーズ部22としての処理を図4を参照して説明す
る。尚、以下の説明において、ハードディスク14に
は、動作パラメータと、デフォルトデータ型定義に相当
するデフォルトDTDとが事前に設定され、格納されて
いるものとする。ここで、動作パラメータとは、図5に
示すように、開始タグ処理部33へのポインタ(A)
と、終了タグ処理部34へのポインタ(B)と、CDA
TA処理部32へのポインタ(C)と、CDATAとし
て処理すべきタグ名の配列(D)と、プレフォーマット
処理部31へのポインタ(E)と、プレフォーマット処
理部31で処理すべきタグ名の配列(F)と、終了タグ
の省略の可否を表すフラグ(G)とを関連づけたもので
あり、デフォルトDTDは、要素宣言と、属性宣言とを
含み、要素宣言は、図6(a)に示すように、識別子
(H)と、タグ名(I)と、タイプ(J)と、開始タグ
及び終了タグの省略可否を表すフラグ(K)と、コンテ
ンツに含まれる可能性のあるタグのリスト(L)とを関
連づけたものである。また、属性宣言は、図6(b)に
示すように、識別子(M)と、タグ名(N)と、属性名
(O)と、属性値のタイプ(P)とを関連づけたもので
あり、属性値タイプが列挙型(enumeration)である場
合には、さらに取りうる値の配列(Q)が関連づけられ
ている。これらの図5及び図6において配列やリスト
は、通常広く知られるように、NULLで配列の終了を
識別することとしている。
Here, the XM which the CPU 11 performs on the document data acquired by the TCP / IP protocol processing unit 21
The processing as the L parse unit 22 will be described with reference to FIG. In the following description, it is assumed that an operation parameter and a default DTD corresponding to a default data type definition are set and stored in the hard disk 14 in advance. Here, the operation parameter is a pointer (A) to the start tag processing unit 33 as shown in FIG.
, A pointer (B) to the end tag processing unit 34, and the CDA
Pointer (C) to TA processing unit 32, array (D) of tag names to be processed as CDATA, pointer (E) to preformat processing unit 31, and tag name to be processed by preformat processing unit 31 (F) is associated with a flag (G) indicating whether or not the end tag can be omitted. The default DTD includes an element declaration and an attribute declaration. As shown in FIG. 5, an identifier (H), a tag name (I), a type (J), a flag (K) indicating whether or not a start tag and an end tag can be omitted, and a tag that may be included in the content. The list (L) is associated with the list (L). As shown in FIG. 6B, the attribute declaration associates an identifier (M), a tag name (N), an attribute name (O), and an attribute value type (P). When the attribute value type is an enumeration, an array of possible values (Q) is further associated. In these FIGS. 5 and 6, the end of the array is identified by NULL, as is generally widely known.

【0028】CPU11は、XMLパーズ部22の処理
として、図4に示すように、まず、動作パラメータをハ
ードディスク14からロードし(S1)、デフォルトD
TDをハードディスク14からロードする(S2)。そ
して、文書データを読込み(S3)、文書データが終了
したか否かを調べ(S4)、終了していれば(Yesな
らば)、処理を終了する。
As shown in FIG. 4, the CPU 11 first loads operation parameters from the hard disk 14 as a process of the XML parse unit 22 (S1).
The TD is loaded from the hard disk 14 (S2). Then, the document data is read (S3), and it is determined whether or not the document data has been completed (S4).

【0029】また、処理S4において、終了していなけ
れば(Noならば)、読み込んだ文書データがXMLタ
グであるか否かを調べる(S5)。ここでXMLタグと
は、「<!」や、「<?」で開始する特別なタグである。こ
のようなタグとして例えば、「<!--」で始まるコメント
などがある。この処理S5において、XMLタグであれ
ば(Yesならば)、XMLタグの処理を実行して(S
6)、処理S3に戻って処理を続ける(A)。一方、X
MLタグでなければ(Noならば)、さらに開始タグで
あるか否かを調べ(S7)、開始タグであれば(Yes
ならば)、当該開始タグのタグ名をキーとしてデフォル
トDTDを参照し、開始タグ処理部33へのポインタを
取得し、読み込んだ文書データを引数として開始タグ処
理部33を起動する(S8)。この開始タグ処理部33
の動作については後述する。
In step S4, if it is not completed (if No), it is checked whether the read document data is an XML tag (S5). Here, the XML tag is a special tag starting with “<!” Or “<?”. Such tags include, for example, comments beginning with "<!-". In this process S5, if the tag is an XML tag (Yes), the process of the XML tag is executed (S5).
6) Return to the process S3 to continue the process (A). On the other hand, X
If it is not an ML tag (if No), it is further checked whether it is a start tag (S7), and if it is a start tag (Yes)
Then, the default DTD is referred to using the tag name of the start tag as a key, a pointer to the start tag processing unit 33 is obtained, and the start tag processing unit 33 is activated using the read document data as an argument (S8). This start tag processing unit 33
The operation of will be described later.

【0030】そして、開始タグ処理部33の処理が完了
すると、CPU11は、XMLパーザの処理を再開し、
処理S8で処理した開始タグがCDATAとして処理す
べきタグであるか否かを動作パラメータを参照して検査
し(S9)、CDATAとして処理すべきタグであれば
(Yesであれば)、CDATA処理部32を起動する
(S10)。CPU11は、このCDATA処理部32
の動作として、対応する終了タグが読み込まれるまでの
間、CDATAとして処理し、木構造に追加する処理を
行う。そして、CDATA処理部32の動作が完了する
と、CPU11は、処理S3に戻ってXMLパーザの処
理を続ける。
When the processing of the start tag processing section 33 is completed, the CPU 11 resumes the processing of the XML parser,
It is checked whether or not the start tag processed in step S8 is a tag to be processed as CDATA with reference to the operation parameter (S9). If the tag is to be processed as CDATA (if Yes), the CDATA processing is performed. The unit 32 is started (S10). The CPU 11 controls the CDATA processing unit 32
As an operation of, processing is performed as CDATA until the corresponding end tag is read, and processing for adding to the tree structure is performed. When the operation of the CDATA processing unit 32 is completed, the CPU 11 returns to the processing S3 and continues the processing of the XML parser.

【0031】一方、処理S9において、CDATAとし
て処理すべきタグでなければ(Noであれば)、さらに
当該開始タグがプレフォーマット処理すべきタグである
か否かを動作パラメータを参照して検査し(S11)、
プレフォーマット処理すべきタグであれば(Yesなら
ば)、プレフォーマット処理部31を起動する(S1
2)。そしてCPU11は、プレフォーマット処理部3
1の処理として、当該タグに対応する終了タグが読み込
まれる間、PCDATAとして木構造に追加する処理を
行う。このプレフォーマット処理部31では、改行コー
ドを検出すると、改行タグ<BR>に置き換える処理を行
う。そして、CPU11は、プレフォーマット処理部3
1の処理が完了すると、処理S3に戻ってXMLパーザ
の処理を続ける。また、処理S11において、プレフォ
ーマット処理すべきタグでなければ、そのまま処理S3
に戻ってXMLパーザの処理を続ける。
On the other hand, in step S9, if the tag is not a tag to be processed as CDATA (if No), it is further checked whether or not the start tag is a tag to be preformatted by referring to the operation parameters. (S11),
If the tag is to be preformatted (Yes), the preformat processing unit 31 is started (S1).
2). Then, the CPU 11 executes the preformat processing unit 3
As a process 1, while the end tag corresponding to the tag is read, a process of adding it to the tree structure as PCDATA is performed. When the pre-format processing unit 31 detects a line feed code, the pre-format processing unit 31 performs a process of replacing the line feed code with a line feed tag <BR>. Then, the CPU 11 executes the preformat processing unit 3
Upon completion of the process 1, the process returns to the process S3 to continue the process of the XML parser. If it is determined in step S11 that the tag is not to be preformatted, the process proceeds to step S3.
And the processing of the XML parser is continued.

【0032】さらに、CPU11は、処理S7におい
て、開始タグでなければ(Noならば)、読み込んだ文
書データが終了タグであるか否かを調べる(S13)。
そして、終了タグであれば(Yesならば)、終了タグ
処理部34を起動し(S14)、終了タグ処理を行い、
処理S3に戻って処理を続ける。ここで、終了タグ処理
部34の処理内容については、後述する。
Further, in step S7, if it is not the start tag (if No), the CPU 11 checks whether or not the read document data is the end tag (S13).
If it is an end tag (if Yes), the end tag processing unit 34 is started (S14), and end tag processing is performed.
The process returns to step S3 and continues. Here, the processing contents of the end tag processing unit 34 will be described later.

【0033】また処理S13において、終了タグでなけ
れば(Noならば)、通常のコンテンツとして処理を行
い(S15)、処理S3に戻って処理を続ける。
In step S13, if the tag is not the end tag (if No), the process is performed as normal content (S15), and the process returns to step S3 to continue the process.

【0034】ここで、CPU11が行う開始タグ処理部
33の動作について説明する。CPU11は、開始タグ
処理部33を読み込まれた文書データを引数として起動
し、まず、読み込まれたタグの要素を木構造の現時点で
ポイントしている要素の1レベル下位に追加し、追加し
た要素を新たに現在の要素としてポイントする。また最
初のタグであれば(木構造がなければ)、この最初のタ
グを木構造の最初のレベル(ルート)として登録し、当
該ルートを現在の要素としてポイントする。
Here, the operation of the start tag processing section 33 performed by the CPU 11 will be described. The CPU 11 activates the start tag processing unit 33 with the read document data as an argument, and first adds the read tag element one level below the element currently pointed to in the tree structure, and adds the added element. Is newly pointed as the current element. If the tag is the first tag (if there is no tree structure), the first tag is registered as the first level (root) of the tree structure, and the root is pointed as the current element.

【0035】具体的に図4に示した文書データに対し、
CPU11は、図7に示す木構造を形成する。すなわ
ち、図4の文書データの1行目の<HTML>を開始タグとし
て認識し、開始タグ処理部33の処理としてこの「HTM
L」を木構造のルートとして設定してポイントし
(X)、次に2行目の<HEAD>をさらに開始タグとして認
識して現在ポイントしている要素(HTML)より1レベル
下位に「HEAD」の要素を追加して(Y)、この「HEAD」
をポイントする。さらに3行目の「TITLE」も開始タグ
であるので、さらに1レベル下位に「TITLE」の要素を
付加し、引き続く「HOME PAGE」をPCDATAとして
付加する(Z)。
Specifically, for the document data shown in FIG.
The CPU 11 forms the tree structure shown in FIG. That is, <HTML> on the first line of the document data in FIG. 4 is recognized as a start tag, and the “HTM
"L" is set as the root of the tree structure and pointed (X), and then <HEAD> on the second line is recognized as a start tag, and "HEAD" is one level lower than the element (HTML) currently pointed to. "Element (Y), and this" HEAD "
To point. Further, since "TITLE" on the third line is also a start tag, an element of "TITLE" is further added one level lower, and the subsequent "HOME PAGE" is added as PCDATA (Z).

【0036】また、ここで、CPU11が行う終了タグ
処理部34の動作について説明する。CPU11は、終
了タグ処理部34を読み込まれた文書データと木構造中
で現在ポイントしている要素とを引数として起動し、X
MLの木構造の要素をHTMLとして解析する処理を行
って、当該要素をHTML文書に変換してRAM13に
格納し、木構造中でポイントしている位置を1レベル上
位に設定して、新たに現在の要素としてポイントする。
具体的に図4及び図7においては、「TITLE」要素に付
加されているPCDATA「HOME PAGE」(Z)の後の
「</TITLE>」を終了タグとして認識し、開始タグ「<TIT
LE>」から終了タグ「</TITLE>」までの基本構造「<TITL
E>HOME PAGE</TITLE>」をHTML文書として解析し、
HTML文書としてRAM13に格納する。そして、
「TITLE」より1レベル上位の「HEAD」(Y)をポイン
トするようにして、終了タグの処理を完了する。このよ
うにして、終了タグ処理部34の処理の結果として得ら
れるHTML文書は、図8に示すように、行構造に変換
されたものとなる。
Here, the operation of the end tag processing unit 34 performed by the CPU 11 will be described. The CPU 11 starts the end tag processing unit 34 with the read document data and the element currently pointed in the tree structure as arguments, and
The element of the ML tree structure is analyzed as HTML, the element is converted into an HTML document and stored in the RAM 13, and the position pointed in the tree structure is set one level higher, and newly created. Points to the current element.
Specifically, in FIGS. 4 and 7, “</ TITLE>” after PCDATA “HOME PAGE” (Z) added to the “TITLE” element is recognized as an end tag, and a start tag “<TITLE” is recognized.
LE>"to the end tag"</TITLE>"
E> HOME PAGE </ TITLE> ”as an HTML document,
It is stored in the RAM 13 as an HTML document. And
The processing of the end tag is completed by pointing to “HEAD” (Y) one level higher than “TITLE”. In this way, the HTML document obtained as a result of the processing of the end tag processing unit 34 is converted into a line structure as shown in FIG.

【0037】さらにCPU11は、XMLパーズ部22
の処理が完了すると、ブラウザコア部24を起動して、
RAM13に格納されたHTML文書(HTML及びX
MLの混在した文書からXMLパーズ部22及びHTM
Lパーザ部23の動作によりHTMLに変換された文
書)を参照し、このHTML文書に基づいて描画部25
に描画の指示を出力する。描画部25は、文書の各行の
絶対座標やサイズ、テキストや画像部分、絶対座標やサ
イズ、テキストに対するフォント、画像を参照する情報
としてのURL(Uniform Resource Locators)等を考
慮して、ディスプレイ15に描画結果としての文書デー
タの内容を表示する。
The CPU 11 further includes an XML parse unit 22
Is completed, the browser core unit 24 is activated,
HTML documents stored in the RAM 13 (HTML and X
XML parse unit 22 and HTM from document with mixed ML
The document is converted to HTML by the operation of the L parser unit 23), and based on the HTML document, the drawing unit 25
To output the drawing instruction. The drawing unit 25 displays the absolute coordinates and size of each line of the document, the text and the image portion, the absolute coordinates and size, the font for the text, the URL (Uniform Resource Locators) as information for referring to the image, and the like. Displays the contents of the document data as a drawing result.

【0038】尚、ここまでの説明においては、デフォル
トDTDを予めロードしているが、XMLタグ処理にお
いて、データ型を宣言するタグである「<!DOCTYPE」が
検出されたときに、当該データ型が特定のもの(例えば
HTML3.2)であったときにのみデフォルトDTD
をロードするようにしてもよい。また、開始タグ処理部
33の動作として、「<HTML>」タグを検出した場合に、
それまでにDTD宣言(「<!DOCTYPE」)を検出してい
ないときにのみ、デフォルトDTDをロードすることと
してもよい。
In the above description, the default DTD is loaded in advance. However, when the tag “<! DOCTYPE” that declares the data type is detected in the XML tag processing, the data type is not loaded. Default DTD only if is a specific one (eg HTML 3.2)
May be loaded. Also, as an operation of the start tag processing unit 33, when the “<HTML>” tag is detected,
The default DTD may be loaded only when the DTD declaration (“<! DOCTYPE”) has not been detected by then.

【0039】さらに、読み込まれた文書データに関連し
て、当該文書データ内部又は当該文書データから参照さ
れるDTDがある場合には、CPU11は、このDTD
をロードして、デフォルトDTDの代わりに、又はデフ
ォルトDTDとともにXMLパーズ部22の処理におい
て利用することも好適である。
Further, if there is a DTD that is referred to in the document data or from the document data in relation to the read document data, the CPU 11 executes the DTD.
Is preferably used in the processing of the XML parse unit 22 in place of the default DTD or together with the default DTD.

【0040】また、動作パラメータにおいて、終了タグ
の省略の可否を表すフラグにより、特定のタグの省略が
可能と設定された場合には、CPU11は、当該開始タ
グを読み込むと、木構造に追加された要素の1つ上位の
要素を取得しておき、ロードされたDTDを参照して、
省略可能であるときには、タイプがEMPTYである
(「/>」で終了するタグである)か、又はEMPTYで
ないが要素宣言中コンテンツに含まれる可能性のあるタ
グのリストにないタグであるときに、終了タグが省略さ
れたものとして終了タグ処理部34を起動する。
When a flag indicating whether or not the end tag can be omitted is set in the operation parameter so that a specific tag can be omitted, the CPU 11 reads the start tag and adds it to the tree structure. The next higher element is obtained, and the loaded DTD is referred to.
When it can be omitted, if the type is EMPTY (a tag ending with "/>") or it is a tag that is not EMPTY but is not in the list of tags that may be included in the content in the element declaration Then, the end tag processing unit 34 is activated assuming that the end tag is omitted.

【0041】また、省略可能でないタグであるときや、
EMPTYでなく、かつ要素宣言中コンテンツに含まれ
る可能性のあるタグのリストにある場合には、当該タグ
を木構造に追加して開始タグ処理部33を起動する。
When the tag cannot be omitted,
If the tag is not EMPTY and is in the list of tags that may be included in the element declaration content, the tag is added to the tree structure and the start tag processing unit 33 is started.

【0042】[0042]

【発明の効果】本発明によれば、XMLパーズ手段が、
必要に応じてHTMLパーズ手段を起動するので、文書
データを効率的に処理できる。
According to the present invention, the XML parse means comprises:
Since the HTML parse means is activated as needed, the document data can be processed efficiently.

【0043】また本発明によれば、デフォルトデータ型
定義が利用されるので、データ型定義に関連づけられて
いない文書データも正常に処理できる。
According to the present invention, since the default data type definition is used, document data not associated with the data type definition can be normally processed.

【0044】さらに、本発明によれば、省略可能なタグ
がある場合に、終了タグを補完して処理するので、タグ
を省略しても正常に処理できる。
Furthermore, according to the present invention, when there is a tag that can be omitted, the end tag is complemented and processed, so that normal processing can be performed even if the tag is omitted.

【図面の簡単な説明】[Brief description of the drawings]

【図1】 本発明の実施の形態に係る文書データ処理装
置の構成ブロック図である。
FIG. 1 is a configuration block diagram of a document data processing device according to an embodiment of the present invention.

【図2】 CPU11が処理するブラウザのソフトウエ
アの構造を表す構成ブロック図である。
FIG. 2 is a configuration block diagram illustrating a structure of browser software processed by a CPU 11;

【図3】 文書データの一例を表す説明図である。FIG. 3 is an explanatory diagram illustrating an example of document data.

【図4】 CPU11のXMLパーザとしての処理を表
すフローチャート図である。
FIG. 4 is a flowchart illustrating a process performed by the CPU 11 as an XML parser.

【図5】 動作パラメータの一例を表す説明図である。FIG. 5 is an explanatory diagram illustrating an example of an operation parameter.

【図6】 DTDの一例を表す説明図である。FIG. 6 is an explanatory diagram illustrating an example of a DTD.

【図7】 木構造の一例を表す説明図である。FIG. 7 is an explanatory diagram illustrating an example of a tree structure.

【図8】 行構造の一例を表す説明図である。FIG. 8 is an explanatory diagram illustrating an example of a row structure.

【符号の説明】[Explanation of symbols]

11 CPU、12 ブートROM、13 RAM、1
4 ハードディスク、15 ディスプレイ、16 操作
部、17 LANインタフェース、18 外部記憶装
置、21 TCP/IPプロトコル解析部、22 XM
Lパーズ部、23HTMLパーズ部、24 ブラウザコ
ア部、25 描画部、31 プレフォーマット処理部、
32 CDATA処理部、33 開始タグ処理部、34
終了タグ処理部。
11 CPU, 12 Boot ROM, 13 RAM, 1
4 hard disk, 15 display, 16 operation unit, 17 LAN interface, 18 external storage device, 21 TCP / IP protocol analysis unit, 22 XM
L parse part, 23 HTML parse part, 24 browser core part, 25 drawing part, 31 pre-format processing part,
32 CDATA processing unit, 33 start tag processing unit, 34
End tag processing unit.

Claims (9)

【特許請求の範囲】[Claims] 【請求項1】 HTMLにより記述された部分文書デー
タとXMLにより記述された部分文書データの少なくと
も一方を含むタグ付き文書データ、 を処理する文書データ処理装置であって、 所定の部分文書データをHTML文書として処理し、出
力するHTMLパーザ手段と、 処理対象となったタグ付き文書データを部分文書データ
ごとに順次解析し、解析の結果に応じて前記HTMLパ
ーザ手段を起動する動作と、当該解析された部分文書デ
ータをXML文書として処理する動作とのいずれかを選
択的に行うXMLパーザ手段と、 を含むことを特徴とする文書データ処理装置。
1. A document data processing apparatus for processing tagged document data including at least one of partial document data described in HTML and partial document data described in XML, wherein predetermined document data is converted to HTML. HTML parser means for processing and outputting as a document, and an operation of sequentially analyzing the tagged document data to be processed for each partial document data, and activating the HTML parser means according to the result of the analysis. XML parser means for selectively performing one of the following: an operation of processing the partial document data as an XML document.
【請求項2】 請求項1に記載の文書データ処理装置で
あって、さらに、 処理対象となったタグ付き文書データのデータ型属性を
取得する手段と、 前記データ型属性に対応付けて事前に定義されているデ
フォルトデータ型定義を取得する手段とを含み、 前記XMLパーザ手段が、前記取得したデフォルトデー
タ型定義に従って処理を行うことを特徴とする文書デー
タ処理装置。
2. The document data processing apparatus according to claim 1, further comprising: means for acquiring a data type attribute of the tagged document data to be processed; Means for acquiring a defined default data type definition, wherein the XML parser performs processing according to the acquired default data type definition.
【請求項3】 請求項2に記載の文書データ処理装置で
あって、 前記XMLパーザ手段は、処理対象となったタグ付き文
書データにXML宣言がない場合にのみ前記取得したデ
フォルトデータ型定義に従って処理を行うことを特徴と
する文書データ処理装置。
3. The document data processing apparatus according to claim 2, wherein the XML parser means according to the acquired default data type definition only when there is no XML declaration in the tagged document data to be processed. A document data processing device for performing processing.
【請求項4】 請求項1に記載の文書データ処理装置で
あって、 処理対象となったタグ付き文書データと、当該文書デー
タに関連づけられたデータ型定義とを取得する手段と、 前記タグ付き文書データのデータ型属性を取得する手段
と、 前記データ型属性に対応付けて事前に定義されているデ
フォルトデータ型定義を取得する手段とを含み、 前記XMLパーザ手段が、前記取得したデータ型定義と
デフォルトデータ型定義とに従って処理を行うことを特
徴とする文書データ処理装置。
4. The document data processing apparatus according to claim 1, wherein: a means for acquiring tagged document data to be processed and a data type definition associated with the document data; Means for acquiring a data type attribute of the document data; and means for acquiring a default data type definition predefined in association with the data type attribute, wherein the XML parser means comprises: And a default data type definition.
【請求項5】 請求項1から4のいずれかに記載の文書
データ処理装置において、 特殊タグごとに、当該特殊タグに関連する部分文書デー
タを処理するパーザ手段と、 前記特殊タグの情報と、当該特殊タグに対応するパーザ
手段とを少なくとも一組設定する手段を含み、 前記XMLパーザ手段は、タグ付き文書データを解析
し、当該解析の結果、前記特殊タグを検出すると、当該
特殊タグに対応するパーザ手段を起動することを特徴と
する文書データ処理装置。
5. The document data processing apparatus according to claim 1, wherein for each special tag, parser means for processing partial document data related to the special tag, information on the special tag, Means for setting at least one set of parser means corresponding to the special tag, wherein the XML parser means analyzes the tagged document data and detects the special tag as a result of the analysis. A document data processing apparatus for activating a parser means for performing the processing.
【請求項6】 請求項5に記載の文書データ処理装置に
おいて、 前記特殊タグには、少なくともCDATAに関連するタ
グと、プレフォーマットに関連するタグとのいずれかを
含むことを特徴とする文書データ処理装置。
6. The document data processing apparatus according to claim 5, wherein the special tag includes at least one of a tag related to CDATA and a tag related to preformat. Processing equipment.
【請求項7】 請求項1から6のいずれかに記載の文書
データ処理装置において、 さらに、各タグごとの省略可否情報を格納する手段を含
み、 前記XMLパーザ手段は、省略可能に設定されたタグを
検出すると、タグが省略されているか否かを解析し、当
該解析の結果に基づいてタグが省略されているときに
は、当該省略されたタグを補完して文書データを処理す
ることを特徴とする文書データ処理装置。
7. The document data processing apparatus according to claim 1, further comprising: means for storing omissibility information for each tag, wherein said XML parser means is set to be omissible. When a tag is detected, it is analyzed whether or not the tag is omitted, and when the tag is omitted based on the result of the analysis, the document data is processed by complementing the omitted tag. Document data processing device.
【請求項8】 第1のルールで記述された部分文書デー
タと第2のルールに従って記述された部分文書データの
少なくとも一方を含む文書データ、 を処理する文書データ処理装置であって、 所定の部分文書データを前記第1のルールに従って処理
し、出力する第1パーザ手段と、 処理対象となった文書データを部分文書データごとに順
次解析し、解析の結果に応じて前記第1パーザ手段を起
動する動作と、当該解析された部分文書データを第2の
ルールに従って処理する動作とのいずれかを選択的に行
う第2パーザ手段と、 を含むことを特徴とする文書データ処理装置。
8. A document data processing apparatus for processing document data including at least one of partial document data described according to a first rule and partial document data described according to a second rule, comprising: A first parser for processing and outputting the document data according to the first rule; and sequentially analyzing the document data to be processed for each partial document data, and activating the first parser according to the result of the analysis. And an operation of selectively processing the analyzed partial document data in accordance with a second rule.
【請求項9】 第1のルールで記述された部分文書デー
タと第2のルールに従って記述された部分文書データの
少なくとも一方を含む文書データ、 を処理する文書データ処理プログラムであって、 所定の部分文書データを前記第1のルールに従って処理
し、出力する第1パーザモジュールと、 処理対象となった文書データを部分文書データごとに順
次解析し、解析の結果に応じて前記第1パーザモジュー
ルを起動する動作と、当該解析された部分文書データを
第2のルールに従って処理する動作とのいずれかを選択
的に行う第2パーザモジュールと、 を含む文書データ処理プログラムを格納したことを特徴
とするコンピュータ読み取り可能な記録媒体。
9. A document data processing program for processing document data including at least one of partial document data described according to a first rule and partial document data described according to a second rule, comprising: A first parser module for processing and outputting document data in accordance with the first rule, and sequentially analyzing document data to be processed for each partial document data, and activating the first parser module in accordance with a result of the analysis And a second parser module for selectively performing one of an operation of processing the analyzed partial document data in accordance with a second rule and a second parser module. A readable recording medium.
JP2000144947A 2000-05-17 2000-05-17 Document data processor Pending JP2001325248A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000144947A JP2001325248A (en) 2000-05-17 2000-05-17 Document data processor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000144947A JP2001325248A (en) 2000-05-17 2000-05-17 Document data processor

Publications (1)

Publication Number Publication Date
JP2001325248A true JP2001325248A (en) 2001-11-22

Family

ID=18651527

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000144947A Pending JP2001325248A (en) 2000-05-17 2000-05-17 Document data processor

Country Status (1)

Country Link
JP (1) JP2001325248A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004049194A1 (en) * 2002-11-26 2004-06-10 Lg Electronics,Inc. Parsing system and method of multi-document based on elements
CN112051998A (en) * 2020-09-03 2020-12-08 中国银行股份有限公司 Configured file analysis method and device

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004049194A1 (en) * 2002-11-26 2004-06-10 Lg Electronics,Inc. Parsing system and method of multi-document based on elements
CN112051998A (en) * 2020-09-03 2020-12-08 中国银行股份有限公司 Configured file analysis method and device
CN112051998B (en) * 2020-09-03 2024-05-24 中国银行股份有限公司 Method and device for analyzing configured file

Similar Documents

Publication Publication Date Title
US6799718B2 (en) Development assistance for mixed-language sources
US7733509B2 (en) Method and apparatus for printing XML directly using a formatting template
US7464329B2 (en) Declarative mechanism for defining a hierarchy of objects
WO2022033055A1 (en) Page rendering method, apparatus, and device, and computer readable storage medium
US20040015782A1 (en) Templating method for automated generation of print product catalogs
GB2382174A (en) Data formatting in a platform independent manner
JP2009134741A (en) Data processing method
US20230419016A1 (en) Visualized Page Rendering Method, Device, Equipment, and Storage Medium
JPH10124495A (en) Original text generation processor and medium for storing program for the same
CN110837347A (en) Webpage printing method based on analysis plug-in, server and storage medium
JP2002278757A (en) Method and device for recognition of grammatical base of user interface object in html application
US20130124969A1 (en) Xml editor within a wysiwyg application
US20060271850A1 (en) Method and apparatus for transforming a printer into an XML printer
CN112463152A (en) Webpage adaptation method and device based on AST
JP4943002B2 (en) Method and system for storing unknown markup in a strongly typed environment
Maler et al. XML pointer language (XPointer)
US8112500B2 (en) Technique of relaying communications between client apparatus and server apparatus
Pohja COMPARISON OF COMMON XML-BASED WEB USER INTERFACE LANGUAGESCOMPARISON OF COMMON XML-BASED WEB USER INTERFACE LANGUAGES
JP2001325248A (en) Document data processor
JP2007094757A (en) Image forming system, image forming method and program
CN113297425B (en) Document conversion method, device, server and storage medium
EP1639482A1 (en) Declarative mechanism for defining a hierarchy of objects
JP2001101036A (en) Method for storing and using log information
JPH11353189A (en) Method and device for implementing tag-based display language using procedure instruction language
US7020683B2 (en) Method, server and system for dynamic server application adjustment