JP2003196269A - マークアップ言語で表わされた文書の解析方法 - Google Patents

マークアップ言語で表わされた文書の解析方法

Info

Publication number
JP2003196269A
JP2003196269A JP2002186189A JP2002186189A JP2003196269A JP 2003196269 A JP2003196269 A JP 2003196269A JP 2002186189 A JP2002186189 A JP 2002186189A JP 2002186189 A JP2002186189 A JP 2002186189A JP 2003196269 A JP2003196269 A JP 2003196269A
Authority
JP
Japan
Prior art keywords
data
attribute
tag
content
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002186189A
Other languages
English (en)
Inventor
Jean Jacques Moreau
モロー ジャンージャック
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of JP2003196269A publication Critical patent/JP2003196269A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/221Parsing markup language streams

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 (修正有) 【課題】マークアップ言語で表された文書を解析する方
法。 【解決手段】長さの属性に関連した特定のタグの使用に
より、コンテント長の属性の値によって与えられる特定
の長さの、特有のデータのブロックとしてパーサに認識
されたデータのセットを、自動的に識別することを可能
とする特別な指示をパーサに与える。これによって、パ
ーサが文字でないデータのセットについて正しく行われ
なかった文字毎の解析をせずに、データセット全体を識
別することが可能になる。そして、データセットを記憶
し、実装されたアプリケーションで後で処理をする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、マークアップ言語
で表わされた文書の解析方法に関する。
【0002】本発明は、そのような文書にデータのセッ
トを組み込む方法、及びそのようにして文書に組み込ま
れたデータのセットを処理する方法にも関する。
【0003】本発明は更に、本発明による上記の解析、
組み込み、及び処理の方法をそれぞれ実施するように構
成された解析装置、組み込み装置、及び処理装置にも関
する。
【0004】概して、本発明は、コンピュータと通信ネ
ットワークと通信している他の装置との間の交換が、X
ML("eXtensible Markup Language")タイプのマーク
アップ言語によって提供される文書及び要求を転送する
ことによって行なわれる、通信ネットワークに適用され
る。
【0005】
【従来の技術】XML言語はマークアップ言語、すなわ
ち、タグによって構成される情報を提供する言語であ
る。文書のページが含み得る情報の基本的項目全てを分
離するために、随意に新たなタグを作り出すことが可能
である。
【0006】このようにあらゆる文字データは、通信ネ
ットワーク上で転送及び処理を可能とするマークアップ
言語で表わされ得る。
【0007】しかしながら、これら文字データとは別
に、他のタイプのデータ、特に、例えばデジタル画像を
表しているバイナリデータを、通信ネットワークで送信
する必要がある場合が頻繁にある。
【0008】この場合は特に、クライアント・コンピュ
ータがネットワークのサーバ・コンピュータに、例え
ば、画像の幾何学的変換などの画像に対する特定の形態
の処理を要求するときに生じる。
【0009】このような場合、クライアント・ステーシ
ョンによって関数のリモート実行の要求がXML言語で
生成され、通信ネットワークを介してサーバ・ステーシ
ョンに転送される。
【0010】
【発明が解決しようとする課題】しかしながら、XML
のようなマークアップ言語は、例えばバイナリデータの
ようなそれ自体がXML言語で符号化されていないデー
タが、文書やXML言語での要求に含まれるのを認めて
いない。
【0011】従って、考えられる技術では、これらデジ
タルデータをサーバ・ステーション宛ての別の要求で送
信する。この技術は付加的遅延を招き、付加的要求がク
ライアント・ステーションで生成されるようにするが、
これは例えばクライアント・ステーションがネットワー
クに断続的なアクセスだけを行う場合には、使用できな
い。これは特に移動電話の場合に該当する。
【0012】別の技術では、バイナリデータをASCI
Iで符号化、すなわちこれらのバイナリデータを、マー
クアップ言語で表された文書に挿入され得る一連の文字
に変換する。この解決策は、実施するのに時間がかか
り、送信すべき元のデータのサイズがかなり大きくなる
という付加的欠点を有している。
【0013】MIMEのような、電子メールにファイル
を添付するのに一般的に使用される通信プロトコルを使
用することも知られている。この技術では、例えば、関
数の実行を要求するXML文書と関連するバイナリデー
タとの端と端をつなぐこととなる。これはまた、実施及
び処理されるデータを実際の処理要求から分離するのが
複雑であるという欠点を有する。処理の時点では、処理
すべきデータにアクセス可能となる前に、XML言語の
文書全体を解析する必要がある。
【0014】本発明の目的は、上述の欠点を克服し、あ
らゆるタイプのデータのセットをマークアップ言語で表
された文書に添付する新たな技術を提供することであ
る。
【0015】
【課題を解決するための手段】本発明の第1の態様によ
れば、マークアップ言語で表された文書の解析方法は、
予め定められたタイプのタグであって、少なくとも1つ
のコンテント長の属性に関連するタグを検出するステッ
プと、前記コンテント長の属性の値を読み取るステップ
と、前記タグに続く、前記読み取った値と等しい長さの
データのセットを自動的に識別するステップと、を備え
ている。
【0016】長さの属性に関連した特定のタグの使用に
より、コンテント長の属性の値によって与えられる特定
の長さの、特有のデータのブロックとしてパーサに認識
されたデータのセットを、自動的に識別するのを可能と
する特別な指示をパーサ(parser;構文解析手段)に与
えることが可能である。
【0017】データのセットの長さをこの予め定められ
たタイプのタグと関連付けることによって、パーサが、
文字でないデータのセットについては正しく行われなか
った文字毎の解析を実行せずに、データのセット全体を
識別することが可能である。
【0018】従って、この予め定められたタイプのタグ
は、マークアップ言語のパーサによって読み取れないデ
ータのセットを無視するようパーサに指示する。
【0019】本発明の好適な特徴によれば、解析方法
は、前記データのセットを記憶するステップを更に備え
ている。
【0020】このためデータのセットを、文書の解析の
後で、実装されたアプリケーションによって後で処理す
るために記憶することが可能である。
【0021】本発明の第1の好適な特徴によれば、前記
タグは更にコンテント・タイプの属性に関連しており、
前記解析方法は、前記コンテント・タイプの属性の値を
読み取るステップと、前記データのセット及び前記コン
テント・タイプの属性の値を記憶するステップと、を備
えている。
【0022】マークアップ言語の文書に組み込まれたデ
ータのタイプの記憶は、パーサ又はアプリケーションに
それらの処理のためにデータのタイプを指示するのを可
能とする。
【0023】本発明の第2の態様によれば、マークアッ
プ言語で表された文書にデータのセットを組み込む方法
は、少なくとも1つのコンテント長の属性を含む、予め
定められたタイプの開始タグを挿入するステップと、前
記データのセットの長さを取得するステップと、前記取
得した長さに等しい属性値を、前記コンテント長の属性
に関連付けるステップと、前記予め定められたタイプの
開始タグの後に、前記データのセットをそのまま文書に
組み込むステップと、前記予め定められたタイプの終了
タグを挿入するステップと、を備えている。
【0024】長さの属性と関連した予め定められたタイ
プのタグの使用は、XMLタイプの文書内に、従来のマ
ークアップ言語文書のパーサでは読み取れないデータを
含めることを可能とする。データは文書にそのまま組み
込まれるが、これはすなわち、マークアップ言語での文
書の構築を遅延させ、かつサイズの増大を招きやすい、
事前処理が無いことを意味する。
【0025】データのセットの挿入は、マークアップ言
語の構造を考慮して、開始タグと終了タグの間で行なわ
れる。
【0026】この本発明の第2の態様の好適な特徴によ
れば、この組み込み方法は、予め定められたコンテント
・タイプのグループから選択された、前記データのセッ
トのコンテント・タイプを決定するステップと、前記予
め定められたタイプの開始タグを、コンテント・タイプ
の属性及び前記決定されたコンテント・タイプに等しい
属性値に関連付けるステップと、を更に備えている。
【0027】コンテント・タイプとタグとの関連は、後
で文書を解析するときに、パーサ又は特定のアプリケー
ションに処理すべきデータのタイプを指示するのを可能
とする。
【0028】本発明の第3の態様によれば、マークアッ
プ言語で表された文書に組み込まれたデータのセットを
処理する方法は、前記文書を本発明の第1の態様の解析
方法に従って解析するステップと、識別された形式で前
記データのセットを処理するステップと、を備えてい
る。
【0029】データはマークアップ言語で表された文書
に直接組み込まれており、それらの処理は、該データの
事前の変換を必要とせずに、文書の解析の後に実施され
得る。
【0030】この本発明の第3の態様の好適な特徴によ
れば、データのセットはデジタル画像を表すバイナリデ
ータのセットであり、前記処理方法は、識別されたバイ
ナリデータのセットの処理が終了したときに、その画像
を表示するステップを備えている。
【0031】従って、本発明によれば、マークアップ言
語の文書の解析と共に、文書内に組み込まれた個々の画
像を表すバイナリデータのセットが識別されるとすぐ
に、画像を漸次表示することが可能となる。
【0032】この本発明の第3の態様の別の好適な特徴
によれば、マークアップ言語で表された文書は、データ
のセットに対する関数のリモート実行についての要求で
あり、前記処理方法は、識別されたデータのセットに対
して関数を実行するステップを備えている。
【0033】この特別に有利なアプリケーションでは、
前記処理方法は、マークアップ言語で表された関数の実
行の要求の解析と、その関数が実行されるべきデータの
識別とを同時に進めるのを可能とする。
【0034】本発明はまた、マークアップ言語で表され
た文書を解析する装置にも関係しており、該装置は、予
め定められたタイプのタグであって、少なくとも1つの
コンテント長の属性に関連するタグを検出する手段と、
前記コンテント長の属性の値を読み取る手段と、前記タ
グに続く、読み取った値と等しい長さのデータのセット
を自動的に識別する手段と、を備えている。
【0035】本発明はまた、マークアップ言語で表され
た文書にデータのセットを組み込む装置にも関係してお
り、該装置は、少なくとも1つのコンテント長の属性を
含む、予め定められたタイプの開始タグを挿入する手段
と、前記データのセットの長さを取得する手段と、前記
取得した長さに等しい属性値を、前記コンテント長の属
性に関連付ける手段と、前記予め定められたタイプの開
始タグの後に、前記データのセットをそのまま組み込む
手段と、前記予め定められたタイプの終了タグを挿入す
る手段と、を備えている。
【0036】最後に、本発明はマークアップ言語で表さ
れた文書に組み込まれたデータのセットを処理する装置
に関係しており、該装置は、本発明による解析装置と、
該解析装置によって識別されたデータのセットを処理す
る手段とを備えている。
【0037】解析、組み込み及び処理のためのこれらの
装置は、それらが実施する方法と同様な利点及び特徴を
もたらす。
【0038】特に、デジタル画像を表すバイナリデータ
のセットの処理に対して、本発明は特に有利である。
【0039】特に、本発明はXML言語で表されたあら
ゆる文書に適用でき、とりわけ、XML言語などのマー
クアップ言語で表された関数のリモート実行の要求に適
用できる。
【0040】本発明はまた、移動電話、携帯情報端末、
及びより一般的には、本発明による解析装置、組み込み
装置及び処理装置の少なくともいずれかを含むあらゆる
コンピュータ・システムに関係する。
【0041】本発明はまた、部分的に又は全体的に着脱
可能であり、コンピュータ・システムによって読み取り
可能であり、コンピュータ・システムによってロードさ
れて実行されたときに本発明による解析方法、組み込み
方法及び処理方法の少なくともいずれかを実施するよう
に構成された、コンピュータ・プログラムの命令を含む
情報キャリアにも関係する。
【0042】最後に、本発明は、情報キャリアに格納さ
れたコンピュータ・プログラムに関係し、該プログラム
は、コンピュータ・システムによってロードされて実行
されたときに本発明による解析方法、組み込み方法及び
処理方法の少なくともいずれかを実施するように構成さ
れた、コンピュータ・プログラムの命令を含んでいる。
【0043】このような移動電話、このような携帯情報
端末、このような情報システム、このような情報キャリ
ア、及びこのようなコンピュータ・プログラムは、それ
らが実施する方法と同様な利点をもたらす。
【0044】本発明の更に他の特徴及び利点は、以下の
説明から明らかになるであろう。
【0045】
【発明の実施の形態】マークアップ言語で表わされた文
書にデータのセットを組み込む方法を以下で説明する。
【0046】本明細書では、デジタル画像を表すバイナ
リデータのセットについて検討するが、これに限るもの
ではない。
【0047】このバイナリデータのセットは、例えば、
JPEG(Joint Picture Expert Group)フォーマット
の画像を表す圧縮データのファイルであってもよい。
【0048】このバイナリデータのセットが、XML言
語の文書に組み込まれる。
【0049】このXML言語の文書は、通信ネットワー
ク上でも容易に使用され得る。
【0050】特に、このXML文書は、デジタル画像に
適用されるべき特定の処理操作を可能とする、関数の実
行の要求であってもよい。
【0051】好ましくは、デジタル画像に対して関数を
実行する方法を記載しており、特に、同じ通信ネットワ
ーク上のコンピュータ間で、関数をリモート的に実行す
る方法を記載している、欧州特許出願EP 1 065
592号を参照されたい。
【0052】このように、クライアント・コンピュータ
が画像に、例えば回転などの特定の処理操作を適用する
のをサーバ・コンピュータに要求するとき、回転関数の
実行を要求するのに加えて、画像自体をサーバ・コンピ
ュータに送信することが必要となる。
【0053】図1を参照して、まず最初にXML言語で
書かれた関数のリモート実行の要求に、画像を表すバイ
ナリデータのセットを組み込む方法を以下で説明する。
【0054】この組み込み方法は最初に、組み込むべき
バイナリデータのセットの長さnを取得するステップS
10を含んでいる。
【0055】バイナリデータのファイルの場合、この長
さnは通常はファイルに含まれているバイト数に等しい
であろう。
【0056】このため長さの取得は、組み込むべきデー
タのファイルに記憶されたバイト数を読み取ることで実
行されてもよい。
【0057】データのセットのコンテント・タイプを決
定するために、決定ステップS11が次に実施される。
【0058】コンテント・タイプは、予め定められたコ
ンテント・タイプGのグループから選択される。
【0059】このコンテント・タイプGのグループは、
それらの特性を明らかにするのを可能とする異なったタ
イプを有していてもよい。ここでは、組み込まれるべき
バイナリデータのセットを特徴付けるために、グループ
Gの"image/JPEG"が選択され得る。
【0060】一般的な方法では、グループGに記憶され
るコンテント・タイプは、電子メールに添付されるのに
適したファイル用として周知の、MIMEフィールドの
“コンテント・タイプ”の規定に従うであろう。
【0061】"image/JPEG"タイプとは別に、コンテント
・タイプのグループは"ZIP"タイプを含んでいる。
【0062】次に予め定められたタイプの開始タグがX
ML要求に挿入される。
【0063】この挿入ステップは、より詳細には開き括
弧 < を書込むステップS12と、実際にタグの名前を
書き込むステップS13とを含んでいる。
【0064】ここでは、例としてタグの名前を"image"
とする。
【0065】このタグは予め定められたタイプであり、
以下の記載では"opaque"タイプと呼ぶ。
【0066】この"opaque"タイプはXML文書のヘッダ
内で定義され、そうでなければXML文書に関連したX
MLスキーマで定義されるであろう。
【0067】この"opaque"タイプは、XML文書内にX
MLタイプのマークアップ言語で表されていないデータ
を挿入するのを可能とする。
【0068】ここで、バイナリデータのセットが組み込
まれたXML文書が、とりわけ、そのようなXML文書
を書くのに使用されるタグのタイプを定義している、X
MLスキーマに一般的な方法で関連していると想定す
る。
【0069】このため、imageタグはそのタイプ"xs:opa
que"によってXMLスキーマで直接定義される。
【0070】これに代えて、タグの定義がXML文書の
ヘッダ内にあってもよい。
【0071】ここでは2つである属性の数は、この"ima
ge"タグに関連している。
【0072】この"image"タグとの関連及びこれら属性
の定義は、XML文書のヘッダ内で作成されてもよい。
【0073】特に、その値が整数であるコンテント長の
属性"ContentLength"は"image"タグと関連している。
【0074】この属性は、組み込まれるデータのセット
の長さをタグ内で明示するのを可能としている。
【0075】その上、"image"タグはここでは、組み込
まれるデータの特性を定義するのを可能とするコンテン
ト・タイプの属性"contentType"にも関連している。
【0076】この属性"contentType"はMIMEフィー
ルドの値とは異なっていてもよい。
【0077】例として、これら2つの属性に関連する"o
paque"タイプなどのタグを宣言しているXMLスキーマ
を以下に記すと、 //画像処理要求の要求スキーマ <xz:element name="rotate"/> <xs:complexType> <xs:element name="image" type="xs:opaque"> <xs:attribute name="contentType" type="xs:mimeType"/> <xs:attibute name="contentLength" type="xs:integer"/> </xs:element> <xs:element name="angle" type="xs:integer"/> </xs:complexType> </xs:element> となる。
【0078】このため、XMLでの要求及びバイナリデ
ータのセットの組み込みに戻ると、"image"タグを書き
込んだ後、ステップS14で長さの属性"contentLengt
h"が加えられ、関連するステップS15において、取得
ステップS10で取得された長さに等しい値nがその長
さの属性に加えられる。
【0079】そしてコンテント・タイプの属性、"conte
ntType"についての処理が同様な方法で進められる。
【0080】このコンテント・タイプの属性は、追加ス
テップS16でXMLの要求に加えられ、関連するステ
ップS17によりステップS11で求められた値を、こ
こでは"image/JPEG"と等しいコンテント・タイプの属性
と関連付けることが可能となる。
【0081】この"image"タグ及びその属性がこのよう
に書き込まれ、閉じ括弧 > が書き込みステップS18
で従来の方法で書き込まれる。
【0082】次に、書き込みステップS19により、既
に書き込まれた開始タグの直後に、バイナリデータのセ
ットをXML文書にそのまま組み込むことが可能とな
る。
【0083】このようにバイナリデータのセットが、フ
ァイルの変更やバイナリデータの事前処理なしに、XM
Lでのリモート実行の要求に直接組み込まれ得る。
【0084】このデータのセットの後に、予め定められ
た"opaque"タイプの終了タグが挿入されるが、これはス
ラッシュが後に続く括弧 </ を書込むステップS2
0、"image"タグの名前を書き込むステップS21、閉
じ括弧 > を書込むステップS22を連続して含んでい
る。
【0085】このようにこの組み込み方法は、XML言
語でのリモート実行の要求の内部に、バイナリデータの
セットをこのファイルの変更なしにそのまま組み込むの
を可能とする。
【0086】画像を90度回転させるためのそのような
要求の例を以下に記すと、 //画像処理要求の要求に対応 <rotate> <image> contentType="image/jpeg" contentLength="256">binary JPEG image here </image> <angle>90</angle> </rotate> となる。
【0087】このXML文書への直接組み込みは、予め
定められた"opaque"タイプの"image"タグの使用により
可能となる。
【0088】図2及び3を参照して、XML文書に組み
込まれたそのようなバイナリデータのセットを処理する
方法を説明する。
【0089】XMLで書かれた関数のリモート実行に対
する要求が含まれているとき、バイナリデータのセット
をその要求内に挿入するように、クライアント・ステー
ションでバイナリデータのセットを組み込む方法が実行
される。
【0090】次にこの要求は組み込まれたバイナリデー
タのセットと共に、このデータのセットを処理する、特
にデータのセットに対して関数を実行する必要のある、
通信ネットワークのサーバに送信される。
【0091】ここで、例えば、クライアント・ステーシ
ョンが、デジタル画像の角度90度での回転のリモート
実行を要求すると想定する。
【0092】ネットワークのサーバ・ステーションでの
処理手順では、XML文書を受信するステップS30が
最初に実施される。
【0093】XML文書がXMLスキーマに関連してい
るという点で、取得ステップS30はステーションが対
応するXMLスキーマを取得するのを可能とする。
【0094】そして文書を実際に解析するステップS3
2が、XML文書を読み取るために実施される。
【0095】文書の解析については図3に詳細に示し
た。
【0096】一般に、及び当業者には周知のように、こ
のXML文書の解析は、文書の読み取り、タグ毎に、各
タグの、タイプ、考えられる属性及びそのデータの値を
識別することによって実行される。
【0097】このためこの再帰的方法は、最初のタグを
読み取るステップS320を含んでいる。
【0098】S321のテストにより、このタグが予め
定められた"opaque"タイプか否かを確かめるのが可能と
なる。
【0099】そのような予め定められたタイプのタグが
検出されたとき、読み取りステップS322によりその
属性の値を読み取ることが可能となる。
【0100】ここで本発明によれば、読み取りステップ
S322は、コンテント長の属性の値を読み取るのを可
能とする。
【0101】その上、本実施形態では、この読み取りス
テップは、コンテント・タイプの属性の値を読み取るの
も可能とする。
【0102】ここでこれらの値は、それぞれ"n"及び"im
age/jpeg"である。
【0103】次に自動的識別ステップS323により、
コンテント長の値nにより、タグに続く読み取った値n
と同じ長さのバイナリデータのセットの識別が可能とな
る。
【0104】実際には、予め定められたopaqueタイプの
開始タグの終了を示す閉じ括弧 >の後のnバイトを、自
動的に識別することが可能となる。
【0105】このように、パーサに特定のデータのセッ
トの存在を示す、この特定のタグによって、長さの属性
に記憶された長さnのおかげで、このデータのセットを
自動的に識別することが可能となる。
【0106】そして、この自動的識別ステップS323
に続く記憶ステップS324は、"image"タグの名前、
コンテント・タイプ"image/jpeg"及び識別されたバイ
ト、すなわち、XML文書に含まれるバイナリデータ
を、同時に記憶するのを可能とする。
【0107】これらのデータの記憶の例を、図4に表し
た。
【0108】記憶ステップS324は、このように記憶
されたバイナリデータを後で処理することを可能とす
る。
【0109】パーサもこれらのバイナリデータを、例え
ば、XML文書内の画像を表示して処理可能である特別
な場合には、バイナリデータがパーサによって識別され
た直後にその表示が実行されてもよい。
【0110】更に、コンテント長nは、XML文書に組
み込まれたデータのセットをパーサが自動的に識別する
のにも有用であることがわかるであろう。
【0111】一方、コンテント・タイプはここではパー
サに直接使用されないが、アプリケーション自身による
データ処理で使用されるため、ステップS324で記憶
される。
【0112】そして解析手順は文書の全てのタグについ
て続行され、より詳細には、読み取りステップS325
は後続するタグが識別されるのを可能とする。
【0113】テストステップS326で、これが実際に
終了タグであるか確認される。
【0114】終了タグでなければ、ステップS327で
エラーメッセージが生成され、解析手順は中断される。
【0115】しかしながら、もし終了タグが実際に存在
すれば、テストステップS328で、これが最後のタグ
か否か確認される。最後のタグでなければ、後続するタ
グが読み取りステップS329で読み取られ、このタグ
が"opaque"タイプであるか否か判定するために、テスト
ステップS321が繰り返される。"opaque"タイプであ
れば、ステップS322からS329が繰り返される。
【0116】"opaque"タイプでなければ、文書の解析は
テストステップS330でこれがsimpleタイプのタグ
か、すなわち、タグがXML言語で子のタグとしても知
られる副次的部分を何も含まないか否かの確認によって
通常の方法で続けられる。
【0117】実際にそのような場合、ステップS331
により、このタグに関連するデータの値を、記号 </ に
よって識別される終了タグの開始まで読み取ることが可
能となる。
【0118】記憶ステップS332はまた、タグの名
前、そのタイプ及びこのようにして読み取った値を記憶
することを可能とする。
【0119】テストステップS330の終わりで、この
タグのタイプがsimpleではなくcomplexである、すなわ
ち、子のタグを含んでいれば、文書の解析処理は現在の
タグに含まれる副次的部分についても同様な方法で実施
される。
【0120】この解析ステップS32は、図3を参照し
て説明した解析手順と同じものである。
【0121】特に、opaqueタイプのタグ及びその予め定
められたタイプのタグの後に組み込まれたデータのセッ
トの識別が、XML文書のあらゆる階層レベルで実施さ
れ得る。
【0122】ステップS328の終わりで、全てのタグ
が解析されたとき、文書の解析手順は終了し、図2に示
されたように、識別され記憶ステップS324で記憶さ
れたバイナリデータを処理するステップS33が続いて
行なわれる。
【0123】この例では、処理ステップS33は、識別
されたバイナリデータのセットに対して関数を実行する
ステップである。
【0124】この記憶されたバイナリデータのセットに
対する、サーバ・ステーションによる関数の呼び出し
と、この関数に関連する引数の利用とが、既知の方法で
実施される。
【0125】そのような関数のリモート実行について
は、欧州特許出願EP 1 065592号を参照する
のが好適であろう。
【0126】例として、この関数がバイナリデータのセ
ットによって表わされる画像を90度回転させるものに
対応するとする。
【0127】本発明によれば、バイナリデータのセット
を組み込む及び処理する方法は、バイナリデータのファ
イルを1つづつXML文書に組み込むこと、及びそれを
後で処理するという観点からXML文書内でそれを識別
することを可能とするのが好適である。
【0128】特に、この方法は、通信ネットワーク内の
2つのコンピュータ間で、リモート実行に対する要求内
でバイナリデータのセットを送信するのに非常に好適で
ある。
【0129】これらバイナリデータを組み込む方法は、
好適には移動電話又は携帯情報端末(PDA)内で直接
実施されてもよい。
【0130】XML文書の解析及び識別されたデータの
処理のための装置は、通常は、移動電話又は携帯情報端
末と通信するように構成された通信ネットワークのサー
バ・ステーション内に組み込まれてもよい。
【0131】このようなコンピュータ・システムのいず
れか1つを図5に概略的に示した。
【0132】データのセットを組み込む装置がこのよう
なコンピュータ・システムに実装されるとき、該装置は
特に、opaqueタイプの開始タグ及び終了タグを挿入する
手段と、データのセットの長さを取得する手段と、タグ
の長さの属性に取得した長さに等しい属性値を関連付け
る手段と、挿入された開始タグの直後に、データのセッ
トをそのまま書き込む手段とを備えている。
【0133】該装置はまた、データのセットのコンテン
ト・タイプを求める手段と、開始タグと求められたコン
テント・タイプに等しいコンテント・タイプの属性値と
を関連付ける関連付け手段とを備えている。
【0134】代わりに、図5に示されるようなコンピュ
ータ・システムに文書を処理及び解析する装置が組み込
まれているとき、該装置は、"opaque"タイプのタグを検
出する手段と、長さの属性の値を読み取り、そしておそ
らくはコンテント・タイプの属性を読み取る手段とを備
えている。
【0135】本発明によれば、該装置は、読み取った値
と等しい長さのデータのセットを自動的に識別する手
段、並びにこの識別されたデータのセットとコンテント
・タイプの属性の値とを記憶する手段も備えている。
【0136】識別されたデータのセットを処理する手段
は、解析装置及び、例えば、画像を表示する手段に組み
込まれ得る。
【0137】それ以外の場合、識別されたデータのセッ
トを処理する手段は、解析装置と別個であってもよく、
特に、例えば、識別されたデータのセットに対して関数
の実行を可能とするコンピュータのアプリケーションを
備えていてもよい。
【0138】図5に示されたように、一方の組み込み装
置と他方の解析装置とは、マイクロプロセッサ100、
データのセットを組み込む又は文書を解析するプログラ
ムを含むリードオンリーメモリすなわちROM101、
及びプログラムの実行中に変更された変数を記録するよ
う構成されたレジスタを含む、ランダムアクセスメモリ
あるいはRAM102に組み込まれてもよい。
【0139】特に、このランダムアクセスメモリ102
は、属性"contentLength"及び"contentType"並びに"opa
que"タイプの属性の値を格納する、特別なレジスタを備
えている。
【0140】マイクロプロセッサ100は、様々な周辺
機器と接続され得るコンピュータ10に一体化される。
【0141】コンピュータ10は、コンピュータの要求
などの文書を受信又は送信するように、通信ネットワー
ク1に接続された通信インタフェース110を備えてい
る。
【0142】コンピュータ10は更に、ハードディスク
106などの文書を格納する手段を備えているか、ディ
スク・リーダ107によってディスク700(フレキシ
ブルディスク、CD又はPCカード)などの文書を格納
する取り外し可能な手段と協働するように構成されてい
る。
【0143】これら固定又は取り外し可能な格納手段は
更に、一旦マイクロプロセッサ100によって読み取ら
れるとハードディスク106内に格納される、本発明に
よる組み込み又は解析及び処理の方法のコードを含んで
いてもよい。
【0144】変形例として、本発明を実施する組み込み
又は解析及び処理装置を実現するプログラムが、リード
オンリーメモリ101内に格納されてもよい。
【0145】第2の変形例では、先に説明したように格
納されるべく、プログラムが通信ネットワークを介して
受信されてもよい。
【0146】コンピュータ10はまた、キーボード10
4又はマウス105の助けによってユーザとのインタフ
ェースとして働くことができる画面10、あるいは解析
の後でXML文書のデータを表示し、例えば、XML文
書に組み込まれたデジタル画像も表示する、他の何らか
の手段を有している。
【0147】中央処理ユニット(CPU)100は、本
発明の実施に関する命令を実行する。電源投入の際、不
揮発性メモリ、例えば、リードオンリーメモリ101に
格納された本発明に関する方法のプログラムは、ランダ
ムアクセスメモリ102に転送され、そこで本発明の実
行可能コード並びに本発明の実施に必要な変数を含む形
態となるであろう。
【0148】通信バス112は、コンピュータ10の様
々な構成要素又はそれにリンクされた要素間の通信を提
供する。バス112の表現は非限定的であり、特に、マ
イクロプロセッサ100が、あらゆる構成要素への又は
別の構成要素を介した指示の通信を受け持つ。
【0149】もちろん、本発明の範囲から逸脱すること
なしに、先に説明した実施形態に対して多くの変更が可
能であろう。
【0150】特に、XML文書にそのまま組み込まれる
データファイルは、圧縮されたZIPファイルでもよ
い。
【0151】第1のXML文書に、該第1のXML文書
の解析の時点では解析及び読み取りを望まない、第2の
XML文書を組み込むことも可能である。
【図面の簡単な説明】
【図1】本発明による組み込み方法を示すアルゴリズム
である。
【図2】本発明による処理方法を示すアルゴリズムであ
る。
【図3】本発明による解析方法を示すアルゴリズムであ
る。
【図4】解析方法が完了したときのデータの記憶を示す
テーブルである。
【図5】本発明を実施するように構成されたコンピュー
タ・システムを概略的に示す図である。

Claims (33)

    【特許請求の範囲】
  1. 【請求項1】 マークアップ言語で表された文書の解析
    方法であって、 予め定められたタイプのタグであって、少なくとも1つ
    のコンテント長の属性に関連するタグを検出するステッ
    プ(S321)と、 前記コンテント長の属性の値(n)を読み取るステップ
    (S322)と、 前記タグに続く、前記読み取った値(n)と等しい長さ
    のデータのセットを自動的に識別するステップ(S32
    3)と、を備えることを特徴とする解析方法。
  2. 【請求項2】 前記データのセットを記憶するステップ
    (S324)を更に備えることを特徴とする請求項1に
    記載の解析方法。
  3. 【請求項3】 前記タグが更にコンテント・タイプの属
    性に関連しており、前記解析方法が、 前記コンテント・タイプの属性の値を読み取るステップ
    (S322)と、 前記データのセット及び前記コンテント・タイプの属性
    の値を記憶するステップ(S324)と、を備えること
    を特徴とする請求項1に記載の解析方法。
  4. 【請求項4】 マークアップ言語で表された文書にデー
    タのセットを組み込む方法であって、 少なくとも1つのコンテント長の属性を含む、予め定め
    られたタイプの開始タグを挿入するステップ(S12〜
    S18)と、 前記データのセットの長さ(n)を取得するステップ
    (S10)と、 前記取得した長さ(n)に等しい属性値を、前記コンテ
    ント長の属性に関連付けるステップ(S16)と、 前記予め定められたタイプの開始タグの後に、前記デー
    タのセットをそのまま文書に書き込むステップ(S1
    9)と、 前記予め定められたタイプの終了タグを挿入するステッ
    プ(S20〜S22)と、を備えることを特徴とする組
    み込み方法。
  5. 【請求項5】 予め定められたコンテント・タイプのグ
    ループ(G)から選択された、前記データのセットのコ
    ンテント・タイプを決定するステップ(S11)と、 前記予め定められたタイプの開始タグと、コンテント・
    タイプの属性及び前記決定されたコンテント・タイプに
    等しい属性値とを関連付けるステップ(S17)と、を
    更に備えることを特徴とする請求項4に記載の組み込み
    方法。
  6. 【請求項6】 マークアップ言語で表された文書に組み
    込まれたデータのセットを処理する方法であって、 前記文書を請求項1から3のいずれか1項に記載の解析
    方法に従って解析するステップ(S32)と、 識別された形式で前記データのセットを処理するステッ
    プ(S33)と、を備えることを特徴とする処理方法。
  7. 【請求項7】 前記データのセットはデジタル画像を表
    すバイナリデータのセットであり、識別されたバイナリ
    データのセットの処理が終了したときに、その画像を表
    示するステップ(S33)を備えることを特徴とする請
    求項6に記載の処理方法。
  8. 【請求項8】 マークアップ言語で表された前記文書
    は、前記データのセットに対する関数のリモート実行に
    ついての要求であり、識別されたデータのセットに対し
    て前記関数を実行するステップ(S33)を備えること
    を特徴とする請求項6に記載の処理方法。
  9. 【請求項9】 マークアップ言語で表された文書を解析
    する装置であって、 予め定められたタイプのタグであって、少なくとも1つ
    のコンテント長の属性に関連するタグを検出する手段
    (100,101,102)と、 前記コンテント長の属性の値(n)を読み取る手段(1
    00,101,102)と、 前記タグに続く、読み取った値(n)と等しい長さのデ
    ータのセットを自動的に識別する手段(100,10
    1,102)と、を備えることを特徴とする解析装置。
  10. 【請求項10】 前記データのセットを記憶する手段
    (100,101,102)を更に備えることを特徴と
    する請求項9に記載の解析装置。
  11. 【請求項11】 前記タグがコンテント・タイプの属性
    にも関連しており、 前記読み取り手段が、前記コンテント・タイプの属性の
    値を読み取るように構成されており、前記データのセッ
    ト及び前記コンテント・タイプの属性の値を記憶する手
    段(100,101,102)を備えることを特徴とす
    る請求項9に記載の解析装置。
  12. 【請求項12】 マークアップ言語で表された文書にデ
    ータのセットを組み込む装置であって、 少なくとも1つのコンテント長の属性を含む、予め定め
    られたタイプの開始タグを挿入する手段(100,10
    1,102)と、 前記データのセットの長さ(n)を取得する手段(10
    0,101,102)と、 前記取得した長さ(n)に等しい属性値を、前記コンテ
    ント長の属性に関連付ける手段(100,101,10
    2)と、 前記予め定められたタイプの開始タグの後に、前記デー
    タのセットをそのまま書き込む手段(100,101,
    102)と、 前記予め定められたタイプの終了タグを挿入する手段
    (100,101,102)と、を備えることを特徴と
    する組み込み装置。
  13. 【請求項13】 予め定められたコンテント・タイプの
    グループから選択された、前記データのセットのコンテ
    ント・タイプを決定する手段((100,101,10
    2)を更に備え、前記関連付ける手段が、コンテント・
    タイプの属性及び前記決定されたコンテント・タイプに
    等しい属性値と、前記予め定められたタイプの開始タグ
    とを関連付けるように構成されていることを特徴とする
    請求項12に記載の組み込み装置。
  14. 【請求項14】 マークアップ言語で表された文書に組
    み込まれたデータのセットを処理する装置であって、 請求項9に記載の解析装置(100,101,102)
    と、該解析装置によって識別されたデータのセットを処
    理する手段とを備えることを特徴とする処理装置。
  15. 【請求項15】 画像を表示する手段を備えることを特
    徴とする請求項14に記載の処理装置。
  16. 【請求項16】 マークアップ言語で表された関数のリ
    モート実行についての要求を解析した後に、識別された
    データのセットに対して関数を実行する手段(100,
    101,102)を備えることを特徴とする請求項14
    に記載の処理装置。
  17. 【請求項17】 請求項9に記載の解析装置を備えるこ
    とを特徴とする移動電話。
  18. 【請求項18】 請求項9に記載の解析装置を備えるこ
    とを特徴とする携帯情報端末。
  19. 【請求項19】 請求項9に記載の解析装置を備えるこ
    とを特徴とするコンピュータ・システム。
  20. 【請求項20】 請求項12に記載の組み込み装置を備
    えることを特徴とする移動電話。
  21. 【請求項21】 請求項12に記載の組み込み装置を備
    えることを特徴とする携帯情報端末。
  22. 【請求項22】 請求項12に記載の組み込み装置を備
    えることを特徴とするコンピュータ・システム。
  23. 【請求項23】 請求項14に記載の処理装置を備える
    ことを特徴とする移動電話。
  24. 【請求項24】 請求項14に記載の処理装置を備える
    ことを特徴とする携帯情報端末。
  25. 【請求項25】 請求項14に記載の処理装置を備える
    ことを特徴とするコンピュータ・システム。
  26. 【請求項26】 部分的に又は全体的に着脱可能であっ
    て、コンピュータ・システムによって読み取り可能であ
    り、コンピュータ・システムによってロードされて実行
    されたときに、請求項1に記載の解析方法を実施するよ
    うに構成された、コンピュータ・プログラムの命令を含
    むことを特徴とする情報キャリア。
  27. 【請求項27】 部分的に又は全体的に着脱可能であっ
    て、コンピュータ・システムによって読み取り可能であ
    り、コンピュータ・システムによってロードされて実行
    されたときに、請求項4に記載の組み込み方法を実施す
    るように構成された、コンピュータ・プログラムの命令
    を含むことを特徴とする情報キャリア。
  28. 【請求項28】 部分的に又は全体的に着脱可能であっ
    て、コンピュータ・システムによって読み取り可能であ
    り、コンピュータ・システムによってロードされて実行
    されたときに、請求項6に記載の処理方法を実施するよ
    うに構成された、コンピュータ・プログラムの命令を含
    むことを特徴とする情報キャリア。
  29. 【請求項29】 情報キャリアに格納されたコンピュー
    タ・プログラムであって、該プログラムは、コンピュー
    タ・システムによってロードされて実行されたときに、
    請求項1に記載の解析方法を実施するように構成された
    コンピュータ・プログラムの命令を含んでいることを特
    徴とするコンピュータ・プログラム。
  30. 【請求項30】 情報キャリアに格納されたコンピュー
    タ・プログラムであって、該プログラムは、コンピュー
    タ・システムによってロードされて実行されたときに、
    請求項4に記載の組み込み方法を実施するように構成さ
    れたコンピュータ・プログラムの命令を含んでいること
    を特徴とするコンピュータ・プログラム。
  31. 【請求項31】 情報キャリアに格納されたコンピュー
    タ・プログラムであって、該プログラムは、コンピュー
    タ・システムによってロードされて実行されたときに、
    請求項6に記載の処理方法を実施するように構成された
    コンピュータ・プログラムの命令を含んでいることを特
    徴とするコンピュータ・プログラム。
  32. 【請求項32】 予め定められたタイプのタグであっ
    て、少なくとも1つのコンテント長の属性に関連するタ
    グを含むことを特徴とする、マークアップ言語で表され
    たコンピュータ文書。
  33. 【請求項33】 前記タグが、コンテント・タイプの属
    性に関連することを特徴とする請求項32に記載のコン
    ピュータ文書。
JP2002186189A 2001-06-27 2002-06-26 マークアップ言語で表わされた文書の解析方法 Pending JP2003196269A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0108475A FR2826761B1 (fr) 2001-06-27 2001-06-27 Procede d'analyse d'un document represente dans un langage de balisage
FR0108475 2001-06-27

Publications (1)

Publication Number Publication Date
JP2003196269A true JP2003196269A (ja) 2003-07-11

Family

ID=8864831

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002186189A Pending JP2003196269A (ja) 2001-06-27 2002-06-26 マークアップ言語で表わされた文書の解析方法

Country Status (3)

Country Link
US (1) US20030028559A1 (ja)
JP (1) JP2003196269A (ja)
FR (1) FR2826761B1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007048215A (ja) * 2005-08-12 2007-02-22 Canon Inc 通信装置、中継装置及び当該装置におけるメッセージ送受信方法

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2841998B1 (fr) * 2002-07-04 2004-10-22 Canon Kk Procede d'execution sur une station d'un reseau de communication d'un programme informatique represente dans un langage de balisage
FR2844370B1 (fr) 2002-09-05 2008-05-09 Canon Kk Document electronique de description d'un service informatique
WO2005008993A1 (en) * 2003-07-23 2005-01-27 Canon Kabushiki Kaisha Description document for a service offered by a server in a communication network and method of validating a multimedia document
KR100677429B1 (ko) * 2005-02-01 2007-02-02 엘지전자 주식회사 이동 통신 단말기의 사용자 인터페이스 처리 방법
FR2886428B1 (fr) * 2005-05-26 2007-08-31 Canon Kk Procede et dispositif de traitement d'un document xml
BR112012010120A2 (pt) * 2009-10-30 2016-06-07 Rakuten Inc dispositivo e método de determinação de conteúdo característico
US10614134B2 (en) 2009-10-30 2020-04-07 Rakuten, Inc. Characteristic content determination device, characteristic content determination method, and recording medium

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10222510A (ja) * 1997-02-07 1998-08-21 Hitachi Ltd 文書変換方法
JP2001167095A (ja) * 1999-09-27 2001-06-22 Mitsubishi Electric Corp 画像検索システムおよび画像検索方法
JP2002132751A (ja) * 2000-10-27 2002-05-10 Fuji Xerox Co Ltd 文書処理装置
JP2002358230A (ja) * 2001-06-04 2002-12-13 Murata Mach Ltd 構造化文書のデータ構造と構造化文書生成装置及びそのプログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2048039A1 (en) * 1991-07-19 1993-01-20 Steven Derose Data processing system and method for generating a representation for and random access rendering of electronic documents
US6122657A (en) * 1997-02-04 2000-09-19 Networks Associates, Inc. Internet computer system with methods for dynamic filtering of hypertext tags and content
EP1045315A3 (en) * 1999-04-13 2011-03-02 Canon Kabushiki Kaisha Data processing method and apparatus
ATE294480T1 (de) * 1999-06-11 2005-05-15 Microsoft Corp Allgemeines api zur gerätefernsteuerung
US7149965B1 (en) * 1999-08-10 2006-12-12 Microsoft Corporation Object persister
US6732102B1 (en) * 1999-11-18 2004-05-04 Instaknow.Com Inc. Automated data extraction and reformatting
JP4244492B2 (ja) * 2000-03-24 2009-03-25 ソニー株式会社 情報処理装置、情報配信システム、情報処理方法、及び記録媒体
US6516308B1 (en) * 2000-05-10 2003-02-04 At&T Corp. Method and apparatus for extracting data from data sources on a network

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10222510A (ja) * 1997-02-07 1998-08-21 Hitachi Ltd 文書変換方法
JP2001167095A (ja) * 1999-09-27 2001-06-22 Mitsubishi Electric Corp 画像検索システムおよび画像検索方法
JP2002132751A (ja) * 2000-10-27 2002-05-10 Fuji Xerox Co Ltd 文書処理装置
JP2002358230A (ja) * 2001-06-04 2002-12-13 Murata Mach Ltd 構造化文書のデータ構造と構造化文書生成装置及びそのプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007048215A (ja) * 2005-08-12 2007-02-22 Canon Inc 通信装置、中継装置及び当該装置におけるメッセージ送受信方法
JP4701040B2 (ja) * 2005-08-12 2011-06-15 キヤノン株式会社 通信装置及び当該装置におけるメッセージ送信方法

Also Published As

Publication number Publication date
US20030028559A1 (en) 2003-02-06
FR2826761B1 (fr) 2003-10-17
FR2826761A1 (fr) 2003-01-03

Similar Documents

Publication Publication Date Title
US7177949B2 (en) Template architecture and rendering engine for web browser access to databases
US7188307B2 (en) Access system
US20030084405A1 (en) Contents conversion system, automatic style sheet selection method and program thereof
US6073166A (en) System for transfer of data
US6658662B1 (en) Retrieving information from a broadcast signal
US20020042831A1 (en) System and method for building applications that adapt for multiple device and protocol standards
US6976059B1 (en) System and method to provide applets using a server based virtual machine
US20010039540A1 (en) Method and structure for dynamic conversion of data
US20030191817A1 (en) Method and system for dynamic language display in network-based applications
US20040205620A1 (en) Information distributing program, computer-readable recording medium recorded with information distributing program, information distributing apparatus and information distributing method
US20020162093A1 (en) Internationalization compiler and process for localizing server applications
US20020062396A1 (en) Server devices for displaying web pages
JP3623715B2 (ja) 通信端末装置
MXPA03005451A (es) Metodo y sistema para asociar acciones con etiquetas semanticas en documentos electronicos.
TW200422881A (en) Method and computer-readable medium for importing and exporting hierarchically structured data
US7594235B2 (en) Method of executing on a station of a communication network a computer program represented in a markup language
US20060059247A1 (en) Automatic simultaneous entry of values in multiple web page fields
US20030159105A1 (en) Interpretive transformation system and method
JP2003196269A (ja) マークアップ言語で表わされた文書の解析方法
US20040181750A1 (en) Exception markup documents
EP0977130A1 (en) Facility for selecting and printing web pages
US20030237052A1 (en) Method and an apparatus for styling a web service
US20040205612A1 (en) Programmatically generating a presentation style for legacy host data
JP4405695B2 (ja) 更新情報の自動表示方法、装置、媒体およびプログラム
EP1883012A1 (en) Interface markup language and method for making application code

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040624

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050930

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051128

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061208