JP2006277031A - 情報処理装置及びその方法 - Google Patents

情報処理装置及びその方法 Download PDF

Info

Publication number
JP2006277031A
JP2006277031A JP2005091856A JP2005091856A JP2006277031A JP 2006277031 A JP2006277031 A JP 2006277031A JP 2005091856 A JP2005091856 A JP 2005091856A JP 2005091856 A JP2005091856 A JP 2005091856A JP 2006277031 A JP2006277031 A JP 2006277031A
Authority
JP
Japan
Prior art keywords
data
format
data format
character string
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005091856A
Other languages
English (en)
Other versions
JP3962748B2 (ja
Inventor
Toru Ishizaki
透 石嵜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2005091856A priority Critical patent/JP3962748B2/ja
Priority to CNA2006100651953A priority patent/CN1841382A/zh
Priority to US11/391,953 priority patent/US7793207B2/en
Publication of JP2006277031A publication Critical patent/JP2006277031A/ja
Application granted granted Critical
Publication of JP3962748B2 publication Critical patent/JP3962748B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/123Storage facilities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • G06F40/143Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]

Abstract

【課題】 XML文書のsrc属性に大きなサイズの画像データが埋め込まれている場合、この画像データの解析中の状態を保持するためには大容量のバッファが必要となる。
【解決手段】 構造化された文書データを解析し、その解析結果を構造単位で出力する情報処理装置及びその方法であって、構造化された文書データに含まれる第1データ形式を示す所定の文字列を検出し(S1)、所定の文字列を検出すると、その所定の文字列に対応するデータを、第1データ形式とは異なる第2データ形式に変換する(S2)。
【選択図】 図4

Description

本発明は、構造化された文書データを解析し、その解析結果を構造単位で出力する情報処理装置及びその方法に関するものである。
XMLのような構造化文書を入力して解析する情報処理装置において、例えばSAXパーサでは、XML文書のある要素の終了要素が解析し終わった時点で解析結果を処理することが行われている。
ところで、特許文献1では、ユーザに構成要素の要素名を指定させ、その指定された要素だけを解析し、その解析結果を出力している。
特開2000−148438号公報
入力される文書データの処理単位となる文書構造単位内に大きなデータが入っている場合、その文書を処理するのに多くのリソースが情報処理装置において必要となる。例えば、入力されるXML文書が、「img src=...」という記述で、src属性に大きなサイズの画像データが埋め込まれている場合、この画像データなどの解析中の状態を保持するために大容量のバッファを必要とする。ここで、この構造化文書に対応する独自のインタフェースを設ければ、大容量のバッファを必要とせずに処理できる可能性があるが、アプリケーションをそれに対応させるためにコストが大きくなる。
本発明は、上記従来技術の欠点を解決することにある。
本発明は上記問題点に鑑みてなされたもので、本願発明の特徴は、予め決められた処理単位で大容量のデータを抱えている文書データが入力されても、少ないリソースで解析して出力できるようにした情報処理装置及びその制御方法を提供することをにある。
上記特徴は、独立クレームに記載の特徴の組み合わせにより達成され、従属項は発明の単なる有利な具体例を規定するものである。
本発明の一態様に係る情報処理装置は以下のような構成を備える。即ち、
構造化された文書を処理する情報処理装置であって、
構造化された文書を受信する受信手段と、
前記構造化された文書に含まれる、第1データ形式としてテキストデータ形式で記述されたデータであることを示す所定の文字列を検出する文字列検出手段と、
前記文書データの受信処理に並行して、前記文字列検出手段によって検出された所定の文字列に続いて読み込まれるデータを第2データ形式としてバイナリデータ形式で記述されたデータに変換する処理を行うデータ変換手段と、
前記データ変換手段によって変換されたバイナリデータ形式で記述されたデータをメモリに記憶するバイナリデータ記憶手段と、
を有することを特徴とする。
本発明の一態様に係る情報処理方法は以下のような工程を備える。即ち、
構造化された文書データを処理する情報処理方法であって、
前記構造化された文書を受信手段によって受信する受信工程と、
前記構造化された文書に含まれる、第1データ形式としてテキストデータ形式で記述されたデータであることを示す所定の文字列を文字列検出手段において検出する文字列検出工程と、
前記文書データの受信処理に並行して、前記文字列検出手段によって検出された所定の文字列に続いて読み込まれるデータを第2データ形式としてバイナリデータ形式で記述されたデータに変換する処理をデータ変換手段において行うデータ変換工程と、
前記データ変換手段によって変換されたバイナリデータ形式で記述されたデータをメモリに記憶するバイナリデータ記憶工程と、
を有することを特徴とする。
本発明によれば、構造単位内に大容量のデータが含まれていても、リソースの少ない機器で処理することができる。
以下、添付図面を参照して本発明の好適な実施の形態を詳しく説明する。尚、以下の実施の形態は、本願の特許請求の範囲に係る発明を限定するものでなく、また、本実施の形態で説明されている特徴の組み合わせの全てが発明の解決手段に必須のものとは限らない。
図1は、本発明の実施の形態に係る印刷処理装置を含む印刷システムの概要を説明する構成図である。
図において、印刷処理装置103はLAN102を介してデジタルカメラ101やPC105と接続されており、これらからXML文書などの構造化文書を受信して記録シートに印刷することができる。このLAN102は、例えばWANやUSB回線など他の通信路で置き換えることができる。また印刷処理装置103は、USB回線やSCSIを介してハードディスクメモリ等で構成される文書,画像,音声データなどのファイルを保存する記憶装置104に接続されている。PC105は、このLAN102に接続されていて、LAN102を介して印刷処理装置103にデータの印刷を指示することができる。尚、この図1では、デジタルカメラ101、PC105がLAN102を介して印刷処理装置103に接続されているが、これ以外にも他のコンピュータ機器や画像入出力機器が接続されていてもよいことはもちろんである。
図2は、本実施の形態に係る印刷処理装置103のハードウェア構成を説明するブロック図である。
図2において、CPU201は、ROM202に記憶されているプログラムに従って、この装置全体の動作を制御している。この処理には、例えばLAN102を介してデジタルカメラ101から受信したXML文書に含まれる画像データを印刷イメージに変換し、プリント部(プリンタエンジン)206に出力して印刷するなどの制御も含まれる。ROM202は、CPU201により実行されるプログラムや、後述するテーブルなどを含む各種固定データを格納している。RAM203は、SRAM,DRAM等で構成され、CPU201による制御処理時に各種プログラム制御変数等を格納する。また各種設定パラメータ、各種ワーク用バッファも、このRAM203に格納される。プリント部206は、例えばインクジェット方式、或いは電子写真方式などにより記録シートに画像を印刷するプリンタエンジンである。LANI/F207は、この印刷処理装置103をLAN102に接続し、XML文書を受信するためのインタフェースある。USBI/F208は、USB210に接続するためのインタフェースである。尚、印刷処理装置103の構成によっては、更に、スキャナ部、モデム等が加えられても良い。
次に本実施の形態に係る印刷処理装置103が、LAN102を介して受信した構造化された文書(XML文書)を解析処理する際の動作に関して説明する。尚、この構造化された文書が送られてくる際のプロトコルに関しては本実施の形態では特に限定しない。
[実施の形態1]
この実施の形態1は、ある要素の先頭にその要素の属性(種類)を示す所定の文字列(特定文字列)を検出した場合、LANI/F207によるその要素内のデータの受信処理,解析処理と並行して、その要素の特定文字列に対応するsrc属性の属性データのデータ形式を別のデータ形式に変換する処理が実行されることを特徴とするものである。
図3は、本発明の実施の形態1に係る印刷処理装置103が受信した文書データの一部の一例を示す図である。
図3に示す文書はXMLで記述されている。印刷処理装置103は、sample要素の一行目に記述されている「src="data:image/jpeg;base64」を検出することにより、src属性の属性データとしてjpeg画像(バイナリデータ)をbase64エンコードしたテキストデータが含まれることを認識する。この特定文字列以降に、base64エンコードすることによって得られたテキストデータ「R0IGOD...YKAAA7」(base64エンコードされ、キャラクタコードで記述されたjpeg画像データ)が含まれている。
図4は、本実施の形態1に係る印刷処理装置103における印刷処理を説明するフローチャートで、この処理を実行するプログラムはROM202に記憶されており、CPU201の制御の下に実行される。ここでは図3に示すような文書を受信した場合を説明する。
図3において、src属性の先頭文字列「data:image/jpeg;base64」は、IETFのRFC2397に従っており、XML文書の属性データに、ある種のデータを記述する場合に使われる。ここで「image/jpeg」は、データのメディアタイプで、jpeg符号化された画像データを示している。「base64」はデータの符号化方式を示している。この実施の形態1に係る印刷処理装置103は、順次受信したXML文書内のデータを先頭から読み込んで解析処理を行う。この受信処理に並行して、テキストデータ形式で記述された画像データをバイナリデータ形式のデータ形式に変換し、RAM203に変換されたバイナリデータ形式の画像が格納される。そして、格納された画像データの印刷処理が順次行われる。
すなわち、RAM203に格納されるバイナリデータの容量はXML文書中のエンコードされたテキストデータの容量より減少するので、RAM203の容量が少なくてすむ。
まずステップS1の解析処理において、それぞれの要素がその先頭に前述の特定文字列を含むかどうかを判定する。特定文字列を含まないと判断した場合は、この処理を終了する。
ステップS1で、特定文字列を含むと判断した場合はステップS2に進み、特定文字列に続くsrc属性の属性データの読み込み(受信処理),解析処理に並行して、読み込まれた属性データのデータ形式を別のデータ形式に変換され、プリント部206において印刷処理が実行される。本実施の形態1では、上記特定文字列を「data:image/jpeg;base64」としている。なお、この特定文字列は、jpeg符号化された画像データをbase64でエンコードしたデータであることを示している。
ここでのデータ形式の変換は、変換後のデータサイズが小さくなるように、base64エンコードされたデータをbase64デコードしたバイナリ形式のデータに変換する。これによりデータ量が約3/4に減少される。
こうして変換された画像データは、印刷処理が行われるとともに印刷処理装置に接続された外部の記憶装置104に画像ファイルとして保存されても良い。そして、ファイルの保存先が参照できるように識別情報を生成してXML文書に付与する。実施の形態1では、そのファイルのURIを識別情報として生成する。
ステップS3で、まだ読み込んでいない属性データがあるかどうかを判断し、あればステップS2に戻り、前述と同様に引き続き属性データを読み込み、データ形式を変換して画像ファイルに保存する。なお、識別情報が付与されたXML文書に関しても記憶装置104に保存してもよい。
なお、base64エンコードとは、バイナリデータを64種のascii文字に変換する操作である。そして、使用するascii文字は6bitで表現される。すなわち、バイナリデータ3バイト (24bit)は4個のascii文字に変換されることになる。ところで、ascii文字は、有効ビットは6bitであるが、データとしては1バイト(8bit)で表現されるので、3バイトであったバイナリデータが4バイトのデータにエンコードされることになる。よって、図3に示すようなbase64エンコードされたデータはバイナリデータとしてのデータよりサイズが4/3倍に増えている。今回はこれをデコードすることによって印刷処理装置においてデータ量が削減されることになる。
こうしてステップS3で、全てのsrc属性の属性データの解析処理、印刷処理が終了すると、ステップS4に進み、その生成した識別情報を元のbase64エンコードされた属性データを削除する代わりに解析結果としてXML文書中に記述する処理を行う。ここではその保存先を参照できるリンク情報を記述した拡張子を付与する。これによりXML文書の外部リンクとして画像データを参照できる。また、このように適切な拡張子を付与しておくことにより、その拡張子により、そのデータの中身を判断することができる。
上述したように、ステップS2,3の処理によって、全体としてのデータ量を削減することができ、RAM203のメモリ容量が少なくても処理を行うことができる。また、印刷処理装置103においてデータの変換処理を行うことなくこのリンク情報を参照することによってバイナリデータを読出し、再印刷処理を実行することができる。
図5は、図4のステップS4の処理において、入力した文書データの記述に基づいて最適な拡張子を求める処理の詳細を説明するフローチャートである。
ここでは図6のような拡張子を対応付けるテーブルを用意しておく。
図6は、前述のように、データ形式を変換したデータをファイルとして保存する場合、そのファイルの拡張子を、入力した文書データに含まれる拡張子を示す文字列に対応付けるテーブル例を示している。このテーブルは、例えばROM202に記憶されている。この例では「image/jpeg」は、拡張子「jpg」に対応付けられている。
まずステップS11で、属性データを保存する際に、前述のステップS1で検出した特定文字列中に、図6に示す拡張子対応テーブルのエントリの文字列が含まれているかどうかを判定する。含まれていない場合はステップS12に進み、既定の拡張子をつけて保存する。一方、含まれている場合はステップS13で、その拡張子を示す文字列に対応する拡張子をつけて保存する。
本実施の形態1の場合では、図3に示すように、拡張子の文字列「image/jpeg」が含まれているため、図6を参照しそれに対応する拡張子「jpeg」をつけて保存する。また、データ形式の変換方式も、その入力された文書データに基づいて適切なものを選択することができる。
図7は、本実施の形態1において、図4のステップS2でデータ形式を変換する際、入力した文書データの記述に基づいて適切な変換方式を選択する動作を示すフローチャートである。
ここでは、図8に示すデータ変換方式の対応付けテーブルを用意しておく。
図8は、前述のように、データ形式を変換する際、どのようなデータ形式に変換するかを記述したテーブル例を示す図である。このテーブルは、例えばROM202に記憶されている。この例では「base64」は、base64のデコード「base64_decode」に変換するように対応付けられている。
まずステップS21で、前述の図4のステップS2で属性データのデータ形式を変換する際に、ステップS1で検出した文字列中に、図8に示すデータ変換形式の対応テーブルのエントリにある変換方式の識別文字列が含まれているかどうかを判定する。含まれていない場合はステップS22に進み、既定のデータ変換方式でデータ形式を変換する。一方、含まれている場合はステップS23で、図8のテーブルを参照し、それに対応するデータ形式に変換する。
本実施の形態1では、文字列「base64」が含まれているため「base64_decode(){」(base64デコード)でデータ形式を変換する。
以上説明したように本実施の形態1では、src属性の「data:image/jpeg;base64」でエンコードされたjpeg画像データをバイナリ形式のデータに変換して記憶し、そのjpegデータをファイルとして保存する。これにより、元の文書データのデータ量を低減することができる。更に、「data:image/jpeg;base64」でエンコードされたjpeg画像データの代わりにXML文書中にその保存したファイルを示すURIを記述する。これにより、後の工程で、そのURIに基づいて、その保存したデータにアクセスすることで、少ないメモリ容量であっても、印刷処理を行うすることができる。
[実施の形態2]
本発明の実施の形態2では、図9に示す記述形式において、ある要素の開始タグに記述される所定の文字列(特定文字列)を属性の種類情報として検出した場合に、その属性値の読出しと並行してその要素内容として記述されたデータの形式を別の形式に変換し、印刷処理する場合を説明する。尚、この実施の形態2における印刷システム及び印刷処理装置103のハードウェア構成は、前述の実施の形態1の場合と同様であるため、その説明を省略する。
図9は、本発明の実施の形態2に係る印刷処理装置103で受信した文書データの一部の一例を示す図である。
図9に示したように、この文書はXMLで記述されている。ここでは、要素のtype属性(要素の種類を示す情報)として「image/jpeg」というメディアタイプを表す文字列が記述されている。
図10は、本実施の形態2に係る印刷処理装置103における処理を説明するフローチャートで、この処理を実行するプログラムはROM202に記憶されており、CPU201の制御の下に実行される。実施の形態2に係る印刷処理装置103においても、実施形態1と同様に受信したXML文書を先頭から順次受信し、読み込んで解析処理を行う。
まずステップS31の解析処理においては、それぞれの要素の属性に所定のtype属性“image/jpeg”が記述されていないかどうかを判定する。記述されていないと判断した場合は、この解析処理を終了する。
ステップS31で、所定のtype属性が記述されていると判断した場合はステップS32に進み、要素内容の受信、解析処理に並行して、その要素内容を他のデータ形式に順次変換し、印刷処理を行う。このデータ形式の変換は、前述の実施の形態1と同様に、データサイズが小さくなるように、base64エンコードされたデータの場合にはbase64デコードを行う。この変換後のデータの保存も、前述の実施の形態1と同様に、記憶装置104にファイルとして保存する。今形態においても、保存時には、その保存先が参照できるような識別情報を生成して付与する。本実施の形態2では、ファイルとして記憶装置104に保存し、それにURIを識別情報として付加して記憶する。
こうして保存した後ステップS33で、文書に、まだ読み込んでいない残りの要素の内容があるかどうかを判定し、あればステップS32に戻り、前述と同様にデータ変換処理し、変換された画像データに基づいて印刷処理を行う。尚、変換された画像データの保存先の識別情報として、前述の実施の形態1と同様に、入力された文書データの記述に基づいて最適な拡張子を含めることができる。こうしてステップS33で、全ての要素の内容を保存するとステップS34に進み、その生成した識別情報を元の要素の内容の代わりに解析結果として記述する。
図11は、図10のステップS34の処理において、入力した文書データの記述に基づいて最適な拡張子を含める所定の詳細を説明するフローチャートである。
ここでも前述の図6のような拡張子対応テーブルを用意しておく。
図10のステップS32で要素の内容を保存する際に、まずステップS41で、同じ要素内の記述に、図6の拡張子対応表のエントリにある拡張子の識別文字列が含まれているかどうかを判定する。含まれていない場合はステップS42に進み、既定の拡張子を付与して、その変換済のデータを保存する。一方、ステップS41で、エントリにある拡張子の識別文字列が含まれている場合はステップS43に進み、図6を参照して対応する拡張子を付与して保存する。
本実施の形態2の場合は、同じ要素のtype属性の値に文字列「image/jpeg」が含まれているため、拡張子「jpeg」をつけて保存する。
また、データ形式の変換方式も、入力された文書データに基づいて適切なものを選択することができる。
図12は、本実施の形態2において、図10のステップS32でデータ形式を変換する際、入力した文書データの記述に基づいて適切な変換方式を選択する動作を示すフローチャートである。この場合も、図8のようなデータ変換方式対応表を用意しておく。
ステップS32で、要素の内容をデータ形式変換する際に、まずステップS51で、同じ要素内の記述に、図8のデータ変換形式の対応テーブルのエントリにある変換方式の識別文字列が含まれているかどうかを判定する。含まれていない場合はステップS52に進み、既定の方式でデータ形式を変換する。含まれている場合はステップS53に進み、図8のテーブルに従って、対応する方式でデータ形式を変換する。
本実施の形態2の場合、同じ要素のtype属性の値に「image/jpeg」という文字列が含まれているためbase64デコードでデータ形式を変換する。一般的に、メディアタイプ「image/jpeg」だけではbase64エンコードされているかどうかは判断できないが、対応テーブルで、文字列「image/jpeg」に対応するデータ変換形式を定めておくことにより適切なデータ変換方式を認識することができる。
以上説明したように本実施の形態2によれば、sample要素の開始タグから終了タグまでの内容の代わりに生成したURIを記述する。その後、解析処理を進め、その文書データの構造単位に解析結果を出力する。そして、そのファイルに付されたURIを求めることにより、保存されたファイルデータにアクセスすることができる。
尚、以上説明した実施の形態1,2では、印刷処理装置を例に説明したが、本発明はこれに限らず、例えば、携帯電話機、ディスプレイ、ストレージ等のその他の周辺機器、或いはコンピュータ等の汎用な情報処理装置でも同様に適用できる。
例えば、音声再生装置においても適用することができる。具体的には、XML文書中にbase64エンコードされることによって記述されたテキストデータの読出しに並行して、バイナリ形式の音声データに変換し、変換された音声データを再生したり、保存したりすることによって達成することができる。+
以上説明したように本実施の形態によれば、文書中の特定文字列の検出に応じて、それ以降の文書内のデータの受信処理に並行して、より小さなデータサイズとなるデータ形式のデータに変換し、印刷処理を行ったり、ファイルへ保存したりすることができる。
また本実施の形態によれば、入力した文書データの構造単位内に画像データのような大きなデータが含まれていても、メモリなどのリソースの少ない機器であっても有効に処理することができる。また、入出力インタフェースは従来通りなので、本実施の形態を適用する際のアプリケーション側の対応コストは小さくて済む。
なお本発明は、前述した実施の形態の機能を実現するソフトウェアのプログラムを、システム或いは装置に直接或いは遠隔から供給し、そのシステム或いは装置のコンピュータが、その供給されたプログラムコードを読み出して実行することによっても達成される場合を含む。その場合、プログラムの機能を有していれば、その形態はプログラムである必要はない。従って、本発明の機能処理をコンピュータで実現するために、該コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明には、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等、プログラムの形態を問わない。
プログラムを供給するための記憶媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)などがある。その他のプログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続し、該ホームページから本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルをハードディスク等の記憶媒体にダウンロードすることによっても供給できる。また本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明のクレームに含まれるものである。
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布し、所定の条件を満足するユーザに対してインターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせ、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
またコンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部又は全部を行ない、その処理によっても前述した実施形態の機能が実現され得る。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部又は全部を行ない、その処理によっても前述した実施形態の機能が実現される。
本発明の実施の形態に係る印刷処理装置を含む印刷システムの概要を説明する構成図である。 本実施の形態に係る印刷処理装置のハードウェア構成を説明するブロック図である。 本発明の実施の形態1に係る印刷処理装置が受信した文書データの一部の一例を示す図である。 本実施の形態1に係る印刷処理装置における処理を説明するフローチャートである。 図4のステップS4の処理において、入力した文書データの記述に基づいて最適な拡張子を求める処理の詳細を説明するフローチャートである。 ファイルの拡張子を、入力した文書データに含まれる拡張子を示す文字列に対応付けるテーブルの一例を示す図である。 本実施の形態1において、図4のステップS2でデータ形式を変換する際、入力した文書データの記述に基づいて適切な変換方式を選択する動作を示すフローチャートである。 データ形式を変換する際、どのようなデータ形式に変換するかを記述したテーブルの一例を説明する図である。 本発明の実施の形態2に係る印刷処理装置で受信した文書データの一部の一例を示す図である。 本実施の形態2に係る印刷処理装置における処理を説明するフローチャートである。 図10のステップS34の処理において、入力した文書データの記述に基づいて最適な拡張子を含める所定の詳細を説明するフローチャートである。 本実施の形態2において、図10のステップS32でデータ形式を変換する際、入力した文書データの記述に基づいて適切な変換方式を選択する動作を示すフローチャートである。

Claims (10)

  1. 構造化された文書を処理する情報処理装置であって、
    構造化された文書を受信する受信手段と、
    前記構造化された文書に含まれる、第1データ形式としてテキストデータ形式で記述されたデータであることを示す所定の文字列を検出する文字列検出手段と、
    前記文書データの受信処理に並行して、前記文字列検出手段によって検出された所定の文字列に続いて読み込まれるデータを第2データ形式としてバイナリデータ形式で記述されたデータに変換する処理を行うデータ変換手段と、
    前記データ変換手段によって変換されたバイナリデータ形式で記述されたデータをメモリに記憶するバイナリデータ記憶手段と、
    を有することを特徴とする情報処理装置。
  2. 前記データ変換手段によって変換されたバイナリ形式で記述されたデータは画像データまたは音声データであることを特徴とする請求項1に記載の情報処理装置。
  3. 前記第1データ形式よりも前記第2データ形式の方がデータ量が少ないことを特徴とする請求項1又は2に記載の情報処理装置。
  4. 前記データ変換手段により変換されたバイナリデータ形式で記述されたデータを記憶装置に保存する保存手段と、
    前記保存手段により保存されたバイナリデータ形式のデータのリンク情報を前記第1データ形式としてテキストデータ形式で記述されたデータの代わりに前記構造化された文書に記述する処理手段とを有することを特徴とする請求項1乃至3のいずれか1項に記載の情報処理装置。
  5. 構造化された文書データを処理する情報処理方法であって、
    前記構造化された文書を受信手段によって受信する受信工程と、
    前記構造化された文書に含まれる、第1データ形式としてテキストデータ形式で記述されたデータであることを示す所定の文字列を文字列検出手段において検出する文字列検出工程と、
    前記文書データの受信処理に並行して、前記文字列検出手段によって検出された前記所定の文字列に続いて読み込まれるデータを第2データ形式としてバイナリデータ形式で記述されたデータに変換する処理をデータ変換手段において行うデータ変換工程と、
    前記データ変換手段によって変換されたバイナリデータ形式で記述されたデータをメモリに記憶するバイナリデータ記憶工程と、
    を有することを特徴とする情報処理方法。
  6. 前記データ変換工程において変換されたバイナリ形式で記述されたデータは画像データまたは音声データであることを特徴とする請求項5に記載の情報処理方法。
  7. 前記第1データ形式よりも前記第2データ形式の方がデータ量が少ないことを特徴とする請求項5又は6に記載の情報処理方法。
  8. 前記データ変換工程において変換された前記第2データ形式のデータを記憶装置に保存する保存工程と、
    前記保存工程において保存されたバイナリデータ形式のデータのリンク情報を、処理手段によって前記第1データ形式としてテキストデータ形式で記述されたデータの代わりに前記構造化された文書に記述する処理工程とを更に有することを特徴とする請求項5乃至7のいずれか1項に記載の情報処理方法。
  9. 請求項5ないし請求項8のいずれか1項に記載の情報法処理方法を実行するためのプログラム。
  10. 請求項9のプログラムを記憶した記憶媒体。
JP2005091856A 2005-03-28 2005-03-28 情報処理装置及びその方法 Expired - Fee Related JP3962748B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2005091856A JP3962748B2 (ja) 2005-03-28 2005-03-28 情報処理装置及びその方法
CNA2006100651953A CN1841382A (zh) 2005-03-28 2006-03-27 信息处理设备及其方法
US11/391,953 US7793207B2 (en) 2005-03-28 2006-03-28 Converting text data into binary data using external link information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005091856A JP3962748B2 (ja) 2005-03-28 2005-03-28 情報処理装置及びその方法

Publications (2)

Publication Number Publication Date
JP2006277031A true JP2006277031A (ja) 2006-10-12
JP3962748B2 JP3962748B2 (ja) 2007-08-22

Family

ID=37030406

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005091856A Expired - Fee Related JP3962748B2 (ja) 2005-03-28 2005-03-28 情報処理装置及びその方法

Country Status (3)

Country Link
US (1) US7793207B2 (ja)
JP (1) JP3962748B2 (ja)
CN (1) CN1841382A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009031474A1 (ja) 2007-09-07 2009-03-12 Humming Heads Inc. 情報検索システム、情報検索方法及びプログラム
JP2009157852A (ja) * 2007-12-28 2009-07-16 Mitsubishi Space Software Kk 空間データ変換装置、空間データ変換プログラム、空間データ変換方法
JP2010026960A (ja) * 2008-07-24 2010-02-04 Nec Corp 情報処理装置
JP2010250434A (ja) * 2009-04-13 2010-11-04 Canon Inc 情報処理装置、情報処理方法、プログラム及び記憶媒体

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008073921A (ja) * 2006-09-20 2008-04-03 Canon Inc 印刷装置およびその制御方法
US8200618B2 (en) * 2007-11-02 2012-06-12 International Business Machines Corporation System and method for analyzing data in a report
WO2010002407A1 (en) * 2008-07-02 2010-01-07 Hewlett-Packard Development Company, L.P. Performing administrative tasks associated with a network-attached storage system at a client
US8601438B2 (en) * 2008-11-17 2013-12-03 Accenture Global Services Limited Data transformation based on a technical design document
CN104580097A (zh) * 2013-10-22 2015-04-29 腾讯科技(深圳)有限公司 一种数据处理方法、装置及系统
CN105282124A (zh) * 2014-07-24 2016-01-27 上海未来宽带技术股份有限公司 基于xmpp协议的渐进式图片的传输方法及呈现方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6104833A (en) * 1996-01-09 2000-08-15 Fujitsu Limited Pattern recognizing apparatus and method
DE69729826T2 (de) * 1996-05-30 2004-11-25 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zur Übertragung von Daten, Verfahren und Vorrichtung zum Empfang von Daten und Kommunikationssystem
US6094684A (en) * 1997-04-02 2000-07-25 Alpha Microsystems, Inc. Method and apparatus for data communication
JP2000148438A (ja) 1998-11-09 2000-05-30 Fuji Xerox Co Ltd 構造化文書の出力装置
US6912314B1 (en) * 1999-11-30 2005-06-28 Xerox Corporation Reformatting binary image data to improve compression using byte oriented compression
US6879988B2 (en) * 2000-03-09 2005-04-12 Pkware System and method for manipulating and managing computer archive files
JP3610001B2 (ja) 2000-11-20 2005-01-12 シャープ株式会社 電子メールシステム
US7178100B2 (en) * 2000-12-15 2007-02-13 Call Charles G Methods and apparatus for storing and manipulating variable length and fixed length data elements as a sequence of fixed length integers
DE60214094T2 (de) * 2001-07-19 2007-04-12 TransCore Link Logistics Corp., Mississauga Phasennachlaufeinrichtung für linear modulierte Signale
JP2003108331A (ja) 2001-09-27 2003-04-11 Fujitsu Ltd データ変換方法、プログラム及び記録媒体
US7023974B1 (en) * 2002-10-31 2006-04-04 America Online, Inc. Compression of electronic communications
JPWO2005101210A1 (ja) 2004-04-09 2008-03-06 シャープ株式会社 データ解析装置およびデータ解析プログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009031474A1 (ja) 2007-09-07 2009-03-12 Humming Heads Inc. 情報検索システム、情報検索方法及びプログラム
US8560540B2 (en) 2007-09-07 2013-10-15 Humming Heads Inc. Information search system, information search method, and program
JP2009157852A (ja) * 2007-12-28 2009-07-16 Mitsubishi Space Software Kk 空間データ変換装置、空間データ変換プログラム、空間データ変換方法
JP2010026960A (ja) * 2008-07-24 2010-02-04 Nec Corp 情報処理装置
JP2010250434A (ja) * 2009-04-13 2010-11-04 Canon Inc 情報処理装置、情報処理方法、プログラム及び記憶媒体

Also Published As

Publication number Publication date
US7793207B2 (en) 2010-09-07
JP3962748B2 (ja) 2007-08-22
US20060214707A1 (en) 2006-09-28
CN1841382A (zh) 2006-10-04

Similar Documents

Publication Publication Date Title
JP3962748B2 (ja) 情報処理装置及びその方法
JP4999791B2 (ja) 情報処理装置、その制御方法、及びプログラム
US8542394B2 (en) Image processing apparatus for recording and managing image data input/output therein, and its control method
US7860892B2 (en) Information processing apparatus, history file generation method and program
JP4661580B2 (ja) 画像処理装置及びプログラム
JP4631792B2 (ja) 印刷記録管理装置、プログラム及び方法
JP2007253598A (ja) 印刷装置
US20060056713A1 (en) Image coding apparatus and image coding method
JP4293959B2 (ja) 画像処理装置、プログラム及び記録媒体
JP2008310816A (ja) 複数のマークアップ・ページ・データをコンパクトに表現するシステムおよび方法
JP2008211747A (ja) 画像処理装置、サーバ装置、タスク処理方法、記憶媒体、プログラム
US7376566B2 (en) Image forming apparatus and method
US7616822B2 (en) Image coding apparatus and image coding method
JP5409090B2 (ja) 情報処理装置、情報処理方法、プログラム及び記憶媒体
JP2009027648A (ja) 画像処理装置
JP2007025815A (ja) 画像処理方法、画像処理装置、デジタルカメラ及びコンピュータプログラム
JP5182214B2 (ja) 処理実行装置、制御方法および制御プログラム
JP2009134645A (ja) データ処理装置、印刷処理方法、記憶媒体、プログラム
JP2010067281A (ja) ログ提供装置及びログ提供方法
JP4957816B2 (ja) Pdlデータ処理装置とpdlデータ処理プログラム
JP2005284469A (ja) データ処理装置およびフォーム処理方法およびコンピュータが読み取り可能なプログラムを格納した記憶媒体およびプログラム
JP5111302B2 (ja) 画像処理装置、画像処理装置の制御方法、およびプログラム
JP2008310774A (ja) 情報処理装置及びその制御方法、コンピュータプログラム
JP4341518B2 (ja) 画像処理装置、画像処理プログラム
US7386788B2 (en) Data structure, processing method of structured document described using that data structure, program for implementing the method, and storage medium storing the program

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060929

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061128

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070112

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070315

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20070412

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070508

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070521

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100525

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110525

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120525

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120525

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130525

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140525

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees