JP2001022615A - データ処理方法及び装置及び記憶媒体 - Google Patents

データ処理方法及び装置及び記憶媒体

Info

Publication number
JP2001022615A
JP2001022615A JP11189636A JP18963699A JP2001022615A JP 2001022615 A JP2001022615 A JP 2001022615A JP 11189636 A JP11189636 A JP 11189636A JP 18963699 A JP18963699 A JP 18963699A JP 2001022615 A JP2001022615 A JP 2001022615A
Authority
JP
Japan
Prior art keywords
data
metadata
reading
binary data
data processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11189636A
Other languages
English (en)
Other versions
JP2001022615A5 (ja
JP4072293B2 (ja
Inventor
Miyuki Enokida
幸 榎田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP18963699A priority Critical patent/JP4072293B2/ja
Priority to US09/595,882 priority patent/US6629101B1/en
Publication of JP2001022615A publication Critical patent/JP2001022615A/ja
Publication of JP2001022615A5 publication Critical patent/JP2001022615A5/ja
Application granted granted Critical
Publication of JP4072293B2 publication Critical patent/JP4072293B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/81Indexing, e.g. XML tags; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/912Applications of a database
    • Y10S707/913Multimedia
    • Y10S707/915Image
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/912Applications of a database
    • Y10S707/913Multimedia
    • Y10S707/916Audio
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99943Generating database or data structure, e.g. via user interface

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

(57)【要約】 【課題】メタデータをバイナリデータに接続する時に、
バイナリデータの終端コードをメタデータの最後に挿入
することにより、既存のアプリケーションに影響を与え
ずに、バイナリデータにメターデータを登録可能とす
る。 【解決手段】ステップS301において、バイナリデータを
読み込む。ステップS302で、上記バイナリデータに付与
すべきメタデータを読み込む。ステップS303において、
上記読み込まれたメタデータが正当なXMLで記述されて
いると判断された場合、ステップS304へ進み、上記ステ
ップS301読み込まれたバイナリデータの後に、ステップ
S302で読み込まれたメタデータを接続し、ステップS306
でバイナリデータの種類を判断し、ステップS308でバイ
ナリデータの終端コードをメタデータの後ろに挿入し、
ステップS306において、得られたデータの全体をバイナ
リデータファイルとして出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明はバイナリデータとメ
タデータを扱うデータ処理方法及び装置及び記憶媒体に
関する。
【0002】
【従来技術の説明】メタデータ(meta-data)とは、
「データに関する付属データ」であり、画像データや音
声データ等のバイナリデータを説明するデータとして用
いられている。しかし、バイナリデータとこれに対応す
るメタデータが別々のファイルで存在した場合、ファイ
ルの移動やコピーの際に、ユーザはバイナリデータとメ
タデータとを同時に管理しなければならず、非常にわず
らわしいことになる。
【0003】そこで一般に、バイナリデータとメタデー
タの管理を容易にするために、バイナリデータとメタデ
ータを記述する様々な方法が提案されてきた。この種の
従来技術は、新しいバイナリフォーマットを規定する方
法と、データベースで管理する方法の2つに分けること
ができる。
【0004】まず、新しいバイナリフォーマットを規定
する方法の一例をあげると、画像フォーマットではTif
f、Exif、Flashpixなどがある。図9は、バイナリデー
タにメタデータを埋め込んだフォーマットの概観を示す
図である。バイナリデータとしては、例えば画像データ
が挙げられる。図9に示されるように、画像のヘッダ部
分にメタデータを記述する枠組みを設け、そこにユーザ
がメタデータを記述するというのが一般的な方法であ
る。このようにメタデータを記述することにより、デー
タの検索・分類が容易になる。また、バイナリデータ内
にメタデータを含むようになるので、1つのファイルで
管理でき、ファイルの管理は比較的容易になる。
【0005】次に、バイナリデータとメタデータをデー
タベースで管理する方法を説明する。図10はバイナリ
データとメタデータをデータベースで管理する方法を概
念的に示した図である。図10に示されるような、別々
のファイルで存在するバイナリデータとメタデータをデ
ータベース等を用いて管理するという方法も広く行われ
ているものである。この場合は既存のバイナリデータ
が、既存のアプリケーションでそのまま使えるという利
点がある。
【0006】
【発明が解決しようとする課題】しかしながら、上述し
たようなメタデータを記述する新フォーマットを規定す
る方法とデータベースを用いてメタデータを管理する方
法のそれぞれに問題がある。
【0007】まず、メタデータを記述する新フォーマッ
トを規定した場合には、既存のバイナリデータを当該新
フォーマットに変換し、なおかつその新フォーマット内
にメタデータを記述しなけれなばならない。更に、その
新フォーマット内のメタデータを用いて検索するために
は、当該新フォーマット対応のアプリケーションが必要
となる。すなわち、メタデータを記述したり利用したり
するために、非常に多くのステップと専用の環境が必要
になるという問題がある。また、このような新フォーマ
ットのバイナリデータを処理する(例えば画像データで
あれば画像の出力)ためには、当該フォーマットに対応
したアプリケーションが必要であり、既存のアプリケー
ションでは対応できなくなる。
【0008】そのうえ、メタデータの記述方法も新フォ
ーマットにおいて独自に決められたものであり、新フォ
ーマット内のメタデータを利用するアプリケーションを
作成するためには、新規にメタデータの検索ルーチンを
つくらなければならないという問題もある。さらに、新
しい枠組みのメタデータを記述するにはフォーマットの
規定を変更しなければならないという問題点もあった。
【0009】一方、データベースを用いてバイナリデー
タとメタデータを同時に管理する場合、データベースソ
フトが無ければメタデータの登録も利用もできないとい
う問題があった。また、登録したメタデータを表示する
ためにも専用のソフトウェアが必要である。更に、バイ
ナリデータをデータベース外に持っていくと、メタデー
タは付加されず、メタデータのないバイナリデータとな
ってしまうという問題点もあった。
【0010】さらに、メタデータを管理するための情報
の中に、バイナリデータのフォーマット上での予約語あ
るいは、特別な意味をなすコードが入っていた場合、既
存のアプリケーションが誤動作する可能性があった。
【0011】本発明はメタデータの記述・検索に関する
上記の問題点に鑑みてなされたものであり、既存のアプ
リケーションに影響を与えずに、バイナリデータにメタ
データを登録可能とすることを目的とする。
【0012】また、本発明の他の目的は、メタデータが
登録されたバイナリデータを、既存のアプリケーション
で処理することが可能な形態で提供可能とすることにあ
る。
【0013】また、本発明の他の目的は、メタデータの
記述に一般的なデータ記述言語を用いることにより、デ
ータ記述言語用の既存のツールを利用することを可能と
し、対応アプリケーションの開発を容易にすることにあ
る。
【0014】さらに、本発明の他の目的は、メタデータ
が記述されたバイナリデータからメタデータを抽出し、
例えば検索、参照、変更等の処理に供することを可能と
することにある。
【0015】さらに、本発明の他の目的は、メタデータ
が記述されたバイナリデータを容易に判別する方法を提
供することも目的とする。
【0016】
【課題を解決するための手段】上記の目的を達成するた
めに、本発明の一態様によるデータ処理方法はたとえば
以下の工程を備える。すなわち、バイナリデータにメタ
データを登録するデータ処理方法であって、メタデータ
の付与対象のバイナリデータを読み込む第1読込工程
と、前記バイナリデータに付与すべきメタデータを読み
込む第2読込工程と、前記第1読込工程で読み込まれた
バイナリデータの後に、前記第2読込工程で読み込まれ
たメタデータを接続する第1接続工程と、前記第1接続
工程で接続されたメタデータの後に、前記バイナリデー
タに対応する終端コードを接続する第2接続工程と、前
記第1及び第2接続工程によって得られたデータの全体
を一つのファイルとして出力する出力工程とを備える。
【0017】また、上記の目的を達成するための本発明
の他の態様によるデータ処理方法はたとえば以下の工程
を備える。すなわち、メタデータが登録されたバイナリ
データにおいてメタデータを判別する方法であって、デ
ータを読み込む読込工程と、前記読込工程で読み込まれ
たデータを末尾より検査し、終端コードに続いて所定の
データ記述言語における適正な形式で記述されたデータ
が存在するか否かを判定することにより、該データに含
まれるメタデータを判別する判別工程とを備える。
【0018】また、本発明の他の態様によれば、上記の
データ処理方法を実現するデータ処理装置が提供され
る。さらに本発明の他の態様によれば、上記のデータ処
理方法をコンピュータに実現させるための制御プログラ
ムを格納した記憶媒体が提供される。
【0019】
【発明の実施の形態】以下、添付の図面を用いて本発明
の実施形態を説明する。
【0020】<第1の実施形態>本実施形態では、バイ
ナリデータの後ろに、所定のデータ記述言語(本実施形
態ではXMLを用いる)で記述されたメタデータを接続
することによりメタデータの付加されたバイナリデータ
を生成する。このとき、接続されたメタデータの中に、
バイナリデータのフォーマット上での予約語、あるい
は、特別な意味をなすコードが入っていた場合、既存の
アプリケーションが誤動作してしまう場合がある。以下
では、まずこの点を説明し、その後で本実施形態のデー
タ処理装置について説明することにする。
【0021】たとえば、バイナリデータがJPEG方式
で符号化されている場合、ファイルの最後にEOI(En
d Of Image)コードが存在するか否かを判断する場合が
ある。図2は、EOIマーカーコード検索の手順を示す
フローチャートである。
【0022】図2において、まずステップS200で、
変数POSにJPEG符号化データのファイルのバイト
数をセットする。ステップS201で変数POSから2
を引く。ステップS202で、変数POSの位置にファ
イル読み出し位置をシークする。次にステップS203
で2バイトリードする。
【0023】ステップS204にて、読み込んだ2バイ
トのデータがEOIコードか否かを判断し、EOIコー
ドの場合はステップS205に移動し、EOIコードが
あったと判断する。一方ステップS204で、2バイト
のデータがEOIコードではない場合は、ステップS2
06に移動する。ステップS206では、JPEG符号
化データ内にある可能性があるマーカーコードか否かを
判断する。このステップでマーカコードであると判断す
ると、ステップS207に移動し、このJPEGファイ
にルの中には、EOIコードがなかったと判断する。一
方ステップS206にて、マーカコードではないと判断
した場合は、ステップS208に移る。ステップS20
8では、現在の変数POSの値から1を引く。次にステ
ップS209で、変数POSが0か否かを判断する。0
の場合は、当該ファイルの先頭まで読み込んだことにな
るので、処理をステップS207に移動し、EOIマー
カコードはなかったと判断する。一方ステップS209
で変数POSが0ではない場合は、ステップS202に
戻り、上記の処理を繰り返す。
【0024】以上の処理により、これから処理を行おう
としているJPEGファイルが、完全なJPEGファイ
ル(例えば途中でコードが終わっていないかどうか等)
か否かを判断することができる。そして、例えば、EO
Iコードが存在しないJPEGファイルに対しては、デ
コード処理を行わないといった処理を行うことができる
ようになる。
【0025】以上の様な処理が実行された場合、JPE
G符号化データの後ろにメタデータが接合されている
と、図2で説明したEOIの存否判断において誤動作す
る可能性がある。また、EOIコードをファイルの最後
から探す場合でも、接合したメタデータのデータ量分コ
ードの判断を繰り返す必要が生じてしまい、処理時間が
かかるという問題点もあった。
【0026】本実施形態ではこれらの不具合を解決する
データ処理装置を説明する。
【0027】図1は第1の実施形態によるデータ処理装
置の構成を示すブロック図である。図1において、10
0は読込部であり、スキャナ装置などを用いて画像を読
み込む。101は入力部であり、ユーザからの指示やデ
ータを入力するもので、キーボードやポインティング装
置を含む。102は蓄積部であり、バイナリデータやメ
タデータを蓄積する。蓄積部102としては、ハードデ
ィスクを用いるのが一般的である。103は表示部であ
り、蓄積部102に蓄積されたバイナリデータを表示し
たり、読込部100で読み込まれた画像データを表示す
る。表示部103としては、CRTや液晶表示装置が一
般的である。
【0028】104はCPUであり、上述した各構成の
処理のすべてに関わり、ROM105とRAM106は
その処理に必要なプログラムやデータを格納する領域、
或いは作業領域をCPU104に提供する。なお、図3
のフローチャートを参照して後述する本実施形態の処理
手順を実現するための制御プログラムもROM105に
格納されているものとする。もちろん、蓄積部102に
その制御プログラムを格納しておき、CPU104によ
る実行に応じてその制御プログラムがRAM106上へ
ロードされるような構成であってもよい。
【0029】なお、第1の実施形態のデータ処理装置に
は上記以外にも、種々の構成要素が設けられているが、
本発明の主眼ではないので、その説明については省略す
る。
【0030】つぎに、以上のように構成されたデータ処
理装置において、メタデータをバイナリデータに登録す
る処理について説明する。図3は、第1の実施形態によ
るメタデータの登録処理を説明するフローチャートであ
る。
【0031】図3において、まず、ステップS301
で、ユーザによって指定されたバイナリデータをメモリ
(RAM106)上に読み込む。これは例えば所望のバ
イナリデータファイル名をキーボードから入力したり、
ポインティング装置(例えばマウス)によって当該バイ
ナリデータのアイコンを指示することによりなされる。
次にステップS302において、ユーザによって指定さ
れた、メタデータが記述されているXMLファイルをメ
モリ(RAM106)上に読み込む。このXMLファイ
ルの指定も、キーボードからファイル名を入力したり、
ポインティング装置(例えばマウス)で対応するアイコ
ンを指示する等によって行われる。
【0032】次にステップS303で、メタデータを記
述したXMLファイルが適正形式のXMLデータである
かを調べる。この適性形式の判定では、XMLファイル
の記述フォーマットを満足しているか(例えば、タグの
左右の括弧が正しく対をなしているか、タグ付けの形式
が正しいかどうか等)がチェックされる。なお、適性形
式のXMLデータであるか否かの判定は、正当なXML
データであるか否かを含めたチェックであってもよい。
ここで、正当なXMLデータか否かの判定は、例えば、
XMLデータがDTD(Document Type Definition)等
のスキーマに従って記述されているかどうか等のチェッ
クを行うことでなされる。
【0033】ステップS303において適正形式のXM
Lデータでないと判定された場合にはステップS305
に進む。ステップS305では、XMLデータにエラー
がある旨を表示部103に表示し、本処理を終了する。
【0034】一方、ステップS303においてXMLフ
ァイルが適正形式のXMLデータであると判定された場
合には、処理はステップS304に進む。ステップS3
04では、ステップS301でメモリ上に読み込まれた
バイナリデータの後ろに当該メタデータを接続すること
により、メタデータの登録を行う。
【0035】次にステップS306で、当該バイナリデ
ータ(ステップS301で読み込んだバイナリデータ)
の種類を判断する。この判断は、たとえばバイナリデー
タが、JPEG符号化データでるとか、MPEG1符号
化データあるとかを判断する。そしてその結果を基にス
テップS307で、ステップS304にて追加/登録し
たメタデータの最後にバイナリデータの終端コードを追
加するか否かを判断する。この判断は、例えば画像デー
タファイルフォーマットの仕様から、終端コードが存在
するバイナリデータであるか否かを判断することにより
行う。すなわち、終端コードを有するバイナリデータで
ある場合は、追加すると判断され、ステップS308に
て終端コードを追加した後にステップS309に進む。
一方、終端コードを追加しないと判断された場合は、ス
テップS307から直接ステップS309に進む。
【0036】その後、ステップS309において、メタ
データを追加/登録したバイナリデータを出力し、処理
を終了する。なお、ステップS309におけるデータ出
力により、図4に示されるデータ構造を有するデータが
1つのファイルとして蓄積部102に格納されることに
なる。
【0037】なお、本実施形態の場合の終端コードと
は、バイナリデータがJPEG符号化方式で符号化され
ている場合は、EOIコードを、あるいはバイナリデー
タがMPEG1符号化方式で符号化されている場合には
SECコードを入れる。また、バイナリデータファイル
フォーマットに終端コードが無い場合は、メタデータの
最後に終端を示すコードを接合しないように制御され
る。
【0038】以上説明したように、第1の実施形態によ
れば、メタデータをXMLで記述し、バイナリデータの
最後に接合することにより、既存のバイナリデータにメ
タデータを登録することができる。
【0039】図4は本実施形態によるバイナリデータへ
のメタデータの登録状態を説明する図である。図4に示
されるように、メタデータをXMLで記述し、このXM
Lデータをバイナリデータの最後に接続し、さらにこの
メタデータの最後に所定のコードを付加することによ
り、既存のアプリケーションに影響を及ぼすことなく、
既存のバイナリデータにメタデータを登録することが可
能となる。すなわち、メタデータが登録されたバイナリ
データを、既存のアプリケーションで処理することが可
能な形態で提供することができる。例えば、図4の場
合、EOIコードを検索して処理が行われる場合であっ
ても、確実にEOIコードを検出でき、正しく処理が行
われることになる。
【0040】また、メタデータとして既存のデータ記述
言語を用いれば、メタデータの編集、参照等に際して、
当該データ記述言語用の既存のツールをそのまま用いる
ことができ、開発に関する手間も省くことができる。
【0041】例えば、本実施形態では、メタデータはX
MLで記述されているため、このXMLデータ部分を抽
出しておくことにより、XMLデータを理解するツール
があれば、メタデータの追加・変更・参照が可能であ
り、非常に汎用性に優れている。なお、XMLデータ部
分の抽出については第2の実施形態で詳しく説明する。
【0042】<第2の実施形態>第1の実施形態では、
バイナリデータのフォーマットに合わせて、そのバイナ
リデータの終端コードを、接合したメタデータの後ろに
接合することを説明した。第2の実施形態では、予め、
サポートする画像データファイルフォーマットを設定し
ておき、その画像データファイルフォーマットのサポー
ト上必要な終端コード全てをメタデータの最後に接合す
る場合を説明する。
【0043】たとえばJPEGとMPEG1の画像デー
タファイルフォーマットをサポートするときは、JPE
GのEOIコードと、MPEG1のSECコードの両方
をメタデータの最後に追加する。図8は第2の実施形態
によるメタデータが追加/登録されたバイナリデータの
データ構成を示す図である。図8では、JPEGの終端
コードであるEOIコードと、MPEG1の終端コード
であるSECコードの2つのコードが入っている。この
ときの挿入順は、図8に示される順序に限らないことは
言うまでもない。また、対象となるバイナリデータフォ
ーマットは、JPEGやMPEGだけでなく、その他の
フォーマットのバイナリデータであっても良い。
【0044】なお、第2の実施形態によるメタデータの
登録処理は、図3に示したフローチャートにおいてステ
ップS306とステップS307を省略して無条件でス
テップS308を実行するようにし、ステップS308
では、上述のようにサポートするフォーマットの終端コ
ードを付加するようにすることで実現できる。このた
め、第1の実施形態におけるステップS306に示す、
バイナリデータのフォーマットを判断する処理を省略で
き、高速に処理することが可能となる。
【0045】<第3の実施形態>第1及び第2の実施形
態においてバイナリデータにメタデータを登録する方法
を説明した。第3の実施形態では、バイナリデータにメ
タデータが登録されているかどうかを判別し、登録され
ている場合にはそのメタデータを抽出する処理について
説明する。なお、第3の実施形態におけるデータ処理装
置の構成は第1の実施形態(図1)と同様であるのでこ
こでは説明を省略する。
【0046】以下、指定されたファイルのデータに第1
或いは第2の実施形態で説明した如きメタデータが登録
されているか否かの判定と、登録されたメタデータを抽
出する動作について説明する。図5は第3の実施形態に
よる登録されたメタデータの判別及び抽出手順を示すフ
ローチャートである。なお、本実施形態では、抽出され
たメタデータを表示部103に表示するが、出力の形態
はこれに限らない。例えば、抽出したメタデータを検索
処理に提供するように構成してもよいことは当業者には
明らかであろう。
【0047】図5によれば、まず、ステップS501
で、ユーザの指示により、メタデータが登録されている
かを判別したいファイル、即ち処理対象データを指定す
る。ステップS501における、処理対象データの指定
は、キーボードから当該バイナリデータのファイル名を
入力したり、対応するアイコンをポインティング装置
(マウス)で指示することにより行われる。
【0048】次にステップS502において、指定され
たファイルのデータにXMLで記述されたメタデータが
登録されているかどうかを判別する。以下、ステップS
502における判別処理の詳細について図6のフローチ
ャートと、図7の概略図にしたがって説明する。図6は
第2の実施形態によるメタデータの判別処理の詳細を説
明するフローチャートである。また、図7はメタデータ
としてXMLデータが登録されたバイナリデータのデー
タ構成例を示す図である。
【0049】第1の実施形態で説明したように、メタデ
ータとしてのXMLデータが登録されている処理対象デ
ータのデータ構成は図7のようになっている。したがっ
て、メタデータの有無の判別は以下のように行われる。
【0050】図6に示されるように、まず、ステップS
601で、ステップS501で指定されたファイルのデ
ータ全体(処理対象データの全体)をメモリ(RAM1
06)上に読み込む。なお、第1の実施形態のステップ
S306によって出力されたデータは一つのファイルと
して管理されるので、一般的なファイル管理システムに
よってこのデータの全体を読出すことが可能である。
【0051】次にステップS602において、ステップ
S601で読み込んだデータの最後に、終了コードに続
いて“</PhotoXML>”という文字列があるか調べる。
存在しなかった場合はステップS605に進む。
【0052】一方、読み込んだ処理対象データの最後
に、終了コードに続いて“</PhotoXML>”という文字
列が存在した場合はステップS603に進む。ステップ
S603では“</PhotoXML>”という文字列の前方に
“<PhotoXML>”という文字列が存在するかどうかを調
べ、さらにそれらの文字列で囲まれたデータが、XML
の適正形式で記述されているかを確認する。なお、この
とき、XMLの正当なデータであるか否かの判定を含め
て行うようにしてもよい。適性形式か否かの判定、正当
なデータか否かの判定は、第1の実施形態(ステップS
303)で説明したとおりである。
【0053】ステップS603において適正形式である
ことが確認された場合は、ステップS604にすすむ。
ステップS604においては、メタデータが登録されて
いるものと結論づけ、本処理を終了する。一方、ステッ
プS603において適正形式であることが確認されなか
った場合には、処理はステップS605に進む。ステッ
プS605においては、メタデータは登録されていない
ものと結論づける。すなわち、ステップS602で、当
該バイナリデータの最後に文字列“</PhotoXML>”が
存在しない場合、ステップS603で文字列“<PhotoX
ML>”が存在しない場合、或いはステップS603で内
部の記述が適正でないと判定された場合には、処理はス
テップS605にすすみ、当該処理対象データにメタデ
ータは登録されていないものと結論づける。以上で、メ
タデータの判別を終了する。
【0054】次に、図5のフローチャートにもどる。図
6のフローチャートで示される処理によってメタデータ
が登録されていると結論づけられた場合には、処理はス
テップS503に進む。ステップS503では、文字列
“<PhotoXML>”と“</PhotoXML>”で囲まれた部分
のXMLデータに基づいて登録されているメタデータの
内容を表示し、処理を終了する。一方、ステップS50
2でメタデータが登録されていないと判定された場合に
はそのまま処理を終了する。
【0055】以上説明したように、第3の実施形態によ
れば、メタデータ付きのバイナリデータと通常のバイナ
リデータとの判別を、データの末尾にXMLデータが適
正形式で記述されているか否かによって判別することが
可能となる。また、メタデータが判別された場合には、
そのメタデータを表示することが可能となる。
【0056】すなわち、第3の実施形態によれば、メタ
データが登録されたバイナリデータとメタデータが登録
されていないバイナリデータとを判別するとともに、登
録されたメタデータを抽出することが可能となる。従っ
て、メタデータとして既存のデータ記述言語を用いれ
ば、メタデータを用いた検索に際して、当該データ記述
言語用の既存のツールをそのまま用いることができ、開
発に関する手間も省くことができる。
【0057】なお、上記各実施形態では、メタデータと
してXMLデータを用いたがこれに限られるものではな
い。例えば、SGMLやHTML等のデータ記述言語で
あってもよい。また、バイナリデータとしては静止画像
データ、動画像データ、音声データ等が挙げられる。な
お、第3の実施形態では、第1の実施形態の手順で提供
されるデータ(図7)に対する処理を説明したが、第2
の実施形態の手順で提供されたデータ(図8)を処理対
象とすることももちろん可能である。この場合、ステッ
プS602で認識される終了コードが複数個(第2の実
施形態では2つ)となる。
【0058】なお、本発明は、複数の機器(例えばホス
トコンピュータ,インタフェイス機器,リーダ,プリン
タなど)から構成されるシステムに適用しても、一つの
機器からなる装置(例えば、複写機,ファクシミリ装置
など)に適用してもよい。
【0059】また、本発明の目的は、前述した実施形態
の機能を実現するソフトウェアのプログラムコードを記
録した記憶媒体を、システムあるいは装置に供給し、そ
のシステムあるいは装置のコンピュータ(またはCPU
やMPU)が記憶媒体に格納されたプログラムコードを
読出し実行することによっても、達成されることは言う
までもない。
【0060】この場合、記憶媒体から読出されたプログ
ラムコード自体が前述した実施形態の機能を実現するこ
とになり、そのプログラムコードを記憶した記憶媒体は
本発明を構成することになる。
【0061】プログラムコードを供給するための記憶媒
体としては、例えば、フロッピディスク,ハードディス
ク,光ディスク,光磁気ディスク,CD−ROM,CD
−R,磁気テープ,不揮発性のメモリカード,ROMな
どを用いることができる。
【0062】また、コンピュータが読出したプログラム
コードを実行することにより、前述した実施形態の機能
が実現されるだけでなく、そのプログラムコードの指示
に基づき、コンピュータ上で稼働しているOS(オペレ
ーティングシステム)などが実際の処理の一部または全
部を行い、その処理によって前述した実施形態の機能が
実現される場合も含まれることは言うまでもない。
【0063】さらに、記憶媒体から読出されたプログラ
ムコードが、コンピュータに挿入された機能拡張ボード
やコンピュータに接続された機能拡張ユニットに備わる
メモリに書込まれた後、そのプログラムコードの指示に
基づき、その機能拡張ボードや機能拡張ユニットに備わ
るCPUなどが実際の処理の一部または全部を行い、そ
の処理によって前述した実施形態の機能が実現される場
合も含まれることは言うまでもない。
【0064】
【発明の効果】以上説明したように、本発明によれば、
メタデータをデータ記述言語で記述し、バイナリデータ
の最後に接合することにより、既存のバイナリデータに
メタデータを登録することができる。また、メタデータ
が登録されたバイナリデータと通常のバイナリデータも
容易に判別することが可能であり、さらに、メタデータ
の登録や検索に際しても、既存のデータ記述言語専用の
ツールをそのまま用いることができ、開発に関する手間
も省くことができる。また、メタデータの最後にバイナ
リデータの終端コードを入れることにより、バイナリデ
ータの完全性を判断する部分も高速に処理することがで
きる。
【図面の簡単な説明】
【図1】第1の実施形態によるデータ処理装置の構成を
示すブロック図である。
【図2】EOIマーカーコード検索の手順を示すフロー
チャートである。
【図3】第1の実施形態によるメタデータの登録処理を
説明するフローチャートである。
【図4】本実施形態によるバイナリデータへのメタデー
タの登録状態を説明する図である。
【図5】第3の実施形態による登録されたメタデータの
判別及び抽出手順を示すフローチャートである。
【図6】第2の実施形態によるメタデータの判別処理の
詳細を説明するフローチャートである。
【図7】メタデータとしてXMLデータが登録されたバ
イナリデータのデータ構成例を示す図である。
【図8】第2の実施形態によるメタデータが追加/登録
されたバイナリデータのデータ構成を示す図である。
【図9】バイナリデータにメタデータを埋め込んだフォ
ーマットの概観を示す図である。
【図10】バイナリデータとメタデータをデータベース
で管理する方法を概念的に示した図である。

Claims (28)

    【特許請求の範囲】
  1. 【請求項1】 バイナリデータにメタデータを登録する
    データ処理方法であって、 メタデータの付与対象のバイナリデータを読み込む第1
    読込工程と、 前記バイナリデータに付与すべきメタデータを読み込む
    第2読込工程と、 前記第1読込工程で読み込まれたバイナリデータの後
    に、前記第2読込工程で読み込まれたメタデータを接続
    する第1接続工程と、 前記第1接続工程で接続されたメタデータの後に、前記
    バイナリデータに対応する終端コードを接続する第2接
    続工程と、 前記第1及び第2接続工程によって得られたデータの全
    体を一つのファイルとして出力する出力工程とを備える
    ことを特徴とするデータ処理方法。
  2. 【請求項2】 前記バイナリデータが終端コードを有す
    るか否かを判定する判定工程をさらに備え、 前記第2接続工程は、前記判定工程で終端コードを有す
    ると判定された場合に、前記第1接続工程で接続された
    メタデータの後に、前記バイナリデータに対応する終端
    コードを接続することを特徴とする請求項1に記載のデ
    ータ処理方法。
  3. 【請求項3】 前記第2接続工程は、予め決められた終
    端コードを前記第1接続工程で接続されたメタデータの
    後に接続することを特徴とする請求項1に記載のデータ
    処理方法。
  4. 【請求項4】 前記第2接続工程は、予め決められた複
    数種類の終端コードを前記第1接続工程で接続されたメ
    タデータの後に接続することを特徴とする請求項1に記
    載のデータ処理方法。
  5. 【請求項5】 前記第2読込工程で読み込まれたメタデ
    ータが、所定のデータ記述言語における適正な形式で記
    述されているか否かを判定する判定工程を更に備え、 前記第1接続工程は、前記判定工程で適正な形式で記述
    されていると判定された場合に、前記メタデータを前記
    バイナリデータの後に接続することを特徴とする請求項
    1に記載のデータ処理方法。
  6. 【請求項6】 前記判定工程は、前記メタデータが前記
    所定のデータ記述言語としての正当性を満足するか否か
    を含めて判定することを特徴とする請求項5に記載のデ
    ータ処理方法。
  7. 【請求項7】 メタデータが登録されたバイナリデータ
    においてメタデータを判別する方法であって、 データを読み込む読込工程と、 前記読込工程で読み込まれたデータを末尾より検査し、
    終端コードに続いて所定のデータ記述言語における適正
    な形式で記述されたデータが存在するか否かを判定する
    ことにより、該データに含まれるメタデータを判別する
    判別工程とを備えることを特徴とするデータ処理方法。
  8. 【請求項8】 前記判別工程においてメタデータが判別
    された場合、判別されたメタデータを抽出して出力する
    出力工程を更に備えることを特徴とする請求項7に記載
    のデータ処理方法。
  9. 【請求項9】 前記出力工程は、前記抽出されたメタデ
    ータに基づく表示を行うことを特徴とする請求項8に記
    載のデータ処理方法。
  10. 【請求項10】 前記出力工程は、前記抽出されたメタ
    データを、前記所定のデータ記述言語を処理するための
    ツールに提供することを特徴とする請求項8に記載のデ
    ータ処理方法。
  11. 【請求項11】 前記バイナリデータは画像データであ
    ることを特徴とする請求項1乃至10のいずれかに記載
    のデータ処理方法。
  12. 【請求項12】 前記バイナリデータは音声データであ
    ることを特徴とする請求項1乃至10のいずれかに記載
    のデータ処理方法。
  13. 【請求項13】 前記バイナリデータは動画像データで
    あることを特徴とする請求項1乃至10のいずれかに記
    載のデータ処理方法。
  14. 【請求項14】 前記所定のデータ記述言語がXMLで
    あることを特徴とする請求項1乃至10のいずれかに記
    載のデータ処理方法。
  15. 【請求項15】 前記所定のデータ記述言語がSGML
    であることを特徴とする請求項1乃至10のいずれかに
    記載のデータ処理方法。
  16. 【請求項16】 前記所定のデータ記述言語がHTML
    であることを特徴とする請求項1乃至10のいずれかに
    記載のデータ処理方法。
  17. 【請求項17】 バイナリデータにメタデータを登録す
    るデータ処理装置であって、 メタデータの付与対象のバイナリデータを読み込む第1
    読込手段と、 前記バイナリデータに付与すべきメタデータを読み込む
    第2読込手段と、 前記第1読込手段で読み込まれたバイナリデータの後
    に、前記第2読込手段で読み込まれたメタデータを接続
    する第1接続手段と、 前記第1接続手段で接続されたメタデータの後に、前記
    バイナリデータに対応する終端コードを接続する第2接
    続手段と、 前記第1及び第2接続手段によって得られたデータの全
    体を一つのファイルとして出力する出力手段とを備える
    ことを特徴とするデータ処理装置。
  18. 【請求項18】 前記バイナリデータが終端コードを有
    するか否かを判定する判定手段をさらに備え、 前記第2接続手段は、前記判定手段で終端コードを有す
    ると判定された場合に、前記第1接続手段で接続された
    メタデータの後に、前記バイナリデータに対応する終端
    コードを接続することを特徴とする請求項17に記載の
    データ処理装置。
  19. 【請求項19】 前記第2接続手段は、予め決められた
    終端コードを前記第1接続手段で接続されたメタデータ
    の後に接続することを特徴とする請求項17に記載のデ
    ータ処理装置。
  20. 【請求項20】 前記第2接続手段は、予め決められた
    複数種類の終端コードを前記第1接続手段で接続された
    メタデータの後に接続することを特徴とする請求項17
    に記載のデータ処理装置。
  21. 【請求項21】 前記第2読込手段で読み込まれたメタ
    データが、所定のデータ記述言語における適正な形式で
    記述されているか否かを判定する判定手段を更に備え、 前記第1接続手段は、前記判定手段で適正な形式で記述
    されていると判定された場合に、前記メタデータを前記
    バイナリデータの後に接続することを特徴とする請求項
    17に記載のデータ処理装置。
  22. 【請求項22】 前記判定手段は、前記メタデータが前
    記所定のデータ記述言語としての正当性を満足するか否
    かを含めて判定することを特徴とする請求項21に記載
    のデータ処理装置。
  23. 【請求項23】 メタデータが登録されたバイナリデー
    タにおいてメタデータを判別する方法であって、 データを読み込む読込手段と、 前記読込手段で読み込まれたデータを末尾より検査し、
    終端コードに続いて所定のデータ記述言語における適正
    な形式で記述されたデータが存在するか否かを判定する
    ことにより、該データに含まれるメタデータを判別する
    判別手段とを備えることを特徴とするデータ処理装置
  24. 【請求項24】 前記判別手段においてメタデータが判
    別された場合、判別されたメタデータを抽出して出力す
    る出力手段を更に備えることを特徴とする請求項23に
    記載のデータ処理装置。
  25. 【請求項25】 前記出力手段は、前記抽出されたメタ
    データに基づく表示を行うことを特徴とする請求項24
    に記載のデータ処理装置。
  26. 【請求項26】 前記出力手段は、前記抽出されたメタ
    データを、前記所定のデータ記述言語を処理するための
    ツールに提供することを特徴とする請求項23に記載の
    データ処理装置。
  27. 【請求項27】 コンピュータによって、バイナリデー
    タにメタデータを登録するデータ処理を実現するための
    制御プログラムを格納する記憶媒体であって、方法であ
    って、 メタデータの付与対象のバイナリデータを読み込む第1
    読込工程のコードと、 前記バイナリデータに付与すべきメタデータを読み込む
    第2読込工程のコードと、 前記第1読込工程で読み込まれたバイナリデータの後
    に、前記第2読込工程で読み込まれたメタデータを接続
    する第1接続工程のコードと、 前記第1接続工程で接続されたメタデータの後に、前記
    バイナリデータに対応する終端コードを接続する第2接
    続工程のコードと、 前記第1及び第2接続工程によって得られたデータの全
    体を一つのファイルとして出力する出力工程のコードと
    を備えることを特徴とする記憶媒体。
  28. 【請求項28】 コンピュータによって、メタデータが
    登録されたバイナリデータからメタデータを判別する処
    理を実現するための制御プログラムを格納する記憶媒体
    であって、該制御プログラムが、 データを読み込む読込工程のコードと、 前記読込工程で読み込まれたデータを末尾より検査し、
    終端コードに続いて所定のデータ記述言語における適正
    な形式で記述されたデータが存在するか否かを判定する
    ことにより、該データに含まれるメタデータを判別する
    判別工程のコードとを備えることを特徴とする記憶媒
    体。
JP18963699A 1999-07-02 1999-07-02 データ処理方法及び装置及び記憶媒体 Expired - Fee Related JP4072293B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP18963699A JP4072293B2 (ja) 1999-07-02 1999-07-02 データ処理方法及び装置及び記憶媒体
US09/595,882 US6629101B1 (en) 1999-07-02 2000-06-20 Data processing method and apparatus, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP18963699A JP4072293B2 (ja) 1999-07-02 1999-07-02 データ処理方法及び装置及び記憶媒体

Publications (3)

Publication Number Publication Date
JP2001022615A true JP2001022615A (ja) 2001-01-26
JP2001022615A5 JP2001022615A5 (ja) 2006-08-03
JP4072293B2 JP4072293B2 (ja) 2008-04-09

Family

ID=16244625

Family Applications (1)

Application Number Title Priority Date Filing Date
JP18963699A Expired - Fee Related JP4072293B2 (ja) 1999-07-02 1999-07-02 データ処理方法及び装置及び記憶媒体

Country Status (2)

Country Link
US (1) US6629101B1 (ja)
JP (1) JP4072293B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003015922A (ja) * 2001-06-27 2003-01-17 Canon Inc データ処理方法及び装置及び記憶媒体

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2312474A1 (en) * 1999-04-13 2011-04-20 Canon Kabushiki Kaisha Data processing method and apparatus
US7149360B2 (en) * 2002-01-09 2006-12-12 Hewlett-Packard Development Company, L.P. Method for using a JPEG engine to assist in efficiently constructing MPEG I-frames
US20050198069A1 (en) * 2004-03-05 2005-09-08 Cherry Darrel D. Meta-data association
US20050275566A1 (en) * 2004-06-14 2005-12-15 Nokia Corporation System and method for transferring content
US20110072955A1 (en) 2005-10-06 2011-03-31 Turner William D System and method for pacing repetitive motion activities
US7825319B2 (en) * 2005-10-06 2010-11-02 Pacing Technologies Llc System and method for pacing repetitive motion activities
CN101944229B (zh) * 2009-07-08 2012-11-28 方正国际软件(北京)有限公司 用于图像文件的附加信息方法
US9137443B2 (en) 2011-04-26 2015-09-15 Blackberry Limited Fast estimation of binary data length using memory corruption

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04168865A (ja) * 1990-11-01 1992-06-17 Hitachi Ltd コードデータとイメージデータの合成出力方式
JPH0644320A (ja) * 1991-05-14 1994-02-18 Sony Corp 情報検索システム
JP3317763B2 (ja) * 1993-11-05 2002-08-26 富士通株式会社 プログラム起動方法およびその処理装置
JPH09107547A (ja) * 1995-10-09 1997-04-22 Hitachi Ltd 既圧縮動画データ量削減装置および既圧縮動画データ量削減システムならびに既圧縮動画データ量削減方法
US5937160A (en) * 1997-05-01 1999-08-10 Reedy Creek Technologies, Inc. Systems, methods and computer program products for updating hypertext documents via electronic mail
US6173287B1 (en) * 1998-03-11 2001-01-09 Digital Equipment Corporation Technique for ranking multimedia annotations of interest
US6272484B1 (en) * 1998-05-27 2001-08-07 Scansoft, Inc. Electronic document manager
US6360010B1 (en) * 1998-08-12 2002-03-19 Lucent Technologies, Inc. E-mail signature block segmentation

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003015922A (ja) * 2001-06-27 2003-01-17 Canon Inc データ処理方法及び装置及び記憶媒体

Also Published As

Publication number Publication date
JP4072293B2 (ja) 2008-04-09
US6629101B1 (en) 2003-09-30

Similar Documents

Publication Publication Date Title
US7349911B2 (en) Data processing method and apparatus
US7127472B1 (en) Data processing method and data processing device
RU2358311C2 (ru) Документ текстовой обработки, хранящийся в едином файле xml, которым могут манипулировать приложения, понимающие язык xml
RU2328034C2 (ru) Способ и система сопоставления операций семантическим меткам в электронных документах
US8527864B2 (en) Method of compound document comparison
AU2003204869B2 (en) System and method for supporting non-native XML in native XML of a word-processor document
US6571248B1 (en) Data processing method and apparatus
KR100995234B1 (ko) 데이터 포맷 문서에서 주석이 달려있지 않은 텍스트 노드들을 보여주기 위한 컴퓨터 실행 가능 명령어들을 기록한 컴퓨터 판독 가능 기록 매체
US20040210573A1 (en) Method, system and program for generating structure pattern candidates
JPH08241332A (ja) 全文登録語検索装置および方法
JP2009534743A (ja) 非構造化リソースの構文解析方法
JP2005339566A (ja) コンテンツを開始テンプレートとターゲットテンプレートとの間でマップするための方法およびシステム
JP2006178944A (ja) 文書を表すファイル・フォーマット、その方法、およびコンピュータ・プログラム製品
JP4072293B2 (ja) データ処理方法及び装置及び記憶媒体
US20050044488A1 (en) Technique to validate electronic books
US7308398B2 (en) Translation correlation device
CN111679825A (zh) 一种层叠样式表生成方法、装置、计算机设备及存储介质
JP4072285B2 (ja) データ処理方法及び装置及び記憶媒体
JP4072284B2 (ja) データ処理方法及び装置及び記憶媒体
JP4072283B2 (ja) データ処理方法及び装置及び記憶媒体
JP4417384B2 (ja) 文書処理装置および文書処理方法
JP2000311103A (ja) データ処理方法及び装置及び記憶媒体
JP2000312290A (ja) データ処理方法及び装置及び記憶媒体
JP3466792B2 (ja) 図面検索方法及びその装置
JP4724283B2 (ja) 文書管理装置、文書管理方法および記憶媒体

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060615

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060615

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20060615

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080111

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080121

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110125

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120125

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130125

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140125

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees