JP4822882B2 - Information processing apparatus, information processing method, and program - Google Patents
Information processing apparatus, information processing method, and program Download PDFInfo
- Publication number
- JP4822882B2 JP4822882B2 JP2006060240A JP2006060240A JP4822882B2 JP 4822882 B2 JP4822882 B2 JP 4822882B2 JP 2006060240 A JP2006060240 A JP 2006060240A JP 2006060240 A JP2006060240 A JP 2006060240A JP 4822882 B2 JP4822882 B2 JP 4822882B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- attribute
- arrangement
- information processing
- arrangement structure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、動画、静止画、音声データ、テキストなどを構成要素として含む電子文書(以下、「マルチメディア文書」ともいう。)を検索、利用する技術に関するものである。 The present invention relates to a technique for retrieving and using an electronic document (hereinafter also referred to as “multimedia document”) including moving images, still images, audio data, text, and the like as constituent elements.
近年、デジタルデータの処理・通信技術の発達により、動画、静止画、音声、テキストなどが混在したマルチメディア文書を扱うことが可能なシステムが提供されている。かかるシステムによれば、マルチメディア文書をコンテンツとして作成し、記録(蓄積)することが可能であり、また、蓄積したマルチメディア文書を検索し、利用することも可能である。 In recent years, with the development of digital data processing / communication technology, systems capable of handling multimedia documents in which moving images, still images, audio, text, and the like are mixed have been provided. According to such a system, it is possible to create and record (accumulate) a multimedia document as content, and to search and use the accumulated multimedia document.
マルチメディア文書の各構成要素(動画、静止画、音声データ、テキストなど)に着目し、検索を実現する技術は動画、静止画、音声、テキストなどのそれぞれについて、検索に使用する技術が異なる。そのため、動画、静止画、音声データ、テキストなどのうちから必要な情報を検索する場合、個別の検索技術の適用が必要となる。特定の構成要素として動画、静止画、音声、テキストを検索する際に、各構成要素自体の情報と、マルチメディア文書内の他の情報とを組み合わせ、各構成要素を特徴付けた検索技術がある。この検索技術によると、例えば、静止画の検索において、マルチメディア文書内の他の情報として、文書中のタイトルや静止画の説明文などが組み合わされて、静止画が特徴付けられている。この検索技術では、静止画等を特徴付ける情報として、その静止画に対するマルチメディア文書中のタイトルや、説明文などのテキストをどのように獲得するかが問題である。例えば、特許文献1においては、マルチメディア文書中の画像情報に関連するテキスト情報を抽出し、検索対象のテキストの規模に関する情報を抽出し、検索時に利用している。
しかしながら、上述の特許文献1では、検出対象の画像と本文の関係は特定しているが、画像と本文のレイアウト(配置構造)を合わせる情報処理は行っていない。そのため、マルチメディア文書内の検索や利用を行う場合、文章の記載と対応する図表など、構成要素間の関係が正確に捉えられないことになり、検索対象を効率的に精度よく検索し、利用することが困難になるという問題がある。
However, in the above-mentioned
本発明は、上記問題点に鑑みてなされたものであり、マルチメディア文書中から検索対象を効率的に精度よく検索し、利用することを可能にする技術の提供を目的とする。 The present invention has been made in view of the above-described problems, and an object of the present invention is to provide a technique that enables a search target to be efficiently and accurately searched from a multimedia document and used.
上記の目的を達成するべく、本発明にかかる情報処理装置は、異なる属性のデータを含む電子文書を処理することが可能な情報処理装置であって、
前記電子文書に含まれるデータの配置構造を属性単位に解析するレイアウト解析手段と、
前記レイアウト解析手段により解析された第1属性のデータの配置構造と、当該第1属性のデータを参照する第2属性のデータの配置構造とを比較する比較手段と、
前記比較手段の比較結果において、前記第1属性のデータの配置構造と前記第2属性のデータの配置構造とが相違すると判定された場合に、一方の配置構造に含まれ、他方の配置構造に含まれない配置構造を追加データとして生成して、前記他方の配置構造に追加する変更手段と、
前記変更手段により生成された前記追加データを、前記第1属性のデータと前記第2属性のデータとを関係づける検索用データとして登録する登録手段と、を備えることを特徴とする。
In order to achieve the above object, an information processing apparatus according to the present invention is an information processing apparatus capable of processing an electronic document including data having different attributes,
Layout analysis means for analyzing the arrangement structure of data included in the electronic document in attribute units;
Comparison means for comparing the arrangement structure of the first attribute data analyzed by the layout analysis means with the arrangement structure of the second attribute data referring to the first attribute data;
Oite on a comparison result of the comparing means, when the arrangement of the data arrangement of data and the second attribute of said first attribute is determined to be different, is included in one arrangement, other generates a placement structure that is not included in the arrangement as additional data, a changing unit to be added to the arrangement of the other,
And registration means for registering the additional data generated by the changing means as search data that associates the data of the first attribute with the data of the second attribute.
本発明に拠れば、マルチメディア文書中から検索対象を効率的に精度よく検索し、利用することが可能になる。 According to the present invention, it becomes possible to efficiently search and use a search target from a multimedia document with high accuracy.
本発明の実施形態を添付図面の参照により説明する。図1は、本発明の実施形態にかかる情報処理装置の内部構成を概略的に説明する図である。 Embodiments of the present invention will be described with reference to the accompanying drawings. FIG. 1 is a diagram schematically illustrating an internal configuration of an information processing apparatus according to an embodiment of the present invention.
同図において、CPU101は情報処理装置における各種制御を実行する。ROM102は情報処理装置の立ち上げ時に実行されるブートプログラムや各種データを格納する。RAM103はCPU101が処理するための制御プログラムを格納するとともに、CPU101が各種制御を実行する際の作業領域を提供する。
In the figure, a
入力部104はキーボード、マウス、スタイラスペン、ダイヤルなどから構成され、ユーザによる各種入力操作環境を提供する。
The
外部記憶装置105はハードディスクやフロッピー(登録商標)ディスク、光ディスク、磁気ディスク、光磁気ディスク、磁気テープ、不揮発性のメモリカード等の記録媒体と、記憶媒体を駆動し、情報を記録するドライブなどで構成される。外部記憶装置105はマルチメディア文書やそれを検索、再利用する際に使用する情報などを記録し、利用することが可能な記憶容量を有するものとする。情報処理装置が検索サーバとして、検索サービスを提供する場合、検索用付加情報を検索用のメタデータとして外部記憶装置105に格納する。
The
表示部106はディスプレイなどで構成され、各種入力操作の状態をユーザに対して表示する。通信部107は他の機器と通信を行うための構成要素であり、RS232C、USB、IEEE1394、P1284、SCSI、モデム、Ethernet(登録商標)などの有線通信機能を有する。また、通信部107は Bluetooth、赤外線通信、IEEE802.11b等の無線通信の各種通信機能を有する。108はLANであり、通信部107はLAN108を介して情報処理装置を他の機器と通信することが可能である。コネクタ109は通信部107を介して情報処理装置を他の機器と接続するためのコネクタである。コネクタ109の先に、記憶装置や、他の機器を接続して情報処理装置から記憶装置等を利用することが可能になる。
The
115は、撮像ユニットであり、動画または静止画を撮影することが可能である。情報処理装置内の各構成要素は内部バス110により接続されており、相互にデータの送受信が可能である。情報処理装置は、LAN108、通信部107を介して他の装置から送信されたマルチメディア文書を外部記憶装置105に格納することも可能である。また、情報処理装置は、撮像ユニット115により撮像された静止画等と入力部104により入力された文書等とを組み合わせたマルチメディア文書を生成することが可能である。情報処理装置は、生成したマルチメディア文書を外部記憶装置105に格納することが可能である。
図2は、本実施形態で処理の対象となるマルチメディア文書201の1ページ分の構成例を例示した図である。202はマルチメディア文書201の文書部分を示し、203は文書の見出しを示す。見出し203には、文書部分204、グラフ205、キャプション(説明文)206、グラフ207、キャプション(説明文)208、グラフ209、キャプション210、ページ番号211が含まれる。
FIG. 2 is a diagram exemplifying a configuration example for one page of the
図3は、情報処理装置のCPU101がマルチメディア文書201のレイアウト解析を行った結果を記述する基本部分のデータ構成を例示する図である。図中右に示す(3−1)から(3−32)は、レイアウト解析結果の各行番号に対応したものである。尚、レイアウト解析結果の表示は、図3に示すXML形式に限定されるものでなく、SGML形式など他の構造化文書により表記することも可能である。
FIG. 3 is a diagram exemplifying a data structure of a basic part describing a result of the layout analysis of the
(3−1)行目はページの開始を示すもので、マルチメディア文書201のページ番号が11であることを示している。また、(3−32)行は該当ページの終了を示している。
The (3-1) line indicates the start of a page and indicates that the page number of the
(3−2)から(3−4)行目までは、該当ページの大きさを特定するための情報を記述している。ページ左上を原点(O)とし、y軸をページ下方向に正方向、x軸を右方向に正方向とするx−y座標系で記述している(図2)。 From (3-2) to (3-4) lines, information for specifying the size of the corresponding page is described. The upper left corner of the page is the origin (O), the y-axis is the forward direction in the lower direction, and the x-axis is the forward direction in the right direction.
ここでは、(3−3)行目において、x方向に600、y方向に900の大きさであると記述されている。以下、位置や大きさなどの情報は、この座標系により記述するものとする。尚、ページの大きさは、縦横の数値に限らず、A4、B5等の規格により特定してもよいし、m行xn列等のページレイアウトの設定値により特定することも可能である。 Here, it is described in the (3-3) line that the size is 600 in the x direction and 900 in the y direction. Hereinafter, information such as position and size is described in this coordinate system. Note that the page size is not limited to vertical and horizontal numerical values, but may be specified by a standard such as A4 or B5, or may be specified by a page layout setting value such as m rows and xn columns.
(3−5)から(3−31)行目は、ページ内の構成要素を列挙したもので、各構成要素をブロック(Block)という単位で表現している。ここで、(3−6)から(3−21)行目は、図2に示すマルチメディア文書201の文書部分202、見出し203、文書部分204の文章領域のブロックを表現したものである。
Lines (3-5) to (3-31) list the constituent elements in the page, and express each constituent element in a unit of a block. Here, lines (3-6) to (3-21) represent blocks of the text area of the
(3−6)行目は、レイアウト解析により付されたブロックを識別するための番号(以下、「ブロック識別番号」という。)が「1101」であること、データの属性が文章を入れるテキスト形式のブロックであることを示している。 The (3-6) line is a text format in which the number for identifying the block given by the layout analysis (hereinafter referred to as “block identification number”) is “1101”, and the attribute of the data is a text. It shows that it is a block.
(3−7)から(3−9)行目はブロック識別番号1101により特定されるブロックのページ内における位置情報が示されている。(3−8)行目において、位置情報は(50、40)と記述されており、この位置情報は文書部分202、見出し203及び文書部分204を含む文書領域のブロックにおける点G1に対応する(図2を参照)。
The (3-7) to (3-9) lines indicate position information in the page of the block specified by the
(3−10)から(3−12)行目は、文書領域のブロックの大きさ(サイズ)の情報が示されている。図3において、サイズは(x、y)=(400、500)である。文書領域のブロックの点G1を基準として、サイズの情報に基づいて、文書領域のブロックのページ内における位置とサイズを特定することが可能になる。 Lines (3-10) to (3-12) show information on the size (size) of blocks in the document area. In FIG. 3, the size is (x, y) = (400, 500). With reference to the point G1 of the block in the document area, the position and size of the block in the document area in the page can be specified based on the size information.
(3−13)から(3−20)行目は、文書領域のブロックで記述されている内容が示されている。この文章は、紙媒体などからスキャンした場合には、文字認識などの技術を用いることで、画像から文字やテキスト情報に変換することで実現される。あるいは、LAN108を介して、他の装置から送信されてくる電子データに基づいてテキスト情報等を取得することも可能である。
Lines (3-13) to (3-20) show the contents described in the document area block. When the document is scanned from a paper medium or the like, it is realized by converting the image into characters and text information by using a technique such as character recognition. Alternatively, text information or the like can be acquired based on electronic data transmitted from another device via the
(3−15)行目は、見出し部分203に相当する内容であって、見出しの番号が「5」であること、見出しのタイトルが「客層の分析」という内容であることを示すXML情報が記述されている。そして、(3−16)行目には、テキストデータの内容か記述される。
The (3-15) line contains contents corresponding to the
(3−17)〜(3−19)行目は箇条書きの項目であることを示すXML情報が記述されている。(3−18)行目には、箇条書きの項目の文書部分に相当する内容が記述されており、「スキー客」という表現がアンダーラインつきの表現であることを示すXML情報(タグ<UL>および</UL>)が記述されている。 The (3-17) to (3-19) lines describe XML information indicating itemized items. In the (3-18) line, the content corresponding to the document part of the item of the bullet item is described, and XML information (tag <UL>) indicating that the expression “ski customer” is an underlined expression. And </ UL>).
(3−22)行目は、レイアウト解析により付されたブロック識別番号」が「1102」であること、データの属性が図形を入れるグラフ形式のブロックであることを示している。 The (3-22) line indicates that the block identification number given by the layout analysis is “1102”, and that the data attribute is a graph-type block into which a graphic is inserted.
(3−23)から(3−25)行目はブロック識別番号1102により特定されるブロックのページ内における位置情報が示されている。(3−24)行目において、位置情報は(60、560)と記述されており、この位置情報は円グラフ205、円グラフ207を含む図形領域のブロックにおける点G2に対応する(図2を参照)。
The (3-23) to (3-25) lines indicate the position information within the page of the block specified by the
(3−26)から(3−28)行目は、グラフ形式のブロックの大きさ(サイズ)の情報が示されている。図3において、サイズは(x、y)=(100、80)である。グラフ形式のブロックの点G2を基準として、サイズの情報に基づいて、グラフ形式のブロックのページ内における位置とサイズを特定することが可能になる。 Lines (3-26) to (3-28) show information on the size (size) of the block in the graph format. In FIG. 3, the size is (x, y) = (100, 80). Based on the size information, the position and size of the graph block in the page can be specified based on the point G2 of the graph block.
(3−29)〜(3−31)行目は、グラフ205(Graph1)、グラフ207(Graph2)、グラフ210(Graph3)が記述されている。尚、各種グラフに限られず、表形式の表示、写真や描画データなどをマルチメディア文書の構成要素とすることも可能である。 In lines (3-29) to (3-31), a graph 205 (Graph 1), a graph 207 (Graph 2), and a graph 210 (Graph 3) are described. Note that the present invention is not limited to various types of graphs, and a table format display, a photograph, drawing data, and the like can be used as components of the multimedia document.
レイアウト解析の結果、マルチメディア文書201に含まれる構成要素(文書部分202等、グラフ205等)が抽出される。構成要素はブロックごとに、ブロック識別番号、属性情報、ブロックの位置情報、サイズ情報、文書またはグラフ等が抽出される。
As a result of the layout analysis, components (
CPU101は外部記憶装置105に保存されたマルチメディア文書に対してレイアウト解析を行う。そして、レイアウト解析の結果から構成要素ごとに(ブロックごとに)特徴量を抽出し、これをメタデータとして、その特徴量を処理可能な検索用の情報として、外部記憶装置105に登録することが可能である。レイアウト解析に基づく特徴量の抽出により、様々なマルチメディア文書の記録されている様々なフォーマットに依存することなく、検索が可能になる。更に、検索時にメタデータの検索だけを処理すればよいので、検索処理に要する処理時間を短縮することが可能になる。この処理により、様々なマルチメディア文書の記録されている様々なフォーマットに依存することなく、検索、利用が容易になる。
The
図4は、図2に示したマルチメディア文書に対して行ったレイアウト解析の結果(図3)を概略的に示す図である。 FIG. 4 is a diagram schematically showing the result (FIG. 3) of the layout analysis performed on the multimedia document shown in FIG.
401はページ番号に対応する部分であり、402は図2の文章部分202に対応するテキストデータが配置される。403は図2の見出し203に対応し、404は見出し203の次の行の文書部分に対応するテキストデータが配置されている。
405は図2の箇条書き部分を示し、この中には、箇条書き項目(406、409)が含まれる。箇条書き項目406の下には、箇条書き項目の内容(407、408)に関するテキストデータが配置されている。箇条書き項目の内容(407、408)中には、テキストデータと、この中で参照される図番号(3−a)、(3−b)が記載されている。
410は図領域を示し、図領域410には、図番号(3−a)、図番号(3−b)、図番号(3−c)に対応する図表データが配置される(412、413、414)。以下の説明では図表データを例としているが、この他、動画、静止画であってもよい。 Reference numeral 410 denotes a figure area. In the figure area 410, chart data corresponding to the figure number (3-a), the figure number (3-b), and the figure number (3-c) are arranged (412, 413, 414). In the following description, chart data is used as an example, but a moving image or a still image may be used.
箇条書き部分405のデータの配置構造(406〜409)と、図領域410のデータの配置構造(412〜414)とを比較すると、箇条書き項目406に対応するデータが図領域410に無い点で両者は相違する。
Comparing the data arrangement structure (406 to 409) of the
箇条書き部分が、順番に意味を持たせた記載であったり、対立に意味を持たせた記載であったりする場合、参照される各図表データ(412、413、414)も同様の関係が成立することが多い。このため、文書部分と図表部分との配置構造を合わせることで、マルチメディア文書内の構成要素の関係をより正確に捉えることが可能となる。 If the itemized portion is a description that gives meaning in order or a description that gives meaning to the confrontation, the same relationship is also established for each referenced chart data (412, 413, 414). Often to do. For this reason, by combining the arrangement structure of the document part and the chart part, it is possible to more accurately grasp the relationship between the constituent elements in the multimedia document.
図5は、本実施形態における、マルチメディア文書内の文書部分と図表部分との配置構造を合わせる処理の流れを説明する図である。この処理は情報処理装置におけるCPU101の制御の下に実行されるものとする。
FIG. 5 is a diagram for explaining a flow of processing for matching the arrangement structure of the document part and the chart part in the multimedia document in the present embodiment. This process is executed under the control of the
ステップS501で処理を開始し、ステップS502において、外部記憶装置106等内にあるマルチメディア文書に対してレイアウト解析を行う。
In step S501, the process is started. In step S502, layout analysis is performed on the multimedia document in the
ステップS503において、レイアウト解析の結果から得られた図形又は表形式のデータ(図表データ)から選択した図表に対するキャプションの有無を検索する。ここでは、例として、図2のグラフ205、207、209が選択されたものとする。キャプションが無いと判定された場合は処理を終了し、キャプションがあると判定された場合、処理をステップS504に進める。ここで、図2の206、208、210がキャプションとして検索される。
In step S503, it is searched whether or not there is a caption for the chart selected from the graphic or tabular data (chart data) obtained from the layout analysis result. Here, as an example, it is assumed that the
ステップS504において、近傍のテキスト形式のデータブロックに、キャプション206、208、210と同じテキスト(表現)を含むデータを検索する。
In step S504, data including the same text (expression) as the
ステップS505において、キャプション206、208、210と同じテキスト(表現)を含むデータが検索されなかった場合、処理は終了する。一方、ステップS505の判定で、キャプション(説明文)206、208、210と同じテキスト(表現)を含むデータが検索された場合、処理はステップS506に進められる。
In step S505, if data including the same text (expression) as the
ステップS506において、キャプション(説明文)の配置構造と、キャプション(説明文)と同じテキスト(表現)を含む文書部分のデータの配置構造が同じか否かを判定する。具体的には、図4において、キャプション(3−a、b、c)の図表データ(412〜414)の配置構造と、キャプション(3−a、b、c)を含む文書部分(箇条書き部分)(407〜409)の配置構造とを比較する。これらの配置構造が同じであれば、処理をステップS509に進め処理を終了する。一方、配置構造が異なる場合、処理はステップS507に進められ、構造の複雑な方に合わせて配置構造が変更される。単純な構造に合わせた場合、複雑な配置構造を有するデータの一部が削除されるのを防止するためである。図4の場合、箇条書き項目406に対応するデータが図領域410に無い点で、文書部分(箇条書き部分)(407〜409)の配置構造の方が図表データ(412〜414)より複雑であると判定される。この判定結果により、キャプション(3−a、b、c)の図表データ(412〜414)の配置構造が文書部分(箇条書き部分)(407〜409)の配置構造に合わせて変更される。
In step S506, it is determined whether the arrangement structure of the caption (description) is the same as the arrangement structure of the data of the document portion including the same text (expression) as the caption (description). Specifically, in FIG. 4, the layout structure of the chart data (412 to 414) of the caption (3-a, b, c) and the document part (itemized part) including the caption (3-a, b, c) ) (407 to 409). If these arrangement structures are the same, the process proceeds to step S509 and the process ends. On the other hand, if the arrangement structure is different, the process proceeds to step S507, and the arrangement structure is changed according to the more complicated structure. This is for preventing a part of data having a complicated arrangement structure from being deleted when the simple structure is adopted. In the case of FIG. 4, the arrangement structure of the document part (itemized part) (407 to 409) is more complicated than the chart data (412 to 414) in that there is no data corresponding to the
配置構造の変更にいおいて、図6の615に示されるような追加データが生成される。この追加データは、図表データ(612、613)と文書部分(箇条書き部分)(407、408)とを関係づける検索用データとして機能する。追加データは検索用メタデータとして、外部記憶装置105等に格納(登録)され、図表データ(612、613)または文書部分(箇条書き部分)(407、408)の検索、利用に際して参照される。
In changing the arrangement structure, additional data as shown by 615 in FIG. 6 is generated. This additional data functions as search data for associating the chart data (612, 613) and the document part (itemized part) (407, 408). The additional data is stored (registered) as search metadata in the
ステップS508において、キャプション(3−a、b、c)の図表データ(412〜414)の配置構造を変更したレイアウト解析の結果を外部記憶装置105等に格納して処理を終了する。
In step S508, the layout analysis result obtained by changing the arrangement structure of the chart data (412 to 414) of the caption (3-a, b, c) is stored in the
図6は、キャプション「3−a」、「3−b」、「3−c」を含む文書部分(箇条書き部分)(407〜409)の配置構造に合わせて、対応する図表データ(412〜414)の配置構造を変更した結果を示す図である。配置構造を変更する前のレイアウト解析の結果を示す図4と同一部分は同一の参照番号を付している。 FIG. 6 shows corresponding chart data (412 to 412) according to the arrangement structure of the document parts (itemized parts) (407 to 409) including the captions “3-a”, “3-b”, and “3-c”. It is a figure which shows the result of having changed the arrangement structure of 414). The same parts as those in FIG. 4 showing the result of layout analysis before changing the arrangement structure are given the same reference numerals.
図表データ612、613の配置構造が、キャプション「3−a」、「3−b」を含む文書部分(箇条書き部分)(407、408)の配置構造に合わせて変更されている。配置構造を合わせるためのデータとして、「図領域」615が生成され、図領域615の下に図表データ612、613が含まれるように配置構造が変更される。
The arrangement structure of the
これにより、箇条書き部分(405〜409)の記載(例えば、比較・対立・列挙などの関係)を、図領域(410、615、612、613、414)にも反映でき、相互の対応関係を明確にすることが可能になる。文書部分と図領域との配置構造を合わせることで、マルチメディア文書内の構成要素の関係をより正確に捉えることが可能となる。 As a result, the description (for example, the relationship such as comparison / conflict / enumeration) of the bulleted portion (405 to 409) can be reflected in the diagram area (410, 615, 612, 613, 414), and the mutual correspondence can be reflected. It becomes possible to clarify. By combining the arrangement structure of the document part and the figure area, it is possible to more accurately grasp the relationship between the constituent elements in the multimedia document.
箇条書き項目406に対応する図領域615は検索用のメタデータとして利用することが可能である。箇条書き部分407から対応する図表データを検索する場合、説明文の構文解析によらず箇条書き項目406に対応するメタデータ(図領域615)を検索することで、対応する図表データ612を検索し、利用することが可能になる。
The
同様に、図表データ612から対応する箇条書き部分407を検索する場合、構文解析によらず、図領域615と対応する箇条書き項目406を検索することで、図表に対応する箇条書き部分を検索し、利用することが可能になる。
Similarly, when searching the corresponding
尚、本実施形態において、検索用のメタデータとして利用することが可能なデータ(図領域615)は1つの場合を示したが複数でもよい。複数の検索用メタデータが生成される場合、各検索用メタデータに定量的な重要度を設定することが可能である。例えば、複数の検索用メタデータが階層構造となる場合、階層の深さを評価して、定量的な重要度を各検索用メタデータに設定してもよい。検索用メタデータの重要度の評価として、例えば、第1の階層の重要度を100、第2の階層の重要度を80、第3の階層の重要度を60と、階層の深さに応じて重要度を定量化することも可能である。そして、この重要度を指標として検索の優先順位を決定することも可能である。 In the present embodiment, the number of data that can be used as search metadata (the figure region 615) is one, but a plurality of data may be used. When a plurality of search metadata are generated, it is possible to set a quantitative importance for each search metadata. For example, when a plurality of search metadata has a hierarchical structure, the depth of the hierarchy may be evaluated, and quantitative importance may be set for each search metadata. As the evaluation of the importance of the search metadata, for example, the importance of the first hierarchy is 100, the importance of the second hierarchy is 80, the importance of the third hierarchy is 60, depending on the depth of the hierarchy. It is also possible to quantify the importance. It is also possible to determine the priority of search using this importance as an index.
以上説明したように、本実施形態に拠れば、マルチメディア文書中から検索対象を効率的に精度よく検索し、利用することが可能になる。 As described above, according to the present embodiment, it is possible to efficiently search and use a search target from a multimedia document with high accuracy.
(他の実施形態)
なお、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給することによっても、達成されることは言うまでもない。また、システムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、達成されることは言うまでもない。
(Other embodiments)
Needless to say, the object of the present invention can also be achieved by supplying a storage medium storing software program codes for realizing the functions of the above-described embodiments to a system or apparatus. Needless to say, this can also be achieved by the computer (or CPU or MPU) of the system or apparatus reading and executing the program code stored in the storage medium.
この場合、記憶媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。 In this case, the program code itself read from the storage medium realizes the functions of the above-described embodiments, and the storage medium storing the program code constitutes the present invention.
プログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク,ハードディスク,光ディスク,光磁気ディスク,CD−ROM,CD−R,不揮発性のメモリカード,ROMなどを用いることができる。 As a storage medium for supplying the program code, for example, a flexible disk, a hard disk, an optical disk, a magneto-optical disk, a CD-ROM, a CD-R, a nonvolatile memory card, a ROM, or the like can be used.
また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現される。また、プログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態が実現される場合も含まれることは言うまでもない。 Further, the functions of the above-described embodiment are realized by executing the program code read by the computer. In addition, an OS (operating system) running on a computer performs part or all of actual processing based on an instruction of a program code, and the above-described embodiment is realized by the processing. Needless to say.
Claims (9)
前記電子文書に含まれるデータの配置構造を属性単位に解析するレイアウト解析手段と、
前記レイアウト解析手段により解析された第1属性のデータの配置構造と、当該第1属性のデータを参照する第2属性のデータの配置構造とを比較する比較手段と、
前記比較手段の比較結果において、前記第1属性のデータの配置構造と前記第2属性のデータの配置構造とが相違すると判定された場合に、一方の配置構造に含まれ、他方の配置構造に含まれない配置構造を追加データとして生成して、前記他方の配置構造に追加する変更手段と、
前記変更手段により生成された前記追加データを、前記第1属性のデータと前記第2属性のデータとを関係づける検索用データとして登録する登録手段と、
を備えることを特徴とする情報処理装置。 An information processing apparatus capable of processing an electronic document including data with different attributes,
Layout analysis means for analyzing the arrangement structure of data included in the electronic document in attribute units;
Comparison means for comparing the arrangement structure of the first attribute data analyzed by the layout analysis means with the arrangement structure of the second attribute data referring to the first attribute data;
Oite on a comparison result of the comparing means, when the arrangement of the data arrangement of data and the second attribute of said first attribute is determined to be different, is included in one arrangement, other generates a placement structure that is not included in the arrangement as additional data, a changing unit to be added to the arrangement of the other,
Registration means for registering the additional data generated by the changing means as search data relating the first attribute data and the second attribute data;
An information processing apparatus comprising:
前記電子文書に含まれるデータの配置構造を属性単位に解析するレイアウト解析工程と、
前記レイアウト解析工程で解析された第1属性のデータの配置構造と、当該第1属性のデータを参照する第2属性のデータの配置構造とを比較する比較工程と、
前記比較工程の比較結果において、前記第1属性のデータの配置構造と第2属性のデータの配置構造とが相違すると判定された場合に、一方の配置構造に含まれ、他方の配置構造に含まれない配置構造を追加データとして生成して、前記他方の配置構造に追加する変更工程と、
前記変更工程により生成された前記追加データを、前記第1属性のデータと前記第2属性のデータとを関係づける検索用データとして登録する登録工程と、
を有することを特徴とする情報処理方法。 An information processing method capable of processing an electronic document including data of different attributes,
A layout analysis step of analyzing the arrangement structure of data included in the electronic document in attribute units;
A comparison step of comparing the arrangement structure of the first attribute data analyzed in the layout analysis step with the arrangement structure of the second attribute data referring to the first attribute data;
Oite on a comparison result of the comparing step, when the arrangement of data arrangement and the second attribute data of the first attribute is determined to be different, it is included in one arrangement, other arrangements generates a placement structure that is not included in the structure as additional data, a changing step of adding to the arrangement of the other,
A registration step of registering the additional data generated by the changing step as search data relating the data of the first attribute and the data of the second attribute;
An information processing method characterized by comprising:
電子文書に含まれるデータの配置構造を属性単位に解析するレイアウト解析工程と、
前記レイアウト解析工程で解析された第1属性のデータの配置構造と、当該第1属性のデータを参照する第2属性のデータの配置構造とを比較する比較工程と、
前記比較工程の比較結果において、前記第1属性のデータの配置構造と第2属性のデータの配置構造とが相違すると判定された場合に、一方の配置構造に含まれ、他方の配置構造に含まれない配置構造を追加データとして生成して、前記他方の配置構造に追加する変更工程と、
前記変更工程により生成された前記追加データを、前記第1属性のデータと前記第2属性のデータとを関係づける検索用データとして登録する登録工程と、
を実行させることを特徴とするプログラム。 On the computer ,
A layout analysis process for analyzing the arrangement structure of data contained in an electronic document in attribute units;
A comparison step of comparing the arrangement structure of the first attribute data analyzed in the layout analysis step with the arrangement structure of the second attribute data referring to the first attribute data;
In the comparison result of the comparison step, when it is determined that the data attribute structure of the first attribute is different from the data attribute structure of the second attribute, it is included in one arrangement structure and included in the other arrangement structure A change process for generating an additional arrangement structure as additional data and adding to the other arrangement structure;
A registration step of registering the additional data generated by the changing step as search data relating the data of the first attribute and the data of the second attribute;
A program characterized by having executed.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006060240A JP4822882B2 (en) | 2006-03-06 | 2006-03-06 | Information processing apparatus, information processing method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006060240A JP4822882B2 (en) | 2006-03-06 | 2006-03-06 | Information processing apparatus, information processing method, and program |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2007241474A JP2007241474A (en) | 2007-09-20 |
JP2007241474A5 JP2007241474A5 (en) | 2009-04-02 |
JP4822882B2 true JP4822882B2 (en) | 2011-11-24 |
Family
ID=38586984
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006060240A Expired - Fee Related JP4822882B2 (en) | 2006-03-06 | 2006-03-06 | Information processing apparatus, information processing method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4822882B2 (en) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0362169A (en) * | 1989-07-31 | 1991-03-18 | Agency Of Ind Science & Technol | Method and device for document retrieval |
JP2005276161A (en) * | 2004-02-26 | 2005-10-06 | Seiko Epson Corp | Layout system, layout device, layout program, template selection program, storage medium storing layout program, storage medium storing template selection program, and layout method |
JP2005352696A (en) * | 2004-06-09 | 2005-12-22 | Canon Inc | Image processing device, control method thereof, and program |
-
2006
- 2006-03-06 JP JP2006060240A patent/JP4822882B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2007241474A (en) | 2007-09-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4926004B2 (en) | Document processing apparatus, document processing method, and document processing program | |
JP4366108B2 (en) | Document search apparatus, document search method, and computer program | |
US20070171473A1 (en) | Information processing apparatus, Information processing method, and computer program product | |
EP1736894A1 (en) | Digitization service manual generation method and additional data generation method | |
US9430716B2 (en) | Image processing method and image processing system | |
JP4785655B2 (en) | Document processing apparatus and document processing method | |
CN100430957C (en) | Image processing device, image processing method, and storage medium storing image processing program | |
JP2005295564A (en) | Document management method | |
JP5205028B2 (en) | Handwritten annotation management device and interface | |
JP2008129793A (en) | Document processing system, apparatus and method, and recording medium with program recorded thereon | |
JP2005151127A5 (en) | ||
JPH11184894A (en) | Method for extracting logical element and record medium | |
JP2006065477A (en) | Character recognition device | |
EP1304625B1 (en) | Method and apparatus for forward annotating documents and for generating a summary from a document image | |
JP2010092383A (en) | Electronic document file search device, electronic document file search method, and computer program | |
US20120136815A1 (en) | Display Device and Display Method | |
JP4822882B2 (en) | Information processing apparatus, information processing method, and program | |
JP2004334341A (en) | Document retrieval system, document retrieval method, and recording medium | |
JP2021064143A (en) | Sentence generating device, sentence generating method, and sentence generating program | |
JP2007241473A (en) | Information processing apparatus and method, program, and storage medium | |
JP2006227914A (en) | Information search device, information search method, program and storage medium | |
JP2011034504A (en) | Document processing device, document processing method, program, and storage medium | |
JP2007241568A (en) | Topic image extraction method, device and program | |
JP4517822B2 (en) | Image processing apparatus and program | |
JP2009199164A (en) | Document management device, document management method and recording medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090217 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090217 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110831 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110905 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110906 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140916 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |