JP2007241474A - Information processing apparatus and method, program, and storage medium - Google Patents

Information processing apparatus and method, program, and storage medium Download PDF

Info

Publication number
JP2007241474A
JP2007241474A JP2006060240A JP2006060240A JP2007241474A JP 2007241474 A JP2007241474 A JP 2007241474A JP 2006060240 A JP2006060240 A JP 2006060240A JP 2006060240 A JP2006060240 A JP 2006060240A JP 2007241474 A JP2007241474 A JP 2007241474A
Authority
JP
Japan
Prior art keywords
data
attribute
information processing
arrangement structure
changing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006060240A
Other languages
Japanese (ja)
Other versions
JP4822882B2 (en
JP2007241474A5 (en
Inventor
Hidetomo Soma
英智 相馬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2006060240A priority Critical patent/JP4822882B2/en
Publication of JP2007241474A publication Critical patent/JP2007241474A/en
Publication of JP2007241474A5 publication Critical patent/JP2007241474A5/ja
Application granted granted Critical
Publication of JP4822882B2 publication Critical patent/JP4822882B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To efficiently and accurately retrieve and use the subject of retrieval from within multimedia documents. <P>SOLUTION: An information processing method, which is capable of processing electronic documents including data with different attributes, includes analyzing in attribute units the layout structure of data contained in electronic documents (S502); and comparing the layout structure of data of a first attribute selected with the layout structure of data of a second attribute for which the data of the first attribute is referred to (S506). Based on the comparison result, if the layout structure of the data of the first attribute is different from the layout structure of the data of the second attribute, additional data is created and, according to the layout structure of one of the data, the layout structure of the other is changed (S507). The additional data created is registered as data for retrieval for associating the data of the first attribute with the data of the second attribute (S508). <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は、動画、静止画、音声データ、テキストなどを構成要素として含む電子文書(以下、「マルチメディア文書」ともいう。)を検索、利用する技術に関するものである。   The present invention relates to a technique for retrieving and using an electronic document (hereinafter also referred to as “multimedia document”) including moving images, still images, audio data, text, and the like as constituent elements.

近年、デジタルデータの処理・通信技術の発達により、動画、静止画、音声、テキストなどが混在したマルチメディア文書を扱うことが可能なシステムが提供されている。かかるシステムによれば、マルチメディア文書をコンテンツとして作成し、記録(蓄積)することが可能であり、また、蓄積したマルチメディア文書を検索し、利用することも可能である。   In recent years, with the development of digital data processing / communication technology, systems capable of handling multimedia documents in which moving images, still images, audio, text, and the like are mixed have been provided. According to such a system, it is possible to create and record (accumulate) a multimedia document as content, and to search and use the accumulated multimedia document.

マルチメディア文書の各構成要素(動画、静止画、音声データ、テキストなど)に着目し、検索を実現する技術は動画、静止画、音声、テキストなどのそれぞれについて、検索に使用する技術が異なる。そのため、動画、静止画、音声データ、テキストなどのうちから必要な情報を検索する場合、個別の検索技術の適用が必要となる。特定の構成要素として動画、静止画、音声、テキストを検索する際に、各構成要素自体の情報と、マルチメディア文書内の他の情報とを組み合わせ、各構成要素を特徴付けた検索技術がある。この検索技術によると、例えば、静止画の検索において、マルチメディア文書内の他の情報として、文書中のタイトルや静止画の説明文などが組み合わされて、静止画が特徴付けられている。この検索技術では、静止画等を特徴付ける情報として、その静止画に対するマルチメディア文書中のタイトルや、説明文などのテキストをどのように獲得するかが問題である。例えば、特許文献1においては、マルチメディア文書中の画像情報に関連するテキスト情報を抽出し、検索対象のテキストの規模に関する情報を抽出し、検索時に利用している。
特開2000−306103号公報
Focusing on each component of the multimedia document (moving image, still image, audio data, text, etc.), the technology for realizing the search is different for each of moving image, still image, audio, text, and the like. Therefore, when searching for necessary information from moving images, still images, audio data, texts, etc., it is necessary to apply individual search techniques. When searching for moving images, still images, audio, and text as specific components, there is a search technology that combines each component's own information with other information in the multimedia document to characterize each component. . According to this search technique, for example, in a still image search, a still image is characterized by combining a title in the document and a description of the still image as other information in the multimedia document. In this search technique, there is a problem of how to acquire text such as a title and an explanation in a multimedia document for the still image as information characterizing the still image. For example, in Patent Document 1, text information related to image information in a multimedia document is extracted, information on the scale of text to be searched is extracted, and used at the time of search.
JP 2000-306103 A

しかしながら、上述の特許文献1では、検出対象の画像と本文の関係は特定しているが、画像と本文のレイアウト(配置構造)を合わせる情報処理は行っていない。そのため、マルチメディア文書内の検索や利用を行う場合、文章の記載と対応する図表など、構成要素間の関係が正確に捉えられないことになり、検索対象を効率的に精度よく検索し、利用することが困難になるという問題がある。   However, in the above-mentioned Patent Document 1, the relationship between the image to be detected and the text is specified, but information processing that matches the layout (arrangement structure) of the image and the text is not performed. Therefore, when searching and using in multimedia documents, the relationship between components such as texts and corresponding charts cannot be accurately grasped, and the search target is searched and used efficiently and accurately. There is a problem that it becomes difficult to do.

本発明は、上記問題点に鑑みてなされたものであり、マルチメディア文書中から検索対象を効率的に精度よく検索し、利用することを可能にする技術の提供を目的とする。   The present invention has been made in view of the above-described problems, and an object of the present invention is to provide a technique that enables a search target to be efficiently and accurately searched from a multimedia document and used.

上記目的を達成するべく、本発明にかかる情報処理装置は、
異なる属性のデータを含む電子文書を処理することが可能な情報処理装置であって、
前記電子文書に含まれるデータの配置構造を属性単位に解析するレイアウト解析手段と、
選択された第1属性のデータの配置構造と、当該第1属性のデータを参照する第2属性のデータの配置構造とを比較する比較手段と、
前記比較手段の比較結果に基づき、前記第1属性のデータの配置構造と第2属性のデータの配置構造とが相違する場合、追加データを生成して、何れか一方の配置構造に合わせて他方の配置構造を変更する変更手段と、
前記変更手段により生成された前記追加データを、前記第1属性のデータ及び第2属性のデータとを関係づける検索用データとして登録する登録手段とを備えることを特徴とする。
In order to achieve the above object, an information processing apparatus according to the present invention provides:
An information processing apparatus capable of processing an electronic document including data with different attributes,
Layout analysis means for analyzing the arrangement structure of data included in the electronic document in attribute units;
A comparing means for comparing the arrangement structure of the selected first attribute data with the arrangement structure of the second attribute data referring to the first attribute data;
If the data structure of the first attribute is different from the data structure of the second attribute based on the comparison result of the comparing means, additional data is generated, and the other is matched to one of the arrangement structures. Changing means for changing the arrangement structure of
Registration means for registering the additional data generated by the changing means as search data that associates the data of the first attribute and the data of the second attribute.

本発明に拠れば、マルチメディア文書中から検索対象を効率的に精度よく検索し、利用することが可能になる。   According to the present invention, it becomes possible to efficiently search and use a search target from a multimedia document with high accuracy.

本発明の実施形態を添付図面の参照により説明する。図1は、本発明の実施形態にかかる情報処理装置の内部構成を概略的に説明する図である。   Embodiments of the present invention will be described with reference to the accompanying drawings. FIG. 1 is a diagram schematically illustrating an internal configuration of an information processing apparatus according to an embodiment of the present invention.

同図において、CPU101は情報処理装置における各種制御を実行する。ROM102は情報処理装置の立ち上げ時に実行されるブートプログラムや各種データを格納する。RAM103はCPU101が処理するための制御プログラムを格納するとともに、CPU101が各種制御を実行する際の作業領域を提供する。   In the figure, a CPU 101 executes various controls in the information processing apparatus. The ROM 102 stores a boot program executed when the information processing apparatus is started up and various data. The RAM 103 stores a control program to be processed by the CPU 101 and provides a work area when the CPU 101 executes various controls.

入力部104はキーボード、マウス、スタイラスペン、ダイヤルなどから構成され、ユーザによる各種入力操作環境を提供する。   The input unit 104 includes a keyboard, a mouse, a stylus pen, a dial, and the like, and provides various input operation environments for the user.

外部記憶装置105はハードディスクやフロッピー(登録商標)ディスク、光ディスク、磁気ディスク、光磁気ディスク、磁気テープ、不揮発性のメモリカード等の記録媒体と、記憶媒体を駆動し、情報を記録するドライブなどで構成される。外部記憶装置105はマルチメディア文書やそれを検索、再利用する際に使用する情報などを記録し、利用することが可能な記憶容量を有するものとする。情報処理装置が検索サーバとして、検索サービスを提供する場合、検索用付加情報を検索用のメタデータとして外部記憶装置105に格納する。   The external storage device 105 includes a recording medium such as a hard disk, a floppy (registered trademark) disk, an optical disk, a magnetic disk, a magneto-optical disk, a magnetic tape, and a nonvolatile memory card, and a drive that drives the storage medium and records information. Composed. The external storage device 105 is assumed to have a storage capacity that can record and use multimedia documents and information used when searching and reusing them. When the information processing apparatus provides a search service as a search server, the search additional information is stored in the external storage device 105 as search metadata.

表示部106はディスプレイなどで構成され、各種入力操作の状態をユーザに対して表示する。通信部107は他の機器と通信を行うための構成要素であり、RS232C、USB、IEEE1394、P1284、SCSI、モデム、Ethernet(登録商標)などの有線通信機能を有する。また、通信部107は Bluetooth、赤外線通信、IEEE802.11b等の無線通信の各種通信機能を有する。108はLANであり、通信部107はLAN108を介して情報処理装置を他の機器と通信することが可能である。コネクタ109は通信部107を介して情報処理装置を他の機器と接続するためのコネクタである。コネクタ109の先に、記憶装置や、他の機器を接続して情報処理装置から記憶装置等を利用することが可能になる。   The display unit 106 is configured by a display or the like, and displays various input operation states to the user. The communication unit 107 is a component for communicating with other devices, and has a wired communication function such as RS232C, USB, IEEE1394, P1284, SCSI, modem, Ethernet (registered trademark). The communication unit 107 has various communication functions such as Bluetooth, infrared communication, and IEEE802.11b. Reference numeral 108 denotes a LAN, and the communication unit 107 can communicate the information processing apparatus with other devices via the LAN 108. A connector 109 is a connector for connecting the information processing apparatus to another device via the communication unit 107. It is possible to connect a storage device or another device to the end of the connector 109 to use the storage device from the information processing apparatus.

115は、撮像ユニットであり、動画または静止画を撮影することが可能である。情報処理装置内の各構成要素は内部バス110により接続されており、相互にデータの送受信が可能である。情報処理装置は、LAN108、通信部107を介して他の装置から送信されたマルチメディア文書を外部記憶装置105に格納することも可能である。また、情報処理装置は、撮像ユニット115により撮像された静止画等と入力部104により入力された文書等とを組み合わせたマルチメディア文書を生成することが可能である。情報処理装置は、生成したマルチメディア文書を外部記憶装置105に格納することが可能である。   Reference numeral 115 denotes an imaging unit that can capture a moving image or a still image. Each component in the information processing apparatus is connected by an internal bus 110 and can transmit and receive data to and from each other. The information processing apparatus can also store the multimedia document transmitted from another apparatus via the LAN 108 and the communication unit 107 in the external storage device 105. The information processing apparatus can generate a multimedia document that combines a still image captured by the imaging unit 115 and a document input by the input unit 104. The information processing apparatus can store the generated multimedia document in the external storage device 105.

図2は、本実施形態で処理の対象となるマルチメディア文書201の1ページ分の構成例を例示した図である。202はマルチメディア文書201の文書部分を示し、203は文書の見出しを示す。見出し203には、文書部分204、グラフ205、キャプション(説明文)206、グラフ207、キャプション(説明文)208、グラフ209、キャプション210、ページ番号211が含まれる。   FIG. 2 is a diagram exemplifying a configuration example for one page of the multimedia document 201 to be processed in the present embodiment. Reference numeral 202 denotes a document portion of the multimedia document 201, and 203 denotes a document heading. The heading 203 includes a document part 204, a graph 205, a caption (description) 206, a graph 207, a caption (description) 208, a graph 209, a caption 210, and a page number 211.

図3は、情報処理装置のCPU101がマルチメディア文書201のレイアウト解析を行った結果を記述する基本部分のデータ構成を例示する図である。図中右に示す(3−1)から(3−32)は、レイアウト解析結果の各行番号に対応したものである。尚、レイアウト解析結果の表示は、図3に示すXML形式に限定されるものでなく、SGML形式など他の構造化文書により表記することも可能である。   FIG. 3 is a diagram exemplifying a data structure of a basic part describing a result of the layout analysis of the multimedia document 201 performed by the CPU 101 of the information processing apparatus. (3-1) to (3-32) shown on the right in the figure correspond to the respective row numbers of the layout analysis result. The display of the layout analysis result is not limited to the XML format shown in FIG. 3, but can be expressed by other structured documents such as the SGML format.

(3−1)行目はページの開始を示すもので、マルチメディア文書201のページ番号が11であることを示している。また、(3−32)行は該当ページの終了を示している。   The (3-1) line indicates the start of a page and indicates that the page number of the multimedia document 201 is 11. The (3-32) line indicates the end of the corresponding page.

(3−2)から(3−4)行目までは、該当ページの大きさを特定するための情報を記述している。ページ左上を原点(O)とし、y軸をページ下方向に正方向、x軸を右方向に正方向とするx−y座標系で記述している(図2)。   From (3-2) to (3-4) lines, information for specifying the size of the corresponding page is described. The upper left corner of the page is the origin (O), the y-axis is the forward direction in the lower direction of the page, and the x-axis is the forward direction in the right direction (FIG. 2).

ここでは、(3−3)行目において、x方向に600、y方向に900の大きさであると記述されている。以下、位置や大きさなどの情報は、この座標系により記述するものとする。尚、ページの大きさは、縦横の数値に限らず、A4、B5等の規格により特定してもよいし、m行xn列等のページレイアウトの設定値により特定することも可能である。   Here, it is described in the (3-3) line that the size is 600 in the x direction and 900 in the y direction. Hereinafter, information such as position and size is described in this coordinate system. Note that the page size is not limited to vertical and horizontal numerical values, but may be specified by a standard such as A4 or B5, or may be specified by a page layout setting value such as m rows and xn columns.

(3−5)から(3−31)行目は、ページ内の構成要素を列挙したもので、各構成要素をブロック(Block)という単位で表現している。ここで、(3−6)から(3−21)行目は、図2に示すマルチメディア文書201の文書部分202、見出し203、文書部分204の文章領域のブロックを表現したものである。   Lines (3-5) to (3-31) list the constituent elements in the page, and express each constituent element in a unit of a block. Here, lines (3-6) to (3-21) represent blocks of the text area of the document part 202, the headline 203, and the document part 204 of the multimedia document 201 shown in FIG.

(3−6)行目は、レイアウト解析により付されたブロックを識別するための番号(以下、「ブロック識別番号」という。)が「1101」であること、データの属性が文章を入れるテキスト形式のブロックであることを示している。   The (3-6) line is a text format in which the number for identifying the block given by the layout analysis (hereinafter referred to as “block identification number”) is “1101”, and the attribute of the data is a text. It shows that it is a block.

(3−7)から(3−9)行目はブロック識別番号1101により特定されるブロックのページ内における位置情報が示されている。(3−8)行目において、位置情報は(50、40)と記述されており、この位置情報は文書部分202、見出し203及び文書部分204を含む文書領域のブロックにおける点G1に対応する(図2を参照)。   The (3-7) to (3-9) lines indicate position information in the page of the block specified by the block identification number 1101. In the (3-8) line, the position information is described as (50, 40), and this position information corresponds to the point G1 in the block of the document area including the document part 202, the heading 203, and the document part 204 ( (See FIG. 2).

(3−10)から(3−12)行目は、文書領域のブロックの大きさ(サイズ)の情報が示されている。図3において、サイズは(x、y)=(400、500)である。文書領域のブロックの点G1を基準として、サイズの情報に基づいて、文書領域のブロックのページ内における位置とサイズを特定することが可能になる。   Lines (3-10) to (3-12) show information on the size (size) of blocks in the document area. In FIG. 3, the size is (x, y) = (400, 500). With reference to the point G1 of the block in the document area, the position and size of the block in the document area in the page can be specified based on the size information.

(3−13)から(3−20)行目は、文書領域のブロックで記述されている内容が示されている。この文章は、紙媒体などからスキャンした場合には、文字認識などの技術を用いることで、画像から文字やテキスト情報に変換することで実現される。あるいは、LAN108を介して、他の装置から送信されてくる電子データに基づいてテキスト情報等を取得することも可能である。   Lines (3-13) to (3-20) show the contents described in the document area block. When the document is scanned from a paper medium or the like, it is realized by converting the image into characters and text information by using a technique such as character recognition. Alternatively, text information or the like can be acquired based on electronic data transmitted from another device via the LAN 108.

(3−15)行目は、見出し部分203に相当する内容であって、見出しの番号が「5」であること、見出しのタイトルが「客層の分析」という内容であることを示すXML情報が記述されている。そして、(3−16)行目には、テキストデータの内容か記述される。   The (3-15) line contains contents corresponding to the headline portion 203, and XML information indicating that the headline number is “5” and the headline title is “analysis of customer segment”. is described. In line (3-16), the contents of the text data are described.

(3−17)〜(3−19)行目は箇条書きの項目であることを示すXML情報が記述されている。(3−18)行目には、箇条書きの項目の文書部分に相当する内容が記述されており、「スキー客」という表現がアンダーラインつきの表現であることを示すXML情報(タグ<UL>および</UL>)が記述されている。   The (3-17) to (3-19) lines describe XML information indicating itemized items. In the (3-18) line, the content corresponding to the document part of the item of the bullet item is described, and XML information (tag <UL>) indicating that the expression “ski customer” is an underlined expression. And </ UL>).

(3−22)行目は、レイアウト解析により付されたブロック識別番号」が「1102」であること、データの属性が図形を入れるグラフ形式のブロックであることを示している。   The (3-22) line indicates that the block identification number given by the layout analysis is “1102”, and that the data attribute is a graph-type block into which a graphic is inserted.

(3−23)から(3−25)行目はブロック識別番号1102により特定されるブロックのページ内における位置情報が示されている。(3−24)行目において、位置情報は(60、560)と記述されており、この位置情報は円グラフ205、円グラフ207を含む図形領域のブロックにおける点G2に対応する(図2を参照)。   The (3-23) to (3-25) lines indicate the position information within the page of the block specified by the block identification number 1102. In the (3-24) line, the position information is described as (60, 560), and this position information corresponds to the point G2 in the block of the graphic area including the pie chart 205 and the pie chart 207 (see FIG. 2). reference).

(3−26)から(3−28)行目は、グラフ形式のブロックの大きさ(サイズ)の情報が示されている。図3において、サイズは(x、y)=(100、80)である。グラフ形式のブロックの点G2を基準として、サイズの情報に基づいて、グラフ形式のブロックのページ内における位置とサイズを特定することが可能になる。   Lines (3-26) to (3-28) show information on the size (size) of the block in the graph format. In FIG. 3, the size is (x, y) = (100, 80). Based on the size information, the position and size of the graph block in the page can be specified based on the point G2 of the graph block.

(3−29)〜(3−31)行目は、グラフ205(Graph1)、グラフ207(Graph2)、グラフ210(Graph3)が記述されている。尚、各種グラフに限られず、表形式の表示、写真や描画データなどをマルチメディア文書の構成要素とすることも可能である。   In lines (3-29) to (3-31), a graph 205 (Graph 1), a graph 207 (Graph 2), and a graph 210 (Graph 3) are described. Note that the present invention is not limited to various types of graphs, and a table format display, a photograph, drawing data, and the like can be used as components of the multimedia document.

レイアウト解析の結果、マルチメディア文書201に含まれる構成要素(文書部分202等、グラフ205等)が抽出される。構成要素はブロックごとに、ブロック識別番号、属性情報、ブロックの位置情報、サイズ情報、文書またはグラフ等が抽出される。   As a result of the layout analysis, components (document portion 202, graph 205, etc.) included in multimedia document 201 are extracted. For each block, a block identification number, attribute information, block position information, size information, a document, a graph, or the like is extracted for each block.

CPU101は外部記憶装置105に保存されたマルチメディア文書に対してレイアウト解析を行う。そして、レイアウト解析の結果から構成要素ごとに(ブロックごとに)特徴量を抽出し、これをメタデータとして、その特徴量を処理可能な検索用の情報として、外部記憶装置105に登録することが可能である。レイアウト解析に基づく特徴量の抽出により、様々なマルチメディア文書の記録されている様々なフォーマットに依存することなく、検索が可能になる。更に、検索時にメタデータの検索だけを処理すればよいので、検索処理に要する処理時間を短縮することが可能になる。この処理により、様々なマルチメディア文書の記録されている様々なフォーマットに依存することなく、検索、利用が容易になる。   The CPU 101 performs layout analysis on the multimedia document stored in the external storage device 105. Then, a feature amount is extracted for each component (for each block) from the layout analysis result, and this is registered as metadata in the external storage device 105 as search information that can be processed. Is possible. The feature amount extraction based on the layout analysis enables the search without depending on various formats in which various multimedia documents are recorded. Furthermore, since only the metadata search needs to be processed at the time of search, the processing time required for the search process can be shortened. This process facilitates retrieval and use without depending on various formats in which various multimedia documents are recorded.

図4は、図2に示したマルチメディア文書に対して行ったレイアウト解析の結果(図3)を概略的に示す図である。   FIG. 4 is a diagram schematically showing the result (FIG. 3) of the layout analysis performed on the multimedia document shown in FIG.

401はページ番号に対応する部分であり、402は図2の文章部分202に対応するテキストデータが配置される。403は図2の見出し203に対応し、404は見出し203の次の行の文書部分に対応するテキストデータが配置されている。   Reference numeral 401 denotes a part corresponding to the page number, and reference numeral 402 denotes text data corresponding to the sentence part 202 in FIG. Reference numeral 403 corresponds to the headline 203 in FIG. 2, and reference numeral 404 denotes text data corresponding to the document portion on the next line of the headline 203.

405は図2の箇条書き部分を示し、この中には、箇条書き項目(406、409)が含まれる。箇条書き項目406の下には、箇条書き項目の内容(407、408)に関するテキストデータが配置されている。箇条書き項目の内容(407、408)中には、テキストデータと、この中で参照される図番号(3−a)、(3−b)が記載されている。   Reference numeral 405 denotes a bulleted portion in FIG. 2, which includes bulleted items (406, 409). Under the bullet item 406, text data relating to the content (407, 408) of the bullet item is arranged. In the contents of itemized items (407, 408), text data and figure numbers (3-a), (3-b) referenced therein are described.

410は図領域を示し、図領域410には、図番号(3−a)、図番号(3−b)、図番号(3−c)に対応する図表データが配置される(412、413、414)。以下の説明では図表データを例としているが、この他、動画、静止画であってもよい。   Reference numeral 410 denotes a figure area. In the figure area 410, chart data corresponding to the figure number (3-a), the figure number (3-b), and the figure number (3-c) are arranged (412, 413, 414). In the following description, chart data is used as an example, but a moving image or a still image may be used.

箇条書き部分405のデータの配置構造(406〜409)と、図領域410のデータの配置構造(412〜414)とを比較すると、箇条書き項目406に対応するデータが図領域410に無い点で両者は相違する。   When the data arrangement structure (406 to 409) of the bulleted portion 405 is compared with the data arrangement structure (412 to 414) of the figure area 410, the data corresponding to the item 406 is not in the figure area 410. They are different.

箇条書き部分が、順番に意味を持たせた記載であったり、対立に意味を持たせた記載であったりする場合、参照される各図表データ(412、413、414)も同様の関係が成立することが多い。このため、文書部分と図表部分との配置構造を合わせることで、マルチメディア文書内の構成要素の関係をより正確に捉えることが可能となる。   If the itemized portion is a description that gives meaning in order or a description that gives meaning to the confrontation, the same relationship is also established for each referenced chart data (412, 413, 414). Often to do. For this reason, by combining the arrangement structure of the document part and the chart part, it is possible to more accurately grasp the relationship between the constituent elements in the multimedia document.

図5は、本実施形態における、マルチメディア文書内の文書部分と図表部分との配置構造を合わせる処理の流れを説明する図である。この処理は情報処理装置におけるCPU101の制御の下に実行されるものとする。   FIG. 5 is a diagram for explaining a flow of processing for matching the arrangement structure of the document part and the chart part in the multimedia document in the present embodiment. This process is executed under the control of the CPU 101 in the information processing apparatus.

ステップS501で処理を開始し、ステップS502において、外部記憶装置106等内にあるマルチメディア文書に対してレイアウト解析を行う。   In step S501, the process is started. In step S502, layout analysis is performed on the multimedia document in the external storage device 106 or the like.

ステップS503において、レイアウト解析の結果から得られた図形又は表形式のデータ(図表データ)から選択した図表に対するキャプションの有無を検索する。ここでは、例として、図2のグラフ205、207、209が選択されたものとする。キャプションが無いと判定された場合は処理を終了し、キャプションがあると判定された場合、処理をステップS504に進める。ここで、図2の206、208、210がキャプションとして検索される。   In step S503, it is searched whether or not there is a caption for the chart selected from the graphic or tabular data (chart data) obtained from the layout analysis result. Here, as an example, it is assumed that the graphs 205, 207, and 209 in FIG. 2 are selected. If it is determined that there is no caption, the process ends. If it is determined that there is a caption, the process proceeds to step S504. Here, 206, 208, and 210 in FIG. 2 are searched as captions.

ステップS504において、近傍のテキスト形式のデータブロックに、キャプション206、208、210と同じテキスト(表現)を含むデータを検索する。   In step S504, data including the same text (expression) as the captions 206, 208, and 210 is searched for in a nearby text data block.

ステップS505において、キャプション206、208、210と同じテキスト(表現)を含むデータが検索されなかった場合、処理は終了する。一方、ステップS505の判定で、キャプション(説明文)206、208、210と同じテキスト(表現)を含むデータが検索された場合、処理はステップS506に進められる。   In step S505, if data including the same text (expression) as the captions 206, 208, and 210 is not retrieved, the process ends. On the other hand, if it is determined in step S505 that data including the same text (expression) as the captions (descriptions) 206, 208, and 210 is searched, the process proceeds to step S506.

ステップS506において、キャプション(説明文)の配置構造と、キャプション(説明文)と同じテキスト(表現)を含む文書部分のデータの配置構造が同じか否かを判定する。具体的には、図4において、キャプション(3−a、b、c)の図表データ(412〜414)の配置構造と、キャプション(3−a、b、c)を含む文書部分(箇条書き部分)(407〜409)の配置構造とを比較する。これらの配置構造が同じであれば、処理をステップS509に進め処理を終了する。一方、配置構造が異なる場合、処理はステップS507に進められ、構造の複雑な方に合わせて配置構造が変更される。単純な構造に合わせた場合、複雑な配置構造を有するデータの一部が削除されるのを防止するためである。図4の場合、箇条書き項目406に対応するデータが図領域410に無い点で、文書部分(箇条書き部分)(407〜409)の配置構造の方が図表データ(412〜414)より複雑であると判定される。この判定結果により、キャプション(3−a、b、c)の図表データ(412〜414)の配置構造が文書部分(箇条書き部分)(407〜409)の配置構造に合わせて変更される。   In step S506, it is determined whether the arrangement structure of the caption (description) is the same as the arrangement structure of the data of the document portion including the same text (expression) as the caption (description). Specifically, in FIG. 4, the layout structure of the chart data (412 to 414) of the caption (3-a, b, c) and the document part (itemized part) including the caption (3-a, b, c) ) (407 to 409). If these arrangement structures are the same, the process proceeds to step S509 and the process ends. On the other hand, if the arrangement structure is different, the process proceeds to step S507, and the arrangement structure is changed according to the more complicated structure. This is for preventing a part of data having a complicated arrangement structure from being deleted when the simple structure is adopted. In the case of FIG. 4, the arrangement structure of the document part (itemized part) (407 to 409) is more complicated than the chart data (412 to 414) in that there is no data corresponding to the itemized item 406 in the figure area 410. It is determined that there is. Based on the determination result, the arrangement structure of the chart data (412 to 414) of the caption (3-a, b, c) is changed in accordance with the arrangement structure of the document part (itemized part) (407 to 409).

配置構造の変更にいおいて、図6の615に示されるような追加データが生成される。この追加データは、図表データ(612、613)と文書部分(箇条書き部分)(407、408)とを関係づける検索用データとして機能する。追加データは検索用メタデータとして、外部記憶装置105等に格納(登録)され、図表データ(612、613)または文書部分(箇条書き部分)(407、408)の検索、利用に際して参照される。   In changing the arrangement structure, additional data as shown by 615 in FIG. 6 is generated. This additional data functions as search data for associating the chart data (612, 613) and the document part (itemized part) (407, 408). The additional data is stored (registered) as search metadata in the external storage device 105 or the like, and is referred to when searching or using the chart data (612, 613) or the document part (itemized part) (407, 408).

ステップS508において、キャプション(3−a、b、c)の図表データ(412〜414)の配置構造を変更したレイアウト解析の結果を外部記憶装置105等に格納して処理を終了する。   In step S508, the layout analysis result obtained by changing the arrangement structure of the chart data (412 to 414) of the caption (3-a, b, c) is stored in the external storage device 105 and the process is terminated.

図6は、キャプション「3−a」、「3−b」、「3−c」を含む文書部分(箇条書き部分)(407〜409)の配置構造に合わせて、対応する図表データ(412〜414)の配置構造を変更した結果を示す図である。配置構造を変更する前のレイアウト解析の結果を示す図4と同一部分は同一の参照番号を付している。   FIG. 6 shows corresponding chart data (412 to 412) according to the arrangement structure of the document parts (itemized parts) (407 to 409) including the captions “3-a”, “3-b”, and “3-c”. It is a figure which shows the result of having changed the arrangement structure of 414). The same parts as those in FIG. 4 showing the result of layout analysis before changing the arrangement structure are given the same reference numerals.

図表データ612、613の配置構造が、キャプション「3−a」、「3−b」を含む文書部分(箇条書き部分)(407、408)の配置構造に合わせて変更されている。配置構造を合わせるためのデータとして、「図領域」615が生成され、図領域615の下に図表データ612、613が含まれるように配置構造が変更される。   The arrangement structure of the chart data 612 and 613 is changed according to the arrangement structure of the document parts (itemized parts) (407 and 408) including the captions “3-a” and “3-b”. As data for matching the arrangement structure, a “diagram area” 615 is generated, and the arrangement structure is changed so that the chart data 612 and 613 are included under the figure area 615.

これにより、箇条書き部分(405〜409)の記載(例えば、比較・対立・列挙などの関係)を、図領域(410、615、612、613、414)にも反映でき、相互の対応関係を明確にすることが可能になる。文書部分と図領域との配置構造を合わせることで、マルチメディア文書内の構成要素の関係をより正確に捉えることが可能となる。   As a result, the description (for example, the relationship such as comparison / conflict / enumeration) of the bulleted portion (405 to 409) can be reflected in the diagram area (410, 615, 612, 613, 414), and the correspondence between them It becomes possible to clarify. By combining the arrangement structure of the document part and the figure area, it is possible to more accurately grasp the relationship between the constituent elements in the multimedia document.

箇条書き項目406に対応する図領域615は検索用のメタデータとして利用することが可能である。箇条書き部分407から対応する図表データを検索する場合、説明文の構文解析によらず箇条書き項目406に対応するメタデータ(図領域615)を検索することで、対応する図表データ612を検索し、利用することが可能になる。   The figure area 615 corresponding to the itemized item 406 can be used as search metadata. When searching the corresponding chart data from the itemized section 407, the corresponding chart data 612 is searched by searching the metadata (the figure area 615) corresponding to the item 406 without parsing the explanation text. Can be used.

同様に、図表データ612から対応する箇条書き部分407を検索する場合、構文解析によらず、図領域615と対応する箇条書き項目406を検索することで、図表に対応する箇条書き部分を検索し、利用することが可能になる。   Similarly, when searching for the corresponding bulleted part 407 from the chart data 612, the bulleted part corresponding to the chart is searched by searching the bulleted item 406 corresponding to the figure area 615 regardless of the syntax analysis. Can be used.

尚、本実施形態において、検索用のメタデータとして利用することが可能なデータ(図領域615)は1つの場合を示したが複数でもよい。複数の検索用メタデータが生成される場合、各検索用メタデータに定量的な重要度を設定することが可能である。例えば、複数の検索用メタデータが階層構造となる場合、階層の深さを評価して、定量的な重要度を各検索用メタデータに設定してもよい。検索用メタデータの重要度の評価として、例えば、第1の階層の重要度を100、第2の階層の重要度を80、第3の階層の重要度を60と、階層の深さに応じて重要度を定量化することも可能である。そして、この重要度を指標として検索の優先順位を決定することも可能である。   In the present embodiment, the number of data that can be used as search metadata (the figure region 615) is one, but a plurality of data may be used. When a plurality of search metadata are generated, it is possible to set a quantitative importance for each search metadata. For example, when a plurality of search metadata has a hierarchical structure, the depth of the hierarchy may be evaluated, and quantitative importance may be set for each search metadata. As the evaluation of the importance of the search metadata, for example, the importance of the first hierarchy is 100, the importance of the second hierarchy is 80, the importance of the third hierarchy is 60, depending on the depth of the hierarchy. It is also possible to quantify the importance. It is also possible to determine the priority of search using this importance as an index.

以上説明したように、本実施形態に拠れば、マルチメディア文書中から検索対象を効率的に精度よく検索し、利用することが可能になる。   As described above, according to the present embodiment, it is possible to efficiently search and use a search target from a multimedia document with high accuracy.

(他の実施形態)
なお、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給することによっても、達成されることは言うまでもない。また、システムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、達成されることは言うまでもない。
(Other embodiments)
Needless to say, the object of the present invention can also be achieved by supplying a storage medium storing software program codes for realizing the functions of the above-described embodiments to a system or apparatus. Needless to say, this can also be achieved by the computer (or CPU or MPU) of the system or apparatus reading and executing the program code stored in the storage medium.

この場合、記憶媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。   In this case, the program code itself read from the storage medium realizes the functions of the above-described embodiments, and the storage medium storing the program code constitutes the present invention.

プログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク,ハードディスク,光ディスク,光磁気ディスク,CD−ROM,CD−R,不揮発性のメモリカード,ROMなどを用いることができる。   As a storage medium for supplying the program code, for example, a flexible disk, a hard disk, an optical disk, a magneto-optical disk, a CD-ROM, a CD-R, a nonvolatile memory card, a ROM, or the like can be used.

また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現される。また、プログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態が実現される場合も含まれることは言うまでもない。   Further, the functions of the above-described embodiment are realized by executing the program code read by the computer. In addition, an OS (operating system) running on a computer performs part or all of actual processing based on an instruction of a program code, and the above-described embodiment is realized by the processing. Needless to say.

本発明の実施形態にかかる情報処理装置の内部構成を概略的に説明する図である。It is a figure which illustrates roughly the internal structure of the information processing apparatus concerning embodiment of this invention. 本発明の実施形態で処理の対象となるマルチメディア文書の1ページ分の構成例を例示した図である。It is the figure which illustrated the example of a structure for one page of the multimedia document used as the process target in embodiment of this invention. 本発明の実施形態にかかるマルチメディア文書のレイアウト解析を行った結果を記述するデータ構成を示す図である。It is a figure which shows the data structure which describes the result of having performed the layout analysis of the multimedia document concerning embodiment of this invention. 図2に示したマルチメディア文書に対して行ったレイアウト解析の結果を概略的に示す図である。FIG. 3 is a diagram schematically showing a result of layout analysis performed on the multimedia document shown in FIG. 2. 本発明の実施形態における、マルチメディア文書内の文書部分と図表部分との配置構造を合わせる処理の流れを説明する図である。It is a figure explaining the flow of a process which matches the arrangement structure of the document part and figure part in a multimedia document in embodiment of this invention. キャプションを含む文書部分(箇条書き部分)の配置構造に合わせて、対応する図表データの配置構造を変更した結果を示す図である。It is a figure which shows the result of having changed the arrangement structure of corresponding chart data according to the arrangement structure of the document part (itemized part) containing a caption.

Claims (10)

異なる属性のデータを含む電子文書を処理することが可能な情報処理装置であって、
前記電子文書に含まれるデータの配置構造を属性単位に解析するレイアウト解析手段と、
選択された第1属性のデータの配置構造と、当該第1属性のデータを参照する第2属性のデータの配置構造とを比較する比較手段と、
前記比較手段の比較結果に基づき、前記第1属性のデータの配置構造と第2属性のデータの配置構造とが相違する場合、追加データを生成して、何れか一方の配置構造に合わせて他方の配置構造を変更する変更手段と、
前記変更手段により生成された前記追加データを、前記第1属性のデータ及び第2属性のデータとを関係づける検索用データとして登録する登録手段と、
を備えることを特徴とする情報処理装置。
An information processing apparatus capable of processing an electronic document including data with different attributes,
Layout analysis means for analyzing the arrangement structure of data included in the electronic document in attribute units;
Comparing means for comparing the arrangement structure of the selected first attribute data with the arrangement structure of the second attribute data referring to the first attribute data;
If the data structure of the first attribute is different from the data structure of the second attribute based on the comparison result of the comparing means, additional data is generated, and the other is matched to one of the arrangement structures. Changing means for changing the arrangement structure of
Registration means for registering the additional data generated by the changing means as search data relating the data of the first attribute and the data of the second attribute;
An information processing apparatus comprising:
前記変更手段は、前記比較手段の比較結果に基づき、配置構造が複雑な方に合わせて、前記第1属性のデータの配置構造または第2属性のデータの配置構造を変更することを特徴とする請求項1に記載の情報処理装置。   The changing means changes the data attribute structure of the first attribute or the data attribute structure of the second attribute in accordance with a more complicated arrangement structure based on the comparison result of the comparing means. The information processing apparatus according to claim 1. 前記変更手段により複数の追加データが生成された場合、前記登録手段は、当該複数の追加データそれぞれに重要度を設定し、検索用データとして登録することを特徴とする請求項1に記載の情報処理装置。   2. The information according to claim 1, wherein, when a plurality of additional data is generated by the changing unit, the registration unit sets importance for each of the plurality of additional data and registers the data as search data. Processing equipment. 前記第1属性のデータには動画、静止画、図表データが含まれ、前記第2属性のデータにはテキストデータが含まれることを特徴とする請求項1または2に記載の情報処理装置。   The information processing apparatus according to claim 1, wherein the first attribute data includes moving images, still images, and chart data, and the second attribute data includes text data. 異なる属性のデータを含む電子文書を処理することが可能な情報処理方法であって、
前記電子文書に含まれるデータの配置構造を属性単位に解析するレイアウト解析工程と、
選択された第1属性のデータの配置構造と、当該第1属性のデータを参照する第2属性のデータの配置構造とを比較する比較工程と、
前記比較工程の比較結果に基づき、前記第1属性のデータの配置構造と第2属性のデータの配置構造とが相違する場合、追加データを生成して、何れか一方の配置構造に合わせて他方の配置構造を変更する変更工程と、
前記変更工程により生成された前記追加データを、前記第1属性のデータ及び第2属性のデータとを関係づける検索用データとして登録する登録工程と、
を備えることを特徴とする情報処理方法。
An information processing method capable of processing an electronic document including data of different attributes,
A layout analysis step of analyzing the arrangement structure of data included in the electronic document in attribute units;
A comparison step of comparing the arrangement structure of the selected first attribute data with the arrangement structure of the second attribute data referring to the first attribute data;
If the data structure of the first attribute is different from the data structure of the second attribute based on the comparison result of the comparison step, additional data is generated, and the other is combined with one of the arrangement structures. A change process for changing the arrangement structure of
A registration step of registering the additional data generated by the changing step as search data relating the data of the first attribute and the data of the second attribute;
An information processing method comprising:
前記変更工程は、前記比較工程の比較結果に基づき、配置構造が複雑な方に合わせて、前記第1属性のデータの配置構造または第2属性のデータの配置構造を変更することを特徴とする請求項5に記載の情報処理方法。   The changing step is characterized in that, based on the comparison result of the comparison step, the data attribute structure of the first attribute or the data attribute structure of the second attribute is changed in accordance with the more complicated arrangement structure. The information processing method according to claim 5. 前記変更工程により複数の追加データが生成された場合、前記登録工程は、当該複数の追加データそれぞれに重要度を設定し、検索用データとして登録することを特徴とする請求項5に記載の情報処理方法。   6. The information according to claim 5, wherein when a plurality of additional data is generated by the changing step, the registration step sets importance for each of the plurality of additional data and registers the data as search data. Processing method. 前記第1属性のデータには動画、静止画、図表データが含まれ、前記第2属性のデータにはテキストデータが含まれることを特徴とする請求項5または6に記載の情報処理方法。   The information processing method according to claim 5 or 6, wherein the first attribute data includes moving images, still images, and chart data, and the second attribute data includes text data. 請求項5乃至8のいずれかに記載の情報処理方法をコンピュータに実行させることを特徴とするプログラム。   A program for causing a computer to execute the information processing method according to claim 5. 請求項9に記載のプログラムを格納したことを特徴とするコンピュータ可読の記憶媒体。   A computer-readable storage medium storing the program according to claim 9.
JP2006060240A 2006-03-06 2006-03-06 Information processing apparatus, information processing method, and program Expired - Fee Related JP4822882B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006060240A JP4822882B2 (en) 2006-03-06 2006-03-06 Information processing apparatus, information processing method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006060240A JP4822882B2 (en) 2006-03-06 2006-03-06 Information processing apparatus, information processing method, and program

Publications (3)

Publication Number Publication Date
JP2007241474A true JP2007241474A (en) 2007-09-20
JP2007241474A5 JP2007241474A5 (en) 2009-04-02
JP4822882B2 JP4822882B2 (en) 2011-11-24

Family

ID=38586984

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006060240A Expired - Fee Related JP4822882B2 (en) 2006-03-06 2006-03-06 Information processing apparatus, information processing method, and program

Country Status (1)

Country Link
JP (1) JP4822882B2 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0362169A (en) * 1989-07-31 1991-03-18 Agency Of Ind Science & Technol Method and device for document retrieval
JP2005276161A (en) * 2004-02-26 2005-10-06 Seiko Epson Corp Layout system, layout device, layout program, template selection program, storage medium storing layout program, storage medium storing template selection program, and layout method
JP2005352696A (en) * 2004-06-09 2005-12-22 Canon Inc Image processing device, control method thereof, and program

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0362169A (en) * 1989-07-31 1991-03-18 Agency Of Ind Science & Technol Method and device for document retrieval
JP2005276161A (en) * 2004-02-26 2005-10-06 Seiko Epson Corp Layout system, layout device, layout program, template selection program, storage medium storing layout program, storage medium storing template selection program, and layout method
JP2005352696A (en) * 2004-06-09 2005-12-22 Canon Inc Image processing device, control method thereof, and program

Also Published As

Publication number Publication date
JP4822882B2 (en) 2011-11-24

Similar Documents

Publication Publication Date Title
JP4926004B2 (en) Document processing apparatus, document processing method, and document processing program
JP4366108B2 (en) Document search apparatus, document search method, and computer program
US20070171473A1 (en) Information processing apparatus, Information processing method, and computer program product
US9430716B2 (en) Image processing method and image processing system
JP4785655B2 (en) Document processing apparatus and document processing method
CN100430957C (en) Image processing device, image processing method, and storage medium storing image processing program
JP2009098763A (en) Handwritten annotation management apparatus and interface
JP2008129793A (en) Document processing system, apparatus and method, and recording medium with program recorded thereon
JP2005151127A5 (en)
JP2006065477A (en) Character recognition device
EP1304625B1 (en) Method and apparatus for forward annotating documents and for generating a summary from a document image
JP2010092383A (en) Electronic document file search device, electronic document file search method, and computer program
JP4822882B2 (en) Information processing apparatus, information processing method, and program
JP2004334341A (en) Document retrieval system, document retrieval method, and recording medium
JP3711636B2 (en) Information retrieval apparatus and method
JP2007011973A (en) Information retrieval device and information retrieval program
JP2007241473A (en) Information processing apparatus and method, program, and storage medium
JP2006227914A (en) Information search device, information search method, program and storage medium
JP5384315B2 (en) SEARCH DEVICE, METHOD, AND PROGRAM
JP2011034504A (en) Document processing device, document processing method, program, and storage medium
JP2007241568A (en) Topic image extraction method, device and program
JP4517822B2 (en) Image processing apparatus and program
JP2010102734A (en) Image processor and program
JP7377565B2 (en) Drawing search device, drawing database construction device, drawing search system, drawing search method, and program
JP2007317131A (en) Document management method, document retrieval method and device, and program

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090217

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090217

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110831

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110905

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110906

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140916

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees