JP2007310501A - 情報処理装置、その制御方法、及びプログラム - Google Patents

情報処理装置、その制御方法、及びプログラム Download PDF

Info

Publication number
JP2007310501A
JP2007310501A JP2006136963A JP2006136963A JP2007310501A JP 2007310501 A JP2007310501 A JP 2007310501A JP 2006136963 A JP2006136963 A JP 2006136963A JP 2006136963 A JP2006136963 A JP 2006136963A JP 2007310501 A JP2007310501 A JP 2007310501A
Authority
JP
Japan
Prior art keywords
information
text information
metadata
document
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006136963A
Other languages
English (en)
Inventor
Tomomi Takada
智美 高田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2006136963A priority Critical patent/JP2007310501A/ja
Publication of JP2007310501A publication Critical patent/JP2007310501A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】文書中の非テキスト情報を精度よく検索するためのメタデータを抽出し得る情報処理装置、その制御方法、及びプログラムを提供する。
【解決手段】文書中の画像、図、表等の非テキスト情報の特徴情報を、これら非テキスト情報に係るキャプション情報等に基づいて抽出する。また、文書中の複数の非テキスト情報を結ぶ矢印記号等の記号が示す各非テキスト情報間の関係情報を解析する。そして、非テキスト情報の特徴情報と記号が示す関係情報に基づいて、文書中の非テキスト情報を検索するためのメタデータを該文書から抽出する。すなわち、画像、図、表等のテキスト情報の特徴やこれらの関係まで考慮してメタデータを抽出する。
【選択図】図7

Description

本発明は、文書中に含まれる画像を精度よく検出するためのメタデータを抽出するのに好適な情報処理装置、その制御方法、及びプログラムに関する。
近年、保存スペースの削減,遠隔地からの利便性から、膨大な量の電子文書が氾濫している。このため、所望の電子文書の検索に長時間を要するようになってきている。
特に、近年の電子文書には、テキスト情報だけでなく、画像、図、表、音声等の非テキスト情報も含まれている。これら非テキスト情報は、それ自体は文字情報を持たないか、持っていても断片的な文字情報であるため、所望の非テキスト情報の検索は困難である。
そこで、画像情報にメタデータ(テキスト情報)を付加し、このメタデータを用いて画像情報を検索する技術が開発されている(特許文献1参照)。
特開2002−202975号公報
ところで、文書データ内の一部領域に含まれる画像,図,表などの非テキスト情報を検索したいという要望がある。本発明は、このような背景の下になされたもので、その目的は、文書中の画像を精度よく検索するためのメタデータを抽出し得る情報処理装置、その制御方法、及びプログラムを提供することにある。
上記目的を達成するために、本発明は、文書中の非テキスト情報に関連するメタデータを抽出し、該メタデータを用いて非テキスト情報を検索する情報処理装置において、文書中の非テキスト情報の特徴情報を抽出する抽出手段と、文書中の複数の非テキスト情報を結ぶ記号が示す各非テキスト情報間の関係情報を解析する記号解析手段と、前記非テキスト情報の特徴情報と前記記号が示す関係情報に基づいて、前記文書中の非テキスト情報を検索するためのメタデータを該文書から抽出するメタデータ抽出手段とを備えたことを特徴とする。
本発明によれば、画像や表の特徴、画像や表の関係などまで考慮してメタデータを抽出しているので、文書中の画像を精度よく検索するためのメタデータを抽出し得る情報処理装置、その制御方法、及びプログラムを提供することが可能となる。
[第1の実施の形態]
図1は、本発明の第1の実施の形態に係る情報処理装置が構築されたコンピュータの基本構成を示すブロック図である。
図1において、CPU101は、本情報処理装置における各種の制御を行う。その制御内容は、後述するROM102、RAM103、外部記憶装置106等に格納されたプログラムによって指示される。また、CPU101やプログラムの構成により、CPU101は、複数のプログラムを並列に実行することができる。このCPU101は、バス105を介して、ROM102、RAM103、外部記憶装置106等の各種デバイスと相互に交信可能に接続されている。ROM102には、ブートプログラム等のプログラム、データ等が格納されている。RAM103は、CPU101が実際に実行する処理を実行する際に、その処理に係るプログラムを外部記憶装置106等からロードして展開する等、ワークエリアとして利用される。
キーボード104は、アルファベットキー、ひらがなキー、カタカナキー等の文字入力キー、及びカーソル移動キー等の各種の機能キーを有している。なお、マウスのようなポインティングデバイスをキーボード104に搭載することもできる。
外部記装置106には、OS、アプリケーションプログラム等の各種のプログラム、電子文書データ等に各種のデータが格納される。この外部記憶装置106は、ハードディスク、光ディスク、磁気ディスク、光磁気ディスク、不揮発性の半導体メモリ等の記憶媒体などで構成されている。なお、外部記装置106には、図2〜図5、図12〜図13のフローチャートに係る処理を行なうためのアプリケーションプログラムも格納されている。
表示器107は、液晶ディスプレイなどで構成され、各種の入力操作の係るデータ、CPU101での処理内容等を表示する。NCU(Network Control Unit)108は、ネットワーク(LAN)等を介して他のコンピュータ装置等と通信するための制御を行う。このNCU108による通信制御により、本実施の形態に係るプログラムやデータを他の装置と共有することが可能になる。NCU108による通信は、RS232CやUSB、IEEE1394、P1284、SCSI、モデム、Ethernet(登録商標)などの有線通信、Bluetooth、赤外線通信、IEEE802.11b等の無線通信の何れの通信方式を採ってもよい。
イメージスキャナ109は、原稿を光学的に読み取り、電子的な画像データを得るためのデバイスである。イメージスキャナ109により得られた画像データは、外部記憶装置106、RAM等に格納することができる。なお、画像データは、NCU108を介して外部のネットワークスキャナ、複写機等の入力機器から入力することも可能である。また、イメージスキャナ109により読み取られた画像データを、NCU108を介して外部の装置に転送・格納することも可能である。
次に、第1の実施の形態における情報処理装置の文書登録処理を、図2のフローチャートに基づいて説明する。なお、図2の文書登録処理における各処理は、各ページの文書データについてページ単位で行なわれるものである。
CPU101は、まず、文書データ(電子文書)の入力処理を行なう(ステップS201)。この入力処理は、例えば、イメージスキャナ109、或いはNCU108を介してネットワーク上の複写機等の外部の入力機器から入力された文書データを処理する。また、文書データには、テキストデータと、図、表、撮像画像等の画像データとが混在していてもよい。さらに、文書データは、複数ページであってもよい。また、文書データは、ワードプロセッサ等の編集ソフトウェアで作成された文書データや、HTML等で記述された文書データ、PDF形式の文書データでもかまわない。だだし、PDF形式の文書データの場合は、ステップS301の入力処理において、フォーマット変換等の処理を行なう必要がある。
次に、CPU101は、入力した文書データを解析する(ステップS202)。この文書データの解析処理では、CPU101は、文書データを文字領域(テキスト領域)、画像、図、表等の画像領域(非テキスト領域)に分割し、さらに、矢印等の記号画像の解析、レイアウトの抽出等を行なう。この文書データの解析処理は、図3のフローチャートを用いて後で詳細に説明する。
次に、CPU101は、文書データの解析結果に基づいて、文書の論理構造を解析する(ステップS203)。ここで、「論理構造」とは、ステップS202で解析された領域、レイアウト等について、「タイトル」、「見出し」等の論理的な属性を抽出して付与、或いは「矢印の始点/終点の関係」等の論理的な関係を推定して構造化したものである。この文書の論理構造解析処理は、図4のフローチャートを用いて後で詳細に説明する。
次に、CPU101は、文書の論理構造解析結果に基づいて、当該文書データ中のテキスト領域から画像や表に関連する検索用メタデータを抽出する(ステップS204)。この検索用メタデータを抽出処理は、図5のフローチャートを用いて後で詳細に説明する。
次に、図2のステップS202におけるCPU101が実行する文書データの解析処理を図3のフローチャートに基づいて説明する。以下では複数ページのうちの1ページ分の処理に関して説明する。
CPU101は、あるページの文書データについて、文字、図、表、撮像画像等の画像の種類別にその矩形領域を抽出する(ステップS301)。この場合、CPU101は、それら矩形領域ごとに、画像の種類と、ページ内での位置座標や領域サイズ等の物理的な情報を検出する。
すなわち、CPU101は、文字領域については、文字列の読み方向と文字サイズを検出し、その検出結果に基づいて文字又は文字列を抽出する。ここでは、文字列の方向が同じで、文字サイズと文字間値と行間値がほぼ均一である領域を1纏まりの文字領域として抽出するものとする。非文字領域(画像領域)については、枠構造や線の連続状況等に基づいて抽出する。
なお、入力された文書データがカラー画像データ等の多値データである場合は、2値データに変換することで、同様に領域抽出処理を行うことができる。この領域抽出処理は、例えば特開平6−96275号公報等に開示されているので、ここでは、その詳細な説明は省略する。
図6、図7は、或るページの文書データに対する矩形領域抽出処理の処理結果を示している。図6において、600はスキャンされたページデータであり、601〜613は抽出された矩形領域を示している。この矩形領域のうち、601〜605、611〜613は文字領域である。この領域抽出処理において、CPU101は、文字列の方向が同じで、文字サイズと文字間値・行間値がほぼ均一であり、更に行方向の配置(字下げ、センタリング、揃え等)が同じ領域が1つの文字領域として抽出している。
図6の606〜610は画像領域である。また、606〜608は図または画像として、609と610は記号画像として識別されている。なお、記号画像609,610には、それぞれ「動作AB」、「動作BC」という文字列が内包されている。本実施の形態においては、予め記号画像として登録されたもの以外のものを図または画像として識別するものとする。
図7の文書データは、図6の文書データとほほ同様であるが、図7の記号画像709,710には、文字列が内包されていない点で図6と相違している。また、図7の文字領域704a,704bには、706〜708の図に関する説明文が記述されている点で、図6と相違している。
図8は、或る文書データから抽出された矩形領域に関する物理的な情報を例示している。図8に示すように、当該文書の各ページの文書データに対して、「幅290mm、高さ210mm」等のページサイズ、「300dpi」等の読み込み時の解像度、及び「画像データ」等のデータ種別が付与されている。
図8において、各ページに関する情報としては、抽出された各矩形領域に対して、「文字領域」、「画像領域」等の領域種別、「40×12.5」等の矩形領域のサイズ、「10,10」等のページ内での位置座標等の物理的な情報が付与されている。なお、位置座標は、矩形領域の特定の角位置、例えば左上の角位置の座標を示すものである。さらに、文字領域については、「8ポイント」等の文字サイズ、「横」、「縦」等の文字列の方向等を示す文字情報が付与されている。画像領域については、「図」、「撮像画像」、「表」、「記号」等の画像種別情報が付与されている。なお、文字領域については、「abcレポート」等の実際の文字列(テキスト)も付与されているが、この文字列は、未だ文字認識されて文字コード化されていない画像データとしての文字列である。
なお、図8の例では、ページ内での矩形領域の位置を特定するためのデータとしては、領域のサイズと特定の角位置の座標情報を抽出しているが、これに限定されることなく、例えば矩形領域の左上の角位置と右下の角位置、或いは矩形領域の右上の角位置と左下の角位置の座標を抽出するようにしてもよい。また、文字領域については、後述する文字認識を行なった後に、字体(フォント)を付与することも可能である。
CPU101は、上記のような矩形領域抽出処理を行なった後、当該ページの全ての矩形領域に対して文字認識処理を行う(ステップS302)。すなわち、この文字認識処理は、図6の矢印の記号画像609,610のように画像領域(図、表、撮像画像、その他一般的な画像)に文字が含まれている場合もあるので、文字領域だけでなく画像領域に対しても行なう。
なお、図2のS201で入力された文書データが、イメージスキャナ等から入力されたものではなく、ワードプロセッサ等で処理された文字コードに係るものである場合は、ステップS302での文字認識処理は不要である。また、イメージスキャナ等がOCR機能を有しており、イメージスキャナ等からの文書データが文字列について文字コードに変換されている場合も、ステップS302での文字認識処理は不要である。
次に、CPU101は、文書データから、画像、図、表等の画像領域間の関係を示す、数字、矢印、+、罫線(⊥等の罫線を示す記号)等の記号画像の種類や記号画像に関する各種情報(矢印記号の場合は、矢印の向き等)を抽出する(ステップS303)。そして、CPU101は、ステップS301で検出した当該ページ内での各矩形領域の位置座標や領域サイズ等の物理的な情報に基づいて、当該ページにおける各矩形領域の空間的な位置関係(レイアウト)を抽出する(ステップS304)。
このレイアウト抽出処理では、例えば、ページ内の2つの矩形領域に対する空間的な関係として、互いの矩形領域の上下左右方向の離間距離、大小関係などを抽出する。すなわち、レイアウト抽出処理では、図9に示したように、互いの矩形領域の上下左右方向の離間距離としては、矩形領域が重なっている、接している(図9のtouch)、近傍に在る(図9のnear)、含まれている等の状態を抽出している。また、重なり、接触、内包の位置関係にない場合は、隣接する2つの矩形領域間の相対的な距離を(図9のupper,lower参照)、ネットワーク構造で表現している。
このように、互いの矩形領域の上下左右方向の離間距離を抽出する代わりに、ページの所定位置、例えばページの左上の角の位置(位置座標の原点)に対する各矩形領域の位置、すなわち図8に示した位置(x,y)、及び領域サイズに基づいて、各矩形領域の上下左右方向等の位置関係を抽出することも可能である。
以上の文書データの解析結果は、図8に示すとおり、ページ毎に木構造やネットワーク構造で表現することができる。また、ステップS301〜304の処理結果は、全てRAM103、外部記憶装置106等の記憶媒体に格納される。さらに、テップS301〜304の処理は、入力された文書データの全ページについて実行される。
次に、図2のステップS203にける文書の論理構造の解析処理例を、図4のフローチャートに基づいて説明する。
CPU101は、ページ及び矩形領域の読み順を判定する(ステップS401)。この場合、ページ及び矩形領域の読み順は、各文字領域の文字列の読み方向、各文字領域の位置関係、文書中の主な文字領域(サイズの大きな領域)の文字列の読み方向から組方向を認定することによって判定することができる。例えば、日本語で横組のページでは、文字領域は、上から下の段へ、左から右の段へと読み順が付与されることになる。なお、この読み順判定処理は、必須の処理ではなく、文書の種類によっては省略してもよい。
次に、CPU101は、ページや矩形領域の論理属性と矩形領域間の関係を解析する(ステップS402)。例えば、文書の先頭ページである、他のページに比べて空白が多く文字数が少ない、文字サイズが非常に大きい等、他のページと比べて特徴的な文字領域が存在するページは、文書における「表紙ページ」であることが推定できる。
また、例えば、ページの最上部や最下部に位置し、他の領域とのレイアウト上の関連性が見出せない(距離が離れている、配置や特徴に関する共通性・規則性が少ない等)領域や、文書内の他のページと同位置に同じ内容の領域が存在する場合は、ヘッダやフッタであることが推定できる。
さらに、例えば、文書内の他の文字領域と配置や文字についての共通性・規則性が低い、文字サイズが大きく文字数の少ない文字領域である等の特徴的な文字領域が、ヘッダを除いた文書の上部に在れば「タイトル」、それ以外の位置に在れば「見出し」であると推定することができる。また、撮像画像や図、表等の画像領域に対して最も近接した文字領域を、その画像領域に対する「キャプション(説明文)」と推定して、画像領域との関連付けを行うことができる。
なお、これらの論理属性や論理的な関係は、特徴的なページや矩形領域に対して推定可能であり、全てのページ、矩形領域について付与できるとは限らない。また、各ページや矩形領域について、複数の論理属性や論理的な関係を付与することも可能である。この場合には、複数の論理属性や論理的な関係について、その可能性の強さを示す数値等を付与してもよい。
次に、CPU101は、記号画像が存在するか否かを判別する(ステップS403)。その結果、記号画像が存在すれば、CPU101は、その記号画像の種類と記号画像に関する各種情報、及び記号画像に関連するテキスト情報に基づいて、記号画像の意味と、記号画像とその近傍の矩形領域との関係を解析する(ステップS404)。
記号画像に関連するテキスト情報としては、例えば、記号画像の中に含まれるテキスト情報、記号画像に近接する文字領域中のテキスト情報、記号画像と同じページや前後のページに含まれる周辺文字領域中の記号に関する説明部分のテキスト情報等がある。記号画像の中に含まれるテキスト情報や、記号画像に近接する文字領域中のテキスト情報は、記号画像の意味について直接的に説明している可能性が高いと考えられる。
また、記号画像の近傍の矩形領域が画像領域の場合には、その画像領域に近接する文字領域は、当該画像領域の「キャプション」である可能性が高い。その「キャプション」を利用することで、CPU101は、周辺の文字領域から記号画像に関する説明部分と思われるテキスト情報を探索することができる。
これら記号画像に関連するテキスト情報を解析することによって、記号画像とその周辺の矩形領域との関係を推定することができる。例えば、記号画像が矢印である場合は、この矢印は、当該矢印の始点と終点に位置する矩形領域に対して、順序や時間・空間の推移、状態の変化、原因・結果、部分・全体等の関係、説明や注釈の付与等の関係が存在することが考えられる。すなわち、本実施の形態では、外部記憶装置106に記号の意味を記憶しておく。例えば、矢印記号の場合、矢印記号と、矢印の始点と終点に位置する矩形領域が上述した関係の意味が外部記憶装置106に予め登録される。
また、図6に示したように、矢印609,610中に当該矢印の意味を示すテキスト情報が含まれている場合もある。このような場合には、CPU101は、矢印609が「動作AB」を意味し、矢印609の始点に位置する画像606と終点に位置する画像607が「動作AB」の前後の状態の関係にあると認識する。
また、図7のように、矢印画像と同ページの文字領域に当該矢印画像に関する説明テキスト情報が記述されている場合もある。このような場合、CPU101は、矢印709の始点に位置する画像706に近接する文字領域711から文字列「図1−A:aa」を抽出し、矢印709の終点に位置する画像707に近接する文字領域712から文字列「図1−B:bb」を抽出する。そして、CPU101は、これら抽出した文字列は、画像領域の近接領域に存在していたので、キャプションであると見做す。そしてCPU101は、このキャプションが他の文字領域に存在するか否か検索する。このときの検索範囲として該当ページ内あるいは前後1ページを設定してもよい。図7の例では、704aの文字領域に「図1−Aはaa、図1−Bはbb、」という文字列があり、704bの文字列に「aaに動作ABを行なうとbbになる。」という文字列がある。従って、CPU101は、外部記憶装置106を参照することにより、矢印709が「動作AB」を意味し、矢印709の始点に位置する画像706と終点に位置する画像707が「動作AB」の前後の状態の関係にあると推定する。
なお、画像706と画像707の関係を矢印の始点/終点の関係としておき、後述するメタデータ抽出処理を行なう際に矢印709に関連するテキスト情報を解析して、「動作AB」の前後の関係を抽出してもよい。
ステップS403にて、記号画像が存在しないと判別された場合、又はステップS404の処理が終了した場合は、CPU101は、本文書の論理構造の解析処理を終了する。なお、ステップS401〜S404の処理の結果は、全てRAM103、又は外部記憶装置106に格納される。
図10は、文書データの論理構造の解析結果を例示した図であり、ページと矩形領域の論理属性、それら矩形領域の読み順や論理的関係等を示している。図10において、ページ1、2、…は、読み込まれた文書データの各ページデータに関する論理情報を示し、この論理情報としては各ページデータに対する読み順等が付与されている。また、領域1,2,…11は、ページデータ1から抽出された矩形領域に関する論理情報を示している。
この矩形領域に関する論理情報としては、矩形領域の読み順や論理属性、矢印の始点/終点の関係、動作ABの前後の関係、画像/キャプションの関係、キャプション/サブキャプションの関係等の矩形領域間の関係等が付与されている。なお、図10において、ページや矩形領域を繋ぐ実線の矢印は、ページや矩形領域の読み順や論理的関係を示しており、矢印の無い点線は、包含関係を示している。例えば、ページデータ1には、矩形領域1、矩形領域2、…、矩形領域11が含まれており、論理属性が「見出し」の矩形領域3、論理属性が「段落」の矩形領域4、論理属性が「キャプション」の矩形領域5、…の順に、各矩形領域を読むように読み順が付与されている。
また、論理属性が「キャプション」の矩形領域5と矩形領域11は、「キャプションとサブキャプションの関係」で結ばれており、論理属性が「図」の矩形領域6と矩形領域11は、「画像とキャプションの関係」で結ばれている。また、論理属性が「図」の矩形領域6と矩形領域7には、「”動作AB”の前/後の関係」、または「矢印の始点/終点の関係」が付与されている。
なお、論理構造の解析は、後述するメタデータ抽出処理を行なえるものであれば、図10の例示した以外の手法や形態で行なってもよい。図10に示す解析結果は、RAM103あるいは外部記憶装置106に記憶される。
次に、図2のステップS204における検索用メタデータの抽出処理例を、図5のフローチャートに基づいて詳細に説明する。
CPU101は、文書の論理構造の解析結果に基づいて、検索対象となる矩形領域を取得する(ステップS501)。ここでは、撮像画像、図、表等の画像領域を検索対象とするが、それ以外の矩形領域を検索対象としてもよい。
次に、CPU101は、検索対象として取得した矩形領域のうち、1つの矩形領域に着目し、その着目した矩形領域を検索するための検索用メタデータとなるテキスト情報を抽出する(ステップS502)。
この抽出処理では、まず、CPU101は、検索用メタデータの抽出対象となる矩形領域を取得する。ここでは、検索用メタデータの抽出対象となる矩形領域として、例えば、検索対象として着目した画像領域と論理的関係が結ばれている文字領域や、更にその文字領域と論理的関係が結ばれている文字領域を取得する。
次に、CPU101は、検索用メタデータの抽出対象となる矩形領域として取得した文字領域のテキスト情報の中から、画像領域について説明しているテキスト部分を抽出する。例えば、論理属性が「キャプション」である文字領域のテキスト情報の中から画像番号を示す文字列(「図1」等)と画像名を示す文字列(「システム構成図」等)を抽出し、これら文字列を検索用メタデータとする。
なお、CPU101は、検索用メタデータの抽出対象となる矩形領域として、検索対象として着目した画像領域の周辺に存在し、論理属性が「段落」である文字領域を取得する。そして、CPU101は、その取得した文字領域から画像番号を示す文字列を含む文を検索用メタデータとして抽出してもよい。
また、CPU101は、検索用メタデータの抽出対象となる矩形領域から、「上(の)表」等のような画像の方向を示す語と画像を示す語を含む文を抽出する。そして、CPU101は、その語が示す画像の方向と、図3のステップS304で抽出されたページ内での各矩形領域の空間的な関係(レイアウト)を照合して、画像とメタデータを関連付けることも可能である。また、CPU101は、「次(の)ページの図」のようなページの位置を示す語と画像を示す語を含む文を抽出し、その語が示すページ位置と文書のページ構成を照合して、画像と検索用メタデータを関連付けたりすることも可能である。
次に、CPU101は、検索対象として着目している画像領域が、他の画像領域と矢印等の記号画像による関係で結ばれているか否かを判別する(ステップS503)。その結果、他の画像領域と矢印等の記号画像による関係で結ばれていると判断された場合は、CPU101は、ステップS504に進む。
CPU101は、ステップS504では、検索対象として着目している画像領域に対して関係があると判断された他の画像領域のキャプション中に含まれるテキスト情報を抽出する。さらに、CPU101は、検索対象として着目している画像領域とその画像領域に関係があると判断された他の画像領域を結ぶ記号画像の意味する関係に類似した言語表現を含むテキスト情報を、周辺の文字領域から検索する。この検索は、記号の持つ意味と、双方の画像領域のキャプション中に含まれるテキスト情報に基づいて検索することが可能である。検索用メタデータとして抽出する。
ステップS504において、CPU101は、具体的には、キャプションやサブキャプションに対し、自然言語処理技術を利用して、形態素解析や構文解析などの解析を行う。この解析処理では、まず、意味を持つ単語の集まりの最小単位である文節に文を区切る。そして、文節中の単語、その単語の品詞、語義などの情報と、文中における文節相互の関係に関する情報を取り出して、文の構造を解析する。
次に、CPU101は、形態素解析、構文解析された単語、文節等が含まれるテキスト情報を、周辺の文字領域から検索用メタデータの候補として抽出する。そして、その検索用メタデータの候補に対して、自然言語処理技術を利用して形態素解析や構文解析などの解析を行う。
更に、CPU101は、検索用メタデータの候補であるテキスト情報内の各単語、文節の関係と類似する構造を持つテキスト情報が、周辺の文字領域に存在するかどうかを調査する。この調査は、検索用メタデータの候補であるテキスト情報内の各単語、文節相互の関係(文構造)と、その周辺のキャプション/サブキャプションの文構造、及びこれら論理関係が付与された画像を結ぶ記号画像の関係とを比較することにより行なわれる。そして、類似性の高い文構造を持つテキスト情報がメタデータとして抽出される。
例えば、図10の矩形領域5と矩形領域11のキャプション/サブキャプション中に含まれる「図1」、「abc」、「図1−A」「aa」で周辺の文字領域を検索する。すると、図7に示した矩形領域74aから「図1−Aはaa、図1−Bはbb、図1−Cはccについての画像である。」という文を取得することができる。また、図7に示した矩形領域74bから「aaに動作ABを行うとbbになる。」という文や、「bbに動作BCを行うとccになる。」という文を取得することができる。
また、図10では、矩形領域6と矩形領域7に対して、「”動作AB”の前/後」の関係が付与されているので、この関係と各領域のサブキャプションから、「aaに動作ABを行うとbbになる。」という文が、矩形領域6と矩形領域7の関係に類似した構造を持つテキスト情報であることがわかる。
ステップS503とステップS504で説明した検索用メタデータの抽出方法は例であり、他にも様々な検索用メタデータの抽出方法が考えられる。また、検索用メタデータ抽出時に、検索用メタデータとして抽出された理由を示す情報を出力してもよい。さらに、検索用メタデータの抽出対象となった矩形領域の論理属性や論理的な関係等に従って、検索対象の画像と検索用メタデータの関係の強さを示す数値を出力してもよい。また、ここでは文字領域に含まれるテキスト情報を検索用メタデータとして抽出したが、テキスト情報以外の情報を検索用メタデータとして抽出してもよい。
CPU101は、上記のようにして記号画像の関係に合致した表現のテキスト情報を検索用メタデータとして抽出した後、或いはステップS503にて、記号画像による関係が無いと判別された場合は、ステップS505に進む。このステップS505では、CPU101は、ステップS502、S504で抽出された検索用メタデータと検索対象領域を関連付けて検索用DB(データベース)に格納する。この検索用DBは、外部記憶装置106上に構築され、記憶されている。
次に、CPU101は、次の検索対象の矩形領域が存在するか否かを判別する(ステップS506)。その結果、次の検索対象の矩形領域が存在する場合は、ステップS502に戻り、次の矩形領域に着目して、ステップS502以降の処理を行なう。すなわち、CPU101は、ステップS501で抽出された全ての矩形領域について、その矩形領域を検索するための検索用メタデータの抽出処理を行なう。
図11は、検索対象である画像領域と、抽出された検索用メタデータを関連付けて外部記憶装置106格納した検索用DBのデータ構造例を示したものである。図11のデータ構造では、ページデータ1に含まれる矩形領域6,7等の画像データに対して、それぞれ撮像画像、図、表等の画像種別、画像データの格納位置またはファイル名、文書から抽出されたテキスト情報等が、検索用メタデータとして付与されていることを示している。
例えば、矩形領域6の画像データに対して、画像種別として「図」、画像データ名として「012001.jpg」が付与されている。また、矩形領域6を検索するための検索用メタデータとして、文字列「aa」、「abcの仕様概要」、「aaに動作ABを行うとbbになる。」等のテキスト情報が、矩形領域6の画像データ名等に対応付けて登録されている。また、各検索用メタデータには、当該検索用メタデータが抽出された理由(サブキャプションの画像名等)、当該検索用メタデータと矩形領域6との関係の強さを示す値(3等)が付与されている。
次に、文書データに含まれる画像を検索する検索処理例を、図12のフローチャートに基づいて説明する。この検索処理は、図11に示すような画像に関連付けられている検索用メタデータを利用して行うものである。この検索処理の概要は、入力された検索条件と、各画像に関連付けられた検索用メタデータを対比し、その検索条件と適合する検索用メタデータと関連付けられている画像をピックアップして、検索結果として表示するものである。この場合、検索条件としては、キーワード、そのキーワードのリスト、自然文などをユーザが入力する。
図12において、CPU101は、ユーザが指定した文書の文書データ、その指定文書に係る図11のような検索用DBを有する外部記憶装置106から読み出されたデータをRAM103に展開する(ステップS1201)。
この場合、文書データ、検索用DB等は、図1に示した本情報処理装置が搭載されたコンピュータと電気通信回線で接続された他のコンピュータに保有しておき、このコンピュータから図1に示したコンピュータにロードするようにしてもよい。
次に、CPU101は、ユーザの操作によって入力された検索条件としての文、文節、単語(キーワード)等を検出する(ステップS1202)。すると、CPU101は、その検索条件として入力された文、文節、単語等に対して、自然言語処理技術を利用して形態素解析や構文解析などの解析処理を行う(ステップS1203)。
この場合、検索条件は、本情報処理装置が搭載されたコンピュータ以外の他のコンピュータから入力することも可能である。また、上記の解析処理では、意味を持つ単語の集まりの最小単位である文節に文を区切り、文節中の単語、単語の品詞、語義などの情報と、文中における文節相互の関係(文構造)に関する情報を取り出す。
次に、CPU101は、ステップS1203で得られた文構造(単語だけの場合を含む、以下同様)に合致する検索用メタデータと関連付けられた画像を検索する(ステップS1204)。そして、CPU101は、検索された画像の有無を判別する(ステップS1205)。その結果、検索された画像が1つも無い場合は、CPU101は、本検索処理を終了する。
CPU101は、検索された画像が複数有る場合は、検索条件の文構造と、検索された各画像に係る検索用メタデータの文構造を比較する(ステップS1206)。
そして、CPU101は、検索条件の文構造に類似する文構造を持つ検索用メタデータに係る画像を検索結果として出力する(ステップS1207)。なお、ステップS1206,S1207の処理では、文構造の類似性や検索用メタデータに付与された重要度の情報等に基づいて、検索条件と検索用メタデータとの類似度を求め、対応する画像を類似度の高い順番に並べて表示してもよい。ここで言う類似度とは、検索条件が、各画像に付与された検索用メタデータとの関係を示す表現としてどの程度適切であるかを示すものである。
次に、上記の検索処理を、具体例で説明する。例えば、「abcのaaに動作ABした後」という文が検索条件が入力された場合は、この文は、「abcの」、「aaに」「動作AB」、「した」という文節に分解され、さらに、「abc」「の」、「aa」、「に」「動作」「AB」、「した」という単語に分解される。
そして、これら単語に「名詞」、「接続詞」等の品詞情報が割り当てられる。また、各文節同士は、「修飾」、「並列」といった関係を持つこと、すなわち文構造が解析される。次に、名詞等の重要な品詞の単語である「aa」、「動作」、「AB」等が含まれた検索用メタデータに係る画像、図11の例では、矩形領域6と矩形領域7の画像を該当候補として取得する。
次に、CPU101は、これらの該当候補の画像に係る検索用メタデータの文構造と検索条件の文構造とを比較して、検索条件の文構造と類似する文構造の検索用メタデータに係る画像を、検索結果として表示器107の表示画面上に表示させる。上記の検索条件では、「abc」と「aa」、「aa」と「動作AB」、「動作AB」と「後」が修飾の関係で結ばれている。
また、図11に示したように、矩形領域6,7のキャプションによる検索用メタデータ中には「abc」が含まれ、サブキャプションによるメタデータ中には「aa」が含まれている。このように、画像がキャプション、サブキャプションを持つ場合、キャプションとサブキャプションの関係によるメタデータには修飾関係が生じると考えられる。さらに、矩形領域6,7のキャプション/サブキャプションの関係によるメタデータ中には、修飾の関係で結ばれた「aa」と「動作AB」が含まれている。このことより、矩形領域6の画像のメタデータに、検索条件の文構造との類似性が見出せることがわかる。
なお、上記の検索方法に限定されることなく、例えば、最初に検索条件に係る文字列と検索用メタデータとの類似性を判定し、類似性のある検索用メタデータと関連付けられた画像等を検索結果として表示することも可能である。
また、上記検索結果を利用することによって、文書に含まれる画像等を効率的に再利用することができるようになる。例えば、検索結果の一覧の中から所望の画像を選択して得た画像データを、ワープロ等の編集ソフトウェア等を用いて編集・加工したり、別の文書に挿入したりすることによって、再利用することができるようになる。
また、文書および文書中の画像や表を蓄積する場合に、上記の検索等メタデータを利用することによって、効率的に分類・整理・管理することができるようになる。例えば、検索用メタデータの文字列を分析して、関連するカテゴリで画像等を分類することができる。この場合、分類するカテゴリなどはユーザが与えてもよいし、クラスタリング等の統計的手法によって自動的に分類するようにしてもよい。また、分類時に、カテゴリと各画像のメタデータの類似度等を計算して求めて、分類に利用してもよい。
第1の実施の形態では、文書登録時に、文書データを解析して、文字、図、表等の領域とそれらのレイアウトを抽出し、それに基づいて領域の論理属性とそれらの論理的関係を構造化した論理構造を抽出した。そしてそれに基づいて検索用メタデータを抽出する構成となっている。
[第2の実施の形態]
第2の実施の形態の情報処理装置は、文書データに含まれる手書きに係る文字、記号に関する処理に適用したものである。すなわち、文字列がフォントで記載された紙文書中の画像、表や文章等に対して、手書き等で矢印等を使用して説明文を加筆し、この加筆がなされた紙文書をイメージスキャナ109等で読み取って電子化した文書データに適用可能な形態のものである。
以下、第2の実施の形態を、第1の実施の形態との相違点を中心に説明する。第2の実施の形態に係る情報処理装置を適用したコンピュータの基本構成は、図1に示した第1の実施の形態と同様である。
図14は、手書きで画像やテキスト等に説明文が加筆された或るページデータに対して領域抽出処理を行った結果を例示したものである。図14において、2000はスキャンされたページデータであり、2001〜2015は抽出されたオブジェクトの矩形領域を示している。2001〜2005、2011〜2014は文字領域である。この文字領域は、文字列の方向が同じで、文字サイズと文字間値・行間値がほぼ均一であり、更に行方向の配置(字下げ、センタリング、揃え等)が同じ矩形領域が1つの文字領域として抽出される。
2006〜2010、2015は画像領域であり、2006〜2008は図として認識され、2009〜2010、2015は記号画像として認識されている。また、2014と2015は、手書きで加筆された部分として認識されている。
第2の実施の形態における文書登録処理の基本的な動作は、図2を用いて説明した第1の実施の形態の場合と同様である。また、図2のステップS202での第2の実施の形態における文書データ解析処理は、図3を用いて説明した第1の実施の形態の場合とほぼ同様である。ただし、第2の実施の形態では、図3のステップS301の領域分割・抽出処理を行う際に、CPU101は、図14に示した領域2014には手書き文字であることを示す情報を付与し、領域2015には手書きの矢印であることを示す情報を付与する。
また、図2のステップS203での第2の実施の形態における論理構造解析処理は、図4を用いて説明した第1の実施の形態の場合とほぼ同様である。ただし、第2の実施の形態では、CPU101は、ステップS404において、手書きの矢印記号が存在し、その近傍に手書きの文字領域や画像領域や表領域等が存在する場合には、矢印記号が手書きによる説明・注釈の付与を意味していることを推定する。
例えば、図14の例では、手書きの矢印記号2015があり、その始点部分に手書きの文字領域2014が、終点部分に文字領域2004aが存在している。そこで、CPU101は、矢印記号2015は説明・注釈の付与を意味しており、手書きの文字領域2014は、文字領域2004aの一部のテキスト部分に対する説明・注釈であることを推定する。
図15は、第2の実施の形態における文書データの論理構造の解析結果を例示した図である。この図15は、第1の実施の形態に係る図10の解析結果とほぼ同様であり、RAM103に記憶される。ただし、論理属性が「手書き文字領域」である領域14と、論理属性が「段落」の領域4との間には、「手書きの説明/説明付与対象」という論理的関係が付与されている。
図13は、図2のステップS204での第2の実施の形態における検索用メタデータ抽出処理を示すフローチャートである。この図13は、第1の実施の形態における検索用メタデータ抽出処理を示す図5のフローチャートの処理に対して、ステップS1304〜S1306の処理が追加されたものである。
そこで、ここでは、追加された処理だけを説明する。次に、ステップS503にて、検索対象である画像領域が、他の画像領域と記号画像による関係で結ばれていると判別された場合は、CPU101は、ステップS1304に進む。
CPU101は、ステップS1304では、検索対象である画像領域が、手書きの文字領域と手書きの記号画像によって結ばれているか否かを判別する。ここで、手書きの記号画像によって結ばれていないと判別された場合には、CPU101は、ステップS1305に進み、手書きの記号画像によって結ばれていると判別された場合には、ステップS1306に進む。
CPU101は、ステップS1305では、検索対象である画像領域と他の画像領域のキャプション中に含まれる表現、及びこれらの画像領域を結ぶ記号画像の意味する関係に類似した言語表現を含むテキスト情報を、周辺の文字領域から探し出し、検索用メタデータとして抽出する。この抽出処理は、第1の実施の形態の場合と同様である。
CPU101は、ステップS1306では、ステップS502で抽出した検索用メタデータと手書きの記号画像によって結ばれている手書きの文字領域のテキストを、検索用メタデータとして抽出する。さらに、CPU101は、検索対象である画像領域と手書きの記号画像によって結ばれている手書きの文字領域のテキストを、検索用メタデータとして抽出する。
例えば、図15では、領域14と領域4に対して、「手書きの説明/説明付与対象」の関係が付与されている。この関係から、CPU101は、領域4の「aaに動作ABを行うとbbになる。」を領域6の「図」の検索用メタデータとして抽出した場合には、領域14の「xxxの状態でyyyした場合」も、領域6の「図」の検索用メタデータとして抽出する(図16参照)。
このように、第2の実施の形態では、手書きの説明も検索用メタデータとして利用して、画像、図、表を検索することができる。従って、キャプションやサブキャプションに含まれない単語がユーザ入力に係る検索条件中に含まれていた場合でも、画像、図、表を検索することが可能となる。
なお、第2の実施の形態のように、手書きの説明文が加筆された場合だけでなく、手書きの図や表等が加筆された場合にも、これら手書き部分を検索用のメタデータとして利用して、画像、図、表を検索するようにしてもよい。
以上説明したように、第1,第2の実施の形態では、画像、図、表の特徴やこれらの関係まで考慮してメタデータを抽出し、このメタデータを用いて画像、図、表を検索している。すなわち、第1,第2の実施の形態では、文書中の画像、図、表等の非テキスト情報の特徴情報を、これら非テキスト情報に係るキャプション情報等に基づいて抽出する。また、文書中の複数の非テキスト情報を結ぶ矢印記号等の記号が示す各非テキスト情報間の関係情報を解析する。そして、非テキスト情報の特徴情報と記号が示す関係情報に基づいて、文書中の非テキスト情報を検索するためのメタデータを該文書から抽出する。従って、文書中の画像を精度よく検索することが可能となる。
なお、本発明は、上記の各実施の形態に限定されることなく、例えば、ユーザが非テキスト情報を検索する文書を指定した際に、その文書に係る検索用メタデータを一覧表示し、その中から選択された検索用メタデータに関連付けられた非テキスト情報を検索結果として表示することも可能である。
また、本発明の目的は、前述した各実施の形態の機能を実現するソフトウェアのプログラムコードを記憶した記憶媒体を、システム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)が記憶媒体に格納されたプログラムコードを読み出し実行することによっても達成される。
この場合、記憶媒体から読み出されたプログラムコード自体が前述した各実施の形態の機能を実現することになり、そのプログラムコード及び該プログラムコードを記憶した記憶媒体は本発明を構成することになる。
また、プログラムコードを供給するための記憶媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光磁気ディスク、CD−ROM、CD−R、CD−RW、DVD−ROM、DVD−RAM、DVD−RW、DVD+RW等の光ディスク、磁気テープ、不揮発性のメモリカード、ROM等を用いることができる。または、プログラムコードをネットワークを介してダウンロードしてもよい。
また、コンピュータが読み出したプログラムコードを実行することにより、前述した各実施の形態の機能が実現されるだけではなく、そのプログラムコードの指示に基づき、コンピュータ上で稼動しているOS(オペレーティングシステム)等が実際の処理の一部または全部を行い、その処理によって前述した各実施の形態の機能が実現される場合も含まれる。
さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その拡張機能を拡張ボードや拡張ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって前述した各実施の形態の機能が実現される場合も含まれる。
本発明の情報処理装置が構築されたコンピュータの基本構成を示すブロック図である。 本発明の第1の実施の形態における文書登録処理を示すフローチャートである。 図2のステップS202における文書データの解析処理例を示すフローチャートである。 図2のステップS203にける文書の論理構造の解析処理例を示すフローチャートである。 図2のステップS204における検索用メタデータ抽出処理例を示すフローチャートである。 ページデータに対する領域抽出処理の結果を例示した図である(第1の実施の形態)。 他のページデータに対する領域抽出処理の結果を例示した図である(第1の実施の形態)。 ページデータや領域に関する各種物理的な情報を例示した図である(第1の実施の形態)。 ページデータ中の各矩形領域の位置関係の情報を例示した図である(第1の実施の形態)。 文書の論理構造の解析結果を例示した図である(第1の実施の形態)。 文書中の画像と検索用メタデータを関連付けて登録した検索用DBのデータ構造を例示した図である(第1の実施の形態)。 文書中の画像を検索する検索処理例を示すフローチャートである(第1の実施の形態)。 第2の実施の形態における文書中の画像を検索する検索処理例を示すフローチャートである。 手書きで説明を加筆したページデータに対して領域抽出処理を行った結果を例示した図である。 第2の実施の形態における文書の論理構造を解析した結果を例示した図である。 第2の実施の形態における文書中の画像と検索用メタデータを関連付けて登録した検索用DBのデータ構造を例示した図である(第1の実施の形態)。
符号の説明
101…CPU、102…ROM、103…RAM、106…外部記憶装置、107…表記器、109…スキャナ

Claims (12)

  1. 文書中の非テキスト情報に関連するメタデータを抽出し、該メタデータを用いて非テキスト情報を検索する情報処理装置において、
    文書中の非テキスト情報の特徴情報を抽出する抽出手段と、
    文書中の複数の非テキスト情報を結ぶ記号が示す各非テキスト情報間の関係情報を解析する記号解析手段と、
    前記非テキスト情報の特徴情報と前記記号が示す関係情報に基づいて、前記文書中の非テキスト情報を検索するためのメタデータを該文書から抽出するメタデータ抽出手段と、
    を備えたことを特徴とする情報処理装置。
  2. 前記記号は、矢印記号であることを特徴とする請求項1に記載の情報処理装置。
  3. 前記矢印記号は、テキスト情報を内包し、前記記号解析手段は、該テキスト情報に基づいて該矢印記号が結ぶ非テキスト情報間の関係情報を解析することを特徴とする請求項2に記載の情報処理装置。
  4. 前記矢印記号は、手書きで加筆された矢印記号であることを特徴とする請求項2に記載の情報処理装置。
  5. 前記抽出手段は、前記文書中の各非テキスト情報、各テキスト情報の領域の論理的な関係を解析する論理構造解析手段を有することを特徴とする請求項1〜4の何れかに記載の情報処理装置。
  6. 前記論理構造解析手段は、前記非テキスト情報に対するキャプション情報を認定することを特徴とする請求項5に記載の情報処理装置。
  7. 前記抽出手段は、前記非テキスト情報に対して認定されたキャプション情報を用いて該非テキスト情報の特徴情報を抽出し、前記メタデータ抽出手段は、該キャプション情報を用いて該非テキスト情報を検索するためのメタデータを該文書から抽出することを特徴とする請求項6に記載の情報処理装置。
  8. 前記メタデータ抽出手段は、前記非テキスト情報の周辺のテキスト情報の領域から該非テキスト情報を検索するためのメタデータを抽出することを特徴とする請求項5〜7の何れかに記載の情報処理装置。
  9. 前記メタデータ抽出手段は、1つの非テキスト情報に対して複数の前記メタデータを抽出した場合に、各メタデータに対して該非テキスト情報との関係の強さを示す情報を付与することを特徴とする請求項1〜8の何れかに記載の情報処理装置。
  10. 検索条件として入力された文字列と類似するメタデータを用いて非テキスト情報を検索する検索手段を備えたことを特徴とする請求項1〜9の何れかに記載の情報処理装置。
  11. 文書中の非テキスト情報に関連するメタデータを抽出し、該メタデータを用いて非テキスト情報を検索する情報処理装置の制御方法において、
    文書中の非テキスト情報の特徴情報を抽出する抽出工程と、
    文書中の複数の非テキスト情報を結ぶ記号が示す各非テキスト情報間の関係情報を解析する記号解析工程と、
    前記非テキスト情報の特徴情報と前記記号が示す関係情報に基づいて、前記文書中の非テキスト情報を検索するためのメタデータを該文書から抽出するメタデータ抽出工程と、
    を備えたことを特徴とする情報処理装置の制御方法。
  12. 請求項11に記載の制御方法を実行するプログラム。
JP2006136963A 2006-05-16 2006-05-16 情報処理装置、その制御方法、及びプログラム Pending JP2007310501A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006136963A JP2007310501A (ja) 2006-05-16 2006-05-16 情報処理装置、その制御方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006136963A JP2007310501A (ja) 2006-05-16 2006-05-16 情報処理装置、その制御方法、及びプログラム

Publications (1)

Publication Number Publication Date
JP2007310501A true JP2007310501A (ja) 2007-11-29

Family

ID=38843317

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006136963A Pending JP2007310501A (ja) 2006-05-16 2006-05-16 情報処理装置、その制御方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP2007310501A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009193356A (ja) * 2008-02-14 2009-08-27 Canon Inc 画像処理装置、画像処理方法、プログラム、及び記憶媒体
JP2009271779A (ja) * 2008-05-08 2009-11-19 Canon Inc 画像処理装置、画像処理方法ならびにそのプログラムおよび記憶媒体
JP2010073165A (ja) * 2008-09-22 2010-04-02 Canon Inc 情報処理装置、その制御方法、及びコンピュータプログラム
JP2011141597A (ja) * 2010-01-05 2011-07-21 Canon Inc 画像処理装置、画像処理方法、プログラム
JP2013257659A (ja) * 2012-06-11 2013-12-26 Nikkei Business Publications Inc 情報処理装置、情報処理方法、及びプログラム
JP2018200659A (ja) * 2017-05-30 2018-12-20 株式会社内田洋行 構造形式情報再利用システム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009193356A (ja) * 2008-02-14 2009-08-27 Canon Inc 画像処理装置、画像処理方法、プログラム、及び記憶媒体
JP2009271779A (ja) * 2008-05-08 2009-11-19 Canon Inc 画像処理装置、画像処理方法ならびにそのプログラムおよび記憶媒体
JP2010073165A (ja) * 2008-09-22 2010-04-02 Canon Inc 情報処理装置、その制御方法、及びコンピュータプログラム
US8380685B2 (en) 2008-09-22 2013-02-19 Canon Kabushiki Kaisha Information processing apparatus, control method thereof, computer program, and storage medium
JP2011141597A (ja) * 2010-01-05 2011-07-21 Canon Inc 画像処理装置、画像処理方法、プログラム
JP2013257659A (ja) * 2012-06-11 2013-12-26 Nikkei Business Publications Inc 情報処理装置、情報処理方法、及びプログラム
JP2018200659A (ja) * 2017-05-30 2018-12-20 株式会社内田洋行 構造形式情報再利用システム
JP7023619B2 (ja) 2017-05-30 2022-02-22 株式会社内田洋行 構造形式情報再利用システム

Similar Documents

Publication Publication Date Title
JP4785655B2 (ja) 文書処理装置及び文書処理方法
JP5663866B2 (ja) 情報処理装置及び情報処理プログラム
EP2162859B1 (en) Image processing apparatus, image processing method, and computer program
JP2014102669A (ja) 情報処理装置、情報処理方法およびプログラム
JP5372110B2 (ja) 情報出力装置、情報出力方法、及びコンピュータプログラム
US20060285748A1 (en) Document processing device
US20150146985A1 (en) Handwritten document processing apparatus and method
US20220222292A1 (en) Method and system for ideogram character analysis
JP2007122403A (ja) 文書タイトルおよび関連情報の自動抽出装置、抽出方法および抽出プログラム
JP2007310501A (ja) 情報処理装置、その制御方法、及びプログラム
JP2006221569A (ja) 文書処理システム、文書処理方法、プログラムおよび記憶媒体
JP2008129793A (ja) 文書処理システムおよび装置および方法、およびプログラムを記録した記録媒体
JP2006065477A (ja) 文字認識装置
JP2008040753A (ja) 画像処理装置、方法、プログラムおよび記録媒体
US20240104290A1 (en) Device dependent rendering of pdf content including multiple articles and a table of contents
CN113495874A (zh) 信息处理装置和计算机可读取介质
JPH103483A (ja) 情報検索装置
JP2007310503A (ja) 情報処理装置、その制御方法、及びプログラム
CN1955979A (zh) 文章标题及关联信息的自动抽取装置、抽取方法及抽取程序
JP2008134954A (ja) 情報処理装置、その制御方法、及びプログラム
US20230205910A1 (en) Information processing device, confidentiality level determination program, and method
JP2005267057A (ja) テキストデータ抽出方法、検索用インデックス作成方法、電子ファイリングシステムおよびプログラム
JP7252818B2 (ja) デジタル文書からのデータ抽出システム
US11842141B2 (en) Device dependent rendering of PDF content
JP2002297638A (ja) 文書画像からのタイトル抽出方法