JPH11120185A - 情報処理装置及びその方法 - Google Patents

情報処理装置及びその方法

Info

Publication number
JPH11120185A
JPH11120185A JP9277040A JP27704097A JPH11120185A JP H11120185 A JPH11120185 A JP H11120185A JP 9277040 A JP9277040 A JP 9277040A JP 27704097 A JP27704097 A JP 27704097A JP H11120185 A JPH11120185 A JP H11120185A
Authority
JP
Japan
Prior art keywords
result
character recognition
analysis
language
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP9277040A
Other languages
English (en)
Inventor
Makoto Takaoka
真琴 高岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP9277040A priority Critical patent/JPH11120185A/ja
Priority to US09/165,116 priority patent/US6539116B2/en
Publication of JPH11120185A publication Critical patent/JPH11120185A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Machine Translation (AREA)
  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 文書画像データをより効率的に利用し、かつ
管理することができる情報処理装置及びその方法を提供
する。 【解決手段】入力された文書画像データの構成を解析す
る。解析されたテキストブロック中の文字列を文字認識
する。その文字認識結果を言語解析する。その言語解析
結果として得られる単語の同義語、類似語を抽出する。
言語解析結果として得られる単語を他言語の単語に変換
する。解析されたテキストブロック中の文字列を他言語
に翻訳する。そして、少なくとも、文書画像データの構
成を解析した解析結果、文字認識結果、言語解析結果を
記憶し、また、抽出結果、変換結果、翻訳結果の内、少
なくとも1つを文字認識結果と対応づけてRAM3に記
憶する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力された文書画
像データを管理する情報処理装置及びその方法に関する
ものである。
【0002】
【従来の技術】従来、文書画像データの内容を再利用す
る場合、スキャナ等の画像入力手段で文書画像データを
読み込み、その読み込んだ文書画像データに対して文字
認識処理を行って得られるデータを用いて再利用を図っ
ていた。また、近年の文書画像データのレイアウトも多
様化してきており、文字認識処理をより効率的に実行す
るために、文字認識処理を実行する前にレイアウト認識
処理を実行し、その精度も重要視されるようになってき
た。
【0003】そこで、文書画像データをレイアウト認識
処理と文字認識処理が行われた後の結果の形式で、保存
しておけば文書画像データの内容まで取得することがで
きる。そして、保存された文書画像データから所望の文
書画像データを検索する場合に、その取得した内容を利
用することは、検索効率を向上するのに有効ことである
ため、文書画像データに対応させてレイアウト認識処理
結果と文字認識処理結果を保存する文書画像データ保存
形式が出始めてきている。
【0004】このような文書画像データ保存形式は、特
定アプリケーションのファイルフォーマットである場合
が多く、例えば、マイクロソフト社のRTF(Rich
Text Format)であったり、ジャストシステ
ム社の一太郎フォーマットであったり、最近では、イン
ターネットでよく用いられているHTML形式であった
りする。
【0005】しかしながら、特定アプリケーションのフ
ァイルフォーマットの場合、相互互換がともすればでき
なかったり、交換精度が低下したりする場合が多い。そ
こで、レイアウト解析処理と文字認識処理の処理結果よ
り得られる情報をできるだけ多く保存し、各種アプリケ
ーションに変換するのに精度が落ちないようにするため
の中間フォーマットが必要とされてきた。
【0006】そのような背景の元、どのようなアプリケ
ーションあるいはシステムでもコンバート(変換処理)
が可能な中間フォーマットが提唱されてきた。SGML
形式やPDF(Page Description Fo
rmat)形式がその一例である。また、このような中
間フォーマットを総称して、DAOF(Documen
t Analysis Output Format)と
呼ぶ。
【0007】また、文書画像データを保存したり、交換
する場合、文書画像データそのものをビットマップデー
タや圧縮した後に、保存、交換を行う。しかしながら、
このような保存形式だと、自然画のような画像データは
良いが、文書画像データの場合、検索することができな
い。そこで、文書画像データを圧縮して持っていてもよ
いが、それ以外に文書画像データを画像解析して、文字
コード、レイアウト記述、そして文書画像データ中の図
や絵等は画像化する記述、さらに表はその構造を解析
し、表計算ソフトに適用できる保存形式が必要になって
きた。
【0008】その解決手段として、従来のDAOFは文
書画像データを解析し、レイアウト記述、文字認識記
述、表構造記述、画像記述のデータ構成で文書画像デー
タを保存する。
【0009】ここで、従来のDAOFのデータ構造につ
いて、図11を用いて説明する。
【0010】図11は従来のDAOFのデータ構造を示
す図である。
【0011】図11において、401はHeaderで
あり、処理対象の文書画像データに関する情報が保持さ
れる。レイアウト記述データ部402では、文書画像デ
ータ中のTEXT(文字)、TITLE(タイトル)、
CAPTION(キャプション)、LINEART(線
画)、PICTURE(自然画)、FRAME(枠)、
TABLE(表)等の属性毎に認識された各ブロックの
属性情報とその矩形アドレス情報を保持する。文字認識
記述データ部403では、TEXT、TITLE、CA
PTION等のTEXTブロックを文字認識して得られ
る文字認識結果を保持する。表記述データ部404で
は、TABLEブロックの構造の詳細を格納する。画像
記述データ部405は、PICTUREやLINEAR
T等のブロックのイメージデータを文書画像データから
切り出して保持する。
【0012】このようなDAOFは、中間データとして
のみならず、それ自体がファイル化されて保存される場
合もある。これに伴い、この中間フォーマットが多数保
存されその整理や検索が重要視されてきた。また、文書
画像データのみを保存するのと違い、文字情報等で検索
が可能となり、このDAOFを利用した検索の要望が強
くなってきた。
【0013】
【発明が解決しようとする課題】しかしながら、上述し
た従来のDAOFは、レイアウト認識処理や文字認識処
理の処理結果は、文書画像データを忠実に再現するため
のもとして利用されているため、所望の文書画像データ
を検索したり、その文書画像データと関連性のある文書
画像データ群をグループ化させたりすることはできなか
った。また、このような処理を実現するために、DAO
Fで管理されるデータ間の論理的な関係により汎用性を
持たせることが必要とされている。
【0014】本発明は上記の問題点に鑑みてなされたも
のであり、文書画像データをより効率的に利用し、かつ
管理することができる情報処理装置及びその方法を提供
することを目的とする。
【0015】
【課題を解決するための手段】上記の目的を達成するた
めの本発明による情報処理装置は以下の構成を備える。
即ち、入力された文書画像データを管理する情報処理装
置であって、前記入力された文書画像データの構成を解
析する構成解析手段と、前記解析手段で解析されたテキ
ストブロック中の文字列を文字認識する文字認識手段
と、前記文字認識手段の文字認識結果を言語解析する言
語解析手段と、前記言語解析手段で言語解析結果として
得られる単語の同義語、類似語を抽出する抽出手段と、
前記言語解析結果として得られる単語を他言語の単語に
変換する変換手段と、前記構成解析手段で解析されたテ
キストブロック中の文字列を他言語に翻訳する翻訳手段
と少なくとも、前記構成解析手段の解析結果、前記文字
認識手段の文字認識結果、前記言語解析手段の言語解析
結果を記憶し、また、前記抽出手段の抽出結果、前記変
換手段の変換結果、前記翻訳手段の翻訳結果の内、少な
くとも1つを前記文字認識結果と対応づけて記憶する記
憶手段とを備える。
【0016】また、好ましくは、前記記憶手段は、前記
構成解析手段の解析結果、前記文字認識手段の認識結果
を論理的に記述したデータ構造で記憶する。
【0017】また、好ましくは、前記記憶手段は、前記
抽出手段の抽出結果である同義語、類似語を単語単位
で、かつ前記文字認識手段の文字認識結果とリンクさせ
て記憶することを特徴とする請求項1に記載の情報処理
装置。前記記憶手段は、前記変換手段の変換結果である
他言語の単語を、前記文字認識手段の文字認識結果とリ
ンクさせて記憶する。
【0018】また、好ましくは、前記記憶手段は、前記
翻訳手段の翻訳結果を、前記文字認識手段の文字認識結
果とリンクさせて記憶する。
【0019】上記の目的を達成するための本発明による
情報処理方法は以下の構成を備える。即ち、入力された
文書画像データを管理する情報処理方法であって、前記
入力された文書画像データの構成を解析する構成解析工
程と、前記解析工程で解析されたテキストブロック中の
文字列を文字認識する文字認識工程と、前記文字認識工
程の文字認識結果を言語解析する言語解析工程と、前記
言語解析工程で言語解析結果として得られる単語の同義
語、類似語を抽出する抽出工程と、前記言語解析結果と
して得られる単語を他言語の単語に変換する変換工程
と、前記構成解析工程で解析されたテキストブロック中
の文字列を他言語に翻訳する翻訳工程と少なくとも、前
記構成解析工程の解析結果、前記文字認識工程の文字認
識結果、前記言語解析工程の言語解析結果を記憶し、ま
た、前記抽出工程の抽出結果、前記変換工程の変換結
果、前記翻訳工程の翻訳結果の内、少なくとも1つを前
記文字認識結果と対応づけて記憶媒体に記憶する記憶工
程とを備える。
【0020】上記の目的を達成するための本発明による
コンピュータ可読メモリは以下の構成を備える。即ち、
入力された文書画像データを管理する情報処理のプログ
ラムコードが格納されたコンピュータ可読メモリであっ
て、前記入力された文書画像データの構成を解析する構
成解析工程のプログラムコードと、前記解析工程で解析
されたテキストブロック中の文字列を文字認識する文字
認識工程と、前記文字認識工程の文字認識結果を言語解
析する言語解析工程のプログラムコードと、前記言語解
析工程で言語解析結果として得られる単語の同義語、類
似語を抽出する抽出工程のプログラムコードと、前記言
語解析結果として得られる単語を他言語の単語に変換す
る変換工程と、前記構成解析工程で解析されたテキスト
ブロック中の文字列を他言語に翻訳する翻訳工程のプロ
グラムコードと少なくとも、前記構成解析工程の解析結
果、前記文字認識工程の文字認識結果、前記言語解析工
程の言語解析結果を記憶し、また、前記抽出工程の抽出
結果、前記変換工程の変換結果、前記翻訳工程の翻訳結
果の内、少なくとも1つを前記文字認識結果と対応づけ
て記憶媒体に記憶する記憶工程のプログラムコードとを
備える。
【0021】
【発明の実施の形態】以下、図面を参照して本発明の好
適な実施形態を詳細に説明する。
【0022】図1は本発明の実施形態の情報処理装置の
構成を示すブロック図である。
【0023】図1において、CPU1はメインバス7を
介して情報処理装置10全体の制御を実行するととも
に、情報処理装置10の外部に接続される入力装置11
(例えば、イメージスキャナ、記憶装置、ネットワーク
回線を介して接続される他の情報処理装置、電話回線を
介して接続されるファクシミリ等)を入力I/F(印あ
フェース)4を介して制御する。また、情報処理装置1
0の外部に接続される出力装置12(例えば、プリン
タ、モニタ、ネットワーク回線を介して接続される他の
情報処理装置、電話回線を介して接続されるファクシミ
リ等)5を介して制御する。また、CPU1は、KBD
I/F(キーボードインタフェース)6を介して入力部
(例えば、キーボード23やポインティングデバイス2
4やペン25)から入力された指示に従って、画像の入
力、画像処理、色変換処理、画像の出力制御等の一連の
処理を実行する。更に、入力装置11より入力された画
像データや、キーボード3やポインティングデバイス2
4やペン25を用いて作成された画像データを表示する
表示部30をビデオI/F(インタフェース)28を介
して制御する。
【0024】ROM2は、CPU1の各種制御を実行す
る各種制御プログラムを記憶している。RAM3は、C
PU1によりOSや本発明を実現するための制御プログ
ラムを含むその他の制御プログラムがロードされ実行さ
れる。また、制御プログラムを実行するために用いられ
る各種作業領域、一時待避領域として機能する。また、
入力装置11より入力された画像データや、キーボード
23やポインティングデバイス24やペン25を用いて
作成された画像データを、一旦、保持するVRAM(不
図示)が構成されている。
【0025】次に、本実施形態で実行される処理の概要
について、図2を用いて説明する。図2は本発明の実施
形態で実行される処理の概要を示すフローチャートであ
る。
【0026】まず、文書画像データを取り込み、取り込
んだ文書画像データに対し、レイアウト認識(詳細は後
述)を行い、TEXT(文字)、TITLE(タイト
ル)、CAPTION(キャプション)、LINEAR
T(線画)、PICTURE(自然画)、FRAME
(枠)、TABLE(表)等の属性毎に各ブロックを解
析する(ステップS202)。次に、文字認識(詳細は
後述)を行う(ステップS2039。これは、レイアウ
ト認識で認識されたTEXTブロックに対して行い、1
文字ごとに文字認識処理を行う。認識結果は、第一候
補、第二候補のように、いくつかの認識結果を保持す
る。次に、文字認識結果の第1候補を用いて、文字認識
結果として得られた文字列に対応する単語を確定する自
然言語処理を行う(ステップS204)。この言語処理
では、候補文字列の前後関係より、文字がおかしい場合
候補文字から、合う文字を抜きだして、第一候補と入れ
替えたり、あるいはまったく候補に入っていなく、新規
に文字を当てはめる場合もある。この処理結果は、文字
認識結果として保持されている候補文字列を訂正するこ
とで、反映される。
【0027】次に、言語処理結果で得られた単語ごとに
同義語、あるいは類義語を抽出する同義語処理を行う
(ステップS205)。抽出された同義語は、言語処理
結果である本来の文字列より、多くなったり少なくなっ
たりするが、これは、新規にデータ構造を作成し、文字
認識結果として保持されている文字列とリンクが張れる
ようにすればよい。言語処理結果で得られた単語列を、
機械翻訳により、他言語単語を抽出する単語翻訳処理を
行う(ステップS206)。次に、文字認識処理結果の
第一候補を機械翻訳するTEXT Block翻訳処理
を行う(ステップS207)。このTEXT Bloc
k翻訳処理では、文字認識結果が正しくないと、翻訳結
果に誤訳が多くなるが、言語処理結果に対し再翻訳を行
ったり、入力部を介してユーザが誤訳の訂正を行うこと
で誤訳を削減することができる。尚、機械翻訳では、前
後の文脈より適切な翻訳結果を作成するため、この処理
では、一文字ごとの結果ではな<、一連の文書となる文
字列に対し翻訳処理を行う。この翻訳結果は可変長のた
め、同義語処理と同様、新規にデータ構造を作成し、文
字認識結果である文字列とリンクを張っておく。
【0028】次に、上述した処理の具体例について、図
3を用いて説明する。
【0029】図3は本発明の実施形態で実行される処理
の具体例を説明するための図である。
【0030】例えば、「評価辞書」という文字列が文書
画像データ中にあるとする。この文字列の内、”価”の
文字の文字認識結果が”イ”、”西”の2文字であると
する。この文字認識結果に対し、言語処理を行うと、”
価”の文字として認識される。これにより、文字認識結
果の文字数は、2文字の文字認識結果が結合されて保持
される。また、”評価”、”辞書”それぞれの単語に対
し同義語処理を行うと、例えば、”検査”、”辞典”と
いう同義語が抽出される。この処理は、ROM2等に同
義語対比テーブル(不図示)を記憶しておき、これを参
照することで行う。また、”評価”、”辞書”それぞれ
の単語に対し単語翻訳処理を行うと、例えば、”eva
luate”、”dictionary”という翻訳単
語が抽出される。この処理も、ROM2等に単語翻訳テ
ーブル(不図示)を記憶しておき、これを参照すること
で実現される。ここでは、英語に翻訳する例を示した
が、中国語、韓国語等の他国言語で翻訳することも可能
である。また、”評価辞書”に対しTEXT Bloc
k処理を行うと、例えば、”evaluationdi
ctionary”というように翻訳される。以上の例
は、簡単な熟語のため、それ程変化はないが、一連の文
章として存在するTEXT Blockの場合、前後関
係から適切な翻訳を行うことになる。
【0031】次に、本実施形態による処理例について、
図4を用いて説明する。
【0032】図4は本発明の実施形態の処理例を示す図
である。
【0033】例えば、文書画像データ101に対し、レ
イアウト認識及び文字認識を行うと、その結果である文
書解析結果画像102が作成される。文書解析結果画像
102では、レイアウト認識によって認識される認識枠
が示されている。次に、同義語処理を行うと、その結果
である同義語置き換え文書解析結果画像103が作成さ
れる。この同義語文書解析結果画像103は、文字認識
結果に対し言語処理を行い、単語ごとの同義語を抽出
し、その同義語を文字認識結果中の対応する単語と置き
換えたものである。
【0034】次に、単語翻訳処理を行うと、その結果で
ある他言語学語置き換え文書解析結果画像104が作成
される。この他言語単語置き換え文書解析結果画像10
4は、言語処理結果に対し単語ごとの翻訳を行い、その
翻訳された他国語言語を文字認識結果中の対応する単語
と置き換えたものである。次に、TEXT Block
翻訳処理を行うと、その結果である他言語翻訳置き換え
文書解析結果画像105が作成される。この他言語翻訳
置き換え文書解析結果画像105は、レイアウト認識で
認識されたTEXTブロックに対し、その認識順番に従
ってTEXTブロック中の文字列の機械翻訳を行い、そ
の翻訳結果を対応するTEXTブロックと置き換えたも
のである。
【0035】このように、本実施形態によれば、文書画
像データから認識した各ブロックに対応する上述しの処
理を行い、各処理結果にリンクを張っておく。これによ
り、文書画像データのレイアウトを損なわずに、各処理
結果を管理することができる。
【0036】次に、本実施形態で実行される処理によっ
て得られる各処理結果を保持するデータ構造例につい
て、図5を用いて説明する。
【0037】図5は本発明の実施形態で実行される処理
によって得られる各処理結果を保持するデータ構造例を
示す図である。
【0038】図5において、401はHeaderであ
り、処理対象の文書画像データに関する情報が保持され
る。402はレイアウト記述データ部であり、レイアウ
ト認識処理の処理結果を保持する。403は文字認識記
述データ部であり、文字認識処理の処理結果を保持す
る。404は表記述データ部であり、レイアウト認識処
理で認識されたTABLEブロックに関するデータを保
持する。405は画像記述部であり、レイアウト認識処
理で認識されたPICTUREブロック等の画像ブロッ
クに関するデータを保持する。406は同義語記述デー
タ部であり、同義語処理の処理結果を保持する。407
は他言語単語記述データ部であり、単語翻訳処理の処理
結果を保持する。408は他言語翻訳記述データ部であ
り、TEXT Block処理の処理結果を保持する。
【0039】尚、同義語記述データ部406、他言語単
語記述データ部407、他言語翻訳記述データ部408
それぞれが独立して存在するのは、処理内容によって、
保持する文字列等のデータが変化したり、それぞれ特徴
のあるデータ情報を必要とするからである。例えば、文
字認識記述データ部403は、一文字単位でデータを保
持するが、同義語記述データ部406、他言語単語記述
データ部407は、単語単位でデータを保持する。ま
た、他言語翻訳記述データ部408、翻訳対象となった
TEXTブロックに関する情報が必要となる。
【0040】次に、図5のデータ構造例の詳細につい
て、図6を用いて説明する。
【0041】図6は本発明の実施形態の図5のデータ構
造例の詳細を示す図である。
【0042】図6において、レイアウト記述データ部4
02では、レイアウト認識されたそれぞれのブロックの
矩形アドレスとその属性(attribute)を保持
する。その他各種情報は省略する。文字認識記述データ
部403では、BlockDescriptorで対象
とするTEXTブロックの詳細情報を保持する。また、
Line Descriptorでは、TEXTブロッ
クの1行ごとの情報を保持する。これらは主に、文字認
識処理で実行される文字切り出し処理から得られる情報
から生成される。Element Descripto
rでは、文字認識処理の処理結果が記述され、第1候補
から第n候補まで記述される。通常は、第8候補程度迄
を保持する。
【0043】表記述データ部404では、レイアウト認
識処理でTEBLEブロックと認識された矩形情報の他
に、属性として、TABLE、REGION、CEL
L、ELEMENTを設けている。TABLEは表全体
を示す領域、REGIONは罫線枠で囲まれた最大枠を
示す領域、CELLは表の意味のある最小単位の枠、E
LEMENTは1行単位の文字列領域の枠を示す。
【0044】画像記述データ部405では、レイアウト
認識処理で認識されたPICTURE等の画像ブロック
の矩形情報を示す情報、画像のタイプを示す情報、解像
度を示す情報を保持する。同義語記述データ部406、
他言語単語記述データ部407は、文字認識記述データ
部403と同様なBlock Descriptor、
Line Descriptorを有し、また、Wor
d Descriotorを保持する。ここに、同義語
が格納されたり、他言語単語を格納する。他言語翻訳記
述データ部408は、Block Descripto
r、LineDescriptorを有し、Line
Descriptorに翻訳情報を保持する。
【0045】次に、本実施形態で実行される処理の詳細
について、図7を用いて説明する。図7は本発明の実施
形態で実行される処理の詳細を示すフローチャートであ
る。
【0046】まず、ステップS602で、レイアウト認
識処理を行う。詳しくは、文書画像データの黒画素を検
出してゆき、輪郭線追跡、またはラベリング方式によ
り、黒画素ブロックの矩形枠を作成する。次に、その矩
形枠のなかの黒画素密度、隣接矩形枠の有無、矩形枠の
縦横比率などを判断基準にして、TABLEブロック、
PICTUREブロック等の画像ブロック、TEXTブ
ロック等の属性毎にブロックを認識する。このレイアウ
ト認識処理によって認識された各属性のブロック毎に対
応する処理を行う。
【0047】TEXTブロックが認識された場合(ステ
ップS603)、ステップS604で、文字認識処理を
行う。
【0048】ステップS604で行う文字認識処理の一
つの方法として、特徴ベクトル抽出比較方式がある。例
えば、”本”という文字が文書画像データ中にあったと
する。これに対し、第一段階として、文字切り出し処理
を行なう。これは一つの文字の矩形を切り出す処理で、
黒画素連続性の状態を検出していけば求められる。第二
段階として、一文字をm×nのブロックに切り出す。例
えば、64×64にする。そして、そのブロックの中か
ら2×2のウインドウを用いて、黒画素の分布方向を抽
出する(方向ベクトル情報)。この2×2のウインドウ
をずらしてゆき、方向ベクトル情報を数十個得る。この
ベクトル情報が切り出した文字の特徴となる。この特徴
ベクトルとあらかじめ用意してある文字認識辞書とを比
較して、特徴ベクトルに一番近い文字から順番に文字を
抽出する。一番近い文字が第一候補となり、続いて第
二、第三候補となる。この特徴ベクトルの近さが、その
文字に対する距離の近さ、これが類似度という数値とな
る。そして、類似度が近ければ、より精度の高い文字と
いうことになる。
【0049】また、上述したレイアウト認識処理で、T
ABLEブロックが認識された場合(ステップS60
5)、ステップS606で、表解析を行う。
【0050】また、上述したレイアウト認識処理で、P
ICTUREブロック等の画像ブロックが認識された場
合(ステップS607)、ステップS608で、画像切
り出しを行う。次に、ステップS609で、切り出した
画像を圧縮するか否かを判定する。圧縮する場合(ステ
ップS609でYES)、ステップS610に進み、そ
の切り出した画像を圧縮する。一方、圧縮しない場合
(ステップS609でNO)、ステップS612に進
む。
【0051】また、上述したレイアウト認識処理で、上
記のTEXTブロック、TABLEブロック、画像ブロ
ック以外のブロックが認識された場合(ステップS61
1)、そのブロックをそのまま保持する。
【0052】ステップS612で、レイアウト認識処理
によって認識された各属性のブロック毎に対し施された
処理によって得られたデータを基に、DAOFを作成す
る。尚、この時点で作成されるDAOFは図11に示し
た従来のDAOFと同様の構成を有する。
【0053】ステップS613で、TEXTブロックに
対し言語処理を行う。ステップS614で、同義語処理
を行うか否かを判定する。同義語処理を行う場合(ステ
ップS614でYES)、ステップS615に進み、同
義語処理を行う。一方、同義語処理を行わない場合(ス
テップS614でNO)、ステップS616に進む。ス
テップS616で、他言語単語処理を行うか否かを判定
する。他言語単語処理を行う場合(ステップS616で
YES)、ステップS617に進み、他言語単語処理を
行う。一方、他言語単語処理を行わない場合(ステップ
S616でNO)、ステップS618に進む。ステップ
S618で、他言語翻訳処理を行うか否かを判定する。
他言語翻訳処理を行う場合(ステップS618でYE
S)、ステップS619に進み、他言語翻訳処理を行
う。一方、他言語翻訳処理を行わない場合(ステップS
618でNO)、ステップS620に進む。
【0054】ステップS620で、ステップS614〜
ステップS619の処理によって得られるデータを、ス
テップS612で作成したDAOFにデータを追加し、
拡張DAOFを作成する。以上説明した処理によって、
例えば、図6に示したようなデータ構造を有するDAO
Fを作成することができる。
【0055】次に、本発明の応用例を説明する。
【0056】図8は本発明の応用例を説明するための情
報処理システムの構成例を示す図である。
【0057】図8に示す情報処理システム例では、コン
ピュータ10にスキャナ701、複写機702の画像入
力手段が接続され、それらの画像入力手段から入力され
た文書画像データをハードディスク等の記憶媒体704
に保存することができる。
【0058】この情報処理システムによって、記憶媒体
704に上述した処理によって得られた複数のDAOF
とそれに対応する文書画像データが格納され、格納され
ているDAOFを利用して所望の文書画像データを検索
する場合について、図8を用いて説明する。
【0059】図9は本発明の図8の情報処理システムの
記憶媒体に格納された文書画像データから所望の文書画
像データを検索する手順を説明するための図である。
【0060】ここでは、記憶媒体704には、数百、数
千の文書画像データとそれに対応するDAOFが格納さ
れているとする。そして、これらの文書画像データから
所望の文書画像データを検索する場合には、コンピュー
タ10の表示部30に表示されるGUI(グラフィック
ユーザインタフェース)803を用いて検索を行う。ま
ず、検索キーワードの項目に検索条件である文字列を入
力する。検索方法としては、DAOFの文字認識記述デ
ータ部403の内容を参照して、例えば、曖昧検索を用
いて、第一候補、第二候補のように、候補文字も含めた
検索を行う。また、文字認識の誤認識の精度を考慮し
て、単語の間抜けもカバーするような検索を行う(80
4)。
【0061】また、この検索に加えて、検索条件の文字
列の照合を同義語記述データ部406の内容も加味して
検索を行っても良い(805)。これは、検索条件であ
る文字列の類義語、同義語を有する文書画像データも検
索するためである。
【0062】更に、この検索に加えて、他言語単語記述
データ部407の内容も加味して検索を行っても良い
(806)。これによって、他言語の文字列を検索条件
として入力しても所望の文書画像データを検索すること
ができる。
【0063】以上の検索によって、GUI803内に検
索条件に該当する文書画像データ807が検索結果とし
て表示される。尚、上述したDAOFの内容を参照した
検索方法は、上述したものに限らず、例えば、他言語翻
訳記述データ部408の内容を加味した検索等、ユーザ
の好みに応じて様々な検索方法で検索することが可能で
ある。
【0064】また、GUI803が表示する検索結果を
表示する表示形態は、図9に示したものに限定されず、
図10に示すような表示形態であっても良い。
【0065】図10に示すGUI901では、検索結果
である文書画像データ902以外に、他言語翻訳記述デ
ータ部408の内容を参照して作成した文書画像データ
902内のTEXTブロックが翻訳されている文書画像
データ903を表示する。このように、元の文書画像デ
ータ902と他言語翻訳記述データ部408の内容を反
映させた文書画像データを対比させて表示するため、他
言語での判読が可能となる。
【0066】尚、図10では、文書画像データ902
と、そのTEXTブロックの他言語翻訳を含む文書画像
データ903を表示するようにしたが、文書画像データ
902内のTEXTブロックに対しクリックした場合
に、その他言語翻訳を表示すような構成にしてもよい。
【0067】また、これ以外にも、DAOFを利用した
検索結果の表示が可能であることは言うまでもない。
【0068】また、応用例では、文書画像データを検索
する例を示したが、本実施形態のDAOFは、文書画像
データの補助データとして活用することもできる。例え
ば、他言語の文書画像データや他言語が混在する文書画
像データ内の文字列の上、あるいは下にルビをふる形式
で、同義語、他言語単語、他言語翻訳を挿入して表示す
ることで、より判読が容易な文書画像データを作成する
ことができる。
【0069】以上説明したように、本実施形態によれ
ば、文書画像データに対し図6に示したDAOFを保持
する。これにより、文書画像データから所望の文書画像
データを検索する場合、検索条件である文字列が文字認
識記述データ部403に保持されてなくても、同義語記
述データ部406に保持されていれば、それに基づいて
検索するが可能になり、検索率を向上することができ
る。
【0070】また、日本語以外の言語、例えば、英語を
検索条件とした文書画像データの検索が可能となる。こ
れは、例えば、日本語の特許文書画像データを検索する
場合にも、アメリカ人が日本の特許を調査するのに、英
語の検索条件で、所望の特許文書画像データを検索する
ことが可能となる。また、英語以外、中国語、韓国語な
どでもこれと同等の使用方法ができる。
【0071】また、文書画像データを再利用する場合
に、同様のレイアウトで、他言語に翻訳された文書画像
データも再現することができる。あるいは、ワープロソ
フトと連携の操作になるが、文書画像データ中の所望の
TEXTブロックをクリックすることにより、その部分
だけ他言語の翻訳表示に切り替えることも可能である。
これにより、翻訳文書との対比読みができ、他言語が混
在する文書画像データを読みやすくすることができる。
【0072】まとめると、本実施形態によれば、(1)
曖昧検索、同義語検索、他言語検索が可能となる。
(2)他言語翻訳結果が、即座に読むことができる。
(3)他言語、あるいは他言語が混在するような文書画
像データの判読補助手段を提供することができる。
【0073】尚、本発明は、複数の機器(例えばホスト
コンピュータ、インタフェース機器、リーダ、プリンタ
など)から構成されるシステムに適用してもよい。
【0074】また、本発明の目的は、前述した実施形態
の機能を実現するソフトウェアのプログラムコードを記
録した記憶媒体を、システムあるいは装置に供給し、そ
のシステムあるいは装置のコンピュータ(またはCPU
やMPU)が記憶媒体に格納されたプログラムコードを
読出し実行することによっても、達成されることは言う
までもない。
【0075】この場合、記憶媒体から読出されたプログ
ラムコード自体が前述した実施形態の機能を実現するこ
とになり、そのプログラムコードを記憶した記憶媒体は
本発明を構成することになる。
【0076】プログラムコードを供給するための記憶媒
体としては、例えば、フロッピディスク、ハードディス
ク、光ディスク、光磁気ディスク、CD−ROM、CD
−R、磁気テープ、不揮発性のメモリカード、ROMな
どを用いることができる。
【0077】また、コンピュータが読出したプログラム
コードを実行することにより、前述した実施形態の機能
が実現されるだけでなく、そのプログラムコードの指示
に基づき、コンピュータ上で稼働しているOS(オペレ
ーティングシステム)などが実際の処理の一部または全
部を行い、その処理によって前述した実施形態の機能が
実現される場合も含まれることは言うまでもない。
【0078】更に、記憶媒体から読出されたプログラム
コードが、コンピュータに挿入された機能拡張ボードや
コンピュータに接続された機能拡張ユニットに備わるメ
モリに書込まれた後、そのプログラムコードの指示に基
づき、その機能拡張ボードや機能拡張ユニットに備わる
CPUなどが実際の処理の一部または全部を行い、その
処理によって前述した実施形態の機能が実現される場合
も含まれることは言うまでもない。
【0079】
【発明の効果】以上説明したように、本発明によれば、
文書画像データをより効率的に利用し、かつ管理するこ
とができる情報処理装置及びその方法を提供できる。
【0080】
【図面の簡単な説明】
【図1】本発明の実施形態の情報処理装置の構成を示す
ブロック図である。
【図2】本発明の実施形態で実行される処理の概要を示
すフローチャートである。
【図3】本発明の実施形態で実行される処理の具体例を
説明するための図である。
【図4】本発明の実施形態の処理例を示す図である。
【図5】本発明の実施形態で実行される処理によって得
られる各処理結果を保持するデータ構造例を示す図であ
る。
【図6】本発明の実施形態の図5のデータ構造例の詳細
を示す図である。
【図7】本発明の実施形態で実行される処理の詳細を示
すフローチャートである。
【図8】本発明の応用例を説明するための情報処理シス
テムの構成例を示す図である。
【図9】本発明の図8の情報処理システムの記憶媒体に
格納された文書画像データから所望の文書画像データを
検索する手順を説明するための図である。
【図10】本発明の実施形態の検索による検索結果の表
示例を示す図である。
【図11】従来のDAOFのデータ構造を示す図であ
る。
【符号の説明】 1 CPU 2 ROM 3 RAM 4 入力I/F 5 出力I/F 6 KBD I/F 7 メインバス 10 コンピュータ 11 入力装置 12 出力装置 23 ポインティングデバイス 24 キーボード 25 ペン 28 ビデオI/F 30 表示部
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 FI G06F 15/62 325Z

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】 入力された文書画像データを管理する情
    報処理装置であって、 前記入力された文書画像データの構成を解析する構成解
    析手段と、 前記解析手段で解析されたテキストブロック中の文字列
    を文字認識する文字認識手段と、 前記文字認識手段の文字認識結果を言語解析する言語解
    析手段と、 前記言語解析手段で言語解析結果として得られる単語の
    同義語、類似語を抽出する抽出手段と、 前記言語解析結果として得られる単語を他言語の単語に
    変換する変換手段と、 前記構成解析手段で解析されたテキストブロック中の文
    字列を他言語に翻訳する翻訳手段と少なくとも、前記構
    成解析手段の解析結果、前記文字認識手段の文字認識結
    果、前記言語解析手段の言語解析結果を記憶し、また、
    前記抽出手段の抽出結果、前記変換手段の変換結果、前
    記翻訳手段の翻訳結果の内、少なくとも1つを前記文字
    認識結果と対応づけて記憶する記憶手段とを備えること
    を特徴とする情報処理装置。
  2. 【請求項2】 前記記憶手段は、前記構成解析手段の解
    析結果、前記文字認識手段の認識結果を論理的に記述し
    たデータ構造で記憶することを特徴とする請求項1に記
    載の情報処理装置。
  3. 【請求項3】 前記記憶手段は、前記抽出手段の抽出結
    果である同義語、類似語を単語単位で、かつ前記文字認
    識手段の文字認識結果とリンクさせて記憶することを特
    徴とする請求項1に記載の情報処理装置。
  4. 【請求項4】 前記記憶手段は、前記変換手段の変換結
    果である他言語の単語を、前記文字認識手段の文字認識
    結果とリンクさせて記憶することを特徴とする請求項1
    に記載の情報処理装置。
  5. 【請求項5】 前記記憶手段は、前記翻訳手段の翻訳結
    果を、前記文字認識手段の文字認識結果とリンクさせて
    記憶することを特徴とする請求項1に記載の情報処理装
    置。
  6. 【請求項6】 入力された文書画像データを管理する情
    報処理方法であって、 前記入力された文書画像データの構成を解析する構成解
    析工程と、 前記解析工程で解析されたテキストブロック中の文字列
    を文字認識する文字認識工程と、 前記文字認識工程の文字認識結果を言語解析する言語解
    析工程と、 前記言語解析工程で言語解析結果として得られる単語の
    同義語、類似語を抽出する抽出工程と、 前記言語解析結果として得られる単語を他言語の単語に
    変換する変換工程と、 前記構成解析工程で解析されたテキストブロック中の文
    字列を他言語に翻訳する翻訳工程と少なくとも、前記構
    成解析工程の解析結果、前記文字認識工程の文字認識結
    果、前記言語解析工程の言語解析結果を記憶し、また、
    前記抽出工程の抽出結果、前記変換工程の変換結果、前
    記翻訳工程の翻訳結果の内、少なくとも1つを前記文字
    認識結果と対応づけて記憶媒体に記憶する記憶工程とを
    備えることを特徴とする情報処理方法。
  7. 【請求項7】 前記記憶工程は、前記構成解析工程の解
    析結果、前記文字認識工程の認識結果を論理的に記述し
    たデータ構造で前記記憶媒体に記憶することを特徴とす
    る請求項6に記載の情報処理方法。
  8. 【請求項8】 前記記憶工程は、前記抽出工程の抽出結
    果である同義語、類似語を単語単位で、かつ前記文字認
    識工程の文字認識結果とリンクさせて前記記憶媒体に記
    憶することを特徴とする請求項6に記載の情報処理方
    法。
  9. 【請求項9】 前記記憶工程は、前記変換工程の変換結
    果である他言語の単語を、前記文字認識工程の文字認識
    結果とリンクさせて前記記憶媒体に記憶することを特徴
    とする請求項6に記載の情報処理方法。
  10. 【請求項10】 前記記憶工程は、前記翻訳工程の翻訳
    結果を、前記文字認識工程の文字認識結果とリンクさせ
    て前記記憶媒体に記憶することを特徴とする請求項6に
    記載の情報処理方法。
  11. 【請求項11】 入力された文書画像データを管理する
    情報処理のプログラムコードが格納されたコンピュータ
    可読メモリであって、 前記入力された文書画像データの構成を解析する構成解
    析工程のプログラムコードと、 前記解析工程で解析されたテキストブロック中の文字列
    を文字認識する文字認識工程と、 前記文字認識工程の文字認識結果を言語解析する言語解
    析工程のプログラムコードと、 前記言語解析工程で言語解析結果として得られる単語の
    同義語、類似語を抽出する抽出工程のプログラムコード
    と、 前記言語解析結果として得られる単語を他言語の単語に
    変換する変換工程と、前記構成解析工程で解析されたテ
    キストブロック中の文字列を他言語に翻訳する翻訳工程
    のプログラムコードと少なくとも、前記構成解析工程の
    解析結果、前記文字認識工程の文字認識結果、前記言語
    解析工程の言語解析結果を記憶し、また、前記抽出工程
    の抽出結果、前記変換工程の変換結果、前記翻訳工程の
    翻訳結果の内、少なくとも1つを前記文字認識結果と対
    応づけて記憶媒体に記憶する記憶工程のプログラムコー
    ドとを備えることを特徴とするコンピュータ可読メモ
    リ。
JP9277040A 1997-10-09 1997-10-09 情報処理装置及びその方法 Withdrawn JPH11120185A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP9277040A JPH11120185A (ja) 1997-10-09 1997-10-09 情報処理装置及びその方法
US09/165,116 US6539116B2 (en) 1997-10-09 1998-10-02 Information processing apparatus and method, and computer readable memory therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9277040A JPH11120185A (ja) 1997-10-09 1997-10-09 情報処理装置及びその方法

Publications (1)

Publication Number Publication Date
JPH11120185A true JPH11120185A (ja) 1999-04-30

Family

ID=17577951

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9277040A Withdrawn JPH11120185A (ja) 1997-10-09 1997-10-09 情報処理装置及びその方法

Country Status (2)

Country Link
US (1) US6539116B2 (ja)
JP (1) JPH11120185A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001351089A (ja) * 2000-06-09 2001-12-21 Canon Inc 画像管理装置および画像管理方法
JP2010218098A (ja) * 2009-03-16 2010-09-30 Ricoh Co Ltd 情報処理装置、情報処理方法、制御プログラム及び記録媒体
JP2015111807A (ja) * 2013-11-08 2015-06-18 株式会社リコー 画像処理システム、画像処理方法及びプログラム
JP2015204015A (ja) * 2014-04-15 2015-11-16 コニカミノルタ株式会社 電子文書生成システム、画像形成装置、通信端末およびプログラム
JP2016535335A (ja) * 2013-11-08 2016-11-10 グーグル インコーポレイテッド 画像内に描かれたテキストの翻訳の提示
US10198439B2 (en) 2013-11-08 2019-02-05 Google Llc Presenting translations of text depicted in images

Families Citing this family (65)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001249922A (ja) * 1999-12-28 2001-09-14 Matsushita Electric Ind Co Ltd 単語分割方式及び装置
US7437669B1 (en) * 2000-05-23 2008-10-14 International Business Machines Corporation Method and system for dynamic creation of mixed language hypertext markup language content through machine translation
JP5033277B2 (ja) * 2000-09-12 2012-09-26 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置および画像処理方法並びにコンピュータ読み取り可能な記録媒体
JP4599693B2 (ja) * 2000-09-12 2010-12-15 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置および画像処理方法並びにコンピュータ読み取り可能な記録媒体
US6738535B2 (en) * 2001-01-31 2004-05-18 International Business Machines Corporation Head-mounted display content transformer
JP4576770B2 (ja) * 2001-08-03 2010-11-10 セイコーエプソン株式会社 画像ファイルの生成
US8438004B2 (en) * 2001-10-03 2013-05-07 Hewlett-Packard Development Company L.P. System and methods for language translation printing
CN100520697C (zh) * 2001-10-05 2009-07-29 松下电器产业株式会社 打印数据产生装置以及打印数据产生方法
US6714203B1 (en) * 2002-03-19 2004-03-30 Aechelon Technology, Inc. Data aware clustered architecture for an image generator
US20030200078A1 (en) * 2002-04-19 2003-10-23 Huitao Luo System and method for language translation of character strings occurring in captured image data
US20040179228A1 (en) * 2003-03-10 2004-09-16 Mccluskey Mark Indication of image content modification
US20040210444A1 (en) * 2003-04-17 2004-10-21 International Business Machines Corporation System and method for translating languages using portable display device
US20050069859A1 (en) * 2003-09-30 2005-03-31 Cherry Gaye C. Patient communication apparatus and method
US20050111651A1 (en) * 2003-11-21 2005-05-26 Armando Chavez Script translation
JP2006251902A (ja) * 2005-03-08 2006-09-21 Fuji Xerox Co Ltd 翻訳文書画像生成装置、翻訳文書画像生成プログラム及び翻訳文書画像生成方法
JP4428266B2 (ja) * 2005-03-22 2010-03-10 富士ゼロックス株式会社 翻訳装置およびプログラム
US7865353B2 (en) * 2005-03-22 2011-01-04 Fuji Xerox Co., Ltd. Translation device, image processing device, translation method, and recording medium
JP2006268372A (ja) * 2005-03-23 2006-10-05 Fuji Xerox Co Ltd 翻訳装置、画像処理装置、画像形成装置、翻訳方法及びプログラム
EP1943643B1 (en) * 2005-11-04 2019-10-09 Nokia Technologies Oy Audio compression
JP4890880B2 (ja) * 2006-02-16 2012-03-07 キヤノン株式会社 画像送信装置,画像送信方法,プログラム,および記憶媒体
JP2007316849A (ja) * 2006-05-24 2007-12-06 Canon Inc 情報処理装置、情報処理システム、及びその制御方法、プログラム、記憶媒体
US7986843B2 (en) 2006-11-29 2011-07-26 Google Inc. Digital image archiving and retrieval in a mobile device system
US20080162603A1 (en) * 2006-12-28 2008-07-03 Google Inc. Document archiving system
US20080162602A1 (en) * 2006-12-28 2008-07-03 Google Inc. Document archiving system
KR101358224B1 (ko) * 2007-06-19 2014-02-05 엘지전자 주식회사 다중언어를 지원하는 단말장치 및 방법
JP2009053932A (ja) * 2007-08-27 2009-03-12 Fuji Xerox Co Ltd 文書画像処理装置、及び文書画像処理プログラム
US8290272B2 (en) * 2007-09-14 2012-10-16 Abbyy Software Ltd. Creating a document template for capturing data from a document image and capturing data from a document image
US9754022B2 (en) * 2007-10-30 2017-09-05 At&T Intellectual Property I, L.P. System and method for language sensitive contextual searching
US8229225B2 (en) * 2008-05-06 2012-07-24 Wu Yingchao Candidate selection method for handwriting input
JP4875024B2 (ja) * 2008-05-09 2012-02-15 株式会社東芝 画像情報伝送装置
JP2010055235A (ja) * 2008-08-27 2010-03-11 Fujitsu Ltd 翻訳支援プログラム、及び該システム
JP4711093B2 (ja) * 2008-08-28 2011-06-29 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP4623169B2 (ja) * 2008-08-28 2011-02-02 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
US8527522B2 (en) * 2008-09-05 2013-09-03 Ramp Holdings, Inc. Confidence links between name entities in disparate documents
US8547589B2 (en) 2008-09-08 2013-10-01 Abbyy Software Ltd. Data capture from multi-page documents
US9390321B2 (en) 2008-09-08 2016-07-12 Abbyy Development Llc Flexible structure descriptions for multi-page documents
USH2272H1 (en) 2008-09-17 2012-11-06 The United States Of America As Represented By The Secretary Of The Navy Code framework for generic data extraction, analysis and reduction
JP4930564B2 (ja) * 2009-09-24 2012-05-16 カシオ計算機株式会社 画像表示装置及び方法並びにプログラム
JP5538812B2 (ja) * 2009-10-23 2014-07-02 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
US8856162B2 (en) * 2009-11-20 2014-10-07 Google Inc. Cross language search options
TWI461906B (zh) * 2011-09-09 2014-11-21 Hon Hai Prec Ind Co Ltd 硬碟測試資料分析方法
KR101210201B1 (ko) * 2011-10-04 2012-12-07 주식회사 소머스 소셜 네트워크 서비스를 이용한 인터랙티브 다국어 광고 시스템 및 그 구동 방법
US8971630B2 (en) 2012-04-27 2015-03-03 Abbyy Development Llc Fast CJK character recognition
US8989485B2 (en) 2012-04-27 2015-03-24 Abbyy Development Llc Detecting a junction in a text line of CJK characters
US8446481B1 (en) 2012-09-11 2013-05-21 Google Inc. Interleaved capture for high dynamic range image acquisition and synthesis
US9519641B2 (en) * 2012-09-18 2016-12-13 Abbyy Development Llc Photography recognition translation
JP2014089637A (ja) * 2012-10-31 2014-05-15 International Business Maschines Corporation 画像データ中の訳し分けされるべき単語又はフレーズに対応する訳語を決定する方法、並びにそのコンピュータ及びコンピュータ・プログラム
US8866927B2 (en) 2012-12-13 2014-10-21 Google Inc. Determining an image capture payload burst structure based on a metering image capture sweep
US9087391B2 (en) 2012-12-13 2015-07-21 Google Inc. Determining an image capture payload burst structure
US8866928B2 (en) 2012-12-18 2014-10-21 Google Inc. Determining exposure times using split paxels
US9247152B2 (en) 2012-12-20 2016-01-26 Google Inc. Determining image alignment failure
US8995784B2 (en) 2013-01-17 2015-03-31 Google Inc. Structure descriptors for image processing
US9686537B2 (en) 2013-02-05 2017-06-20 Google Inc. Noise models for image processing
US9117134B1 (en) 2013-03-19 2015-08-25 Google Inc. Image merging with blending
US9066017B2 (en) 2013-03-25 2015-06-23 Google Inc. Viewfinder display based on metering images
US9131201B1 (en) 2013-05-24 2015-09-08 Google Inc. Color correcting virtual long exposures with true long exposures
US9077913B2 (en) 2013-05-24 2015-07-07 Google Inc. Simulating high dynamic range imaging with virtual long-exposure images
US20150012259A1 (en) * 2013-07-02 2015-01-08 Sap Ag Language translator module in the middleware tool process integration
US9615012B2 (en) 2013-09-30 2017-04-04 Google Inc. Using a second camera to adjust settings of first camera
US9239833B2 (en) * 2013-11-08 2016-01-19 Google Inc. Presenting translations of text depicted in images
US9858385B2 (en) * 2015-07-23 2018-01-02 International Business Machines Corporation Identifying errors in medical data
CN105260727B (zh) * 2015-11-12 2018-09-21 武汉大学 基于图像处理与序列标注的学术文献语义再结构化方法
US12056331B1 (en) 2019-11-08 2024-08-06 Instabase, Inc. Systems and methods for providing a user interface that facilitates provenance tracking for information extracted from electronic source documents
US11315353B1 (en) * 2021-06-10 2022-04-26 Instabase, Inc. Systems and methods for spatial-aware information extraction from electronic source documents
US12067039B1 (en) 2023-06-01 2024-08-20 Instabase, Inc. Systems and methods for providing user interfaces for configuration of a flow for extracting information from documents via a large language model

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1270063A (en) * 1985-05-14 1990-06-05 Kouji Miyao Translating apparatus
US5497319A (en) * 1990-12-31 1996-03-05 Trans-Link International Corp. Machine translation and telecommunications system
JPH05324713A (ja) * 1992-05-20 1993-12-07 Hitachi Ltd 自然語処理方法および自然語処理システム
EP0692767B1 (en) 1994-07-13 2003-10-08 Canon Kabushiki Kaisha Image processing apparatus and method
US6201894B1 (en) 1996-01-23 2001-03-13 Canon Kabushiki Kaisha Method and apparatus for extracting ruled lines or region surrounding ruled lines

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001351089A (ja) * 2000-06-09 2001-12-21 Canon Inc 画像管理装置および画像管理方法
JP2010218098A (ja) * 2009-03-16 2010-09-30 Ricoh Co Ltd 情報処理装置、情報処理方法、制御プログラム及び記録媒体
US8508795B2 (en) 2009-03-16 2013-08-13 Ricoh Company, Limited Information processing apparatus, information processing method, and computer program product for inserting information into in image data
JP2015111807A (ja) * 2013-11-08 2015-06-18 株式会社リコー 画像処理システム、画像処理方法及びプログラム
JP2016535335A (ja) * 2013-11-08 2016-11-10 グーグル インコーポレイテッド 画像内に描かれたテキストの翻訳の提示
US10198439B2 (en) 2013-11-08 2019-02-05 Google Llc Presenting translations of text depicted in images
US10726212B2 (en) 2013-11-08 2020-07-28 Google Llc Presenting translations of text depicted in images
JP2015204015A (ja) * 2014-04-15 2015-11-16 コニカミノルタ株式会社 電子文書生成システム、画像形成装置、通信端末およびプログラム

Also Published As

Publication number Publication date
US20020064316A1 (en) 2002-05-30
US6539116B2 (en) 2003-03-25

Similar Documents

Publication Publication Date Title
JPH11120185A (ja) 情報処理装置及びその方法
US6246976B1 (en) Apparatus, method and storage medium for identifying a combination of a language and its character code system
JP3232144B2 (ja) 文章中の単語文節の出現頻度を求めるための装置
US5748805A (en) Method and apparatus for supplementing significant portions of a document selected without document image decoding with retrieved information
JP3292388B2 (ja) 文書画像の復号なしに文書を要約するための方法と装置
US5687383A (en) Translation rule learning scheme for machine translation
JP3232143B2 (ja) 復号していない文書画像の修正版を自動的に作成するための装置
US8655641B2 (en) Machine translation apparatus and non-transitory computer readable medium
US20060285746A1 (en) Computer assisted document analysis
US20060217959A1 (en) Translation processing method, document processing device and storage medium storing program
JP3038079B2 (ja) 自動翻訳装置
US7231600B2 (en) File translation
CN113673294B (zh) 文献关键信息的提取方法、装置、计算机设备和存储介质
CN109445900B (zh) 用于图片显示的翻译方法和装置
JP2004334341A (ja) 文書検索装置、文書検索方法及び記録媒体
KR20120103436A (ko) 화상 처리 장치, 비일시적인 컴퓨터 판독 가능한 매체, 및 화상 처리 방법
WO2022004097A1 (ja) 情報処理装置、情報処理方法、及びコンピュータプログラム
CN114564970A (zh) 一种全自动语料对齐系统和方法
JPH0883280A (ja) 文書処理装置
JPH11272671A (ja) 機械翻訳装置及び機械翻訳方法
JPH04311262A (ja) 辞書情報表示装置
JPH06149881A (ja) 辞書引き装置及び文書処理装置並びにディジタル複写装置
KR20030068502A (ko) 번역 메모리를 이용한 번역 처리방법 및 이 번역소프트웨어를 기록한 판독 가능한 기록매체
JP2002132764A (ja) 機械翻訳前処理装置
JPH07182344A (ja) 機械翻訳装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050104