JP2002269499A - 数式認識装置および数式認識方法並びに文字認識装置および文字認識方法 - Google Patents

数式認識装置および数式認識方法並びに文字認識装置および文字認識方法

Info

Publication number
JP2002269499A
JP2002269499A JP2001063968A JP2001063968A JP2002269499A JP 2002269499 A JP2002269499 A JP 2002269499A JP 2001063968 A JP2001063968 A JP 2001063968A JP 2001063968 A JP2001063968 A JP 2001063968A JP 2002269499 A JP2002269499 A JP 2002269499A
Authority
JP
Japan
Prior art keywords
character
mathematical expression
relationship
subscript
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001063968A
Other languages
English (en)
Other versions
JP4181310B2 (ja
Inventor
Masakazu Suzuki
昌和 鈴木
Hiroko Eto
裕子 江藤
Kazuaki Yokota
和章 横田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2001063968A priority Critical patent/JP4181310B2/ja
Priority to DE60224128T priority patent/DE60224128T2/de
Priority to US10/087,772 priority patent/US7181068B2/en
Priority to EP02004377A priority patent/EP1239406B1/en
Publication of JP2002269499A publication Critical patent/JP2002269499A/ja
Application granted granted Critical
Publication of JP4181310B2 publication Critical patent/JP4181310B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries
    • G06V30/244Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
    • G06V30/2455Discrimination between machine-print, hand-print and cursive writing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】数式を含む文書から高い精度で数式を認識する
ことが可能なOCRシステムを実現する。 【解決手段】数式検出部113では、形式文法と各単語
毎に算出されるテキストおよび数式それぞれの評価値と
に基づいて、単語毎にテキストおよび数式のいずれかを
選択しながら単語間を接続するための最適な経路が探索
され、数式領域が検出される。続く数式認識部114で
は、前後の文字種類別に異なる複数の散布図を用いるこ
とにより、水平位置関係、下付添え字関係、上付添え字
関係についての判定がなされる。そして、各文字間の局
所的な関係の判定のみならず、大域的な評価条件を考慮
して最適な経路を探索することにより、文字間毎に生成
されたリンク候補の中から最適な経路が決定され、文字
間の添え字関係が確定される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、数式を含む文書イ
メージの認識に使用される数式認識装置および数式認識
方法並びに文字認識装置および文字認識方法に関する。
【0002】
【従来の技術】数式を含む印刷文書の文字認識はあまり
報告は多くはないものの、以前より少しずつ行われてい
る。この分野の文字認識においては、文字は1次元的に
並んでいるわけではなく、添え字やべき乗、分数線の上
下など、2次元的な並びとなっている。従って、各文字
の文字認識結果だけでなく、その文字が添え字、べき
乗、分母・分子のどこにあるのかなど、数式における位
置情報を判定する手段が必要となる。従って、この文字
認識を計算機によって行う場合、その処理にかかる時間
は数式を対象としない通常の文字認識と比べて多くな
る。
【0003】これを実用的な時間で処理可能とした報告
例に、以下に示す文献[1][2]や文献[3]の手法がある。
これらは、数式の中の文字の上下関係などをルールとし
て記述し、通常の文字、添え字、べき乗、分母・分子な
どの位置判定を行うことで、数式認識を実現している。
【0004】文献[1] 岡本正行,トワキョンドムサフィ
リハシム,「周辺分布特長を用いた数式構造認識」,電子
情報通信学会論文誌, J78-DII, No.2, pp.366-370(199
5) 文献[2] 岡本正行,東裕之「記号レイアウトに注目した
数式構造認識」,電子情報通信学会論文誌,J78-DII, No.
3, pp.474-482(1995) 文献[3] R. J. Fateman, T. Tokuyasu, B. P. Berman
and N. Mitchell, "Optical Character Recognition a
nd Parsing of Typeset Mathematics," Journal of Vis
ual Communication and Image Representation, Vol 7,
No. 1, pp.2-15(1996)
【0005】
【発明が解決しようとする課題】しかしながら上記した
従来技術においては、文字を局所的な特徴に基づいて通
常の文字、添え字、べき乗、分母・分子などの位置判定
を行っていたため、1箇所の位置判定が誤ると、その後
の位置判定に大きく影響してしまうなどの問題があっ
た。例えば、ある場所に存在する通常の文字を、誤って
添え字と判定してしまうと、その誤判定された文字と同
じ水平位置上に並んでいる以後の通常の文字について
も、それらが全て添え字領域に存在する文字と誤って判
定されてしまうなどの現象が発生する場合があった。つ
まり、局所的な誤認識が、数式の全体の構造認識を大き
く崩してしまうのである。
【0006】また、上記した技術は、主に数式内部の文
字認識に関するものであり、テキスト中に現れる数式を
検出する方法については、単純に記号を検索するなどの
仕組みに頼っていた。
【0007】そこで本発明は上記の問題を解決するため
になされたものであり、数式を含む文書から高い精度で
数式を認識することが可能な数式認識装置および数式認
識方法並びに文字認識装置および文字認識方法を提供す
ることを目的とする。
【0008】
【課題を解決するための手段】上述の課題を解決するた
め、本発明の数式認識装置は、数式を含む文書イメージ
の文字認識を行う文字認識手段と、正規表現により特定
可能な単語種別毎にそれがテキストと数式に該当する可
能性をそれぞれ示す評価値を定義した第1の知識辞書
と、前記第1の知識辞書を参照して、前記文字認識手段
によって得られた文字認識結果に含まれる各単語につい
てテキストおよび数式それぞれに該当する評価値を得る
手段と、形式文法と前記各単語毎に算出されるテキスト
および数式それぞれの評価値とに基づいて、単語毎にテ
キストおよび数式のいずれかを選択しながら単語間を接
続するための最適な経路を探索し、その探索結果に基づ
いて数式に該当する単語を検出する数式検出手段とを具
備することを特徴とする。
【0009】この数式認識装置においては、数式領域を
通常の文字認識により認識すると、予期しない様々な文
字が認識結果として出現することを考慮して、正規表現
によって文字認識結果に含まれる様々な単語をその種別
毎に分類し、且つその分類された単語種別毎に予めテキ
ストと数式に該当する可能性をそれぞれ示す評価値を取
得するための知識辞書が用意されている。この知識辞書
を用いることにより、柔軟に各単語に対して評価値を与
えることが可能となる。数式検出は、形式文法と、各単
語毎に算出されるテキストおよび数式それぞれの評価値
とに基づいて、単語毎にテキストおよび数式のいずれか
を選択しながら単語間を接続するための最適な経路を探
索していくことによって行われる。これにより、数式領
域を精度良く検出することができるので、数式を含む文
書から高い精度で数式を認識することが可能となる。
【0010】また、本発明の数式認識装置は、数式を含
む文書イメージの文字認識を行う文字認識手段と、前記
文字認識手段によって得られた文字認識結果の中から数
式領域を検出する手段と、前後の文字が水平位置、下付
添え字、上付添え字それぞれの関係にある場合における
それら前後の文字間における正規化サイズとその中心位
置の関係を示すサンプル情報を、前後の文字種類別に複
数記憶する手段と、前記数式領域内に含まれる前後の文
字毎に、正規化サイズとその中心位置の関係を算出し、
その算出結果と、前記前後の文字の文字種類の関係に対
応するサンプル情報とに基づいて、前記前後の文字間毎
に水平位置関係、下付添え字関係、上付添え字関係それ
ぞれに該当する可能性を示すリンク候補を得る手段とを
具備することを特徴とする。
【0011】この数式認識装置においては、前後の文字
種類別に異なる複数のサンプル情報が用意されており、
水平位置関係、下付添え字関係、上付添え字関係を判定
すべき文字間の文字種類に対応するサンプル情報を参照
することにより、より高い精度で水平位置関係、下付添
え字関係、上付添え字関係を判定することが可能とな
る。よって、数式内の文字の位置に関する判定誤り自体
を大幅に低減することが可能となり、数式構造の認識効
率を大幅に向上することができる。
【0012】また、本発明の数式認識装置は、数式を含
む文書イメージの文字認識を行う文字認識手段と、前記
文字認識手段によって得られた文字認識結果の中から数
式領域を検出する手段と、前後の文字が水平位置、下付
添え字、上付添え字それぞれの関係にある場合における
それら前後の文字間における正規化サイズとその中心位
置の関係を示すサンプル情報を記憶する手段と、前記数
式領域内に含まれる前後の文字毎に正規化サイズとその
中心位置の関係を算出し、その算出結果と、前記サンプ
ル情報とに基づいて、前記前後の文字間毎に、水平位置
関係、下付添え字関係、上付添え字関係の中で該当する
可能性のある文字間構造候補とその評価値から成るリン
ク候補を得る文字間構造判定手段と、前記数式領域内に
含まれる文字それぞれの文字高さの分布に基づいて予め
決められた大域的評価条件を記憶する手段と、前記大域
的評価条件と、前記リンク候補とに基づいて、前記前後
の文字間毎に水平位置関係、下付添え字関係、上付添え
字関係のいずれかの文字間構造候補を選択しながら前記
数式領域内の文字同士を矛盾なく接続するための最適な
経路を探索し、その探索結果に基づいて前記各文字間の
水平位置関係、下付添え字関係、上付添え字関係を認識
する手段とを具備することを特徴とする。
【0013】このように、各文字間の局所的な関係の判
定のみならず、大域的な評価条件を考慮して最終的に合
計評価値が最大となるように数式領域内の文字同士を矛
盾なく接続するための最適な経路が探索されるので、特
定の文字間の位置判定にたとえ誤りが発生してとして
も、それが数式全体の構造にまで影響を及ぼすことを防
止することが可能となる。
【0014】
【発明の実施の形態】以下、図面を参照して本発明の実
施形態について説明する。図1は本発明の一実施形態に
係る文字認識システムの構成が示されている。この文字
認識(OCR)システム11は、例えば科学技術文書な
どに代表されるような数式を含む印刷文書の認識を行う
ためのものであり、印刷文書をスキャナ装置10を用い
て読み取り、その文書内のテキスト領域および数式領域
それぞれについての認識処理を行って、数式データとテ
キストデータとを含む電子化文書データを認識結果デー
タ20として出力する。読み取り対象の文書は印刷文書
のみならず、既にイメージデータ化された数式混じりの
文書イメージについても読み取り対象となる。
【0015】このOCRシステム11はコンピュータ上
で実行されるソフトウェアとして実現されており、その
機能モジュールとして、図示のように、レイアウト解析
部111、通常文字認識部112、数式検出部113、
数式認識部114、出力変換部115、数式・テキスト
判定知識辞書201、品詞接続知識辞書202、文字サ
イズ散布図情報記憶部203、および大域的評価情報記
憶部204を有している。これらの辞書および記憶部は
半導体メモリや磁気ディスク等の記憶媒体に記憶される
ものである。
【0016】認識処理は、1)文書イメージのスキャ
ン、2)レイアウト解析処理、3)通常文字認識処理、
4)数式検出処理、5)数式認識処理、6)出力変換処
理、の順で行われる。本実施形態では、特に数式検出処
理および数式認識処理の実現方法に特徴を有している。
【0017】数式検出処理および数式認識処理の具体的
内容を詳述する前に、まず、処理の流れの概要について
説明する。
【0018】先ず、数式を含む印刷文書をスキャナ装置
10で読み取ることにより、数式を含むページイメージ
が得られる。次いで、レイアウト解析部111によるレ
イアウト解析が行われ、ページイメージが図、表、文章
領域に分割される。そして、文章領域に対して通常文字
認識部112による通常文字認識処理が行われる。この
通常文字認識処理では、ヒストグラムに基づく行の切り
分けおよび文字の切り出し、そして1文字単位での文字
認識が行われる。この後、文字認識結果に基づき数式検
出部113による数式検出処理、および数式認識部11
4による数式認識処理が行われることになる。
【0019】数式検出部113による数式検出処理で
は、数式・テキスト判定知識辞書201、品詞接続知識
辞書202が用いられる。数式・テキスト判定知識辞書
201は、正規表現を用いて特定可能な単語の種別毎に
それがテキストと数式に該当する可能性をそれぞれ示す
評価値を定義したものである。この数式・テキスト判定
知識辞書201を参照することにより、単語毎にテキス
トと数式それぞれに関する評価値が求められる。
【0020】品詞接続知識辞書202は形式文法を規定
したものであり、ここにはテキスト品詞と数式との間の
接続関係の規則などが定義されている。この品詞接続知
識辞書202で与えられる形式文法と、数式・テキスト
判定知識辞書201の参照によって得られたテキストお
よび数式それぞれに関する「評価値」とに基づいて、文
字認識結果に含まれる単語間の最適な接続関係を判定す
ることにより、文字認識結果が数式領域とテキスト領域
へ分割される。
【0021】数式領域に含まれる文字・記号等は全て数
式認識部114に送られ、そこで数式構造の認識処理が
行われる。この数式構造認識処理では、数式をその構成
要素に分解する処理がなされ、その後、各数式要素毎
に、水平位置、下付添え字、上付添え字それぞれの関係
などが調べられる。ここでは、文字サイズ散布図情報記
憶部203内に記憶されている後述する複数種の文字サ
イズ散布図と、大域的評価情報記憶部204内に記憶さ
れている後述する大域的評価条件とが用いられる。サン
プル情報である文字サイズ散布図は、前後の文字ペアが
水平位置、下付添え字、上付添え字それぞれの関係にあ
る場合におけるそれら前後の文字間における正規化サイ
ズとその中心位置の分布の様子を示すものである。この
文字サイズ散布図を参照することにより、数式要素内に
含まれる文字間毎に、水平位置関係、下付添え字関係、
上付添え字関係の中で該当する可能性のある文字間構造
候補とその評価値から成るリンク候補が得られる。
【0022】大域的評価条件は、数式要素内に含まれる
文字全てに関する大域的な評価に基づいて適切な文字間
構造を決定するための条件式である。この大域的評価条
件を用いることにより、各文字間の局所的な関係の判定
のみならず、大域的な評価条件を考慮して、最終的に数
式要素内の文字同士を矛盾なく関係付けするための最適
な経路を探索する処理が行われる。
【0023】出力変換部115では、テキスト領域およ
び数式領域それぞれについての認識結果等を合成して認
識結果データ20を出力する処理が行われる。
【0024】(数式検出方法)以下、数式検出処理の具
体的な方法について説明する。本実施形態では、図2に
示すように、以下の2つのステップ(A1,A2)から
なる数式検出方法により、数式領域の検出を行う。この
検出方法は、基本的に英文の文書からの数式検知を対象
としている。
【0025】<ステップA1: 数式/テキスト評価処
理>このステップでは、通常の文字認識により得られた
結果から、各単語を数式「Math 」・テキスト「Text 」
として評価する。ここで「単語」とは認識結果のスペー
スで区切られた文字列をいう。図3は、この方法を示し
たものである。
【0026】図3の1行目は、実際に本システム11へ
入力された画像の例(Original Image)を示す。2行目
はそれを通常文字認識部112により通常文字認識した
結果である(Recognized Result)。本実施形態の通常
文字認識処理では、数式を認識する機能は実装されてい
ないため、数式が現れるとその認識結果は予期しない様
々な記号列として現れる。このステップA1では、この
認識結果を入力として、各単語を数式「Math 」および
テキスト「Text 」としてそれぞれ評価する。認識結果
の下の2行に「Math 」および「Text 」と示されている
値は、こうして各単語を評価した結果の例を示す。本実
施形態では、この処理を前述の数式・テキスト判定知識
辞書201より検索することで行っている。図4に数式
・テキスト判定知識辞書201のデータ例を示す。
【0027】図4において、番号1で示されている行
は、「with 」という綴りの単語の品詞は前置詞(PP)
で、「Math 」(数式)としての評価値が0、「Text 」
(テキスト)としての評価値が100であることを示
す。同様に、番号2で示されている行は、「where 」と
いう綴りの単語の品詞は代名詞(PN)で、「Math 」とし
ての評価値が0、「Text 」としての評価値が100で
あることを示す。番号3で示されている行は、「is 」
という綴りの単語の品詞は動詞(V )で、「Math 」とし
ての評価値が70、「Text 」としての評価値が70で
あることを示す。番号4で示されている行は、「a 」と
いう綴りの単語の品詞は冠詞(ART)で、「Math 」として
の評価値が90、「Text 」としての評価値が90であ
ることを示す。このようにして、数式・テキスト判定知
識辞書201には、科学技術文書などで通常使用される
ほとんど全ての単語について、その綴り(文字コードの
並び)、品詞、数式およびテキストそれぞれに関する評
価値が予め登録されている。
【0028】さらに、本実施形態では、数式に対する認
識結果は予期しない様々な記号列として現れることを考
慮し、正規表現によって、様々な記号列に柔軟に対応で
きるようにしている。正規表現とは、単語の綴りをより
柔軟に表現できるようにしたものであり、通常は検索シ
ステム等に使われている。この場合、正規表現における
各記号は次の意味を表す。
【0029】. 任意の文字を示す * 直前の文字の0回以上の繰り返しを示す (例 .* の場合、全ての文字列を示す) [] 括弧内に指定された文字のいずれか1つを示す (例 [a-z]の場合、a からz までのアルファベットの文
字を示す) ^ 次に指定した範囲以外の文字を示す (例 [^ a-z]の場合、a からz 以外の文字を示す) つまり、図4の番号5で示される行は、a からz 以外の
文字、即ち何らかの記号を1文字含む単語であることを
示す。この単語の品詞は名詞(N)で、「Math 」としての
評価値が100、「Text 」としての評価値が70であ
ることを示す。同様に番号6で示される行は、a からz
以外の何らかの記号を2文字含む単語であることを示し
ており、品詞は名詞(N)で、「Math 」としての評価値が
100、「Text 」としての評価値が40である。番号
7で示される行は、a からz 以外の何らかの記号を3文
字含む単語であることを示しており、品詞は名詞(N)
で、「Math 」としての評価値が100、「Text 」とし
ての評価値が20である。番号8で示される行は、a か
らz までのアルファベット1文字を示しており、品詞は
名詞(N)で、「Math 」としての評価値が90、「Text
」としての評価値が40である。なお、名詞(N)の品詞
は該当する単語がテキストである場合を示している。
【0030】図4に示す数式・テキスト判定知識辞書2
01を行番号順に検索することにより、文字認識結果で
得られた単語毎に品詞種別と、「Math 」および「Text
」それぞれについての評価値が得られる。
【0031】すなわち、図3に示されているように、単
語[with ]については図4の番号1の知識により、「M
ath 」としての評価値が0、「Text 」としての評価値
が100として得られる。単語[f ]については図4
の番号8の知識により、「Math 」としての評価値が9
0、「Text 」としての評価値が40として得られる。
単語[(,\ ]の3文字については番号7の規則によ
り、「Math 」としての評価値が100、「Text 」とし
ての評価値が20として得られる。続く、単語である
[ )=,\ ]の4文字は「Math 」としての評価値が10
0、「Text 」としての評価値が20として評価してい
ることを示す。ただし、図4にはこの例は示していな
い。同様に単語[where ]は図4の番号2の知識によ
り、「Math 」としての評価値が0、「Text 」としての
評価値が100として得られる。単語[U]は図4の番
号8の知識により、「Math 」としての評価値が90、
「Text 」としての評価値が40と評価される。同様に
単語[is ]は図4の番号3の知識により、「Math 」と
しての評価値が70、「Text 」としての評価値が70
として得られる。また、最後の単語[a ]は、図4の
番号4の知識が番号8の知識よりも優先適用されるの
で、「Math 」としての評価値および「Text 」としての
評価値が共に90として得られる。
【0032】<ステップA2: 最適パスの探索>次の
ステップA2では、評価した結果から最適パスを探索し
て接続する処理を行う。図5はこの様子を示したもので
ある。このステップA2では、テキストのどの品詞がど
の品詞に接続でき、またテキストのどの品詞が数式と接
続できるかなどを示した前述の品詞接続知識辞書202
を使用する。図6は品詞接続知識辞書202の実装例を
示したものである。
【0033】図6において、1行目の「Text PP →Mat
h」は、テキストの前置詞(PP)は後続する数式に接続で
きることを示している。また、2行目の「Math →Mat
h」は、数式同士を接続できることを示している。3行
目の「Math →Text PN」は、数式は後続するテキストの
代名詞(PN)に接続できることを示している。4行目の
「Text PN →Math」は、テキストの代名詞(PN)は後続
する数式に接続できることを示している。5行目の「Te
xt ART →Text N」は、テキストの冠詞(ART)は後続す
るテキストの名詞(N)に接続できることを示している。
【0034】品詞接続知識辞書202には接続可能な全
ての組み合わせが登録されており、それ以外のものは接
続できない。
【0035】最適経路の探索では、評価値を加算しなが
ら各単語について、品詞接続知識辞書202の形式文法
の規則に従って数式「Math 」/テキスト「Text 」のい
ずれかを選択しながら、可能な接続だけが辿られる。こ
うして、接続可能な全ての経路の中で、数式/テキスト
の評価値の合計が最も高くなる経路が探索される。簡単
に言えば、例えば図5において単語[with ]から次の単
語[f ]への接続可能な経路としては、単語[with ]の「M
ath 」からは単語[f ]の「Math 」と単語[f ]の「Text
」とが存在し、また単語[with ]の「Math 」からは単
語[f ]の「Math」と単語[f ]の「Text 」とが存在する
が、選択経路の合計評価値が最も高くなるように、単語
[with ]の「Text 」から単語[f ]の「Math 」への経路
が選択されることになる。図5においては、最初の単語
[with ]から最後の単語[a ]までの8単語を接続する際
の最適経路として、「Text 」、「Math 」、「Math
」、「Math 」、「Text 」、「Math 」、「Text 」、
「Text 」のルートが探索されたことが示されている。
【0036】この探索アルゴリズムは、ビームサーチ
(または幅優先探索と言う)により実現できる。ビーム
サーチは動的計画法などで使用される良く知られたアル
ゴリズムであり、動的計画法において、最適経路として
の可能性が低いと判断されたものを以後の処理から除外
することで探索空間を圧縮し、計算量とメモリ量の低減
を同時に実現できる効率化法である。
【0037】以上の探索処理の結果、各単語が数式「Ma
th 」/テキスト「Text 」のいずれであるかが求まり、
数式領域とテキスト領域とを検出することができる。図
5では、 f (,\ )=,\ U の単語が数式「Math 」として判定され、それ以外の単
語は全てテキスト「Text」として判定されたことが分か
る。数式「Math 」として判定された単語に対応するイ
メージデータ内の領域が数式領域となり、またテキスト
「Text 」として判定された単語に対応するイメージデ
ータ内の領域がテキスト領域となる。
【0038】なお、本例では品詞を用いて接続をチェッ
クするため、いわば正規文法で文法を記述しているのと
等価であるが、実際には文脈自由文法など、より高度な
形式文法で接続関係を記述することもできる。
【0039】従来のシステムでは、認識結果に括弧やイ
タリック体などの数式らしき記号が入っていればそれを
数式と判定するなど、簡単なルールで判定しているもの
が多かった。従って、数式を認識した場合に認識結果と
して出現する様々な記号については対応できず、また例
えば文書に[a ]という単語が存在した場合、それが冠
詞であるか数式であるかを判定することも事実上不可能
であった。本実施形態では、上述のように、各単語の評
価値をチェックすることで、より正確に各単語が数式
「Math 」であるかテキスト「Text 」であるかを判定で
きる。また形式文法をチェックしているので、例えば、
冠詞であるテキスト[a ]に後続できるのはテキストの
名詞のみであるという規則から、後ろに名詞が続かない
[a ]については数式と判定することも可能となる。
【0040】(数式認識方法)数式認識は、通常の文字
認識と比べて、文字自体の認識の他に、添え字、べき
乗、分母分子などの構造を調べる手法が必要となる。こ
のうち本実施形態では文字自体の認識には、従来の文字
認識と同一の方法を用いる。そして、数式構造を調べる
方法については、図7に示すように、以下の4つのステ
ップ(B1,B2,B3,B4)によって行われる。
【0041】<ステップB1: 分母分子、左添え字、
アクセント、根号、点類等の構造検出>このステップで
は、数式領域のイメージデータから分数線や根号などを
検出し、分母分子、根号内などをバラバラの式に分解す
る。同様に左添え字、アクセント記号、点類などを検出
し、それらを数式領域のイメージデータから消去する。
【0042】例えば、図8の様な数式が上記のようにし
て検出された数式領域に含まれている場合、点線で示す
ように4つの数式構成要素に分解され、且つ各数式構成
要素毎に左添え字の削除(a→a)、文字上の^,~,
等のアクセント記号の削除(xdx^→xdx)、さら
に図8には示されていないが根号の削除(√a+b → a+b
)、点類の削除(x → x)などが行われる。
【0043】分母分子や左添え字、アクセント記号、根
号、点類などの数式要素の判定は、上述の[1][2][3]な
どの文献でも比較的正確に行われており、多くの場合、
局所的な位置関係に基づく判定式で判定可能である。そ
こで、これらの検出作業を単純な判定方法によりあらか
じめ行っておくことで、以降のステップB2〜B4の処
理を、例えば下付添え字、上付添え字(べき乗)に関す
る処理に限定することができ、処理を高速化できる利点
がある。
【0044】<ステップB2: 文字認識>以降のステ
ップB2〜B4は、ステップB1により処理された、そ
れ以上分数線やアクセント記号、左添え字、根号、点類
などを含まない部分数式を対象に行う。
【0045】まず、ステップB2では、ステップB1に
よって得られた部分数式のイメージデータに対して黒連
結成分の抽出がなされ、その各黒連結成分に対して文字
認識が行われる。この結果、図9のような候補文字が得
られる。図9は、cxという部分数式のイメージ
データを文字認識した場合の例であり、この文字認識に
より、各文字(黒連結成分)毎に大文字、小文字などが
候補文字として得られる。
【0046】<ステップB3: リンク候補の生成>次
のステップB3では、得られた候補文字の全てについ
て、図10に示した関係を用いて、各文字の接続可能性
を調べる。
【0047】図10は、前後の2つの文字間が水平位置
関係、下付添え字関係、上付添え字関係のいずれに該当
するかを判定するために用いる値(正規化サイズとその
中心位置)を示したものである。図中、h1,h2で示
した値は、それぞれ該当する文字の正規化高さ(正規化
サイズ)である。正規化サイズとは、同一ライン上の文
字についてはそれらが同じサイズ(高さ)を持つように
大きさを補正したものである。
【0048】ここでは、アセンダー部分(例えば文字
[d ])とディセンダー部分(例えば文字[y ])を
あわせた文字全体の高さを正規化サイズとする。すなわ
ち、h1は、その文字の位置に「d 」と「y 」を重ねて
タイプした場合の文字高さを示す。「d 」はアセンダー
部分の上限にまで黒連結線分が延在している文字であ
り、「y 」はディセンダー部分の下限にまで黒連結線分
が延在している文字である。例えば、図中に示した「x
」の場合、「d 」や「y 」と比べて背が低い。そこ
で、「x 」の実際の文字高さを一定倍することにより、
「d 」と「y 」を重ね打ちした場合の正規化サイズh1
を求めることができる。正規化サイズを求めるための倍
率の値は、文字の種類毎に予め個々に規定されており、
実際の文字サイズにその倍率を乗じることにより正規化
サイズが求められる。例えば、小文字の「c 」につい
てはその上下方向に文字高さが広がるような倍率が用い
られ、また大文字の「C 」についてはその下方向にの
み文字高さが広がるような倍率が用いられることにな
る。
【0049】同様にして、添え字領域の文字「2 」につい
てもその実際の文字サイズに対して、その文字「2 」に対
応する倍率を乗ずることにより、正規化サイズh2が求
められる。通常、ベースライン上に存在する文字に比
し、添え字領域に存在する文字の実サイズは小さいの
で、ベースライン上に存在する文字「x 」の正規化サイ
ズh1よりも、添え字領域に存在する文字「2 」の正規化
サイズh2の方が小さくなる。
【0050】また、図10において、c1,c2は、そ
れぞれ正規化中心である。正規化中心とは同一ライン上
の文字が同じ高さの中心位置を持つように中心位置を補
正したものであり、ここでは、正規化した文字サイズを
囲む外接矩形の中心y座標を正規化中心とする。今、隣
り合った文字の正規化高さと中心座標をそれぞれh1、
c1、h2、c2とすれば、 正規化サイズの関係 H=(h2/h1) × 1000 正規化中心の関係 D={(c1−c2)/h1}
× 1000 の関係をプロットすると、図11の散布図が得られる。
【0051】図11(A)〜(D)の4つの散布図(サ
ンプル情報)は、水平位置にある文字のペアと、上付添
え字の関係にある文字のペアと、下付添え字の関係にあ
る文字のペアについて正規化サイズ・正規化中心の関係
(H.D)を、前後の文字種類別に測定した結果を示し
ている。図11(A)は連続する2つの文字が共にアル
ファベット類である場合の散布図である。ここで、アル
ファベット類とはアルファベット、ギリシャ文字、数字
を示している。同様に、図11(B)はアルファベット
類と演算子とが前後する場合を示し、図11(C)はイ
ンテグラルとアルファベット類とが前後する場合を示
し、図11(D)はΣ類とアルファベット類とが前後す
る場合を示している。
【0052】従って、ステップB2で調べた各候補文字
間毎にH,Dを算出し、H,Dが、それらの文字種に対
応する散布図上に示された多角形状領域のどれに属する
かを評価することにより、水平位置関係、下付添え字関
係、上付添え字関係の中で該当する可能性のある文字間
構造候補とその評価値の組(ここではリンク候補と呼
ぶ)を求めることが出来る。例えば前後の2文字間の正
規化サイズ・正規化中心の関係(H.D)が図11
(A)の多角形状領域P1,P2に含まれる場合にはそ
れらは上付添え字関係であると評価される(評価値はP
2よりもP1に含まれる場合の方が高い)。また、多角
形状領域P3,P4に含まれる場合にはそれらは下付添
え字関係であると評価される(評価値はP4よりもP3
に含まれる場合の方が高い)。また多角形状領域P6,
P5に含まれる場合にはそれらは水平位置関係であると
評価される(評価値はP5よりもP6に含まれる場合の
方が高い)。
【0053】図12は生成されたリンク候補を分かりや
すく示したものである。この図12では、各リンク候補
は、(親(左)候補文字、子(右)候補文字、接続の種
類、評価値)を表している。なお、リンク候補は前後の
2文字毎に行われるが、添え字領域が存在する文字を間
に挟んでその前後にある2文字(図12のx,yの関
係)についてもリンク候補が生成される。
【0054】図12に示すように、文字「c」と文字
「x」とのリンク候補は、図11(A)の散布図を参照
すると、 (c,x,水平,100) (c,X,下,60) (C,X,水平,100)となる。
【0055】この場合、(C,x)の組は散布図からあ
り得ない。
【0056】また、文字「x」と添え字文字「2」との
リンク候補は、図11(A)の散布図を参照すると、 (X,2,上,60) (x,2,上,100) (x,2,水平,20)となる。
【0057】また、文字「x」と添え字文字「2」を配
慮した文字「y」とのリンク候補は、図11(A)の散
布図を参照すると、 (x,y,水平,100) (x,Y,下,60) (X,y,水平,60) (2,y,下,10) (2,Y,下,50)となる。
【0058】また、文字「y」と添え字文字「3」との
リンク候補は、図11(A)の散布図を参照すると、 (y,3,上,100) (Y,3,上,50)となる。
【0059】本実施形態では、図11に示す散布図(サ
ンプル情報)が、前後の文字種類別に4つある点が一つ
の特徴となっている。図11に示した通り、各文字間の
関係は前後の文字種類によって分布がかなり変化する。
そこで本実施形態では、前後の文字の文字種類毎にこの
図を用意して、判定対象の2文字の文字種類に対応した
散布図を用いて添え字判定を行っている。
【0060】上述の文献[1][2][3]では、正規化された
中心位置が親文字の中心当たりにあるか、上下にずれて
いるかだけで、添え字判定を行っている。これは、図1
1でいうと、縦座標だけを用いて添え字判定を行ってい
ることになり、誤判定となる場合がかなりあることが分
かる。これに対し、本発明では、大きさの比も組み合わ
せて2次元的な領域での散布図で判定を行い、更にそれ
を記号種毎の組み合わせで散布図を求めて判定を行って
いるため、添え字判定の精度が大幅に向上する。
【0061】次のステップを説明する前に、数式構造認
識が何故最適経路問題になるかについて説明する。
【0062】即ち、数式の構造は木構造で表され、記号
は1列に並ばないので、何故、最適「経路」を求める問
題になるかは理解されていない。本発明では、ステップ
B3で作成したリンクネットワークから最適な数式構造
を表す全域木を求めることにより達成される。「全域木
を求めること」は「各文字の親文字への接続を定めるこ
と」になる。従って、(親(左)候補文字、子(右)候
補文字、接続の種類、評価値)の組を「リンク候補」と
呼び、各文字矩形に、その文字を子とするリンク候補を
全て持たせている。その上で、各文字矩形から1つずつ
リンク候補を選んでいけば1つの全域木が定まる。その
ような選択は「経路」として見なすことが出来るので、
最適経路問題になるという理屈になる。
【0063】<ステップB4: 最適パスの探索>次い
で、ステップB4では、ステップB3で文字間毎に生成
されたリンク候補を、後ろから(又は前から)辿ること
により、それらリンク候補を接続する際の最適な経路が
探索される。すなわち、各文字間毎の接続関係(水平位
置関係、下付添え字関係、上付添え字関係)を考慮し
て、前後の文字間毎にいずれかのリンク候補を選択しな
がら文字同士を矛盾なく接続可能な経路の中で、最も合
計評価値が最も高くなる経路が調べられる。この場合、
各リンク候補で与えられる文字間毎の局所的な評価値の
みならず、以下に示すように、該当する数式構成要素に
含まれる文字それぞれの間の文字高さの分布等に基づく
大域的な4つの大域的評価条件に基づいて、大域的評価
値が最も高くなる経路が最適経路として決定される。
【0064】1. 経路内の各リンク候補の評価値の和
を、大域的評価値とする。
【0065】2. 各文字の正規化サイズよりも、添え字
領域にある文字の正規化サイズが大きければ大域的評価
値を下げる。これは図14(a)の場合に相当する。つ
まり、リンク候補によって添え字領域に存在すると判定
された文字の正規化サイズが、他の文字それぞれの正規
化サイズと等しいか、それよりも大きい場合には、大域
的評価値を下げる。図14(a)では、“b”を添え字
と同じ大きさと判断した場合で、“b”の文字サイズが
“a”と同じなので、大域的評価値を下げる。
【0066】3. ベースライン上の文字と同じラインに
近い文字が添え字領域にあれば、大域的評価値を下げ
る。つまり、ベースライン上の文字と、図11の散布図
で狭領域(P2,P4,P6)に入る文字が添え字領域
にあれば、大域的評価値を下げる。図14(b)では、
“x”を大文字の“X”と判断した場合で、ベースライ
ン文字“A”と同じラインに近い文字“B”が添え字領
域にあり、大域的評価値を下げる。
【0067】4. ベースライン上のアルファベット類の
正規化文字サイズが一定以上ばらついていれば、大域的
評価値を下げる。これは図14(c)の場合に相当す
る。つまり、ベースライン上のアルファベット類が異な
る正規化サイズを持つとき大域的評価値が下げられる。
図14(c)は、“C”を小文字の“c”に誤判定した
場合で、その場合、“c”の正規化サイズは“A”の正
規化サイズより大きくなり、大域的評価値を下げる。
【0068】このように、大域的評価条件とは、前後の
文字間毎に水平位置関係、下付添え字関係、上付添え字
関係のいずれかのリンク候補を選択しながら数式内の文
字同士を矛盾なく接続可能な経路における合計評価値を
大域的な基準で修正し直すための条件である。大域評価
値が最も高くなる最適な経路を探索するための探索アル
ゴリズムとしては、ビームサーチ(または幅優先探索と
言う)を利用することができる。
【0069】図13には、大域的評価値を考慮して決定
された最適経路の一例が示されている。このようにし
て、各文字間毎に最適なリンク候補が選択され、各文字
間毎に水平位置関係、下付添え字関係、上付添え字関係
のいずれに該当するかが確定される。
【0070】上述の文献[1][2][3]の手法では、このよ
うな上記のような大域的評価値という考えが無かったた
め、一箇所でもベースライン上にある文字を添え字と間
違うと、それ以降の文字が全て添え字になってしまう問
題があった。これは、各文字の添え字・べき乗判定を、
局所的な特徴のみに基づいて計算していることによるも
のであった。これに比し、本発明では経路を辿る時に大
域的評価値を計算するため、1文字を誤って添え字と判
定してしまったとしても、それ以後の文字を全て添え字
としてしまうような現象が生じないという特徴を持つ。
また、この大域的評価値計算方法を利用して、外部の装
置により数式認識した結果を評価することもできる。こ
れは複合判定などにも応用可能である。
【0071】そして、このようにして候補文字間の最適
なつながりが決定された文字列に対してステップB1で
削除した左添え字やアクセント記号、根号などを加える
ことにより、該当する数式構成要素に関する最終的な認
識結果が得られる。ステップB2〜B4の処理を数式構
成要素毎に行うことにより、数式領域に関する最終的な
認識結果が得られる。そして、テキスト領域の認識結果
と数式領域に関する認識結果を合成することにより、数
式を含む文章領域の認識結果データが得られる。
【0072】以上説明したように、本実施形態によれ
ば、1)形式文法と各単語毎に算出されるテキストおよ
び数式それぞれの評価値とに基づいて、単語毎にテキス
トおよび数式のいずれかを選択しながら単語間を接続す
るための最適な経路を探索することにより、数式領域を
精度良く検出することが可能となる。2)前後の文字間
における正規化サイズとその中心位置の関係を示す散布
図を、前後の文字種類別に複数用意しておくことによ
り、高い精度で水平位置関係、下付添え字関係、上付添
え字関係を判定することが可能となる。3)各文字間の
局所的な関係の判定のみならず、大域的な評価条件を考
慮して最適な経路が探索することにより、特定の文字間
の位置判定にたとえ誤りが発生してとしても、それが数
式全体の構造にまで影響を及ぼすことを防止することが
可能となる。4)数式構成要素毎に分解して各数式構成
要素から左添え字、アクセント記号、根号などを検出す
る処理を、リンク候補生成、最適パスの探索の前処理と
して事前に行うことにより、リンク候補生成の対象とな
る文字を減らすことができ、処理の効率化を図ること出
来る。という効果が得られる。
【0073】なお、本実施形態のOCRシステム11の
機能はすべてソフトウェアによって実現できるので、上
述の各処理手順をコンピュータに実行させるプログラム
を用意し、それをコンピュータ読み取り可能な記憶媒体
に記憶すると共に、その記憶媒体を通じてコンピュータ
に導入して実行するだけで、本実施形態と同様の効果を
容易に得ることができる。
【0074】また、本発明は、上記実施形態に限定され
るものではなく、実施段階ではその要旨を逸脱しない範
囲で種々に変形することが可能である。更に、上記実施
形態には種々の段階の発明が含まれており、開示される
複数の構成要件における適宜な組み合わせにより種々の
発明が抽出され得る。例えば、実施形態に示される全構
成要件から幾つかの構成要件が削除されても、発明が解
決しようとする課題の欄で述べた課題が解決でき、発明
の効果の欄で述べられている効果が得られる場合には、
この構成要件が削除された構成が発明として抽出され得
る。
【0075】
【発明の効果】以上詳述した如く本発明によれば、数式
を含む文書から高い精度で数式を認識することが可能と
なり、例えば科学技術文書の電子化等に有効に活用する
ことができる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係るOCRシステムの機
能構成を示すブロック図。
【図2】同実施形態における数式検出方法の手順を示す
フローチャート。
【図3】同実施形態の数式検出で行われる数式/テキス
ト評価処理を説明するための図。
【図4】同実施形態で用いられる数式・テキスト判定知
識辞書の例を説明するための図。
【図5】同実施形態の数式検出で行われる最適パス探索
処理を説明するための図。
【図6】同実施形態で用いられる品詞接続知識辞書を説
明するための図。
【図7】同実施形態における数式認識方法の手順を示す
フローチャート。
【図8】同実施形態の数式認識で行われる数式分解の様
子を示す図。
【図9】同実施形態の数式認識で行われる候補文字の検
出動作を説明するための図。
【図10】同実施形態の数式認識で行われる正規化サイ
ズと正規化中心の算出処理を説明するための図。
【図11】同実施形態で用いられる散布図を説明するた
めの図。
【図12】同実施形態において連続する文字間毎に生成
されるリンク候補を説明するための図。
【図13】同実施形態の数式認識おける最適パス探索処
理を説明するための図。
【図14】同実施形態の数式認識で用いられる大域的評
価値計算のための条件を説明するための図。
【符号の説明】
11…OCRシステム 111…レイアウト解析部 112…通常文字認識部 113…数式検出部 114…数式認識部 115…出力変換部 201…数式・テキスト判定知識辞書 202…品詞接続知識辞書 203…文字サイズ散布図 204…大域的評価情報
───────────────────────────────────────────────────── フロントページの続き (72)発明者 江藤 裕子 福岡県福岡市東区箱崎6丁目10番1号 九 州大学内 (72)発明者 横田 和章 東京都青梅市末広町2丁目9番地 株式会 社東芝青梅工場内 Fターム(参考) 5B064 AA01 AB02 AB13 AB17 AB18 BA01 CA11 EA19 EA20

Claims (17)

    【特許請求の範囲】
  1. 【請求項1】 数式を含む文書イメージの文字認識を行
    う文字認識手段と、 正規表現により特定可能な単語種別毎にそれがテキスト
    と数式に該当する可能性をそれぞれ示す評価値を定義し
    た第1の知識辞書と、 前記第1の知識辞書を参照して、前記文字認識手段によ
    って得られた文字認識結果に含まれる各単語についてテ
    キストおよび数式それぞれに該当する評価値を得る手段
    と、 形式文法と前記各単語毎に算出されるテキストおよび数
    式それぞれの評価値とに基づいて、単語毎にテキストお
    よび数式のいずれかを選択しながら単語間を接続するた
    めの最適な経路を探索し、その探索結果に基づいて数式
    に該当する単語を検出する数式検出手段とを具備するこ
    とを特徴とする数式認識装置。
  2. 【請求項2】 接続可能な単語それぞれのテキスト品詞
    と数式の関係を前記形式文法として定義した第2の知識
    辞書をさらに具備し、 前記数式検出手段は、 前記文字認識結果に含まれる各単語についての品詞と前
    記第2の知識辞書で与えられる形式文法とに従って、単
    語毎にテキストおよび数式のいずれかを選択しながら単
    語間を接続可能な全ての経路を選定し、それら経路の中
    で、単語それぞれのテキストまたは数式に関する合計評
    価値が最大となる最適な経路を探索することを特徴とす
    る請求項1記載の数式認識装置。
  3. 【請求項3】 前後の文字が水平位置、下付添え字、上
    付添え字それぞれの関係にある場合におけるそれら前後
    の文字間における正規化サイズとその中心位置の関係を
    示すサンプル情報を、前後の文字種類別に複数記憶する
    手段と、 前記数式検出手段で検出された数式内に含まれる前後の
    文字毎に、正規化サイズとその中心位置の関係を算出
    し、その算出結果と、前記前後の文字の文字種類の関係
    に対応するサンプル情報とに基づいて、前記前後の文字
    間毎に、水平位置関係、下付添え字関係、上付添え字関
    係の中で該当する可能性のある文字間構造候補とその評
    価値から成るリンク候補を得る文字間構造判定手段をさ
    らに具備することを特徴とする請求項1記載の数式認識
    装置。
  4. 【請求項4】 前記数式内に含まれる文字それぞれの文
    字高さの分布に基づいて予め決められた大域的評価条件
    を記憶する手段と、 前記大域的評価条件と、前記リンク候補とに基づいて、
    前記前後の文字間毎に水平位置関係、下付添え字関係、
    上付添え字関係のいずれかの文字間構造候補を選択しな
    がら前記数式内の文字同士を矛盾なく接続するための最
    適な経路を探索し、その探索結果に基づいて前記各文字
    間の水平位置関係、下付添え字関係、上付添え字関係を
    認識する手段とをさらに具備することを特徴とする請求
    項3記載の数式認識装置。
  5. 【請求項5】 前記大域的評価条件には、下付添え字領
    域に含まれる文字の高さと他の各文字の高さとの関係、
    ベースラインと下付添え字領域に含まれる文字との間の
    位置関係、水平領域に含まれる文字間の高さのバラツ
    キ、のうちの少なくとも1つが含まれていることを特徴
    とする請求項4記載の数式認識装置。
  6. 【請求項6】 前記数式検出手段で検出された数式をそ
    の数式構成要素毎に分解し、各数式構成要素から少なく
    とも左添え字、アクセント記号、根号、点類を検出し
    て、それを除外する手段をさらに具備し、 前記文字間構造判定手段は、除外した数式構成要素に対
    して、リンク候補を得ることを特徴とする請求項3記載
    の数式認識装置。
  7. 【請求項7】 数式を含む文書イメージの文字認識を行
    う文字認識手段と、 前記文字認識手段によって得られた文字認識結果の中か
    ら数式領域を検出する手段と、 前後の文字が水平位置、下付添え字、上付添え字それぞ
    れの関係にある場合におけるそれら前後の文字間におけ
    る正規化サイズとその中心位置の関係を示すサンプル情
    報を、前後の文字種類別に複数記憶する手段と、 前記数式領域内に含まれる前後の文字毎に、正規化サイ
    ズとその中心位置の関係を算出し、その算出結果と、前
    記前後の文字の文字種類の関係に対応するサンプル情報
    とに基づいて、前記前後の文字間毎に水平位置関係、下
    付添え字関係、上付添え字関係それぞれに該当する可能
    性を示すリンク候補を得る手段とを具備することを特徴
    とする数式認識装置。
  8. 【請求項8】 数式を含む文書イメージの文字認識を行
    う文字認識手段と、 前記文字認識手段によって得られた文字認識結果の中か
    ら数式領域を検出する手段と、 前後の文字が水平位置、下付添え字、上付添え字それぞ
    れの関係にある場合におけるそれら前後の文字間におけ
    る正規化サイズとその中心位置の関係を示すサンプル情
    報を記憶する手段と、 前記数式領域内に含まれる前後の文字毎に正規化サイズ
    とその中心位置の関係を算出し、その算出結果と、前記
    サンプル情報とに基づいて、前記前後の文字間毎に、水
    平位置関係、下付添え字関係、上付添え字関係の中で該
    当する可能性のある文字間構造候補とその評価値から成
    るリンク候補を得る文字間構造判定手段と、 前記数式領域内に含まれる文字それぞれの文字高さの分
    布に基づいて予め決められた大域的評価条件を記憶する
    手段と、 前記大域的評価条件と、前記リンク候補とに基づいて、
    前記前後の文字間毎に水平位置関係、下付添え字関係、
    上付添え字関係のいずれかの文字間構造候補を選択しな
    がら前記数式領域内の文字同士を矛盾なく接続するため
    の最適な経路を探索し、その探索結果に基づいて前記各
    文字間の水平位置関係、下付添え字関係、上付添え字関
    係を認識する手段とを具備することを特徴とする数式認
    識装置。
  9. 【請求項9】 数式を含む文書イメージの文字認識を行
    う文字認識ステップと、 正規表現により特定可能な単語種別毎にそれがテキスト
    と数式に該当する可能性をそれぞれ示す評価値を定義し
    た第1の知識情報を参照して、前記文字認識ステップに
    よって得られた文字認識結果に含まれる各単語について
    テキストおよび数式それぞれに該当する評価値を得るス
    テップと、 形式文法と前記各単語毎に算出されるテキストおよび数
    式それぞれの評価値とに基づいて、単語毎にテキストお
    よび数式のいずれかを選択しながら単語間を接続するた
    めの最適な経路を探索し、その探索結果に基づいて数式
    に該当する単語を検出する数式検出ステップとを具備す
    ることを特徴とする数式認識方法。
  10. 【請求項10】 数式を含む文書イメージの文字認識を
    行う文字認識ステップと、 前記文字認識ステップによって得られた文字認識結果の
    中から数式領域を検出するステップと、 前後の文字が水平位置、下付添え字、上付添え字それぞ
    れの関係にある場合におけるそれら前後の文字間におけ
    る正規化サイズとその中心位置の関係を示すサンプル情
    報を、前後の文字種類別に複数予め用意しておき、前記
    数式領域内に含まれる前後の文字毎に、正規化サイズと
    その中心位置の関係を算出し、その算出結果と、前記前
    後の文字の文字種類の関係に対応するサンプル情報とに
    基づいて、前記前後の文字間毎に水平位置関係、下付添
    え字関係、上付添え字関係それぞれに該当する可能性を
    示す文字間構造の評価値から成るリンク候補を得るステ
    ップとを具備することを特徴とする数式認識方法。
  11. 【請求項11】 数式を含む文書イメージの文字認識を
    行う文字認識ステップと、 前記文字認識ステップによって得られた文字認識結果の
    中から数式領域を検出するステップと、 前後の文字が水平位置、下付添え字、上付添え字それぞ
    れの関係にある場合におけるそれら前後の文字間におけ
    る正規化サイズとその中心位置の関係を示すサンプル情
    報を予め用意しておき、前記数式領域内に含まれる前後
    の文字毎に正規化サイズとその中心位置の関係を算出
    し、その算出結果と、前記サンプル情報とに基づいて、
    前記前後の文字間毎に、水平位置関係、下付添え字関
    係、上付添え字関係の中で該当する可能性のある文字間
    構造候補とその評価値から成るリンク候補を得る文字間
    構造判定ステップと、 前記数式領域内に含まれる文字それぞれの文字高さの分
    布に基づいて予め決められた大域的評価条件を用意して
    おき、前記大域的評価条件と、前記リンク候補とに基づ
    いて、前記前後の文字間毎に水平位置関係、下付添え字
    関係、上付添え字関係のいずれかの文字間構造候補を選
    択しながら前記数式領域内の文字同士を矛盾なく接続す
    るための最適な経路を探索し、その探索結果に基づいて
    前記各文字間の水平位置関係、下付添え字関係、上付添
    え字関係を認識するステップとを具備することを特徴と
    する数式認識方法。
  12. 【請求項12】 数式を含む文書を読み取り、テキスト
    領域および数式領域それぞれについての認識処理を行う
    文字認識装置において、 前記数式を含む文書のイメージデータに対して文字認識
    を行う文字認識手段と、 正規表現により特定可能な単語種別毎にそれがテキスト
    と数式に該当する可能性をそれぞれ示す評価値を定義し
    た第1の知識辞書と、 前記第1の知識辞書を参照して、前記文字認識手段によ
    って得られた文字認識結果に含まれる各単語についてテ
    キストおよび数式それぞれに該当する評価値を得る手段
    と、 形式文法と前記各単語毎に算出されるテキストおよび数
    式それぞれの評価値とに基づいて、単語毎にテキストお
    よび数式のいずれかを選択しながら単語間を接続するた
    めの最適な経路を探索し、その探索結果に基づいて前記
    数式領域と前記テキスト領域を検出する手段とを具備す
    ることを特徴とする文字認識装置。
  13. 【請求項13】 数式を含む文書を読み取り、テキスト
    領域および数式領域それぞれについての認識処理を行う
    文字認識装置において、 前記数式を含む文書のイメージデータに対して文字認識
    を行う文字認識手段と、 前記文字認識手段によって得られた文字認識結果の中か
    ら数式領域を検出する手段と、 前後の文字が水平位置、下付添え字、上付添え字それぞ
    れの関係にある場合におけるそれら前後の文字間におけ
    る正規化サイズとその中心位置の関係を示すサンプル情
    報を、前後の文字種類別に複数記憶する手段と、 前記数式領域内に含まれる前後の文字毎に、正規化サイ
    ズとその中心位置の関係を算出し、その算出結果と、前
    記前後の文字の文字種類の関係に対応するサンプル情報
    とに基づいて、前記前後の文字間毎に水平位置関係、下
    付添え字関係、上付添え字関係それぞれに該当する可能
    性を示すリンク候補を得て、前記数式領域内の数式構造
    を認識する手段とを具備することを特徴とする文字認識
    装置。
  14. 【請求項14】 数式を含む文書を読み取り、テキスト
    領域および数式領域それぞれについての認識処理を行う
    文字認識装置において、 前記数式を含む文書のイメージデータに対して文字認識
    を行う文字認識手段と、 前記文字認識手段によって得られた文字認識結果の中か
    ら数式領域を検出する手段と、 前後の文字が水平位置、下付添え字、上付添え字それぞ
    れの関係にある場合におけるそれら前後の文字間におけ
    る正規化サイズとその中心位置の関係を示すサンプル情
    報を記憶する手段と、 前記数式領域内に含まれる前後の文字毎に正規化サイズ
    とその中心位置の関係を算出し、その算出結果と、前記
    サンプル情報とに基づいて、前記前後の文字間毎に、水
    平位置関係、下付添え字関係、上付添え字関係の中で該
    当する可能性のある文字間構造候補とその評価値から成
    るリンク候補を得る文字間構造判定手段と、 前記数式領域内に含まれる文字それぞれの文字高さの分
    布に基づいて予め決められた大域的評価条件を記憶する
    手段と、 前記大域的評価条件と、前記リンク候補とに基づいて、
    前記前後の文字間毎に水平位置関係、下付添え字関係、
    上付添え字関係のいずれかの文字間構造候補を選択しな
    がら前記数式領域内の文字同士を矛盾なく接続するため
    の最適な経路を探索し、その探索結果に基づいて前記各
    文字間の水平位置関係、下付添え字関係、上付添え字関
    係を認識する手段とを具備することを特徴とする文字認
    識装置。
  15. 【請求項15】 数式を含む文書を読み取り、テキスト
    領域および数式領域それぞれについての認識処理を行う
    文字認識方法において、 前記数式を含む文書のイメージデータに対して文字認識
    を行う文字認識ステップと、 正規表現により特定可能な単語種別毎にそれがテキスト
    と数式に該当する可能性をそれぞれ示す評価値を定義し
    た第1の知識辞書を参照して、前記文字認識ステップに
    よって得られた文字認識結果に含まれる各単語について
    テキストおよび数式それぞれに該当する評価値を得るス
    テップと、 形式文法と前記各単語毎に得られたテキストおよび数式
    それぞれの評価値とに基づいて、単語毎にテキストおよ
    び数式のいずれかを選択しながら単語間を接続するため
    の最適な経路を探索し、その探索結果に基づいて前記数
    式領域と前記テキスト領域を検出するステップとを具備
    することを特徴とする文字認識方法。
  16. 【請求項16】 数式を含む文書を読み取り、テキスト
    領域および数式領域それぞれについての認識処理を行う
    文字認識方法において、 前記数式を含む文書のイメージデータに対して文字認識
    を行う文字認識ステップと、 前記文字認識ステップによって得られた文字認識結果の
    中から数式領域を検出するステップと、 前後の文字が水平位置、下付添え字、上付添え字それぞ
    れの関係にある場合におけるそれら前後の文字間におけ
    る正規化サイズとその中心位置の関係を示すサンプル情
    報を、前後の文字種類別に複数用意しておき、前記数式
    領域内に含まれる前後の文字毎に、正規化サイズとその
    中心位置の関係を算出し、その算出結果と、前記前後の
    文字の文字種類の関係に対応するサンプル情報とに基づ
    いて、前記前後の文字間毎に水平位置関係、下付添え字
    関係、上付添え字関係それぞれに該当する可能性を示す
    リンク候補を得て、前記数式領域内の数式構造を認識す
    るステップとを具備することを特徴とする文字認識方
    法。
  17. 【請求項17】 数式を含む文書を読み取り、テキスト
    領域および数式領域それぞれについての認識処理を行う
    文字認識方法において、 前記数式を含む文書のイメージデータに対して文字認識
    を行う文字認識ステップと、 前記文字認識ステップによって得られた文字認識結果の
    中から数式領域を検出するステップと、 前後の文字が水平位置、下付添え字、上付添え字それぞ
    れの関係にある場合におけるそれら前後の文字間におけ
    る正規化サイズとその中心位置の関係を示すサンプル情
    報を用意しておき、前記数式領域内に含まれる前後の文
    字毎に正規化サイズとその中心位置の関係を算出し、そ
    の算出結果と、前記散布図とに基づいて、前記前後の文
    字間毎に、水平位置関係、下付添え字関係、上付添え字
    関係の中で該当する可能性のある文字間構造候補とその
    評価値から成るリンク候補を得る文字間構造判定ステッ
    プと、 前記数式領域内に含まれる文字それぞれの文字高さの分
    布に基づいて予め決められた大域的評価条件を用意して
    おき、前記大域的評価条件と、前記リンク候補とに基づ
    いて、前記前後の文字間毎に水平位置関係、下付添え字
    関係、上付添え字関係のいずれかの文字間構造候補を選
    択しながら前記数式領域内の文字同士を矛盾なく接続す
    るための最適な経路を探索し、その探索結果に基づいて
    前記各文字間の水平位置関係、下付添え字関係、上付添
    え字関係を認識するステップとを具備することを特徴と
    する文字認識方法。
JP2001063968A 2001-03-07 2001-03-07 数式認識装置および数式認識方法 Expired - Lifetime JP4181310B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2001063968A JP4181310B2 (ja) 2001-03-07 2001-03-07 数式認識装置および数式認識方法
DE60224128T DE60224128T2 (de) 2001-03-07 2002-03-05 Vorrichtung und Verfahren zum Erkennen von Zeichen und mathematischen Ausdrücken
US10/087,772 US7181068B2 (en) 2001-03-07 2002-03-05 Mathematical expression recognizing device, mathematical expression recognizing method, character recognizing device and character recognizing method
EP02004377A EP1239406B1 (en) 2001-03-07 2002-03-05 Device and method for character recognition and for recognition of mathematical expressions

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001063968A JP4181310B2 (ja) 2001-03-07 2001-03-07 数式認識装置および数式認識方法

Publications (2)

Publication Number Publication Date
JP2002269499A true JP2002269499A (ja) 2002-09-20
JP4181310B2 JP4181310B2 (ja) 2008-11-12

Family

ID=18922868

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001063968A Expired - Lifetime JP4181310B2 (ja) 2001-03-07 2001-03-07 数式認識装置および数式認識方法

Country Status (4)

Country Link
US (1) US7181068B2 (ja)
EP (1) EP1239406B1 (ja)
JP (1) JP4181310B2 (ja)
DE (1) DE60224128T2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007072718A (ja) * 2005-09-06 2007-03-22 Univ Of Tokyo 手書き数式の認識装置及び認識方法
JP2009500755A (ja) * 2005-07-01 2009-01-08 マイクロソフト コーポレーション 文書視覚構造の文法的な解析
JP2011034263A (ja) * 2009-07-31 2011-02-17 Casio Computer Co Ltd 電子機器及びプログラム
JP2012133627A (ja) * 2010-12-22 2012-07-12 Casio Comput Co Ltd 手書き数式認識機能を備えた電子計算機およびプログラム
US8509563B2 (en) 2006-02-02 2013-08-13 Microsoft Corporation Generation of documents from images
JP2015505113A (ja) * 2012-01-23 2015-02-16 マイクロソフト コーポレーション 式検出エンジン
US10127221B2 (en) 2013-03-11 2018-11-13 Microsoft Technology Licensing, Llc Detection and reconstruction of East Asian layout features in a fixed format document

Families Citing this family (61)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9514181B2 (en) * 2004-03-23 2016-12-06 Linguaversal, SL Calculation expression management
US7698638B2 (en) * 2004-09-15 2010-04-13 Microsoft Corporation Systems and methods for automated equation buildup
US7561739B2 (en) * 2004-09-22 2009-07-14 Microsoft Corporation Analyzing scripts and determining characters in expression recognition
US7929767B2 (en) * 2004-09-22 2011-04-19 Microsoft Corporation Analyzing subordinate sub-expressions in expression recognition
US7561737B2 (en) * 2004-09-22 2009-07-14 Microsoft Corporation Mathematical expression recognition
US7702673B2 (en) 2004-10-01 2010-04-20 Ricoh Co., Ltd. System and methods for creation and use of a mixed media environment
US9373029B2 (en) 2007-07-11 2016-06-21 Ricoh Co., Ltd. Invisible junction feature recognition for document security or annotation
US7812986B2 (en) 2005-08-23 2010-10-12 Ricoh Co. Ltd. System and methods for use of voice mail and email in a mixed media environment
US8156116B2 (en) 2006-07-31 2012-04-10 Ricoh Co., Ltd Dynamic presentation of targeted information in a mixed media reality recognition system
US8965145B2 (en) 2006-07-31 2015-02-24 Ricoh Co., Ltd. Mixed media reality recognition using multiple specialized indexes
US9171202B2 (en) 2005-08-23 2015-10-27 Ricoh Co., Ltd. Data organization and access for mixed media document system
US9530050B1 (en) 2007-07-11 2016-12-27 Ricoh Co., Ltd. Document annotation sharing
US8989431B1 (en) 2007-07-11 2015-03-24 Ricoh Co., Ltd. Ad hoc paper-based networking with mixed media reality
US9384619B2 (en) 2006-07-31 2016-07-05 Ricoh Co., Ltd. Searching media content for objects specified using identifiers
US8176054B2 (en) * 2007-07-12 2012-05-08 Ricoh Co. Ltd Retrieving electronic documents by converting them to synthetic text
US9405751B2 (en) 2005-08-23 2016-08-02 Ricoh Co., Ltd. Database for mixed media document system
US8020091B2 (en) * 2005-07-15 2011-09-13 Microsoft Corporation Alignment and breaking of mathematical expressions in documents
KR100630200B1 (ko) * 2005-08-24 2006-10-02 삼성전자주식회사 휴대용 단말기에서 계산기 모드 동작 방법
RU2309456C2 (ru) * 2005-12-08 2007-10-27 "Аби Софтвер Лтд." Способ распознавания текстовой информации из векторно-растрового изображения
US20100254606A1 (en) * 2005-12-08 2010-10-07 Abbyy Software Ltd Method of recognizing text information from a vector/raster image
AU2007215162A1 (en) 2006-02-10 2007-08-23 Nokia Corporation Systems and methods for spatial thumbnails and companion maps for media objects
CN101443787B (zh) 2006-02-17 2012-07-18 徕美股份公司 用于ocr系统中的不确定识别单词的验证的方法和系统
US9721157B2 (en) * 2006-08-04 2017-08-01 Nokia Technologies Oy Systems and methods for obtaining and using information from map images
US9176984B2 (en) 2006-07-31 2015-11-03 Ricoh Co., Ltd Mixed media reality retrieval of differentially-weighted links
US9063952B2 (en) 2006-07-31 2015-06-23 Ricoh Co., Ltd. Mixed media reality recognition with image tracking
US8201076B2 (en) 2006-07-31 2012-06-12 Ricoh Co., Ltd. Capturing symbolic information from documents upon printing
US8489987B2 (en) 2006-07-31 2013-07-16 Ricoh Co., Ltd. Monitoring and analyzing creation and usage of visual content using image and hotspot interaction
US9020966B2 (en) 2006-07-31 2015-04-28 Ricoh Co., Ltd. Client device for interacting with a mixed media reality recognition system
WO2009075689A2 (en) 2006-12-21 2009-06-18 Metacarta, Inc. Methods of systems of using geographic meta-metadata in information retrieval and document displays
US7885456B2 (en) * 2007-03-29 2011-02-08 Microsoft Corporation Symbol graph generation in handwritten mathematical expression recognition
US8009915B2 (en) * 2007-04-19 2011-08-30 Microsoft Corporation Recognition of mathematical expressions
US8116570B2 (en) * 2007-04-19 2012-02-14 Microsoft Corporation User interface for providing digital ink input and correcting recognition errors
US8073258B2 (en) * 2007-08-22 2011-12-06 Microsoft Corporation Using handwriting recognition in computer algebra
US20090245646A1 (en) * 2008-03-28 2009-10-01 Microsoft Corporation Online Handwriting Expression Recognition
US8121412B2 (en) * 2008-06-06 2012-02-21 Microsoft Corporation Recognition of tabular structures
US20100115403A1 (en) * 2008-11-06 2010-05-06 Microsoft Corporation Transforming math text objects using build down and build up
US20100166314A1 (en) * 2008-12-30 2010-07-01 Microsoft Corporation Segment Sequence-Based Handwritten Expression Recognition
JP4775462B2 (ja) * 2009-03-12 2011-09-21 カシオ計算機株式会社 計算機及びプログラム
US8571270B2 (en) 2010-05-10 2013-10-29 Microsoft Corporation Segmentation of a word bitmap into individual characters or glyphs during an OCR process
US8751550B2 (en) 2010-06-09 2014-06-10 Microsoft Corporation Freeform mathematical computations
JP5790070B2 (ja) * 2010-08-26 2015-10-07 カシオ計算機株式会社 表示制御装置およびプログラム
CN103250149B (zh) * 2010-12-07 2015-11-25 Sk电信有限公司 用于从数学语句提取语义距离并且按照语义距离对数学语句分类的方法和用于该方法的装置
US8943113B2 (en) * 2011-07-21 2015-01-27 Xiaohua Yi Methods and systems for parsing and interpretation of mathematical statements
US9058331B2 (en) 2011-07-27 2015-06-16 Ricoh Co., Ltd. Generating a conversation in a social network based on visual search results
US9600587B2 (en) 2011-10-19 2017-03-21 Zalag Corporation Methods and apparatuses for generating search expressions from content, for applying search expressions to content collections, and/or for analyzing corresponding search results
US9208218B2 (en) * 2011-10-19 2015-12-08 Zalag Corporation Methods and apparatuses for generating search expressions from content, for applying search expressions to content collections, and/or for analyzing corresponding search results
JP5950700B2 (ja) * 2012-06-06 2016-07-13 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
CN103679129A (zh) * 2012-09-21 2014-03-26 中兴通讯股份有限公司 一种图像中的目标物体识别方法及装置
JP2014127188A (ja) * 2012-12-27 2014-07-07 Toshiba Corp 整形装置及び方法
JP2014203393A (ja) * 2013-04-09 2014-10-27 株式会社東芝 電子機器、手書き文書処理方法、及び手書き文書処理プログラム
CN103996055B (zh) * 2014-06-13 2017-06-09 上海珉智信息科技有限公司 基于影像档案电子资料识别系统中分类器的识别方法
RU2596600C2 (ru) 2014-09-02 2016-09-10 Общество с ограниченной ответственностью "Аби Девелопмент" Способы и системы обработки изображений математических выражений
CN107092902B (zh) * 2016-02-18 2021-04-06 富士通株式会社 字符串的识别方法和系统
US10025976B1 (en) * 2016-12-28 2018-07-17 Konica Minolta Laboratory U.S.A., Inc. Data normalization for handwriting recognition
CN108038441B (zh) * 2017-12-07 2021-03-16 潘晓梅 一种基于图像识别的系统与方法
JP2019168935A (ja) * 2018-03-23 2019-10-03 カシオ計算機株式会社 入力装置、入力方法、およびプログラム
US11610502B2 (en) 2018-11-28 2023-03-21 Kyndryl, Inc. Portable computing device for learning mathematical concepts
CN110796137A (zh) * 2019-10-10 2020-02-14 中国建设银行股份有限公司 一种识别图像的方法和装置
KR20210061523A (ko) * 2019-11-19 2021-05-28 삼성전자주식회사 필기 입력을 텍스트로 변환하는 전자 장치 및 그 동작 방법
CN112712075B (zh) * 2020-12-30 2023-12-01 科大讯飞股份有限公司 算式检测方法、电子设备和存储装置
KR102449336B1 (ko) * 2021-09-23 2022-09-30 (주)웅진씽크빅 Ocr을 이용한 학습 추천 장치 및 방법

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL109268A (en) * 1994-04-10 1999-01-26 Advanced Recognition Tech Method and system for image recognition

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009500755A (ja) * 2005-07-01 2009-01-08 マイクロソフト コーポレーション 文書視覚構造の文法的な解析
US8249344B2 (en) 2005-07-01 2012-08-21 Microsoft Corporation Grammatical parsing of document visual structures
JP2007072718A (ja) * 2005-09-06 2007-03-22 Univ Of Tokyo 手書き数式の認識装置及び認識方法
US8509563B2 (en) 2006-02-02 2013-08-13 Microsoft Corporation Generation of documents from images
JP2011034263A (ja) * 2009-07-31 2011-02-17 Casio Computer Co Ltd 電子機器及びプログラム
JP2012133627A (ja) * 2010-12-22 2012-07-12 Casio Comput Co Ltd 手書き数式認識機能を備えた電子計算機およびプログラム
US8659567B2 (en) 2010-12-22 2014-02-25 Casio Computer Co., Ltd. Electronic device having handwritten mathematical formula recognition function
JP2015505113A (ja) * 2012-01-23 2015-02-16 マイクロソフト コーポレーション 式検出エンジン
KR101812380B1 (ko) 2012-01-23 2017-12-26 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 공식 검출 엔진
US9928225B2 (en) 2012-01-23 2018-03-27 Microsoft Technology Licensing, Llc Formula detection engine
US10127221B2 (en) 2013-03-11 2018-11-13 Microsoft Technology Licensing, Llc Detection and reconstruction of East Asian layout features in a fixed format document

Also Published As

Publication number Publication date
DE60224128T2 (de) 2008-12-04
EP1239406B1 (en) 2007-12-19
EP1239406A3 (en) 2005-03-16
DE60224128D1 (de) 2008-01-31
US20020126905A1 (en) 2002-09-12
EP1239406A2 (en) 2002-09-11
JP4181310B2 (ja) 2008-11-12
US7181068B2 (en) 2007-02-20

Similar Documents

Publication Publication Date Title
JP2002269499A (ja) 数式認識装置および数式認識方法並びに文字認識装置および文字認識方法
US5664027A (en) Methods and apparatus for inferring orientation of lines of text
Lu et al. Document image retrieval through word shape coding
JP5144940B2 (ja) 目次抽出におけるロバスト性向上
EP0844583B1 (en) Method and apparatus for character recognition
JP3452774B2 (ja) 文字認識方法
JPH05307638A (ja) ビットマップ・イメージ・ドキュメントのコード化データへの変換方法
Lehal et al. A shape based post processor for Gurmukhi OCR
Lehal et al. A post-processor for Gurmukhi OCR
Hocking et al. Optical character recognition for South African languages
JP3975825B2 (ja) 文字認識誤り訂正方法、装置及びプログラム
JP6007720B2 (ja) 情報処理装置及び情報処理プログラム
Liu et al. An improved algorithm for Identifying Mathematical formulas in the images of PDF documents
Baird et al. A family of European page readers
JP4181327B2 (ja) 数式認識装置および数式認識方法
JP2002063197A (ja) 検索装置、記録媒体およびプログラム
KR102673900B1 (ko) 표 데이터 추출 시스템 및 그 방법
JPH09274645A (ja) 文字認識方法および装置
Rathnasena et al. Summarization based approach for old sinhala text archival search and preservation
Habeeb Hybrid model of post-processing techniques for Arabic optical character recognition
JPS62249269A (ja) 文書処理装置
JP2827066B2 (ja) 数字列混在文書の文字認識の後処理方法
JPH08315069A (ja) 文字認識方法
Chaudhuri et al. An approach for processing mathematical expressions in printed document
JPH01171080A (ja) 誤り自動訂正文字認識装置

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20040615

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050301

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080513

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080711

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080826

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080829

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4181310

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110905

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120905

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120905

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130905

Year of fee payment: 5

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term