JP2011188465A - 原稿レイアウトの方向検出方法及び装置 - Google Patents

原稿レイアウトの方向検出方法及び装置 Download PDF

Info

Publication number
JP2011188465A
JP2011188465A JP2010101990A JP2010101990A JP2011188465A JP 2011188465 A JP2011188465 A JP 2011188465A JP 2010101990 A JP2010101990 A JP 2010101990A JP 2010101990 A JP2010101990 A JP 2010101990A JP 2011188465 A JP2011188465 A JP 2011188465A
Authority
JP
Japan
Prior art keywords
character
layout
feature value
language
attribute feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010101990A
Other languages
English (en)
Inventor
Toshiaki Mutsuo
敏明 六尾
Pingli Li
ピンリ リー
Honjii Chan
ホンジー チャン
Mengyou Yuan
モンヨウ ユエン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Founder International Beijing Co Ltd
Kyocera Document Solutions Inc
Original Assignee
Peking University
Founder International Beijing Co Ltd
Kyocera Mita Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University, Founder International Beijing Co Ltd, Kyocera Mita Corp filed Critical Peking University
Publication of JP2011188465A publication Critical patent/JP2011188465A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

【課題】複雑な原稿レイアウトに対し正確な検出結果を得られないという問題を解決できる原稿レイアウトの方向検出方法及び装置を提供する。
【解決手段】本発明の原稿レイアウトの方向検出方法は、原稿レイアウトに対し文字と図形との分離を行い、得られた文字領域を複数の文字ユニットに分け、複数の文字ユニットの言語類別属性を決定するステップと、言語類別属性に基づいて複数の文字ユニットの書字方向属性特徴値を取得し、それを対応する全体の統計量(global statistics)に取り入れるステップと、全体の統計量における各書字方向属性特徴値に基づいてそれぞれ各書字方向属性特徴値によるレイアウト方向及び対応する信頼度を取得するステップと、各書字方向属性特徴値によるレイアウト方向及び対応する信頼度に基づいて原稿レイアウトの方向及びその対応する全体の信頼度を決定するステップとを含む。
【選択図】図1

Description

本発明は、画像処理分野に関し、詳しくは原稿レイアウト方向の検出方法及び装置に関する。

デジタル文書交換が次第に現代通信の主流方式になっているにもかかわらず、契約、有価シートなどの、法律効力と認証の必要がある内容を有するものは、紙文書の形式で伝達、保存しなければならない。そのような紙文書の管理及び内容の伝達を行うために、走査によってデジタル化させる必要がある。日常の執務場所及び文書を集めて管理する機構において、大量の紙文書の走査に対する需要がきわめて大きい。
大量の紙文書を走査する際に、文書のすべてを正方向に配置しなければならない。事後、文書方向を補正する方法としては、一枚ずつ人為的にざっと見て画像を回転させる方法と、コンピュータープログラムによって自動的に文書画像の方向を認識して正方向に回転させる方法がある。事後文書方向を自動的に判定する方法としては、OCR(Optical Character Recognition, 光学的文字認識)技術によって文書画像中の文字を認識してレイアウト方向を判断する方法と、特徴認識アルゴリズムによってレイアウト方向を判断する方法がある。
国内外の関連特許及び文献にも、原稿レイアウトの検出技術が記載されている。1991年に、「高速レイアウト方向検出」という名称の特許文献1においてローマ字の上がり下がりと文字の書字方向との間の関係が提案された。1998年に、「複雑で、不明晰である無方向性の文書画像の言語認識」という名称の文章において、ベルの実験研究者によりアジア文字の書字方向に関連する特徴が提案された。これらの特許及び文献は、原稿レイアウトにおけるキャラクター又は句読点特徴と書字方向との関係を尋ねることに力を注いだ。
米国特許第5276742号明細書

しかしながら、実際には、原稿レイアウト走査画像は画像、文字、数字及び句読点を含む複雑な内容を混ぜてなることがよくある。また、国際交流の増加につれて、1枚の原稿レイアウトにフォント及びサイズの異なった多種言語の文字がさらに含まれている。
本発明の発明者は、従来技術において複雑な原稿レイアウトに対し正確な検出結果を得ることができないことを発見した。
本発明は、従来技術において複雑な原稿レイアウトに対し正確な検出結果を得られないという問題を解決できる原稿レイアウトの方向検出方法及び装置を提供することを目的とする。さらに、方向検出結果が有用かどうかを判断するための依拠を与える原稿レイアウトの方向検出結果の信頼度計算方法を提供する。

本発明において、原稿レイアウトに対し文字と図形との分離を行い、得られた文字領域を複数の文字ユニットに分け、複数の文字ユニットの言語類別属性を決定するステップと、言語類別属性に基づいて複数の文字ユニットの書字方向属性特徴値を取得し、それを対応する全体の統計量(global statistics)に取り入れるステップと、全体の統計量における各書字方向属性特徴値に基づいてそれぞれ各書字方向属性特徴値によるレイアウト方向及び対応する信頼度を取得するステップと、各書字方向属性特徴値によるレイアウト方向及び対応する信頼度に基づいて原稿レイアウトの方向及びその対応する全体の信頼度を決定するステップとを含む原稿レイアウトの方向検出方法が提供されている。
本発明において、さらに、原稿レイアウトに対し文字と図形との分離を行い、得られた文字領域を複数の文字ユニットに分け、複数の文字ユニットの言語類別属性を決定する分割モジュールと、言語類別属性に基づいて複数の文字ユニットの書字方向属性特徴値を取得し、それを対応する全体の統計量に取り入れる第1の算出モジュールと、全体の統計量における各書字方向属性特徴値に基づいてそれぞれ各書字方向属性特徴値によるレイアウト方向及び対応する信頼度を取得する第2の算出モジュールと、各書字方向属性特徴値によるレイアウト方向及び対応する信頼度に基づいて原稿レイアウトの方向及びその対応する全体の信頼度を決定する第3の算出モジュールとを含む原稿レイアウトの方向検出装置が提供されている。

本発明において、原稿レイアウトにおける文字と図形を分離させて得られた文字領域を文字ユニットに分け、さらに文字ユニットの言語類別属性に基づいて各書字方向属性特徴値によるレイアウト方向及び対応する信頼度を取得し、最後に各書字方向属性特徴値によるレイアウト方向及び対応する信頼度に基づいて原稿レイアウトの方向及び対応する全体の信頼度を決定することによって、自動的な原稿レイアウト方向の決定を実現するとともに、全体の信頼度を与えてユーザーにより判定結果が有用かどうかが判断されるため、従来技術において複雑な原稿レイアウトに対し正確な検出結果を得られないという問題を解消した。

本発明の一実施例に係る原稿レイアウトの方向検出方法を示すフローチャートである。 1枚の日本新聞の原稿レイアウトの画面効果(エフェクト)を示す図である。 文字ユニットが異なった方向にある原稿レイアウトを示す図である。 本発明の好適な実施例に係る原稿レイアウトを示す図である。 本発明の一実施例に係る原稿レイアウトの方向検出装置を示す図である。
以下、図面を参照して実施例を結び付けながら、本発明を詳述する。
図1は、本発明の一実施例に係る原稿レイアウトの方向検出方法を示すフローチャートである。本発明の一実施例に係る原稿レイアウトの方向検出方法は、
原稿レイアウトに対し文字と図形との分離を行い、得られた文字領域を複数の文字ユニットに分け、複数の文字ユニットの言語類別属性を決定するステップS102と、
言語類別属性に基づいて複数の文字ユニットの書字方向属性特徴値を取得し、それを対応する全体の統計量(global statistics)に取り入れるステップS104と、
全体の統計量における各書字方向属性特徴値に基づいてそれぞれ各書字方向属性特徴値によるレイアウト方向及び対応する信頼度を取得するステップS106と、
各書字方向属性特徴値によるレイアウト方向及び対応する信頼度に基づいて原稿レイアウトの方向及び対応する全体の信頼度を決定するステップS108とを含む。
本実施例において、原稿レイアウトにおける文字と図形を分離させて得られた文字領域を文字ユニットに分け、さらに文字ユニットの言語類別属性に基づいて各書字方向属性特徴値によるレイアウト方向及び対応する信頼度を取得し、最後に、各書字方向属性特徴値によるレイアウト方向及び対応する信頼度に基づいて原稿レイアウトの方向及びその対応する全体の信頼度を決定することによって、自動的な原稿レイアウト方向の決定を実現するとともに、全体の信頼度を与えることによって、ユーザーにより判定結果の有用かどうかが判断でき、従来技術における複雑な原稿レイアウトに対し正確な検出結果を得られないという問題を解消した。
上述した原稿レイアウトの方向検出方法において、原稿レイアウトに対し文字と図形の分離を行い、得られた文字領域を複数の文字ユニットに分けるステップは、原稿レイアウトの画像を2値化させた後、連結領域検出を行うことと、検出された連結領域に対し、それぞれ水平及び垂直方向において行検出を行うことと、1行に連結された連結領域の行内連結領域の数、行内連結領域のサイズ及び相対的位置関係、並びに行内連結領域の複雑度に基づいて連結領域が文字行であるか否かを判定することと、文字行と判定された連結領域を文字領域とし、文字行を分けて文字ユニットを得ることと、を含むのが好ましい。本実施例において、文字ユニットに分けることで、単語(比較的短い文字行、主にローマ字)またはセンテンス(比較的長い文字行、主にアジア文字)を得る。
本発明の実施例では、有効な連結領域を分析して文字行及び言語類別属性を決定する。有効な連結領域とは、走査方向において重ならない連結領域を指す。有効な連結領域のサイズ(走査法線方向に沿う寸法)及び走査方向に沿う中心位置の変化幅がいずれも30%を超えないことを満たす連結領域の行は文字行である。通常、行内連結領域の数が16個を超えるのはアジア言語の文字セグメントである。また、行内連結領域の数が16個を超えず、且つ複雑度が所定の要求を満たす連結領域の数が行内連結領域の合計の25%以上を占めているのはローマ字の行である。
例えば、書籍や、新聞、雑誌等は頁レイアウトの内容が豊かで、主に文字領域と図形領域に分けられ、文字領域はさらにローマ字言語文字領域とアジア言語文字領域に分けられることができる。また、アジア言語文字の書字方向は横書きと縦書きの2種類に分けられ、ローマ字言語文字の書字方向は横書きのみがある。
図2に、1枚の日本新聞の原稿レイアウトの画面効果(エフェクト)図を示す。図2に示すように、図形領域21と文字領域を含む。同一の頁レイアウトには、横書きの文字領域22と縦書きの文字領域23が同時に存在している。図3に、文字ユニットが異なった方向にある原稿レイアウトの模式図を示す。図3に示すように、同一の頁レイアウトにおいて文字ユニットが異なる方向に位置する場合があり、文字領域32における文字ユニットの局所的方向は上向きで、文字領域31における文字ユニットの局所的方向は左向きである。このような場合には、後の網羅的分析ステップにおいて、ぞれぞれの文字数の分布比率を結合して最終的なレイアウト方向の判定結果を出す。図3に示す実施例において、2種類の書字方向があるが、すべてのキャラクタの書字方向特徴値を全体的に統計すると、上向きである書字方向特徴値が優位を占めたため、最終のレイアウト方向は上向きと判定される。
よって、図形と文字の混合、多言語(アジア、ヨーロッパ)混合のある原稿レイアウトの方向判定は各文字領域を分析する必要があるため、判定結果の正確度を向上する。
上述した原稿レイアウトの方向検出方法において、原稿レイアウトに対し文字と図形との分離を行い、得られた文字領域を複数の文字ユニットに分け、複数の文字ユニットの言語類別属性を決定するステップは、文字ユニットにおける文字連結領域の内部連結領域のサイズ、形態及び相対的位置関係に基づいてその言語属性特徴値を決定することと、言語属性特徴値を、予めデータベースに記憶されている対応する参考値と比較して文字ユニットの言語類別属性を決定することとを含むのが好ましい。
上述した実施例において、連結領域の複雑度の程度により当該連結領域がローマ字であるか否かを決定する。連結領域の複雑度は、主に、走査方向の法線方向に沿う負の内部連結領域の数及び相対的位置関係で定義される。
上記原稿レイアウトの方向検出方法において、全体の統計量における各書字方向属性特徴値に基づいてそれぞれ各書字方向属性特徴値によるレイアウト方向及び対応する信頼度を取得するステップは、各書字方向属性特徴値を、予めデータベースに記憶されている参考値と比較して各書字方向属性特徴値によるレイアウト方向及び対応する信頼度を決定することを含むのが好ましい。
本実施例において、原稿レイアウト方向を判定するための各特徴値についてそれぞれ統計を行い、原稿レイアウト方向及び該特徴値により判定されたレイアウト方向の信頼度を取得し、信頼度は各特徴の強さと弱さによって決められる。例えば、四つの象限における句読点の分布数量特徴により判定される原稿レイアウト方向の信頼度は、四つの象限における句読点の最大数量と句読点全体に占める比例により計算される。単一の象限内における句読点の最大値が大きければ大きいほど、該最大値の句読点全体に占める比例は高くなり、句読点により判定されたレイアウト方向の信頼度も高くなるが、そうでない場合、信頼度が低くなる。
最終の原稿レイアウト方向と信頼度は、異なる特徴値に基づく幾つかの判定結果を網羅的に分析して得られるものである。幾つかのレイアウト方向判定結果における信頼度が最大の方向を最終のレイアウト方向とすることができる。最終の全体信頼度は、特徴信頼度における最大値を基に、信頼度を強める或いは弱めて得られる。信頼度2番目の方向と信頼度最大の方向とが一致すれば、全体信頼度は最大特徴方向信頼度からさらに高まり、そうでない場合、最大特徴方向信頼度が下げられ、最終の全体信頼度が得られる。
図4には、本発明の好適な実施例に係る原稿レイアウトの模式図を示す。図4に示すように、文字行を検出し、単語、センテンスを組み合わせた後、幾つかの候補文字セグメントが得られる。候補文字セグメントにおける各キャラクタの言語特徴分析を経て、文字セグメントがローマ単語であるか否かを判別することができる。ローマ単語であると判別された文字セグメントの中の各キャラクタに対し、ローマ字の書字方向特徴(ロー特徴1や、ロー特徴2等)の抽出を行い、ローマ文字でないと判別された文字セグメントの中の各キャラクタに対し、アジア文字の書字方向特徴(ア特徴1や、ア特徴2等)の抽出を行う。抽出された特徴値は、それぞれアジア文字の書字方向特徴の統計量(ア統計1や、ア統計2等)及びローマ字の書字方向特徴の統計量(ロー統計1や、ロー統計2等)に加えられる。アジア言語とローマ言語の各種の特徴統計値を分析することで、各種の統計値に対応するレイアウト方向判定結果及び信頼度(ア統計1 方向、ア統計1 信頼度;ア統計2 方向、ア統計2 信頼度;ロー統計1 方向、ロー統計1 信頼度;ロー統計2 方向、ロー統計2 信頼度等)を取得する。最後に、すべての特徴方向と信頼度を総合的に対比・分析してレイアウトの全体的な方向と信頼度を得る。
本発明の実施例において、最高の信頼度を有する特徴方向をレイアウト方向とする。2番目の信頼度の特徴方向が最高の信頼度の特徴方向と一致すれば、頁レイアウトの信頼度は最高の信頼度に基づいて上がり(例えば、20%)、そうでない場合、信頼度は下がる(例えば、20%)。
図4に示す実施例では、「ア統計1 信頼度」、「ア統計2 信頼度」、「ロー統計1 信頼度」、「ロー統計2 信頼度」のうち「ア統計1 信頼度」が最大のため、レイアウト方向は「ア統計1 方向」である。「ロー統計2 信頼度」が2番目の信頼度であると共に、「ロー統計2 方向」と「ア統計1 方向」とが一致している場合には、レイアウト方向の信頼度は「ア統計1 信頼度」×120%となる。
上述した原稿レイアウトの方向検出方法において、文字ユニットは少なくともローマ単語、アジア文字セグメント及び句読点のいずれか1つを含むことが好ましい。
上述した原稿レイアウトの方向検出方法において、言語類別は少なくともアジア言語類別及びローマ字言語類別のいずれか1つを含むことが好ましい。
上述した原稿レイアウトの方向検出方法において、書字方向特徴は少なくともアジア文字の左右払い特徴、ローマ字言語文字の開口方向特徴と上がり下がり特徴、及び句読点の文字に対する位置の特徴のいずれか1つを含むことが好ましい。
図5には、本発明の一実施例に係る原稿レイアウトの方向検出装置の構成ブロック図を示す。本発明の一実施例に係る原稿レイアウトの方向検出装置は、原稿レイアウトに対し文字と図形との分離を行い、得られた文字領域を複数の文字ユニットに分け、複数の文字ユニットの言語類別属性を決定する分割モジュール10と、言語類別属性に基づいて複数の文字ユニットの書字方向属性特徴値を取得し、それを対応する全体の統計量(global statistics)に取り入れる第1の算出モジュール20と、全体の統計量における各書字方向属性特徴値に基づいてそれぞれ各書字方向属性特徴値によるレイアウト方向及び対応する信頼度を取得する第2の算出モジュール30と、各書字方向属性特徴値によるレイアウト方向及び対応する信頼度に基づいて原稿レイアウトの方向及び対応する全体の信頼度を決定する第3の算出モジュール40とを含む。
本実施例において、原稿レイアウトにおける文字と図形を分離させて得られた文字領域を文字ユニットに分け、さらに文字ユニットの言語類別属性に基づいて各書字方向属性特徴値によるレイアウト方向及び対応する信頼度を取得し、最後に各書字方向属性特徴値によるレイアウト方向及び対応する信頼度に基づいて原稿レイアウトの方向及びその対応する全体の信頼度を決定することによって、自動的な原稿レイアウト方向の決定を実現するとともに、全体の信頼度を与えてユーザーにより判定結果が有用かどうかが判断されるため、従来技術における複雑な原稿レイアウトに対し正確な検出結果を得られないという問題を解消した。
上述した原稿レイアウトの方向検出装置において、分割モジュールは、原稿レイアウトの画像を2値化させた後、連結領域検出を行う連結領域検出ユニットと、検出された連結領域に対し、それぞれ水平及び垂直方向において行検出を行う行検出ユニットと、1行に連結された連結領域の行内連結領域の数、行内連結領域のサイズ及び相対的位置関係、並びに行内連結領域の複雑度に基づいて連結領域が文字行であるか否かを判定する文字行判定ユニットと、文字行と判定された連結領域を文字領域とし、文字行を分けて文字ユニットを得る分割ユニットと、を含むのが好ましい。本実施例において、文字ユニットに分けることで、単語(比較的短い文字行、主にローマ字)またはセンテンス(比較的長い文字行、主にアジア文字)を得る。
例えば、書籍や、新聞、雑誌等は頁レイアウトの内容が豊かで、主に文字領域と図形領域に分けられ、文字領域がさらにローマ字言語文字領域とアジア言語文字領域に分けられることができる。また、アジア言語文字の書字方向は横書きと縦書きの2種類に分けられ、ローマ字言語文字の書字方向は横書きのみがある。
上述した原稿レイアウトの方向検出装置において、第1の算出モジュールは、文字ユニットにおける文字連結領域の内部連結領域のサイズ、形態及び相対的位置関係に基づいてその言語属性特徴値を決定する属性特徴値ユニットと、言語属性特徴値を、予めデータベースに記憶されている対応する参考値と比較して文字ユニットの言語類別属性を決定する第1の比較ユニットとを含むのが好ましい。言語属性特徴値は各文字ユニットがどの種類の言語類別に属するか判定するための特徴である。
上記原稿レイアウトの方向検出装置において、第2の算出モジュールは、各書字方向属性特徴値を、予めデータベースに記憶されている参考値と比較して各書字方向属性特徴値によるレイアウト方向及び対応する信頼度を決定する第2の比較ユニットを含むのが好ましい。
上述した原稿レイアウトの方向検出装置において、文字ユニットは少なくともローマ単語、アジア文字セグメント及び句読点のいずれか1つを含むことが好ましい。
上述した原稿レイアウトの方向検出装置において、言語類別は少なくともアジア言語類別及びローマ字言語類別のいずれか1つを含むことが好ましい。
上述した原稿レイアウトの方向検出装置において、書字方向特徴は少なくともアジア文字の左右払い特徴、ローマ字言語文字の開口方向特徴と上がり下がり特徴、及び句読点の文字に対する位置特徴のいずれか1つを含むことが好ましい。
なお、上述した本発明の各モジュールや各ステップは、汎用の計算装置で実現することができ、単一の計算装置に集積されてもよく、複数の計算装置からなるネットワークに配置されてもよい。また、各モジュールや各ステップは、計算装置が実行可能なプログラムコードで実現することができる。従って、それらを記憶装置に記憶して計算装置に実行させてもよく、それぞれ各集積回路モジュールとして作成してもよく、それらのうちの複数のモジュール又はステップを単一の集積回路モジュールとして作成して実現してもよい。このように、本発明は、如何なる特定のハードウェアとソフトウェアとの組合せにも限定されない。
以上は、本発明の好適な実施例に過ぎず、本発明を限定するものではない。本発明は、様々な変更や変化が可能である。本発明の主旨と原則を離脱しない範囲で、如何なる変更、同等代替、改良なども本発明の保護範囲内に含まれる。
10 分割モジュール
20 第1の算出モジュール
30 第2の算出モジュール
40 第3の算出モジュール

Claims (14)

  1. 原稿レイアウトに対し文字と図形との分離を行い、得られた文字領域を複数の文字ユニットに分け、前記複数の文字ユニットの言語類別属性を決定するステップと、
    前記言語類別属性に基づいて前記複数の文字ユニットの書字方向属性特徴値を取得し、それを対応する全体の統計量に取り入れるステップと、
    前記全体の統計量における各書字方向属性特徴値に基づいてそれぞれ各書字方向属性特徴値によるレイアウト方向及び対応する信頼度を取得するステップと、
    前記各書字方向属性特徴値によるレイアウト方向及び対応する信頼度に基づいて前記原稿レイアウトの方向及び対応する全体の信頼度を決定するステップとを、含むことを特徴とする原稿レイアウトの方向検出方法。
  2. 請求項1において、
    原稿レイアウトに対し文字と図形との分離を行い、得られた文字領域を複数の文字ユニットに分けるステップは、
    原稿レイアウトの画像を2値化させた後、連結領域検出を行うことと、
    検出された連結領域に対し、それぞれ水平及び垂直方向に行検出を行うことと、
    1行に連結された前記連結領域の行内連結領域の数、行内連結領域のサイズ及び相対的位置関係、並びに行内連結領域の複雑度に基づいて前記連結領域が文字行であるか否かを判定することと、
    文字行と判定された前記連結領域を文字領域とし、前記文字行を分けて文字ユニットを得ることと、
    を含むことを特徴とする原稿レイアウトの方向検出方法。
  3. 請求項2において、
    原稿レイアウトに対し文字と図形との分離を行い、得られた文字領域を複数の文字ユニットに分け、前記複数の文字ユニットの言語類別属性を決定するステップは、
    前記文字ユニットの文字連結領域の内部連結領域のサイズ、形態及び相対的位置関係に基づいてその言語属性特徴値を決定することと、
    前記言語属性特徴値を、予めデータベースに記憶されている対応する参考値と比較して、前記文字ユニットの言語類別属性を決定することと、
    をさらに含むことを特徴とする原稿レイアウトの方向検出方法。
  4. 請求項1において、
    前記全体の統計量における各書字方向属性特徴値に基づいてそれぞれ前記各書字方向属性特徴値によるレイアウト方向及び対応する信頼度を取得するステップは、
    前記各書字方向属性特徴値を、予めデータベースに記憶されている参考値と比較して、前記各書字方向属性特徴値によるレイアウト方向及び対応する信頼度を決定することを含むことを特徴とする原稿レイアウトの方向検出方法。
  5. 請求項1において、
    前記文字ユニットは、少なくともローマ単語、アジア文字セグメント及び句読点のいずれか1つを含むことを特徴とする原稿レイアウトの方向検出方法。
  6. 請求項1において、
    前記言語類別は、少なくともアジア言語類別及びローマ字言語類別のいずれか1つを含むことを特徴とする原稿レイアウトの方向検出方法。
  7. 請求項4において、
    前記書字方向特徴は、少なくともアジア文字の左右払い特徴、ローマ字言語文字の開口方向特徴と上がり下がり特徴、及び句読点の文字に対する位置特徴のいずれか1つを含むことを特徴とする原稿レイアウトの方向検出方法。
  8. 原稿レイアウトに対し文字と図形との分離を行い、得られた文字領域を複数の文字ユニットに分け、前記複数の文字ユニットの言語類別属性を決定する分割モジュールと、
    前記言語類別属性に基づいて前記複数の文字ユニットの書字方向属性特徴値を取得し、それを対応する全体の統計量に取り入れる第1の算出モジュールと、
    前記全体の統計量における各書字方向属性特徴値に基づいてそれぞれ各書字方向属性特徴値によるレイアウト方向及び対応する信頼度を取得する第2の算出モジュールと、
    前記各書字方向属性特徴値によるレイアウト方向及び対応する信頼度に基づいて前記原稿レイアウトの方向及びその対応する全体の信頼度を決定する第3の算出モジュールを、含むことを特徴とする原稿レイアウトの方向検出装置。
  9. 請求項8において、
    前記分割モジュールは、
    原稿レイアウトの画像を2値化させた後、連結領域検出を行う連結領域検出ユニットと、
    検出された連結領域に対し、それぞれ水平及び垂直方向に行検出を行う行検出ユニットと、
    1行に連結された前記連結領域の行内連結領域の数、行内連結領域のサイズ及び相対的位置関係、並びに行内連結領域の複雑度に基づいて前記連結領域が文字行であるか否かを判定する文字行判定ユニットと、
    文字行と判定された前記連結領域を文字領域とし、前記文字行を分けて文字ユニットを得る分割ユニットと、
    を含むことを特徴とする原稿レイアウトの方向検出装置。
  10. 請求項8において、
    前記第1の算出モジュールは、
    前記文字ユニットの文字連結領域の内部連結領域のサイズ、形態及び相対的位置関係に基づいてその言語属性特徴値を決定する属性特徴値ユニットと、
    前記言語属性特徴値を、予めデータベースに記憶されている対応する参考値と比較して、前記文字ユニットの言語類別属性を決定する第1の比較ユニットと、
    をさらに含むことを特徴とする原稿レイアウトの方向検出装置。
  11. 請求項8において、
    前記第2の算出モジュールは、
    前記各書字方向属性特徴値を、予めデータベースに記憶されている参考値と比較して、前記各書字方向属性特徴値によるレイアウト方向及び対応する信頼度を決定する第2の比較ユニットを含むことを特徴とする原稿レイアウトの方向検出装置。
  12. 請求項9において、
    前記文字ユニットは、少なくともローマ単語、アジア文字セグメント及び句読点のいずれか1つを含むことを特徴とする原稿レイアウトの方向検出装置。
  13. 請求項8において、
    前記言語類別は、少なくともアジア言語類別及びローマ字言語類別のいずれか1つを含むことを特徴とする原稿レイアウトの方向検出装置。
  14. 請求項11において、
    前記書字方向特徴は、少なくとも、アジア文字の左右払い特徴、ローマ字言語文字の開口方向特徴と上がり下がり特徴、及び句読点の文字に対する位置特徴のいずれか1つを含むことを特徴とする原稿レイアウトの方向検出装置。
JP2010101990A 2010-03-05 2010-04-27 原稿レイアウトの方向検出方法及び装置 Pending JP2011188465A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201010119229.9 2010-03-05
CN 201010119229 CN102194117B (zh) 2010-03-05 2010-03-05 文稿页面方向检测方法和装置

Publications (1)

Publication Number Publication Date
JP2011188465A true JP2011188465A (ja) 2011-09-22

Family

ID=44602159

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010101990A Pending JP2011188465A (ja) 2010-03-05 2010-04-27 原稿レイアウトの方向検出方法及び装置

Country Status (2)

Country Link
JP (1) JP2011188465A (ja)
CN (1) CN102194117B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015524120A (ja) * 2012-06-13 2015-08-20 カタール・ファウンデーションQatar Foundation 電子リーディング装置及び方法

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102831421B (zh) * 2012-08-29 2015-09-23 华东师范大学 一种基于标点符号的文档上下方向检测方法
CN103870799A (zh) * 2012-12-17 2014-06-18 北京千橡网景科技发展有限公司 字符方向判断方法及装置
CN105574530B (zh) * 2014-10-08 2019-11-22 富士通株式会社 提取文档中的文本行的方法和装置
CN105989341A (zh) * 2015-02-17 2016-10-05 富士通株式会社 文字识别方法和装置
CN106296629B (zh) * 2015-05-18 2019-01-22 富士通株式会社 图像处理装置和方法
CN105718448B (zh) * 2016-01-13 2019-03-19 北京新美互通科技有限公司 一种对输入字符进行自动翻译的方法和装置
CN107845094B (zh) * 2017-11-20 2020-06-19 北京小米移动软件有限公司 图像文字检测方法、装置及计算机可读存储介质
CN111476239A (zh) * 2020-05-28 2020-07-31 北京易真学思教育科技有限公司 图像方向的确定方法、装置和电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11338974A (ja) * 1998-05-28 1999-12-10 Canon Inc 文書処理方法及び装置、記憶媒体
JP2004272798A (ja) * 2003-03-11 2004-09-30 Pfu Ltd 画像読み取り装置
JP2006031546A (ja) * 2004-07-20 2006-02-02 Ricoh Co Ltd 文字方向識別装置、文書処理装置及びプログラム並びに記憶媒体
JP2007122500A (ja) * 2005-10-28 2007-05-17 Ricoh Co Ltd 文字認識装置、文字認識方法及び文字データ
JP2011008549A (ja) * 2009-06-25 2011-01-13 Sharp Corp 画像処理装置、画像読取装置、複合機、画像処理方法、プログラム、記録媒体

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5852448A (en) * 1996-09-20 1998-12-22 Dynalab Inc. Stroke-based font generation independent of resolution
CN101013417B (zh) * 2007-02-12 2010-05-19 北京大学 一种改变排版数据换行属性的划版辅助装置及方法
JP2008259172A (ja) * 2007-03-15 2008-10-23 Ricoh Co Ltd 画像処理装置、画像処理方法およびプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11338974A (ja) * 1998-05-28 1999-12-10 Canon Inc 文書処理方法及び装置、記憶媒体
JP2004272798A (ja) * 2003-03-11 2004-09-30 Pfu Ltd 画像読み取り装置
JP2006031546A (ja) * 2004-07-20 2006-02-02 Ricoh Co Ltd 文字方向識別装置、文書処理装置及びプログラム並びに記憶媒体
JP2007122500A (ja) * 2005-10-28 2007-05-17 Ricoh Co Ltd 文字認識装置、文字認識方法及び文字データ
JP2011008549A (ja) * 2009-06-25 2011-01-13 Sharp Corp 画像処理装置、画像読取装置、複合機、画像処理方法、プログラム、記録媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015524120A (ja) * 2012-06-13 2015-08-20 カタール・ファウンデーションQatar Foundation 電子リーディング装置及び方法

Also Published As

Publication number Publication date
CN102194117B (zh) 2013-03-27
CN102194117A (zh) 2011-09-21

Similar Documents

Publication Publication Date Title
JP2011188465A (ja) 原稿レイアウトの方向検出方法及び装置
Shafait et al. Table detection in heterogeneous documents
US20150095769A1 (en) Layout Analysis Method And System
CA2656425A1 (en) Recognizing text in images
US10142499B2 (en) Document distribution system, document distribution apparatus, information processing method, and storage medium
JP2012500428A (ja) 印刷媒体ページの記事へのセグメント化
CN109598185B (zh) 图像识别翻译方法、装置、设备及可读存储介质
US10503993B2 (en) Image processing apparatus
CN111340020B (zh) 一种公式识别方法、装置、设备及存储介质
WO2015031702A1 (en) Multiple hypothesis testing for word detection
JP2010055142A (ja) 文書処理装置およびプログラム
US7929772B2 (en) Method for generating typographical line
JP5412903B2 (ja) 文書画像処理装置、文書画像処理方法および文書画像処理プログラム
JP2011070558A (ja) 文書画像処理装置、文書画像処理方法および文書画像処理プログラム
CN102682457A (zh) 一种对平面媒体图像进行适应屏幕阅读的重排方法
CN107798355B (zh) 一种基于文档图像版式自动分析与判断的方法
US9110926B1 (en) Skew detection for vertical text
US9811726B2 (en) Chinese, Japanese, or Korean language detection
Tikader et al. Histogram of oriented gradients for English-Bengali script recognition
Kleber et al. Robust skew estimation of handwritten and printed documents based on grayvalue images
JP5857634B2 (ja) 単語間空白検出装置、単語間空白検出方法及び単語間空白検出用コンピュータプログラム
JP5414631B2 (ja) 文字列探索方法、文字列探索装置、記録媒体
US20210042555A1 (en) Information Processing Apparatus and Table Recognition Method
Liu et al. An improved algorithm for Identifying Mathematical formulas in the images of PDF documents
Soheili et al. Sub-word image clustering in Farsi printed books

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120321

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130731

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130904

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130926

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20140612