JP7132654B2 - レイアウト解析方法、読取り支援デバイス、回路および媒体 - Google Patents
レイアウト解析方法、読取り支援デバイス、回路および媒体 Download PDFInfo
- Publication number
- JP7132654B2 JP7132654B2 JP2021113960A JP2021113960A JP7132654B2 JP 7132654 B2 JP7132654 B2 JP 7132654B2 JP 2021113960 A JP2021113960 A JP 2021113960A JP 2021113960 A JP2021113960 A JP 2021113960A JP 7132654 B2 JP7132654 B2 JP 7132654B2
- Authority
- JP
- Japan
- Prior art keywords
- layout
- segmented
- connected regions
- text
- zones
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/418—Document matching, e.g. of document images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Character Input (AREA)
Description
本開示のいくつかの実施形態によれば、読取り支援デバイスが提供され、上に記載したチップ回路と、画像を取り込むように構成された画像センサとを含む。
図面は、実施形態を例示的に示し明細書の一部を形成し、そして明細書の記述とともに実施形態の例示的な実装形態を説明するために使用される。示した実施形態は、単に例示の目的のためであり特許請求の範囲の範囲を限定しない。図面全体を通して、同一の参照符号は、類似するが必ずしも同一である必要がない要素を表示する。
本開示の例示的な方法が、テキストの原画像自体よりはむしろテキストの座標情報に主に基づいてレイアウト解析を実行するために使用されるので、このステップでは、画像内の複数のテキスト行の座標情報が、後の処理のために取得される。画像は、画像センサによって取り込まれた電子画像データであってもよい。いくつかの実施形態によれば、画像センサは、例えば、図1に示したアプリケーションシナリオ100では、ユーザのウェアラブルデバイス、メガネ、または他の物品に配置されることがある。
図7は、例示的な実施形態にしたがって複数の接続された領域710を形成するために図5の長方形ブロック510の幅を調節することによって得られたレイアウトモデル700を示す模式図である。得られた複数の接続された領域710は、テキスト行の複数の段落に対応する。これゆえ、ステップ610の操作は、段落分割と呼ばれることがある。
図8は、ステップ620を実施するための例のプロセスを示すフローチャートである。いくつかの実施形態によれば、複数の接続された領域の空間レイアウトを解析するステップは、レイアウトモデル内の複数の接続された領域の向きを選択的に補正するまたは補正しないステップ(ステップ810)と、それぞれの選択され接続された領域を得るために、行方向においてレイアウトモデルの2つの辺のうちのいずれか一方に直接隣接するレイアウトモデル内の接続された領域を選択的に除去するまたは除去しないステップ(ステップ820)と、セグメント化されたゾーンのセットを得るためおよび互いに対するセグメント化されたゾーンの順番を求めるために、それぞれの選択され接続された領域にプロジェクションセグメンテーションを実行するステップ(ステップ830)とを含む。
いくつかの実施形態によれば、レイアウトモデル内の複数の接続された領域の向きを選択的に補正するまたは補正しないステップは、複数の接続された領域がレイアウトモデルの行方向および列方向のうちのいずれか一方に対して傾いた状態であるかどうかを決定するステップと、複数の接続された領域が傾いた状態であることが決定される場合に、複数の接続された領域が傾いた状態でないように補正角だけ複数の接続された領域を回転するステップとを含む。傾いた状態を補正するステップの操作は、図1に示したアプリケーションシナリオ100などのアプリケーションにとって特に有利である。これらのアプリケーションでは、読者は、本または他の読み物を通常持ち、そして画像センサによって取り込まれた画像内のテキスト領域はしばしば傾けられる。複数の接続された領域が傾いた状態でないように補正角だけ複数の接続された領域を回転させるステップは、レイアウト解析の精度を大きく向上させることができる。このことは、従来のレイアウト解析技術を超える利点を提供する。従来のレイアウト解析技術では、解析した対象は、スキャナによるスキャニングを介して得られた一般に平らな画像であり、ここではテキスト領域は傾いていない。これゆえ、このような従来技術は、読取り支援のシナリオに適用可能ではないことがある。
図8に戻って参照して、ステップ820では、行方向においてレイアウトモデルの2辺のうちのいずれか一方に直接隣接するレイアウトモデル内の接続された領域が、それぞれの選択され接続された領域を得るために選択的に除去されるまたは除去されない。
本明細書において使用するように、行方向のゾーンの有効サイズは、行方向の接続された領域の最小の周囲を囲まれた長方形のサイズなどの、行方向の接続された領域内のサイズを呼ぶ。いくつかの実施形態では、行方向のゾーンの有効サイズは、行方向のゾーン内のすべての接続された領域のサイズの平均であってもよい。
いくつかの実施形態によれば、レイアウト構造に基づいて互いに対するテキスト行の順番を決定するステップは、セグメント化されたゾーンのセット内の各々のセグメント化されたゾーンに対して選択され接続された領域の各々の相対的な位置にしたがって、選択され接続された領域の各々と各々のセグメント化されたゾーンとの間の対応を決定するステップであって、各々のセグメント化されたゾーンが選択され接続された領域の対応するセットを含む、対応を決定するステップと、選択され接続された領域の対応するセット内の選択され接続された領域同士の間の位置的な関係にしたがって選択され接続された領域の対応するセット内で選択され接続された領域を配置するステップと、選択され接続された領域内の長方形ブロック同士の間の位置的な関係にしたがって各々の選択され接続された領域内で長方形ブロックを配置するステップと、複数のテキスト行と複数の長方形ブロックとの間の対応にしたがって各々の選択され接続された領域内の長方形ブロックと複数のテキスト行とをマッチングさせるステップとを含むことができる。
いくつかの実施形態によれば、各々の選択され接続された領域内の長方形ブロックを配置するステップは、複数のテキスト行が水平レイアウトタイプのものであることが決定される場合には、上から下へ各々の選択され接続された領域内の長方形ブロックを配置するステップと、複数のテキスト行が垂直レイアウトタイプのものであることが決定される場合には、右から左へ各々の選択され接続された領域内の長方形ブロックを配置するステップとを含む。
いくつかの実施形態によれば、レイアウトモデルに基づいてテキスト行のレイアウト構造を解析するステップはまた、主レイアウトタイプのテキスト行のレイアウト構造を解析するステップも含むことができる。いくつかの実施形態によれば、テキスト行のレイアウト構造がレイアウトモデルに基づいて解析される前に、画像内の重要でないテキストに対応する長方形ブロックが、選択的に破棄されることがある。
110 スマートグラス
112 撮影範囲
114 テキスト行
116 読み物
200 方法
300 レイアウト解析方法
400 画像
410 テキスト行
500 レイアウトモデル
510 長方形ブロック
700 レイアウトモデル
710 接続された領域
1210 波形
1220 連結線
1230 垂直分割線
2400 読取り支援デバイス
2410 画像センサ
2420 チップ回路
2430 サウンド出力デバイス
2500 コンピューティングデバイス
2502 バス
2504 プロセッサ
2506 入力デバイス
2508 出力デバイス
2510 記憶デバイス
2512 通信デバイス
2514 ワーキングメモリ
2516 オペレーティングシステム
2518 アプリケーション
Claims (19)
- コンピュータで実行されるレイアウト解析方法であって、
画像内の複数のテキスト行の座標情報を取得するステップと、
前記座標情報にしたがって前記画像のレイアウトモデルを作り出すステップであって、前記レイアウトモデルはテキスト分布を模擬的に再現するデータ値で埋められたデータ要素を有するデータ構造であるステップと、
前記画像の代わりに前記レイアウトモデルに基づいて前記テキスト行のレイアウト構造を解析するステップと、
前記レイアウト構造に基づいて互いに対する前記テキスト行の順番を決定するステップと、
を含む、レイアウト解析方法において、
前記座標情報にしたがって前記画像のレイアウトモデルを作り出すステップは、
前記レイアウトモデルを得るためにデータ構造内の前記座標情報に対応するデータ要素をデータ値で埋めるステップであって、前記データ値で埋められた前記データ要素が複数の長方形ブロックを形成し、前記複数の長方形ブロックが前記複数のテキスト行内のそれぞれのテキスト行に対応する、埋めるステップ、
を含む、レイアウト解析方法。 - 前記レイアウトモデルに基づいて前記テキスト行の前記レイアウト構造を前記解析するステップは、
前記複数の長方形ブロックが互いに別々の複数の接続された領域へと併合されるように、前記複数の長方形ブロックの幅を選択的に調節するステップと、
前記テキスト行のレイアウト構造を得るために前記複数の接続された領域の空間レイアウトを解析するステップと、
を含む、請求項1に記載のレイアウト解析方法。 - 前記複数の長方形ブロックの前記幅を前記選択的に調節するステップが、
各々の長方形ブロックに対して、
長方形ブロックの幅が前記複数の長方形ブロックの代表する幅以下であることに応じて第1の大きさだけ前記長方形ブロックの前記幅を大きくするステップと、
前記長方形ブロックの前記幅が前記代表する幅よりも大きく前記代表する幅の第1の倍数以下であることに応じて第2の大きさだけ前記長方形ブロックの前記幅を大きくするステップと、
前記長方形ブロックの前記幅が前記代表する幅の前記第1の倍数よりも大きく前記代表する幅の第2の倍数以下であることに応じて前記長方形ブロックの前記幅を調節しないステップと、
前記長方形ブロックの前記幅が前記代表する幅の前記第2の倍数よりも大きいことに応じて第3の大きさだけ前記長方形ブロックの前記幅を小さくするステップと、
を含む、請求項2に記載のレイアウト解析方法。 - 前記複数の接続された領域の前記空間レイアウトを前記解析するステップが、
前記レイアウトモデル内の前記複数の接続された領域の向きを選択的に補正するまたは補正しないステップと、
それぞれの選択され接続された領域を得るために、行方向において前記レイアウトモデルの2つの辺のうちのいずれか一方に直接隣接する前記レイアウトモデル内の接続された領域を選択的に除去するまたは除去しないステップと、
セグメント化されたゾーンのセットを得るためおよび互いに対する前記セグメント化されたゾーンの順番を求めるために、前記それぞれの選択され接続された領域に対してプロジェクションセグメンテーションを実行するステップと、
を含む、請求項2に記載のレイアウト解析方法。 - 前記レイアウトモデル内の前記複数の接続された領域の向きを前記選択的に補正するまたは補正しないステップは、
前記複数の接続された領域が前記レイアウトモデルの前記行方向および列方向のうちのいずれか一方に対して傾いた状態であるかどうかを決定するステップと、
前記複数の接続された領域が前記傾いた状態であることを決定するステップに応じて、前記複数の接続された領域が前記傾いた状態でないように補正角だけ前記複数の接続された領域を回転するステップと、
を含む、請求項4に記載のレイアウト解析方法。 - 前記行方向において前記レイアウトモデルの2つの辺のうちのいずれか一方に直接隣接する前記レイアウトモデル内の接続された領域を前記選択的に除去するまたは除去しないステップは、
前記複数の接続された領域が前記傾いた状態にないことに応じて前記レイアウトモデルに対して垂直プロジェクションセグメンテーションを実行するステップと、
前記垂直プロジェクションセグメンテーションの結果に依存して、前記複数の接続された領域から、前記行方向において前記レイアウトモデルの2つの辺うちのいずれか一方に直接隣接する接続された領域を選択的に除去するまたは除去しないステップと、
を含む、請求項5に記載のレイアウト解析方法。 - 前記複数の接続された領域から、前記行方向において前記レイアウトモデルの2つの辺のうちのいずれか一方に直接隣接する接続された領域を前記選択的に除去するまたは除去しないステップは、
少なくとも2つのゾーンが前記垂直プロジェクションセグメンテーションを介して前記レイアウトモデルから得られていないことを決定することに応じて前記除去を実行しないステップと、
少なくとも2つのゾーンが前記垂直プロジェクションセグメンテーションを介して前記レイアウトモデルから得られていることを決定することに応じて、前記行方向の前記少なくとも2つのゾーンの対応する有効サイズを決定するステップと、前記行方向において前記レイアウトモデルの2つの辺のうちのいずれか一方に直接隣接する前記少なくとも2つのゾーンの各々の横ゾーンに下記の操作を実行するステップであって、
2つのゾーンがセグメンテーションを介して前記レイアウトモデルから得られていることおよび前記行方向の前記横ゾーンの有効サイズが前記対応する有効サイズ内の最大サイズの第1のしきい値パーセントよりも小さくそして前記行方向の前記2つのゾーンのうちの他方の有効サイズの第2のしきい値パーセントよりも小さいことに応じて前記横ゾーン内の接続された領域を除去するステップと、
2つよりも多くのゾーンがセグメンテーションを介して前記レイアウトモデルから得られていることおよび前記行方向の前記横ゾーンの前記有効サイズが前記対応する有効サイズ内の前記最大サイズの第3のしきい値パーセントよりも小さくそして前記行方向において前記横ゾーンに直接隣接する前記ゾーン内のゾーンの有効サイズの第4のしきい値パーセントよりも小さいことに応じて前記横ゾーン内の接続された領域を除去するステップと、
を含む、請求項6に記載のレイアウト解析方法。 - 前記それぞれの選択され接続された領域に対してプロジェクションセグメンテーションを前記実行するステップが、
セグメンテーションを介して前記レイアウトモデルから前記セグメント化されたゾーンのセットを得るために、前記それぞれの選択され接続された領域に対して水平プロジェクションセグメンテーションおよび垂直プロジェクションセグメンテーションを再帰的に交互に実行するステップと、
読取り順則に基づいて互いに対する前記セグメント化されたゾーンのセット内のそれぞれのセグメント化されたゾーンの順番を決定するステップと、
を含む、請求項4に記載のレイアウト解析方法。 - 前記それぞれの選択され接続された領域に対して水平プロジェクションセグメンテーションおよび垂直プロジェクションセグメンテーションを前記再帰的に交互に実行するステップは、
周期的に操作を実行するステップであって、前記操作は、
各々のセグメント化されたゾーンが水平プロジェクションセグメンテーションおよび垂直プロジェクションセグメンテーションを介してセグメント化できなくなるまで、
水平プロジェクションセグメンテーションを介して得られた各々の水平セグメント化されたゾーンに垂直プロジェクションセグメンテーションを実行するステップと、
垂直プロジェクションセグメンテーションを介して得られた各々の垂直セグメント化されたゾーンに水平プロジェクションセグメンテーションを実行するステップと
を含む、周期的に操作を実行するステップ
を含み、
水平プロジェクションセグメンテーションおよび垂直プロジェクションセグメンテーションを介してセグメント化できなくなった前記セグメント化されたゾーンが、前記セグメント化されたゾーンのセットを形成する、
請求項8に記載のレイアウト解析方法。 - 水平プロジェクションセグメンテーションを介して得られた各々の水平セグメント化されたゾーンに垂直プロジェクションセグメンテーションを前記実行するステップは、
データ列のセットに関する前記水平セグメント化されたゾーンを検索するステップであって、前記データ列のセット内の各々のデータ列のデータ値の総計がゼロから第1のしきい値までの範囲内であり、前記第1のしきい値がゼロよりも大きい、前記水平セグメント化されたゾーンを検索するステップと、
前記データ列のセットから、前記データ列のセットを見つけることに応じて前記水平セグメント化されたゾーンをセグメント化するための垂直分割線を選択するステップと、
垂直セグメント化されたゾーンを得るために前記選択した垂直分割線を使用して前記水平セグメント化されたゾーンをセグメント化するステップと、
を含む、請求項9に記載のレイアウト解析方法。 - 垂直プロジェクションセグメンテーションを介して得られた各々の垂直セグメント化されたゾーンに水平プロジェクションセグメンテーションを前記実行するステップは、
データ行のセットに関する前記垂直セグメント化されたゾーンを検索するステップであって、前記データ行のセット内の各々のデータ行のデータ値の総計がゼロから第2のしきい値までの範囲内であり、前記第2のしきい値がゼロよりも大きい、前記垂直セグメント化されたゾーンを検索するステップと、
前記データ行のセットから、前記データ行のセットを見つけることに応じて前記垂直セグメント化されたゾーンをセグメント化するための水平分割線を選択するステップと、
水平セグメント化されたゾーンを得るために前記選択した水平分割線を使用して前記垂直セグメント化されたゾーンをセグメント化するステップと、
を含む、請求項9に記載のレイアウト解析方法。 - 互いに対する前記セグメント化されたゾーンのセット内の前記それぞれのセグメント化されたゾーンの前記順番を前記決定するステップが、
周期的に前記操作を実行する際に、階層ツリーデータ構造内の水平セグメント化されたゾーン同士の間の、垂直セグメント化されたゾーン同士の間の、および前記水平セグメント化されたゾーンと前記垂直セグメント化されたゾーンとの間の階層的関係を記録するステップであって、前記階層ツリーデータ構造内のリーフノードが前記セグメント化されたゾーンのセットを表す、階層的関係を記録するステップと、
前記読取り順則にしたがって前記リーフノードをスキャンするステップであって、前記リーフノードをスキャンするステップの順番が互いに対する前記セグメント化されたゾーンのセット内の前記それぞれのセグメント化されたゾーンの順番を表す、前記リーフノードをスキャンするステップと、
を含む、請求項9に記載のレイアウト解析方法。 - 前記複数の接続された領域の前記空間レイアウトを前記解析するステップは、前記それぞれの選択され接続された領域に対してプロジェクションセグメンテーションを前記実行するステップの後で、
前記それぞれの選択され接続された領域が前記補正角だけこれまでに回転されているかどうかを決定するステップと、
前記それぞれの選択され接続された領域が前記補正角だけこれまでに回転されていることを決定するステップに応じて前記補正角だけ前記セグメント化されたゾーンのセットを逆に回転するステップと、
をさらに含む、請求項5に記載のレイアウト解析方法。 - 前記レイアウト構造に基づいて互いに対する前記テキスト行の前記順番を前記決定するステップが、
前記セグメント化されたゾーンのセット内のそれぞれのセグメント化されたゾーンに対して前記それぞれの選択され接続された領域の相対的な位置にしたがって、前記それぞれの選択され接続された領域と前記それぞれのセグメント化されたゾーンとの間の対応を決定するステップであって、各々のセグメント化されたゾーンが選択され接続された領域の対応するセットを含む、対応を決定するステップと、
選択され接続された領域の前記対応するセット内の前記選択され接続された領域同士の間の位置的な関係にしたがって選択され接続された領域の前記対応するセット内の選択され接続された領域を配置するステップと、
前記選択され接続された領域内の前記長方形ブロック同士の間の位置的な関係にしたがって各々の選択され接続された領域内の長方形ブロックを配置するステップと、
前記複数のテキスト行と前記複数の長方形ブロックとの間の対応にしたがって前記それぞれの選択され接続された領域内の長方形ブロックと前記複数のテキスト行とをマッチングさせるステップと、
を含む、請求項13に記載のレイアウト解析方法。 - 前記レイアウトモデルに基づいて前記テキスト行の前記レイアウト構造を前記解析するステップの前に、
前記複数のテキスト行の主レイアウトタイプを認識するステップであって、前記主レイアウトタイプが水平レイアウトタイプおよび垂直レイアウトタイプから構成される群から選択される1つを含む、認識するステップをさらに含み、
前記レイアウトモデルに基づいて前記テキスト行の前記レイアウト構造を前記解析するステップが、
前記主レイアウトタイプの前記テキスト行のレイアウト構造を解析するステップを含む、
請求項1に記載のレイアウト解析方法。 - 請求項1~15のいずれか一項に記載のレイアウト解析方法を実行するように構成された回路ユニットを備えた、チップ回路。
- 請求項16に記載のチップ回路と、
画像を取り込むように構成された画像センサと、
を備えた、読取り支援デバイス。 - プロセッサと、
プログラムを記憶するメモリであって、前記プログラムが、前記プロセッサによって実行されたときに、前記プロセッサに請求項1~15のいずれか一項に記載のレイアウト解析方法を実行させる命令を含む、メモリと、
を備えた、電子デバイス。 - プログラムを記憶するコンピュータ可読記憶媒体であって、前記プログラムが、電子デバイスのプロセッサによって実行されたときに、前記電子デバイスに請求項1~15のいずれか一項に記載のレイアウト解析方法を実行させる命令を含む、コンピュータ可読記憶媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010667074.6 | 2020-07-13 | ||
CN202010667074.6A CN111832476A (zh) | 2020-07-13 | 2020-07-13 | 版面分析方法、阅读辅助设备、电路和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022017202A JP2022017202A (ja) | 2022-01-25 |
JP7132654B2 true JP7132654B2 (ja) | 2022-09-07 |
Family
ID=72900564
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021113960A Active JP7132654B2 (ja) | 2020-07-13 | 2021-07-09 | レイアウト解析方法、読取り支援デバイス、回路および媒体 |
Country Status (5)
Country | Link |
---|---|
EP (1) | EP3940589B1 (ja) |
JP (1) | JP7132654B2 (ja) |
KR (1) | KR102399508B1 (ja) |
CN (1) | CN111832476A (ja) |
WO (1) | WO2022012121A1 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11367296B2 (en) | 2020-07-13 | 2022-06-21 | NextVPU (Shanghai) Co., Ltd. | Layout analysis |
CN111832476A (zh) * | 2020-07-13 | 2020-10-27 | 上海肇观电子科技有限公司 | 版面分析方法、阅读辅助设备、电路和介质 |
CN113033338B (zh) * | 2021-03-09 | 2024-03-29 | 太极计算机股份有限公司 | 电子报头版头条新闻位置识别方法及装置 |
CN114494711B (zh) * | 2022-02-25 | 2023-10-31 | 南京星环智能科技有限公司 | 一种图像特征的提取方法、装置、设备及存储介质 |
CN114757144B (zh) * | 2022-06-14 | 2022-09-06 | 成都数之联科技股份有限公司 | 图像文档的重建方法、装置、电子设备和存储介质 |
CN114998885A (zh) * | 2022-06-23 | 2022-09-02 | 小米汽车科技有限公司 | 页面数据处理方法、装置、车辆及存储介质 |
CN116167143B (zh) * | 2023-04-20 | 2023-08-15 | 江西少科智能建造科技有限公司 | 一种工位布置方法、系统、存储介质及设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004240643A (ja) | 2003-02-05 | 2004-08-26 | Toshiba Corp | 文字認識システム、文字認識方法およびプログラム |
JP2004272822A (ja) | 2003-03-12 | 2004-09-30 | Seiko Epson Corp | 文字認識装置および文字認識方法並びにコンピュータプログラム |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06215184A (ja) * | 1992-09-17 | 1994-08-05 | Fuji Facom Corp | 抽出領域のラベリング装置 |
JP3683923B2 (ja) * | 1994-11-17 | 2005-08-17 | キヤノン株式会社 | 文字領域の順序付け方法 |
JP3940491B2 (ja) * | 1998-02-27 | 2007-07-04 | 株式会社東芝 | 文書処理装置および文書処理方法 |
JP4856925B2 (ja) * | 2005-10-07 | 2012-01-18 | 株式会社リコー | 画像処理装置、画像処理方法及び画像処理プログラム |
US8594422B2 (en) * | 2010-03-11 | 2013-11-26 | Microsoft Corporation | Page layout determination of an image undergoing optical character recognition |
CN102479173B (zh) * | 2010-11-25 | 2013-11-06 | 北京大学 | 识别版面阅读顺序的方法及装置 |
US9330070B2 (en) * | 2013-03-11 | 2016-05-03 | Microsoft Technology Licensing, Llc | Detection and reconstruction of east asian layout features in a fixed format document |
US20150212654A1 (en) * | 2014-01-28 | 2015-07-30 | Comikka, Inc. | Architecture for providing dynamically sized image sequences |
CN110969056B (zh) * | 2018-09-29 | 2023-08-08 | 杭州海康威视数字技术股份有限公司 | 文档图像的文档版面分析方法、装置及存储介质 |
CN109934210B (zh) * | 2019-05-17 | 2019-08-09 | 上海肇观电子科技有限公司 | 版面分析方法、阅读辅助设备、电路和介质 |
CN111340037B (zh) * | 2020-03-25 | 2022-08-19 | 上海智臻智能网络科技股份有限公司 | 文本版面分析方法、装置、计算机设备和存储介质 |
CN111832476A (zh) * | 2020-07-13 | 2020-10-27 | 上海肇观电子科技有限公司 | 版面分析方法、阅读辅助设备、电路和介质 |
-
2020
- 2020-07-13 CN CN202010667074.6A patent/CN111832476A/zh active Pending
-
2021
- 2021-05-08 WO PCT/CN2021/092338 patent/WO2022012121A1/zh active Application Filing
- 2021-06-25 EP EP21181721.8A patent/EP3940589B1/en active Active
- 2021-07-05 KR KR1020210087974A patent/KR102399508B1/ko active IP Right Grant
- 2021-07-09 JP JP2021113960A patent/JP7132654B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004240643A (ja) | 2003-02-05 | 2004-08-26 | Toshiba Corp | 文字認識システム、文字認識方法およびプログラム |
JP2004272822A (ja) | 2003-03-12 | 2004-09-30 | Seiko Epson Corp | 文字認識装置および文字認識方法並びにコンピュータプログラム |
Also Published As
Publication number | Publication date |
---|---|
KR102399508B1 (ko) | 2022-05-19 |
EP3940589A1 (en) | 2022-01-19 |
WO2022012121A1 (zh) | 2022-01-20 |
JP2022017202A (ja) | 2022-01-25 |
CN111832476A (zh) | 2020-10-27 |
EP3940589B1 (en) | 2023-10-25 |
KR20220008224A (ko) | 2022-01-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7132654B2 (ja) | レイアウト解析方法、読取り支援デバイス、回路および媒体 | |
US10467466B1 (en) | Layout analysis on image | |
WO2020192433A1 (zh) | 多语言文本检测识别方法和设备 | |
US9330331B2 (en) | Systems and methods for offline character recognition | |
CN113498521A (zh) | 文本检测方法及装置、存储介质 | |
CN111612004A (zh) | 一种基于语义内容的图像裁剪方法及装置 | |
WO2024027349A1 (zh) | 一种印刷体数学公式识别方法、装置及存储介质 | |
CN111368632A (zh) | 一种签名识别方法及设备 | |
WO2020233379A1 (zh) | 版面分析方法、阅读辅助设备、电路及介质 | |
WO2022121842A1 (zh) | 文本图像的矫正方法及装置、设备和介质 | |
US11367296B2 (en) | Layout analysis | |
JP5412916B2 (ja) | 文書画像処理装置、文書画像処理方法および文書画像処理プログラム | |
JP2006133941A (ja) | 画像処理装置、画像処理方法、画像処理プログラム及び携帯型端末 | |
WO2022121843A1 (zh) | 文本图像的矫正方法及装置、设备和介质 | |
CN113793264B (zh) | 一种基于卷积模型的档案图像处理方法、系统和电子设备 | |
CN113850239B (zh) | 多文档检测方法、装置、电子设备及存储介质 | |
CN113486171B (zh) | 一种图像处理方法及装置、电子设备 | |
CN113850238B (zh) | 文档检测方法、装置、电子设备及存储介质 | |
CN110969161B (zh) | 图像处理方法、电路、视障辅助设备、电子设备和介质 | |
US10380447B1 (en) | Providing regions of interest in an image | |
CN113850268B (zh) | 基于人工智能的文本识别排序方法、装置、设备及介质 | |
WO2016069005A1 (en) | Text line detection | |
US20220277473A1 (en) | Pose estimation apparatus, learning apparatus, pose estimation method, and non-transitory computer-readable recording medium | |
CN116912849A (zh) | 文档恢复方法、装置、电子设备及存储介质 | |
CN112861735A (zh) | 文本图像的识别方法及装置、设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210709 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20210709 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211018 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220106 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20220323 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220714 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20220714 |
|
C11 | Written invitation by the commissioner to file amendments |
Free format text: JAPANESE INTERMEDIATE CODE: C11 Effective date: 20220728 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20220808 |
|
C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C21 Effective date: 20220809 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220815 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220819 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7132654 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |