JP7242331B2 - 情報処理装置及びプログラム - Google Patents
情報処理装置及びプログラム Download PDFInfo
- Publication number
- JP7242331B2 JP7242331B2 JP2019026390A JP2019026390A JP7242331B2 JP 7242331 B2 JP7242331 B2 JP 7242331B2 JP 2019026390 A JP2019026390 A JP 2019026390A JP 2019026390 A JP2019026390 A JP 2019026390A JP 7242331 B2 JP7242331 B2 JP 7242331B2
- Authority
- JP
- Japan
- Prior art keywords
- region
- processor
- score
- equal
- boundary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Character Input (AREA)
- Image Analysis (AREA)
Description
プロセッサ11は、インターフェース15を通じて、文字列を含む画像を取得する。たとえば、インターフェース15がスキャナと接続する場合、プロセッサ11は、スキャナに画像をスキャンさせる信号を送信して、スキャナから画像を取得する。
また、インターフェース15がネットワークに接続する場合、プロセッサ11は、ネットワークを通じて外部装置に画像を要求するリクエストを送信して、外部装置から画像を取得する。
プロセッサ11が文字列を含む画像を取得する方法は、特定の方法に限定されるものではない。
中腹領域スコアは、画素が中腹領域であることに関連するスコアである。たとえば、中腹領域スコアは、画素が中腹領域であることの尤度である。
図2は、中腹領域について説明するための図である。
図2は、文字行20、中心線21及び中腹領域22を示す。ここでは、文字行20は、一行の文字列である。
文字行20の高さHは、たとえば、文字行20の平均的な高さである。
中腹領域22は、文字行20の高さHの1/N倍の高さに形成される。即ち、中腹領域22は、直交方向において、Hの1/N倍の幅に形成される。ここでは、Nは、3である。なお、Nの値は、1以上の任意の値でよい。また、中腹領域22の高さは、高さHに関係なく所定の値、たとえば3や5、でもよい。
図3は、文字行20、中心線21及び上端領域23を示す。文字行20及び中心線21は、前述の通りである。
図4は、文字行20、中心線21及び下端領域24を示す。文字行20及び中心線21は、前述の通りである。
即ち、プロセッサ11は、文字行領域の上端を形成する線(上端線)を探索する。
ここでは、取得した画像の横軸をX軸とし、縦軸をY軸とする。また、X軸において、左側から右側に掛けてX座標の値が上昇するものとする。また、Y軸において、上側から下側に掛けてY座標の値が上昇するものとする。また、プロセッサ11は、中腹領域62を特定したものとする。
プロセッサ11は、中腹領域62の左端のX座標から右端のX座標まで上記の動作を繰り返して、上端線を探索する。
即ち、プロセッサ11は、文字行領域の下端を形成する線(下端線)を探索する。
たとえば、プロセッサ11は、中腹領域62の左端のX座標を取得する。左端のX座標を取得すると、プロセッサ11は、左端のX座標における中腹領域62の下端(第2の方向の端)のY座標を取得する。プロセッサ11は、中腹領域62の下端のY座標から下部に進み、下端線の座標を探索する。
プロセッサ11は、中腹領域62の左端のX座標から右端のX座標まで上記の動作を繰り返して、下端線を探索する。
プロセッサ11は、上端線と下端線との間の領域を文字行領域として特定する。
Xが中腹領域の右端のX座標(Right)よりも大きいと判定すると(S33、YES)、プロセッサ11は、動作を終了する。
Xが中腹領域の右端のX座標(Right)よりも大きいと判定すると(S43、YES)、プロセッサ11は、動作を終了する。
情報処理装置10は、中腹領域から3以上の方向に境界を探索する。
図14は、プロセッサ11の動作例を説明するための図である。図14が示すように、プロセッサ11は、中腹領域72から8方向に境界を探索する。
また、プロセッサ11は、中腹領域72及び各端領域スコアに基づいて、各方向の端領域の境界を探索する。
領域73は、境界点81乃至境界点88を直線で結んで形成される。
以下に、本願の出願当初の特許請求の範囲に記載された発明を付記する。
[C1]
画像を取得するインターフェースと、
対象領域の中腹領域を特定し、
前記画像を構成する画素が前記対象領域の第1の端領域であることに関連する第1の端領域スコアを算出し、
前記画素が前記対象領域の第2の端領域であることに関連する第2の端領域スコアを算出し、
前記中腹領域及び前記第1の端領域スコアに基づいて前記第1の端領域の第1の境界を特定し、
前記中腹領域及び前記第2の端領域スコアに基づいて前記第2の端領域の第2の境界を特定し、
前記第1の境界及び前記第2の境界に基づいて前記対象領域を特定する、
プロセッサと、
を備える情報処理装置。
[C2]
前記プロセッサは、
前記中腹領域から第1の方向に沿って画素ごとに前記第1の端領域スコアが所定の閾値以下であるか否かを順に判定し、前記第1の端領域スコアが所定の閾値以下である画素の座標に基づいて前記第1の境界を特定し、
前記中腹領域から前記第1の方向と異なる第2の方向に沿って画素ごとに前記第2の端領域スコアが所定の閾値以下であるか否かを順に判定し、前記第2の端領域スコアが所定の閾値以下である画素の座標に基づいて前記第2の境界を特定する、
C1に記載の情報処理装置。
[C3]
前記プロセッサは、
前記中腹領域における前記第1の方向の端から前記第1の方向に沿って画素ごとに前記第1の端領域スコアが所定の閾値以下であるか否かを順に判定し、前記第1の端領域スコアが所定の閾値以下である画素の座標に基づいて前記第1の境界を特定し、
前記中腹領域における前記第2の方向の端から前記第2の方向に沿って画素ごとに前記第2の端領域スコアが所定の閾値以下であるか否かを順に判定し、前記第2の端領域スコアが所定の閾値以下である画素の座標に基づいて前記第2の境界を特定する、
C2に記載の情報処理装置。
[C4]
前記プロセッサは、
前記中腹領域における中心線から前記第1の方向に沿って画素ごとに前記第1の端領域スコアが所定の閾値以下であるか否かを順に判定し、前記第1の端領域スコアが所定の閾値以下である画素の座標に基づいて前記第1の境界を特定し、
前記中心線から前記第2の方向に沿って画素ごとに前記第2の端領域スコアが所定の閾値以下であるか否かを順に判定し、前記第2の端領域スコアが所定の閾値以下である画素の座標に基づいて前記第2の境界を特定する、
C2に記載の情報処理装置。
[C5]
前記第2の方向は、前記第1の方向と逆方向である、
C2乃至4の何れか1項に記載の情報処理装置。
[C6]
前記第1の端領域は、前記中心線よりも上部に形成される上端領域であり、
前記第2の端領域は、前記中心線よりも下部に形成される下端領域である、
C4に記載の情報処理装置。
[C7]
前記対象領域は、1行の文字列から構成される文字行を表示する領域である、
C1乃至6の何れか1項に記載の情報処理装置。
[C8]
前記プロセッサは、
前記画素が前記中腹領域であることに関連する中腹領域スコアを算出し、
前記中腹領域スコアに基づいて前記中腹領域を特定する、
C1乃至7の何れか1項に記載の情報処理装置。
[C9]
前記プロセッサは、深層学習によって得られたモデルに基づいて前記第1の端領域スコア及び前記第2の端領域スコアを算出する、
C1乃至8の何れか1項に記載の情報処理装置。
[C10]
プロセッサによって実行されるプログラムであって、
前記プロセッサに、
画像を取得させ、
対象領域の中腹領域を特定させ、
前記画像を構成する画素が前記対象領域の第1の端領域であることに関連する第1の端領域スコアを算出させ、
前記画素が前記対象領域の第2の端領域であることに関連する第2の端領域スコアを算出させ、
前記中腹領域及び前記第1の端領域スコアに基づいて前記第1の端領域の第1の境界を特定させ、
前記中腹領域及び前記第2の端領域スコアに基づいて前記第2の端領域の第2の境界を特定させ、
前記第1の境界及び前記第2の境界に基づいて前記対象領域を特定させる、
プログラム。
Claims (9)
- 画像を取得するインターフェースと、
対象領域の中腹領域を特定し、
前記画像を構成する画素が前記対象領域の第1の端領域であることに関連する第1の端領域スコアを算出し、
前記画素が前記対象領域の第2の端領域であることに関連する第2の端領域スコアを算出し、
前記中腹領域及び前記第1の端領域スコアに基づいて前記第1の端領域の第1の境界を特定し、
前記中腹領域及び前記第2の端領域スコアに基づいて前記第2の端領域の第2の境界を特定し、
前記第1の境界及び前記第2の境界に基づいて前記対象領域を特定する、
プロセッサと、
を備え、
前記プロセッサは、
前記中腹領域から第1の方向に沿って画素ごとに前記第1の端領域スコアが所定の閾値以下であるか否かを順に判定し、前記第1の端領域スコアが所定の閾値以下である画素の座標に基づいて前記第1の境界を特定し、
前記中腹領域から前記第1の方向と異なる第2の方向に沿って画素ごとに前記第2の端領域スコアが所定の閾値以下であるか否かを順に判定し、前記第2の端領域スコアが所定の閾値以下である画素の座標に基づいて前記第2の境界を特定する、
情報処理装置。 - 前記プロセッサは、
前記中腹領域における前記第1の方向の端から前記第1の方向に沿って画素ごとに前記第1の端領域スコアが所定の閾値以下であるか否かを順に判定し、前記第1の端領域スコアが所定の閾値以下である画素の座標に基づいて前記第1の境界を特定し、
前記中腹領域における前記第2の方向の端から前記第2の方向に沿って画素ごとに前記第2の端領域スコアが所定の閾値以下であるか否かを順に判定し、前記第2の端領域スコアが所定の閾値以下である画素の座標に基づいて前記第2の境界を特定する、
請求項1に記載の情報処理装置。 - 前記プロセッサは、
前記中腹領域における中心線から前記第1の方向に沿って画素ごとに前記第1の端領域スコアが所定の閾値以下であるか否かを順に判定し、前記第1の端領域スコアが所定の閾値以下である画素の座標に基づいて前記第1の境界を特定し、
前記中心線から前記第2の方向に沿って画素ごとに前記第2の端領域スコアが所定の閾値以下であるか否かを順に判定し、前記第2の端領域スコアが所定の閾値以下である画素の座標に基づいて前記第2の境界を特定する、
請求項1に記載の情報処理装置。 - 前記第2の方向は、前記第1の方向と逆方向である、
請求項1乃至3の何れか1項に記載の情報処理装置。 - 前記第1の端領域は、前記中心線よりも上部に形成される上端領域であり、
前記第2の端領域は、前記中心線よりも下部に形成される下端領域である、
請求項3に記載の情報処理装置。 - 前記対象領域は、1行の文字列から構成される文字行を表示する領域である、
請求項1乃至5の何れか1項に記載の情報処理装置。 - 前記プロセッサは、
前記画素が前記中腹領域であることに関連する中腹領域スコアを算出し、
前記中腹領域スコアに基づいて前記中腹領域を特定する、
請求項1乃至6の何れか1項に記載の情報処理装置。 - 前記プロセッサは、深層学習によって得られたモデルに基づいて前記第1の端領域スコア及び前記第2の端領域スコアを算出する、
請求項1乃至7の何れか1項に記載の情報処理装置。 - プロセッサによって実行されるプログラムであって、
前記プロセッサに、
画像を取得させ、
対象領域の中腹領域を特定させ、
前記画像を構成する画素が前記対象領域の第1の端領域であることに関連する第1の端領域スコアを算出させ、
前記画素が前記対象領域の第2の端領域であることに関連する第2の端領域スコアを算出させ、
前記中腹領域及び前記第1の端領域スコアに基づいて前記第1の端領域の第1の境界を特定させ、
前記中腹領域及び前記第2の端領域スコアに基づいて前記第2の端領域の第2の境界を特定させ、
前記第1の境界及び前記第2の境界に基づいて前記対象領域を特定させ、
前記第1の境界を特定することは、前記中腹領域から第1の方向に沿って画素ごとに前記第1の端領域スコアが所定の閾値以下であるか否かを順に判定し、前記第1の端領域スコアが所定の閾値以下である画素の座標に基づいて前記第1の境界を特定することであり、
前記第2の境界を特定することは、前記中腹領域から前記第1の方向と異なる第2の方向に沿って画素ごとに前記第2の端領域スコアが所定の閾値以下であるか否かを順に判定し、前記第2の端領域スコアが所定の閾値以下である画素の座標に基づいて前記第2の境界を特定することである、
プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019026390A JP7242331B2 (ja) | 2019-02-18 | 2019-02-18 | 情報処理装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019026390A JP7242331B2 (ja) | 2019-02-18 | 2019-02-18 | 情報処理装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020135272A JP2020135272A (ja) | 2020-08-31 |
JP7242331B2 true JP7242331B2 (ja) | 2023-03-20 |
Family
ID=72263117
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019026390A Active JP7242331B2 (ja) | 2019-02-18 | 2019-02-18 | 情報処理装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7242331B2 (ja) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01245375A (ja) * | 1988-03-26 | 1989-09-29 | Toshiba Corp | 文字認識装置 |
JP3576570B2 (ja) * | 1991-11-19 | 2004-10-13 | ゼロックス コーポレイション | 比較方法 |
-
2019
- 2019-02-18 JP JP2019026390A patent/JP7242331B2/ja active Active
Non-Patent Citations (1)
Title |
---|
TextSnake: A Flexible Representation for Detecting Text of Arbitrary Shapes,Computer Vision and Pattern Recognition,2018年07月04日, [検索日 2022.09.29],インターネット: <https://arxiv.org/pdf/1807.01544v1.pdf> |
Also Published As
Publication number | Publication date |
---|---|
JP2020135272A (ja) | 2020-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109409398B (zh) | 图像处理装置、图像处理方法以及存储介质 | |
JP5713790B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
US11783610B2 (en) | Document structure identification using post-processing error correction | |
US20200167993A1 (en) | Map constructing apparatus and map constructing method | |
JP2019041150A5 (ja) | ||
JP2020061158A (ja) | 画像処理装置、表示制御装置、画像処理方法、および、記録媒体 | |
JP2001273091A (ja) | 多重解像度画像解析による指示位置検出 | |
KR101631015B1 (ko) | 제스처 인식 장치 및 제스처 인식 장치의 제어 방법 | |
JP6895563B2 (ja) | ロボットシステム、モデル生成方法、及びモデル生成プログラム | |
JP2020523668A5 (ja) | ||
US11164318B2 (en) | Image recognition apparatus, method, and program for enabling recognition of objects with high precision | |
KR20220126709A (ko) | 자율주행 차량을 위한 로드 네트워크 데이터 생성 방법, 장치 및 컴퓨터프로그램 | |
JP7242331B2 (ja) | 情報処理装置及びプログラム | |
JP6229554B2 (ja) | 検出装置および検出方法 | |
JP2013229011A (ja) | 帳票識別装置および帳票識別方法 | |
JP6694638B2 (ja) | プログラム、情報記憶媒体及び認識装置 | |
US9244892B2 (en) | Information display apparatus and computer readable medium | |
US9229608B2 (en) | Character display apparatus, character display method, and computer readable medium | |
JP2019169182A (ja) | 情報処理装置、制御方法、プログラム | |
JP2018088223A (ja) | 情報処理装置、情報処理方法、プログラム | |
CN111291756A (zh) | 图像中文本区域的检测方法、装置、计算机设备及计算机存储介质 | |
US20200125883A1 (en) | Article recognition apparatus | |
JP7017114B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP2021005234A (ja) | 帳票認識装置、帳票認識方法、及び帳票認識システム | |
US11132496B2 (en) | Electronic book display device, electronic book display method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210908 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220926 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221004 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221118 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20230105 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230207 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230308 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7242331 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |