JP7031389B2 - 情報処理装置及びプログラム - Google Patents
情報処理装置及びプログラム Download PDFInfo
- Publication number
- JP7031389B2 JP7031389B2 JP2018045338A JP2018045338A JP7031389B2 JP 7031389 B2 JP7031389 B2 JP 7031389B2 JP 2018045338 A JP2018045338 A JP 2018045338A JP 2018045338 A JP2018045338 A JP 2018045338A JP 7031389 B2 JP7031389 B2 JP 7031389B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- character
- designated
- unit
- character string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Character Input (AREA)
- Editing Of Facsimile Originals (AREA)
Description
そこで、本発明は、各々が文字列を含む複数の定形画像が重なっていても各定形画像に含まれる文字列を区別して抽出することを目的とする。
請求項2に係る発明によれば、必要な情報が表されていない文字列を除いて抽出を続けることができる。
請求項3に係る発明によれば、輪郭検出による抽出が行われない場合に比べて、文字列認識処理による負荷を少なくすることができる。
請求項4に係る発明によれば、文字の認識処理の精度の悪化を防ぐことができる。
請求項5に係る発明によれば、輪郭の成す角度に関係なく画像を傾ける場合に比べて、新たな画像を指定する回数を少なくすることができる。
請求項6に係る発明によれば、新たな画像を一度指定するだけで文字列を抽出することができる。
請求項7に係る発明によれば、文字列の上下方向がどちらに向いている場合でも、いずれかの新たな画像によって文字列を抽出することができる。
請求項8に係る発明によれば、残った文字列の確信度に関係なく画像を傾ける場合に比べて、新たな画像を指定する回数を少なくすることができる。
請求項9に係る発明によれば、確信度に基づいて画像を傾け続ける場合に比べて、一群の文字列が抽出されないまま新たな画像が指定され続ける事態を起こりにくくすることができる。
図1は実施例に係る画像処理装置10のハードウェア構成を表す。画像処理装置10は、画像処理を行って、シート状の媒体に表されている文字列の画像を媒体毎に電子データ化する装置である。シート状の媒体とは、大きさ及び形(通常は四角形)が決まっている定型の媒体であり、本実施例では、名刺が用いられる。画像処理装置10は、名刺に表された文字列(会社名、氏名及び住所等)の画像を媒体毎に電子データに変換して保存する。
図2は画像処理装置10が実現する機能構成を表す。画像処理装置10は、画像読取部101と、処理対象指定部102と、文字認識処理部103と、一群文字列特定部104と、抽出条件判定部111と、文字列抽出部112と、削除部113と、画像傾斜部114とを備える。
図4は一群の文字列の特定手順の一例を表す。図4(a)では、指定画像に含まれている名刺画像C1が表されている。名刺画像C1は、その短辺及び長辺が指定画像の上下方向A11及び左右方向A12に対して傾いている。スキャナ20は、図3に表す原稿ガラス21の上下方向A1及び左右方向A2に沿って走査を行う。
図9は生成された傾斜画像の例を表す。図9(a)では、図8に表す削除後画像G10-2に含まれる名刺画像C1-2が表されている。
図10は抽出処理における動作手順の一例を表す。この動作手順は、スキャナ20の読み取り操作が行われることを契機に開始される。まず、画像処理装置10(画像読取部101)は、シート状の媒体を画像として読み取る(ステップS11)。次に、画像処理装置10(処理対象指定部102)は、文字認識処理の対象とする画像を指定する(ステップS12)。
上述した実施例は本発明の実施の一例に過ぎず、以下のように変形させてもよい。また、実施例及び各変形例は、必要に応じて組み合わせて実施してもよい。
実施例では、画像処理装置10自身が読み取ったスキャン画像が最初に指定画像であったが、これに限らない。例えば他の装置が読み取ったスキャン画像が最初に指定画像であってもよい。また、シート状の媒体を読み取るスキャナによって読み取られた画像ではなく、デジタルカメラ等で撮像された画像が指定画像であってもよい。いずれの場合も、定形領域に含まれる一群の文字列が抽出対象として複数含まれる画像が最初の指定画像として指定されればよい。
実施例では名刺に含まれている文字列が抽出対象であったが、これに限らない。例えば、領収書、受領書及び伝票等に表されている文字列も抽出対象としてもよい。いずれの場合も、定形領域に含まれる一群の文字列が抽出対象であればよい。
実施例ではシート状の媒体に表されている文字列を電子データ化するために画像変換が行われたが、上述したコード変換が行われてもよい。その場合、文字列抽出部112が、一群文字列特定部104により特定された一群の文字列(いずれも既に文字認識処理により認識された文字)について各文字の文字コードを示すデータ(テキストデータ等)を生成することで、コード変換が行われる。
最初の指定画像に抽出対象として適当でない文字列が含まれる場合がある。例えば名刺が原稿ガラス21からはみ出していてほとんど文字列が読み取られていない場合である。また、デジタルカメラ等で撮像された画像が指定画像であり、関係のない文字列(被写体の近くに存在したメモ書き等)が写ってしまっている場合である。それらの場合に、抽出対象として適当でない文字列が抽出されないようにしてもよい。
実施例では、輪郭を検出してから一群の文字列を特定する方法が用いられなかったが、この方法が併用されてもよい。
図12は本変形例で実現される機能構成を表す。図12では、図2に表す各部に加えて輪郭検出部121と、第2抽出条件判定部122と、定形画像抽出部123とを備える画像処理装置10aが表されている。
画像傾斜部114は、実施例では削除後画像を決められた角度だけ傾けた傾斜画像を生成したが、削除後画像の傾け度合いを動的に変化させてもよい。例えば、図12に表す輪郭検出部121により指定画像から矩形を表す輪郭(名刺画像の輪郭)が検出されたとする。
図15は本変形例の傾斜画像の一例を表す。図15(a)では、指定画像G11の上下方向A11に対して角度θ1を成す短辺と角度θ2を成す長辺とを有する矩形の輪郭H4が名刺画像C1-2の輪郭として表されている。
削除後画像の傾け度合いを動的に変化させる方法は上述した方法に限らない。本変形例では、画像傾斜部114は、文字列抽出部112により抽出された文字列を除いた指定画像(削除後画像)に残った文字列の確信度が小さいほど大きく傾けた画像を傾斜画像として生成する。
図16は傾斜角度テーブルの一例を表す。図16の例では、「K11未満」、「K11以上K12未満」及び「K12以上」という文字列の確信度に、「θ13」、「θ12」及び「θ11」という傾斜角度が対応付けられている。
削除部113は、実施例では、定形画像が表示されている領域を背景色に塗り潰すことで一群の文字列を指定画像から削除したが、これ以外の削除方法を用いてもよい。削除部113は、例えば、定形画像ではなく図4(b)に表す文字列領域を背景色に塗り潰すことで一群の文字列を指定画像から削除してもよい。定形画像の表示領域を削除する場合に比べると、文字列領域の方が小さいので、削除された領域により残されるべき文字列が消えてしまうことが起こりにくくなる。
図2及び図12に表す各機能は、2以上の機能が統合されてもよいし、1つの機能が2以上の機能に分割されてもよい。また、或る機能が行う動作を他の機能が行ってもよい。また、各機能は、画像処理装置だけによって実現されるとは限らず、画像処理装置を含む2以上の装置(つまりシステム)によって実現されてもよい。要するに、装置又はシステムの全体で図2及び図12に表す各機能と同等の機能が実現されていれば、機能の実現方法はどのようになっていてもよい。
本発明は、画像処理装置10という情報処理装置の他、その情報処理装置と、文字認識処理を行う外部装置とを備える情報処理システムとしても捉えられる。また、本発明は、各装置が実施する処理を実現するための情報処理方法としても捉えられるし、各装置を制御するコンピュータを機能させるためのプログラムとしても捉えられる。このプログラムは、それを記憶させた光ディスク等の記録媒体の形態で提供されてもよいし、インターネット等の通信回線を介してコンピュータにダウンロードさせ、それをインストールして利用可能にするなどの形態で提供されてもよい。
Claims (10)
- 指定された指定画像に対して文字認識処理を行う処理部と、
前記文字認識処理により認識された文字のうち一群の文字列を特定する特定部と、
特定された前記一群の文字列が定形領域に収まり且つ当該文字列に含まれる各文字の確信度の平均値、中央値又は最頻値によって算出される当該文字列の確信度が閾値以上の場合に当該文字列を抽出する抽出部と、
前記抽出部により抽出された文字列を除いた前記指定画像に前記認識された文字が残っている場合に、当該指定画像を傾けた新たな画像を前記文字認識処理の対象として指定する指定部と
を備える情報処理装置。 - 前記抽出部は、文字数が閾値未満の前記一群の文字列は抽出せず、
前記指定部は、前記抽出部が抽出しなかった文字列を除いた前記指定画像に認識された文字が残っている場合に当該指定画像を傾けた画像を前記新たな画像として指定する
請求項1に記載の情報処理装置。 - 前記指定画像に含まれる輪郭を検出する検出部と、
前記検出部により検出された輪郭を含む最小の矩形領域の前記定形領域に対する比率が閾値未満である場合に当該矩形領域を抽出する第2抽出部とを備え、
前記指定部は、前記抽出部により抽出された文字列に加えて前記第2抽出部により抽出された矩形領域を除いた前記指定画像に認識された文字が残っている場合に当該指定画像を傾けた画像を前記新たな画像として指定する
請求項1又は2に記載の情報処理装置。 - 前記指定部は、前記新たな画像として、最初の前記指定画像を加工した画像を指定する
請求項1から3のいずれか1項に記載の情報処理装置。 - 前記指定画像に含まれる輪郭を検出する検出部を備え、
前記指定部は、前記指定画像から矩形を表す輪郭が検出された場合に当該矩形の辺と前記傾きの基準となる方向の成す角度だけ当該指定画像を傾けた画像を前記新たな画像として指定する
請求項1から4のいずれか1項に記載の情報処理装置。 - 前記指定部は、前記矩形の辺と前記方向との成す複数の角度のうち最小の角度を傾ける角度とする画像を前記新たな画像として指定する
請求項5に記載の情報処理装置。 - 前記指定部は、前記矩形の辺と前記方向との成す複数の角度のそれぞれを傾ける角度とする画像を前記新たな画像として指定する
請求項5に記載の情報処理装置。 - 前記指定部は、前記抽出された文字列を除いた前記指定画像に残った文字列の確信度が小さいほど大きく傾けた画像を前記新たな画像として指定する
請求項1から4のいずれか1項に記載の情報処理装置。 - 前記指定部は、指定した画像に残った文字列の確信度が閾値未満になった場合、決められた角度だけ傾けた画像を前記新たな画像として指定する
請求項8に記載の情報処理装置。 - コンピュータを、
指定された指定画像に対して文字認識処理を行う処理部と、
前記文字認識処理により認識された文字のうち一群の文字列を特定する特定部と、
特定された前記一群の文字列が定形領域に収まり且つ当該文字列に含まれる各文字の確信度の平均値、中央値又は最頻値によって算出される当該文字列の確信度が閾値以上の場合に当該文字列を抽出する抽出部と、
前記抽出部により抽出された文字列を除いた前記指定画像に前記認識された文字が残っている場合に、当該指定画像を傾けた新たな画像を前記文字認識処理の対象として指定する指定部
として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018045338A JP7031389B2 (ja) | 2018-03-13 | 2018-03-13 | 情報処理装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018045338A JP7031389B2 (ja) | 2018-03-13 | 2018-03-13 | 情報処理装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019161440A JP2019161440A (ja) | 2019-09-19 |
JP7031389B2 true JP7031389B2 (ja) | 2022-03-08 |
Family
ID=67992716
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018045338A Active JP7031389B2 (ja) | 2018-03-13 | 2018-03-13 | 情報処理装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7031389B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6773992B1 (ja) * | 2020-01-31 | 2020-10-21 | 株式会社Osk | 情報処理装置,コンピュータの制御方法及び制御プログラム |
JP7457903B2 (ja) * | 2020-03-24 | 2024-03-29 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016170677A (ja) | 2015-03-13 | 2016-09-23 | オムロン株式会社 | 文書画像処理用のプログラムおよびこのプログラムを用いた画像処理装置ならびに文字認識装置 |
-
2018
- 2018-03-13 JP JP2018045338A patent/JP7031389B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016170677A (ja) | 2015-03-13 | 2016-09-23 | オムロン株式会社 | 文書画像処理用のプログラムおよびこのプログラムを用いた画像処理装置ならびに文字認識装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2019161440A (ja) | 2019-09-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020140698A1 (zh) | 表格数据的获取方法、装置和服务器 | |
TW201333835A (zh) | 行動影像擷取和處理的系統和方法 | |
WO2009094446A1 (en) | Method and apparatus for cropping images | |
JP7031389B2 (ja) | 情報処理装置及びプログラム | |
JP2007081458A (ja) | 画像処理装置および画像処理装置の制御方法 | |
JP4904330B2 (ja) | 画像からテキストを抽出する方法及び装置 | |
JP2004046632A (ja) | 画像処理装置 | |
JP6628336B2 (ja) | 情報処理システム | |
JP2024038417A (ja) | 情報処理装置、情報処理方法、プログラム | |
JP7449505B2 (ja) | 情報処理システム | |
JP2010186246A (ja) | 画像処理装置、方法、及び、プログラム | |
JPH08190690A (ja) | ナンバープレート決定方法 | |
CN112215783B (zh) | 一种图像噪点识别方法、装置、存储介质及设备 | |
JP3268552B2 (ja) | 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置 | |
JP2020021520A (ja) | 情報処理システム | |
CN113255637A (zh) | 图像边界的定位方法、图像处理设备、装置和存储介质 | |
JP2021005234A (ja) | 帳票認識装置、帳票認識方法、及び帳票認識システム | |
JPS58197581A (ja) | 文字図形認識方法とその装置 | |
JP7343115B1 (ja) | 情報処理システム | |
JPS5949671A (ja) | 光学的文字読取装置 | |
WO2023171132A1 (ja) | 情報処理システム | |
JP3190794B2 (ja) | 文字切り出し装置 | |
KR20220168787A (ko) | 만주어의 글자 추출 방법 및 이를 수행하는 시스템 | |
JP3341097B2 (ja) | 光学文字読取装置 | |
JPH03219384A (ja) | 文字認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210226 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20211102 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211116 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220114 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220125 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220207 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7031389 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |