JP7127365B2 - 文字切り出し装置、文字切り出し方法、及びプログラム - Google Patents

文字切り出し装置、文字切り出し方法、及びプログラム Download PDF

Info

Publication number
JP7127365B2
JP7127365B2 JP2018103857A JP2018103857A JP7127365B2 JP 7127365 B2 JP7127365 B2 JP 7127365B2 JP 2018103857 A JP2018103857 A JP 2018103857A JP 2018103857 A JP2018103857 A JP 2018103857A JP 7127365 B2 JP7127365 B2 JP 7127365B2
Authority
JP
Japan
Prior art keywords
character
size
image
clipping
window
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018103857A
Other languages
English (en)
Other versions
JP2019207645A (ja
Inventor
正彦 山崎
紘志 齋藤
佑大 神戸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dai Nippon Printing Co Ltd
Original Assignee
Dai Nippon Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dai Nippon Printing Co Ltd filed Critical Dai Nippon Printing Co Ltd
Priority to JP2018103857A priority Critical patent/JP7127365B2/ja
Publication of JP2019207645A publication Critical patent/JP2019207645A/ja
Application granted granted Critical
Publication of JP7127365B2 publication Critical patent/JP7127365B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)

Description

本発明は、文字切り出し装置、文字切り出し方法、及びプログラムに係り、詳細には、画像から文字を読取り、認識するOCR(Optical Character Recognition/Reader)における文字の切り出し処理に関する。
近年、多量の名刺、手紙、葉書、文献リスト等を画像読み取り装置で読み取って資料化する、いわゆるデータベース化が行われている。例えば、運転免許証の券面画像を光学的に読み取り、読み取った画像情報から文字認識を行って文字コードに変換し(OCR)、データベース化する作業が行われている。
画像から文字を認識する手順としては、まず、文字列の画像から各文字の画像を切り出す処理である文字切り出し処理を行い、次に切り出された文字画像がどの文字に対応しているかを判別し文字コード(JISコード)に変換する文字変換処理を行う。上述の文字切り出し処理において、一般的な文章であれば、文中に全角文字と半角文字が混在することがなく、かつ文字ピッチも一定であることが多いため、所定の規則に従って画像から文字を切り出すことができる。例えば、特許文献1には、運転免許証の免許番号部の文字切り出しに関する発明が開示されている。また、特許文献2には、名刺の文字切り出しに関する発明が開示されている。
特許6080259号公報 特開平08-185485号公報
しかしながら、運転免許証の住所欄は1行に文字列を収める必要があるため、全角文字、半角文字、2/3角文字が混在し、文字ピッチも一定ではない。そのため、一文字ごとの切り出しが非常に困難であった。上述の特許文献1の発明は、段落[0033]に「識別文字は、文字の大きさ(幅や高さ)がほぼ同じであり、文字と文字との間にはスペース(空白区間)が形成されている。」と記載されているように、文字の大きさや文字間スペースが均等であることが前提となっている。また、特許文献2に係る発明は、段落[0007]に「各文字列毎に、文字列に属する文字の最大高さMAX(Hi)を求め、隣り合う文字間隔長Diが(2/3)・MAX(Hi)以上であれば単語の区切りとする」と記載されているように、文字の区切りを文字の高さから算出している。そのため、運転免許証の住所欄のように様々な文字サイズや文字ピッチが混在する文字列に適用することができないものであった。
本発明は、このような課題に鑑みてなされたもので、様々な文字サイズや文字ピッチが混在する文字列の画像から正確に各文字を切り出すことが可能な文字切り出し装置、文字切り出し方法、及びプログラムを提供することを目的とする。
前述した課題を解決するための第1の発明は、文字列を含む画像を取得する画像取得手段と、取得した画像の文字列を文字毎に分割するための切出窓のサイズを設定する設定手段と、前記設定手段により設定したサイズの切出窓を用いて前記画像に含まれる文字列の右端から各文字を切り出す文字切り出し手段と、前記文字の切り出しが成功したか否かを判定する判定手段と、前記判定手段により切り出し成功と判定された文字を文字画像として記憶する記憶手段と、前記判定手段により切り出し失敗と判定された文字がある場合に、前記切出窓に対する前記画像のサイズを相対的に変更するサイズ変更手段と、を備え、前記文字切り出し手段は、前記判定手段により切り出し失敗と判定された文字について前記サイズ変更手段により変更されたサイズで文字の切り出しを行うことを特徴とする文字切り出し装置である。
第1の発明によれば、文字切り出し装置は、文字列を含む画像を取得し、取得した画像の文字列を文字毎に分割するための切出窓のサイズを設定し、設定したサイズの切出窓を用いて前記画像に含まれる文字列の右端から各文字を切り出す。また、文字の切り出しが成功したか否かを判定し、切り出し成功と判定された文字を文字画像として記憶する。切り出し失敗と判定された文字がある場合に、切出窓に対する前記画像のサイズを相対的に変更し、切り出し失敗と判定された文字の切り出しを行う。これにより、文字列に、様々な文字サイズや文字ピッチが混在していても、切り出すサイズを変更しながら文字を切り出せるため、正確に文字を切り出すことが可能となる。
第1の発明において、前記サイズ変更手段は、前記画像のサイズを変更することにより、前記切出窓に対する画像のサイズを相対的に変更してもよい。また、前記サイズ変更手段は、前記切出窓の幅を変更することにより、前記切出窓に対する画像のサイズを相対的に変更してもよい。
また、前記判定手段は、切り出した文字間に所定ドット数以上の隙間が有るか否か、及び、前記切出窓内に文字が収まるか否かに基づいて文字の切り出しが成功したか否かを判定してもよい。
また、前記サイズ変更手段は、前記切出窓のサイズを、半角から全角まで徐々に拡げ、文字の切り出しが成功する最大のサイズに変更してもよい。
第2の発明は、コンピュータが、文字列を含む画像を取得する画像取得ステップと、取得した画像の文字列を文字毎に分割するための切出窓のサイズを設定する設定ステップと、設定したサイズの切出窓を用いて前記画像に含まれる文字列の右端から各文字を切り出す文字切り出しステップと、前記文字の切り出しが成功したか否かを判定する判定ステップと、前記判定ステップにより切り出し成功と判定された文字を文字画像として記憶する記憶ステップと、前記判定ステップにより切り出し失敗と判定された文字がある場合に、前記切出窓に対する前記画像のサイズを相対的に変更するサイズ変更ステップと、を含み、前記文字切り出しステップは、前記判定ステップにより切り出し失敗と判定された文字について前記サイズ変更ステップにより変更されたサイズで文字の切り出しを行うことを特徴とする文字切り出し方法である。
第2の発明によれば、コンピュータは、文字列を含む画像を取得し、取得した画像の文字列を文字毎に分割するための切出窓のサイズを設定し、設定したサイズの切出窓を用いて前記画像に含まれる文字列の右端から各文字を切り出す。また、文字の切り出しが成功したか否かを判定し、切り出し成功と判定された文字を文字画像として記憶する。切り出し失敗と判定された文字がある場合に、切出窓に対する前記画像のサイズを相対的に変更し、切り出し失敗と判定された文字の切り出しを行う。これにより、文字列に様々な文字サイズや文字ピッチが混在していても、切り出すサイズを変更しながら文字を切り出せるため、正確に文字を切り出すことが可能となる。
第3の発明は、コンピュータを、文字列を含む画像を取得する画像取得手段、取得した画像の文字列を文字毎に分割するための切出窓のサイズを設定する設定手段、前記設定手段により設定したサイズの切出窓を用いて前記画像に含まれる文字列の右端から各文字を切り出す文字切り出し手段、前記文字の切り出しが成功したか否かを判定する判定手段、前記判定手段により切り出し成功と判定された文字を文字画像として記憶する記憶手段、前記判定手段により切り出し失敗と判定された文字がある場合に、前記切出窓に対する前記画像のサイズを相対的に変更するサイズ変更手段、として機能させ、前記文字切り出し手段は、前記判定手段により切り出し失敗と判定された文字について前記サイズ変更手段により変更されたサイズで文字の切り出しを行うことを特徴とするプログラムである。
第3の発明によれば、コンピュータを第1の発明の文字切り出し装置として機能させることが可能となる。
本発明により、様々な文字サイズや文字ピッチが混在する文字列の画像から正確に各文字を切り出すことが可能な文字切り出し装置、文字切り出し方法、及びプログラムを提供できる。
本発明に係る文字切り出し装置1の機能構成を示すブロック図 文字切り出し装置1として機能するコンピュータの内部構成図 文字切り出し処理の流れを示すフローチャート 切出窓に対して画像のサイズを変更しながら文字を切り出す例について説明する図 分割判定について説明する図 切出窓のサイズを変更しながら文字を切り出す例について説明する図
以下、図面に基づいて本発明の実施形態を詳細に説明する。なお、以下の実施の形態では、運転免許証の住所欄の文字切り出し方法について説明するが、本発明の適用範囲は運転免許証の住所欄に限定されず、様々な文字サイズや文字ピッチが混在する文字列について適用できる。
[第1の実施の形態]
図1は、本発明に係る文字切り出し装置1の機能構成を示すブロック図、図2は、文字切り出し装置1として機能するコンピュータの内部構成の例を示す図である。文字切り出し装置1は、画像から文字を認識するOCR等の前処理である文字切り出し処理を行う装置である。
図1に示すように、文字切り出し装置1は、画像取得部2、サイズ設定部3、文字切り出し部4、分割判定部5、記憶部6、及びサイズ変更部7を備える。記憶部6には、文字切り出し部4により切り出された文字画像61が記憶される。
画像取得部2は、画像を取得し、文字切り出し装置1に入力する。入力する画像(以下、入力画像と呼ぶ)は、文字列を含む画像である。画像取得部2は、図1に示すように、スキャナ20により読み取った画像を直接スキャナ20から取得してもよいし、記憶部6(12)や記録媒体等に記憶されている画像を取得してもよい。スキャナ20は、読取り対象の媒体(例えば、運転免許証等)から文字や画像等を光学的に読み込み、デジタル画像データに変換して出力する装置である。
サイズ設定部3は、画像取得部2により取得した入力画像に含まれる文字列を文字毎に分割する(切り出す)ための範囲を示す切出窓のサイズを設定する。初期状態では、例えば、全角文字を切り出せるサイズとする。
文字切り出し部4は、サイズ設定部3により設定したサイズの切出窓を用いて入力画像に含まれる文字列から各文字を切り出す(分割する)。また、サイズ設定部3により設定したサイズでは、文字の切り出しが失敗してしまう場合には、サイズ変更部7により画像と切出窓とのサイズを相対的に変更させて文字の切り出しを行う。このようにして、切り出しサイズの変更を繰り返しながら、文字列の始端(例えば、右端)から終端(例えば、左端)まで文字の切り出しを行う。文字切り出し処理の詳細については後述する。
分割判定部5は、文字切り出し部4による文字の切り出し(分割)が成功したか否かを判定する。分割判定部5による判定条件は、少なくとも、文字間に所定ドット数(例えば、1ドット)以上の隙間が有るか、及び、切出窓に文字が収まっているかを含む。分割判定についての詳細は後述する。
記憶部12は、判定部5により分割成功と判定された文字を文字画像61として記憶する。例えば、「山」、「2」、「-」等のように一文字ずつの文字画像61が記憶部12に記憶される。なお、文字切り出し処理の後に行われるOCRの文字変換処理において、複数の文字画像から複数の文字を認識できるように辞書が学習されている場合には、上述の文字画像61が2文字以上を含んでいてもよい。
サイズ変更部7は、判定部5により分割失敗と判定された文字がある場合に、切出窓に対する入力画像のサイズを相対的に変更する。切出窓に対する入力画像のサイズを相対的に変更するとは、切出窓のサイズを固定して入力画像のサイズを変更(本実施の形態では、画像のサイズを拡大(引き延ばし))するか、または、入力画像のサイズを固定して切出窓の幅を変更することである。
入力画像のサイズを変更する場合、サイズ変更部7は、例えば、全角サイズの切出窓に対して、画像を徐々に拡大し、文字の切り出しが成功するサイズに変更する。切出窓のサイズを変更する場合、サイズ変更部7は、例えば、半角文字のサイズから全角文字のサイズまでの範囲で切出窓を徐々に広げ、文字の切り出しが成功する最大のサイズに変更する。サイズ変更部7による切出窓(または入力画像データ)のサイズの変更については後述する(図4、図6等)。
図2は、文字切り出し装置1として機能させるコンピュータの構成例を示す図である。図2に示すように、文字切り出し装置1は、制御部11、記憶部12、メディア入出力部13、通信制御部14、入力部15、表示部16、周辺機器I/F部17等がバス19を介して接続されて構成される。周辺機器I/F部17には、スキャナ20(図1)が接続される。コンピュータを文字切り出し装置1として機能させる場合、コンピュータの制御部11は、図3に示す処理を記述したプログラムを実行することにより実現する。
制御部11は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)等により構成される。CPUは、記憶部12、ROM、記録媒体等に格納されるプログラムをRAM上のワークメモリ領域に呼び出して実行し、バス18を介して接続された各部を駆動制御する。ROMは、コンピュータのブートプログラムやBIOS等のプログラム、データ等を恒久的に保持する。RAMは、ロードしたプログラムやデータを一時的に保持するとともに、制御部11が各種処理を行うために使用するワークエリアを備える。制御部11は、上記プログラムを読み出して実行することにより、文字切り出し装置1の各手段(画像取得部2、サイズ設定部3、文字切り出し部4、分割判定部5、記憶部6、及びサイズ変更部7)として機能する。本実施の形態において、RAMは、後述する文字切り出し処理において切り出した文字を記憶する記憶部6として機能する。
記憶部12は、例えば、ハードディスクドライブ等の記憶装置である。記憶部12には制御部11が実行するプログラムや、プログラム実行に必要なデータ、オペレーティングシステム等が格納されている。これらのプログラムコードは、制御部11により必要に応じて読み出されてRAMに移され、CPUに読み出されて実行される。
メディア入出力部13は、例えば、CD、DVD、MO等の各種記録媒体(メディア)のドライブ装置であり、メディアに対してデータの入出力(書込み/読み出し)を行う。
通信制御部14は、通信制御装置、通信ポート等を有し、ネットワーク8等との通信を制御する。ネットワーク8は、LAN(Local Area Network)や、より広域に通信接続されたWAN(Wide Area Network)、またはインターネット等の公衆の通信回線、基地局等を含む。ネットワーク8は有線、無線を問わない。文字切り出し装置1はネットワーク8を介してサーバ(不図示)にアクセスし、各種のプログラムやデータを送受信可能な構成としてもよい。
入力部15は、例えば、タッチパネル、キーボード、マウス等のポインティング・デバイス、テンキー等の入力装置であり、入力されたデータを制御部11へ出力する。
表示部16は、例えば液晶パネル、CRTモニタ等のディスプレイ装置と、ディスプレイ装置と連携して表示処理を実行するための論理回路(ビデオアダプタ等)で構成され、制御部11の制御により入力された表示情報をディスプレイ装置上に表示させる。なお、入力部15及び表示部16は、表示画面にタッチパネル等の入力装置を一体的に設けたタッチパネルディスプレイとしてもよい。
周辺機器I/F(インタフェース)部17は、周辺機器を接続させるためのポートであり、周辺機器I/F部17を介して周辺機器とのデータの送受信を行う。周辺機器I/F部17は、USB等で構成されており、通常複数の周辺機器I/Fを有する。周辺機器との接続形態は有線、無線を問わない。
バス19は、各装置間の制御信号、データ信号等の授受を媒介する経路である。
次に、図3を参照して、文字切り出し装置1が実行する文字切り出し処理の流れについて説明する。図3は文字切り出し処理の流れを説明するフローチャートである。文字切り出し装置1の制御部11は記憶部12から図3に示す処理に関するプログラム及びデータを読み出し、このプログラム及びデータに基づいて処理を実行する。
まず、文字切り出し装置1の制御部11(画像取得部2)は、スキャナ20により読み込んだ画像または記憶部12等に記憶された画像を入力画像として取得する(ステップS101)。ステップS101で取得する入力画像31は、文字列を含む画像であり、以下の例では、運転免許証の住所欄の画像とする。
運転免許証の住所欄の文字サイズには、下記のパターンがある。
(1)すべて全角
(2)全角(都道府県市町村)→半角または2/3角(番地)
(3)全角(都道府県市町村)→半角または2/3角(番地)→全角(「号」や漢字のアパート)
(3)には、
・半角(2/3角)→全角→半角(2/3角)→全角
・(2/3角)→全角→半角(2/3角)
の場合もあり得る。
制御部11(サイズ設定部3)は、ステップS101で取得した画像の文字列を文字毎に分割するための切出窓のサイズを設定する(ステップS102)。そして、制御部11(文字切り出し部4)はステップS102で設定したサイズの切出窓を用いて、入力画像に含まれる文字列から各文字を切り出す(ステップS103)。
ここで、図4(a)に示す入力画像31から各文字を切り出す例について説明する。
ステップS102において、制御部11は、切出窓のサイズを全角サイズに設定する。図4に示す、文字列中に等間隔で設定された縦線が切出窓であり、切出窓のサイズとは縦線の間隔である。制御部11は、文字列の端部(ここでは、右端)から切出窓を位置合わせし、文字の切り出し(分割)を行う。文字の切り出しでは、制御部11は、切出窓の各縦線と各文字との位置関係に基づき、分割判定を行う(ステップS104)。
分割判定では、制御部11(分割判定部5)は切出窓(縦線)で分割される文字と文字との間に所定ドット数(例えば、1ドット)以上の隙間が有るか、及び、切出窓に文字がかかっていないか(収まっているか)に基づいて文字の切り出しが成功したか否かを判定する。図5(a)に示すように、文字と文字の間に所定ドット数(例えば、1ドット)以上の隙間が有り、かつ、切出窓に文字がかかっていない場合は切り出し成功(分割成功)と判定する。文字間ピッチが文字列の途中で崩れる場合や、文字サイズが文字列の途中で変わった場合は、図5(b)に示すように、同じサイズの切出窓では、すべての文字を切り出すことができない。図5(b)の例では、「東京都心」の文字列のうち「東」「京」は切り出し成功(分割成功)であるが、「京」と「都」の間で文字ピッチが広くなったため、「都」と「新」の切り出しが失敗(分割失敗)となっている。
図4(a)の説明に戻る。初回の文字切り出しでは、制御部11は、文字列の画像31の右端側から全角サイズの切出窓を重ね合わせ、文字列の右端の文字から1文字ずつ分割判定を行う。制御部11は、分割が成功していると判定した場合は、切り出し(分割)が成功した各文字を切り出した順(右から左の順)に記憶部6に記憶する(ステップS105)。そして、文字列の終端まで切り出しが終了しているかを判定し(ステップS106)、文字列の終端ではない場合は(ステップS106;No)、次の文字(左隣の文字)の切り出し及び分割判定を行う(ステップS107→ステップS103、ステップS104)。
図4(a)の例では、「東かえで野団地8-202」の部分の各文字はステップS102で設定したサイズの切出窓による分割が成功しており、「東」の文字の左隣の「1」は切出窓(縦線)に収まっていない。したがって、「東」の左隣の「1」は切り出しが失敗している。ここまでの処理で、切り出し(分割)が成功した各文字「東」「か」「え」「で」「野」「団」「地」「8」「-」「2」「0」「2」が切り出した順に記憶部6に記憶される(ステップS104;Yes→ステップS105)。
ステップS104の分割判定において、切り出しが失敗した場合(この例では、「東」の左隣の「1」)は(ステップS104;No)、ステップS108へ移行する。
制御部11(サイズ変更部7)は、画像のサイズを変更(拡大)して、「1」を分割可能なサイズとする(ステップS108)。すなわち、図4(b)のように、「1」を分割可能となるまで、画像を拡大する。
「1」を分割可能となるまで画像のサイズを変更すると、ステップS103へ戻り、文字の切り出し(ステップS103)、分割判定を行う(ステップS104)。図4(b)の例では、「1」の文字はステップS108で変更した画像サイズで分割が成功するが、「1」の文字の左隣の「-」は切出窓(縦線)に収まっていない。したがって、「-」は切り出しが失敗している。そのため、切り出し(分割)が成功した文字「1」が記憶部6に記憶される(ステップS108→ステップS103~ステップS105)。
次の文字「-」以降についても、画像のサイズを変更しながら、ステップS103~ステップS108の処理を繰り返す。図4(c)のように、「9」「-」「2」「-」が順に切り出され、記憶部6に保存される。「町」は「9」「-」「2」「-」を切り出したサイズと同じサイズでは分割に失敗するため、画像のサイズを変更する。
「東京都立川市南町」の部分についても、画像のサイズを変更しながら、ステップS103~ステップS108の処理を繰り返す。図4(d)のように、「都」「立」「川」「市」「南」「町」が順に切り出され、記憶部6に保存される。
このように、画像と切出窓のサイズを相対的に変更しながら文字列の最後まで文字の切り出しを行い(ステップS106;Yes)、残りの文字列がなくなると処理を終了する。
なお、上述の実施形態では、文字列の右端から切り出しを行ったが、本発明は、この例に限定されず、文字列の左端から切出窓を合わせ、切り出しを行うものとしてもよい。文字列の右端から切り出しを行うのは、住所に含まれる番地や部屋番号等の半角文字を確実に切り出すためである(免許証の住所欄等では、番地や部屋番号等の数字は半角で記載されることが多い)。
[第2の実施の形態]
第1の実施の形態(図4)の例では、切出窓のサイズを固定のまま、画像のサイズを拡大して位置を合わせ、文字を切り出したが、画像のサイズを固定して切出窓のサイズを変更してもよい。
図6を参照して、切出窓のサイズを変更して文字を切り出す例について説明する。なお、文字切り出し装置1の構成は、第1の実施の形態(図1及び図2)と同様であり、文字切り出し処理の手順は、図3のフローチャートと同様である。
まず、文字切り出し装置1の制御部11(画像取得部2)は、スキャナ20により読み込んだ画像または記憶部12に記憶された画像を入力画像として取得する(ステップS101)。図6(a)に示すように、読み込んだ文字列の画像は、全角と半角が混在する。
制御部11(サイズ設定部3)は、ステップS101で取得した画像の文字列を文字毎に分割するための切出窓のサイズを設定する(ステップS102)。そして、制御部11(文字切り出し部4)はステップS102で設定したサイズの切出窓を用いて、入力画像に含まれる文字列から各文字を切り出す(ステップS103)。
図6(a)に示す入力画像は、「東京都立川市南町」が全角で、「9-2-1 東かえで野団地8-202」が半角サイズである。制御部11は、文字幅が小さい右端から文字の切り出しを開始する。ステップS102において、制御部11は(分割判定部5)、切出窓を幅方向に徐々に広げながら分割判定を行う(ステップS104)。制御部11は、切出窓のサイズを、半角から200%(全角)まで徐々に引き伸ばし、文字の切り出しが成功する最大のサイズに設定する。
図6の例では、まず文字列の右端側である「-1 東かえで野団地8-202」までがステップS102で設定したサイズの切出窓により切り出され、記憶部6に保存される(ステップS104;Yes→ステップS105、図6(b))。切出した「-」の隣の「2」の文字には切出窓が重なってしまうので切出し失敗となる。
切り出しが失敗した場合は(ステップS104;No)、制御部11(サイズ変更部7)は、切出窓のサイズを変更する(ステップS108)。図6(b)の下段に示すように、「9-2」が、変更したサイズの切出窓で切り出され記憶部6に記憶される。
制御部11は、ステップS103~ステップS108までの処理を繰り返す。図6(c)では、サイズ変更した切出窓により「東京都立川市南町」までが切り出された(分割された)状態を示している。
なお、全角と半角が混在する文字列の場合、注意すべきは、例えば「北」のように漢字の中央に隙間がある場合である。この場合、半角サイズの切出窓で分割を行うと、「北」の漢字の右側部分(つくり)がカタカナの「ヒ」として認識されてしまうという問題が発生する。しかし、本実施の形態のように、切出窓のサイズを半角から開始し200%の全角まで徐々に拡げていき、分割成功したサイズのうち最も引き伸ばせたサイズを優先とすれば、漢字の一部を半角カタカナと誤認識してしまうことを防ぐことができる。その際、文字ピッチによっては半角2文字が1つの枠(切出窓の1枠)に収まってしまうことがあるが、半角2文字は正確に認識できるよう、辞書を学習しておくことが望ましい。
以上、添付図面を参照して、本発明に係る文字切り出し装置等の好適な実施形態について説明したが、本発明は係る例に限定されない。当業者であれば、本願で開示した技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
1………………………文字切り出し装置(コンピュータ)
11……………………制御部
12……………………記憶部
13……………………メディア入出力部
14……………………通信制御部
15……………………入力部
16……………………表示部
17……………………周辺機器I/F部
19……………………バス
20……………………スキャナ
2………………………画像取得部
3………………………サイズ設定部
4………………………文字切り出し部
5………………………分割判定部
6………………………記憶部
7………………………サイズ変更部
8………………………ネットワーク
31……………………入力画像
61……………………文字画像


Claims (7)

  1. 文字列を含む画像を取得する画像取得手段と、
    取得した画像の文字列を文字毎に分割するための切出窓のサイズを設定する設定手段と、
    前記設定手段により設定したサイズの切出窓を用いて前記画像に含まれる文字列の右端から各文字を切り出す文字切り出し手段と、
    前記文字の切り出しが成功したか否かを判定する判定手段と、
    前記判定手段により切り出し成功と判定された文字を文字画像として記憶する記憶手段と、
    前記判定手段により切り出し失敗と判定された文字がある場合に、前記切出窓に対する前記画像のサイズを相対的に変更するサイズ変更手段と、を備え、
    前記文字切り出し手段は、
    前記判定手段により切り出し失敗と判定された文字について前記サイズ変更手段により変更されたサイズで文字の切り出しを行うことを特徴とする文字切り出し装置。
  2. 前記サイズ変更手段は、前記画像のサイズを変更することにより、前記切出窓に対する画像のサイズを相対的に変更することを特徴とする請求項1に記載の文字切り出し装置。
  3. 前記サイズ変更手段は、前記切出窓の幅を変更することにより、前記切出窓に対する画像のサイズを相対的に変更することを特徴とする請求項1に記載の文字切り出し装置。
  4. 前記判定手段は、
    切り出した文字間に所定ドット数以上の隙間が有るか否か、及び、前記切出窓内に文字が収まるか否かに基づいて文字の切り出しが成功したか否かを判定することを特徴とする請求項1から請求項3のいずれかに記載の文字切り出し装置。
  5. 前記サイズ変更手段は、前記切出窓のサイズを、半角から全角まで徐々に拡げ、文字の切り出しが成功する最大のサイズに変更することを特徴とする請求項3に記載の文字切り出し装置。
  6. コンピュータが、
    文字列を含む画像を取得する画像取得ステップと、
    取得した画像の文字列を文字毎に分割するための切出窓のサイズを設定する設定ステップと、
    設定したサイズの切出窓を用いて前記画像に含まれる文字列の右端から各文字を切り出す文字切り出しステップと、
    前記文字の切り出しが成功したか否かを判定する判定ステップと、
    前記判定ステップにより切り出し成功と判定された文字を文字画像として記憶する記憶ステップと、
    前記判定ステップにより切り出し失敗と判定された文字がある場合に、前記切出窓に対する前記画像のサイズを相対的に変更するサイズ変更ステップと、を含み、
    前記文字切り出しステップは、
    前記判定ステップにより切り出し失敗と判定された文字について前記サイズ変更ステップにより変更されたサイズで文字の切り出しを行うことを特徴とする文字切り出し方法。
  7. コンピュータを、
    文字列を含む画像を取得する画像取得手段、
    取得した画像の文字列を文字毎に分割するための切出窓のサイズを設定する設定手段、
    前記設定手段により設定したサイズの切出窓を用いて前記画像に含まれる文字列の右端から各文字を切り出す文字切り出し手段、
    前記文字の切り出しが成功したか否かを判定する判定手段、
    前記判定手段により切り出し成功と判定された文字を文字画像として記憶する記憶手段、
    前記判定手段により切り出し失敗と判定された文字がある場合に、前記切出窓に対する前記画像のサイズを相対的に変更するサイズ変更手段、として機能させ、
    前記文字切り出し手段は、
    前記判定手段により切り出し失敗と判定された文字について前記サイズ変更手段により変更されたサイズで文字の切り出しを行う
    ことを特徴とするプログラム。
JP2018103857A 2018-05-30 2018-05-30 文字切り出し装置、文字切り出し方法、及びプログラム Active JP7127365B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018103857A JP7127365B2 (ja) 2018-05-30 2018-05-30 文字切り出し装置、文字切り出し方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018103857A JP7127365B2 (ja) 2018-05-30 2018-05-30 文字切り出し装置、文字切り出し方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2019207645A JP2019207645A (ja) 2019-12-05
JP7127365B2 true JP7127365B2 (ja) 2022-08-30

Family

ID=68767775

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018103857A Active JP7127365B2 (ja) 2018-05-30 2018-05-30 文字切り出し装置、文字切り出し方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP7127365B2 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008097589A (ja) 2006-09-13 2008-04-24 Keyence Corp 文字切り出し装置、方法およびプログラム
JP2010039769A (ja) 2008-08-05 2010-02-18 Canon Inc 情報処理装置、情報処理方法及びプログラム
JP2017021695A (ja) 2015-07-14 2017-01-26 株式会社東芝 情報処理装置および情報処理方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0799532B2 (ja) * 1986-11-28 1995-10-25 富士電機株式会社 文字切出し装置
JP2800192B2 (ja) * 1988-09-13 1998-09-21 富士ゼロックス株式会社 高速文字図形分離装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008097589A (ja) 2006-09-13 2008-04-24 Keyence Corp 文字切り出し装置、方法およびプログラム
JP2010039769A (ja) 2008-08-05 2010-02-18 Canon Inc 情報処理装置、情報処理方法及びプログラム
JP2017021695A (ja) 2015-07-14 2017-01-26 株式会社東芝 情報処理装置および情報処理方法

Also Published As

Publication number Publication date
JP2019207645A (ja) 2019-12-05

Similar Documents

Publication Publication Date Title
JP3425408B2 (ja) 文書読取装置
CA2116600C (en) Methods and apparatus for inferring orientation of lines of text
JP4998219B2 (ja) 帳票認識プログラム、帳票認識装置および帳票認識方法
US10606933B2 (en) Method and system for document image layout deconstruction and redisplay
US6466694B2 (en) Document image processing device and method thereof
RU2316814C2 (ru) Способ выбора шрифта
JP3919617B2 (ja) 文字認識装置および文字認識方法、プログラムおよび記憶媒体
US8452097B2 (en) Apparatus and method for extracting circumscribed rectangles of characters in transplantable electronic document
JPH11120293A (ja) 文字認識/修正方式
Arya et al. Experiences of integration and performance testing of multilingual OCR for printed Indian scripts
JP5790082B2 (ja) 文書認識装置、文書認識方法、プログラム及び記憶媒体
CN108062301B (zh) 文字翻译方法及其装置
JP2008225695A (ja) 文字認識誤り修正装置およびプログラム
JP7127365B2 (ja) 文字切り出し装置、文字切り出し方法、及びプログラム
JP4849883B2 (ja) 行方向判定プログラム、方法及び装置
JP4810853B2 (ja) 文字画像切出装置、文字画像切出方法およびプログラム
JPH10177623A (ja) 文書認識装置および言語処理装置
JP2007018178A (ja) 文字入力装置、文字入力プログラム、および文字入力プログラムを記録する記録媒体
CN117391045B (zh) 可复制蒙文的可携带文件格式文件输出方法
JP7206644B2 (ja) 文字認識装置、文字認識方法、及びプログラム
JP4050745B2 (ja) 文章入力システム
JPS6385695A (ja) 連綿文字作成方式
CN117542056A (zh) 图文数据生成文本的方法、装置、存储介质及处理器
JP2002245470A (ja) 言語特定装置及び翻訳装置及び言語特定方法
JPH01292586A (ja) 文字認識支援装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210323

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220222

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220414

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220719

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220801

R150 Certificate of patent or registration of utility model

Ref document number: 7127365

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150