JP7127365B2 - 文字切り出し装置、文字切り出し方法、及びプログラム - Google Patents
文字切り出し装置、文字切り出し方法、及びプログラム Download PDFInfo
- Publication number
- JP7127365B2 JP7127365B2 JP2018103857A JP2018103857A JP7127365B2 JP 7127365 B2 JP7127365 B2 JP 7127365B2 JP 2018103857 A JP2018103857 A JP 2018103857A JP 2018103857 A JP2018103857 A JP 2018103857A JP 7127365 B2 JP7127365 B2 JP 7127365B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- size
- image
- clipping
- window
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Character Input (AREA)
Description
図1は、本発明に係る文字切り出し装置1の機能構成を示すブロック図、図2は、文字切り出し装置1として機能するコンピュータの内部構成の例を示す図である。文字切り出し装置1は、画像から文字を認識するOCR等の前処理である文字切り出し処理を行う装置である。
表示部16は、例えば液晶パネル、CRTモニタ等のディスプレイ装置と、ディスプレイ装置と連携して表示処理を実行するための論理回路(ビデオアダプタ等)で構成され、制御部11の制御により入力された表示情報をディスプレイ装置上に表示させる。なお、入力部15及び表示部16は、表示画面にタッチパネル等の入力装置を一体的に設けたタッチパネルディスプレイとしてもよい。
バス19は、各装置間の制御信号、データ信号等の授受を媒介する経路である。
(1)すべて全角
(2)全角(都道府県市町村)→半角または2/3角(番地)
(3)全角(都道府県市町村)→半角または2/3角(番地)→全角(「号」や漢字のアパート)
(3)には、
・半角(2/3角)→全角→半角(2/3角)→全角
・(2/3角)→全角→半角(2/3角)
の場合もあり得る。
ステップS102において、制御部11は、切出窓のサイズを全角サイズに設定する。図4に示す、文字列中に等間隔で設定された縦線が切出窓であり、切出窓のサイズとは縦線の間隔である。制御部11は、文字列の端部(ここでは、右端)から切出窓を位置合わせし、文字の切り出し(分割)を行う。文字の切り出しでは、制御部11は、切出窓の各縦線と各文字との位置関係に基づき、分割判定を行う(ステップS104)。
第1の実施の形態(図4)の例では、切出窓のサイズを固定のまま、画像のサイズを拡大して位置を合わせ、文字を切り出したが、画像のサイズを固定して切出窓のサイズを変更してもよい。
11……………………制御部
12……………………記憶部
13……………………メディア入出力部
14……………………通信制御部
15……………………入力部
16……………………表示部
17……………………周辺機器I/F部
19……………………バス
20……………………スキャナ
2………………………画像取得部
3………………………サイズ設定部
4………………………文字切り出し部
5………………………分割判定部
6………………………記憶部
7………………………サイズ変更部
8………………………ネットワーク
31……………………入力画像
61……………………文字画像
Claims (7)
- 文字列を含む画像を取得する画像取得手段と、
取得した画像の文字列を文字毎に分割するための切出窓のサイズを設定する設定手段と、
前記設定手段により設定したサイズの切出窓を用いて前記画像に含まれる文字列の右端から各文字を切り出す文字切り出し手段と、
前記文字の切り出しが成功したか否かを判定する判定手段と、
前記判定手段により切り出し成功と判定された文字を文字画像として記憶する記憶手段と、
前記判定手段により切り出し失敗と判定された文字がある場合に、前記切出窓に対する前記画像のサイズを相対的に変更するサイズ変更手段と、を備え、
前記文字切り出し手段は、
前記判定手段により切り出し失敗と判定された文字について前記サイズ変更手段により変更されたサイズで文字の切り出しを行うことを特徴とする文字切り出し装置。 - 前記サイズ変更手段は、前記画像のサイズを変更することにより、前記切出窓に対する画像のサイズを相対的に変更することを特徴とする請求項1に記載の文字切り出し装置。
- 前記サイズ変更手段は、前記切出窓の幅を変更することにより、前記切出窓に対する画像のサイズを相対的に変更することを特徴とする請求項1に記載の文字切り出し装置。
- 前記判定手段は、
切り出した文字間に所定ドット数以上の隙間が有るか否か、及び、前記切出窓内に文字が収まるか否かに基づいて文字の切り出しが成功したか否かを判定することを特徴とする請求項1から請求項3のいずれかに記載の文字切り出し装置。 - 前記サイズ変更手段は、前記切出窓のサイズを、半角から全角まで徐々に拡げ、文字の切り出しが成功する最大のサイズに変更することを特徴とする請求項3に記載の文字切り出し装置。
- コンピュータが、
文字列を含む画像を取得する画像取得ステップと、
取得した画像の文字列を文字毎に分割するための切出窓のサイズを設定する設定ステップと、
設定したサイズの切出窓を用いて前記画像に含まれる文字列の右端から各文字を切り出す文字切り出しステップと、
前記文字の切り出しが成功したか否かを判定する判定ステップと、
前記判定ステップにより切り出し成功と判定された文字を文字画像として記憶する記憶ステップと、
前記判定ステップにより切り出し失敗と判定された文字がある場合に、前記切出窓に対する前記画像のサイズを相対的に変更するサイズ変更ステップと、を含み、
前記文字切り出しステップは、
前記判定ステップにより切り出し失敗と判定された文字について前記サイズ変更ステップにより変更されたサイズで文字の切り出しを行うことを特徴とする文字切り出し方法。 - コンピュータを、
文字列を含む画像を取得する画像取得手段、
取得した画像の文字列を文字毎に分割するための切出窓のサイズを設定する設定手段、
前記設定手段により設定したサイズの切出窓を用いて前記画像に含まれる文字列の右端から各文字を切り出す文字切り出し手段、
前記文字の切り出しが成功したか否かを判定する判定手段、
前記判定手段により切り出し成功と判定された文字を文字画像として記憶する記憶手段、
前記判定手段により切り出し失敗と判定された文字がある場合に、前記切出窓に対する前記画像のサイズを相対的に変更するサイズ変更手段、として機能させ、
前記文字切り出し手段は、
前記判定手段により切り出し失敗と判定された文字について前記サイズ変更手段により変更されたサイズで文字の切り出しを行う
ことを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018103857A JP7127365B2 (ja) | 2018-05-30 | 2018-05-30 | 文字切り出し装置、文字切り出し方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018103857A JP7127365B2 (ja) | 2018-05-30 | 2018-05-30 | 文字切り出し装置、文字切り出し方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019207645A JP2019207645A (ja) | 2019-12-05 |
JP7127365B2 true JP7127365B2 (ja) | 2022-08-30 |
Family
ID=68767775
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018103857A Active JP7127365B2 (ja) | 2018-05-30 | 2018-05-30 | 文字切り出し装置、文字切り出し方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7127365B2 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008097589A (ja) | 2006-09-13 | 2008-04-24 | Keyence Corp | 文字切り出し装置、方法およびプログラム |
JP2010039769A (ja) | 2008-08-05 | 2010-02-18 | Canon Inc | 情報処理装置、情報処理方法及びプログラム |
JP2017021695A (ja) | 2015-07-14 | 2017-01-26 | 株式会社東芝 | 情報処理装置および情報処理方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0799532B2 (ja) * | 1986-11-28 | 1995-10-25 | 富士電機株式会社 | 文字切出し装置 |
JP2800192B2 (ja) * | 1988-09-13 | 1998-09-21 | 富士ゼロックス株式会社 | 高速文字図形分離装置 |
-
2018
- 2018-05-30 JP JP2018103857A patent/JP7127365B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008097589A (ja) | 2006-09-13 | 2008-04-24 | Keyence Corp | 文字切り出し装置、方法およびプログラム |
JP2010039769A (ja) | 2008-08-05 | 2010-02-18 | Canon Inc | 情報処理装置、情報処理方法及びプログラム |
JP2017021695A (ja) | 2015-07-14 | 2017-01-26 | 株式会社東芝 | 情報処理装置および情報処理方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2019207645A (ja) | 2019-12-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3425408B2 (ja) | 文書読取装置 | |
CA2116600C (en) | Methods and apparatus for inferring orientation of lines of text | |
JP4998219B2 (ja) | 帳票認識プログラム、帳票認識装置および帳票認識方法 | |
US10606933B2 (en) | Method and system for document image layout deconstruction and redisplay | |
US6466694B2 (en) | Document image processing device and method thereof | |
RU2316814C2 (ru) | Способ выбора шрифта | |
JP3919617B2 (ja) | 文字認識装置および文字認識方法、プログラムおよび記憶媒体 | |
US8452097B2 (en) | Apparatus and method for extracting circumscribed rectangles of characters in transplantable electronic document | |
JPH11120293A (ja) | 文字認識/修正方式 | |
Arya et al. | Experiences of integration and performance testing of multilingual OCR for printed Indian scripts | |
JP5790082B2 (ja) | 文書認識装置、文書認識方法、プログラム及び記憶媒体 | |
CN108062301B (zh) | 文字翻译方法及其装置 | |
JP2008225695A (ja) | 文字認識誤り修正装置およびプログラム | |
JP7127365B2 (ja) | 文字切り出し装置、文字切り出し方法、及びプログラム | |
JP4849883B2 (ja) | 行方向判定プログラム、方法及び装置 | |
JP4810853B2 (ja) | 文字画像切出装置、文字画像切出方法およびプログラム | |
JPH10177623A (ja) | 文書認識装置および言語処理装置 | |
JP2007018178A (ja) | 文字入力装置、文字入力プログラム、および文字入力プログラムを記録する記録媒体 | |
CN117391045B (zh) | 可复制蒙文的可携带文件格式文件输出方法 | |
JP7206644B2 (ja) | 文字認識装置、文字認識方法、及びプログラム | |
JP4050745B2 (ja) | 文章入力システム | |
JPS6385695A (ja) | 連綿文字作成方式 | |
CN117542056A (zh) | 图文数据生成文本的方法、装置、存储介质及处理器 | |
JP2002245470A (ja) | 言語特定装置及び翻訳装置及び言語特定方法 | |
JPH01292586A (ja) | 文字認識支援装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210323 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220124 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220222 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220414 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220719 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220801 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7127365 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |