JPS6334680A - 文字読取装置 - Google Patents
文字読取装置Info
- Publication number
- JPS6334680A JPS6334680A JP17846386A JP17846386A JPS6334680A JP S6334680 A JPS6334680 A JP S6334680A JP 17846386 A JP17846386 A JP 17846386A JP 17846386 A JP17846386 A JP 17846386A JP S6334680 A JPS6334680 A JP S6334680A
- Authority
- JP
- Japan
- Prior art keywords
- character
- main character
- subscript
- main
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 claims abstract description 21
- 239000010979 ruby Substances 0.000 claims description 5
- 229910001750 ruby Inorganic materials 0.000 claims description 5
- 238000000605 extraction Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 102100039250 Essential MCU regulator, mitochondrial Human genes 0.000 description 1
- 101000813097 Homo sapiens Essential MCU regulator, mitochondrial Proteins 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000034 method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
[発明の目的]
(産業上の利用分野)
本発明は、特に書籍、雑誌および新聞等の紙面から文字
を読取る際に好適する文字読取装置に関する。
を読取る際に好適する文字読取装置に関する。
(従来の技術)
従来から、各種事務処理分野において光学的文字読取装
置が広く用いられており、近年、ジレーナリズムの分野
にも普及しつつある。
置が広く用いられており、近年、ジレーナリズムの分野
にも普及しつつある。
この分野では、たとえば書籍や雑誌および新聞の紙面等
の帳票を文字読取装置により読取らせることが行なわれ
ている。
の帳票を文字読取装置により読取らせることが行なわれ
ている。
ところで、上)ボした書籍、雑誌および新聞等の帳票で
は、主文字に対して、たとえばふりがな等のルビ、サイ
ドライン、アンダーライン、傍点等の添字か付されてい
る場合がある。
は、主文字に対して、たとえばふりがな等のルビ、サイ
ドライン、アンダーライン、傍点等の添字か付されてい
る場合がある。
しかしながら、従来の文字読取装置では、主文字以外の
領域のデータは無視されているため、これらの添字を読
取ることが不可能であった。このため、特に特殊なふり
がなを必要とする場合があってもその情報前ることがで
きず、たとえば書籍の再版等を行なう場合にこれらの情
報が欠けてしまい、伯の手段でこれらを入力しなければ
ならないという問題があった。
領域のデータは無視されているため、これらの添字を読
取ることが不可能であった。このため、特に特殊なふり
がなを必要とする場合があってもその情報前ることがで
きず、たとえば書籍の再版等を行なう場合にこれらの情
報が欠けてしまい、伯の手段でこれらを入力しなければ
ならないという問題があった。
(発明が解決しようとする問題点)
本発明は上述した従来の問題点を解決するためのもので
、書籍、雑誌および新聞等の帳票の読取を行なう場合に
、主文字に対して添字が存在する場合にもその読取を可
能とした文字読取装置を提供することを目的とする。
、書籍、雑誌および新聞等の帳票の読取を行なう場合に
、主文字に対して添字が存在する場合にもその読取を可
能とした文字読取装置を提供することを目的とする。
[発明の構成]
(問題点を解決するための手段)
本発明は上記目的を達成するために、帳票に記録された
文字の文字イメージをに読取る読取部と、この読取部か
ら出力される文字イメージを格納するイメージ格納手段
と、このイメージ格納手段に格納された文字イメージか
ら主文字パターンおよびこの主文字パターンに付帯する
添字文字パターンを1文字ずつ切出す検出切出手段と、
この検出切出手段によって出力される主文字パターンお
よび添字文字パターンを認識する文字認識部と、前記主
文字パターンのKK ’tk結果にその主文字パターン
に付帯する添字文字パターンの認識結果を付加して出力
する出力手段とを具漏したものである。
文字の文字イメージをに読取る読取部と、この読取部か
ら出力される文字イメージを格納するイメージ格納手段
と、このイメージ格納手段に格納された文字イメージか
ら主文字パターンおよびこの主文字パターンに付帯する
添字文字パターンを1文字ずつ切出す検出切出手段と、
この検出切出手段によって出力される主文字パターンお
よび添字文字パターンを認識する文字認識部と、前記主
文字パターンのKK ’tk結果にその主文字パターン
に付帯する添字文字パターンの認識結果を付加して出力
する出力手段とを具漏したものである。
(作 用)
そして本発明は上記手段により、書籍、雑誌および新聞
等の帳票の読取を行なう場合に、主文字に対して添字が
存在した場合でも正確に文字を認識して読取ることがで
きる。
等の帳票の読取を行なう場合に、主文字に対して添字が
存在した場合でも正確に文字を認識して読取ることがで
きる。
(実施例)
以下、本発明の一実施例を図面に基づいて詳細に説明す
る。
る。
第1図は本発明の一実施例の文字読取装置の構成を示す
ブロック図である。
ブロック図である。
同図において、1は読取るべき帳票を光学的に走査して
読み取りパターン信号を出力する読取部、2は帳票の1
頁分または1行毎を暫定的に格納する格納部である。ま
た、3は格納部のパターン信号を第1の切出し規則に従
って主文字領域毎を検出して切出し主文字データを出力
する第1の検出切出し手段と、前記パターン信号を第2
の切出し規則に従って前記主文字領域毎の領域外を添字
領域毎に検出して切出し添字データを出力する第2の検
出切出し手段とを備えた検出切出し部である。
読み取りパターン信号を出力する読取部、2は帳票の1
頁分または1行毎を暫定的に格納する格納部である。ま
た、3は格納部のパターン信号を第1の切出し規則に従
って主文字領域毎を検出して切出し主文字データを出力
する第1の検出切出し手段と、前記パターン信号を第2
の切出し規則に従って前記主文字領域毎の領域外を添字
領域毎に検出して切出し添字データを出力する第2の検
出切出し手段とを備えた検出切出し部である。
4は第1の検出切出し手段により得られた主文字データ
に第2の検出切出し手段により得られた添字データが存
在しない場合に、主文字データを所定の認識規則に従っ
て認識を行ない所定の主文字コードに変換し、また第1
の検出切出し手段により得られた主文字データに第2の
検出切出し手段により得られた添字データが存在する場
合に、主文字データを所定の認識規則に従って認識を行
ない所定の主文字コードに変換するとともに添字データ
所定の認識規則に従って認識を行ない主文字コードに添
字情報を付加して付加文字コードに変換する文字認識部
である。また5は各部の制御を司どる制御部、6はホス
トシステムとのデータの入出力を司どるインターフェイ
ス部である。
に第2の検出切出し手段により得られた添字データが存
在しない場合に、主文字データを所定の認識規則に従っ
て認識を行ない所定の主文字コードに変換し、また第1
の検出切出し手段により得られた主文字データに第2の
検出切出し手段により得られた添字データが存在する場
合に、主文字データを所定の認識規則に従って認識を行
ない所定の主文字コードに変換するとともに添字データ
所定の認識規則に従って認識を行ない主文字コードに添
字情報を付加して付加文字コードに変換する文字認識部
である。また5は各部の制御を司どる制御部、6はホス
トシステムとのデータの入出力を司どるインターフェイ
ス部である。
このように構成された文字読取装置では、次のようにし
て帳票の文字が読取られる。
て帳票の文字が読取られる。
第2図は、読取られるべき帳票Pを示す平面図である。
この帳票Pには、横書ぎの文章の行りが表示されており
、この行りの文字は、主文字領域Aに表示された漢字や
ひらがな等の主文字Wと、主文字領域Aの上下(縦書き
の場合には左右)の添字領域Bに表示されたふりがな等
のルビ、アンダーライン(縦書きの場合にはす゛イドラ
イン〉、傍点簀の添字Wとからなっている。
、この行りの文字は、主文字領域Aに表示された漢字や
ひらがな等の主文字Wと、主文字領域Aの上下(縦書き
の場合には左右)の添字領域Bに表示されたふりがな等
のルビ、アンダーライン(縦書きの場合にはす゛イドラ
イン〉、傍点簀の添字Wとからなっている。
そしてこの帳票Pは、まず、読取部1により帳票P上に
記録された文字を含む文字パターンが光学的に読取られ
パターン信号に変換される。そりで変換されたパターン
信号の帳票Pの1頁毎あるいは1行毎を暫定的に格納部
2により格納する。
記録された文字を含む文字パターンが光学的に読取られ
パターン信号に変換される。そりで変換されたパターン
信号の帳票Pの1頁毎あるいは1行毎を暫定的に格納部
2により格納する。
この後、格納部2から上述のパターン信号を検出切出し
部3の第1の検出切出し手段により第1の切出し規則に
従って主文字領域A毎の主文字Wを検出して切出し主文
字データに変換する。また検出切出し部3の第2の検出
切出し手段により主文字領域A毎の領域外を添字領域B
毎に検出して切出し添字データに変換する。なおこの第
2の検出切出し手段による添字データは添字が存在しな
い場合には出力されないのはもちろんである。
部3の第1の検出切出し手段により第1の切出し規則に
従って主文字領域A毎の主文字Wを検出して切出し主文
字データに変換する。また検出切出し部3の第2の検出
切出し手段により主文字領域A毎の領域外を添字領域B
毎に検出して切出し添字データに変換する。なおこの第
2の検出切出し手段による添字データは添字が存在しな
い場合には出力されないのはもちろんである。
そして上述した主文字データは、文字認識部4により所
定の認識規則に従って認識が行なわれ主文字コードに変
換される。また主文字データに添字データが存在する場
合には、文字認識部4によりまず主文字データが所定の
認識規則に従って認識が行なわれ主文字コードに変換さ
れる。そして添字データが所定の認識規則に従って認識
か行なわれ主文字コードに添字情報がイ」加され付加文
字コードに変換される。
定の認識規則に従って認識が行なわれ主文字コードに変
換される。また主文字データに添字データが存在する場
合には、文字認識部4によりまず主文字データが所定の
認識規則に従って認識が行なわれ主文字コードに変換さ
れる。そして添字データが所定の認識規則に従って認識
か行なわれ主文字コードに添字情報がイ」加され付加文
字コードに変換される。
そして上)ホした主文字コードおよび付加文字コードは
インターフェイス部6を介してホストシステムに入力さ
れ所定の処理が行なわれる。
インターフェイス部6を介してホストシステムに入力さ
れ所定の処理が行なわれる。
ところで上述した主文字データおよび添字データからの
主文字コードおよび付加文字コードの処理は、以下のよ
うに行なわれる。
主文字コードおよび付加文字コードの処理は、以下のよ
うに行なわれる。
まず第2図に示した1行目の1本日は、晴天なり。」を
添字が存在しない状態としてJIS2バイトコードで表
わすと次のようになる。
添字が存在しない状態としてJIS2バイトコードで表
わすと次のようになる。
485C467G 244F 2122 4032
4537 244A[本 日 は 、
晴 天 な246八 2123 リ 。 」 そして、添字が存在する場合の付加文字コードの処理は
、添字が存在した主文字コードに、「8000Jとの論
理和を取ることによってフラグ付加が行なわれる。そし
て上述の[本日は、晴天なり。]を添字が存在する状態
としてコード処理を行なうと次のようになる。
4537 244A[本 日 は 、
晴 天 な246八 2123 リ 。 」 そして、添字が存在する場合の付加文字コードの処理は
、添字が存在した主文字コードに、「8000Jとの論
理和を取ることによってフラグ付加が行なわれる。そし
て上述の[本日は、晴天なり。]を添字が存在する状態
としてコード処理を行なうと次のようになる。
CB5CC67C244F 2122 CO3
2C537244八「 本 日 は 、
晴 天 な246A 2123 リ 。 」 これにより、主文字の添字情報が得られる。
2C537244八「 本 日 は 、
晴 天 な246A 2123 リ 。 」 これにより、主文字の添字情報が得られる。
また上述したコード処理の他に次のようにして付加文字
コードの処理を行なってもよい。
コードの処理を行なってもよい。
この付加文字コードの処理は、主文字データをJ IS
2バイトコードにより処理を行ない、主文字コートに変
換しその主文字に添字が存在する場合に対象となる主文
字コードの前後に添字情報コードを挿入して行なわれる
。この場合、第2図に示した2行目および3行目のコー
ド処理を行なうと以下のようになる。なお、AAAAは
ルビ開始コード、BBBBはルビ終了コード、CCCC
はアンダーライン間知コード(縦書ぎの場合はナイドラ
イン開始コード) 、DDDDはアンダーライン終了コ
ード(縦書きの場合はナイトライン終了コード)、EE
E[は傍点開始コード、rFFFは傍点終了コー・ドで
ある。
2バイトコードにより処理を行ない、主文字コートに変
換しその主文字に添字が存在する場合に対象となる主文
字コードの前後に添字情報コードを挿入して行なわれる
。この場合、第2図に示した2行目および3行目のコー
ド処理を行なうと以下のようになる。なお、AAAAは
ルビ開始コード、BBBBはルビ終了コード、CCCC
はアンダーライン間知コード(縦書ぎの場合はナイドラ
イン開始コード) 、DDDDはアンダーライン終了コ
ード(縦書きの場合はナイトライン終了コード)、EE
E[は傍点開始コード、rFFFは傍点終了コー・ドで
ある。
AAAA 3458 456C434F 4A
7D BBBB 2122[関 東 地
方 CCCC2/148 2433 246D 2
/148 2468 246へと こ ろ
に よ リDDDD EEEE
2448 246F 242B FFFF
AAAAに わ か 31288BBB 2123 雨 。 」 この場合では、主文字に対する詳細な添字情報が得られ
る。
7D BBBB 2122[関 東 地
方 CCCC2/148 2433 246D 2
/148 2468 246へと こ ろ
に よ リDDDD EEEE
2448 246F 242B FFFF
AAAAに わ か 31288BBB 2123 雨 。 」 この場合では、主文字に対する詳細な添字情報が得られ
る。
この実施例では、主文字に対して添字が存在する場合に
、その添字情報を主文字コードに付加することが可能で
あるため、たとえば書籍の再版を行なう場合でもその添
字情報を有効に確認することができる。
、その添字情報を主文字コードに付加することが可能で
あるため、たとえば書籍の再版を行なう場合でもその添
字情報を有効に確認することができる。
なa5上述した実施例の検出切出し部3において、帳票
の文字の始り位置を示すマスクスタート、文字の終り位
置を示すマスクエンドおよび行の始り位置を示すライン
スタート、行り終り位置を示すラインエンドや、文字サ
イズ、行数、文字数、行ピッチ、また縦書ぎあるいは横
書き等のフォーマッドコントロールを予め外部から入力
しておき、このフォーマットコントロールに従って各文
字の検出切出しを行なうようにしてもよいことはもらろ
んである。
の文字の始り位置を示すマスクスタート、文字の終り位
置を示すマスクエンドおよび行の始り位置を示すライン
スタート、行り終り位置を示すラインエンドや、文字サ
イズ、行数、文字数、行ピッチ、また縦書ぎあるいは横
書き等のフォーマッドコントロールを予め外部から入力
しておき、このフォーマットコントロールに従って各文
字の検出切出しを行なうようにしてもよいことはもらろ
んである。
なお、本発明の文字読取装置は、′I4に%3きおよび
横ISぎの帳票の読取りを行なうことができるのはもら
ろんである。
横ISぎの帳票の読取りを行なうことができるのはもら
ろんである。
[発明の効果]
以上説明したように本発明の文字読取装置は、囚籍、雑
誌および新聞等の帳票の読取を行なう場合に、主文字に
対して添字が存在した場合でも正確に文字を認識して読
取ることができる。
誌および新聞等の帳票の読取を行なう場合に、主文字に
対して添字が存在した場合でも正確に文字を認識して読
取ることができる。
第1図は本発明の一実施例の文字読取装置の構成を説明
するためのブロック図、第2図は帳票を説明するための
図である。 1・・・・・・・・・読取部 2・・・・・・・・・格納部 3・・・・・・・・・検出切出し部 4・・・・・・・・・文字認識部 5・・・・・・・・・制御部
するためのブロック図、第2図は帳票を説明するための
図である。 1・・・・・・・・・読取部 2・・・・・・・・・格納部 3・・・・・・・・・検出切出し部 4・・・・・・・・・文字認識部 5・・・・・・・・・制御部
Claims (4)
- (1)帳票に記録された文字の文字イメージを読取る読
取部と、この読取部から出力される文字イメージを格納
するイメージ格納手段と、このイメージ格納手段に格納
された文字イメージから主文字パターンおよびこの主文
字パターンに付帯する添字文字パターンを1文字ずつ切
出す検出切出手段と、この検出切出手段によつて出力さ
れる主文字パターンおよび添字文字パターンを認識する
文字認識部と、前記主文字パターンの認識結果にその主
文字パターンに付帯する添字文字パターンの認識結果を
付加して出力する出力手段とを具備したことを特徴とす
る文字読取装置。 - (2)前記添字はルビである特許請求の範囲第1項記載
の文字読取装置。 - (3)前記添字はアンダーラインおよびサイドラインで
ある特許請求の範囲第1項記載の文字読取装置。 - (4)前記添字は傍点である特許請求の範囲第1項記載
の文字読取装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP17846386A JPS6334680A (ja) | 1986-07-29 | 1986-07-29 | 文字読取装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP17846386A JPS6334680A (ja) | 1986-07-29 | 1986-07-29 | 文字読取装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS6334680A true JPS6334680A (ja) | 1988-02-15 |
Family
ID=16048955
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP17846386A Pending JPS6334680A (ja) | 1986-07-29 | 1986-07-29 | 文字読取装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6334680A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08221508A (ja) * | 1995-02-09 | 1996-08-30 | Pfu Ltd | 文字認識処理装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5699573A (en) * | 1980-01-09 | 1981-08-10 | Hitachi Ltd | Kanji (chinese character) distinction system using katakana (square form of japanese syllabary) |
JPS592191A (ja) * | 1982-06-29 | 1984-01-07 | Fujitsu Ltd | 手書き日本語文の認識処理方式 |
-
1986
- 1986-07-29 JP JP17846386A patent/JPS6334680A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5699573A (en) * | 1980-01-09 | 1981-08-10 | Hitachi Ltd | Kanji (chinese character) distinction system using katakana (square form of japanese syllabary) |
JPS592191A (ja) * | 1982-06-29 | 1984-01-07 | Fujitsu Ltd | 手書き日本語文の認識処理方式 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08221508A (ja) * | 1995-02-09 | 1996-08-30 | Pfu Ltd | 文字認識処理装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5119433A (en) | Method and system for locating the amount field on a document | |
US4962432A (en) | Selective retrieval of data from microfilm images of different forms by reading a memory index form cord (bar code) recorded on each image frame | |
US5854860A (en) | Image filing apparatus having a character recognition function | |
JPS6334680A (ja) | 文字読取装置 | |
JP3171626B2 (ja) | 文字認識の処理領域・処理条件指定方法 | |
JP3309084B2 (ja) | 図形の電子化方法 | |
JPH0991371A (ja) | 文字表示装置 | |
JPS6054082A (ja) | 光学文字読取装置 | |
JP2902694B2 (ja) | 光学式文字読取装置 | |
JP2877380B2 (ja) | 光学的文字読取装置 | |
JPH0991385A (ja) | 文字認識辞書追加方法及びこれを用いた端末ocr装置 | |
JPH0252329A (ja) | 画像情報記録・読取方法 | |
JPS61208584A (ja) | 文字読取装置 | |
JP2570571B2 (ja) | 光学文字読取装置 | |
JP2784004B2 (ja) | 文字認識装置 | |
JPS638988A (ja) | 文字読取装置 | |
JPS58111562A (ja) | フアクシミリ伝送方式 | |
JP2682456B2 (ja) | 光学文字読取装置 | |
JP2931485B2 (ja) | 文字切出し装置及び方法 | |
JPS5831028B2 (ja) | 文字認識装置 | |
JPH0820669B2 (ja) | 画像情報記録・読取方法 | |
JPS6160184A (ja) | 光学的文字読取装置 | |
JPS63188284A (ja) | 文字読取装置 | |
JPH0252328A (ja) | 画像情報読取装置 | |
JPS59180782A (ja) | 光学的文字読取装置 |