JPS6334680A - 文字読取装置 - Google Patents

文字読取装置

Info

Publication number
JPS6334680A
JPS6334680A JP17846386A JP17846386A JPS6334680A JP S6334680 A JPS6334680 A JP S6334680A JP 17846386 A JP17846386 A JP 17846386A JP 17846386 A JP17846386 A JP 17846386A JP S6334680 A JPS6334680 A JP S6334680A
Authority
JP
Japan
Prior art keywords
character
main character
subscript
main
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP17846386A
Other languages
English (en)
Inventor
Katsumi Yaguchi
矢口 克己
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP17846386A priority Critical patent/JPS6334680A/ja
Publication of JPS6334680A publication Critical patent/JPS6334680A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、特に書籍、雑誌および新聞等の紙面から文字
を読取る際に好適する文字読取装置に関する。
(従来の技術) 従来から、各種事務処理分野において光学的文字読取装
置が広く用いられており、近年、ジレーナリズムの分野
にも普及しつつある。
この分野では、たとえば書籍や雑誌および新聞の紙面等
の帳票を文字読取装置により読取らせることが行なわれ
ている。
ところで、上)ボした書籍、雑誌および新聞等の帳票で
は、主文字に対して、たとえばふりがな等のルビ、サイ
ドライン、アンダーライン、傍点等の添字か付されてい
る場合がある。
しかしながら、従来の文字読取装置では、主文字以外の
領域のデータは無視されているため、これらの添字を読
取ることが不可能であった。このため、特に特殊なふり
がなを必要とする場合があってもその情報前ることがで
きず、たとえば書籍の再版等を行なう場合にこれらの情
報が欠けてしまい、伯の手段でこれらを入力しなければ
ならないという問題があった。
(発明が解決しようとする問題点) 本発明は上述した従来の問題点を解決するためのもので
、書籍、雑誌および新聞等の帳票の読取を行なう場合に
、主文字に対して添字が存在する場合にもその読取を可
能とした文字読取装置を提供することを目的とする。
[発明の構成] (問題点を解決するための手段) 本発明は上記目的を達成するために、帳票に記録された
文字の文字イメージをに読取る読取部と、この読取部か
ら出力される文字イメージを格納するイメージ格納手段
と、このイメージ格納手段に格納された文字イメージか
ら主文字パターンおよびこの主文字パターンに付帯する
添字文字パターンを1文字ずつ切出す検出切出手段と、
この検出切出手段によって出力される主文字パターンお
よび添字文字パターンを認識する文字認識部と、前記主
文字パターンのKK ’tk結果にその主文字パターン
に付帯する添字文字パターンの認識結果を付加して出力
する出力手段とを具漏したものである。
(作 用) そして本発明は上記手段により、書籍、雑誌および新聞
等の帳票の読取を行なう場合に、主文字に対して添字が
存在した場合でも正確に文字を認識して読取ることがで
きる。
(実施例) 以下、本発明の一実施例を図面に基づいて詳細に説明す
る。
第1図は本発明の一実施例の文字読取装置の構成を示す
ブロック図である。
同図において、1は読取るべき帳票を光学的に走査して
読み取りパターン信号を出力する読取部、2は帳票の1
頁分または1行毎を暫定的に格納する格納部である。ま
た、3は格納部のパターン信号を第1の切出し規則に従
って主文字領域毎を検出して切出し主文字データを出力
する第1の検出切出し手段と、前記パターン信号を第2
の切出し規則に従って前記主文字領域毎の領域外を添字
領域毎に検出して切出し添字データを出力する第2の検
出切出し手段とを備えた検出切出し部である。
4は第1の検出切出し手段により得られた主文字データ
に第2の検出切出し手段により得られた添字データが存
在しない場合に、主文字データを所定の認識規則に従っ
て認識を行ない所定の主文字コードに変換し、また第1
の検出切出し手段により得られた主文字データに第2の
検出切出し手段により得られた添字データが存在する場
合に、主文字データを所定の認識規則に従って認識を行
ない所定の主文字コードに変換するとともに添字データ
所定の認識規則に従って認識を行ない主文字コードに添
字情報を付加して付加文字コードに変換する文字認識部
である。また5は各部の制御を司どる制御部、6はホス
トシステムとのデータの入出力を司どるインターフェイ
ス部である。
このように構成された文字読取装置では、次のようにし
て帳票の文字が読取られる。
第2図は、読取られるべき帳票Pを示す平面図である。
この帳票Pには、横書ぎの文章の行りが表示されており
、この行りの文字は、主文字領域Aに表示された漢字や
ひらがな等の主文字Wと、主文字領域Aの上下(縦書き
の場合には左右)の添字領域Bに表示されたふりがな等
のルビ、アンダーライン(縦書きの場合にはす゛イドラ
イン〉、傍点簀の添字Wとからなっている。
そしてこの帳票Pは、まず、読取部1により帳票P上に
記録された文字を含む文字パターンが光学的に読取られ
パターン信号に変換される。そりで変換されたパターン
信号の帳票Pの1頁毎あるいは1行毎を暫定的に格納部
2により格納する。
この後、格納部2から上述のパターン信号を検出切出し
部3の第1の検出切出し手段により第1の切出し規則に
従って主文字領域A毎の主文字Wを検出して切出し主文
字データに変換する。また検出切出し部3の第2の検出
切出し手段により主文字領域A毎の領域外を添字領域B
毎に検出して切出し添字データに変換する。なおこの第
2の検出切出し手段による添字データは添字が存在しな
い場合には出力されないのはもちろんである。
そして上述した主文字データは、文字認識部4により所
定の認識規則に従って認識が行なわれ主文字コードに変
換される。また主文字データに添字データが存在する場
合には、文字認識部4によりまず主文字データが所定の
認識規則に従って認識が行なわれ主文字コードに変換さ
れる。そして添字データが所定の認識規則に従って認識
か行なわれ主文字コードに添字情報がイ」加され付加文
字コードに変換される。
そして上)ホした主文字コードおよび付加文字コードは
インターフェイス部6を介してホストシステムに入力さ
れ所定の処理が行なわれる。
ところで上述した主文字データおよび添字データからの
主文字コードおよび付加文字コードの処理は、以下のよ
うに行なわれる。
まず第2図に示した1行目の1本日は、晴天なり。」を
添字が存在しない状態としてJIS2バイトコードで表
わすと次のようになる。
485C467G  244F  2122 4032
 4537 244A[本  日   は   、  
 晴  天  な246八  2123 リ   。  」 そして、添字が存在する場合の付加文字コードの処理は
、添字が存在した主文字コードに、「8000Jとの論
理和を取ることによってフラグ付加が行なわれる。そし
て上述の[本日は、晴天なり。]を添字が存在する状態
としてコード処理を行なうと次のようになる。
CB5CC67C244F   2122   CO3
2C537244八「 本  日   は  、   
晴  天  な246A  2123 リ   。  」 これにより、主文字の添字情報が得られる。
また上述したコード処理の他に次のようにして付加文字
コードの処理を行なってもよい。
この付加文字コードの処理は、主文字データをJ IS
2バイトコードにより処理を行ない、主文字コートに変
換しその主文字に添字が存在する場合に対象となる主文
字コードの前後に添字情報コードを挿入して行なわれる
。この場合、第2図に示した2行目および3行目のコー
ド処理を行なうと以下のようになる。なお、AAAAは
ルビ開始コード、BBBBはルビ終了コード、CCCC
はアンダーライン間知コード(縦書ぎの場合はナイドラ
イン開始コード) 、DDDDはアンダーライン終了コ
ード(縦書きの場合はナイトライン終了コード)、EE
E[は傍点開始コード、rFFFは傍点終了コー・ドで
ある。
AAAA  3458  456C434F   4A
7D   BBBB   2122[関  東  地 
 方 CCCC2/148  2433  246D   2
/148  2468  246へと   こ   ろ
   に   よ   リDDDD   EEEE  
 2448  246F   242B   FFFF
   AAAAに  わ  か 31288BBB 2123 雨      。  」 この場合では、主文字に対する詳細な添字情報が得られ
る。
この実施例では、主文字に対して添字が存在する場合に
、その添字情報を主文字コードに付加することが可能で
あるため、たとえば書籍の再版を行なう場合でもその添
字情報を有効に確認することができる。
なa5上述した実施例の検出切出し部3において、帳票
の文字の始り位置を示すマスクスタート、文字の終り位
置を示すマスクエンドおよび行の始り位置を示すライン
スタート、行り終り位置を示すラインエンドや、文字サ
イズ、行数、文字数、行ピッチ、また縦書ぎあるいは横
書き等のフォーマッドコントロールを予め外部から入力
しておき、このフォーマットコントロールに従って各文
字の検出切出しを行なうようにしてもよいことはもらろ
んである。
なお、本発明の文字読取装置は、′I4に%3きおよび
横ISぎの帳票の読取りを行なうことができるのはもら
ろんである。
[発明の効果] 以上説明したように本発明の文字読取装置は、囚籍、雑
誌および新聞等の帳票の読取を行なう場合に、主文字に
対して添字が存在した場合でも正確に文字を認識して読
取ることができる。
【図面の簡単な説明】
第1図は本発明の一実施例の文字読取装置の構成を説明
するためのブロック図、第2図は帳票を説明するための
図である。 1・・・・・・・・・読取部 2・・・・・・・・・格納部 3・・・・・・・・・検出切出し部 4・・・・・・・・・文字認識部 5・・・・・・・・・制御部

Claims (4)

    【特許請求の範囲】
  1. (1)帳票に記録された文字の文字イメージを読取る読
    取部と、この読取部から出力される文字イメージを格納
    するイメージ格納手段と、このイメージ格納手段に格納
    された文字イメージから主文字パターンおよびこの主文
    字パターンに付帯する添字文字パターンを1文字ずつ切
    出す検出切出手段と、この検出切出手段によつて出力さ
    れる主文字パターンおよび添字文字パターンを認識する
    文字認識部と、前記主文字パターンの認識結果にその主
    文字パターンに付帯する添字文字パターンの認識結果を
    付加して出力する出力手段とを具備したことを特徴とす
    る文字読取装置。
  2. (2)前記添字はルビである特許請求の範囲第1項記載
    の文字読取装置。
  3. (3)前記添字はアンダーラインおよびサイドラインで
    ある特許請求の範囲第1項記載の文字読取装置。
  4. (4)前記添字は傍点である特許請求の範囲第1項記載
    の文字読取装置。
JP17846386A 1986-07-29 1986-07-29 文字読取装置 Pending JPS6334680A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP17846386A JPS6334680A (ja) 1986-07-29 1986-07-29 文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP17846386A JPS6334680A (ja) 1986-07-29 1986-07-29 文字読取装置

Publications (1)

Publication Number Publication Date
JPS6334680A true JPS6334680A (ja) 1988-02-15

Family

ID=16048955

Family Applications (1)

Application Number Title Priority Date Filing Date
JP17846386A Pending JPS6334680A (ja) 1986-07-29 1986-07-29 文字読取装置

Country Status (1)

Country Link
JP (1) JPS6334680A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08221508A (ja) * 1995-02-09 1996-08-30 Pfu Ltd 文字認識処理装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5699573A (en) * 1980-01-09 1981-08-10 Hitachi Ltd Kanji (chinese character) distinction system using katakana (square form of japanese syllabary)
JPS592191A (ja) * 1982-06-29 1984-01-07 Fujitsu Ltd 手書き日本語文の認識処理方式

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5699573A (en) * 1980-01-09 1981-08-10 Hitachi Ltd Kanji (chinese character) distinction system using katakana (square form of japanese syllabary)
JPS592191A (ja) * 1982-06-29 1984-01-07 Fujitsu Ltd 手書き日本語文の認識処理方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08221508A (ja) * 1995-02-09 1996-08-30 Pfu Ltd 文字認識処理装置

Similar Documents

Publication Publication Date Title
US5119433A (en) Method and system for locating the amount field on a document
US4962432A (en) Selective retrieval of data from microfilm images of different forms by reading a memory index form cord (bar code) recorded on each image frame
US5854860A (en) Image filing apparatus having a character recognition function
JPS6334680A (ja) 文字読取装置
JP3171626B2 (ja) 文字認識の処理領域・処理条件指定方法
JP3309084B2 (ja) 図形の電子化方法
JPH0991371A (ja) 文字表示装置
JPS6054082A (ja) 光学文字読取装置
JP2902694B2 (ja) 光学式文字読取装置
JP2877380B2 (ja) 光学的文字読取装置
JPH0991385A (ja) 文字認識辞書追加方法及びこれを用いた端末ocr装置
JPH0252329A (ja) 画像情報記録・読取方法
JPS61208584A (ja) 文字読取装置
JP2570571B2 (ja) 光学文字読取装置
JP2784004B2 (ja) 文字認識装置
JPS638988A (ja) 文字読取装置
JPS58111562A (ja) フアクシミリ伝送方式
JP2682456B2 (ja) 光学文字読取装置
JP2931485B2 (ja) 文字切出し装置及び方法
JPS5831028B2 (ja) 文字認識装置
JPH0820669B2 (ja) 画像情報記録・読取方法
JPS6160184A (ja) 光学的文字読取装置
JPS63188284A (ja) 文字読取装置
JPH0252328A (ja) 画像情報読取装置
JPS59180782A (ja) 光学的文字読取装置