JPS60207952A - 外字登録方式 - Google Patents

外字登録方式

Info

Publication number
JPS60207952A
JPS60207952A JP59063566A JP6356684A JPS60207952A JP S60207952 A JPS60207952 A JP S60207952A JP 59063566 A JP59063566 A JP 59063566A JP 6356684 A JP6356684 A JP 6356684A JP S60207952 A JPS60207952 A JP S60207952A
Authority
JP
Japan
Prior art keywords
character
dictionary
ocr
pattern
foreign
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59063566A
Other languages
English (en)
Inventor
Masaki Komiya
小宮 雅紀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP59063566A priority Critical patent/JPS60207952A/ja
Publication of JPS60207952A publication Critical patent/JPS60207952A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • G06F40/129Handling non-Latin characters, e.g. kana-to-kanji conversion

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)
  • Controls And Circuits For Display Device (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の技術分野] 本発明は、特に漢字OCR用の外字静置及び表示用外字
パターンの登録に用いられる外字登録方式に関する。
[発明の技術向背mとその問題点] 従来、日本語ワードプロセッサ等には、既ひのキャラク
タジェネレータに存在しない文字パターンを外字パター
ンとして登録する外字n録既能がある。このような外字
登録機能をOCR(光学的文字読取装置)に用いると、
特に漢字読取の可能な漢字OCRでは標準辞ツには無い
特殊な文字。
記号等が登録されることになる。これにより、通常の漢
字OCRの読取対象の範囲を大幅に高めることができる
ところで、上記のような外字σ録儂能を漢字OCRに設
ける場合、OCRシステムを構成するCRTディスプレ
イ装置又はプリンタに対する表示用外字パターンも必要
となる。しかしながら、OCRの読取用外字辞書および
表示用外字パターンの両者を、ユーザが簡単に作成して
登録することは困難である。
[発明の目的] 本発明は上記の点に鑑みてなされたもので、その目的は
、ユーザが漢字OCRの読取用外字辞書及び表示用外字
パターンを簡単な操作で作成して登録できる外字登録方
式を提供することにある。
[発明の概要] 本発明では、予め所定の登録用外字を記録する外字登録
用シートが用意される。この外字登録用シーi・から登
録用外字の外字パターンを読取るOCRが設けられる。
このOCRから出力される上記外字パターンに基づいて
、表示用外字パターン作成手段は表示用外字パターンを
作成する。さらに、外字辞書作成手段は、上記OCRか
ら出力される外字パターンに基づいてそのパターンの特
徴を抽出して上記登録用外字に対応する外字辞書を作成
する。この外字辞書作成手段により作成された外字辞書
は、外字辞書登録手段により外字辞書メモリに記憶され
る。また、上記表示用外字パターン作成手段により作成
された表示用外字パターンは、表示用外字メモリに記憶
される。
このような構成により、ユーザは外字登録用シートに必
要な登録用外字を記入し、そのシートをOCRに読取ら
せるだけでOCRの読取用外字辞書及び表示用外字パタ
ーンを登録できる。
[発明の実施例] 以下図面を参照して本発明の一実施例を説明する。第1
図は一実施例に係わる構成を示すブロック図である。第
1図において、OCR10は、例えば第2図に示す外字
登録用シート20に記録された漢字を含む文字を光学的
に読取る装置である。制御ll装置11は、システム全
体の動作を副葬し、0CR10から出力される読取結果
である文字パターンを一時記憶する。入出力装置i!i
12は、キーボード及びCRTディスプレイ装置を備え
、制御I Bi [11に記憶された読取結果に対して
文字パターンの修正等の入力動作および制御装置11か
ら送られる外字パターン等を表示する動作を行なう。ま
たプリンタ13は、制御装置11から出力されるO C
R10の読取結果等を印字する。
辞書作成部14は、制御装置11に記憶された文字パタ
ーン(外字パターン)に基づいてOCRの読取用外字辞
書を作成する。辞書登録部15は、辞書作成部14で作
成された外字辞書を制御装置11の制御により所定の外
字装置メモリに記憶する。一方、画像処理部161ユ、
ユーザが入出力装置12を利用し−CC文字バクシン躇
正4)更等を行なって表示用外字パターンを作成する際
の画像処理を行なう。
このようにして作成された表示用外字パターンは、表示
用外字メモリ17に記憶される。後処理用事HIi辞ロ
メモリ18は、制n装置11がOCR10の読取結果に
基づいて単iJi 認識用の後処理用単5n辞内を記憶
するメモリである。
上記のような構成において、一実施例に係わる動作を説
明づる。先ず、ユーザは、第2図に示す外字登録用シー
ト20に登録ずべき外字を記入する。
ここで、外字登録用シート20には、外字登録欄21゜
文字コード1閃22.及び表示、辞訓、取消の各選択指
示欄23.24.25が設けられている。さらに、後処
理用型n辞出のための単能登録(rl126が設けられ
ているが、必ずしも必要ではない。このようなシー1・
において、文字]−ド迫22には外字に対応りる文字コ
ードが記入され、各選択指示1i1123.24には外
字登録において外字経内及び表示用の両者又は一方の指
示が記入される。
外字登録用シート20は、ニー11によりOCR10に
セットされて記録された登録用外字が読取られる。OC
R10は、外字の文字パターン及び文字コード等の読取
結果をルリ御装置11に出力する。ここで、OCR10
から出力される文字パターンは、通常の前処理回路、雑
音除去回路及び正規化回路を経て、線縁部の平滑化及び
?1r5除去等の処理がなされている。又、正規化部で
は、表示に適正な文字サイズに応じて文字パターンの拡
大、縮小又はBぎの修正もなされる。このようにして(
りられた文字パターンは、一時制陣装置11のバッファ
メモリに記憶される。そして、ユーザは入出力装置12
を操作して制御211装置11に記憶された文字パター
ンを読出し、例えば拡大モード及び実際の表示用のサイ
ズでCRTディスプレイ装置に表示させる。
このとき、拡大モードの処理は画1象処理部1Gでの画
像処理により成される。ユーザは、CRTディスプレイ
Mliの表示で文字パターンを確認して、不都合が有れ
ば画像処理部16の機能を利用して1m正処理を行なう
。この修正処理とは、例えばその文字パターンが類似文
字形との差が小さい場合に差が大きくなるように行なう
画像のピッ1〜処理である。このようにして作成された
表示用外字パターンは、制御装置11により表示用外字
メモリ17にきおかされる。
次に、外字辞書が作成される場合、OCR10により読
取られた文字パターンに対する特徴が制御装置11によ
り抽出される。辞自作成部14では、抽出された特徴に
基づいて外字パターンに対応する外字辞書が作成される
。この場合、OCR10で読取られた・抜敬の文字パタ
ーンの平均パターンを作成し、この平均パターンの特徴
を抽出して辞書を作成する方式がある。また、OCR1
0の全パターンに対して各特徴を抽出し、これから平均
特徴をめて辞書を作成する方式がある。この方式は、既
知のWXa方式を利用して、特徴間の距離をめ所定の閾
値を311に複数の類似特徴群に分類し、これらの各群
に対する辞のを作成する方式である。
辞自作成部14により作成された外字辞書は、辞Φ登録
部15により所定の外字辞書メモリに記憶される。この
外字辞書は、通常OCR10内に設けられている。また
、外字登録用シート20に記録された単語登録1iI2
6の単語により、制911装置11でOCRの後処理用
の単gB辞書が作成され、後処理用単詔辞1118に記
憶される。
このようにして、ユーザは予め登録用外字を外字登録用
シー1−20に記入し、小のシートを0CR10により
読取らせるだけでOCRの外字辞6を作成して登録する
ことができる。また、OCR10の読取結果を入出力装
[12のCRTディスプレイ装置に表示させ、入出力装
g!12を操作して所定のパターン修正を行なうことに
より必要な表示用外字パターンを簡単に作成でき登録す
ることができる。
したがって、ユーザは簡単な操作で、漢字OCRの外字
辞書を登録でき、かつOCRの出力装置であるCRTデ
ィスプレイ装置またはプリンタの出力用の表示用外字パ
ターンをfl録できる。
尚、上記実施例において表示用外字パターンの作成の際
、画像処理部1Gを利用した場合について説明したが画
1g!処理部16は無くてもよい。画m処理部1Gが無
い場合、OCR10の正規化回路から出力される文字パ
ターンが表示用外字パターンとなる。このパターンに問
題があれば、外字登録用シー1−20の取消1125で
取消しを指示して別の外字登録潤21に再度外字を記入
し、OCR10により再入力させる。
[5′?、明の効果] 以上詳述したように本発明によれば、ユーザは簡単な操
作で、漢字OCRの読取用静岡及び表示用外字パターン
を作成して登録することができる。
したがって、読取対雰の範囲が広い漢字OCRを容易に
実現でき、このようなOCRを用いることにより極めて
優れた文字入力装置を実現できるものである。
【図面の簡単な説明】
第1図;よ本発明の一実施例に係わる外字Q録方式の構
成を示すブロック図、第2図は外字登録用シー(への−
例を示す図である。 10・・・0CR111・・・制御装置、12・・・入
出力装置、14・・・辞囚作成部、15・・−BY I
n登録部、1G・・・画像処理部、17・・・表示用外
字メモリ。 出願人代理人 弁理士 鈴江武彦

Claims (1)

    【特許請求の範囲】
  1. 予め所定の(]録車用外を記録する外字登録用シートと
    、この外字登録用シートから登録用外字の外字パターン
    を読取るOCRと、このOCRで読取られた上記外字パ
    ターンに基づいて所定の表示用外字パターンを作成づる
    表示用外字パターン作成手段と、上記OCRから出力さ
    れる外字パターンに基づいてそのパターンの特徴を抽出
    して上記登録用外字に対応する外字経内を作成する外字
    辞■作成手段と、この外字辞自作成手段により作成され
    た外字辞丙を外字辞書メモリに記憶する外字辞m登録手
    段と、上記表示用外字パターン作成手段により作成され
    た表示用外字パターンを記憶する表示用外字メモリとを
    真直してなることを特徴どする外字登録方式。
JP59063566A 1984-03-31 1984-03-31 外字登録方式 Pending JPS60207952A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59063566A JPS60207952A (ja) 1984-03-31 1984-03-31 外字登録方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59063566A JPS60207952A (ja) 1984-03-31 1984-03-31 外字登録方式

Publications (1)

Publication Number Publication Date
JPS60207952A true JPS60207952A (ja) 1985-10-19

Family

ID=13232915

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59063566A Pending JPS60207952A (ja) 1984-03-31 1984-03-31 外字登録方式

Country Status (1)

Country Link
JP (1) JPS60207952A (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58155485A (ja) * 1982-03-12 1983-09-16 Nec Corp 標準パタ−ン登録装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58155485A (ja) * 1982-03-12 1983-09-16 Nec Corp 標準パタ−ン登録装置

Similar Documents

Publication Publication Date Title
JP3215176B2 (ja) 文書画像処理装置及び文書画像処理方法
JPS60207952A (ja) 外字登録方式
JPH0388062A (ja) 文書作成装置
JPS6239794B2 (ja)
JP3486246B2 (ja) 文字認識装置
JP2907947B2 (ja) 光学文字読取システム
JPH0514952B2 (ja)
JPH07306911A (ja) Ocr読取結果修正装置
JPH01292586A (ja) 文字認識支援装置
JPS62295192A (ja) 光学文字画像読取装置
JPH0475185A (ja) 入力装置
JPH0475184A (ja) 入力装置
JP2784004B2 (ja) 文字認識装置
JPS595385A (ja) 手書文字/図形認識装置
JPH06251192A (ja) 光学的文字読み取り装置
JPH0357506B2 (ja)
JPH0354390B2 (ja)
JPS63220383A (ja) 文字入力装置
JPH0576666B2 (ja)
JPS63204486A (ja) 文字入力装置
JPH0484379A (ja) 紙上の文字等の複写方法と記号の認識方法
JPS6244288B2 (ja)
JPH0696283A (ja) 光学式文字読取装置における文字学習方式
JPS63101926A (ja) フオ−ムオ−バ−レイ作成方式
JPS6095688A (ja) 文字認識装置