JPH0576666B2 - - Google Patents

Info

Publication number
JPH0576666B2
JPH0576666B2 JP60071344A JP7134485A JPH0576666B2 JP H0576666 B2 JPH0576666 B2 JP H0576666B2 JP 60071344 A JP60071344 A JP 60071344A JP 7134485 A JP7134485 A JP 7134485A JP H0576666 B2 JPH0576666 B2 JP H0576666B2
Authority
JP
Japan
Prior art keywords
character
voiced
handakuten
mark
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP60071344A
Other languages
English (en)
Other versions
JPS61229177A (ja
Inventor
Yasunao Isaki
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP60071344A priority Critical patent/JPS61229177A/ja
Publication of JPS61229177A publication Critical patent/JPS61229177A/ja
Publication of JPH0576666B2 publication Critical patent/JPH0576666B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、濁点・半濁点付き文字の認識方式、
より詳細には、通常の1文字形式の書体で書かれ
た濁点・半濁点付きの文字を、濁点・半濁点付き
文字認識用の特別の辞書を設けること無く認識出
来る様にした濁点・半濁点付き文字の認識方式に
関する。
〔従来の技術〕
濁点や半濁点付きの文字を認識する場合、通常
の書体で書かれたものをそのまま文字認識しよう
とすると、各濁点・半濁点付き文字認識用の辞書
をそれぞれ設けることが必要である。
この文字認識方式は、通常の書体で記入したも
のが認識出来るのでユーザに便利であるが、濁
点・半濁点付き文字の態様は濁点・半濁点の付か
ない文字の態様に比較して一層多いので、その文
字認識用辞書として極めて大きい容量のものが必
要となると共に、その認識処理も複雑なものとな
る不都合があつた。
そこで、従来は、濁点・半濁点付きの文字を認
識する場合、濁点や半濁点を1文字として取扱
い、濁点・半濁点を除いた文字部分(以下、「文
字本体」という)と共に別個の文字記入枠に記入
させ、両者を1文字として認識した後、両者が一
体となつた濁点・半濁点付き文字の認識を行つて
いた。
例えば、「ガ」の文字を認識する場合は、文字
本体「カ」と濁点を□カ□〓の様にそれぞれ別個の文
字記入枠に記入させ、両者をそれぞれ1文字とし
て認識した後、両者が一体とあつた「ガ」の文字
の認識を行つていた。
この様にすると、濁点・半濁点付き文字認識用
の辞書に濁点「 」及び半濁点「 」を認識する
辞書を付加することにより全ての濁点・半濁点付
き文字を認識することが出来るので、全体の文字
認識用辞書の容量の増幅を僅かなものに抑えるこ
とが出来る。然しながら、通常の書体で書かれた
濁点・半濁点付き文字が認識出来ないという不都
合があつた。
〔発明が解決しようとする問題点〕
従来の濁点・半濁点付き文字の認識方式は、濁
点・半濁点を1文字として文字本体とそれぞれ別
個の文字記入枠に記入させていたので、通常の書
体で書かれた濁点・半濁点付き文字の認識が出来
ず、またその記入方式もユーザにとつて不便であ
るという問題があつた。
一方、通常の書体で書かれた濁点・半濁点付き
文字、即ち1文字記入枠中に1文字として記入さ
れた濁点・半濁点付き文字をそのまま文字認識さ
せようとすると、文字認識用の辞書として極めて
大きい容量を必要とすると共に、その認識処理も
複雑になるという問題があつた。
本発明は、従来の濁点・半濁点付き文字の認識
方式における前述の問題点を解消する為に成され
たもので、通常1文字形式の書体で書かれた濁
点・半濁点付きの文字を、濁点・半濁点付き文字
認識用の特別の辞書を設けること無く認識出来る
様にした濁点・半濁点付き文字の認識方式を提供
することを目的とする。
〔問題点を解決するための手段〕
従来の濁点・半濁点付き文字の認識方式におけ
る前述の問題点を解決し、前記目的を達成する為
に本発明の講じた手段を、第1図により説明す
る。
第1図は、本発明の構成をブロツク図で示した
ものである。
第1図において、110は特徴抽出手段で、従
来の濁点・半濁点を1文字として文字認識を行う
場合と同一の方法で、入力文字についての特徴を
抽出して保持する。
120は濁点・半濁点検査手段で、特徴抽出手
段110で抽出された特徴項目に基づいて、入力
文字が濁点・半濁点付き文字である可能性の有無
を検査し、その結果をデータとして付けて置く。
130は濁点・半濁点除去手段で、入力文字が
濁点・半濁点付き文字の可能性がある場合に、そ
の文字入力文字から濁点・半濁点を除去して文字
本体を作成する。
140は濁点・半濁点付き文字認識手段で、濁
点・半濁点除去手段130によつて作成された文
字本体について文字認識を行い、認識された文字
本体が濁点・半濁点付きの文字となり得る文字で
ある場合に、既に検出された濁点又は半濁点を文
字本体に付したものを、入力文字に対する認識解
答とする。
なお、第1図は、本発明の構成の原理を示した
もので、実際の装置においては各手段は互いに一
部が重複する場合がある。例えば特徴抽出手段1
10の場合は、濁点・半濁点付き文字認識手段1
40中に含包させることが出来る。
〔作用〕
第1図に示した構成を有する本発明の作用を、
入力文字「ガ」である場合を例に取つて説明す
る。
特徴抽出手段110は、従来の濁点・半濁点を
1文字として文字認識を行う場合と同一の方法
で、1文字として入力された入力文字「ガ」につ
いての特徴抽出を行つて保持する。入力文字
「ガ」に対して抽出された特徴項目数は、文字本
体「カ」に対して抽出された特徴項目数よりも当
然多くなる。
濁点・半濁点検査手段120は、特徴抽出手段
110で抽出された特徴項目に基づいて、入力文
字が濁点・半濁点付き文字である可能性の有無を
検査し、その結果をデータとして保持する。
濁点・半濁点付き文字が入力されても、それを
直接認識できる辞書を持たないので、抽出された
特徴項目から直ちに濁点・半濁点付き文字を認識
することは出来ない。然しながら、濁点及び半濁
点の形状及びそれらの存在する位置はどの濁点・
半濁点付き文字にも共通するので、濁点又は半濁
点付き文字から抽出された特徴項目中には、両者
の場合にそれぞれ特有な特徴が抽出される。従つ
て、特徴抽出手段110によつて抽出された特徴
項目を参照すれば、入力文字が濁点付き文字であ
るか半濁点付き文字であるかの可能性の有無を検
出することが出来る。
濁点・半濁点除去手段130は、入力文字が濁
点・半濁点付き文字の可能性がある場合は、その
入力文字から濁点・半濁点を除去して文字本体を
作成する。例えば、入力文字が「ガ」の場合、濁
点を除去して文字本体「カ」を作成する。
濁点・半濁点付き文字認識手段140は、濁
点・半濁点除去手段130によつて作成された文
字本体について従来と同様な方法で文字認識を行
い、認識された文字本体が濁点・半濁点付きの文
字となり得る文字であるか否かを判別し、なる得
る文字の場合は、認識された文字本体に濁点・半
濁点検査手段120によつて検出された濁点又は
半濁点を付したものを、元の入力文字に対する認
識解答とする。
例えば、入力文字が「ガ」の場合、文字本体
「カ」は濁点付きの文字になり得るので、認識さ
れた文字本体「カ」に既に検出された濁点を付し
たものが、元の入力文字であると判断されて、正
しい濁点付きの文字「ガ」の認識が行われる。
以上の様にして、濁点・半濁点付き文字認識用
の特別の辞書を設けること無く、従来の濁点・半
濁点を1文字として入力する文字認識方法を流用
して、通常の1文字形式の書体で書かれた濁点・
半濁点付き文字の認識を行うことが出来る。
〔実施例〕
本発明の実施例を、図面を参照して詳細に説明
する。
第2図は本発明の一実施例の説明図、第3図は
同実施例の動作を説明するフローチヤートであ
る。
(構成の説明) 第2図において、特徴抽出手段110、濁点・
半濁点検査手段120、濁点・半濁点除去手段1
30、濁点・半濁点付き文字認識手段140につ
いては、第1図で説明したとおりである。この実
施例においては、特徴抽出手段110は、濁点・
半濁点付き文字認識手段140の一部として包含
されている。
150は制御手段で、前記各手段の動作を制御
する。
特徴抽出手段110において、111は画像メ
モリで、入力された濁点・半濁点付きの1文字形
式の文字や濁点・半濁点の付かない文字データが
格納される。
112は特徴抽出部で、入力文字の特徴を抽出
する。113は特徴メモリで、抽出された入力文
字の特徴が格納される。114は辞書で、濁点・
半濁点を1文字として記入する従来の文字認識用
辞書と同様な辞書が用いられるが、本実施例の場
合は、辞書に格納された各標準文字の中で濁点・
半濁点付きの文字がマツチングすることの出来る
ものについては、その標準文字データ中にそれを
指示するマークを記入する。半濁点付の文字は濁
点も付き得るので、このマークは、濁点の付き得
ない文字、濁点だけが付く文字、半濁点の付く文
字の3種類を識別させるもので良い。
115は照合部で、特徴メモリ113から読み
出された1つの入力文字の各特徴のデータと辞書
114中の各標準文字のデータを照合し、最も良
くマツチングした標準文字のデータを出力する。
116は答メモリで、照合部115から出力され
た標準文字データを格納する。
この特徴抽出手段110の構成は、濁点・半濁
点を1文字として記入させて文字認識を行う従来
の文字認識手段の構成と共通する。
濁点・半濁点検査手段120において、121
は濁点・半濁点検査部で、特徴メモリ113から
読み出されたその入力文字の各特徴データに基づ
いて、その入力文字が濁点付き文字又は半濁点付
き文字である可能性を検査し、その結果を出力す
る。122はフラグメモリで、濁点・半濁点検査
手段120からの出力を受けて、入力文字が濁点
又は半濁点付き文字の可能性があることを示すフ
ラグをセツトする。
濁点・半濁点除去手段130において、131
はマーク検査部で、答メモリ116より読み出さ
れた標準文字データ中のマークを検査し、認識対
象となつている入力文字が濁点・半濁点の付き得
る文字であるか否かを検出して、その結果を制御
部150に出力する。132は濁点・半濁点除去
部で、画像メモリ111に格納された認識対象と
なつている入力文字から濁点・半濁点部分を除去
して、文字本体を作成する。濁点・半濁点の存在
する位置及びその形状は、各濁点・半濁点付き文
字に共通するので、濁点・半濁点の検出及び除去
は容易に行うことが出来る。
濁点・半濁点付き文字認識手段140におい
て、141は濁点・半濁点文字判別部で、答メモ
リ116から読み出された標準文字データに基づ
いて、認識された文字本体が濁点・半濁点を付け
ることが出来る文字であるか否かを判別して、そ
の結果を出力する。142は答編集部で、認識対
象となつた入力文字についての認識結果を出力す
る。
なお、濁点・半濁点付き文字認識手段140の
一部を構成する特徴抽出部110については既に
説明した通りである。
(動作の説明) 第2図の動作を、第3図のフローチヤートを参
照し、そのステツプに従つて説明する。なお、各
ステツプの動作は制御手段150によつて制御さ
れて行われるが、特に制御手段150によつて行
われる制御動作について述べる必要がある場合の
他は、その制御動作は従来の文字認識方式から明
らかであるので、いちいち制御手段150に言及
して説明することは省略する。
(1) ステツプS1 画像メモリ111に格納された入力文字の中か
ら、認識の対象となる入力文字(以下、単に「入
力文字」という)にとついて位置決めを行い、そ
の入力文字部分だけでスキヤンして、その入力文
字データを読み出す。
(2) ステツプS2 特徴抽出部112は、入力文字データに基づい
て入力文字の特徴を抽出して、特徴メモリ113
に格納する。
(3) ステツプS3 濁点・半濁点検査部121は、特徴メモリ11
3から読み出された入力文字の特徴データに基づ
いて入力文字を検査し、入力文字が濁点付き文字
又は半濁点付き文字である可能性の有無を検出す
る。
入力文字が濁点又は半濁点付き文字の可能性が
ある場合、フラグメモリ122に出力して、その
可能性を示すスラグをセツトする(ステツプ
S31)。
入力文字が濁点・半濁点付き文字の可能性が無
い場合は、制御手段150に通知して次のステツ
プS4の照合処理を行わせる。
(4) ステツプS4 照合部115は、特徴メモリ113から読み出
された入力文字の各特徴データと辞書114中の
各標準文字のデータを照合し、最も良くマツチン
グした標準文字のデータを出力して答メモリ11
6に格納する。
(5) ステツプS5 マーク検査部131は、答メモリ116より読
み出された標準文字データ中のマークを検査し、
入力文字が濁点・半濁点の付き得る文字であるか
否を検出して、その結果を制御部150に出力す
る。
入力文字が濁点・半濁点の付き得る文字でない
と検出された場合は答メモリ116に格納された
標準文字データが直ちに入力文字に対する正しい
認識結果を与えるものであるので、制御手段15
0は、答メモリ116に格納された標準文字デー
タを答編集部142に転送させ、その認識結果を
答として出力させる(ステツプS51)。
入力文字がが濁点・半濁点の付き得る文字であ
ると検出された場合は、制御手段150は次のス
テツプS6の処理を行う。
(6) ステツプS6 制御手段150はフラグメモリ112中にセツ
トされた入力文字に対するフラグを検査して、入
力文字が濁点・半濁点付き文字の可能性があるか
否かを検出する。
フラグから入力文字が濁点・半濁点付き文字で
ある可能性がないと検出された場合は、答メモリ
116に格納された標準文字データが直ち入力文
字に対する正しい認識結果を与えるものであるの
で、制御手段150は、答メモリ111に格納さ
れた標準文字データを答編集部142に転送さ
せ、その認識結果を答として出力させる(ステツ
プS61)。
フラグから入力文字が濁点・半濁点付き文字で
ある可能性があると検出された場合は、次のステ
ツプS4を行う。
(7) ステツプS7 濁点・半濁点除去部132は、画像メモリ11
1に格納されている入力文字から濁点・半濁点部
分を除去して、文字本体を作成する。例えば、入
力文字が1文字形式で書かれた「ガ」であるとす
ると、それから濁点が除去されて文字本体「カ」
が作成され、画像メモリ111に格納される。
(8) ステツプS8 特徴抽出部112は、画像メモリ111から読
み出された元の入力文字の文字本体のデータに基
づいてその特徴を抽出して、特徴メモリ113に
格納する。
(9) ステツプS9 照合部115は、特徴メモリ113から読み出
された文字本体の各特徴メモリと辞書114中の
各標準文字のデータを照合し、最も良くマツチン
グした標準文字データを出力して答メモリ116
に格納する。
(10) ステツプS10 濁点・半濁点文字判別部141は、答メモリ1
16から読み出された標準文字データ中のマーク
を検査し、文字本体が濁点・半濁点付き得る文字
であるか否かを判別する。
入力文字から文字本体を形成する処理及びその
文字本体の照合処理が正しく行われているなら
ば、文字本体は、当然に濁点・半濁点の付き得る
文字である。
従つて、濁点・半濁点文字判別141によつ
て、文字本体が濁点・半濁点の付き得る文字であ
ると判別された場合は、文字本体とマツチングし
た標準文字データを答編集部142に転送する。
答編集部142は、文字本体の標準文字データ
と、制御手段150より送られたフラグメモリの
フラグに基づいて、文字本体に元の濁点又は半濁
点を付けたものを入力文字に対する認識解答とし
て出力する。
もし、濁点・半濁点文字判別部141によつ
て、文字本体が濁点・半濁点の付得る文字では無
いと判別された場合は、明らかにそれ迄の処理に
誤りがあつたことになるので、答編集部142は
読み取り不能という答を出力する。
以上の様にして、濁点・半濁点を1文字として
記入させて濁点・半濁点付き文字の認識を行う従
来の辞書を用いて、1文字形式で書かれた濁点・
半濁点付き文字の認識を行うことが出来る。
〔発明の効果〕
以上説明した様に、本発明にようれば、通常の
1文字形式で書かれた濁点・半濁点付き文字を、
それを認識する為の特別の辞書を新たに設けるこ
と無く、従来の濁点・半濁点を1文字として記入
させて文字認識を行う場合の辞書を用いて認識す
ることが出来る。辞書の容量が増加しないので、
ハードウエアの増加を低く抑えることが出来る。
また、通常の1文字形式の書体で記入出来るの
で、入力をスムースに行うことが出来る。
【図面の簡単な説明】
第1図は本発明の構成のブロツク説明図、第2
図は本説明の一実施例の説明図、第3図は同実施
例の動作を説明するフローチヤート、を示す。 第1図において、110…特徴抽出手段、12
0…濁点・半濁点検査手段、130…濁点・半濁
点除去手段、140…濁点・半濁点付き文字認識
手段。

Claims (1)

  1. 【特許請求の範囲】 1 1文字形式で記入された濁点・半濁点付き文
    字の認識方式であつて、 (a) 濁点と半濁点をそれぞれ1文字として記入さ
    せて文字認識に必要な特徴を抽出する特徴抽出
    手段110と、 (b) 抽出された特徴に基づいて、入力文字が濁
    点・半濁点付き文字である可能性があるか否か
    を検査する濁点・半濁点検査手段120と、 (c) 入力文字が濁点・半濁点付き文字である可能
    性のある場合は、入力文字から濁点・半濁点を
    除去して文字本体を作成する濁点・半濁点除去
    手段130と、 (d) 濁点・半濁点が除去された文字本体部分につ
    いて文字認識を行い、認識された文字本体が濁
    点・半濁点付きの文字となり得る場合に、濁
    点・半濁点検査手段120によつて検出された
    濁点又は半濁点を文字本体に付したものを入力
    文字に対する認識解答とする濁点・半濁点付き
    文字認識手段140、 を備えたことを特徴とする濁点・半濁点付き文字
    認識方式。
JP60071344A 1985-04-04 1985-04-04 濁点・半濁点付き文字の認識方式 Granted JPS61229177A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60071344A JPS61229177A (ja) 1985-04-04 1985-04-04 濁点・半濁点付き文字の認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60071344A JPS61229177A (ja) 1985-04-04 1985-04-04 濁点・半濁点付き文字の認識方式

Publications (2)

Publication Number Publication Date
JPS61229177A JPS61229177A (ja) 1986-10-13
JPH0576666B2 true JPH0576666B2 (ja) 1993-10-25

Family

ID=13457782

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60071344A Granted JPS61229177A (ja) 1985-04-04 1985-04-04 濁点・半濁点付き文字の認識方式

Country Status (1)

Country Link
JP (1) JPS61229177A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61250793A (ja) * 1985-04-30 1986-11-07 Canon Inc 文字認識装置
JP2743995B2 (ja) * 1987-06-30 1998-04-28 株式会社東芝 文字読取装置

Also Published As

Publication number Publication date
JPS61229177A (ja) 1986-10-13

Similar Documents

Publication Publication Date Title
US8489388B2 (en) Data detection
JPH01246678A (ja) パターン認識装置
JPH04195692A (ja) 文書読取装置
Margner SARAT-A system for the recognition of Arabic printed text
JPH0576666B2 (ja)
JP2006252164A (ja) 中国語文書処理装置
JPS592191A (ja) 手書き日本語文の認識処理方式
JPH0991371A (ja) 文字表示装置
JPH11328315A (ja) 文字認識装置
CN115410207B (zh) 一种针对竖排文本的检测方法及装置
JPH028348B2 (ja)
JP2520289B2 (ja) 認識方法、認識装置および同装置を有する情報装置
JPS60217487A (ja) 文字認識装置
JPS6182275A (ja) 自動翻訳装置
JP2749425B2 (ja) 記事抽出方式
JPS63311581A (ja) 図面認識におけるエラ−・リジェクト検出方法
JP2972443B2 (ja) 文字認識装置
JPS6240574A (ja) ワ−ドプロセツサ
JPS6037084A (ja) 文字認識装置
JPS60207983A (ja) 文字認識用辞書作成方式
Harness et al. Enabling the use of Windows environment by the blind and partially sighted
JPH0421169A (ja) 翻訳装置
JPS6227874A (ja) 文字認識装置
JPH10269319A (ja) オンライン手書き文字入力方法ならびに装置
JPS63103375A (ja) 文書処理装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees