JPS61229177A - 濁点・半濁点付き文字の認識方式 - Google Patents

濁点・半濁点付き文字の認識方式

Info

Publication number
JPS61229177A
JPS61229177A JP60071344A JP7134485A JPS61229177A JP S61229177 A JPS61229177 A JP S61229177A JP 60071344 A JP60071344 A JP 60071344A JP 7134485 A JP7134485 A JP 7134485A JP S61229177 A JPS61229177 A JP S61229177A
Authority
JP
Japan
Prior art keywords
character
voiced
handakuten
voiced sound
sound symbol
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP60071344A
Other languages
English (en)
Other versions
JPH0576666B2 (ja
Inventor
Yasunao Isaki
伊崎 保直
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP60071344A priority Critical patent/JPS61229177A/ja
Publication of JPS61229177A publication Critical patent/JPS61229177A/ja
Publication of JPH0576666B2 publication Critical patent/JPH0576666B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、濁点・半濁点付き文字の認識方式、より詳細
には、通常の1文字形式の書体で書かれた濁点・半濁点
付きの文字を、濁点・半濁点付き文字認識用の特別の辞
書を設けること無く認識出来る様にした濁点・半濁点付
き文字の認識方式に関する。
〔従来の技術〕
濁点や半濁点付きの文字を認識する場合、通常の書体で
書かれたものをそのまま文字認識しようとすると、各濁
点・半濁点付き文字認識用の辞書をそれぞれ設けること
が必要である。
この文字認識方式は、通常の書体で記入したものが認識
出来るのでユーザに便利であるが、濁点・半濁点付き文
字の態様は濁点・半濁点の付かない文字の態様に比較し
て一層多いので、その文字認識用辞書として極めて大き
い容量のものが必要となると共に、その認識処理も複雑
なものとなる不都合があった。
そこで、従来は、濁点・半濁点付きの文字を認識する場
合、濁点や半濁点を1文字として取扱い、濁点・半濁点
を除いた文字部分(以下、「文字本体」という)と共に
別個の文字記入枠に記入させ、両者を1文字として認識
した後、両者が一体となった濁点・半濁点付き文字の認
識を行っていた。
例えば、「ガ」の文字を認識する場合は、文字本体「力
」と濁点を刃口の様にそれぞれ別個の文字記入枠に記入
させ、両者をそれぞれ1文字として認識した後、両者が
一体とあった「ガ」の文字の認識を行っていた。
この様にすると、濁点・半濁点付き文字認識用の辞書に
濁点「 」及び半濁点「 」を認識する辞書を付加する
ことにより全ての濁点・半濁点付き文字を認識すること
が出来るので、全体の文字認識用辞書の容量の増幅を僅
かなものに抑えることが出来る。然しながら、通常の書
体で書かれた濁点・半濁点付き文字が認識出来ないとい
う不都合があった。
〔発明が解決しようとする問題点〕
従来の濁点・半濁点付き文字の認識方式は、濁点・半濁
点を1文字として文字本体とそれぞれ別個の文字記入枠
に記入させていたので、通常の書体で書かれた濁点・半
濁点付き文字の認識が出来ず、またその記入方式もユー
ザにとって不便であるという問題があった。
一方、通常の書体で書かれた濁点・半濁点付き文字、即
ち1文字肥大枠中に1文字として記入された濁点・半濁
点付き文字をそのまま文字認識させようとすると、文字
認識用の辞書として極めて大きい容量を必要とすると共
に、その認識処理も複雑になるという問題があった。
本発明は、従来の濁点・半濁点付き文字の認識方式にお
ける前述の問題点を解消する為に成されたもので、通常
の1文字形式の書体で書かれた濁点・半濁点付きの文字
を、濁点・半濁点付き文字認識用の特別の辞書を設ける
こと無く認識出来る様にした濁点・半濁点付き文字の認
識方式を提供することを目的とする。
〔問題点を解決するための手段〕
従来の濁点・半濁点付き文字の認識方式における前述の
問題点を解決し、前記目的を達成する為に本発明の講じ
た手段を、第1図により説明する。
第1図は、本発明の構成をブロック図で示したものであ
る。
第1図において、110は特徴抽出手段で、従来の濁点
・半濁点を1文字として文字認識を行う場合と同一の方
法で、入力文字についての特徴を抽出して保持する。
120は濁点・半濁点検査手段で、特徴抽出手段110
で抽出された特徴項目に基づいて、入力文字が濁点・半
濁点付き文字である可能性の有無を検査し、その結果を
データとして付けて置く。
130は濁点・半濁点除去手段で、入力文字が濁点・半
濁点付き文字の可能性がある場合に、その文字入力文字
から濁点・半濁点を除去して文字本体を作成する。
140は濁点・半濁点付き文字認識手段で、濁点・半濁
点除去手段130によって作成された文字本体について
文字認識を行い、認識された文字本体が濁点・半濁点付
きの文字となり得る文字である場合に、既に検出された
濁点又は半濁点を文字本体に付したものを、入力文字に
対する認識解答とする。
なお、第1図は、本発明の構成の原理を示したもので、
実際の装置においては各手段は互いに一部が重複する場
合がある。例えば特徴抽出手段110の場合は、濁点・
半濁点付き文字認識手段140中に含包させることが出
来る。
〔作 用〕 第1図に示した構成を有する本発明の作用を、入力文字
が「ガ」である場合を例に取って説明する。
特徴抽出手段110は、従来の濁点・半濁点を1文字と
して文字認識を行う場合と同一の方法で、1文字として
入力された入力文字「ガ」についての特徴抽出を行って
保持する。入力文字「ガ」に対して抽出された特徴項目
数は、文字本体「力」に対して抽出され特徴項目数より
も当然多くなる。
濁点・半濁点検査手段120は、特徴抽出手段110で
抽出された特徴項目に基づいて、入力文字が濁点・半濁
点付き文字である可能性の有無を検査し、その結果をデ
ータとして保持する。
濁点・半濁点付き文字が入力されても、それを直接認識
できる辞書を持たないので、抽出された特徴項目から直
ちに濁点・半濁点付き文字を認識することは出来ない。
然しなから、濁点及び半濁点の形状及びそれらの存在す
る位置はどの濁点・半濁点付き文字にも共通するので、
濁点又は半濁点付き文字から抽出された特徴項目中には
、両者の場合にそれぞれ特有な特徴が抽出される。従っ
て、特徴抽出手段110によって抽出された特徴項目を
参照すれば、入力文字が濁点付き文字であるか半濁点付
き文字であるかの可能性の有無を検出することが出来る
濁点・半濁点除去手段130は、入力文字が濁点・半濁
点付き文字の可能性がある場合は、その入力文字から濁
点・半濁点を除去して文字本体を作成する。例えば、入
力文字が「ガ」の場合、濁点を除去して文字本体「力」
を作成する。
濁点・半濁点付き文字認識手段140は、濁点・半濁点
除去手段130によって作成された文字本体について従
来と同様な方法で文字認識を行い、認識さた文字本体が
濁点・半濁点付きの文字となり得る文字であるか否かを
判別し、なる得る文字の場合は、認識された文字本体に
濁点・半濁点検査手段120によって検出された濁点又
は半濁点を付したものを、元の入力文字に対する認識解
答とする。
例えば、入力文字が「ガ」の場合、文字本体「力」は濁
点付きの文字になり得るので、認識された文字本体「力
」に既に検出された濁点を付したものが、元の入力文字
であると判断されて、正しい濁点付きの文字「ガ」の認
識が行われる。
以上の様にして、濁点・半濁点付き文字認識用の特別の
辞書を設けること無く、従来の濁点・半濁点を1文字と
して入力する文字認識方法を流用して、通常の1文字形
式の書体で書かれた濁点・半濁点付き文字の認識を行う
ことが出来る。
〔実施例〕
本発明の実施例を、図面を参照して詳細に説明する。
第2図は本発明の一実施例の説明図、第3図は同実施例
の動作を説明するフローチャートである。
(構成の説明) 第2図において、特徴抽出手段110、濁点・半濁点検
査手段120、濁点・半濁点除去手段l。
30、濁点・半濁点付き文字認識手段140については
、第1図で説明したとおりである。この実施例において
は、特徴抽出手段110は、濁点・半濁点付き文字認識
手段140の一部として包含されている。
150゛は制御手段で、前記各手段の動作を制御する。
特徴抽出手段110において、111は画像メモリで、
入力された濁点・半濁点付きの1文字形式の文字や濁点
・半濁点の付かない文字データが格納される。
112は特徴抽出部で、入力文字の特徴を抽出する。1
13は特徴メモリで、抽出された入力文字の特徴が格納
される。114は辞書で、濁点・半濁点を1文字として
記入する従来の文字認識用辞書と同様な辞書が用いられ
るが、本実施例の場合は、辞書に格納された各標準文字
の中で濁点・半濁点付きの文字がマツチングすることの
出来るものについては、その標準文字データ中にそれを
指示するマークを記入する。半濁点付の文字は濁点も付
き得るので、このマークは、濁点の付き得ない文字、濁
点だけが付く文字、半濁点の付く文字の3種類を識別さ
せるもので良い。
115は照合部で、特徴メモリ113から読み出された
1つの入力文字の各特徴のデータと辞書114中の各標
準文字のデータを照合し、最も良くマツチングした標準
文字のデータを出力する。
116は答メモリで、照合部115から出力された標準
文字データを格納する。
この特徴抽出手段110の構成は、濁点・半濁点を1文
字として記入させて文字認識を行う従来の文字認識手段
の構成と共通する。
濁点・半濁点検査手段120において、121は濁点・
半濁点検査部で、特徴メモリ113から読み出されたそ
の入力文字の各特徴データに基づいて、その入力文字が
濁点付き文字又は半濁点付き文字である可能性を検査し
、その結果を出力する。122はフラグメモリで、濁点
・半濁点検査手段120からの出力を受けて、入力文字
が濁点又は半濁点付き文字の可能性があることを示すフ
ラグをセットする。
濁点・半濁点除去手段130において、131はマーク
検査部で、答メモリ116より読み出された標準文字デ
ータ中のマークを検査し、認識対象となっている入力文
字が濁点・半濁点の付き得る文字であるか否かを検出し
て、その結果を制御部150に出力する。132は濁点
・半濁点除去部で、画像メモリ111に格納された認識
対象となっている入力文字から濁点・半濁点部分を除去
して、文字本体を作成する。濁点・半濁点の存在する位
置及びその形状は、各濁点・半濁点付き文字に共通する
ので、濁点・半濁点の検出及び除去は容易に行うことが
出来る。
濁点・半濁点付き文字認識手段140において、141
は濁点・半濁点文字判別部で、答メモリ116から読み
出された標準文字データに基づいて、認識された文字本
体が濁点・半濁点を付けることが出来る文字であるか否
かを判別して、その結果を出力する。142は答編集部
で、認識対象となった入力文字についての認識結果を出
力する。
なお、濁点・半濁点付き文字認識手段140の一部を構
成する特徴抽出部110については既に説明した通りで
ある。
(動作の説明) 第2図の動作を、第3図のフローチャートを参照し、そ
のステップに従って説明する。゛なお、各ステップの動
作は制御手段150によって制御されて行われるが、特
に制御手段150によって行われる制御動作について述
べる必要がある場合の他は、その制御動作は従来の文字
認識方式から明らかであるので、いちいち制御手段15
0に言及して説明することは省略する。
(11ステップS+ 画像メモリ111に格納された入力文字の中から、認識
の対象となる入力文字(以下、単に「入力文字」という
)にとついて位置決めを行い、その入力文字部分だけで
スキャンして、その入力文字データを読み出す。
(2)ステップS2 特徴抽出部112は、入力文字データに基づいて入力文
字の特徴を抽出して、特徴メモリ113に格納する。
(3)  ステップS3 濁点・半濁点検査部121は、特徴メモリ113から読
み出された入力文字の特徴データに基づいて入力文字を
検査し、入力文字が濁点付き文字又は半濁点付き文字で
ある可能性の有無を検出する。
入力文字が濁点又は半濁点付き文字の可能性がある場合
、フラグメモリ122に出力して、その可能性を示すス
ラグをセットする(ステップS3 l)。
入力文字が濁点・半濁点付き文字の可能性が無い場合は
、制御手段150に通知して次のステップS4の照合処
理を行わせる。
(4)  ステップS4 照合部115は、特徴メモリ113から読み出された入
力文字の各特徴データと辞書114中の各標準文字のデ
ータを照合し、最も良くマツチングした標準文字のデー
タを出力して答メモリ116に格納する。
(5)  ステップS5 マーク検査部131は、答メモリ116より読み出され
た標準文字データ中のマークを検査し、入力文字が濁点
・半濁点の付き得る文字であるか否を検出して、その結
果を制御部150に出力する。
入力文字が濁点・半濁点の付き得る文字でないと検出さ
れた場合は答メモリ116に格納された標準文字データ
が直ちに入力文字に対する正しい認識結果を与えるもの
であるので、制御手段150は、答メモリ116に格納
された標準文字データを答編集部142に転送させ、そ
の認識結果を答として出力させる(ステップ551)。
入力文字が濁点・半濁点の付き得る文字であると検出さ
れた場合は、制御手段150は次のステップS6の処理
を行う。
(6)ステップS6 制御手段150はフラグメモリ122中にセットされた
入力文字に対するフラグを検査して、入力文字が濁点・
半濁点付き文字の可能性があるか否かを検出する。
フラグから入力文字が濁点・半濁点付き文字である苛能
性がないと検出された場合は、答メモリ116に格納さ
れた標準文字データが直ち入力文字に対する正しい認識
結果を与えるものであるので、制御手段150は、答メ
モリ111に格納された標準文字データを答編集部14
2に転送させ、その認識結果を答として出力させる(ス
テップS6 l)。
フラグから入力文字が濁点・半濁点付き文字である可能
性があると検出された場合は、次のステップS7を行う
(7)  ステップS7 濁点・半濁点除去部132は、画像メモリ111に格納
されている入力文字から濁点・半濁点部分を除去して、
文字本体を作成する。例えば、入力文字が1文字形式で
書かれた「ガ」であるとすると、それから濁点が除去さ
れて文字本体「力」が作成され、画像メモリ111に格
納される。
(8)ステップS8 特徴抽出部112は、画像メモリ111から読み出され
た元の入力文字の文字本体のデータに基づいてその特徴
を抽出して、特徴メモリ113に格納する。
(9)ステップS11 照合部115は、特徴メモリ113から読み出された文
字本体の各特徴メモリと辞書114中の各標準文字のデ
ータを照合し、最も良くマツチングした標準文字データ
を出力して答メモリ116に格納する。
00)ステップSh。
濁点・半濁点文字判別部141は、答メモリ116から
読み出された標準文字データ中のマークを検査し、文字
本体が濁点・半濁点付き得る文字であるか否かを判別す
る。
入力文字から文字本体を形成する処理及びその文字本体
の照合処理が正しく行われているならば、文字本体は、
当然に濁点・半濁点の付き得る文字である。
従って、濁点・半濁点文字判別部141によって、文字
本体が濁点・半濁点の付き得る文字であると判別された
場合は、文字本体とマツチングした標準文字データを答
編集部142に転送する。
答編集部142は、文字本体の標準文字データと、制御
手段150より送られたフラグメモリのフ゛ラグに基づ
いて、文字本体に元の濁点又は半濁点を付けたものを入
力文字に対する認識解答として出力する。
もし、濁点・半濁点文字判別部141によって、文字本
体が濁点・半濁点の付得る文字では無いと判別された場
合は、明らかにそれ迄の処理に誤りがあったことになる
ので、答編集部142は読み取り不能という答を出力す
る。
以上の様にして、濁点・半濁点を1文字として記入させ
て濁点・半濁点付き文字の認識を行う従来の辞書を用い
て、1文字形式で書かれた濁点・半濁点付き文字の認識
を行うことが出来る。
〔発明の効果〕
以上説明した様に、本発明にようれば、通常の1文字形
式で書かれた濁点・半濁点付き文字を、それを認識する
為の特別の辞書を新たに設けること無く、従来の濁点・
半濁点を1文字として記入させて文字認識を行う場合の
辞書を用いて認識することが出来る。辞書の容量が増加
しないので、ハードウェアの増加を低く抑えることが出
来る。
また、通常の1文字形式の書体で記入出来るので、入力
をスムースに行うことが出来る。
【図面の簡単な説明】
第1図は本発明の構成のブロック説明図、第2図は本説
明の一実施例の説明図、第3図は同実施例の動作を説明
するフローチャート、を示す。 第1図において、 110・・・特徴抽出手段、120・・・濁点・半濁点
検査手段、130・・・濁点・半濁点除去手段、140
・・・濁点・半濁点付き文字認識手段。 特許出願人  富 士 通 株式会社 第1図 を 左−?Rの亥幾労・1の勤S”f711−イプート第3

Claims (1)

  1. 【特許請求の範囲】 1文字形式で記入された濁点・半濁点付き文字の認識方
    式であって、 (a)濁点と半濁点をそれぞれ1文字として記入させて
    文字認識に必要な特徴を抽出する特徴抽出手段(110
    )と、 (b)抽出された特徴に基づいて、入力文字が濁点・半
    濁点付き文字である可能性があるか否かを検査する濁点
    ・半濁点検査手段(120)と、(c)入力文字が濁点
    ・半濁点付き文字である可能性のある場合は、入力文字
    から濁点・半濁点を除去して文字本体を作成する濁点・
    半濁点除去手段(130)と、 (d)濁点・半濁点が除去された文字本体部分について
    文字認識を行い、認識された文字本体が濁点・半濁点付
    きの文字となり得る場合に、濁点・半濁点検査手段(1
    20)によって検出された濁点又は半濁点を文字本体に
    付したものを入力文字に対する認識解答とする濁点・半
    濁点付き文字認識手段(140)、 を備えたことを特徴とする濁点・半濁点付き文字認識方
    式。
JP60071344A 1985-04-04 1985-04-04 濁点・半濁点付き文字の認識方式 Granted JPS61229177A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60071344A JPS61229177A (ja) 1985-04-04 1985-04-04 濁点・半濁点付き文字の認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60071344A JPS61229177A (ja) 1985-04-04 1985-04-04 濁点・半濁点付き文字の認識方式

Publications (2)

Publication Number Publication Date
JPS61229177A true JPS61229177A (ja) 1986-10-13
JPH0576666B2 JPH0576666B2 (ja) 1993-10-25

Family

ID=13457782

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60071344A Granted JPS61229177A (ja) 1985-04-04 1985-04-04 濁点・半濁点付き文字の認識方式

Country Status (1)

Country Link
JP (1) JPS61229177A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61250793A (ja) * 1985-04-30 1986-11-07 Canon Inc 文字認識装置
JPS647278A (en) * 1987-06-30 1989-01-11 Toshiba Corp Character reader

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61250793A (ja) * 1985-04-30 1986-11-07 Canon Inc 文字認識装置
JPS647278A (en) * 1987-06-30 1989-01-11 Toshiba Corp Character reader

Also Published As

Publication number Publication date
JPH0576666B2 (ja) 1993-10-25

Similar Documents

Publication Publication Date Title
JPH01246678A (ja) パターン認識装置
JPS61229177A (ja) 濁点・半濁点付き文字の認識方式
JPH06215184A (ja) 抽出領域のラベリング装置
JPS592191A (ja) 手書き日本語文の認識処理方式
JP2550012B2 (ja) パタ−ン切り出し及び認識方法
JPH028348B2 (ja)
JP2640472B2 (ja) 文字認識方法
JP2002056357A (ja) 文字認識装置、その方法および記録媒体
JPH09185674A (ja) 誤認識文字検出装置、誤認識文字訂正装置、誤認識文字検出方法、および、誤認識文字訂正方法
JPS58169679A (ja) 文章読取り装置後処理方式
JPS60217487A (ja) 文字認識装置
JP3151866B2 (ja) 英文字認識方法
JP2746345B2 (ja) 文字認識の後処理方法
JP2972443B2 (ja) 文字認識装置
JPS6240574A (ja) ワ−ドプロセツサ
JPH10269319A (ja) オンライン手書き文字入力方法ならびに装置
JPH0318987A (ja) 辞書登録方法
JPS62103784A (ja) 文字読取装置
Asimopoulos Design and implementation of a portable omnifont reading aid for the blind
JPH0573713A (ja) 文字読取装置
JPH096788A (ja) 言語解析方法及びその装置
JPS61220081A (ja) パタ−ン切り出し及び認識方式
JPH03273361A (ja) 電子辞書
JPS5851390A (ja) 活字文字認識装置
JPH0576672B2 (ja)

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees