JPH0676098A - データ処理装置 - Google Patents

データ処理装置

Info

Publication number
JPH0676098A
JPH0676098A JP2401595A JP40159590A JPH0676098A JP H0676098 A JPH0676098 A JP H0676098A JP 2401595 A JP2401595 A JP 2401595A JP 40159590 A JP40159590 A JP 40159590A JP H0676098 A JPH0676098 A JP H0676098A
Authority
JP
Japan
Prior art keywords
character
dakuten
semi
voiced
recognized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2401595A
Other languages
English (en)
Inventor
Nobunori Sakano
伸則 坂野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2401595A priority Critical patent/JPH0676098A/ja
Publication of JPH0676098A publication Critical patent/JPH0676098A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 この発明は、濁点または半濁点付き文字が隣
接する2個の文字枠に記入されても、その濁点または半
濁点付き文字を1個の文字として処理することを目的と
する。 【構成】 文字認識部11によって別個に認識された2
つの文字を1個の濁点または半濁点付き文字に変換する
合成機構14を備えており、この合成機構14は独立し
た1文字として認識された濁点または半濁点の直前文字
が濁点または半濁点付きの有効な文字である場合、その
直前文字を濁点または半濁点付きの1文字に変換する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明はデータ処理装置に関
し、特に文字認識装置で認識された全角文字の濁点、お
よび半濁点を扱うデータ処理装置に関する。
【0002】
【従来の技術】一般に、全角文字を扱う文字認識装置に
おいては、全角文字の濁点付き仮名文字(例えば、
「が」、「ブ」)、および半濁点付き仮名文字(例え
ば、「ぱ」、「ピ」)をあらかじめ決められたピッチの
文字枠内(帳票用紙)に記入する場合、同一枠内に1文
字として記入し、データ処理装置内では認識装置による
その文字の認識の結果を1個の文字コード(JIS X
0208コード)として扱っている。
【0003】ところが、通称ANK文字(アルファベッ
ト、数字、カタカナ)と称される半角文字については、
たとえば片仮名の濁点または半濁点付き文字を記入する
際に濁点と半濁点を別枠に記入する方式が一般に採用さ
れている。このため、このような方式で記入された文字
を前述の文字認識装置で読み取ると、別枠に記入された
濁点と半濁点が正常に認識できず、誤って他の全角文字
(例えば、「い」とか「O」)に認識されてしまう場合
があった。したがって、データ処理装置では、本来1個
の文字コードとして扱うべき濁点または半濁点付き文字
を、2個の文字コードとして扱うという事態が生じ、文
字認識装置で読み取った文字を正常に処理することがで
きなくなる欠点があった。
【0004】
【発明が解決しようとする課題】上記のように従来で
は、全角文字の濁点または半濁点付き文字を半角文字と
同様の記入方式で濁点または半濁点を別枠に別けて記入
すると、データ処理装置では1個の濁点または半濁点付
き文字として扱うことができない欠点があった。
【0005】この発明はこのような点に鑑みてなされた
もので、濁点または半濁点付き文字が隣接する2個の文
字枠に記入されても、その濁点または半濁点付き文字を
1個の文字として処理することができるデータ処理装置
を提供することを目的とする。
【0006】
【課題を解決するための手段および作用】この発明は、
所定ピッチの文字枠内で全角文字の平仮名、片仮名、濁
点、および半濁点を独立した文字として認識する文字認
識手段を備え、この文字認識手段で認識された認識デー
タの処理を行うデータ処理装置において、前記濁点また
は半濁点が独立した文字として認識された際、その認識
文字の直前文字が濁点または半濁点付きの有効な文字か
否かを判定する手段と、前記直前文字が濁点または半濁
点付きの有効な文字と判定された際、前記直前文字の認
識結果を濁点または半濁点付き文字に変換する手段とを
具備することを特徴とする。
【0007】このデータ処理装置においては、文字認識
の結果を濁点または半濁点付き文字に変換する手段を備
えており、独立した文字として認識された濁点または半
濁点の直前文字が濁点または半濁点付きの有効な文字で
ある場合には、その直前文字が濁点または半濁点付きの
1文字に変換される。したがって、濁点または半濁点付
き文字が隣接する2個の文字枠に別個に記入されても、
その濁点または半濁点付き文字を1個の文字として処理
することが可能となる。
【0008】
【実施例】以下、図面を参照して本発明の実施例を説明
する。
【0009】図1にはこの発明の一実施例に係るデータ
処理装置が示されている。このデータ処理装置は、帳票
等に記載された文字の認識結果を扱うものであり、文字
認識部(OCR)11とデータ処理部12とから構成さ
れている。
【0010】文字認識部(OCR)11は、帳票の所定
ピッチの文字枠内に記入される全角文字を光学的に読取
って認識するものであり、1文字枠内に記入された平仮
名、片仮名、濁点、および半濁点は独立した文字として
認識される。この文字認識部(OCR)11は、認識結
果をコード(例えば、JIS規格のX0208コード)
に変換し、データ処理部12に供給する。JISのX0
208コードを使用した場合、例えば、濁点はコード
「212BH」として出力され、半濁点はコード「21
2CH」として出力される。
【0011】データ処理部12は、文字認識部(OC
R)11で認識された文字コードの中から独立した文字
として認識された濁点または半濁点を検出して、その濁
点または半濁点をその直前の文字に合成する機能を有し
ている。
【0012】すなわち、データ処理部12には、制御機
構13と合成機構14が設けられており、制御機構13
は、文字認識部(OCR)11で得られた認識結果(文
字コード)を合成機構14に入力し、合成機構14から
出力される合成結果を受けとって処理する。合成機構1
4は、図2に示す合成処理ルーチンを実行して、制御機
構13から受け取った濁点または半濁点の文字コードの
合成を行う。次に、図2のフローチャートを参照して、
合成機構14の動作を説明する。合成機構14は、制御
機構13から受け取った文字コードに対して1文字単位
で次のような処理を実行する。
【0013】すなわち、合成機構14は、まず、受け取
った文字コードが濁点に対応する文字コード(212B
H)または半濁点に対応する文字コード(212CH)
であるかを判断し(ステップS1)、濁点または半濁点
であった場合にはステップS2の処理に進み、濁点また
は半濁点のどちらでも無かった場合には、制御機構13
から受け取った文字列の次の文字について濁点または半
濁点の文字か否かの判定処理を行う。
【0014】例えば、濁点の文字であることが認識され
た場合には、ステップS2において、その濁点の直前の
文字が濁点付きが有効な文字か否か、つまり、「か」
行、「さ」行、「た」行、「は」行、「カ」行、「サ」
行、「タ」行、「ハ」行のいずれかに属す文字または
「ウ」であるか否かが判断される。濁点の直前文字がこ
れら「か」行、「さ」行、「た」行、「は」行、「カ」
行、「サ」行、「タ」行、「ハ」行のいずれかに属す文
字または「ウ」であった場合には、合成機構14は、そ
の直前文字を濁点付き文字に対応する文字コードに変換
し、またその濁点1文字分が削除されるように濁点が存
在していた1文字分を詰める処理を行う(ステップS
3)。この場合、その直前文字について他の認識候補文
字が存在している場合には、それら認識候補文字につい
ても濁点付きが可能な文字に対しては、濁点付き文字に
対応する文字コードに変換する処理が行われる。次い
で、合成機構14は、ステップS3において1文字分詰
めた事によって生じた後続文字列のずれを補正する等の
処理を実行する(ステップS4)。
【0015】また、ステップS2において、濁点の直前
の文字が濁点付きが有効な文字ではないと判定された場
合には、その濁点文字が単独で処理され、表示または印
字されるという事態を防止するために、その濁点文字を
リジェクト文字として扱い、それを例えばクエスション
マーク等の特殊文字のコードに変換する(ステップS
5)。
【0016】一方、ステップS1で半濁点の文字である
ことが認識された場合には、ステップS2において、そ
の半濁点の直前の文字が半濁点付きが有効な文字か否
か、つまり、「は」行のまたは「ハ」行のいずれかに属
す文字であるか否かが判断される。半濁点の直前文字が
これら「は」行または「ハ」行のいずれかに属す文字で
あった場合には、合成機構14は、その直前文字を半濁
点付き文字に対応する文字コードに変換し、またその半
濁点1文字分が削除されるように半濁点が存在していた
1文字分を詰める処理を行う(ステップS3)。この場
合、その直前文字について他の認識候補文字が存在して
いる場合には、それら認識候補文字についても半濁点付
きが可能な文字に対しては、半濁点付き文字に対応する
文字コードに変換する処理が行われる。次いで、合成機
構14は、ステップS3において1文字分詰めた事によ
って生じた後続文字列のずれを補正する等の処理を実行
する(ステップS4)。
【0017】また、ステップS2において、濁点の直前
の文字が濁点付きが有効な文字ではないと判定された場
合には、その濁点文字が単独で処理され、表示または印
字されるという事態を防止するために、その濁点文字を
リジェクト文字として扱い、それを例えばクエスション
マーク等の特殊文字のコードに変換する(ステップS
5)。そして、このような処理が制御機構13から入力
された文字列データすべてに対して終了したことが認識
されると(ステップS6)、合成機構14はその文字列
の合成処理結果を制御機構13に出力する。図3には、
合成機構14で実行される合成処理の具体例が示されて
いる。ここでは、用語「ゴマ」の「ゴ」について濁点が
帳票(シート)の別枠に別個に記入された場合について
説明する。
【0018】図示のように、文字「コ」については、
「コ」に対応する文字コード(2533)の他、例えば
「ク」に対応する文字コード(252F)、および
「ウ」に対応する文字コード(2526)が次候補文字
として文字認識部11によって認識される。この場合、
合成機構14は、濁点の直前文字「コ」が濁点付きが可
能な文字であるので、「コ」に対応する文字コード(2
533)を「ゴ」に対応する文字コード(2534)に
変換すると共に、濁点の1文字を詰めて「マ」に対応す
る文字コード(255E)を1文字分ずらす。
【0019】また、次候補文字「ク」、「ウ」について
も、これらが濁点付きが可能な文字であるので合成を行
い、「ク」に対応する文字コード(252F)を「グ」
に対応する文字コード「2530」に、「ウ」に対応す
る文字コード(2526)を「ヴ」に対応する文字コー
ド(2574)に変換する処理も行う。そして、これら
変換結果はすべて制御機構12にわたされ、画面表示や
印刷等の処理がなされる。
【0020】以上のように、この実施例のデータ処理装
置においては、文字認識の結果を濁点または半濁点付き
文字に変換する合成機構14を備えており、独立した文
字として認識された濁点または半濁点の直前文字が濁点
または半濁点付きの有効な文字である場合には、その直
前文字が濁点または半濁点付きの1文字に変換される。
したがって、濁点または半濁点付き文字が隣接する2個
の文字枠に別個に記入されても、その濁点または半濁点
付き文字を1個の文字として処理することが可能とな
る。
【0021】このため、全角文字の濁点付きあるいは半
濁点付き文字の記入を、半角(ANK文字)文字の濁点
付きまたは半濁点付き文字と同様の方法で行っても正常
に文字の認識処理を行えるので、利用者は、全角、半
角、の区別に煩わされる事なく、仮名の記入を行うこと
が可能となる。
【0022】
【発明の効果】以上詳記したようにこの発明によれば、
濁点または半濁点付き文字が隣接する2個の文字枠に記
入されても、その濁点または半濁点付き文字を1個の文
字として処理することができる。
【図面の簡単な説明】
【図1】この発明の一実施例に係るデータ処理装置の構
成を示すブロック図。
【図2】図1に示したデータ処理装置の動作を説明する
フローチャート。
【図3】図1に示したデータ処理装置によって実行され
る文字コードの変換動作の一例を示す図。
【符号の説明】
11…文字認識部、12…データ処理部、13…制御機構部、
14…合成機構部。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 所定ピッチの文字枠内で全角文字の平仮
    名、片仮名、濁点、および半濁点を独立した文字として
    認識する文字認識手段を備え、この文字認識手段で認識
    された認識データの処理を行うデータ処理装置におい
    て、 前記濁点または半濁点が独立した文字として認識された
    際、その認識文字の直前文字が濁点または半濁点付きの
    有効な文字か否かを判定する手段と、 前記直前文字が濁点または半濁点付きの有効な文字と判
    定された際、前記直前文字の認識結果を濁点または半濁
    点付き文字に変換する手段とを具備することを特徴とす
    るデータ処理装置。
  2. 【請求項2】 前記直前文字の認識結果が濁点または半
    濁点付き文字に変換された際、前記認識文字を削除する
    と共に、その削除した文字に後続する文字列を1文字分
    詰める手段をさらに具備することを特徴とする請求項1
    記載のデータ処理装置。
JP2401595A 1990-12-12 1990-12-12 データ処理装置 Pending JPH0676098A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2401595A JPH0676098A (ja) 1990-12-12 1990-12-12 データ処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2401595A JPH0676098A (ja) 1990-12-12 1990-12-12 データ処理装置

Publications (1)

Publication Number Publication Date
JPH0676098A true JPH0676098A (ja) 1994-03-18

Family

ID=18511425

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2401595A Pending JPH0676098A (ja) 1990-12-12 1990-12-12 データ処理装置

Country Status (1)

Country Link
JP (1) JPH0676098A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102646201A (zh) * 2011-02-21 2012-08-22 富士施乐株式会社 字符识别设备和字符识别方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102646201A (zh) * 2011-02-21 2012-08-22 富士施乐株式会社 字符识别设备和字符识别方法
US8731298B2 (en) 2011-02-21 2014-05-20 Fuji Xerox Co., Ltd. Character recognition apparatus, character recognition method, and computer readable medium storing program

Similar Documents

Publication Publication Date Title
US6658397B2 (en) Computer method and apparatus for storing and reproducing handwritten characters
JPH0330177B2 (ja)
JPH0676098A (ja) データ処理装置
JP2740575B2 (ja) 文字処理装置
US5481663A (en) Word processors for performing an automatic layout process
JPS607514A (ja) ワ−ドプロセツサ
JPH07105217A (ja) 入力文字自動補正装置
JPH0844723A (ja) 文書作成装置または文書作成方法
JPH05210671A (ja) 文書作成装置
JPH0554180A (ja) 光学式文字読取装置における帳票フオーマツト定義方式
JPS6120176A (ja) ロ−マ字−中国語変換装置
JPS58181672A (ja) インパクトプリンタ
JPH0589140A (ja) 文書作成装置
JPH0668136A (ja) 機械翻訳システム
JPH0664571B2 (ja) 文字処理方法
JPS59223844A (ja) 音声ワ−ドプロセツサ
JPS5851332A (ja) 発音符付文字の入力方法
JPH08132684A (ja) 点字版下出力システム及び点字版下出力方法
JPH04369074A (ja) 文書処理装置
JPH05257582A (ja) 入力制御方式
JPH09288664A (ja) 文字コード変換装置
JPS63263559A (ja) 日本語情報処理装置
JPH04268942A (ja) 文書作成装置
JPS61175850A (ja) 文字処理装置
JPH06231123A (ja) 外字処理装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Effective date: 20040524

Free format text: JAPANESE INTERMEDIATE CODE: A971007

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040601

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040901

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20041102

A61 First payment of annual fees (during grant procedure)

Effective date: 20041201

Free format text: JAPANESE INTERMEDIATE CODE: A61

R150 Certificate of patent (=grant) or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees