JPH0676098A - データ処理装置 - Google Patents
データ処理装置Info
- Publication number
- JPH0676098A JPH0676098A JP2401595A JP40159590A JPH0676098A JP H0676098 A JPH0676098 A JP H0676098A JP 2401595 A JP2401595 A JP 2401595A JP 40159590 A JP40159590 A JP 40159590A JP H0676098 A JPH0676098 A JP H0676098A
- Authority
- JP
- Japan
- Prior art keywords
- character
- dakuten
- semi
- voiced
- recognized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Discrimination (AREA)
- Document Processing Apparatus (AREA)
Abstract
接する2個の文字枠に記入されても、その濁点または半
濁点付き文字を1個の文字として処理することを目的と
する。 【構成】 文字認識部11によって別個に認識された2
つの文字を1個の濁点または半濁点付き文字に変換する
合成機構14を備えており、この合成機構14は独立し
た1文字として認識された濁点または半濁点の直前文字
が濁点または半濁点付きの有効な文字である場合、その
直前文字を濁点または半濁点付きの1文字に変換する。
Description
し、特に文字認識装置で認識された全角文字の濁点、お
よび半濁点を扱うデータ処理装置に関する。
おいては、全角文字の濁点付き仮名文字(例えば、
「が」、「ブ」)、および半濁点付き仮名文字(例え
ば、「ぱ」、「ピ」)をあらかじめ決められたピッチの
文字枠内(帳票用紙)に記入する場合、同一枠内に1文
字として記入し、データ処理装置内では認識装置による
その文字の認識の結果を1個の文字コード(JIS X
0208コード)として扱っている。
ト、数字、カタカナ)と称される半角文字については、
たとえば片仮名の濁点または半濁点付き文字を記入する
際に濁点と半濁点を別枠に記入する方式が一般に採用さ
れている。このため、このような方式で記入された文字
を前述の文字認識装置で読み取ると、別枠に記入された
濁点と半濁点が正常に認識できず、誤って他の全角文字
(例えば、「い」とか「O」)に認識されてしまう場合
があった。したがって、データ処理装置では、本来1個
の文字コードとして扱うべき濁点または半濁点付き文字
を、2個の文字コードとして扱うという事態が生じ、文
字認識装置で読み取った文字を正常に処理することがで
きなくなる欠点があった。
は、全角文字の濁点または半濁点付き文字を半角文字と
同様の記入方式で濁点または半濁点を別枠に別けて記入
すると、データ処理装置では1個の濁点または半濁点付
き文字として扱うことができない欠点があった。
もので、濁点または半濁点付き文字が隣接する2個の文
字枠に記入されても、その濁点または半濁点付き文字を
1個の文字として処理することができるデータ処理装置
を提供することを目的とする。
所定ピッチの文字枠内で全角文字の平仮名、片仮名、濁
点、および半濁点を独立した文字として認識する文字認
識手段を備え、この文字認識手段で認識された認識デー
タの処理を行うデータ処理装置において、前記濁点また
は半濁点が独立した文字として認識された際、その認識
文字の直前文字が濁点または半濁点付きの有効な文字か
否かを判定する手段と、前記直前文字が濁点または半濁
点付きの有効な文字と判定された際、前記直前文字の認
識結果を濁点または半濁点付き文字に変換する手段とを
具備することを特徴とする。
の結果を濁点または半濁点付き文字に変換する手段を備
えており、独立した文字として認識された濁点または半
濁点の直前文字が濁点または半濁点付きの有効な文字で
ある場合には、その直前文字が濁点または半濁点付きの
1文字に変換される。したがって、濁点または半濁点付
き文字が隣接する2個の文字枠に別個に記入されても、
その濁点または半濁点付き文字を1個の文字として処理
することが可能となる。
する。
処理装置が示されている。このデータ処理装置は、帳票
等に記載された文字の認識結果を扱うものであり、文字
認識部(OCR)11とデータ処理部12とから構成さ
れている。
ピッチの文字枠内に記入される全角文字を光学的に読取
って認識するものであり、1文字枠内に記入された平仮
名、片仮名、濁点、および半濁点は独立した文字として
認識される。この文字認識部(OCR)11は、認識結
果をコード(例えば、JIS規格のX0208コード)
に変換し、データ処理部12に供給する。JISのX0
208コードを使用した場合、例えば、濁点はコード
「212BH」として出力され、半濁点はコード「21
2CH」として出力される。
R)11で認識された文字コードの中から独立した文字
として認識された濁点または半濁点を検出して、その濁
点または半濁点をその直前の文字に合成する機能を有し
ている。
構13と合成機構14が設けられており、制御機構13
は、文字認識部(OCR)11で得られた認識結果(文
字コード)を合成機構14に入力し、合成機構14から
出力される合成結果を受けとって処理する。合成機構1
4は、図2に示す合成処理ルーチンを実行して、制御機
構13から受け取った濁点または半濁点の文字コードの
合成を行う。次に、図2のフローチャートを参照して、
合成機構14の動作を説明する。合成機構14は、制御
機構13から受け取った文字コードに対して1文字単位
で次のような処理を実行する。
った文字コードが濁点に対応する文字コード(212B
H)または半濁点に対応する文字コード(212CH)
であるかを判断し(ステップS1)、濁点または半濁点
であった場合にはステップS2の処理に進み、濁点また
は半濁点のどちらでも無かった場合には、制御機構13
から受け取った文字列の次の文字について濁点または半
濁点の文字か否かの判定処理を行う。
た場合には、ステップS2において、その濁点の直前の
文字が濁点付きが有効な文字か否か、つまり、「か」
行、「さ」行、「た」行、「は」行、「カ」行、「サ」
行、「タ」行、「ハ」行のいずれかに属す文字または
「ウ」であるか否かが判断される。濁点の直前文字がこ
れら「か」行、「さ」行、「た」行、「は」行、「カ」
行、「サ」行、「タ」行、「ハ」行のいずれかに属す文
字または「ウ」であった場合には、合成機構14は、そ
の直前文字を濁点付き文字に対応する文字コードに変換
し、またその濁点1文字分が削除されるように濁点が存
在していた1文字分を詰める処理を行う(ステップS
3)。この場合、その直前文字について他の認識候補文
字が存在している場合には、それら認識候補文字につい
ても濁点付きが可能な文字に対しては、濁点付き文字に
対応する文字コードに変換する処理が行われる。次い
で、合成機構14は、ステップS3において1文字分詰
めた事によって生じた後続文字列のずれを補正する等の
処理を実行する(ステップS4)。
の文字が濁点付きが有効な文字ではないと判定された場
合には、その濁点文字が単独で処理され、表示または印
字されるという事態を防止するために、その濁点文字を
リジェクト文字として扱い、それを例えばクエスション
マーク等の特殊文字のコードに変換する(ステップS
5)。
ことが認識された場合には、ステップS2において、そ
の半濁点の直前の文字が半濁点付きが有効な文字か否
か、つまり、「は」行のまたは「ハ」行のいずれかに属
す文字であるか否かが判断される。半濁点の直前文字が
これら「は」行または「ハ」行のいずれかに属す文字で
あった場合には、合成機構14は、その直前文字を半濁
点付き文字に対応する文字コードに変換し、またその半
濁点1文字分が削除されるように半濁点が存在していた
1文字分を詰める処理を行う(ステップS3)。この場
合、その直前文字について他の認識候補文字が存在して
いる場合には、それら認識候補文字についても半濁点付
きが可能な文字に対しては、半濁点付き文字に対応する
文字コードに変換する処理が行われる。次いで、合成機
構14は、ステップS3において1文字分詰めた事によ
って生じた後続文字列のずれを補正する等の処理を実行
する(ステップS4)。
の文字が濁点付きが有効な文字ではないと判定された場
合には、その濁点文字が単独で処理され、表示または印
字されるという事態を防止するために、その濁点文字を
リジェクト文字として扱い、それを例えばクエスション
マーク等の特殊文字のコードに変換する(ステップS
5)。そして、このような処理が制御機構13から入力
された文字列データすべてに対して終了したことが認識
されると(ステップS6)、合成機構14はその文字列
の合成処理結果を制御機構13に出力する。図3には、
合成機構14で実行される合成処理の具体例が示されて
いる。ここでは、用語「ゴマ」の「ゴ」について濁点が
帳票(シート)の別枠に別個に記入された場合について
説明する。
「コ」に対応する文字コード(2533)の他、例えば
「ク」に対応する文字コード(252F)、および
「ウ」に対応する文字コード(2526)が次候補文字
として文字認識部11によって認識される。この場合、
合成機構14は、濁点の直前文字「コ」が濁点付きが可
能な文字であるので、「コ」に対応する文字コード(2
533)を「ゴ」に対応する文字コード(2534)に
変換すると共に、濁点の1文字を詰めて「マ」に対応す
る文字コード(255E)を1文字分ずらす。
も、これらが濁点付きが可能な文字であるので合成を行
い、「ク」に対応する文字コード(252F)を「グ」
に対応する文字コード「2530」に、「ウ」に対応す
る文字コード(2526)を「ヴ」に対応する文字コー
ド(2574)に変換する処理も行う。そして、これら
変換結果はすべて制御機構12にわたされ、画面表示や
印刷等の処理がなされる。
置においては、文字認識の結果を濁点または半濁点付き
文字に変換する合成機構14を備えており、独立した文
字として認識された濁点または半濁点の直前文字が濁点
または半濁点付きの有効な文字である場合には、その直
前文字が濁点または半濁点付きの1文字に変換される。
したがって、濁点または半濁点付き文字が隣接する2個
の文字枠に別個に記入されても、その濁点または半濁点
付き文字を1個の文字として処理することが可能とな
る。
濁点付き文字の記入を、半角(ANK文字)文字の濁点
付きまたは半濁点付き文字と同様の方法で行っても正常
に文字の認識処理を行えるので、利用者は、全角、半
角、の区別に煩わされる事なく、仮名の記入を行うこと
が可能となる。
濁点または半濁点付き文字が隣接する2個の文字枠に記
入されても、その濁点または半濁点付き文字を1個の文
字として処理することができる。
成を示すブロック図。
フローチャート。
る文字コードの変換動作の一例を示す図。
14…合成機構部。
Claims (2)
- 【請求項1】 所定ピッチの文字枠内で全角文字の平仮
名、片仮名、濁点、および半濁点を独立した文字として
認識する文字認識手段を備え、この文字認識手段で認識
された認識データの処理を行うデータ処理装置におい
て、 前記濁点または半濁点が独立した文字として認識された
際、その認識文字の直前文字が濁点または半濁点付きの
有効な文字か否かを判定する手段と、 前記直前文字が濁点または半濁点付きの有効な文字と判
定された際、前記直前文字の認識結果を濁点または半濁
点付き文字に変換する手段とを具備することを特徴とす
るデータ処理装置。 - 【請求項2】 前記直前文字の認識結果が濁点または半
濁点付き文字に変換された際、前記認識文字を削除する
と共に、その削除した文字に後続する文字列を1文字分
詰める手段をさらに具備することを特徴とする請求項1
記載のデータ処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2401595A JPH0676098A (ja) | 1990-12-12 | 1990-12-12 | データ処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2401595A JPH0676098A (ja) | 1990-12-12 | 1990-12-12 | データ処理装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0676098A true JPH0676098A (ja) | 1994-03-18 |
Family
ID=18511425
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2401595A Pending JPH0676098A (ja) | 1990-12-12 | 1990-12-12 | データ処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0676098A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102646201A (zh) * | 2011-02-21 | 2012-08-22 | 富士施乐株式会社 | 字符识别设备和字符识别方法 |
-
1990
- 1990-12-12 JP JP2401595A patent/JPH0676098A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102646201A (zh) * | 2011-02-21 | 2012-08-22 | 富士施乐株式会社 | 字符识别设备和字符识别方法 |
US8731298B2 (en) | 2011-02-21 | 2014-05-20 | Fuji Xerox Co., Ltd. | Character recognition apparatus, character recognition method, and computer readable medium storing program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6658397B2 (en) | Computer method and apparatus for storing and reproducing handwritten characters | |
JPH0330177B2 (ja) | ||
JPH0676098A (ja) | データ処理装置 | |
JP2740575B2 (ja) | 文字処理装置 | |
US5481663A (en) | Word processors for performing an automatic layout process | |
JPS607514A (ja) | ワ−ドプロセツサ | |
JPH07105217A (ja) | 入力文字自動補正装置 | |
JPH0844723A (ja) | 文書作成装置または文書作成方法 | |
JPH05210671A (ja) | 文書作成装置 | |
JPH0554180A (ja) | 光学式文字読取装置における帳票フオーマツト定義方式 | |
JPS6120176A (ja) | ロ−マ字−中国語変換装置 | |
JPS58181672A (ja) | インパクトプリンタ | |
JPH0589140A (ja) | 文書作成装置 | |
JPH0668136A (ja) | 機械翻訳システム | |
JPH0664571B2 (ja) | 文字処理方法 | |
JPS59223844A (ja) | 音声ワ−ドプロセツサ | |
JPS5851332A (ja) | 発音符付文字の入力方法 | |
JPH08132684A (ja) | 点字版下出力システム及び点字版下出力方法 | |
JPH04369074A (ja) | 文書処理装置 | |
JPH05257582A (ja) | 入力制御方式 | |
JPH09288664A (ja) | 文字コード変換装置 | |
JPS63263559A (ja) | 日本語情報処理装置 | |
JPH04268942A (ja) | 文書作成装置 | |
JPS61175850A (ja) | 文字処理装置 | |
JPH06231123A (ja) | 外字処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Effective date: 20040524 Free format text: JAPANESE INTERMEDIATE CODE: A971007 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040601 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040901 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20041102 |
|
A61 | First payment of annual fees (during grant procedure) |
Effective date: 20041201 Free format text: JAPANESE INTERMEDIATE CODE: A61 |
|
R150 | Certificate of patent (=grant) or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |