JPS59116882A - 日本語文書修正装置 - Google Patents

日本語文書修正装置

Info

Publication number
JPS59116882A
JPS59116882A JP57228849A JP22884982A JPS59116882A JP S59116882 A JPS59116882 A JP S59116882A JP 57228849 A JP57228849 A JP 57228849A JP 22884982 A JP22884982 A JP 22884982A JP S59116882 A JPS59116882 A JP S59116882A
Authority
JP
Japan
Prior art keywords
character
characters
rejected
japanese
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57228849A
Other languages
English (en)
Inventor
Masaki Yamashina
正樹 山階
Hisatada Kimura
木村 久正
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP57228849A priority Critical patent/JPS59116882A/ja
Publication of JPS59116882A publication Critical patent/JPS59116882A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (1)発明の属する分骨の説明 本発明は、漢字OCR等の認識技術を用いた入力システ
ムにおいて、リジェクト文字の修正を効率化する装置に
関するものであり、その修正操作に多大の操作時間を要
する。認識系で候補なしりジエクトとなつ丸文字に1日
本語処理で候補を効率よく出力することを目的としてい
る。
(2)従来の技術の説明 従来、この種の装置は、第1図に示すように構成されて
いた。第1図においてlは、認識系からの出力を格納す
る読取結果ファイル、2は修正データを入力できる機能
を持つ入力部、3は、読取結果および修正結果と認識系
でリジェクトされた文字の、<タンとを表示する機能を
持つ表示部、4は、単語単位および漢字単位の変換機能
を持つかな漢字変換部、5は、修正した結果を格納する
修正結果ファイル、6は装置を制御する制御部である。
第1図に示す構成の装置において、漢字で候補なしのり
ジエクトが生じた場合、オペレータは。
リジェクト文字のバタンから、入力すべき漢字を決定し
、漢字の読み等を用いて、目的の漢字を入力する必要が
あるため9選択のみで修正可能な候補ありのりジエクト
文字の修正に比べて、多大の時間を要するという問題が
あった。
(3)発明の目的 本発明は、一般文では、一度使用された用語。
特に名詞は、複数回、使用される場合が多いという性質
を利用して、認識系で候補なしのりジエクトとなった文
字についても1日本語処理で候補を出力することを特徴
とし、その目的は、修正操作を効率化することにある。
特に読取った文書を知識として用いるため、候補の正解
率を高くできる特徴がある。
(4)発明の構成および作用の説明 ゛ 第2図は1本発明の一実施例であって、21は認識
系からの出力を格納する入力文書ファイル。
22は修正データを入力できる機能を持つ入力部。
23は読取結束、修正結果と認識系でリジェクトされた
文字のパタンとを表示する機能を持つ表示部、24はI
n単位および漢字単位の変換機能を持つかな漢字変換部
、25は修正した結果を格納する修正結果ファイル、2
6は修正済の読取結果を蓄積する淳積部、27は種々の
語句を収録した語句テーブル、2日は字種の変わり目を
検出して。
リジェクト文字を含む語句を切り出し、リジェクト文字
をマスクした語句をキーとして蓄積部26゜語句テーブ
ル27をサーチし2語句の中でリジェクト文字以外の部
分がキーと等しい語句が蓄積部あるいは語句テーブルに
存在する場合には、マスクした文字に対応する文字をリ
ジェクト文字の候補として出力する日本語処理部、29
は上記した読取結果ファイル部21.修正結果ファイル
部25゜入力部221表示部23.かな漢字変換部24
゜蓄積部261語句テーブル27.処理部28.を制御
する制御部である。
本装置の動作を以下に示す例文を用いて説明する。
例文 「日本語情報処理システムにおける大きな課題の1つに
入力の効率化がある。そのため1種々の日本語情報処理
技術が、入力を効率化するために周込られている。」 上記の例文で、「・・・・・・効率化がある。」までの
修正が終了すると、これらの文書は、蓄積部26に格納
される。 、第3図に示すように、「情」が候補なしり
シエクト文字であった場合1日本語処理部2Bは2字種
の変わり目を検出して「日本語回報処理技術」を切り出
す。次に、リジェクト文字をマスクし、「日本語ろ和処
理技術」をキーとして、蓄積部26をサーチする。蓄積
部26に該当する語句がない場合には、末尾から1文字
づつ削除した語句をキーとして蓄積部26をサーチする
。第3図に示す例は、末尾の2文字を削除した時にキー
と一致する場合であり、「情」がリジェクト文字の候補
として出力される。桁数が1になっても該当する語句が
無い場合には、候補を上げられない事を制御部29に通
知する。
第4図に示す例の場合、「日本語情報処理」が蓄積部2
6にあり2日本語処理部2日は「囲術」が単語であると
推定する。そこで、「圀術」をキーとして蓄積部26と
語句テーブル27をサーチし、キーと一致する語句を出
力する。この場合。
蓄積部26には該当の語句がなく9語句テーブル2フに
収録されている「技術」、「学術」等の語句が頻度順に
収録されており、「技」、「学」をリジェクト文字の候
補として出力する。
これらの場合1本発明では蓄積部26に修正結果を格納
して、候補の出力および単語の切り出しに用りるため、
候補の曖昧さを少なくすることができる。
上記の方法で語の単位を推定し、リジェクト文字が一字
の単語と推定された場合、それらの語句は、接辞や用言
である場合が多く、テ・−プルのサーチからだけでは、
リジェクト文字の候補を出力することは困難であり1日
本語処理部2日は制御部29に、候補を出力できない事
を通知する。
次に、制御部29は、処理部2日から、リジェクト文字
の候補を受は取り表示部23に表示する。
そのため、オはレータは、認識系から出力された候補と
同様の方法で目的の文字を選択して、リジェクト文字を
修正することができる。
また、認識系からも、処理部2日からもリジェクト文字
の候補が出力されない場合、制御部29は、この事を表
示部23にガイダンスし、オペレータはかな漢字変換部
24を用いて、目的の文字に修正することができる。
(5)効果の説明 以上説明したように1本発明では、認識系で候補なしの
りジェツトとなった文字についても日本語処理で候補を
出力することが可能であり、修正効率の向上が計れる利
点がある。また9本発明で述べた日本語処理部は、認識
系からりジェツト文字の候補として出力された文字の優
先度の決定に利用できることは言うまでもない〇
【図面の簡単な説明】
第1図は従来装置の構成図、第2図は本発明実施例の構
成図、第3図および第4図は実施例の機能を説明するた
めの動作何回である。 図中、21は入力文書ファイル、22は入力部。 23は表示部、24はかな漢字変換部、25は修正結果
ファイル、26は蓄積部、27は語句テーブル、2日は
11本鋼処理部、29は制御部を表わすO 特許出願人  日本電信電話公社 代l’l1人弁理士    森  1)    寛予 
1 図 す?図

Claims (1)

    【特許請求の範囲】
  1. 認識系入力装置からの出力として得られるリジェクト文
    字を含む日本語文書データを修正した結果を蓄積する蓄
    積部と1種々の語句を収録した語句テーブルと、リジェ
    クト文字を含む日本語文書データから、リジェクト文字
    を含む語句を字種の変わり目を用いて切り出し、さらに
    リジェクト文字をマスクした語句をキーとして蓄積部お
    よび語句テーブルをサーチし、マスクした文字以外の文
    字列と1等し込語句が蓄積部あるいは語句テーブルに格
    納されている場合には、蓄積部あるいは語句テーブルに
    収録されている語句で、キー内のマスクした文字、に対
    応する文字をリジェクト文字の候補として出力する日本
    語処理部と、認識部あるいは日本語処理部から出力され
    るリジェクト文字に対する候補文字の選択および文字入
    力によりリジェクト文字を修正する機能を持つ修正部か
    ら構成されることを特徴とする日本語文書修正装置。
JP57228849A 1982-12-23 1982-12-23 日本語文書修正装置 Pending JPS59116882A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57228849A JPS59116882A (ja) 1982-12-23 1982-12-23 日本語文書修正装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57228849A JPS59116882A (ja) 1982-12-23 1982-12-23 日本語文書修正装置

Publications (1)

Publication Number Publication Date
JPS59116882A true JPS59116882A (ja) 1984-07-05

Family

ID=16882831

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57228849A Pending JPS59116882A (ja) 1982-12-23 1982-12-23 日本語文書修正装置

Country Status (1)

Country Link
JP (1) JPS59116882A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63157292A (ja) * 1986-12-22 1988-06-30 Yokogawa Electric Corp 手書き漢字ocr装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63157292A (ja) * 1986-12-22 1988-06-30 Yokogawa Electric Corp 手書き漢字ocr装置

Similar Documents

Publication Publication Date Title
EP0330170A2 (en) European language processing machine with a spelling correction function
JPS59116882A (ja) 日本語文書修正装置
JP2821143B2 (ja) 形態素分解装置
JP2745484B2 (ja) 手書文字認識方法および装置
JPH03209564A (ja) 文献データ登録方法
JP2746345B2 (ja) 文字認識の後処理方法
JPS62117060A (ja) 文字・音声入力変換方式
JPH0262659A (ja) 日本文訂正候補文字抽出装置
JPS6356756A (ja) コレクト機能付欧文作成装置
JPH05324610A (ja) 住所表記漢字入力装置
JPS63138479A (ja) 文字認識装置
JPS6120176A (ja) ロ−マ字−中国語変換装置
JPH0460754A (ja) 仮名漢字変換方法
JPH01281561A (ja) 日本文訂正候補文字抽出方法
JPH0554145B2 (ja)
JPH0359761A (ja) 英単語綴りの誤り訂正装置
JPH10134150A (ja) 文字認識結果の後処理方法
JPH0546612A (ja) 文章誤り検出装置
JPH01288919A (ja) 英単語検索装置
JPH0458381A (ja) 光学的文字読取装置
JPH05225183A (ja) 日本文単語誤り自動検出装置
JPH10187693A (ja) かな漢字変換方法及び装置と前記方法を実施するプログラムを記憶した記憶媒体
JPH04260162A (ja) 連文節かな漢字変換方式
JPH06180695A (ja) かな漢字変換方式
JPH03278194A (ja) 文字認識処理方式