JPS619758A - カナ漢字変換処理装置 - Google Patents

カナ漢字変換処理装置

Info

Publication number
JPS619758A
JPS619758A JP59130568A JP13056884A JPS619758A JP S619758 A JPS619758 A JP S619758A JP 59130568 A JP59130568 A JP 59130568A JP 13056884 A JP13056884 A JP 13056884A JP S619758 A JPS619758 A JP S619758A
Authority
JP
Japan
Prior art keywords
conversion
candidates
candidate
evaluation
kana
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59130568A
Other languages
English (en)
Inventor
Katsuhiko Fujita
克彦 藤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP59130568A priority Critical patent/JPS619758A/ja
Publication of JPS619758A publication Critical patent/JPS619758A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 技術分野 本発明はカナ漢字変換処理装置に関し、特にカナ漢字変
換処理におけるバックトラック処理の効率化を図るのに
好適なカナ漢字変換処理装置に関する。
従来技術 最近、日本語ワードプロセッサやコンピュータ等への入
力入力方法として、カナ漢字変換方式が主流になってき
た。全文字配列ベンタッチ・タブレットや、カナ2スト
ロークで1漢字を入力する方法もそれぞれの利点から依
然として使用されているが、誰でも使えるという手軽さ
の点で、カナ漢字変換方式が完全にリードしている。
カナ漢字変換方式では、表音文字(平仮名、片仮名、ロ
ーマ字等)で入力された文章を適切な漢字カナ混じり文
にするため、カナ漢字変換用の単語辞書を設けている。
しかし、日本語は文法が複雑で、かつ同音異義語が多数
存在するため、辞書検索により即座に正しい漢字カナ混
じり文を得ることは困難である。したがって、べた書き
入力した場合、文法解析する必要がある。文法解析し、
辞書Mk索により変換候補を抽出すると、その変換候補
のそれぞれに対し前の変換済単語(変換結果)との接続
の可否を検定する。さらに、接続可能な変換候補につい
て何らかのパラメータ(読み長さ、出現頻度、接続の重
み等)を用いて評価を行い、評価の最も高い変換候補を
変換結果とする。
この際、該当する変換候補が単語辞書に1個も存在しな
い場合、および、接続可否検定の結果、変換候補が1個
も残らない場合は、前の解析が誤っている可能性がある
ので、ただちに未登録語処理をすることなく、直前での
解析をやり直す、いわゆるバンクトラック方式を採用し
たシステムがある。バックトラック方式においては、通
常、直前の解析時に最高評価値を得た単語以外の変換候
補を保存しておく。そして、バックトラック時には、直
前の変換結果を廃棄し、接続性の異なる変換候補を評価
値の高い順から順次置き換えて再度解析を行う。
しかし、上記方式は、接続性が異なり、かつ接続可能な
変換結果が得られるまで、変換候補の置き換えを行う必
要があり、最悪の場合は全ての変換候補を置き換えても
、なおかつ接続可能な変換結果が得られないという無駄
があり、バックトラック処理の効率が悪いという問題点
がある。
目     的 本発明の目的は、上記のような従来技術の問題点を解決
するため、バックトラック機能を有するカナ漢字変換処
理装置において、バックトラック処理の効率化を図るこ
とにある。
構   成 以下、本発明の構成を一実施例により説明する。
第1図は、本発明の一実施例によるカナ漢字変換処理装
置のブロック図である。
第1図において、1は入力部、2は変換対象文字列作成
部、3は辞書検索部、4は単語辞書、5は接続可否検定
部、6は接続可否検定表、7は評価部、8はバックトラ
ック制御部、9は出力部。
10は変換候補保存用バッファである。
第2図、第3図は、第1図に示したカナ漢字変換処理装
置の動作を示すフローチャートである。
以下、第2図、および第3図ののフローチャートにより
第1図のカナ漢字変換処理装置の動作を説明する。
日本語による文章は、表音文字(平仮名、片仮名、ロー
マ字等)により入力部lから入力され、その中の変換対
象文字列は、変換対象文字列作成部2により作成される
(201)。作成された変換対象文字列は、その先頭か
ら辞書検索部3により単語辞書4が検索され、その読み
に対応するすべての変換候補が抽出される(20’2)
。辞書検索の結果、該当する変換候補が1個も存在しな
いときは、辞書検索部3は、その旨をバソクトラッ制御
部8に知らせる(203,204)。この時のバックト
ラック制御部8の動作は第3図を用いて後で説明する。
接続可否検定部5は辞書検索部3により抽出された変換
候補について、直前の変換済単語(変換結果)との接続
の可否を接続可否検定表6をもiに検定し、接続可能な
変換候補があるか否かを検定する(205,206)。
もし、直前の変換済単語(変換結果)との接続可能な変
換候補が1個も存在しないときは、バックトラック制御
部8にその旨を知らせる(206,204)。
評価部7は、接続可能な変換候補について、読み長さ、
接続の重み等をパラメータとする評価式を用いて評価を
行い、評価値の最も高い変換候補を変換結果とする(2
07)。一方、評価値が低く、変換結果として採用され
なかった変換候補は、その接続性が上記変換結果と異な
るものについて変換候補保存用バッファ10に格納する
(208)。この後、変換結果を出力部9に出力する(
209)。
第4図は、バックトラック処理のために保存しておく変
換候補を格納する上記変換候補保存用バッファlOの内
容を示す図である。
一換候補W1〜W7は、評価値の高い順に変換候補保存
用バッファ10に保存されている。この際、評価値T 
w 1〜T w 7も一諸に保存されている。なお、P
1〜P7は後続の単語との接続態様の相異による分類で
ある。
評価値T w 1〜Tw7は読みの長さ、接続の重み、
出現頻度等をパラメータとする公知の評価式により算出
することができる。接続態様P1〜P7も種々の分類方
法があるが、いずれの分類方法を採用しても良い。
上記のように、単語辞書4の検索により該当する変換候
補が1個も存在しない場合、および接続可否検定の結果
、接続可能な変換候補が1個も残らない場合は、バック
トラック制御部8の制御のもとにバックトラック処理を
行うが、この際のバックトラック制御部8の制御動作を
第3図のフローチャートにより説明する。
バックトラック制御部8は、該当する変換候補が単語辞
書4に1個も存在しない場合、または、すべての変換候
補が接続不能の場合、まず、バックトラック開始が可能
か否かを判断するためその時点のシステムの状態をチェ
ックする(210)。
バックトラック可能な状態であれば、直前の変換結果の
候補として次に評価値が高く、かつ直前の変換結果と接
続性の異なる変換候補を変換候補保存用バッファlOか
ら読み出す(211,212)。
次に、読み出した次位の変換候補の評価値を閾値Tと比
較する(213)。評価値が閾値Tより大きい場合は、
単語解析準備処理、すなわち、直前の変換結果の置換や
それに伴う諸カウンタ等の変更等を行い(213,21
4)=バックトラックを終了させ、通常のカナ漢字変換
処理への復帰処理を行うことの可否を判断するためシス
テムの状態チェック処理をしく215) 、可であれば
復帰処理を行った後、解析対象文字列作成処理に戻る(
216,217、■)、。
この次位の変換候補に対しても後続可能な変換候補が1
個も存在しなかった場合は、さらにバックトラックを繰
り返し、後続可能な変換候補が見つかるまで、順次評価
値の低い変換候補を置き換える(■→201→202→
203→204→205→206→■)。、 しかし、評価値がある程度以下のものは、その後の解析
の有効性も低いと考えられるので、本実施例では、評価
値に対する閾値Tによりバックトラック時の変換候補を
限定した(213→215→216→217→■)。こ
れにより、バックトラック処理の効率化が図れることは
明らかである。
上記の閾値Tは、評価方式や、解析の有効性、バックト
ラックの効率等を考慮して最も適切な値を設定すべきで
ある。
なお、変換候補保存用バッファ10には、最初から、評
価値が閾値T以下の変換候補のみを保存しておくことに
より、第3図のフローチャートにおける評価値と閾値T
を比較する処理過程213を省略することも可能である
また、一旦、変換結果が確定した後は、変換候補保存用
バッファ10の内容を消去することにより、変換候補保
存用バッファ10のメモリ容量を低減することができる
評価値が高いほど信頼性の高い解析結果を得ることがで
き、評価値が低い場合は解析の有効性が低いと考えられ
るので、本実施例のように、バックトラック時の変換候
補を評価値に対する閾値で限定したとしても、解析時間
の短縮にこそなれ評価値方式の利点を損なうことはない
効   果 以上説明したように、本発明のカナ漢字変換処理装置に
よれば、バックトラック時の変換候補を評価値に対する
閾値により限定することにより、バックトラック処理の
効率化を図ることができる。
【図面の簡単な説明】
第1図は本発明の一実施例によるカナ漢字変換処理装置
のブロック図、第2図、第3図は第1図の動作を示すフ
ローチャート、第4図は第1図における変換候補保存用
バッファの内容を示す図である。 3:辞書検索部、4:単語辞書、5:接続検定部、6:
接続検定部、7:評価部、8:バックトラック制御部、
lO:変換候補保存用バッファ、11:出現確率表。 第    1    図 第   2   図 第   3   図 の 第   4   図

Claims (1)

    【特許請求の範囲】
  1. (1)変換対象文字列の先頭から単語辞書を検索するこ
    とにより変換候補を抽出する手段、抽出された該変換候
    補と直前の変換済単語との接続可否検定を行う手段、接
    続可能な変換候補に対し評価値を与え、最大評価値を得
    た変換候補を変換結果(以後、変換済単語とも言う)と
    する手段、接続可否検定後に変換候補が1個も存在しな
    い場合は直前の変換済単語を廃棄し、変換対象文字列の
    うち、直前の変換済単語に対応する部分以降を改めて変
    換対象として解析を行うバックトラック手段を有するカ
    ナ漢字変換処理装置において、バックトラック時の変換
    候補を前記評価値に対する閾値で限定するバックトラッ
    ク制御手段を設けたことを特徴とするカナ漢字変換処理
    装置。
JP59130568A 1984-06-25 1984-06-25 カナ漢字変換処理装置 Pending JPS619758A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59130568A JPS619758A (ja) 1984-06-25 1984-06-25 カナ漢字変換処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59130568A JPS619758A (ja) 1984-06-25 1984-06-25 カナ漢字変換処理装置

Publications (1)

Publication Number Publication Date
JPS619758A true JPS619758A (ja) 1986-01-17

Family

ID=15037355

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59130568A Pending JPS619758A (ja) 1984-06-25 1984-06-25 カナ漢字変換処理装置

Country Status (1)

Country Link
JP (1) JPS619758A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4942526A (en) * 1985-10-25 1990-07-17 Hitachi, Ltd. Method and system for generating lexicon of cooccurrence relations in natural language
JPH0469766A (ja) * 1990-07-10 1992-03-04 Pfu Ltd かな漢字変換装置
JP2011060308A (ja) * 1999-11-05 2011-03-24 Microsoft Corp 言語入力装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4942526A (en) * 1985-10-25 1990-07-17 Hitachi, Ltd. Method and system for generating lexicon of cooccurrence relations in natural language
JPH0469766A (ja) * 1990-07-10 1992-03-04 Pfu Ltd かな漢字変換装置
JP2011060308A (ja) * 1999-11-05 2011-03-24 Microsoft Corp 言語入力装置
JP4920154B2 (ja) * 1999-11-05 2012-04-18 マイクロソフト コーポレーション 言語入力ユーザインタフェース

Similar Documents

Publication Publication Date Title
US4777600A (en) Phonetic data-to-kanji character converter with a syntax analyzer to alter priority order of displayed kanji homonyms
US6704698B1 (en) Word counting natural language determination
US5745602A (en) Automatic method of selecting multi-word key phrases from a document
JPS619758A (ja) カナ漢字変換処理装置
US7343280B2 (en) Processing noisy data and determining word similarity
KR100559472B1 (ko) 영한 자동번역에서 의미 벡터와 한국어 국소 문맥 정보를사용한 대역어 선택시스템 및 방법
JPH1139313A (ja) 文書自動分類システム、文書分類向け知識ベース生成方法及びそのプログラムを記録した記録媒体
JP4953459B2 (ja) 文字ベクトルを用いた略語生成装置、方法及びプログラム
JPS61184681A (ja) カナ漢字変換処理装置
JPS59221732A (ja) カナ漢字変換処理装置
JPS6172361A (ja) かな漢字変換装置
JP2506809B2 (ja) 日本語形態素解析装置
JPH0350669A (ja) 情報処理装置
Tang et al. A boundary-oriented Chinese segmentation method using n-gram mutual information
Noro et al. Building a large-scale Japanese syntactically annotated corpus for deriving a CFG
JPH0683809A (ja) 文書処理装置
JPS6133570A (ja) カナ漢字変換処理装置
JPH05135096A (ja) 形態素解析方式
JPH0630100B2 (ja) 仮名漢字変換方式
JPS60207948A (ja) カナ漢字変換処理装置
JPS62284481A (ja) 文字認識後処理方式
JPH0567074A (ja) かな漢字変換装置
JPH04279971A (ja) 日本語文章処理装置
JPH05290027A (ja) 仮名漢字変換装置
JPS59221733A (ja) カナ漢字変換処理装置