JPS6175467A - 仮名漢字変換方式 - Google Patents

仮名漢字変換方式

Info

Publication number
JPS6175467A
JPS6175467A JP59195698A JP19569884A JPS6175467A JP S6175467 A JPS6175467 A JP S6175467A JP 59195698 A JP59195698 A JP 59195698A JP 19569884 A JP19569884 A JP 19569884A JP S6175467 A JPS6175467 A JP S6175467A
Authority
JP
Japan
Prior art keywords
kana
storage device
word
dictionary storage
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP59195698A
Other languages
English (en)
Other versions
JPH0630100B2 (ja
Inventor
Yoshitoshi Yamauchi
佐敏 山内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP59195698A priority Critical patent/JPH0630100B2/ja
Publication of JPS6175467A publication Critical patent/JPS6175467A/ja
Publication of JPH0630100B2 publication Critical patent/JPH0630100B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 技術分野 本発明は仮名漢字変換方式、詳細には、日本語ワードプ
ロセ、す等のような自然言語処理技術を用いた仮名漢字
変換方式に関する。
従来技術 従来、日本語ワードゾロセッサ等のような日本語処理装
置においては、オペレータが操作する入力装置に入力し
た仮名列に対して、仮名と漢字の混在した仮名漢字の変
換を行っている。このような仮名漢字変換方式の中で、
特に漢字単語と漢字単語とを接続して形成する複合語の
処理の問題が大きくなってきている。
特に、特公昭58−4378号公報に開示されているよ
うに、組合せにより単語辞書を検索し、単語同士の合成
が可能かどうかの判定手段を有し、それの判定結果によ
シ単語同士の合成の確定、非確定を行なう方式や、特開
昭56−38665号公報に開示されているように、単
語間同士の結び付きの強さを検定して複合語とな9うる
かどうかの判8を行なう方式がある。
しかしながら、それらの方式では単語同士の結びつきの
自由度が、特に同音異義語の中では大きいので、余程厳
しい判定基準を設けていないことには誤った判定をし、
誤解析のもとどなってしまう。実際上は、その判定基準
を厳しくするのにも限度があり、誤解析の率が高く実用
的には向いていない欠点があった。
目   的 本発明はこのような・従来技術の欠点を解消し、同音異
義語の判別を容易にしかも確実に行なうことのできる仮
名漢字変換方式を提供することを目的とする。
構  成 本発明は上記の目的を達成させるため入力装置により入
力された仮名文字列を単語辞書記憶装置内で検索するこ
とによシ単語単位の変換候補語を抽出して漢字と仮名の
混った仮名漢字に変換する仮名漢字変換方式において、
隣接単語の組合せを複合語として抽出して、その読みを
検定することによって同音異義語の判別を行なうことを
特徴としたものである。
以下、本発明の実施例に基づいて具体的に説明する。
第1図は本発明を日本語ワードプロセッサに適用したと
きの機能別全体ブロック図である。
第1図において、本実施例はキーが−ド1、入力文字バ
ッファ2、仮名漢字変換制御部3、単語辞書記憶装置4
、複合語辞書記憶装置5、品詞活用表部6、接続重み表
部7、評価器8、出力文字バッファ9、陰極線管(CR
T) 10、文書ファイル部11、プリンタ18から構
成さ・れている。
キー?−ド1は、入力装置の一例で、ひらがな、かたか
な、アルファベット等の文字、数字、記号等の表音文字
を入力する表音文字キー、仮名漢字変換を指示する変換
キー等のファンクションキーを有する。入力文字列バッ
ファ2はキー?−ド1から次々に入力される入力仮名文
字列を一時的に蓄積し、仮名漢字変換処理を終了した入
力仮名文字列を部分的に次々と消去する。
仮名漢字変換制御部3は仮名漢字の処理子゛順のプログ
ラムを記憶するメモリと、入力文字列バッファ2からデ
ータを取込んだシ、そのデータをもとにして後述の単記
や複合語辞書記憶装置3,4を検索したシしてデータを
取込む際のバッファと、品詞活用表部6から列(うけ)
と行(かか9)の位置のデータを取込んだシ、接続重み
表部7から該当する接続重みのデータを取込む際のバッ
ファと、評価器8から演算した評価値とか第1位候補語
(候補語の中で評価最大の候補語)や第2位候補語を記
憶しておくメモリと、ワークエリアとを含み、後述する
ように他の機能の制御する。
単語辞書記憶装置4は表音文字である入力カナ文字を表
記するのに必要な表記文字である単語(たとえば、自立
語、付属語、接辞語や助数詞等。また、動詞、形容詞の
活用形すべてを各−単語として扱う。)の読み、その表
記、その品詞、その頻度ランク、その出力項位学習、複
合語辞書記憶装置5のアドレスもしくはシーケンスナン
バーとなるポインタの項目を格納している。
複合語辞書記憶装置5は単語辞書記憶装置4中に格納さ
れている単語が複数つらなって1つの概念を表わす複合
語で、隣υどうしの単語の関係を記述している辞書。例
えば、「超音速飛行機」の2つの単語同士の組合わせで
ある「超−高速」、「高速−飛行」、「飛行−機」の組
合せで複合語を構成することを表現する。
この辞書記憶装置の表現方法はいろいろとあるが、第1
として単語辞書記憶装置4中の各単語ノアドレスモジく
はシーケンシャルナンバーを複合語の構成となるように
対で記録しておく、第2に単語辞書記憶装置4中の一イ
ンク欄に複合語辞書記憶装置5の対応語の先頭格納アド
レスを記録しておき、複合語辞書記憶装置5の中には複
合語を形成している後続単語の単語辞書記憶装置4中の
アドレスもしくはシーケンシャルナンバーを記録してお
く。なお、「超高速飛行機」等のように後続の単語が複
数ある場合は連続して記録しておく。その場合、他の前
出単語に対応する後続単語との境界の識別は先頭の1ビ
ツトを0と1とを交互に変化させて使用することによシ
行なわれる。第3に第2のように複合語辞書記憶装置5
の中には後続単語の単語辞書記憶装置4中のアドレス等
に代シにその単語の読みを格納しておく。他の前出単語
に対応する後続単語の読みとの境界の識別は第2の方式
と同様でよい。本実施例では第1の方式でまず説明し、
次に第3の方式で説明する。
品詞活用表部6は単語辞書記憶装置4を検索して抽出し
た単語の品詞とその単語の前後に接続する単語の品詞で
もって後述の接続重み表部7の接続重み表の行(かか9
)と列(うけ)の場所を決定するための索引表を格納し
ている。
なお、体言系は「かかり」と「うけ」の行番号、列番号
のみが記録しであるが、用言系は語尾をも記録しである
接続重み表部7は品詞の行と列とが配置され、それらの
交差部分にマトリックス状に単語間の接続の程度を示す
数値が配置されている。品詞活用表部6で指定した行番
号と列番号との交差部の数値がそれらの品詞を有する単
語の接続の強さを示す。その中の数値としては、0;接
続不可。1;接続することはあるが非常にまれである。
2ニ一般的に接続する。3;特に接続が強い◎というよ
うに4ランクに設定しである。
評価器8は単語辞書記憶装置4から抽出した単語のよみ
長、頻度ランク、また、接続重み表部7から抽出した単
語間の接続重み等の・ぐラメータによシ、扱っている単
語がその位置にありうる尤らしさを評価する。なお、評
価演算する式の一例としては、 単語のよみ長×3+頻度ランク+(接続重み)2;評価
値 を用いる 出力文字列バッファ9は評価器8で評価された単語を評
価値順に一時的に蓄積したり、確定した単語を順次確定
順にメモリする。
CRT 10は表示装置の1例で、出力文字列バック7
9に一時的に蓄積された未確定の単語列で一番評価値の
高い単語例を表示して、オペレータからの確定かどうか
の確認をうるための表示装置。
文書ファイル部11はCRT 10で確認、修正された
単語列を文書的にファイル化して蓄積する記憶装置であ
る。
プリンタ12は文書ファイル部11の内容をプリントア
ウトする装置。
第2図は単語辞書記憶装置4の内容の一部を模式的に示
した図、第3図は複合辞書記憶装置5の内容の3種類の
実施例で、第3図(a)は前述の第1の方式で、左側に
は、該当単語のポインタに相当する複合語辞書記憶装置
5のアドレスが記録されており、真中には、該当単語の
単語辞書記憶装置4の中のアドレスが記録されており、
右側にはその該当単語の後続単語の単語辞書記憶装置4
の中のアドレスが記録されている。
第3図(b)は前述の第2の方式で、境界識別フラグが
1ビツトで左側に記録されており、右側には、後続単語
の単語辞書記憶装置4の中におけるアドレスが記録され
ている。第3図(C)は前述の第3の方式で、左側に同
じく境界識別フラグが、右側に後続単語の読みが記録さ
れている。
第4図は品詞活用表部6の内容の一部を模式的に示した
図で、「うけ」の欄及び「かかシ」の欄に列番号、行番
号が記録されている。
第5図は接続重み表部7の接続重み表を概念的に示した
模式図で、行には品詞活用表のかかり番号(行番号)を
示し、列には品詞活用表のうけ番号(列番号)を示し、
それらの番号の行列部には4ランクの接続重みの数値が
格納されている。
第6図は本実施例の一例を示すフローチャートである。
次に、「最近は多くの兼業農家がいます。」の仮名漢字
変換文を作成する例で説明する。「最近は多くの」迄の
解析が進んでいて、その文の末尾の「の」は格助詞の「
の」として切シ出されているとする。この時点では品詞
活用表部60表の格助詞「の」の7瀾の「かかシ」から
接続重み表部7の行(かかシ)番号を指定している状態
である。
次に、キーデート1から「けんぎようのうか・・・」と
次々と入力され、一旦入力文字パッファ2に蓄積される
。この入力時にはキーデート1から1文字入力がある毎
に(S20) 、記号か文字かの判断がなされ(S21
) 、文字の場合、n文字たまったかどうかの判断がな
される(822)。記号の場合は次のプロセスに進行す
るが、文字の場合、所定のn文字が入力文字バッファ2
にバッファされる迄は次のプロセスに進行しない。
なお、それらの判断は、仮名漢字変換制御部3で行なう
。「けんぎょうのうか・・・」という具“合いにn文字
(たとえばn=6)が入力文字バッファに蓄積されると
、「け」、「けん」、「けんぎよう」、「けんぎようの
」の種類の文字列の組でちる単語辞書検索用の仮名文字
列が仮名漢字変換制御部3で作成される(S23)。仮
名漢字変換制御部3はそれらの検索用仮名文字列のよみ
に従って単語辞書記憶装置4を検索しく524)、「毛
」、「気」、「券」、「県」・・・「兼業」、「検校」
等の表記文字の単語を候補語としてあげる。その時、第
2図に示されているそれらの各単語の品詞、頻度ランク
、出力順位、ポインタ等のr−夕を取出す。
次に、複合語辞書記憶装置5のアドレスに対応するポイ
ンタがあるかどうかの判定を仮名漢字変換制御部3は行
なう(S25)。たとえば、表記「検校」の単語のポイ
ンタは65535番で、これは16進表示でFFFFに
相当し、この場合、複合語辞書記憶装置5のアドレスは
ないので複合語辞書記憶装置5を検索する必要はなく評
価処理に進む。
表記「兼業」の単語のポインタは7533番で、これは
65535番とは異なるので、複合語があシ、仮名漢字
変換制御部3は複合語辞書記憶装置5のそのアドレスで
検索する(S26)。
複合語辞書記憶装置5のアドレス7533番の記憶位置
には第3図<a)に示しであるようにアドレス組合せに
よる複合語が格納されている。
1つは11379−17634で、このアドレスで単語
辞書記憶装置4を検索すると「兼業−考」となり、その
読みは、「けんぎようしゃ」となる。その読みと入力文
字バッファ2内の仮名文字列の「けんぎょうのう」とを
仮名漢字変換制御部3で照合すると明らかに不一致とな
る。
したがって、次のアドンス組合せ11379−2311
5をもとにして単語辞書記憶装置4を検索すると「兼業
〜農家」となり、その読みは「けんぎようのうか」とな
る。その読みと入力文字バッファ内の仮名文字列の「け
んぎようのうか」とを仮名漢字変換制御部3で照合する
と明らかに一致する。
これは一致するので、その単語の「農家」の品詞である
64(一般名詞)と頻度ランクである4と出力順位1と
ポインタ65535とが仮名漢字変換制御部3により単
語辞書記憶装置よシ取出されてバッファされる(S2S
)。この複合語候補として取出された単語の「農家」は
、次のようにして新たに1つの単語、「兼業農家」とし
て評価器8で評価される。読み長は「兼業」である前単
語と「農家」である後続単語の両者の和で、8であシ、
頻度ランクは両単語の内で低い方で「兼業」の頻度ラン
ク3である。「兼業農家」の複合語の前の単語「の」と
の接続重みを検定する場合、仮名漢字変換制御器3は「
の」に接続する単語である「兼業」の品詞がす変名詞で
あることがわかっているから、品詞活用表部6内の表に
したがうて接続重み表の列(うけ)番号を取出して接続
重み表部7に転送し、同様に格助詞「の」の行(かか9
)番号をすでに接続重み表部7に転送しであるから、そ
れらの列及び行番号から接続重み表の接続重み(本実施
例の場合、2とする。)を仮名漢字変換制御器3は取出
す。
評価器8は評価式に従がって上記数値を用いて「兼業農
家」の評価値を演算した結果、31となった。他の単語
、たとえば表記「兼業」、「検校」についても上記と同
様に評価演算したところ、22.20となった(829
)。したがって、出力文字バッファ9には「兼業農家」
、「兼業」、「検校」の順位で蓄積される。
ここで、評価値の一番高い単語である「兼業農家」を表
示する語として反に確定し、行(かかシ)番号を指定す
る品詞は後続路の「農家」の一般名詞を用い、品詞活用
表部6の表から行(かかシ)番号を設定する。ここで、
仮名漢字変換制御器3は最優先の単語の評価値、即ち、
候補語の中の最大の評価値を積算し、その積算値がある
閾値を越えたらトリガニ信号を発しく540)。このト
リカー信号を出力文字バッファ9が入力するとその積算
した評価値の単語迄の未確定単語列を確定して(S41
) 、それを文書ファイル部11は所定の記憶位置に記
憶する。
もし、トリが一信号が発生しなかった場合には、未だ未
確定のまま、次の仮名文字列の解析に移る。
入力文字バッファ2内の仮名文字列は「けんぎようのう
か」を削除し「かいます。」とな9、この場合、句読点
の記号があるのでn文字なくても被検索文字列作成に移
る(S23)。上記と同様に、「が」、「かい」、「が
いま」、「かいます」の単語辞書検索用の文字列が仮名
漢字変換制御器3内で作成され、第6図のフローチャー
トにしたがって、上記と同様に仮名漢字変換制御器3が
単語辞書記憶装置4を検索し、「が」の格助詞、「概」
、「害」、「該」等の単語を候補語としてあげる。
上記と同様の手順によって格助詞の「が」が取出され、
次に補助動詞の「い」が取出され、次に丁寧助動詞の「
まず」が取出されて解析され、句読点によシトリガー信
号が発せられ、それらの変換語が確定され、「最近は多
くの兼業農家がいます。」の仮名漢字変換された文が文
書ファイル11に蓄積される。それをプリントアウトさ
せる場合にはプリンタ12に転送すればよい。
効果 本発明によれば同音異義語があっても、その後続単語が
複合語を形成するかどうかを検索することによシ容易に
しかも確実に同音異義語の判別ができ、その判別率が向
上した。
上記実施例では、複合語辞書記憶装置5の構成は上記第
2の方式を用いて説明したが、それは第3の方式をとっ
ても同様に解析できる。
たとえば、単語辞書記憶装置4に格納されている「兼業
」のポインタ7533番を取出し、複合語辞書記憶装置
5のアドレス7533番で、境界識別フラグが「l」と
なっている(第3図(c)参照のこと)部分の読み「じ
ゃ」と「のうか」とを取出す。それらの読みと入力文字
バッファ2内の仮名文字列の「のりか」とを照合すれば
「のりか」が後続単語となる。それを仮名漢字変換制御
部3は単語辞書記憶装置4で検索し、表記「農家」を抽
出する。これによシ「兼業農家」の複合語が単語として
評価される。また、「検校」についてはポインタが65
535番で複合語となりえず、そのままである。したが
って「兼業農家」が最優先候補語となシ、同音異義語の
「兼業」と「検校」とが確実に判別される。
【図面の簡単な説明】
第1図は本発明を日本語ワードプロセッサに適用した一
実施例の機能別ブロック全体図、第2図は第1図の単語
辞書記憶装置の内容の一部を模式的に示した図、 第3図は第1図の複合語辞書記憶装置の内容の一部を模
式的に示した各方式の図、 第4図は第1図の品詞活用表部の内容の一部を模式的に
示した概略図、 第5図は第1図の接続重み表部の内容の一部を模式的に
示した概略図、 第6図は第1図の処理工程を示すフローチャートである
。 主要部分の符号の説明 3・・・仮名漢字変換制御部 4・・単語辞書記憶装置 5・・・複合語辞書記憶装置 9・・・出力文字バッファ             
−城 特許出願人  株式会社 リ コー 一二コ 第3図 (a)         (b)       (c)
第4図 第5図 第6図 「−千当一通、S20

Claims (1)

  1. 【特許請求の範囲】 1、表記用の単語に関する情報を格納している単語辞書
    記憶装置を有し、入力装置により入力された仮名文字列
    をもとに上記単語辞書記憶装置を検索して上記仮名文字
    列に関連する単語を抽出することにより上記仮名文字列
    を漢字と仮名の混在した仮名漢字に変換する仮名漢字変
    換方式において、 複数の漢字単語の組合せで形成される複合語に関するデ
    ータを格納している複合語辞書記憶装置と、上記単語辞
    書記憶装置を検索して抽出した同音異義語の中で複合語
    に関する情報の有無を判別し、該情報にもとづいて複合
    語辞書記憶装置を検索したデータにもとづいて複合語を
    形成し、該複合語のよみと上記仮名文字列のよみとを検
    定する仮名漢字変換制御手段とを有し、該仮名漢字変換
    制御手段は上記複合語辞書記憶装置を検索して形成した
    複合語について、そのよみが上記仮名文字列のよみと一
    致するかどうかを検定して上記同音異義語の判別を行な
    うことを特徴とする仮名漢字変換方式。 2、特許請求の範囲第1項記載の方式において、 上記複合語辞書記憶装置の記憶内容は上記単語辞書記憶
    装置のアドレスもしくはシーケンスナンバーの組合せで
    複合語を記憶していることを特徴とする仮名漢字変換方
    式。
JP59195698A 1984-09-20 1984-09-20 仮名漢字変換方式 Expired - Lifetime JPH0630100B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59195698A JPH0630100B2 (ja) 1984-09-20 1984-09-20 仮名漢字変換方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59195698A JPH0630100B2 (ja) 1984-09-20 1984-09-20 仮名漢字変換方式

Publications (2)

Publication Number Publication Date
JPS6175467A true JPS6175467A (ja) 1986-04-17
JPH0630100B2 JPH0630100B2 (ja) 1994-04-20

Family

ID=16345504

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59195698A Expired - Lifetime JPH0630100B2 (ja) 1984-09-20 1984-09-20 仮名漢字変換方式

Country Status (1)

Country Link
JP (1) JPH0630100B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH041847A (ja) * 1990-04-19 1992-01-07 Nec Corp かな漢字変換装置
US9079744B2 (en) 2009-08-26 2015-07-14 Horizon International Inc. Sheet folding apparatus

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS592125A (ja) * 1982-06-29 1984-01-07 Comput Basic Mach Technol Res Assoc 仮名漢字変換方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS592125A (ja) * 1982-06-29 1984-01-07 Comput Basic Mach Technol Res Assoc 仮名漢字変換方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH041847A (ja) * 1990-04-19 1992-01-07 Nec Corp かな漢字変換装置
US9079744B2 (en) 2009-08-26 2015-07-14 Horizon International Inc. Sheet folding apparatus

Also Published As

Publication number Publication date
JPH0630100B2 (ja) 1994-04-20

Similar Documents

Publication Publication Date Title
JPS6231467A (ja) 文章作成装置
JP2013117978A (ja) タイピング効率向上のためのタイピング候補の生成方法
WO2005089215B1 (en) Phonetic and stroke input methods of chinese characters and phrases
Szanser Automatic error-correction in natural languages
JPS6175467A (ja) 仮名漢字変換方式
JP3531222B2 (ja) 類似文字列検索装置
JPH0130173B2 (ja)
JPS61184676A (ja) 仮名漢字変換方式
JPS6177954A (ja) 仮名漢字変換方式
JPH0363101B2 (ja)
JPS61184674A (ja) 仮名漢字変換方式
JPH0785040A (ja) 表記不統一検出方法およびかな漢字変換方法
Szanser Automatic error-correction in natural languages
JPS5998236A (ja) 日本文入力装置
JPH0567080A (ja) かな漢字変換装置
JPH05324610A (ja) 住所表記漢字入力装置
JPH0128977B2 (ja)
JPS6029823A (ja) 適応型記号列変換方式
JPS61184682A (ja) 仮名漢字変換装置
JPH06309302A (ja) 漢字変換装置
JPH0512252A (ja) かな漢字変換装置およびその方法
JPS628258A (ja) 複合語を処理可能な日本語処理装置
JPH0546612A (ja) 文章誤り検出装置
JPH0131229B2 (ja)
JPH0460754A (ja) 仮名漢字変換方法

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term