JPS603017A

JPS603017A - カナ漢字変換処理装置

Info

Publication number: JPS603017A
Application number: JP58108983A
Authority: JP
Inventors: Katsuhiko Fujita; 克彦藤田; Yasuyuki Numata; 泰之沼田; Yoshitoshi Yamauchi; 佐敏山内
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1983-06-17
Filing date: 1983-06-17
Publication date: 1985-01-09

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】技術分野本発明は邦文ワートプロセソサでγに用い６．１しるカ
ナ漢字変換処理方式に関し、特に複合語に対する変換候
補（以下、単に「候？＋［ｉ　Ｊという）単語抽出の妥
当性を向上可能としたカナ漢字変換処理力式に関するも
のである。

従来技術カナ漢字変換処理方式には、近Ｑ“、従来の誇字部指定
方式２文節指定方式等にυ１１えて、連続する復数の自
立語の読みに対応するカナ文字列の入力を許す方式、更
には、入力カー１文字列に区切り等の制限を付けない方
式が用いら、１Ｌ　；ＩＮ、Ｊ、うにな−）で来ている
。

これらのカナ漢字変換処理方式の多くにノ１ミ通する問
題として、複合語処理における同音語判別において誤り
が発生するという問題がある。例えば、「こうそくひこ
う」というカナ文字列が入力された場合を考えると、こ
の文字列内におけるｑｔ語の切れ目（以下、「／」で示
す）は「こうそく／ひこう」のように明らかになるとし
ても、上記「こうそ′：、Ｊがｒ校則」、「拘束Ｊ、ｒ
高速」等の内のどの５ｔｌであるかは明らかでなく、ま
た、「ひこうＪも「飛行」か「非行」か明らかではない
。

この問題に対する１つの対応策として、「高速」と「飛
行」とにポインタで結んておき、「高速」力１抽出され
た後に「・υ・こう」という入力が続し＼た場合番；は
、「飛行」を同音異字語中℃最優先するとり）う方式が
堤案されている。

しかしながら、この方式においては、最初の文字列「こ
うそく」を変換処理する際に「高速」以外σ〕語が抽出
された場合には、川沿、されたポインタ（よ利用される
ことがなく、例えは、「拘束非行」等の妥当でない複合
語が出力されることになると５＞う問題があった。

目　的本発明は上記事情に鑑みてなさ」したものη１、その目
的とするところは、にｆｉ　、＞ｋのカナ漢字変換処理
方式における上述の如き問題を解消し、複合語に列する
候補単語抽出の妥当性を向−に可能と（、た力す漢字変
換処理方式を提０（することにある。

構成以下、本発明の構成を′３：、施例により詳細ｔこ説明
する。

第１図は本発明の一実施例を示すカナ漢字変換処理装置
のブロック図である。図において、１は図示されていな
い入力部から人カメれだ文字列を貯える入力文字列バノ
フコ・、２はｍ話辞−計９を検索して候補単語を抽出す
る辞１検索部、３は該８１′書検索部２により抽出さＪ
した単語と、その直Ｉ肪のＪｔ語との接続の可否を判定
する接ｉ′１．可否判定部である。また、４は該接続可
否判定部：１により接続可と判定さＪまた単語の読み長
、頻度ランク、出現先度等を基に、各単語の先度鉗合評
ｆｉｌｌｉを行う先度総合評価部、５は該光度総合Ｊ１
“創部・１により最高の評価を与えられたＡ１ｊ語を保
存する出力え字列（♀右部、６は」−記最高の評価をＩ
ｊえらＡ（、た甲５ｊ（と同音同語類または同γ？同品
詞のＡ１ｊ語（以下、甲、に「同音語」という）を保存
する同音語イλ″、右部、７　Ｉｌｌ：　Ｉ：記各部を
制御する制御部、８は接合、；バ刊定部、１０は複合語
ポインタ領域を示している。

なお、ここで、「３類」とは、後述する如く、ａ＋＋＋
分された品詞と字種とを組合わせたものをいう、。

第２図は上記出力文字列保存部５の内容の一例を示すも
のである１図中、１はメモリ中の位買右−示し、Ｎ（１
）は」二元同音語の数、ｒ（ｊ）は上記３類、また、Ｎ
　Ｏは単語に固有の番号である。

第３１１は」、記同音Ｊ５保存部６の同音語保存用メモ
リの一部を示すものであり、各同音語について］二記出
力文字列保右部５中の位置ｌ（■、■、・　・）とり４
応する如く設けられている。

第４図は上記複合語ポインタ領域１０の内容の一例を示
すものであり、対応する２つの数字の左側は複合語の１
）；１部分の、また、右側は後部分の１）；ｊ記単語固
有の番号Ｎ　Ｏを示している。

上述の如く構成さ九た木実施例の動作を以下説明する。

以下の説明においては、こうそくひこうがかのうだ。

という人力文字列の処理を例に挙げる。

辞書検索部２では、上記人力文字列に対してその先頭か
ら辞書検索部２による辞＠検索を行い、すへての候補単
語を抽出する。この場合、例えば。

［拘束ｊ、ｒ校則Ｊ、ｒ高速」、「光速」、「酵素」、
・・・・・「子」等を抽出する。こ九らの単語はは次に
前記接続可否判定部３で文中の直前の単語との接続の可
否を検定さ、ｈる。ここでは、文頭なのこすへての！ｉ
Ｌ　ｊｊ？ｊが接続可となる。

次に、こＪしらの１１語は光度総合、：で創部４で先度
評価を受ける３ここてＩ′Ｊ、「拘束」が最も高い評価
４与えら）したものとする。こＡ１により、１−拘束」
の辞書情報等は出力文字列保存部５に送らＡ（る。Ａ−
た、これと同１１．７に、」二記「拘束Ｊの同音語、こ
の場合、「校則」、「高速−１，「光速」か、０１Ｊ記
出力文字列区存部５内での上記「拘束」の位置（・Ｉ′
ｒ　）　１．：　２Ｊ応する。

同音語保存部Ｇ内の保存用メモリに１１ｊえらＪｔ　；
：Ｉ。

以上で、前記入力文字列の先頭か１゛）「＜」１：テの
解析が一応終了したので、「びごうかかの）た」という
文字列に対して、」二連と同様の解１ｊｉ′を行う、。

なお、言うまでもなく、上述の杓子（」１処Ｊ５Ｐの制
御口。

前記制御部７がｔｌ−っている。

上記解析処理を繰り返し、最後の「　（句読点）」が入
力され処理さｊした時点においては、出力文′？列保存
右部には、第２図に示すように！ｌｔ語が格納されてい
る。また、同音語保存部６の内部には。

例えば、第３図に示すように同音語が格納されている。

」二記句読点が処理されたという情報が制御部７に送ら
れると、該制御部７は複合語判別部８を起動する。複合
語判別部８は、まず、初期設定を行った後、−１−記出
力文字列保右部５中の、名詞または接辞の連続をＬ記出
力の先頭から順にチェックし、「名詞／名詞」、「名詞
／接辞」、「接辞／名詞」のいずれかを光見した場合に
は、ソ肛ぞれの同音語数を調べ、どちらかか１以上てあ
、ｊｔば複合語判別処理を実行する。この処理は、句ｉ
ｆ、ｊｅ点に達するまで行われる。第５図は５この処理
のアルゴリズムの一例を示すものである。。

以下、」二記複合語判別処理の詳細を説明する。

この例では、「拘束」が名詞、「Ｊｉ行ｊが名詞なので
、複合語判別処理が開始される。まず、同音語保存部６
の「拘束」に対応する同音語保存部メモリ中のｔｌＬ語
および「拘束月１身の前記Ｎ　Ｏが調、・〈られる。

この場合には、１０１〜１０４の数字か、複合語判別部
８内に一時的に記憶される。次に、「非行」に対応する
同音語保存用メモリ中の単語および「非行」自身の前記
ＮＯ２この場合、２０１．　：！０２かｔＩ旨１口”Ｉ
　）：１部８内に一時的に記憶される。

続いて、前記複合語ポインタ領域１０を検索＝）−る。

この場合の検索のキーは、複合、：ｔｌの前部分の数字
（この場合、１０１へ１０４）てあり、こＡ１．Ｌ−よ
−て上記領域を参照し、後部分の数字に２旧まノーは２
（Ａ２が存在する数字の組を倹素する。この場−【１Ｆ
−は、」１記検索により、１０３−２０２の紺７）１見
出ごＪしる。これは「高速飛行」に対応するものである
□、もし・、１記２つの数字の絹が児出さコシなか、た
喝菖ＩＪは制御を制御部７に戻す。

」二連の例においては、［高速）に（ｊ　Ｊが見出さ、
１【、だので、出力文字列保存部５の内容’Ｊｒ　’ｌ
’！：換える。すなわち、「拘束」に換えて「高速」を
昇速７）１、「１口１」に換えて「飛行」を書込む。こ
のとさ、−とれγれに対応する同音語保存部６の同音ａ
１１促存用ノモ「Ｊの内容は消去する。こオシに対応し
、て、ｉ；Ｊ記出入１γ字列保存部５中の同音語数Ｎ　
（ｉ）も１に書換える。

これで複合語判別処理を終了し、ＩＴＪび、連れのチェ
ックに戻る。

なお、単語の抽出および評佃ｉ′Ｊｉ法は、必ずしもを
」−２実施例に示した方法に限らＪしるものではなく、
最長−教法、いおり）る最尤評饋法等によっても良いこ
とはごうまでもない。また、句読点以外の文字、単ａ１
１．記号によってト記複合語判別部を起動させるように
４１！！成しても良いことも言うまでもない。

上記実施例においては、出力文字列保存部には、既に表
記まで決定さｊした、すなわち、１語ごどの同音語選択
が行わ、１シた形でＩｌｉ語が格納されており、同音語
は別の保存用メモリに格納されている態様を示したが、
別の実施態様どしては、同語類または同品詞の単語につ
いては、１８ｇごとの同音語選択を行わず、１１語に区
切ることのみを行っておき、複合語判別処理をｔゴっだ
後に表記に変換するように構成することも可能である。

この場合には、同音語は同一領域に格納しておくことが
できる。

更に、複合語判別処理後、同音Ｊ１（保存用メモリの内
容を＠換えることは、必ずしも必要なことではなく、こ
の場合、前記出力文字列保存部中の同音語の数Ｎ（」）
の値の−１・換えは不要である。

効　果以上述べた如く、本発明によ、ｔシば、ｔμ合語をモ゛
η成する単語について、それらの間の接続性を予めポイ
ンタにより−ｔｇえておくようにしたので、ＰＭ合語に
対する候補単語抽出の妥当性を向１１１丁能なカナ漢字
変換処理方式を実現でさるという顕著な効果を奏するも
のである。

【図面の簡単な説明】

第を図は本発明のｍ−実施例を示すブロック図、第２図
は出力文字列保存部の内容の−・例を示す図、第３図は
同音語保存用メモリの一部を示す図、第４図は複合語ポ
インタ領域の内容の一例を示す図、第５図は複合語判別
処理のアルゴリズムの−・例を示すフローチャートであ
る。１：入力文字列バッファ、２：辞ｕＦ検索部、３：接続
可否判定部、４：先度総合、ｉ１′価部、５：出力文字
列保存部、６：同音語保存部、７：制御部、８：複合語
判定部、９：単語辞書、１ｏ：複合語ポインタ領域。第　２　図第　δ　図第　４　図

Claims

【特許請求の範囲】

（１）人力カナ文字列にλ・１して単語辞−升を検索し
て変換候補中１語を抽出する辞；！１検索部を有するカ
ナ漢字変換処理装置において、ｒＪＪ、６語を構成する
前部分のＨＬｉと後部分の語とをｉ＋４−ｉびイ」けて
記憶する手段を１設けて、該記憶１段の内容を谷照する
ことにより、複合語を（９′Ｊ成する前部分の詔と後部
分の詔とを同■、Ｔに確定することを４１徴とするカナ
漢字変換処理方式。
（２）文字列中の前記複合語部分を、３類または品詞に
より見出ずことを！ｌ）徴とする特ム′１請求の範囲第
１項記載のカナ漢字変換処理方式。