JPS603017A - カナ漢字変換処理装置 - Google Patents
カナ漢字変換処理装置Info
- Publication number
- JPS603017A JPS603017A JP58108983A JP10898383A JPS603017A JP S603017 A JPS603017 A JP S603017A JP 58108983 A JP58108983 A JP 58108983A JP 10898383 A JP10898383 A JP 10898383A JP S603017 A JPS603017 A JP S603017A
- Authority
- JP
- Japan
- Prior art keywords
- words
- word
- compound word
- character string
- kana
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
技術分野
本発明は邦文ワートプロセソサでγに用い6.1しるカ
ナ漢字変換処理方式に関し、特に複合語に対する変換候
補(以下、単に「候?+[i Jという)単語抽出の妥
当性を向上可能としたカナ漢字変換処理力式に関するも
のである。
ナ漢字変換処理方式に関し、特に複合語に対する変換候
補(以下、単に「候?+[i Jという)単語抽出の妥
当性を向上可能としたカナ漢字変換処理力式に関するも
のである。
従来技術
カナ漢字変換処理方式には、近Q“、従来の誇字部指定
方式2文節指定方式等にυ11えて、連続する復数の自
立語の読みに対応するカナ文字列の入力を許す方式、更
には、入力カー1文字列に区切り等の制限を付けない方
式が用いら、1L ;IN、J、うにな−)で来ている
。
方式2文節指定方式等にυ11えて、連続する復数の自
立語の読みに対応するカナ文字列の入力を許す方式、更
には、入力カー1文字列に区切り等の制限を付けない方
式が用いら、1L ;IN、J、うにな−)で来ている
。
これらのカナ漢字変換処理方式の多くにノ1ミ通する問
題として、複合語処理における同音語判別において誤り
が発生するという問題がある。例えば、「こうそくひこ
う」というカナ文字列が入力された場合を考えると、こ
の文字列内におけるqt語の切れ目(以下、「/」で示
す)は「こうそく/ひこう」のように明らかになるとし
ても、上記「こうそ′:、Jがr校則」、「拘束J、r
高速」等の内のどの5tlであるかは明らかでなく、ま
た、「ひこうJも「飛行」か「非行」か明らかではない
。
題として、複合語処理における同音語判別において誤り
が発生するという問題がある。例えば、「こうそくひこ
う」というカナ文字列が入力された場合を考えると、こ
の文字列内におけるqt語の切れ目(以下、「/」で示
す)は「こうそく/ひこう」のように明らかになるとし
ても、上記「こうそ′:、Jがr校則」、「拘束J、r
高速」等の内のどの5tlであるかは明らかでなく、ま
た、「ひこうJも「飛行」か「非行」か明らかではない
。
この問題に対する1つの対応策として、「高速」と「飛
行」とにポインタで結んておき、「高速」力1抽出され
た後に「・υ・こう」という入力が続し\た場合番;は
、「飛行」を同音異字語中℃最優先するとり)う方式が
堤案されている。
行」とにポインタで結んておき、「高速」力1抽出され
た後に「・υ・こう」という入力が続し\た場合番;は
、「飛行」を同音異字語中℃最優先するとり)う方式が
堤案されている。
しかしながら、この方式においては、最初の文字列「こ
うそく」を変換処理する際に「高速」以外σ〕語が抽出
された場合には、川沿、されたポインタ(よ利用される
ことがなく、例えは、「拘束非行」等の妥当でない複合
語が出力されることになると5>う問題があった。
うそく」を変換処理する際に「高速」以外σ〕語が抽出
された場合には、川沿、されたポインタ(よ利用される
ことがなく、例えは、「拘束非行」等の妥当でない複合
語が出力されることになると5>う問題があった。
目 的
本発明は上記事情に鑑みてなさ」したものη1、その目
的とするところは、にfi 、>kのカナ漢字変換処理
方式における上述の如き問題を解消し、複合語に列する
候補単語抽出の妥当性を向−に可能と(、た力す漢字変
換処理方式を提0(することにある。
的とするところは、にfi 、>kのカナ漢字変換処理
方式における上述の如き問題を解消し、複合語に列する
候補単語抽出の妥当性を向−に可能と(、た力す漢字変
換処理方式を提0(することにある。
構成
以下、本発明の構成を′3:、施例により詳細tこ説明
する。
する。
第1図は本発明の一実施例を示すカナ漢字変換処理装置
のブロック図である。図において、1は図示されていな
い入力部から人カメれだ文字列を貯える入力文字列バノ
フコ・、2はm話辞−計9を検索して候補単語を抽出す
る辞1検索部、3は該81′書検索部2により抽出さJ
した単語と、その直I肪のJt語との接続の可否を判定
する接i′1.可否判定部である。また、4は該接続可
否判定部:1により接続可と判定さJまた単語の読み長
、頻度ランク、出現先度等を基に、各単語の先度鉗合評
filliを行う先度総合評価部、5は該光度総合J1
“創部・1により最高の評価を与えられたA1j語を保
存する出力え字列(♀右部、6は」−記最高の評価をI
jえらA(、た甲5j(と同音同語類または同γ?同品
詞のA1j語(以下、甲、に「同音語」という)を保存
する同音語イλ″、右部、7 Ill: I:記各部を
制御する制御部、8は接合、;バ刊定部、10は複合語
ポインタ領域を示している。
のブロック図である。図において、1は図示されていな
い入力部から人カメれだ文字列を貯える入力文字列バノ
フコ・、2はm話辞−計9を検索して候補単語を抽出す
る辞1検索部、3は該81′書検索部2により抽出さJ
した単語と、その直I肪のJt語との接続の可否を判定
する接i′1.可否判定部である。また、4は該接続可
否判定部:1により接続可と判定さJまた単語の読み長
、頻度ランク、出現先度等を基に、各単語の先度鉗合評
filliを行う先度総合評価部、5は該光度総合J1
“創部・1により最高の評価を与えられたA1j語を保
存する出力え字列(♀右部、6は」−記最高の評価をI
jえらA(、た甲5j(と同音同語類または同γ?同品
詞のA1j語(以下、甲、に「同音語」という)を保存
する同音語イλ″、右部、7 Ill: I:記各部を
制御する制御部、8は接合、;バ刊定部、10は複合語
ポインタ領域を示している。
なお、ここで、「3類」とは、後述する如く、a+++
分された品詞と字種とを組合わせたものをいう、。
分された品詞と字種とを組合わせたものをいう、。
第2図は上記出力文字列保存部5の内容の一例を示すも
のである1図中、1はメモリ中の位買右−示し、N(1
)は」二元同音語の数、r(j)は上記3類、また、N
Oは単語に固有の番号である。
のである1図中、1はメモリ中の位買右−示し、N(1
)は」二元同音語の数、r(j)は上記3類、また、N
Oは単語に固有の番号である。
第311は」、記同音J5保存部6の同音語保存用メモ
リの一部を示すものであり、各同音語について]二記出
力文字列保右部5中の位置l(■、■、・ ・)とり4
応する如く設けられている。
リの一部を示すものであり、各同音語について]二記出
力文字列保右部5中の位置l(■、■、・ ・)とり4
応する如く設けられている。
第4図は上記複合語ポインタ領域10の内容の一例を示
すものであり、対応する2つの数字の左側は複合語の1
);1部分の、また、右側は後部分の1);j記単語固
有の番号N Oを示している。
すものであり、対応する2つの数字の左側は複合語の1
);1部分の、また、右側は後部分の1);j記単語固
有の番号N Oを示している。
上述の如く構成さ九た木実施例の動作を以下説明する。
以下の説明においては、
こうそくひこうがかのうだ。
という人力文字列の処理を例に挙げる。
辞書検索部2では、上記人力文字列に対してその先頭か
ら辞書検索部2による辞@検索を行い、すへての候補単
語を抽出する。この場合、例えば。
ら辞書検索部2による辞@検索を行い、すへての候補単
語を抽出する。この場合、例えば。
[拘束j、r校則J、r高速」、「光速」、「酵素」、
・・・・・「子」等を抽出する。こ九らの単語はは次に
前記接続可否判定部3で文中の直前の単語との接続の可
否を検定さ、hる。ここでは、文頭なのこすへての!i
L jj?jが接続可となる。
・・・・・「子」等を抽出する。こ九らの単語はは次に
前記接続可否判定部3で文中の直前の単語との接続の可
否を検定さ、hる。ここでは、文頭なのこすへての!i
L jj?jが接続可となる。
次に、こJしらの11語は光度総合、:で創部4で先度
評価を受ける3ここてI′J、「拘束」が最も高い評価
4与えら)したものとする。こA1により、1−拘束」
の辞書情報等は出力文字列保存部5に送らA(る。A−
た、これと同11.7に、」二記「拘束Jの同音語、こ
の場合、「校則」、「高速−1,「光速」か、01J記
出力文字列区存部5内での上記「拘束」の位置(・I′
r ) 1.: 2J応する。
評価を受ける3ここてI′J、「拘束」が最も高い評価
4与えら)したものとする。こA1により、1−拘束」
の辞書情報等は出力文字列保存部5に送らA(る。A−
た、これと同11.7に、」二記「拘束Jの同音語、こ
の場合、「校則」、「高速−1,「光速」か、01J記
出力文字列区存部5内での上記「拘束」の位置(・I′
r ) 1.: 2J応する。
同音語保存部G内の保存用メモリに11jえらJt ;
:I。
:I。
以上で、前記入力文字列の先頭か1゛)「<」1:テの
解析が一応終了したので、「びごうかかの)た」という
文字列に対して、」二連と同様の解1ji′を行う、。
解析が一応終了したので、「びごうかかの)た」という
文字列に対して、」二連と同様の解1ji′を行う、。
なお、言うまでもなく、上述の杓子(」1処J5Pの制
御口。
御口。
前記制御部7がtl−っている。
上記解析処理を繰り返し、最後の「 (句読点)」が入
力され処理さjした時点においては、出力文′?列保存
右部には、第2図に示すように!lt語が格納されてい
る。また、同音語保存部6の内部には。
力され処理さjした時点においては、出力文′?列保存
右部には、第2図に示すように!lt語が格納されてい
る。また、同音語保存部6の内部には。
例えば、第3図に示すように同音語が格納されている。
」二記句読点が処理されたという情報が制御部7に送ら
れると、該制御部7は複合語判別部8を起動する。複合
語判別部8は、まず、初期設定を行った後、−1−記出
力文字列保右部5中の、名詞または接辞の連続をL記出
力の先頭から順にチェックし、「名詞/名詞」、「名詞
/接辞」、「接辞/名詞」のいずれかを光見した場合に
は、ソ肛ぞれの同音語数を調べ、どちらかか1以上てあ
、jtば複合語判別処理を実行する。この処理は、句i
f、je点に達するまで行われる。第5図は5この処理
のアルゴリズムの一例を示すものである。。
れると、該制御部7は複合語判別部8を起動する。複合
語判別部8は、まず、初期設定を行った後、−1−記出
力文字列保右部5中の、名詞または接辞の連続をL記出
力の先頭から順にチェックし、「名詞/名詞」、「名詞
/接辞」、「接辞/名詞」のいずれかを光見した場合に
は、ソ肛ぞれの同音語数を調べ、どちらかか1以上てあ
、jtば複合語判別処理を実行する。この処理は、句i
f、je点に達するまで行われる。第5図は5この処理
のアルゴリズムの一例を示すものである。。
以下、」二記複合語判別処理の詳細を説明する。
この例では、「拘束」が名詞、「Ji行jが名詞なので
、複合語判別処理が開始される。まず、同音語保存部6
の「拘束」に対応する同音語保存部メモリ中のtlL語
および「拘束月1身の前記N Oが調、・〈られる。
、複合語判別処理が開始される。まず、同音語保存部6
の「拘束」に対応する同音語保存部メモリ中のtlL語
および「拘束月1身の前記N Oが調、・〈られる。
この場合には、101〜104の数字か、複合語判別部
8内に一時的に記憶される。次に、「非行」に対応する
同音語保存用メモリ中の単語および「非行」自身の前記
NO2この場合、201. :!02かtI旨1口”I
):1部8内に一時的に記憶される。
8内に一時的に記憶される。次に、「非行」に対応する
同音語保存用メモリ中の単語および「非行」自身の前記
NO2この場合、201. :!02かtI旨1口”I
):1部8内に一時的に記憶される。
続いて、前記複合語ポインタ領域10を検索=)−る。
この場合の検索のキーは、複合、:tlの前部分の数字
(この場合、101へ104)てあり、こA1.L−よ
−て上記領域を参照し、後部分の数字に2旧まノーは2
(A2が存在する数字の組を倹素する。この場−【1F
−は、」1記検索により、103−202の紺7)1見
出ごJしる。これは「高速飛行」に対応するものである
□、もし・、1記2つの数字の絹が児出さコシなか、た
喝菖IJは制御を制御部7に戻す。
(この場合、101へ104)てあり、こA1.L−よ
−て上記領域を参照し、後部分の数字に2旧まノーは2
(A2が存在する数字の組を倹素する。この場−【1F
−は、」1記検索により、103−202の紺7)1見
出ごJしる。これは「高速飛行」に対応するものである
□、もし・、1記2つの数字の絹が児出さコシなか、た
喝菖IJは制御を制御部7に戻す。
」二連の例においては、[高速)に(j Jが見出さ、
1【、だので、出力文字列保存部5の内容’Jr ’l
’!:換える。すなわち、「拘束」に換えて「高速」を
昇速7)1、「1口1」に換えて「飛行」を書込む。こ
のとさ、−とれγれに対応する同音語保存部6の同音a
11促存用ノモ「Jの内容は消去する。こオシに対応し
、て、i;J記出入1γ字列保存部5中の同音語数N
(i)も1に書換える。
1【、だので、出力文字列保存部5の内容’Jr ’l
’!:換える。すなわち、「拘束」に換えて「高速」を
昇速7)1、「1口1」に換えて「飛行」を書込む。こ
のとさ、−とれγれに対応する同音語保存部6の同音a
11促存用ノモ「Jの内容は消去する。こオシに対応し
、て、i;J記出入1γ字列保存部5中の同音語数N
(i)も1に書換える。
これで複合語判別処理を終了し、ITJび、連れのチェ
ックに戻る。
ックに戻る。
なお、単語の抽出および評佃i′Ji法は、必ずしもを
」−2実施例に示した方法に限らJしるものではなく、
最長−教法、いおり)る最尤評饋法等によっても良いこ
とはごうまでもない。また、句読点以外の文字、単a1
1.記号によってト記複合語判別部を起動させるように
41!!成しても良いことも言うまでもない。
」−2実施例に示した方法に限らJしるものではなく、
最長−教法、いおり)る最尤評饋法等によっても良いこ
とはごうまでもない。また、句読点以外の文字、単a1
1.記号によってト記複合語判別部を起動させるように
41!!成しても良いことも言うまでもない。
上記実施例においては、出力文字列保存部には、既に表
記まで決定さjした、すなわち、1語ごどの同音語選択
が行わ、1シた形でIli語が格納されており、同音語
は別の保存用メモリに格納されている態様を示したが、
別の実施態様どしては、同語類または同品詞の単語につ
いては、18gごとの同音語選択を行わず、11語に区
切ることのみを行っておき、複合語判別処理をtゴっだ
後に表記に変換するように構成することも可能である。
記まで決定さjした、すなわち、1語ごどの同音語選択
が行わ、1シた形でIli語が格納されており、同音語
は別の保存用メモリに格納されている態様を示したが、
別の実施態様どしては、同語類または同品詞の単語につ
いては、18gごとの同音語選択を行わず、11語に区
切ることのみを行っておき、複合語判別処理をtゴっだ
後に表記に変換するように構成することも可能である。
この場合には、同音語は同一領域に格納しておくことが
できる。
できる。
更に、複合語判別処理後、同音J1(保存用メモリの内
容を@換えることは、必ずしも必要なことではなく、こ
の場合、前記出力文字列保存部中の同音語の数N(」)
の値の−1・換えは不要である。
容を@換えることは、必ずしも必要なことではなく、こ
の場合、前記出力文字列保存部中の同音語の数N(」)
の値の−1・換えは不要である。
効 果
以上述べた如く、本発明によ、tシば、tμ合語をモ゛
η成する単語について、それらの間の接続性を予めポイ
ンタにより−tgえておくようにしたので、PM合語に
対する候補単語抽出の妥当性を向111丁能なカナ漢字
変換処理方式を実現でさるという顕著な効果を奏するも
のである。
η成する単語について、それらの間の接続性を予めポイ
ンタにより−tgえておくようにしたので、PM合語に
対する候補単語抽出の妥当性を向111丁能なカナ漢字
変換処理方式を実現でさるという顕著な効果を奏するも
のである。
第を図は本発明のm−実施例を示すブロック図、第2図
は出力文字列保存部の内容の−・例を示す図、第3図は
同音語保存用メモリの一部を示す図、第4図は複合語ポ
インタ領域の内容の一例を示す図、第5図は複合語判別
処理のアルゴリズムの−・例を示すフローチャートであ
る。 1:入力文字列バッファ、2:辞uF検索部、3:接続
可否判定部、4:先度総合、i1′価部、5:出力文字
列保存部、6:同音語保存部、7:制御部、8:複合語
判定部、9:単語辞書、1o:複合語ポインタ領域。 第 2 図 第 δ 図 第 4 図
は出力文字列保存部の内容の−・例を示す図、第3図は
同音語保存用メモリの一部を示す図、第4図は複合語ポ
インタ領域の内容の一例を示す図、第5図は複合語判別
処理のアルゴリズムの−・例を示すフローチャートであ
る。 1:入力文字列バッファ、2:辞uF検索部、3:接続
可否判定部、4:先度総合、i1′価部、5:出力文字
列保存部、6:同音語保存部、7:制御部、8:複合語
判定部、9:単語辞書、1o:複合語ポインタ領域。 第 2 図 第 δ 図 第 4 図
Claims (2)
- (1)人力カナ文字列にλ・1して単語辞−升を検索し
て変換候補中1語を抽出する辞;!1検索部を有するカ
ナ漢字変換処理装置において、rJJ、6語を構成する
前部分のHLiと後部分の語とをi+4−iびイ」けて
記憶する手段を1設けて、該記憶1段の内容を谷照する
ことにより、複合語を(9′J成する前部分の詔と後部
分の詔とを同■、Tに確定することを41徴とするカナ
漢字変換処理方式。 - (2)文字列中の前記複合語部分を、3類または品詞に
より見出ずことを!l)徴とする特ム′1請求の範囲第
1項記載のカナ漢字変換処理方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58108983A JPS603017A (ja) | 1983-06-17 | 1983-06-17 | カナ漢字変換処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58108983A JPS603017A (ja) | 1983-06-17 | 1983-06-17 | カナ漢字変換処理装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS603017A true JPS603017A (ja) | 1985-01-09 |
Family
ID=14498605
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP58108983A Pending JPS603017A (ja) | 1983-06-17 | 1983-06-17 | カナ漢字変換処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS603017A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4777600A (en) * | 1985-08-01 | 1988-10-11 | Kabushiki Kaisha Toshiba | Phonetic data-to-kanji character converter with a syntax analyzer to alter priority order of displayed kanji homonyms |
JPH04270130A (ja) * | 1990-08-16 | 1992-09-25 | Corning Inc | 高純度溶融シリカガラスの非多孔質体を作成する方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5617467A (en) * | 1979-07-20 | 1981-02-19 | Fujitsu Ltd | Word-to-word connection approval unit |
JPS5819933A (ja) * | 1981-07-29 | 1983-02-05 | Toshiba Corp | かな漢字変換装置 |
JPS592125A (ja) * | 1982-06-29 | 1984-01-07 | Comput Basic Mach Technol Res Assoc | 仮名漢字変換方法 |
-
1983
- 1983-06-17 JP JP58108983A patent/JPS603017A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5617467A (en) * | 1979-07-20 | 1981-02-19 | Fujitsu Ltd | Word-to-word connection approval unit |
JPS5819933A (ja) * | 1981-07-29 | 1983-02-05 | Toshiba Corp | かな漢字変換装置 |
JPS592125A (ja) * | 1982-06-29 | 1984-01-07 | Comput Basic Mach Technol Res Assoc | 仮名漢字変換方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4777600A (en) * | 1985-08-01 | 1988-10-11 | Kabushiki Kaisha Toshiba | Phonetic data-to-kanji character converter with a syntax analyzer to alter priority order of displayed kanji homonyms |
JPH04270130A (ja) * | 1990-08-16 | 1992-09-25 | Corning Inc | 高純度溶融シリカガラスの非多孔質体を作成する方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH0351020B2 (ja) | ||
JPS592125A (ja) | 仮名漢字変換方法 | |
JPS6033665A (ja) | キ−ワ−ド自動抽出方式 | |
JPS589968B2 (ja) | カナ漢字変換装置 | |
JPS603017A (ja) | カナ漢字変換処理装置 | |
JPH0344343B2 (ja) | ||
JPS6210763A (ja) | 仮名漢字変換処理装置 | |
JPS62184572A (ja) | 単語分割装置における呼応複合語の辞書検索方式 | |
JP3285149B2 (ja) | 外国語電子辞書検索方法及び装置 | |
JPS58114224A (ja) | かな漢字変換方式 | |
JPH01229369A (ja) | 文字処理装置 | |
JPS6132167A (ja) | カナ漢字変換処理装置 | |
JPH1097538A (ja) | 機械翻訳装置 | |
JPS58166435A (ja) | 確率マトリツクスを用いたカナ漢字変換方式 | |
JP3273778B2 (ja) | 仮名漢字変換装置及び仮名漢字変換方法 | |
JPS58127230A (ja) | 漢字仮名変換装置 | |
JPH01281561A (ja) | 日本文訂正候補文字抽出方法 | |
JPS59116835A (ja) | 短縮入力機能付日本語入力装置 | |
JPH0212370A (ja) | 郵便物処理装置 | |
JPH10334122A (ja) | 類似名検索システムおよび記録媒体 | |
JPH0715690B2 (ja) | 日本文文書解析装置 | |
JPS62271173A (ja) | 仮名漢字変換方式 | |
JPH07105232A (ja) | 文字列検索方法 | |
JPS60124769A (ja) | 単語抽出方式 | |
JPS6255757A (ja) | 単語訂正装置 |