JPS603017A - カナ漢字変換処理装置 - Google Patents

カナ漢字変換処理装置

Info

Publication number
JPS603017A
JPS603017A JP58108983A JP10898383A JPS603017A JP S603017 A JPS603017 A JP S603017A JP 58108983 A JP58108983 A JP 58108983A JP 10898383 A JP10898383 A JP 10898383A JP S603017 A JPS603017 A JP S603017A
Authority
JP
Japan
Prior art keywords
words
word
compound word
character string
kana
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58108983A
Other languages
English (en)
Inventor
Katsuhiko Fujita
克彦 藤田
Yasuyuki Numata
泰之 沼田
Yoshitoshi Yamauchi
佐敏 山内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP58108983A priority Critical patent/JPS603017A/ja
Publication of JPS603017A publication Critical patent/JPS603017A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 技術分野 本発明は邦文ワートプロセソサでγに用い6.1しるカ
ナ漢字変換処理方式に関し、特に複合語に対する変換候
補(以下、単に「候?+[i Jという)単語抽出の妥
当性を向上可能としたカナ漢字変換処理力式に関するも
のである。
従来技術 カナ漢字変換処理方式には、近Q“、従来の誇字部指定
方式2文節指定方式等にυ11えて、連続する復数の自
立語の読みに対応するカナ文字列の入力を許す方式、更
には、入力カー1文字列に区切り等の制限を付けない方
式が用いら、1L ;IN、J、うにな−)で来ている
これらのカナ漢字変換処理方式の多くにノ1ミ通する問
題として、複合語処理における同音語判別において誤り
が発生するという問題がある。例えば、「こうそくひこ
う」というカナ文字列が入力された場合を考えると、こ
の文字列内におけるqt語の切れ目(以下、「/」で示
す)は「こうそく/ひこう」のように明らかになるとし
ても、上記「こうそ′:、Jがr校則」、「拘束J、r
高速」等の内のどの5tlであるかは明らかでなく、ま
た、「ひこうJも「飛行」か「非行」か明らかではない
この問題に対する1つの対応策として、「高速」と「飛
行」とにポインタで結んておき、「高速」力1抽出され
た後に「・υ・こう」という入力が続し\た場合番;は
、「飛行」を同音異字語中℃最優先するとり)う方式が
堤案されている。
しかしながら、この方式においては、最初の文字列「こ
うそく」を変換処理する際に「高速」以外σ〕語が抽出
された場合には、川沿、されたポインタ(よ利用される
ことがなく、例えは、「拘束非行」等の妥当でない複合
語が出力されることになると5>う問題があった。
目 的 本発明は上記事情に鑑みてなさ」したものη1、その目
的とするところは、にfi 、>kのカナ漢字変換処理
方式における上述の如き問題を解消し、複合語に列する
候補単語抽出の妥当性を向−に可能と(、た力す漢字変
換処理方式を提0(することにある。
構成 以下、本発明の構成を′3:、施例により詳細tこ説明
する。
第1図は本発明の一実施例を示すカナ漢字変換処理装置
のブロック図である。図において、1は図示されていな
い入力部から人カメれだ文字列を貯える入力文字列バノ
フコ・、2はm話辞−計9を検索して候補単語を抽出す
る辞1検索部、3は該81′書検索部2により抽出さJ
した単語と、その直I肪のJt語との接続の可否を判定
する接i′1.可否判定部である。また、4は該接続可
否判定部:1により接続可と判定さJまた単語の読み長
、頻度ランク、出現先度等を基に、各単語の先度鉗合評
filliを行う先度総合評価部、5は該光度総合J1
“創部・1により最高の評価を与えられたA1j語を保
存する出力え字列(♀右部、6は」−記最高の評価をI
jえらA(、た甲5j(と同音同語類または同γ?同品
詞のA1j語(以下、甲、に「同音語」という)を保存
する同音語イλ″、右部、7 Ill: I:記各部を
制御する制御部、8は接合、;バ刊定部、10は複合語
ポインタ領域を示している。
なお、ここで、「3類」とは、後述する如く、a+++
分された品詞と字種とを組合わせたものをいう、。
第2図は上記出力文字列保存部5の内容の一例を示すも
のである1図中、1はメモリ中の位買右−示し、N(1
)は」二元同音語の数、r(j)は上記3類、また、N
 Oは単語に固有の番号である。
第311は」、記同音J5保存部6の同音語保存用メモ
リの一部を示すものであり、各同音語について]二記出
力文字列保右部5中の位置l(■、■、・ ・)とり4
応する如く設けられている。
第4図は上記複合語ポインタ領域10の内容の一例を示
すものであり、対応する2つの数字の左側は複合語の1
);1部分の、また、右側は後部分の1);j記単語固
有の番号N Oを示している。
上述の如く構成さ九た木実施例の動作を以下説明する。
以下の説明においては、 こうそくひこうがかのうだ。
という人力文字列の処理を例に挙げる。
辞書検索部2では、上記人力文字列に対してその先頭か
ら辞書検索部2による辞@検索を行い、すへての候補単
語を抽出する。この場合、例えば。
[拘束j、r校則J、r高速」、「光速」、「酵素」、
・・・・・「子」等を抽出する。こ九らの単語はは次に
前記接続可否判定部3で文中の直前の単語との接続の可
否を検定さ、hる。ここでは、文頭なのこすへての!i
L jj?jが接続可となる。
次に、こJしらの11語は光度総合、:で創部4で先度
評価を受ける3ここてI′J、「拘束」が最も高い評価
4与えら)したものとする。こA1により、1−拘束」
の辞書情報等は出力文字列保存部5に送らA(る。A−
た、これと同11.7に、」二記「拘束Jの同音語、こ
の場合、「校則」、「高速−1,「光速」か、01J記
出力文字列区存部5内での上記「拘束」の位置(・I′
r ) 1.: 2J応する。
同音語保存部G内の保存用メモリに11jえらJt ;
:I。
以上で、前記入力文字列の先頭か1゛)「<」1:テの
解析が一応終了したので、「びごうかかの)た」という
文字列に対して、」二連と同様の解1ji′を行う、。
なお、言うまでもなく、上述の杓子(」1処J5Pの制
御口。
前記制御部7がtl−っている。
上記解析処理を繰り返し、最後の「 (句読点)」が入
力され処理さjした時点においては、出力文′?列保存
右部には、第2図に示すように!lt語が格納されてい
る。また、同音語保存部6の内部には。
例えば、第3図に示すように同音語が格納されている。
」二記句読点が処理されたという情報が制御部7に送ら
れると、該制御部7は複合語判別部8を起動する。複合
語判別部8は、まず、初期設定を行った後、−1−記出
力文字列保右部5中の、名詞または接辞の連続をL記出
力の先頭から順にチェックし、「名詞/名詞」、「名詞
/接辞」、「接辞/名詞」のいずれかを光見した場合に
は、ソ肛ぞれの同音語数を調べ、どちらかか1以上てあ
、jtば複合語判別処理を実行する。この処理は、句i
f、je点に達するまで行われる。第5図は5この処理
のアルゴリズムの一例を示すものである。。
以下、」二記複合語判別処理の詳細を説明する。
この例では、「拘束」が名詞、「Ji行jが名詞なので
、複合語判別処理が開始される。まず、同音語保存部6
の「拘束」に対応する同音語保存部メモリ中のtlL語
および「拘束月1身の前記N Oが調、・〈られる。
この場合には、101〜104の数字か、複合語判別部
8内に一時的に記憶される。次に、「非行」に対応する
同音語保存用メモリ中の単語および「非行」自身の前記
NO2この場合、201. :!02かtI旨1口”I
 ):1部8内に一時的に記憶される。
続いて、前記複合語ポインタ領域10を検索=)−る。
この場合の検索のキーは、複合、:tlの前部分の数字
(この場合、101へ104)てあり、こA1.L−よ
−て上記領域を参照し、後部分の数字に2旧まノーは2
(A2が存在する数字の組を倹素する。この場−【1F
−は、」1記検索により、103−202の紺7)1見
出ごJしる。これは「高速飛行」に対応するものである
□、もし・、1記2つの数字の絹が児出さコシなか、た
喝菖IJは制御を制御部7に戻す。
」二連の例においては、[高速)に(j Jが見出さ、
1【、だので、出力文字列保存部5の内容’Jr ’l
’!:換える。すなわち、「拘束」に換えて「高速」を
昇速7)1、「1口1」に換えて「飛行」を書込む。こ
のとさ、−とれγれに対応する同音語保存部6の同音a
11促存用ノモ「Jの内容は消去する。こオシに対応し
、て、i;J記出入1γ字列保存部5中の同音語数N 
(i)も1に書換える。
これで複合語判別処理を終了し、ITJび、連れのチェ
ックに戻る。
なお、単語の抽出および評佃i′Ji法は、必ずしもを
」−2実施例に示した方法に限らJしるものではなく、
最長−教法、いおり)る最尤評饋法等によっても良いこ
とはごうまでもない。また、句読点以外の文字、単a1
1.記号によってト記複合語判別部を起動させるように
41!!成しても良いことも言うまでもない。
上記実施例においては、出力文字列保存部には、既に表
記まで決定さjした、すなわち、1語ごどの同音語選択
が行わ、1シた形でIli語が格納されており、同音語
は別の保存用メモリに格納されている態様を示したが、
別の実施態様どしては、同語類または同品詞の単語につ
いては、18gごとの同音語選択を行わず、11語に区
切ることのみを行っておき、複合語判別処理をtゴっだ
後に表記に変換するように構成することも可能である。
この場合には、同音語は同一領域に格納しておくことが
できる。
更に、複合語判別処理後、同音J1(保存用メモリの内
容を@換えることは、必ずしも必要なことではなく、こ
の場合、前記出力文字列保存部中の同音語の数N(」)
の値の−1・換えは不要である。
効 果 以上述べた如く、本発明によ、tシば、tμ合語をモ゛
η成する単語について、それらの間の接続性を予めポイ
ンタにより−tgえておくようにしたので、PM合語に
対する候補単語抽出の妥当性を向111丁能なカナ漢字
変換処理方式を実現でさるという顕著な効果を奏するも
のである。
【図面の簡単な説明】
第を図は本発明のm−実施例を示すブロック図、第2図
は出力文字列保存部の内容の−・例を示す図、第3図は
同音語保存用メモリの一部を示す図、第4図は複合語ポ
インタ領域の内容の一例を示す図、第5図は複合語判別
処理のアルゴリズムの−・例を示すフローチャートであ
る。 1:入力文字列バッファ、2:辞uF検索部、3:接続
可否判定部、4:先度総合、i1′価部、5:出力文字
列保存部、6:同音語保存部、7:制御部、8:複合語
判定部、9:単語辞書、1o:複合語ポインタ領域。 第 2 図 第 δ 図 第 4 図

Claims (2)

    【特許請求の範囲】
  1. (1)人力カナ文字列にλ・1して単語辞−升を検索し
    て変換候補中1語を抽出する辞;!1検索部を有するカ
    ナ漢字変換処理装置において、rJJ、6語を構成する
    前部分のHLiと後部分の語とをi+4−iびイ」けて
    記憶する手段を1設けて、該記憶1段の内容を谷照する
    ことにより、複合語を(9′J成する前部分の詔と後部
    分の詔とを同■、Tに確定することを41徴とするカナ
    漢字変換処理方式。
  2. (2)文字列中の前記複合語部分を、3類または品詞に
    より見出ずことを!l)徴とする特ム′1請求の範囲第
    1項記載のカナ漢字変換処理方式。
JP58108983A 1983-06-17 1983-06-17 カナ漢字変換処理装置 Pending JPS603017A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58108983A JPS603017A (ja) 1983-06-17 1983-06-17 カナ漢字変換処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58108983A JPS603017A (ja) 1983-06-17 1983-06-17 カナ漢字変換処理装置

Publications (1)

Publication Number Publication Date
JPS603017A true JPS603017A (ja) 1985-01-09

Family

ID=14498605

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58108983A Pending JPS603017A (ja) 1983-06-17 1983-06-17 カナ漢字変換処理装置

Country Status (1)

Country Link
JP (1) JPS603017A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4777600A (en) * 1985-08-01 1988-10-11 Kabushiki Kaisha Toshiba Phonetic data-to-kanji character converter with a syntax analyzer to alter priority order of displayed kanji homonyms
JPH04270130A (ja) * 1990-08-16 1992-09-25 Corning Inc 高純度溶融シリカガラスの非多孔質体を作成する方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5617467A (en) * 1979-07-20 1981-02-19 Fujitsu Ltd Word-to-word connection approval unit
JPS5819933A (ja) * 1981-07-29 1983-02-05 Toshiba Corp かな漢字変換装置
JPS592125A (ja) * 1982-06-29 1984-01-07 Comput Basic Mach Technol Res Assoc 仮名漢字変換方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5617467A (en) * 1979-07-20 1981-02-19 Fujitsu Ltd Word-to-word connection approval unit
JPS5819933A (ja) * 1981-07-29 1983-02-05 Toshiba Corp かな漢字変換装置
JPS592125A (ja) * 1982-06-29 1984-01-07 Comput Basic Mach Technol Res Assoc 仮名漢字変換方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4777600A (en) * 1985-08-01 1988-10-11 Kabushiki Kaisha Toshiba Phonetic data-to-kanji character converter with a syntax analyzer to alter priority order of displayed kanji homonyms
JPH04270130A (ja) * 1990-08-16 1992-09-25 Corning Inc 高純度溶融シリカガラスの非多孔質体を作成する方法

Similar Documents

Publication Publication Date Title
JPH0351020B2 (ja)
JPS592125A (ja) 仮名漢字変換方法
JPS6033665A (ja) キ−ワ−ド自動抽出方式
JPS589968B2 (ja) カナ漢字変換装置
JPS603017A (ja) カナ漢字変換処理装置
JPH0344343B2 (ja)
JPS6210763A (ja) 仮名漢字変換処理装置
JPS62184572A (ja) 単語分割装置における呼応複合語の辞書検索方式
JP3285149B2 (ja) 外国語電子辞書検索方法及び装置
JPS58114224A (ja) かな漢字変換方式
JPH01229369A (ja) 文字処理装置
JPS6132167A (ja) カナ漢字変換処理装置
JPH1097538A (ja) 機械翻訳装置
JPS58166435A (ja) 確率マトリツクスを用いたカナ漢字変換方式
JP3273778B2 (ja) 仮名漢字変換装置及び仮名漢字変換方法
JPS58127230A (ja) 漢字仮名変換装置
JPH01281561A (ja) 日本文訂正候補文字抽出方法
JPS59116835A (ja) 短縮入力機能付日本語入力装置
JPH0212370A (ja) 郵便物処理装置
JPH10334122A (ja) 類似名検索システムおよび記録媒体
JPH0715690B2 (ja) 日本文文書解析装置
JPS62271173A (ja) 仮名漢字変換方式
JPH07105232A (ja) 文字列検索方法
JPS60124769A (ja) 単語抽出方式
JPS6255757A (ja) 単語訂正装置