JPS59167737A - かな漢字変換装置 - Google Patents

かな漢字変換装置

Info

Publication number
JPS59167737A
JPS59167737A JP58040871A JP4087183A JPS59167737A JP S59167737 A JPS59167737 A JP S59167737A JP 58040871 A JP58040871 A JP 58040871A JP 4087183 A JP4087183 A JP 4087183A JP S59167737 A JPS59167737 A JP S59167737A
Authority
JP
Japan
Prior art keywords
word
information
homophone
kana
string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58040871A
Other languages
English (en)
Inventor
Tatsuo Kobayashi
達夫 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP58040871A priority Critical patent/JPS59167737A/ja
Publication of JPS59167737A publication Critical patent/JPS59167737A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は日本語情報処理分野におけるかな漢字変換装置
に関するものである。
従来例の構成とその問題点 最近、かな文字で入力された文章をかな漢字混り文に変
換する、かな漢字変換装置の開発がさかんである。
以下に従来のかな漢字変換装置について説明する。
第1図は従来のかな漢字変換装置のブロック図を示すも
のであり、1は入力単語レジスタで入力かな列を記憶す
る。2は辞書検索部で入力単語レジスタ1に格納されて
いる入力かな列の先頭からの部分列に一致するかな列を
単語辞書メモリ3内で検索する。この単語辞書メモリ3
は単語の読みに対応した漢字情報と品詞情報と、同音異
字語群内で直前にどの単語が選ばれたかを示す直前使用
情報とを記憶している。4は単語接続判定部で、単語間
の接続の可否を判定する。5は解釈候補バッファで、単
語接続判定部4で前接する単語との接続が可能であると
判定された単語の単語辞書メモリ3の内容を記憶する。
6は直前使用情報判定部で解釈候補バッファS内の直前
使用情報を調べる。7は第1出力漢字列作成部で第1出
力漢字列を作成する。
以上のように構成された従来のかな漢字変換装置につい
てその動作を説明する。
まず入力単語レジスタ1に入力かな列を設定する。次に
辞書検索部2は、入力単語レジスタ1に格納されている
入力かな列の先頭からの部分列に一致するかな列を単語
辞書メモリ3内で検索し、そのかな列に対応する単語の
漢字情報、品詞情報、直前使用情報を取り出す。そして
単語接続判定部4は、単語辞書メモリ3より取り出され
た単語の品詞情報に基づいて、前接する単語との接続の
可否を判定し、前接する単語と接続するものは解釈候補
バッファ5に上記漢字情報と品詞情報と直前使用情報と
を格納する。次に直前使用情報判定部らは、解釈候補バ
ッファ5内の直前使用情報に基づいて第1番目に出力す
べき単語を決定する。そして、第1出力漢字列作成部7
は、第1出力漢字列を作成し出力する。
1しかしながら以上のような構成では、同じ読みの複数
の単語が解釈候補として解釈候補バッファに格納された
場合に、直前にどの単語が使用されたかを記憶している
直前使用情報だけでは第1出力漢字列に正しい漢字列が
出力されないことがある。たとえば、′ケンキュウショ
′”と入力すると、゛ケンキュウ″に対しては”研究″
、°゛シヨに対しては、6所″ ”署″゛書″が解釈候
補として解釈候補バッファに格納される。しだがって第
1出力漢字列として”研究所″が出方されるのは、前回
に1所″を選択した時だけになる。いいかえれば、”研
究所″と出力させた後で、゛ケイザッショ°°と入力す
ると第1出力漢字列として゛警察所″と出力されること
になる。このことは、変換率の低下、およびオペレータ
ーの操作負担の増加となるものである。
また上記以外の従来例として、単語辞書メモリに゛研究
所″パ警察署″という単語を記憶させる方法もあるが、
この方法だと単語辞書メモリが大きなものになり望まし
くない。
また他の従来例として、第2図に示すような先行単語を
行とし、後続単語を列とする接続行列メモリを用いて、
単語間の接続性を判定することも可能であるが、単語辞
書メモリ中のすへての単語を行および列に配する必要が
あり、非常に大きな容量となり望せしいものでない。
発明の目的 本発明は上記従来の問題点を解消するもので、単語辞書
メモリに登録する単語を増加することなく、また大きな
容量の接続行列を使用することなく、入力されたかなに
対する第1出力漢字列として最も正しい漢字列を出力す
ることのできるかな漢字変換装置を提供することを目的
とする。
発明の構成 本発明は、先行する単語と後続する単語との接続関係を
示す同音語接続行列を記憶するに際し、後続する単語は
、読みによってグループ化し、さらに同一の読みグルー
プ内の異なる単語には同音異字語番号を割り当て、先行
する単語は、後続する単語の前記同音異字語番号によっ
てグループ化し、グループ番号を割り当てることにょ−
で圧縮された同音語接続行列メモリと、同音語接続行列
の内容を基に同音語のうちの1つを決定する同音語決定
部とを備えることにより、単語辞書メモリ中の単語を増
加させることもなく、まだ大きな容量の接続行列を使用
することもせずに、正しい第1出力漢字列を作成するこ
とができるものである。
実施例の説明 第3図は本発明の一実施例におけるかな漢字変換装置の
ブロック図を示すものであり、1は入力単語レジスタで
入力かな列を記憶する。2は辞書検索部で入力単語レジ
スタ1に格納されてぃ゛る入力かな列の先頭からの部分
列に一致するかな列を単語辞書メモリ3内で検索する。
この単語辞書メモリ3では、各々の単語に対する読み情
報、漢字情報、品詞情報、同音語群内での辞書内格納順
位を示す同音異字語番号、および同音語接続行列の行番
号を示す後続単語情報を記憶している。4は単語接続判
定部で単語間の接続の可否を判定する。
5は解釈候補バッファで単語接続判定部4で前接する単
語・との接続が可能であると判定された単語の、単語辞
書メモリ3の内容を記憶する。7は第1出力漢字列作成
部で第1出力漢字列を作成する。
8は同音語決定部で同音異字胎内のどの単語を、第1番
目に出力するかを決定する。9は同音語接続行列メモリ
で、同音語のうちの1つを決定するための情報を記憶す
る。
以上のように構成された本実施例のかな漢字変換装置に
ついて、以下その動作を説明する。
まず入力単語レジスタ1に入力かな列を設定する。次に
辞書検索部2は、人力単語レジスタ1に格納されている
入力かな列の先頭からの部分列に一致するかな列を単語
辞書メモリ3内で検索し、そのかな列に対応する単語の
読み情報、漢字情報、品詞情報、同音異字語番号および
後続単語情報を取り出す。そして単語接続判定部4は、
単語辞書メモリ3より取り出された品詞情報に基づいて
、前接する単語との接続の可否を判定し、前接する単語
と接続するものは解釈候補バッファ5に上記読み情報、
漢字情報、品詞情報、同音異字語番号および後続単語情
報を格納する。次に同音語決定部8は解釈候補バッファ
6内の先行する単語の後続単語情報と後続する単語の読
み情報を取り出し、後続単語情報と読み情報に基づいて
、同音語接続行列メモリ9からその内容を取り出す。そ
して同音語接続行列メモリ9から取り出した内容と解釈
候補バッファ6内の同音異字語番号を比較し、各位が等
しいものを第1出力すべき単語と決定する。
そして第1出力漢字列作成部7は同音語判定部8で第1
出力すべ1きと決定された単語に基いて第1出力漢字列
を作成し、出力する。
第4図は、”ケンキュウショ゛″と入力された場合に解
釈候補バッファ5に格納されるデータ例を示している。
第4図の(,1列は漢字情報を、(bj列は蔽み情報を
、(c)列は品詞情報を、(di列は後続単語情報を、
(ei列は同音異字語番号を示している。
また、第4図の(1)行目には゛ケンキュウ″に対する
データが、(2)〜(4)行目には゛ショ″に対するデ
ータが、格納されていることを示している。
第6図は、上記入力例において先行する単語゛研究″の
後続単語情報が15u、後続する単語の読み゛ショ“に
対する読み情報が゛ショ″であるときに同音語接続行列
メモリ9の5行目の6シヨ“の列の内容が2″であるこ
とを示す。そして同音語決定部8は、同音語接続行列メ
モリ9の内容“′2″と、解釈候補バッファ5のよみ情
報が゛ショ°′である部分の同音異字語番号を比較し、
第1出力漢字として0所″が選択される。そして第1出
力漢字列作成部7で゛研究所″という第1出力漢字列が
作成され出力される。
以上のように本実施例によれば、同音語決定部8を設け
ることにより、同音語決定部8でまず゛研究″の後続単
語情報と゛ショ°°の読み情報から決定される同音語接
続行列メモリ9の内容+121+を取り出す。次にその
内容1121+と解釈候補バッファ5の読み情報が°゛
シヨ″ある行の同音異字語番号とを比較し、その値の等
しい゛所″が第1番目に出力すべき単語として決定され
るといっだ具合に、第1出力漢字列として常に正しい漢
字列を作成することができる。
発明の効果 本発明のかな漢字変換装置は、先行する単語と後続する
単語との接続関係を示す同音語接続行列を記憶するに際
し、後続する単語は、同一の読みのものは同一のグルー
プになるようにし、さらに同一の読みグループ内の異な
る単語には、1より始まる同音異字詔番号を割り当て、
先行する単語は、後続する単語の前記同音異字語番号に
よってグループ化し−グループ番号を割り当ててなる同
音語接続行列メモリと、同音語接続行列の内容を基に同
音語のうちの1つを決定する同音語決定部を備えること
により、単語辞書メモリ中の単語を増加させることもな
く、かつ大き々容量の接続行列を使用することもせずに
、正しい第1出力漢字列を作成することができ、その効
果は大きい。
【図面の簡単な説明】
第1図は従来のかな漢字変換装置のブロック図、第2図
は従来例の接続行列の一例を示す図、第3図は本発明に
おける一実施例のかな漢字変換装置のプロ・’+り図、
第4図は同実施例において使用する解釈候補バッファ内
のデータの一例を示す図、第5図は同実施例において使
用する同音語接続行列の一例を示す図である。 1・・・・・・入力単語レジスタ、2・・・・・・辞書
検索部、3・・・・・・単語辞書メモリ、4・・・・・
・単語接続判定部、6・・・・・・解釈候補バッファ、
7・・・・・・第1出力漢字列作成部、8・・・・・・
同音語決定部、9・・・・・・同音語接続行列メモリ。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名簿 
1 図 @2図 第3図

Claims (1)

    【特許請求の範囲】
  1. 後続する単語は、同一の読みのものは同一のグループと
    し、この同一の読みグループ内の各単語には同音異字語
    番号を割り当て、先行する単語は、後続する単語の前記
    同音異字語番号によってグループ化し、後続単語情報と
    してのグループ番号を割り当て、先行する単語と後続す
    る単語との接続間゛係を示す同音語接続行列を記憶する
    同音語接続行列メモリと、前記同音語接続行列の内容を
    基に同音語のうちの1つを決定する同音語決定部と、入
    力かな列を記憶する入力単語レジスタと、辞書検索部と
    、各々、の単語について、読み情報、漢字情報、品詞情
    報、前記同音異字語番号および前記後続単語情報を記憶
    する単語辞書メモリと、前記入力単語レジスタに格納さ
    れている入力かな列の部分列に一致するかな列を前記単
    語辞書メモリから検索する辞書検索部と、前記品詞情報
    に基づいて先行する単語との接続の可否を判定する単語
    接続判定部と、前記単語接続判定部で接続可・能と判定
    された単語とその関連、情報とを記憶する解釈候補バッ
    ファと、前記同音語決定部の出力をもとに出・力漢字列
    を作成する漢字列作成部とを備え、入力された単語に関
    して上記単語辞書メモリから読み出された読み情報、漢
    字情報、品詞情報、同音異字語番号、後続単語情報およ
    び上記同音語接続行列メモリの内容に基づいて出力漢字
    列を作成することを特徴とするかな漢字変換装置。
JP58040871A 1983-03-11 1983-03-11 かな漢字変換装置 Pending JPS59167737A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58040871A JPS59167737A (ja) 1983-03-11 1983-03-11 かな漢字変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58040871A JPS59167737A (ja) 1983-03-11 1983-03-11 かな漢字変換装置

Publications (1)

Publication Number Publication Date
JPS59167737A true JPS59167737A (ja) 1984-09-21

Family

ID=12592578

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58040871A Pending JPS59167737A (ja) 1983-03-11 1983-03-11 かな漢字変換装置

Country Status (1)

Country Link
JP (1) JPS59167737A (ja)

Similar Documents

Publication Publication Date Title
JPH07182333A (ja) 日本語処理装置
JPS59167737A (ja) かな漢字変換装置
JPH08339376A (ja) 外国語検索装置及び情報検索システム
JPS6162163A (ja) 日本語ワ−ドプロセツサ装置
JPH0227423A (ja) 日本語文字データの並び換え方法
JPH0752450B2 (ja) 辞書デ−タ検索装置
JP3273778B2 (ja) 仮名漢字変換装置及び仮名漢字変換方法
JPS5942347B2 (ja) 電子翻訳機
JPH03118661A (ja) 単語検索装置
JP2628775B2 (ja) 辞書作成装置
JPS62144269A (ja) 情報検索装置
JP2638777B2 (ja) かな漢字変換装置
JPS6068425A (ja) 学習機能を備えた仮名漢字変換装置
JPH01237877A (ja) 漢字変換方式
JPS59106029A (ja) カナ漢字変換装置
JPS6243769A (ja) 仮名漢字変換装置
JPH03137768A (ja) 文書処理装置
JPH06187371A (ja) 圧縮地名データの格納方法及び読み出し方法
JPS59103132A (ja) 日本語入力装置
JPS62214468A (ja) かな漢字変換装置
JPS60122463A (ja) 文字処理装置
JPS6275761A (ja) 文字列処理装置
JPH09282316A (ja) 漢字仮名変換装置
JPH03208162A (ja) 入力装置
JPH0113579B2 (ja)