JP3035932B2 - 仮名漢字変換装置 - Google Patents

仮名漢字変換装置

Info

Publication number
JP3035932B2
JP3035932B2 JP1282537A JP28253789A JP3035932B2 JP 3035932 B2 JP3035932 B2 JP 3035932B2 JP 1282537 A JP1282537 A JP 1282537A JP 28253789 A JP28253789 A JP 28253789A JP 3035932 B2 JP3035932 B2 JP 3035932B2
Authority
JP
Japan
Prior art keywords
word
conversion
kana
dictionary
storage unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP1282537A
Other languages
English (en)
Other versions
JPH03142658A (ja
Inventor
生明 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP1282537A priority Critical patent/JP3035932B2/ja
Publication of JPH03142658A publication Critical patent/JPH03142658A/ja
Application granted granted Critical
Publication of JP3035932B2 publication Critical patent/JP3035932B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、日本語ワードプロセッサ等の仮名漢字変換
装置に関する。
[従来の技術] 従来、仮名漢字変換装置においては、単語の読みに対
する表記を記憶するための基本辞書と、22単語間の接続
をチェックするための接続テーブルとを参照しつつ、与
えられた読み文字列を前方から最長一致の原則(読みの
長い単語を優先して取り出す方式)に従って、基本辞書
からの単語の表記を抽出するようにしたものが一般に知
られている。
また、変換効率を向上させる機能として、学習機能を
持つものがある。これは、例えば、同音語のうちで、一
番新しく使われた単語または過去の使用頻度を記憶して
おき、同音語の選択のときに記憶されている単語を優先
して表示させるというものである。
また、特開平1−19186号公報に示されるように、同
音語の誤変換を減少させるため、変換中に検索された単
語の直後の同音語の優先順を、直前の単語との関係づけ
で変更するというものがある。
その他、単語の長さ、または文節の長さが最長一致に
よって誤った変換がなされてしまうのを解決する方法と
して、2文節最長一致法(2文節の考えられる全ての組
み合わせで変換し一番評価の高かった候補の先頭の1文
節を逐次候補として取り出す方式や)や、文節数最小法
(変換結果の文節数が最小となるように候補を生成する
方式)などがある。
[発明が解決しようとする課題] しかしながら、従来のから漢字変換装置では、同音語
による誤変換および単語または文節の切れ目の誤りによ
る誤変換を完全に解決できるものではない。例えば学習
機能においては、同音語のうちオペレータにより先に使
われたどれかの単語が変換初回時に選択されるため、例
えば、「機器を構成する。」と「危機に陥る。」という
変換では、どちらの「きき」も、「機器」または「危
機」のいずれかが表示され、どちらか一方は誤変換とな
る。
また、特開平1−19186号公報においては、上記例の
ように「構成する」または「陥る」という後方の単語に
より、前方の「きき」の優先順を変更させることは困難
である。また、離れた文節での単語の優先順序を変更す
ることも困難である。例えば、「蛙は雨の日に柳の木の
下で跳んでいた。」という「跳ぶ」を、「蛙」により
「飛ぶ」より優先順を高くするのは困難である。
また、2文節最長一致法や文節数最小法では、変換ス
ピードが極度に遅くなるばかりか、比較的長い単語の文
節に対して正確を出力することは困難であり、十分に満
足のいく変換精度は得られなかった。
本発明は、上述した問題点を解決するためになされた
ものであり、同音語の選択、および単語または文節の区
切り方において、より変換精度の高い仮名漢字変換装置
を提供することを目的とする。
[課題を解決するための手段] 上記目的を達成するために本発明は、仮名漢字変換し
たい仮名読み文字列を入力するための入力装置と、単語
の読みに対する表記を記憶した基本辞書と、2単語間の
接続をチェックするための接続テーブルと、前記基本辞
書と接続テーブルを参照し仮名漢字変換する仮名漢字変
換部と、仮名漢字変換された結果を記憶するための変換
結果記憶部と、前記基本辞書の複数の単語列のパターン
とその書き換え情報を記憶した規則辞書と、前記変換結
果記憶部の内容について前記規則辞書中の単語列のパタ
ーンに一致するものを検索するパターンマッチ検索部
と、一致したパターンが検索されたとき、該当の変換結
果記憶部の内容を書き換える規則書き換え部と、前記変
換結果記憶部の内容を仮名漢字文字列として表示するた
めの出力装置とを備えたものである。
[作用] 上記の構成によれば、入力装置から入力された仮名読
み文字列は、仮名漢字変換部にて、辞書部である基本辞
書および接続テーブルを参照しつつ仮名漢字変換され、
その結果が変換結果記憶部に格納される。次いで、パタ
ーンマッチ検索部により前記変換結果記憶部の内容と、
規則辞書中の各項目のパターンマッチが行われる。変換
結果記憶部中で規則辞書の任意の項目とパターンマッチ
を成功した部分については、規則書き換え部により変換
結果記憶部の内容の書き換えが行われ、誤変換となって
いた部分の修正が行われる。
[実施例] 以下、本発明を具体化した一実施例を図面を参照して
説明する。
まず、第1図を参照して仮名漢字変換装置全体の構想
を説明すると、仮名漢字変換したい文字列を入力するた
めの入力装置1と、記憶手段としてのRAMエリア2と、R
OMエリア3と、装置全体を制御するための中央処理装置
4と、出力バッファの内容を表示するための出力装置5
とから構成されている。
RAMエリア2は、仮名漢字変換された結果を記憶する
ための変換結果記憶部2aと、入力された仮名読み文字列
を記憶するための読み入力バッファ2bと、変換結果記憶
部2aの内容を仮名漢字文字列にしたものを記憶するため
の出力バッファ2cとからなる。ROMエリア3は、プログ
ラム部3aと辞書部3bからなり、プログラム部3aは、基本
辞書と接続テーブルを参照し仮名漢字変換する仮名漢字
変換部3a−1と、規則変換部3a−2とからなり、この規
則変換部3a−2は、単語のパターンと変換結果記憶部2a
の内容とをパターンマッチさせる規則パターンマッチ部
3a−21と、パターンマッチされた変換結果記憶部2aの内
容の一部の書き換えを行う規則書き換え部3a−22とから
なる。また、辞書部3bは、単語の読みに対する表記を記
憶した基本辞書3b−1と、2単語間の接続をチェックす
るための接続テーブル3b−2と、基本辞書中の複数の単
語パターンおよびその書き換えパターンを記憶した規則
辞書3b−3とからなる。
次に、第2図ないし第5図を参照して本仮名漢字変換
装置の動作を説明する。まず、第2図を参照して、全体
の流れを説明すると、ステップS1(以下、S1と略記)に
おいて読み文字列が入力装置1より入力され、その仮名
文字コードが読み入力バッファ2bに記憶される。その
後、S2において通常の仮名漢字変換処理をするために、
基本辞書3b−1および接続テーブル3b−2を参照して、
読み入力バッファ2b中に存在する仮名文字コードが仮名
混じり漢字に変換され、変換結果記憶部2aに記憶され
る。
変換結果記憶部2aには、第4図に示すように変換結果
全体の単語単位の情報が記憶されており、それぞれの単
語の読み長と、基本辞書3b−1中に付加されているその
単語を表す単語IDと、その単語に同音語が存在する場
合、同音語のうちで基本辞書中の先頭に記憶されている
単語の単語IDを表す同音語先頭IDと、末尾に記憶されて
いる単語の単語IDを表す同音語末尾IDが1単語の内容と
して記憶されている。単語IDとは、第6図に示す基本辞
書を参照すれば、容易にその単語の表記を取り出すこと
ができるものであり、同音語先頭IDと同音語末尾IDとが
与えられていることにより、その単語がその同音語の中
に含まれているか否かのチェックも容易に行うことがで
きるようになっている。また、単語IDから第6図に示し
た基本辞書を参照すれば、変換結果記憶部中の単語読み
長、同音語先頭ID、同音語末尾ID等の設定もできるもの
である。
次に、S3において変換結果記憶部2aの内容を規則辞書
3b−3を参照して規則変換し、その結果も第4図に示す
内容で再度、変換結果記憶部2aに格納され、S4において
変換結果記憶部2aの内容が仮名漢字文字列(候補)に変
換され、出力バッファ2cに格納され、処理を終了する。
次に、第3図を参照して上記の規則変換の流れを説明
する。まず、S11において、上記S2で設定した変換結果
記憶部2aの先頭の項目を示すポインタをP1に設定してお
く。その後、S12において、ポインタP1の指す変換結果
記憶部2a中の項目をきっかけとして、規則辞書3b−3中
に該項目の前後の単語列のパターンに一致するものがあ
るかどうかを検索する。規則辞書3b−3の内容は、例え
ば第5図に示す通りで、1項目の内容は一般に、 <パターンマッチ因子−単語パターン:書き換え情報> の形式に記憶されている。「パターンマッチ因子」は、
U,D,Yのいずれかであり、Uの時は単語パターンに記述
されている単語そのものにパターンマッチし、Dの時は
単語パターンに記述されている読みの同音語とパターン
マッチし、Yの時は複数単語(1単語でもよい)の単語
の読みとパターンマッチする。単語パターンは、その項
目がどの単語とパターンマッチするかを表わすもので、
第4図に示した変換結果記憶部中の単語IDと対応するも
のである。この単語パターンは変換結果記憶部中の単語
ID及び同音語先頭ID、同音語末尾ID等とパターンマッさ
せるために使用される。
また、「書き換え情報」は、N(無変化マーカー),D
(削除マーカー)または単語列のいずれかであり、Nの
時は、その項目にパターンマッチした変換結果記憶部中
の項目の書き換えを行なわないことを表し、Dの時は、
変換結果記憶部中の項目を削除することを表し、単語列
の時は、変換結果記憶部中のパターンマッチした項目を
その単語列に書き換えることを表している。単語列とは
複数の単語(1つだけでもよい)が変換結果記憶部中の
単語IDの形で記憶されたものであり、この単語IDから基
本辞書を参照することにより、変換結果記憶部中の単語
読み長、同音語先頭ID、同音語末尾ID等の設定が可能と
なる。
かくして、S12において、上記規則辞書3b−3中のパ
ターンマッチ因子および単語パターンを参照して、ポイ
ンタP1が指す変換結果記憶部2a中の項目(単語)の前後
の単語列とパターンが一致するものを検索し、検索に成
功したときは、S13に進み、規則辞書3b−3にマッチし
た変換結果記憶部2aの先頭項目をポインタPが指すよう
にし、次に、S14でマッチした規則辞書の末尾項目に対
応する変換結果記憶部2aの末尾項目をポインタP2が指す
ようにする。また、S15においてマッチした規則辞書側
の先頭項目をポインタP3が指すようにする。
次に、S16〜S23で上述した規則辞書3b−3中の「書き
換え情報」を参照して、変換結果記憶部2aの項目の書き
換えを行う。
S16、S17、S19の各々では、順次、ポインタP3で指さ
れている規則辞書中の先頭項目の「書き換え情報」位置
に、無変化マーカーNが付いているか、削除マーカーD
が付いているか、単語列が付いているかを調べる。これ
らを説明すると、まず、S16で、無変化マーカーNが付
いていれば、ポインタPで示される変換結果記憶部2aの
先頭項目には何も行わず、S22へ進み、一方、無変化マ
ーカーNが付いていなければ、S17に進む。S17で上記の
「書き換え情報」位置に削除マーカーDが付いていれ
ば、S18でポインタPで指される変換結果記憶部2aの項
目を除去し、S22へ進む。一方、S17で削除マーカーDが
付いていなければ、S19に進み、ここで上記の「書き換
え情報」位置に単語列が付いているときは、S20でその
単語列を基本辞書3b−1より検索し、S21においてポイ
ンタPで指されている変換結果記憶部2aの先頭項目を上
記で検索された単語列に置き換え、S22へ進む。S19の判
定で単語列が付いていないときは、直ちにS22へ進む。
S22では、マッチングした先頭項目のポインタPと末
尾項目のポインタP2を比較し、変換結果記憶部2aの同じ
項目を指していなければ、これは、すなわち、パターン
マッチした規則辞書3b−3の末尾の項目に対応する変換
結果記憶部2aの項目まで書き換えを終了していないとき
になるが、このときは、S23において、変換結果記憶部2
aの項目を指すポインタPと、規則辞書3b−3中の項目
を指すポインタP3とを共に次の項目へ1つずつ移動さ
せ、その項目について、再度、上記S16からS23を繰返
し、規則辞書3b−3を参照しつつ対象項目の書き換えを
行う。
S22においてポインタPとポインタP2が等しいとき
は、S24でポインタP1が変換結果記憶部2aの末尾項目か
どうかを調べ、末尾項目でなければ、ポインタP1を次の
項目へ1つ移動させ、再び、S12において、そのポイン
タP1の指す変換結果記憶部2aの項目から規則辞書3b−3
中にその項目の前後の単語列のパターンにパターンマッ
チするものがあるかどうかを検索し、以下、同様の動作
を行う。
また、S12においてパターンマッチ検索に失敗したと
きは、直ちに、S24に進み、末尾項目でなければ、上記
と同様にS25で逐次、ポインタP1を次の項目へ移動さ
せ、S12において規則辞書3b−3とのパターンマッチを
行う。S24においてポインタP1が変換結果記憶部2aの末
尾項目まで移動したときは、規則変換処理を終了する。
次に、第5図の規則辞書内容例(この辞書の詳細は後
述)を参照して、本規則変換処理が仮名漢字変換された
日本語文にどのような作用をもたらすかを具体的に説明
する。いま、「私は聞き耳を立て」と入力したい場合を
想定する。「わたしはききみみをたて」と仮名入力し、
仮名漢字変換処理の結果、変換結果記憶部2aに記憶され
る内容が、第4図の単語単位の記憶内容に対応して示し
たとき、例えば、「私」、「は」、「聞き耳」、
「を」、「建て」となったとする。その後の規則変換処
理において、これらの単語列について規則辞書3b−3の
項目とパターンマッチ検索することにより、誤変換の
「建て」を正解の「立て」に書き換えることができる。
第3図のフローチャートにおいて、S12でのパターン
マッチ検索が成功するまで、ポインタP1は順次移動され
(S24、S25)、ポインタP1が規則辞書3b−3の内容とパ
ターンマッチする「聞き耳」を指すと、S13以降の処理
に入る。最初、S13でポインタPはポインタP1の指す
「聞き耳」を指し、S14でポインタP2は末尾項目の「建
て」を指し、S15でポインタP3はマッチされた規則辞書
の先頭項目である<U−聞き耳:N>を指す。S16の判定
ではポインタP3の項目に無変化マーカーNが付いている
ので、S22に進み、ここでPとP2は等しくないのでS23に
進み、ポインタP,P3は次の項目、つまり、それぞれ変換
結果の「を」、規則辞書の<U−を:N>を指すようにな
り、S16へ戻る。再び、上記と同様、無変化マーカーN
が付いているので、S22、S23を経て、ポインタP,P3は次
の項目、つまり、それぞれ変換結果の「建て」、規則辞
書の<D−たて:立て>を指すようになり、今度はS16
よりS17を通ってS19に進み、ここでポインタP3の項目に
単語列(ここでは「立て」)が付いているので、S20に
進み、同項目の単語列を基本辞書3b−1から検索し(こ
れは同単語の単語IDを引くことになる)、S21にてポイ
ンタPで示されている「建て」を「立て」に書き換え
る。その後、S22へ進み、ここではポインタPとP2とは
等しいので、S24に進み、これ以降の処理に移る。
次に、規則辞書3b−3の内容について説明する。規則
辞書の辞書項目は、慣用的なパターンや言い回し等、文
脈の前後の関係を単語列のパターンとして記憶させたも
のである。第5図に示した辞書項目5−1は「ききみみ
をたてる」という言い回しで、前方に「聞き耳を」とい
う言い回しが付くときには、その後の「たて」はたくさ
ん存在する同音語「建て」、「絶て」、「断て」…のう
ちで特に「立て」を選択するように規則化したものであ
る。辞書項目5−2は「こうかふこうか」を規則化した
もので、「こうか」に関して読みが「こうか」である
「効果」、「高価」、…「功/か」、「公/か」、…
(「/」は単語の区切り)に対してパターンマッチし、
それを2単語分の「幸/か」に書き換え、「ふこう」に
関しても同じ読みの「吹/こ/う」、「富鉱」などにパ
ターンマッチし、それを「不幸」に書き換える。辞書項
目5−3および5−4は、それぞれ「人」と「鳥に」対
して「鳴/く」と「泣/く」を規則化したもので、<PP
1>はその位置に助詞の「は」、「が」、「も」のう
ち、どれが来ても規則化できるようにするためのマーカ
ーである。辞書項目5−5および5−6は「きき」とい
う単語に対して、その後につながるものに対して、「危
機」を用いるか「機器」を用いるかを規則化したもの
で、項目5−6に関しては、同時に「こうせい」に対し
ても同音語「公正」、厚生」、「攻勢」、…のうちで
「構成」を用いるように規則化してあり、「機器」と
「構成」の間には5単語までのどんな単語が存在しても
規則化できるようになっている。<PP2>が5単語まで
のどんな単語ともパターンマッチするためのマーカーで
あり、どんな1単語ともパターンマッチできる項目であ
る<*>が例外的に用意されている。この辞書項目5−
6で、「機器を構成する」や「機器の一部を構成する」
等の規則づけを行うことができる。
また、書き換え情報の削除マーカーDや複数の単語列
(2単語以上)は書き換える前と後とで単語数が異なる
時に用いるものである。
なお、本発明は以上詳述した実施例に限定されるもの
ではなく、その趣旨を逸脱しない範囲において様々な変
更を加えることができる。例えば、規則辞書3b−3の各
項目に関しては、基本辞書3b−1に付加されるべき意味
情報とパターンマッチできるような項目を設けたり、そ
の他、基本辞書3b−1の任意の情報とパターンマッチす
るような項目を設けてもよい。
[発明の効果] 以上のように本発明によれば、一旦変換した文字列を
規則辞書の項目とパターンマッチ検索することで適宜、
書き換えるようにしているので、従来の仮名漢字変換に
おいて誤変換になり易い部分を正しい変換候補に変更す
ることができ、高精度な仮名漢字変換が可能となる。ま
た、従来の仮名漢字変換と規則変換を分離することによ
り、より高速な規則変換を実現することができる。
【図面の簡単な説明】
第1図は本発明の一実施例による仮名漢字変換装置のブ
ロック構成図、第2図は同装置のプログラム全体のフロ
ーチャート、第3図は規則変換の動作を示すフローチャ
ート、第4図は変換結果記憶部内の内容を概念的に表し
た図、第5図は規則辞書の内容例を概念的に表した図、
第6図は基本辞書の内容例を概念的に表した図である。 1……入力装置、2a……変換結果記憶部、3a−1……仮
名漢字変換部、3a−2……規則変換部、3b−1……基本
辞書、3b−2……接続テーブル、3b−3……規則辞書、
4……中央処理装置、5……出力装置。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】仮名漢字変換したい仮名読み文字列を入力
    するための入力装置と、 単語の読みに対する表記を記憶した基本辞書と、2単語
    間の接続をチェックするための接続テーブルと、 前記基本辞書と接続テーブルを参照し仮名漢字変換する
    仮名漢字変換部と、 仮名漢字変換された結果を記憶するための変換結果記憶
    部と、 前記基本辞書の複数の単語列のパターンとその書き換え
    情報を記憶した規則辞書と、 前記変換結果記憶部の内容について前記規則辞書中の単
    語列のパターンに一致するものを検索するパターンマッ
    チ検索部と、 一致したパターンが検索されたとき、該当の変換結果記
    憶部の内容を書き換える規則書き換え部と、 前記変換結果記憶部の内容を仮名漢字文字列として表示
    するための出力装置とを備えたことを特徴とする仮名漢
    字変換装置。
JP1282537A 1989-10-30 1989-10-30 仮名漢字変換装置 Expired - Fee Related JP3035932B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1282537A JP3035932B2 (ja) 1989-10-30 1989-10-30 仮名漢字変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1282537A JP3035932B2 (ja) 1989-10-30 1989-10-30 仮名漢字変換装置

Publications (2)

Publication Number Publication Date
JPH03142658A JPH03142658A (ja) 1991-06-18
JP3035932B2 true JP3035932B2 (ja) 2000-04-24

Family

ID=17653754

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1282537A Expired - Fee Related JP3035932B2 (ja) 1989-10-30 1989-10-30 仮名漢字変換装置

Country Status (1)

Country Link
JP (1) JP3035932B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102185100B1 (ko) * 2019-03-20 2020-12-01 (주)리얼허브 횡단보도 보행자 안전관리 시스템 및 그 방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102185100B1 (ko) * 2019-03-20 2020-12-01 (주)리얼허브 횡단보도 보행자 안전관리 시스템 및 그 방법

Also Published As

Publication number Publication date
JPH03142658A (ja) 1991-06-18

Similar Documents

Publication Publication Date Title
JP4738847B2 (ja) データ検索装置および方法
JP3035932B2 (ja) 仮名漢字変換装置
JP2009109758A (ja) 音声認識辞書生成装置及び方法
US10614065B2 (en) Controlling search execution time for voice input facility searching
JPH0778183A (ja) デ−タベ−ス検索システム
JP2019095603A (ja) 情報生成プログラム、単語抽出プログラム、情報処理装置、情報生成方法及び単語抽出方法
KR101982490B1 (ko) 문자 데이터 변환에 기초한 키워드 검색 방법 및 그 장치
KR20040018008A (ko) 품사 태깅 장치 및 태깅 방법
KR20080028655A (ko) 품사 태깅 장치 및 태깅 방법
JP3628565B2 (ja) 辞書検索方法、装置、および辞書検索プログラムを記録した記録媒体
JP3414326B2 (ja) 音声合成用辞書登録装置及び方法
JP4136055B2 (ja) 類似文字列検索システムおよび記録媒体
JP2001051992A (ja) 日本語統計データ作成装置および方法、並びにディクテーションシステム
JP4140248B2 (ja) データベース検索装置
JP2738386B2 (ja) 仮名漢字変換装置
JPH04369763A (ja) かな漢字変換装置及び方法
JP3048793B2 (ja) 文字変換装置
JPS59186026A (ja) かな漢字変換方法
JPH07152756A (ja) 文書処理装置
JP2006209298A (ja) 文字認識後処理装置、文字認識後処理方法およびコンピュータプログラム
JPS6118065A (ja) カナ漢字変換処理装置
JPH05120266A (ja) かな漢字変換装置
JPH10154141A (ja) かな漢字変換装置
JPH02105968A (ja) 日本文誤り自動検定・訂正方式
JPS6258364A (ja) カナ漢字変換装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees