JPH08272788A - 仮名漢字変換装置および方法 - Google Patents

仮名漢字変換装置および方法

Info

Publication number
JPH08272788A
JPH08272788A JP7071762A JP7176295A JPH08272788A JP H08272788 A JPH08272788 A JP H08272788A JP 7071762 A JP7071762 A JP 7071762A JP 7176295 A JP7176295 A JP 7176295A JP H08272788 A JPH08272788 A JP H08272788A
Authority
JP
Japan
Prior art keywords
kana
character string
synonym
phrase
kanji conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP7071762A
Other languages
English (en)
Inventor
Hideyuki Kishiba
秀行 岸場
Yasuhisa Watanabe
泰久 渡辺
Masanori Harima
正紀 針間
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Omron Tateisi Electronics Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp, Omron Tateisi Electronics Co filed Critical Omron Corp
Priority to JP7071762A priority Critical patent/JPH08272788A/ja
Publication of JPH08272788A publication Critical patent/JPH08272788A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 仮名読み文字列を該仮名読み文字列に対応す
る漢字仮名混じり文字列に短時間でかつ高効率に変換で
きるように改善した仮名漢字変換装置および方法を提供
する。 【構成】 単語間の繋がりを示す格係り受け情報を関係
システム辞書(33)および関係ユーザ辞書(34)に
格納し、変換モジュール(14)により、関係システム
辞書33および関係ユーザ辞書(34)に格納された格
係り受け情報を参照して仮名読み文字列を漢字仮名混じ
り文字列に変換する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は仮名読み文字列を入力
し、該仮名読み文字列を該仮名読み文字列に対応する漢
字仮名混じり文字列に変換する仮名漢字変換装置および
方法に関し、特に、仮名漢字変換を行う連文節解析アル
ゴリズムの改善により仮名漢字変換に要する時間を大幅
に短縮して変換効率の向上を図った仮名漢字変換装置お
よび方法に関する。
【0002】
【従来の技術】従来、仮名漢字変換装置における連文節
解析アルゴリズムでは、仮名漢字変換時の同音意義語の
選択処理に際して、直前に確定した変換候補を優先して
変換する、いわゆる最終使用優先処理が用いられてい
る。
【0003】すなわち「あつい」という仮名入力に対し
て、変換候補が「厚い」、「暑い」、「熱い」の3つが
あり、ここで、「暑い」を選択して、この変換が確定し
た場合は、次に、「あつい」という仮名入力があると、
「暑い」を優先して変換するように構成されている。
【0004】
【発明が解決しようとする課題】しかしながら、上述し
た従来の最終使用優先処理による仮名漢字変換装置にお
いては、例えば、「あついなつ」という仮名入力に対し
て、「暑い夏」という変換を確定した後、「あついほ
ん」という仮名入力を行うと、この場合は「あつい」に
対して「暑い」が優先的に変換されるため、「あついほ
ん」は「暑い本」と変換されてしまい、ユーザが希望す
る「厚い本」という変換が即座に出てこないという問題
があった。
【0005】そこで、この発明は、仮名読み文字列を該
仮名読み文字列に対応する漢字仮名混じり文字列に短時
間でかつ高効率に変換できるように改善した仮名漢字変
換装置および方法を提供することを目的とする。
【0006】
【課題を解決するための手段】上記目的を達成するた
め、この発明は、仮名読み文字列を入力し、該仮名読み
文字列を該仮名読み文字列に対応する漢字仮名混じり文
字列に変換する仮名漢字変換装置において、各単語間の
繋がりを示す格係り受け情報を格納する格係り受け情報
辞書手段と、上記仮名読み文字列を上記格係り受け情報
辞書手段に格納された上記格係り受け情報を参照して漢
字仮名混じり文字列に変換する文字列変換手段と、を具
備することを特徴とする。
【0007】また、この発明は、仮名読み文字列を入力
するクライアントと、該クライアントと接続され、上記
クライアントで入力された仮名読み文字列を受信して該
仮名読み文字列を該仮名読み文字列に対応する漢字仮名
混じり文字列に変換し、上記クライアントに返送する仮
名漢字変換サーバと、を具備する仮名漢字変換装置にお
いて、上記仮名漢字変換サーバは、各単語間の繋がりを
示す格係り受け情報を格納する格係り受け情報辞書手段
と、上記仮名読み文字列を上記格係り受け情報辞書手段
に格納された上記格係り受け情報を参照して漢字仮名混
じり文字列に変換する文字列変換手段と、を具備するこ
とを特徴とする。
【0008】また、この発明は、仮名読み文字列を入力
し、該仮名読み文字列を該仮名読み文字列に対応する漢
字仮名混じり文字列に変換する仮名漢字変換方法におい
て、各単語間の繋がりを示す格係り受け情報を格納する
第1のステップと、上記仮名読み文字列を各文節毎に区
切る第2のステップと、上記第2のステップで区切られ
た上記仮名読み文字列の最終文節を注目文節として設定
する第3のステップと、上記第3のステップで設定され
た上記注目文節の前に検索対象文節があり、かつ、該注
目文節に複数の同音異義語候補がある場合は、上記第1
のステップで格納した格係り受け情報から上記注目文節
からの上記格係り受け情報を検索する第4のステップ
と、上記注目文節の同音異義語候補および上記検索対象
文節の同音異義語候補を検索する第5のステップと、上
記第5のステップで検索した同音異義語候補の中で上記
格係り受け情報に符合する同音異義語候補が存在する場
合は、該同音異義語候補を優先して選択する第6のステ
ップとを具備し、上記注目文節を1ずつ前の文節に移動
させることにより上記同音異義語候補の選択を行うこと
を特徴とする。
【0009】
【作用】この発明の仮名漢字変換装置においては、単語
間の繋がりを示す格係り受け情報を格係り受け情報辞書
手段に格納し、文字列変換手段により、仮名読み文字列
を格係り受け情報辞書手段に格納された格係り受け情報
を参照して漢字仮名混じり文字列に変換する。
【0010】また、上記文字列変換手段は、上記仮名読
み文字列を各文節毎に区切る文節区切り処理を実行する
文節区切り処理手段と、上記文節区切り処理手段で区切
られた各文節に複数の同音異義語候補がある場合は、該
複数の同音異義語候補の中の1つを選択する同音異義語
処理を実行する同音異義語処理手段と、を具備して構成
することができる。
【0011】ここで、上記同音異義語処理手段は、上記
文節区切り処理手段で区切られた上記仮名読み文字列の
各文節間で、上記格係り受け情報辞書手段に記憶された
上記格係り受け情報に符合する単語の組み合わせの同音
異義語候補が存在する場合は、該同音異義語候補を優先
して選択する。
【0012】また、上記同音異義語処理手段は、上記文
節区切り処理手段で区切られた上記仮名読み文字列の最
終文節を注目文節とし、該注目文節の前に検索対象文節
があり、かつ、該注目文節に複数の同音異義語候補があ
る場合は、上記格係り受け情報辞書手段から上記注目文
節からの上記格係り受け情報を検索するとともに、上記
注目文節の同音異義語候補および上記検索対象文節の同
音異義語候補を検索し、該検索した同音異義語候補の中
で上記格係り受け情報に符合する同音異義語候補が存在
する場合は、該同音異義語候補を優先して選択し、以下
同様に上記注目文節を1ずつ前の文節に移動させること
により上記同音異義語候補の選択を行う。
【0013】ここで、上記注目文節からの上記格係り受
け情報が、離れた文節間でも有効である場合は、上記注
目文節の直前の検索対象文節よりも前の文節を上記検索
対象文節として設定するように構成してもよい。
【0014】また、上記文字列変換手段は、上記仮名読
み文字列の前に入力された仮名読み文字列の同音異義語
候補が確定している場合は、該確定した同音異義語候補
を所定の複数文節分記憶する確定同音異義語候補記憶手
段と、上記仮名読み文字列に複数の同音異義語候補があ
る場合は、該複数の同音異義語候補の中の1つを上記確
定同音異義語候補記憶手段に記憶した確定同音異義語候
補を参照して選択する同音異義語処理を実行する同音異
義語処理手段と、を具備して構成することができる。
【0015】また、この発明では、上記文字列変換手段
で確定した漢字仮名混じり文字列から上記格係り受け情
報を解析し、上記格係り受け情報辞書に格納された格係
り受け情報を更新する学習手段を更に具備して構成する
ことができる。
【0016】また、上記文字列変換手段は、上記各文節
に対応する単語の付属語を解析する付属語解析手段を具
備し、上記付属語解析手段により上記各文節の格情報解
析を行うように構成することができる。
【0017】また、この発明は、仮名読み文字列を入力
するクライアントと、該クライアントと接続され、上記
クライアントで入力された仮名読み文字列を受信して該
仮名読み文字列を該仮名読み文字列に対応する漢字仮名
混じり文字列に変換し、上記クライアントに返送する仮
名漢字変換サーバと、を具備する仮名漢字変換装置にも
適用することができる。
【0018】この場合、クライアント側から入力された
仮名読み文字列に既に確定した確定同音異義語候補を付
加して仮名漢字変換サーバに送信するように構成すれ
ば、上記仮名読み文字列が単文節の場合でも最適な仮名
漢字変換を行うことが可能になる。
【0019】また、この発明の仮名漢字変換方法におい
ては、予め単語間の繋がりを示す格係り受け情報を格納
し、入力された仮名読み文字列を、まず、各文節毎に区
切り、この区切られた仮名読み文字列の最終文節を注目
文節とし、この注目文節の前に検索対象文節があり、か
つ、該注目文節に複数の同音異義語候補がある場合は、
注目文節からの格係り受け情報を検索するとともに、注
目文節の同音異義語候補および検索対象文節の同音異義
語候補を検索し、この検索した同音異義語候補の中で上
記格係り受け情報に符合する同音異義語候補が存在する
場合は、該同音異義語候補を優先して選択し、上記と同
様の処理を注目文節を1ずつ前の文節に移動させること
により上記同音異義語候補の選択を行う。
【0020】ここで、上記注目文節からの上記格係り受
け情報が、離れた文節間でも有効である場合は、上記注
目文節の直前の検索対象文節よりも前の文節を上記検索
対象文節として設定するようにしてもよい。
【0021】また、上記格係り受け情報に符合する同音
異義語候補が存在する場合、該符合の評価値を設定し、
該評価値の高い同音異義語候補を選択するようにしても
よい。
【0022】また、この発明では、確定した同音異義語
候補を含む漢字仮名混じり文字列から格係り受け情報を
解析し、格納された格係り受け情報を更新することによ
り上記格係り受け情報の学習を行う。
【0023】また、各文節に対応する単語の付属語を解
析するとともに、該付属語を解析により上記各文節の格
情報解析を行う。
【0024】
【実施例】以下、この発明に係わる仮名漢字変換装置お
よび方法の実施例を添付図面に基づいて詳細に説明す
る。
【0025】図1は、この発明に係わる仮名漢字変換装
置の一実施例のシステム概略構成を示すブロック図であ
る。
【0026】図1において、この仮名漢字変換装置は、
図示しない複数のクライアントが接続されたLAN(ロ
ーカルエリアネットワーク)の仮名漢字変換サーバ10
として構成される。
【0027】この仮名漢字変換サーバ10は、プロトコ
ル解析/送出モジュール11、ユーザ辞書登録/削除モ
ジュール12、初期化/終了モジュール13、変換モジ
ュール14、単文節解析モジュール15、次候補取出モ
ジュール16、確定モジュール17、学習モジュール1
8、辞書頻度更新モジュール19、辞書ハンドラー2
0、ユーザ辞書31、システム辞書32、関係システム
辞書33、関係ユーザ辞書34を具備して構成される。
【0028】ここで、プロトコル解析/送出モジュール
11は、この仮名漢字変換サーバ10を制御するプロト
コルの解析および送出を制御するものである。
【0029】また、ユーザ辞書登録/削除モジュール1
2は、各ユーザに対応するユーザ辞書31および関係ユ
ーザ辞書34に対するデータの登録および削除を制御す
るものである。
【0030】また、初期化/終了モジュール13は、こ
の仮名漢字変換サーバ10とクライアントとの接続時お
よび接続終了時におけるこの仮名漢字変換サーバ10内
の初期化処理および終了処理を制御するものである。
【0031】また、変換モジュール14は、仮名読み文
字列(仮名漢字変換対象文字列)を受取り、これをユー
ザ辞書31、システム辞書32、関係システム辞書3
3、関係ユーザ辞書34を参照して候補文字列(漢字仮
名混じり文字列)に変換する仮名漢字変換処理を実行す
るものである。
【0032】この変換モジュール14は、読み文字列の
連文節を解析する連文節解析部、最適文節切り、最適同
音意義語の変換を行う変換部、付属語の解析を行う付属
語解析部を有している。
【0033】また、単文節解析モジュール15は、読み
文字列の単文節を解析するもので、大文節からなる単文
節を解析する単文節解析部および小文節からなる単文節
を解析する単文節解析部を有している。
【0034】また、次候補取出モジュール16は、この
仮名漢字変換サーバ10における仮名漢字変換処理の次
候補を取り出す処理を実行するもので、大文節からなる
次候補を取り出す次候補解析部および小文節からなる次
候補を取り出す次候補解析部を有している。
【0035】また、確定モジュール17は、この仮名漢
字変換サーバ10における仮名漢字変換処理の確定処理
を実行するものである。
【0036】また、学習モジュール18は、この仮名漢
字変換サーバ10における仮名漢字変換処理に対応して
ユーザ辞書31、システム辞書32、関係システム辞書
33、関係ユーザ辞書34のデータを更新する学習処理
を実行するものである。
【0037】また、辞書頻度更新モジュール19は、こ
の仮名漢字変換サーバ10における仮名漢字変換処理に
対応してユーザ辞書31、システム辞書32、関係シス
テム辞書33、関係ユーザ辞書34に格納された頻度情
報を更新する処理を実行するものである。
【0038】また、辞書ハンドラー20は、ユーザ辞書
31、システム辞書32、関係システム辞書33、関係
ユーザ辞書34に対するデータの読み出し、書き込みを
制御するものである。
【0039】また、ユーザ辞書31は、各ユーザに対応
して設けられるので、このユーザ辞書31には、辞書デ
ータとともに各ユーザごとの頻度情報が格納される。
【0040】また、システム辞書32は、この仮名漢字
変換サーバ10内において共通に使用される辞書を格納
する。
【0041】また、関係システム辞書33および関係ユ
ーザ辞書34は、それぞれ単語どうしの繋がりを示す格
係り受け情報を、使用される助詞と一緒に、または動詞
の「れる」「られる」として使用されるかどうかを示す
データとともに格納するもので、この関係システム辞書
33は、この仮名漢字変換サーバ10内において共通に
使用される辞書、関係ユーザ辞書34は、各ユーザによ
り専用に使用される辞書である。
【0042】ところで、この実施例においては、 1)連文節解析アルゴリズムの中で上記格係り受け情報
を用いることにより、同音意義語間の変換の精度を上げ
る 2)確定された漢字仮名混じり文字列を解析して有効な
格係り受け情報を、検出、学習し、その結果を次回の変
換に反映する 3)付属語解析時に各々の文節の格情報を解析し、その
結果を変換、学習に渡すようにするという構成をとって
おり、これにより、従来の仮名漢字変換システムと比較
して、変換に要する時間を大幅に減少し、変換効率の向
上を図っている。
【0043】すなわち、この実施例の仮名漢字変換サー
バ10では、与えられた仮名読み文字列を最適な漢字仮
名混じり文字列に変換する際の連文節解析アルゴリズム
(文節区切り処理と同音異義語処理)の内の同音異義語
処理中で、辞書に登録されている格係り受け情報を用
い、変換文字列の中で格係り受け関係にマッチする文節
の組み合わせが存在すれば、それらの候補を優先して変
換することにより、変換効率の向上を実現している。
【0044】また、格係り受け関係を検索する文節の対
象として、その時の変換対象読み文字列だけでなく、以
前確定した文節情報を記憶、検索することで、単文節ご
とに変換、確定された場合でも、格係り受け関係を変換
に使用することができるようにしている。
【0045】ここで、この実施例で採用する格係り受け
情報の一例を示すと以下のようになる。
【0046】(1)隣りあった文節間でのみ有効な関係 1)付属語なし (交通 規制) 2)の格 (銀行の 会頭) 3)連体修飾格 (厚い 本) 4)連用修飾格 (ゆっくり 書く) 5)並列格 (日本や 韓国) (2)離れた文節間でも有効な関係 1)が格 (夏が 暑い) 2)係助詞格(が格と同等)(夏は 暑い) 3)に格 (東京に 主張する) 4)を格 (身長を 測る) 5)で格 (車で 帰る) 6)へ格 (穴へ 入れる) 7)と格 (上司と 訪ねる) 8)にて格 (会社にて 寝る) 9)から格 (今日から 頑張る) 10)より格 (現地より 交渉する) 11)副助詞格 (名前まで 変更する) 12)受け身格 (本が 持たれる) 13)使役格 (部下に 働かせる)
【0047】図1に示した仮名漢字変換サーバ10は、
図1には図示しない仮名漢字変換ライブラリに格納され
たプログラムおよびデータにより制御される。
【0048】図2は、図1に示した仮名漢字変換サーバ
10の要部の動作を、仮名漢字変換ライブラリ100と
この仮名漢字変換サーバ10との間を流れるプロトコル
に注目して示したものである。
【0049】仮名漢字変換サーバ10で仮名文字列を仮
名漢字列に変換する仮名漢字変換処理を実行する場合
は、仮名漢字変換ライブラリ100から仮名漢字変換サ
ーバ10へその仮名漢字変換要求が渡る。
【0050】仮名漢字変換サーバ10では、この仮名漢
字変換要求をプロトコル解析/送出モジュール11を介
して受け取ると、変換部14−1において、ユーザ辞書
31−1〜31−n、システム辞書32、関係システム
辞書33、関係ユーザ辞書34−1〜34−nおよび付
属語ファイル35に格納された付属語から付属語解析部
14−2で解析した付属語を参照して仮名読み文字列
(仮名漢字変換対象データ)を候補文字列(漢字仮名混
じり文字列データ)に変換する仮名漢字変換処理を実行
し、その仮名漢字変換処理結果をプロトコル解析/送出
モジュール11を介して仮名漢字変換ライブラリ100
に戻す。
【0051】仮名漢字変換ライブラリ100は、ユーザ
のオペレーションにより、仮名読み文字列の文節区切り
直しや、次候補の要求があれば、これを覚えておき、新
たな仮名漢字変換要求を仮名漢字変換サーバ10に送
り、上記と同じ手順でその仮名漢字変換処理結果を受け
取る。
【0052】そして、仮名漢字変換ライブラリ100
は、上記仮名漢字変換処理が確定されれば、これまで覚
えておいた結果と確定されたデータを元に、辞書頻度や
関係頻度の更新要求を出す。
【0053】仮名漢字変換サーバ10では、この更新要
求をプロトコル解析/送出モジュール11を介して受け
取ると、学習部18において、この受け取ったデータを
元に、関係頻度の更新や、新たな関係を、付属語の解析
を付属語解析部14−2で行いながら、関係システム辞
書33、関係ユーザ辞書34−1〜34−nに反映させ
る。
【0054】上記構成において、上記仮名漢字変換サー
バ10を用いて仮名漢字変換を行うクライアント側の処
理は以下のようになる。
【0055】まず、クライアント側で、変換対象データ
を入力する。ここで、この変換対象データが「あつい」
であり、この変換対象読みデータの前の確定したデータ
が「夏が」であったとする。この場合、クライアント側
では変換対象読みデータの「あつい」の前に確定したデ
ータ「夏が」を付加して変換対象読みデータを「(夏
が)あつい」として仮名漢字変換サーバ10に送る。
【0056】仮名漢字変換サーバ10では、「あつい」
の前に「(夏が)」が付加されているので、この「あつ
い」は「暑い」と変換すべきであると判断して、「暑
い」と変換して、クライアント側に戻す。
【0057】クライアント側では、この変換結果「暑
い」を受け取り、これにより「夏が暑い」という最適な
仮名漢字変換が可能になる。
【0058】なお、この場合、仮名漢字変換サーバ10
の関係システム辞書33、関係ユーザ辞書34−1〜3
4−nには、関係として 夏−が 暑い 湯−が 熱い 本−が 厚い の関係が格納されているので上記変換が可能になるので
ある。
【0059】なお、仮名漢字変換サーバ10側におい
て、変換対象読みデータが「なつがあつい」である場合
は「夏が暑い」と変換され、「ゆがあつい」である場合
は「湯が熱い」と変換され、「ほんがあつい」である場
合は「本が厚い」と変換される。
【0060】ところで、クライアント側から付加する確
定情報は、所定文節分クライアント側で記憶しておき、
この確定情報は上記仮名漢字変換が確定する毎に更新さ
れる。
【0061】例えば、クライアント側でN(=3)文節
分だけ確定情報を記憶するとし、「夏が」という変換対
象読みデータを確定する前に、 今日は (3文節前) いい (2文節前) 天気です。 (1文節前) の確定情報がクライアント側に記憶されている状態で、
上記「夏が」という変換対象読みデータを確定したとす
ると、クライアント側に記憶される確定情報は、 いい (3文節前) 天気です。 (2文節前) 夏が (1文節前) に更新される。
【0062】また、 今日は (3文節前) いい (2文節前) 天気です。 (1文節前) の確定情報がクライアント側に記憶されている状態で、
「私の名前は岸場秀行です。」という変換対象読みデー
タを確定したとすると、この場合、確定した「私の名前
は岸場秀行です。」は「私の」、「名前は」、「岸
場」、「秀行です。」の4文節に分けられるので、その
結果、「クライアント側に記憶される確定情報は、 名前は (3文節前) 岸場 (2文節前) 秀行です。 (1文節前) に更新される。
【0063】このように、この実施例においては、直前
に確定したN文節分の情報(前確定情報)をクライアン
ト側で記憶しておき、仮名漢字変換要求を仮名漢字変換
サーバ10に送る際に、上記前確定情報を変換対象読み
データに付加して送る。これにより、仮名漢字変換サー
バ10では、この前確定情報を用いた最適な仮名漢字変
換が可能になる。
【0064】なお、クライアント側で、変換、確定操作
以外の操作、例えば、改行、カーソル移動、文字削除等
の操作が行われた場合は、仮名漢字変換サーバ10側で
の誤変換、誤学習を避けるために、クライアント側で記
憶している前確定情報をクリアする。
【0065】図3は、仮名漢字変換サーバ10で実行さ
れる連文節解析アルゴリズムの同音異義語処理手順をフ
ローチャートで示したものである。
【0066】図3において、文節区切り済みデータを受
け取ると(ステップ101)、まず、変換データの最終
文節を注目文節に設定する(ステップ102)。
【0067】そして、この注目文節の前に検索対象文節
があるかを調べる(ステップ103)。
【0068】ここで、この注目文節の前に検索対象文節
がない場合は(ステップ103でNo)、この処理を終
了する(ステップ116)。
【0069】また、ここで、この注目文節の前に検索対
象文節がある場合は(ステップ103でYes)、この
注目文節に含まれる全候補を検索する(ステップ10
4)。そして、次に、この検索により注目候補があるか
を調べ(ステップ105)、注目候補がない場合は(ス
テップ105でNo)、注目文節を1つ前に移動し(ス
テップ117)、ステップ103に戻る。
【0070】また、ステップ105で、注目候補がある
場合は(ステップ105でYes)、この注目候補から
の全格係り受け情報を検索する(ステップ106)。
【0071】次に、検索格係り受け情報があるかを調べ
(ステップ107)、ここで検索格係り受け情報がない
場合は(ステップ107でNo)、次の注目候補へ移行
し(ステップ118)、ステップ105に戻る。
【0072】また、ステップ107で、検索格係り受け
情報がある場合は(ステップ107でYes)、注目文
節の直前の文節を検索対象文節に設定し(ステップ10
8)、次に、検索対象文節があるかを調べる(ステップ
109)。
【0073】ステップ109で、検索対象文節がない場
合は(ステップ109でNo)、次の検索格係り受け情
報へ移行し(ステップ119)、ステップ107に戻
る。
【0074】ステップ109で、検索対象文節がある場
合は(ステップ109でYes)、検索対象文節に含ま
れる全候補を検索し(ステップ110)、この検索によ
り検索対象候補があるかを調べる(ステップ111)。
【0075】ステップ111で、検索対象候補がある場
合は(ステップ111でYes)、次に、検索対象候補
が検索格係り受け情報と一致するかを調べる(ステップ
112)。
【0076】このステップ112で、検索対象候補が検
索格係り受け情報と一致しない場合は(ステップ112
でNo)、次の検索対象候補へ移行し(ステップ12
2)、ステップ111に戻る。
【0077】また、ステップ112で、検索対象候補が
検索格係り受け情報と一致する場合は(ステップ112
でYes)、次に、この格係り受け情報の評価値の方が
以前の評価値より大きいかを調べる(ステップ11
3)。
【0078】このステップ113において、この格係り
受け情報の評価値の方が以前の評価値より大きくないと
判断された場合は(ステップ113でNo)、次の検索
格係り受け情報へ以降し(ステップ115)、ステップ
107に戻る。
【0079】また、ステップ113において、この格係
り受け情報の評価値の方が以前の評価値より大きいと判
断された場合は(ステップ113でYes)、確定候補
情報の入れ換えを行い(ステップ114)、次の検索格
係り受け情報へ以降し(ステップ115)、ステップ1
07に戻る。
【0080】また、ステップ111で、検索対象候補が
ないと判断された場合は(ステップ111でNo)、こ
の検索格係り受け情報は離れた文節間でも有効であるか
を調べる(ステップ120)。
【0081】このステップ120で、この検索格係り受
け情報は離れた文節間でも有効である場合は(ステップ
120でYes)、次の検索対象文節へ移行し(ステッ
プ121)、ステップ109に戻る。
【0082】また、ステップ120で、この検索格係り
受け情報は離れた文節間でも有効でない場合は(ステッ
プ120でNo)、次の検索格係り受け情報へ移行し
(ステップ119)、ステップ107に戻る。
【0083】このような構成によると、格係り受け情報
を考慮した最適な同音異義語処理を短時間でかつ高効率
に行うことができる。
【0084】次に、図2に示した学習部18の処理の詳
細について説明する。
【0085】この実施例において、学習部18は、ユー
ザの確定した漢字仮名混じり文字列の解析を行い、その
ユーザの確定した漢字仮名混じり文字列から抽出した格
係り受け関係を関係システム辞書33、関係ユーザ辞書
34−1〜34−nに自動登録する。そして、関係シス
テム辞書33、関係ユーザ辞書34−1〜34−nに自
動登録した格係り受け関係を示す格係り受け情報は、以
後、変換部14−1により参照され、仮名漢字変換処理
に利用される。
【0086】図4は、学習部18の関係学習動作をプロ
トコルの流れで示したものである。
【0087】図4において、関係学習入出力部18−1
は、プロトコル解析/送出モジュール11を介して図2
に示した仮名漢字変換ライブラリ100から文節情報リ
ストを受け取り、この文節情報リストを関係解析抽出部
18−2に渡す。
【0088】関係解析抽出部18−2は、この文節情報
リストを解析し、各文節関係、すなわち各文節間の格係
り受け関係を抽出する。
【0089】ここで、上記文節情報リストの解析は、付
属語解析部142からの各文節の文節属性を受け取って
実行される。
【0090】関係解析抽出部18−2により解析、抽出
された各文節間の格係り受け関係を示す格係り受け情報
は、関係辞書書き出し部18−3に渡される。
【0091】関係辞書書き出し部18−3は、関係解析
抽出部18−2から格係り受け情報を受け取り、関係辞
書40(関係システム辞書33と関係ユーザ辞書34−
1〜34−n)の更新処理を行う。
【0092】すなわち、関係辞書書き出し部18−3で
は、この格係り受け情報が関係辞書33に存在しなけれ
ば、この格係り受け情報を関係辞書40に自動登録し、
存在すれば、その頻度情報の更新を行うことにより、関
係辞書40に格納される格係り受け情報の学習処理を行
う。
【0093】図5は、学習部18の関係頻度更新動作を
プロトコルの流れで示したものである。
【0094】図5において、関係頻度入出力部18−4
は、プロトコル解析/送出モジュール11を介して図2
に示した仮名漢字変換ライブラリ100から文節関係の
関係頻度および関係頻度の操作指示を受け取り、この文
節関係の関係頻度および関係頻度の操作指示を関係頻度
解析部18−5に渡す。
【0095】関係頻度解析部18−5は、この文節関係
の関係頻度および関係頻度の操作指示を解析し、その解
析結果を関係辞書書き出し部18−6に渡す。
【0096】関係辞書書き出し部18−6は、関係頻度
解析部18−5の解析結果を元に関係辞書40の関係頻
度の更新処理を行う。
【0097】図6は、図4に示した関係解析抽出部18
−2の処理をフローチャートで示したものである。図6
において、まず、文節属性初期化処理を行う(ステップ
180)。この文節属性初期化処理は、付属語解析部1
4−2に各文節毎にその文節属性の解析を依頼すること
により行われる。
【0098】ステップ180の文節属性初期化処理が終
了すると文節間の格係り受け関係を解析する関係解析処
理が行われる(ステップ181)。
【0099】この関係解析処理には、隣接間文節関係関
係解析(ステップ181−1)、主格以外の助詞関係解
析(ステップ181−2)、主格助詞関係解析(ステッ
プ181−3)が含まれる。
【0100】ここで、隣接間文節関係関係解析は、隣接
する文節間の文節関係を解析する。また、主格以外の助
詞関係解析は、文節属性が「が」、「を」等の主格助詞
を除く文節の文節関係を解析する。また、主格助詞関係
解析は、主格助詞を含む文節の文節関係を解析する。
【0101】ステップ181の関係解析処理が終了する
と、次に逆順関係の学習を行う(ステップ182)。こ
こで、逆順関係の学習とは、例えば、「湯が」「熱い」
という関係があったとすると、その逆順関係、すなわち
「熱い」「湯」という関係も関係辞書に自動登録する処
理のことである。この逆順関係の学習は、次に説明する
ステップ192の一時領域に関係を保存する処理により
保存された関係を逆に辿ることにより達成することがで
きる。
【0102】図7は、図6に示した関係解析処理におい
て抽出した関係を一時保存するための処理を示したフロ
ーチャートである。図6に示した関係解析処理において
は、図8に示すような文節情報リストを受け取り、文節
関係解析を行う。ここで、この文節情報リストには、既
に候補が確定した前確定文節も含まれている。
【0103】そこで、まず、ステップ190の前確定変
換学習処理においては、前確定文節どうしの関係を除く
処理を行う。この処理により、関係を二重に登録すると
いう不都合を除くことができる。
【0104】次に、学習しない単語処理を行う(ステッ
プ191)。ここで、学習しない単語処理とは、例え
ば、「これ」、「それ」、「いる」、「なる」、「あ
る」等のあらゆる単語に繋がる単語で、このステップ1
91では、これらの単語との関係を示す情報を除く処理
を行う。この処理により、関係辞書のメモリ使用量を大
幅に削減することができる。
【0105】上記ステップ190の前確定変換学習処理
およびステップ191の学習しない単語処理を行った
後、一時領域に関係を保存し、この処理を終了する。
【0106】
【発明の効果】以上説明したように、この発明の仮名漢
字変換装置および方法によれば、単語間の繋がりを示す
格係り受け情報を格係り受け情報辞書手段に格納し、文
字列変換手段により、仮名読み文字列を格係り受け情報
辞書手段に格納された格係り受け情報を参照して漢字仮
名混じり文字列に変換するように構成したので、仮名漢
字変換を短時間でかつ高効率に実行できる。
【0107】また、確定された漢字仮名混じり文字列を
解析して有効な格係り受け情報を、検出、学習し、その
結果を次回の変換に反映するようにしたので、仮名漢字
変換の高効率化を更に高めることができる。
【図面の簡単な説明】
【図1】この発明に係わる仮名漢字変換装置の一実施例
のシステム概略構成を示すブロック図。
【図2】図1に示した仮名漢字変換サーバの要部の動作
を、仮名漢字変換ライブラリとこの仮名漢字変換サーバ
との間を流れるプロトコルに注目して示した図。
【図3】図1に示した仮名漢字変換サーバで実行される
連文節解析アルゴリズムの同音異義語処理手順を示すフ
ローチャート。
【図4】図2に示した学習部の関係学習動作をプロトコ
ルの流れで示したブロック図。
【図5】図2に示した学習部の関係頻度更新動作をプロ
トコルの流れで示したブロック図。
【図6】図4に示した関係解析抽出部の処理を示したフ
ローチャート。
【図7】図6に示した関係解析処理において抽出した関
係を一時保存するための処理を示したフローチャート。
【図8】図6に示した関係解析処理で使用される文節情
報リストの説明図。
【符号の説明】
10 仮名漢字変換サーバ 11 プロトコル解析/送出モジュール 12 ユーザ辞書登録/削除モジュール 13 初期化/終了モジュール 14 変換モジュール 14−1 変換部 14−2 付属語解析部 15 単文節解析モジュール 16 次候補取出モジュール 17 確定モジュール 18 学習モジュール 18−1 関係学習入出力部 18−2 関係解析抽出部 18−3 関係辞書書き出し部 18−4 関係頻度入出力部 18−5 関係頻度解析部 18−6 関係辞書書き出し部 19 辞書頻度更新モジュール 20 辞書ハンドラー 31 ユーザ辞書 31−1〜31−n ユーザ辞書 32 システム辞書 33 関係システム辞書 34 関係ユーザ辞書 34−1〜34−n 関係ユーザ辞書 35 付属語ファイル 40 関係辞書

Claims (18)

    【特許請求の範囲】
  1. 【請求項1】 仮名読み文字列を入力し、該仮名読み文
    字列を該仮名読み文字列に対応する漢字仮名混じり文字
    列に変換する仮名漢字変換装置において、 各単語間の繋がりを示す格係り受け情報を格納する格係
    り受け情報辞書手段と、 上記仮名読み文字列を上記格係り受け情報辞書手段に格
    納された上記格係り受け情報を参照して漢字仮名混じり
    文字列に変換する文字列変換手段と、 を具備することを特徴とする仮名漢字変換装置。
  2. 【請求項2】 上記文字列変換手段は、 上記仮名読み文字列を各文節毎に区切る文節区切り処理
    を実行する文節区切り処理手段と、 上記文節区切り処理手段で区切られた各文節に複数の同
    音異義語候補がある場合は、該複数の同音異義語候補の
    中の1つを選択する同音異義語処理を実行する同音異義
    語処理手段と、 を具備することを特徴とする請求項1記載の仮名漢字変
    換装置。
  3. 【請求項3】 上記同音異義語処理手段は、 上記文節区切り処理手段で区切られた上記仮名読み文字
    列の各文節間で、上記格係り受け情報辞書手段に記憶さ
    れた上記格係り受け情報に符合する単語の組み合わせの
    同音異義語候補が存在する場合は、該同音異義語候補を
    優先して選択することを特徴とする請求項2記載の仮名
    漢字変換装置。
  4. 【請求項4】 上記同音異義語処理手段は、 上記文節区切り処理手段で区切られた上記仮名読み文字
    列の最終文節を注目文節とし、該注目文節の前に検索対
    象文節があり、かつ、該注目文節に複数の同音異義語候
    補がある場合は、上記格係り受け情報辞書手段から上記
    注目文節からの上記格係り受け情報を検索するととも
    に、上記注目文節の同音異義語候補および上記検索対象
    文節の同音異義語候補を検索し、該検索した同音異義語
    候補の中で上記格係り受け情報に符合する同音異義語候
    補が存在する場合は、該同音異義語候補を優先して選択
    し、以下同様に上記注目文節を1ずつ前の文節に移動さ
    せることにより上記同音異義語候補の選択を行うことを
    特徴とする請求項2記載の仮名漢字変換装置。
  5. 【請求項5】 上記注目文節からの上記格係り受け情報
    が、 離れた文節間でも有効である場合は、上記注目文節の直
    前の検索対象文節よりも前の文節を上記検索対象文節と
    して設定することを特徴とする請求項4記載の仮名漢字
    変換装置。
  6. 【請求項6】 上記文字列変換手段は、 上記仮名読み文字列の前に入力された仮名読み文字列の
    同音異義語候補が確定している場合は、該確定した同音
    異義語候補を所定の複数文節分記憶する確定同音異義語
    候補記憶手段と、 上記仮名読み文字列に複数の同音異義語候補がある場合
    は、該複数の同音異義語候補の中の1つを上記確定同音
    異義語候補記憶手段に記憶した確定同音異義語候補を参
    照して選択する同音異義語処理を実行する同音異義語処
    理手段と、 を具備することを特徴とする請求項1記載の仮名漢字変
    換装置。
  7. 【請求項7】 上記文字列変換手段で確定した漢字仮名
    混じり文字列から上記格係り受け情報を解析し、上記格
    係り受け情報辞書に格納された格係り受け情報を更新す
    る学習手段を更に具備することを特徴とする請求項1記
    載の仮名漢字変換装置。
  8. 【請求項8】 上記文字列変換手段は、 上記各文節に対応する単語の付属語を解析する付属語解
    析手段を具備し、 上記付属語解析手段により上記各文節の格情報解析を行
    うことを特徴とする請求項1記載の仮名漢字変換装置。
  9. 【請求項9】 仮名読み文字列を入力するクライアント
    と、 該クライアントと接続され、上記クライアントで入力さ
    れた仮名読み文字列を受信して該仮名読み文字列を該仮
    名読み文字列に対応する漢字仮名混じり文字列に変換
    し、上記クライアントに返送する仮名漢字変換サーバ
    と、 を具備する仮名漢字変換装置において、 上記仮名漢字変換サーバは、 各単語間の繋がりを示す格係り受け情報を格納する格係
    り受け情報辞書手段と、 上記仮名読み文字列を上記格係り受け情報辞書手段に格
    納された上記格係り受け情報を参照して漢字仮名混じり
    文字列に変換する文字列変換手段と、 を具備することを特徴とする仮名漢字変換装置。
  10. 【請求項10】 上記文字列変換手段は、 上記仮名読み文字列を各文節毎に区切る文節区切り処理
    を実行する文節区切り処理手段と、 上記文節区切り処理手段で区切られた各文節に複数の同
    音異義語候補がある場合は、該複数の同音異義語候補の
    中の1つを選択する同音異義語処理を実行する同音異義
    語処理手段と、 を具備することを特徴とする請求項9記載の仮名漢字変
    換装置。
  11. 【請求項11】 上記同音異義語処理手段は、 上記文節区切り処理手段で区切られた上記仮名読み文字
    列の最終文節を注目文節とし、該注目文節の前に検索対
    象文節があり、かつ、該注目文節に複数の同音異義語候
    補がある場合は、上記格係り受け情報辞書手段から上記
    注目文節からの上記格係り受け情報を検索するととも
    に、上記注目文節の同音異義語候補および上記検索対象
    文節の同音異義語候補を検索し、該検索した同音異義語
    候補の中で上記格係り受け情報に符合する同音異義語候
    補が存在する場合は、該同音異義語候補を優先して選択
    し、以下同様に上記注目文節を1ずつ前の文節に移動さ
    せることにより上記同音異義語候補の選択を行うことを
    特徴とする請求項10記載の仮名漢字変換装置。
  12. 【請求項12】 上記注目文節からの上記格係り受け情
    報が、 離れた文節間でも有効である場合は、上記注目文節の直
    前の検索対象文節よりも前の文節を上記検索対象文節と
    して設定することを特徴とする請求項11記載の仮名漢
    字変換装置。
  13. 【請求項13】 上記クライアントは、 上記仮名読み文字列を入力する仮名読み文字列入力手段
    と、 上記仮名読み文字列入力手段で入力された仮名読み文字
    列の前の仮名読み文字列の同音異義語候補が確定してい
    る場合は、該確定した同音異義語候補を所定の複数文節
    分記憶する確定同音異義語候補記憶手段と、 上記仮名読み文字列入力手段で入力された仮名読み文字
    列に上記確定同音異義語候補記憶手段に記憶された確定
    同音異義語候補を付加して上記仮名漢字変換サーバに送
    信する送信手段と、 を具備し、 上記仮名漢字変換サーバの文字列変換手段は、 上記仮名読み文字列に複数の同音異義語候補がある場合
    は、該複数の同音異義語候補の中の1つを上記送信手段
    により送信された上記確定同音異義語候補を参照して選
    択する同音異義語処理を実行する同音異義語処理手段を
    具備することを特徴とする請求項9記載の仮名漢字変換
    装置。
  14. 【請求項14】 仮名読み文字列を入力し、該仮名読み
    文字列を該仮名読み文字列に対応する漢字仮名混じり文
    字列に変換する仮名漢字変換方法において、 各単語間の繋がりを示す格係り受け情報を格納する第1
    のステップと、 上記仮名読み文字列を各文節毎に区切る第2のステップ
    と、 上記第2のステップで区切られた上記仮名読み文字列の
    最終文節を注目文節として設定する第3のステップと、 上記第3のステップで設定された上記注目文節の前に検
    索対象文節があり、かつ、該注目文節に複数の同音異義
    語候補がある場合は、上記第1のステップで格納した格
    係り受け情報から上記注目文節からの上記格係り受け情
    報を検索する第4のステップと、 上記注目文節の同音異義語候補および上記検索対象文節
    の同音異義語候補を検索する第5のステップと、 上記第5のステップで検索した同音異義語候補の中で上
    記格係り受け情報に符合する同音異義語候補が存在する
    場合は、該同音異義語候補を優先して選択する第6のス
    テップとを具備し、上記注目文節を1ずつ前の文節に移
    動させることにより上記同音異義語候補の選択を行うこ
    とを特徴とする仮名漢字変換方法。
  15. 【請求項15】 上記注目文節からの上記格係り受け情
    報が、 離れた文節間でも有効である場合は、上記注目文節の直
    前の検索対象文節よりも前の文節を上記検索対象文節と
    して設定することを特徴とする請求項14記載の仮名漢
    字変換方法。
  16. 【請求項16】 上記格係り受け情報に符合する同音異
    義語候補が存在する場合、該符合の評価値を設定し、該
    評価値の高い同音異義語候補を選択することを特徴とす
    る請求項14記載の仮名漢字変換方法。
  17. 【請求項17】 上記第6のステップで選択した同音異
    義語候補を確定する第7のステップと、 上記第7のステップで確定した同音異義語候補を含む漢
    字仮名混じり文字列から上記格係り受け情報を解析し、
    上記格納された格係り受け情報を更新することにより上
    記格係り受け情報の学習を行う第8のステップと、 を更に具備することを特徴とする請求項14記載の仮名
    漢字変換方法。
  18. 【請求項18】 上記各文節に対応する単語の付属語を
    解析する第9のステップと、 上記第9のステップによる上記付属語の解析により上記
    各文節の格情報解析を行う第10のステップと、 を更に具備することを特徴とする請求項14記載の仮名
    漢字変換方法。
JP7071762A 1995-03-29 1995-03-29 仮名漢字変換装置および方法 Withdrawn JPH08272788A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7071762A JPH08272788A (ja) 1995-03-29 1995-03-29 仮名漢字変換装置および方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7071762A JPH08272788A (ja) 1995-03-29 1995-03-29 仮名漢字変換装置および方法

Publications (1)

Publication Number Publication Date
JPH08272788A true JPH08272788A (ja) 1996-10-18

Family

ID=13469886

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7071762A Withdrawn JPH08272788A (ja) 1995-03-29 1995-03-29 仮名漢字変換装置および方法

Country Status (1)

Country Link
JP (1) JPH08272788A (ja)

Similar Documents

Publication Publication Date Title
CN109800284B (zh) 一种面向任务的非结构化信息智能问答系统构建方法
CN102395965B (zh) 用于在数据库中搜索对象的方法
CN105095204B (zh) 同义词的获取方法及装置
CN106959994B (zh) 服务器侧的匹配
US20190073357A1 (en) Hybrid classifier for assigning natural language processing (nlp) inputs to domains in real-time
US20070168469A1 (en) Server side search with multi-word word wheeling and wildcard expansion
JPH11184855A (ja) 翻訳方法およびシステム
JPWO2018097091A1 (ja) モデル作成装置、テキスト検索装置、モデル作成方法、テキスト検索方法、データ構造、及びプログラム
WO2012095696A2 (en) Text segmentation with multiple granularity levels
JPH0869470A (ja) 自然言語処理装置及びその方法
US20060074630A1 (en) Conditional maximum likelihood estimation of naive bayes probability models
WO2016138773A1 (zh) 基于图的地址知识处理方法及装置
CN111428494A (zh) 专有名词的智能纠错方法、装置、设备及存储介质
US20070164782A1 (en) Multi-word word wheeling
US20040186706A1 (en) Translation system, dictionary updating server, translation method, and program and recording medium for use therein
CN111209753B (zh) 一种实体命名识别方法及装置
CN111832299A (zh) 一种中文分词系统
US6219664B1 (en) Search method and system using syntactic information
CN105677725A (zh) 一种用于旅游垂直搜索引擎的前置解析方法
Liu et al. Building neural network language model with POS-based negative sampling and stochastic conjugate gradient descent
JP3743678B2 (ja) 自動自然言語翻訳
CN114141384A (zh) 用于检索医学数据的方法、设备和介质
JP4065346B2 (ja) 単語間の共起性を用いたキーワードの拡張方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH08129554A (ja) 関係表現抽出装置および関係表現検索装置
CN107818078B (zh) 汉语自然语言对话的语义关联与匹配方法

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20020604