JPH07160700A

JPH07160700A - 文書処理方法及びその装置

Info

Publication number: JPH07160700A
Application number: JP5310530A
Authority: JP
Inventors: Hironori Fukuda; 浩紀福田
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 1993-12-10
Filing date: 1993-12-10
Publication date: 1995-06-23

Abstract

(57)【要約】【目的】より正確な同音多義語の仮名漢字変換を行
う。【構成】文節に区切られた入力文字列の各文節に関し
て、同音語の候補がある場合に、その同音語の前後にあ
る単語を組み合わせて成立する用例が用例辞書にあるか
どうかをサーチする。そのような用例がある場合、さら
に、入力文字列ではその用例を構成する単語間に別の文
節が存在するかどうかを調べる。もし、別文節がサーチ
された用例に割り込んでいる場合には、用例情報５２２
の飛び越し情報５２３を参照して、別の文節が割り込ん
でいても、用例が用例として成立するかどうかを調べ
る。そして、その結果に従って、仮名漢字変換の変換候
補を決定する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は文書処理方法及びその装
置に関し、特に、文字の変換時における同音語多義判定
処理を行う文書処理方法及びその装置に関するものであ
る。

【０００２】

【従来の技術】従来より、入力文字列の変換を行う文字
処理において、仮名漢字変換処理が広く普及している。
仮名漢字変換の結果、多数現れる同音語候補に対して、
個々の単語の品詞の持つ文法的特性などから同音語の多
義解消が行われてきたが、それだけでは対処できない場
合が多かった。そこで、意味的に互いに関係がある単語
と単語の組（すなわち用例）を格納した用例辞書を用
い、その辞書にある組み合わせを第一候補の決定に利用
して同音語の多義解消が行われてきた。

【０００３】

【発明が解決しようとする課題】ところで用例には、慣
用句や人名のように用例の存在する単語対の間に文節が
割り込んだ場合、用例として成り立たなくなるようなも
のも存在する。しかしながら上記従来例では、例えば、
『目標を掲げて行動を始める』という意味の慣用句であ
る「旗を揚げる」という用例が存在するとき、「はたを
とってあげる。」と入力を行うと、「はたを」と、「あ
げる」に上記用例が適用され、入力文字列が「旗を取っ
て揚げる。」と変換されてしまい「旗を取ってあげる
（これが正しい変換）」とはならないという問題点があ
った。

【０００４】また、仮名漢字変換処理において、用例の
飛び越しが発生した場合、人間が見れば明らかに用例が
適用されてはいけないにもかかわらず、用例が適用され
た変換候補が作成されてしまうことがある。これは結果
として、文書処理全体における処理速度の低下を引き起
こしてしまい、改善が望まれていた。

【０００５】本発明は上記従来例に鑑みてなされたもの
であり、より正確な同音語多義判定処理を行うことがで
きる文書処理方法及びその装置を提供することを目的と
している。

【０００６】

【課題を解決するための手段】上記目的を達成するため
に本発明の文書処理装置は、以下のような構成からな
る。即ち、入力された仮名文字列を仮名漢字変換する文
書処理装置であって、前記仮名文字列を入力する入力手
段と、単語の読み、前記単語の表記、及び、前記単語に
付随する情報を格納する第１記憶手段と、単語と前記単
語とは別の単語を組み合わせた用例と、前記用例を構成
する単語間に別の文節が割り込んだ場合に前記用例が用
例として成立するかどうかの情報を格納する第２記憶手
段と、前記入力手段によって入力された文字列を、前記
第１記憶手段に格納された情報を参照して１つ以上の文
節に区切る区切り手段と、前記区切り手段によって区切
られた文節に関し、前記第２記憶手段に格納された情報
から仮名漢字変換の変換候補を抽出する抽出手段と、前
記抽出手段による抽出結果と、前記第１記憶手段に格納
された単語の表記とに基づいて、前記入力手段によって
入力された文字列を仮名漢字変換する変換手段とを有す
ることを特徴とする文書処理装置を備える。

【０００７】また他の発明によれば、単語の読み、前記
単語の表記、及び、前記単語に付随する情報を格納する
第１記憶媒体と、単語と前記単語とは別の単語を組み合
わせた用例と、前記用例を構成する単語間に別の文節が
割り込んだ場合に前記用例が用例として成立するかどう
かの情報を格納する第２記憶媒体とを用いて、入力され
た仮名文字列を仮名漢字変換する文書処理方法であっ
て、前記仮名文字列を入力する入力工程と、前記入力工
程によって入力された文字列を、前記第１記憶媒体に格
納された情報を参照して１つ以上の文節に区切る区切り
工程と、前記区切り工程によって区切られた文節に関
し、前記第２記憶媒体に格納された情報から仮名漢字変
換の変換候補を抽出する抽出工程と、前記抽出手段によ
る抽出結果と、前記第１記憶媒体に格納された単語の表
記とに基づいて、前記入力工程によって入力された文字
列を仮名漢字変換する変換工程とを有することを特徴と
する文書処理方法を備える。

【０００８】

【作用】以上の構成により本発明は、入力された文字列
を文節に区切り、その区切られた文節に関し、単語と別
の単語を組み合わせた用例と、その用例を構成する単語
間に別の文節が割り込んでも、その用例が用例として成
り立つかどうかを考慮して、仮名漢字変換の変換候補を
抽出するよう動作する。

【０００９】

【実施例】以下添付図面を参照して本発明の好適な実施
例を詳細に説明する。

【００１０】［装置構成の説明］図１は本発明の代表的
な実施例である文書処理装置の構成を示すブロック図で
ある。図１において、１は装置全体の制御や仮名漢字変
換等の文書処理を実行するＣＰＵ、２はＣＰＵ１が各種
情報の一時保存領域や各処理を行う作業領域として用い
るＲＡＭ、３は入力読み文字列や仮名漢字変換された漢
字仮名交じり文を表示するディスプレイ（ＤＩＳＰ）、
４は各種のキー情報を入力するキーボードであり、４１
は文書情報作成・編集のための入力キー、４２は通常の
文字キーや仮名漢字変換の変換キー等である。

【００１１】また、５は各種固定情報を格納するＲＯＭ
であり、ＲＯＭ５の領域５１にはＣＰＵ１が実行する仮
名漢字変換の処理プログラムを、領域５２には仮名漢字
変換で用いられる単語辞書や、用例適用処理で使用する
用例辞書を格納している。６は処理された文書データを
格納するハードディスク、７は各装置構成要素を互いに
接続するＣＰＵバスである。

【００１２】図２はＲＯＭ５の領域５２に格納された仮
名漢字変換に用いる辞書の構成を示す図である。この辞
書は、表記変換に用いる単語情報５２１と、表記変換の
際の第１の候補を決定するための用例情報５２２とで構
成されている。単語情報５２１は、その見出し語である
“読み部”、および単語の表記を格納する“表記”、単
語の品詞を格納する“品詞”等の情報から構成されてい
る。一方、用例情報５２２は、その見出し単語の持つ用
例情報の“個数”、その用例の読みを格納した“読み
部”、その用例の表記を格納した“表記部”、及び、用
例を構成する単語対の間に他の文節が割り込んでも用例
が成り立つかどうか、つまり、飛び越し用例が可能かど
うかの情報を格納した“飛び越し情報”等から構成され
ている。

【００１３】図３は、同音語の各候補に適用される用例
の情報を格納する用例情報の集合体である用例情報プー
ルの構成を示す図である。図３（ａ）は用例情報プール
の全体構成を示し、これは複数の用例情報から構成され
る。図３（ｂ）は各用例情報の構成を示した図である。
各用例情報は用例の相手となる同音語のＩＤを格納する
“ペア同音語ＩＤ”、適用されている用例のＩＤを格納
する“用例ＩＤ”、同じ同音語候補に適用されている別
の用例情報へのポインタが格納されている“用例情報ポ
インタ”等から構成されている。この用例情報プールに
は、新たに用例を追加登録することができる。

【００１４】［仮名漢字変換処理］次に、以上の構成の
装置が実行する仮名漢字変換処理について、図４〜図６
に示すフローチャートと、図７に示す例文と、図８に示
す図７の例文に関する同音語情報および用例情報を参照
して説明する。

【００１５】図４は本実施例に従う文字処理の概要を示
すフローチャート、図５は仮名漢字変換処理を示すフロ
ーチャート、そして、図６は用例抽出処理を示すフロー
チャートである。

【００１６】まずステップＳ４１において、本実施例の
装置はキー入力待ちとなっている。そして、キーボード
４よりキーが押下され、割り込みが発生すると、処理は
ステップＳ４２に進み、押下されたキーがどのような種
類のキーであるかを判別し、その判別結果に従って、処
理はステップＳ４３、ステップＳ４４、ステップＳ４５
のいずれかのステップに進むか、あるいは、処理を終了
する。

【００１７】その判別結果で、キー入力が読みの入力で
あった場合には処理はステップＳ４３に進み、その読み
の文字列を装置に入力する。

【００１８】また、その判別結果で、キー入力が変換キ
ーの押下であった場合には処理はステップＳ４４に進
み、ステップＳ４３で入力された仮名漢字変換の対象と
なる文字列を漢字に変換し出力する。この漢字への変換
の際に、ＲＯＭ５の領域５２に格納された辞書に存在す
る用例情報を用いて、同音語の第一候補を決定する。

【００１９】この仮名漢字変換処理の詳細は、図５を参
照して、以下に説明する。

【００２０】まず、ステップＳ５１では、ＲＯＭ５の領
域５２に格納された辞書にある単語辞書を検索参照し
て、入力された仮名漢字変換の対象となる文字列を解析
し、文節としての切り出しを行い、文節として認識され
る候補を抽出する。

【００２１】次にステップＳ５２では、ステップＳ５１
において出力された解析結果に対して、単語辞書中に格
納されている用例のパターンが存在するかどうかをチェ
ックし、用例のパターンが存在すれば、その用例の対象
となる同音語の候補を優先候補として抽出する。この用
例候補抽出処理の詳細は後で詳細に説明する。

【００２２】続いて、処理はステップＳ５３において、
ステップＳ５２で抽出された優先候補から、単語学習な
ども考慮に入れて、仮名漢字変換の第一候補を決定す
る。そして、ステップＳ５４では、その第１候補を出力
バッファ（不図示）に出力して仮名漢字変換の表示出力
の準備を行う。

【００２３】一方、その判別結果で、キー入力がカーソ
ル移動キーなどの文書編集で用いるキーなど（これを
“その他のキー”という）であった場合には処理はステ
ップＳ４５に進み、その押下キーに従う公知の技術に基
づいた処理を実行する。

【００２４】次に、ステップＳ４３、Ｓ４４、あるい
は、Ｓ４５の処理が終わると処理はステップＳ４６に進
み、上記の処理の結果をディスプレイに表示する。この
処理は文書中のデータ１文字１文字を順次読み込んでパ
ターンに展開し表示バッファに出力するという一般に広
く行われている処理なので、詳細な説明は省略する。

【００２５】［用例候補抽出処理の詳細］ここでは、図
５のステップＳ５２における用例候補抽出処理の詳細に
ついて、図７（ａ）に示す「はたをとってあげる」とい
う文字列が入力された場合を例に図６に示すフローチャ
ートを参照して説明する。また、その文字列はステップ
Ｓ５１における文節候補抽出において「はたを」と、
「とって」と、「あげる」との３つの文節に分割された
とする。

【００２６】まずステップＳ６１では、用例の抽出を行
うための対象となる文節が存在するかどうかを調べる。
ここで、処理対象の文節が存在すれば処理はステップＳ
６２に進み、対象文節がなくなれば処理を終了する。こ
こでは、「はたを」と、「とって」と、「あげる」の３
つの文節について順に処理を行う。

【００２７】次にステップＳ６２では、処理対象の文節
について同音語候補が存在するかどうかを調べる。ここ
で、同音語候補が存在すれば処理はステップＳ６３に進
み、同音語候補がなくなれば、処理はステップＳ６９に
進み、処理対象となる文節を次に進める。例えば、文節
「はたを」についての同音語候補が存在しないようにな
れば、処理を「とって」、次には、「あげる」に移す。

【００２８】ステップＳ６３以降、処理対象である文節
のすべての同音語候補に対して用例抽出処理を行う。い
ま、図７（ａ）に示す例文において、文節候補「あげ
る」について処理が行われているとし、「あげる」の同
音語候補として、図８（ａ）に示すように、『あげ
る』、『上げる』、『挙げる』、『揚げる』の４つが存
在するとする。

【００２９】ステップＳ６３では、対象となる同音語候
補について、その前後の文節とを組み合わせれば意味の
ある句或は文となる用例があるかどうかを辞書の用例情
報を参照してサーチし、続いて、ステップＳ６４ではそ
のサーチ結果として用例が存在するかどうかを調べる。
そして、用例が存在すれば処理はステップＳ６５に進
む。これに対して、用例が存在しないなら処理はステッ
プＳ６８に進み、別の同音語の候補を処理対象として取
り上げる。例えば、対象文節「あげる」についての同音
語候補の処理が、『あげる』に関して終了したなら、そ
の処理対象を『上げる』、『挙げる』、『揚げる』と順
次移していく。

【００３０】このことを、対象同音語候補が、文節候補
「あげる」に対応して同音語『揚げる』とした場合につ
いて説明する。このとき、図７（ｂ）に示すように、
『揚げる』の前にある文節である「はたを」と、「とっ
て」とは各々、『旗を』、『取って』が文節候補となっ
ているとする。この場合、用例情報のサーチは、『揚げ
る』と『旗を』『取って』との間で行われる。サーチの
結果、図８（ｂ）に示すように、用例「旗を揚げる」が
辞書の用例情報に存在するなら、対象同音語候補『揚げ
る』と相手同音語候補『旗を』との間で用例情報が存在
するとみなす。

【００３１】処理はステップＳ６５において、用例が存
在する同音語候補とその組み合わせとなる同音語候補と
の間に文節が割り込んでいるかどうか、即ち、用例が存
在する文節対は、飛び越し用例であるかどうかを調べ
る。ここで、飛び越しがない場合、処理はステップＳ６
７に進み、用例候補の登録（詳細は後述）を行う。これ
に対して、飛び越しがある場合は、処理はステップＳ６
６に進む。ステップＳ６６では、図２に示した辞書の用
例情報５２２にある飛び越し情報を参照して、飛び越し
が可能かどうかを調べる。ここで、飛び越しが可能なら
ば処理はステップＳ６７に進み、飛び越しが不可能なら
ば、用例候補の登録は行わずステップＳ６８に進む。

【００３２】ここで、ステップＳ６４〜Ｓ６６までの処
理を例文に基づいて説明する。

【００３３】図８（ｂ）に示すように用例「旗を揚げ
る」が辞書に存在している場合でも、図８（ａ）に示す
例文を考えると、対象同音語候補『揚げる』と、相手同
音語候補『旗を』との間には、文節『取って』が存在し
ている。従って、ステップＳ６５の処理では飛び越しが
存在していると判定され、処理はステップＳ６６に進み
用例情報の飛び越し情報（図２の５２３）が参照され
る。これによると、用例「旗を揚げる」は飛び越しは不
可能と判定される。この結果、処理はステップＳ６７
（用例候補の登録）をスキップし、処理はステップＳ６
８に進む。

【００３４】さて、ステップＳ６７では、用例が飛び越
しがあっても良い場合や飛び越しがない場合に、図３で
示される用例情報プールにその用例候補を登録する。一
方、例文においては、用例「旗を揚げる」は飛び越しが
ある場合には用例とはならないので、用例候補の登録は
行われない。

【００３５】このような処理によって最終的に、「はた
をとってあげる」という文字列は図７（ｃ）に示すよう
に「旗を取ってあげる」と変換されて表示される。

【００３６】以上の説明では、「はたをとってあげる」
という文字列を例として考えたが、「うでまえをかなり
あげる」という文字列が入力され「腕前を上げる」とい
う用例が存在する場合を図２の用例情報５２２を参照し
て考えてみる。この場合、「腕前を」と「上げる」は飛
び越し可能であるので、「腕前をかなり上げる」と正し
く用例を適用することができる。

【００３７】従って本実施例に従えば、用例の存在する
文節間に別の文節が割り込んでいるような文字列が入力
されたとしても、その割り込んだ文節を飛び越してその
用例を仮名漢字変換の変換候補として用いてよいかどう
かを判断して処理を実行することができる。

【００３８】なお本実施例において用いた辞書は単語情
報と用例情報を同一の見出し語の下に記述した構造をも
つ単一の辞書としたが本発明はこれに限定されるもので
はない。例えば、単語情報と用例情報とを分離した２つ
のテーブルからなる辞書を用いることもできる。

【００３９】尚、本発明は、複数の機器から構成される
システムに適用しても良いし、１つの機器から成る装置
に適用しても良い。また、本発明はシステム或は装置に
プログラムを供給することによって達成される場合にも
適用できることは言うまでもない。

【００４０】

【発明の効果】以上説明したように本発明によれば、入
力された文字列を文節に区切り、その区切られた文節に
関し、単語と別の単語を組み合わせた用例と、その用例
を構成する単語間に別の文節が割り込んでも、その用例
が用例として成り立つかどうかを考慮して、仮名漢字変
換の変換候補を抽出するので、多義性のある同音語につ
いてもより正確な仮名漢字変換を行うことができるとい
う効果がある。

【００４１】これによって、仮名漢字変換の効率が高ま
り、文書処理全体の処理速度の向上に資する。

【図面の簡単な説明】

【図１】本発明の代表的な実施例である文書処理装置の
構成を示すブロック図である。

【図２】ＲＯＭ５の領域５２に格納された仮名漢字変換
に用いる辞書の構成を示す図である。

【図３】同音語の各候補に適用される用例の情報を格納
する用例情報の集合体である用例情報プールの構成を示
す図である。

【図４】本実施例に従う文字処理の概要を示すフローチ
ャートである。

【図５】仮名漢字変換処理を示すフローチャートであ
る。

【図６】用例抽出処理を示すフローチャートである。

【図７】本実施例で用いた入力文字列とその変換結果を
示す図である。

【図８】本実施例で用いた同音語候補と用例候補を示す
図である。

【符号の説明】

１ＣＰＵ２ＲＡＭ３ディスプレイ４キーボード５ＲＯＭ６ハードディスク７ＣＰＵバス

Claims

【特許請求の範囲】

【請求項１】入力された仮名文字列を仮名漢字変換す
る文書処理装置であって、前記仮名文字列を入力する入力手段と、単語の読み、前記単語の表記、及び、前記単語に付随す
る情報を格納する第１記憶手段と、単語と前記単語とは別の単語を組み合わせた用例と、前
記用例を構成する単語間に別の文節が割り込んだ場合に
前記用例が用例として成立するかどうかの情報を格納す
る第２記憶手段と、前記入力手段によって入力された文字列を、前記第１記
憶手段に格納された情報を参照して１つ以上の文節に区
切る区切り手段と、前記区切り手段によって区切られた文節に関し、前記第
２記憶手段に格納された情報から仮名漢字変換の変換候
補を抽出する抽出手段と、前記抽出手段による抽出結果と、前記第１記憶手段に格
納された単語の表記とに基づいて、前記入力手段によっ
て入力された文字列を仮名漢字変換する変換手段とを有
することを特徴とする文書処理装置。
【請求項２】単語の読み、前記単語の表記、及び、前
記単語に付随する情報を格納する第１記憶媒体と、単語
と前記単語とは別の単語を組み合わせた用例と、前記用
例を構成する単語間に別の文節が割り込んだ場合に前記
用例が用例として成立するかどうかの情報を格納する第
２記憶媒体とを用いて、入力された仮名文字列を仮名漢
字変換する文書処理方法であって、前記仮名文字列を入力する入力工程と、前記入力工程によって入力された文字列を、前記第１記
憶媒体に格納された情報を参照して１つ以上の文節に区
切る区切り工程と、前記区切り工程によって区切られた文節に関し、前記第
２記憶媒体に格納された情報から仮名漢字変換の変換候
補を抽出する抽出工程と、前記抽出手段による抽出結果と、前記第１記憶媒体に格
納された単語の表記とに基づいて、前記入力工程によっ
て入力された文字列を仮名漢字変換する変換工程とを有
することを特徴とする文書処理方法。