JPH07160700A - 文書処理方法及びその装置 - Google Patents

文書処理方法及びその装置

Info

Publication number
JPH07160700A
JPH07160700A JP5310530A JP31053093A JPH07160700A JP H07160700 A JPH07160700 A JP H07160700A JP 5310530 A JP5310530 A JP 5310530A JP 31053093 A JP31053093 A JP 31053093A JP H07160700 A JPH07160700 A JP H07160700A
Authority
JP
Japan
Prior art keywords
word
kana
character string
input
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5310530A
Other languages
English (en)
Inventor
Hironori Fukuda
浩紀 福田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP5310530A priority Critical patent/JPH07160700A/ja
Publication of JPH07160700A publication Critical patent/JPH07160700A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 より正確な同音多義語の仮名漢字変換を行
う。 【構成】 文節に区切られた入力文字列の各文節に関し
て、同音語の候補がある場合に、その同音語の前後にあ
る単語を組み合わせて成立する用例が用例辞書にあるか
どうかをサーチする。そのような用例がある場合、さら
に、入力文字列ではその用例を構成する単語間に別の文
節が存在するかどうかを調べる。もし、別文節がサーチ
された用例に割り込んでいる場合には、用例情報522
の飛び越し情報523を参照して、別の文節が割り込ん
でいても、用例が用例として成立するかどうかを調べ
る。そして、その結果に従って、仮名漢字変換の変換候
補を決定する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は文書処理方法及びその装
置に関し、特に、文字の変換時における同音語多義判定
処理を行う文書処理方法及びその装置に関するものであ
る。
【0002】
【従来の技術】従来より、入力文字列の変換を行う文字
処理において、仮名漢字変換処理が広く普及している。
仮名漢字変換の結果、多数現れる同音語候補に対して、
個々の単語の品詞の持つ文法的特性などから同音語の多
義解消が行われてきたが、それだけでは対処できない場
合が多かった。そこで、意味的に互いに関係がある単語
と単語の組(すなわち用例)を格納した用例辞書を用
い、その辞書にある組み合わせを第一候補の決定に利用
して同音語の多義解消が行われてきた。
【0003】
【発明が解決しようとする課題】ところで用例には、慣
用句や人名のように用例の存在する単語対の間に文節が
割り込んだ場合、用例として成り立たなくなるようなも
のも存在する。しかしながら上記従来例では、例えば、
『目標を掲げて行動を始める』という意味の慣用句であ
る「旗を揚げる」という用例が存在するとき、「はたを
とってあげる。」と入力を行うと、「はたを」と、「あ
げる」に上記用例が適用され、入力文字列が「旗を取っ
て揚げる。」と変換されてしまい「旗を取ってあげる
(これが正しい変換)」とはならないという問題点があ
った。
【0004】また、仮名漢字変換処理において、用例の
飛び越しが発生した場合、人間が見れば明らかに用例が
適用されてはいけないにもかかわらず、用例が適用され
た変換候補が作成されてしまうことがある。これは結果
として、文書処理全体における処理速度の低下を引き起
こしてしまい、改善が望まれていた。
【0005】本発明は上記従来例に鑑みてなされたもの
であり、より正確な同音語多義判定処理を行うことがで
きる文書処理方法及びその装置を提供することを目的と
している。
【0006】
【課題を解決するための手段】上記目的を達成するため
に本発明の文書処理装置は、以下のような構成からな
る。即ち、入力された仮名文字列を仮名漢字変換する文
書処理装置であって、前記仮名文字列を入力する入力手
段と、単語の読み、前記単語の表記、及び、前記単語に
付随する情報を格納する第1記憶手段と、単語と前記単
語とは別の単語を組み合わせた用例と、前記用例を構成
する単語間に別の文節が割り込んだ場合に前記用例が用
例として成立するかどうかの情報を格納する第2記憶手
段と、前記入力手段によって入力された文字列を、前記
第1記憶手段に格納された情報を参照して1つ以上の文
節に区切る区切り手段と、前記区切り手段によって区切
られた文節に関し、前記第2記憶手段に格納された情報
から仮名漢字変換の変換候補を抽出する抽出手段と、前
記抽出手段による抽出結果と、前記第1記憶手段に格納
された単語の表記とに基づいて、前記入力手段によって
入力された文字列を仮名漢字変換する変換手段とを有す
ることを特徴とする文書処理装置を備える。
【0007】また他の発明によれば、単語の読み、前記
単語の表記、及び、前記単語に付随する情報を格納する
第1記憶媒体と、単語と前記単語とは別の単語を組み合
わせた用例と、前記用例を構成する単語間に別の文節が
割り込んだ場合に前記用例が用例として成立するかどう
かの情報を格納する第2記憶媒体とを用いて、入力され
た仮名文字列を仮名漢字変換する文書処理方法であっ
て、前記仮名文字列を入力する入力工程と、前記入力工
程によって入力された文字列を、前記第1記憶媒体に格
納された情報を参照して1つ以上の文節に区切る区切り
工程と、前記区切り工程によって区切られた文節に関
し、前記第2記憶媒体に格納された情報から仮名漢字変
換の変換候補を抽出する抽出工程と、前記抽出手段によ
る抽出結果と、前記第1記憶媒体に格納された単語の表
記とに基づいて、前記入力工程によって入力された文字
列を仮名漢字変換する変換工程とを有することを特徴と
する文書処理方法を備える。
【0008】
【作用】以上の構成により本発明は、入力された文字列
を文節に区切り、その区切られた文節に関し、単語と別
の単語を組み合わせた用例と、その用例を構成する単語
間に別の文節が割り込んでも、その用例が用例として成
り立つかどうかを考慮して、仮名漢字変換の変換候補を
抽出するよう動作する。
【0009】
【実施例】以下添付図面を参照して本発明の好適な実施
例を詳細に説明する。
【0010】[装置構成の説明]図1は本発明の代表的
な実施例である文書処理装置の構成を示すブロック図で
ある。図1において、1は装置全体の制御や仮名漢字変
換等の文書処理を実行するCPU、2はCPU1が各種
情報の一時保存領域や各処理を行う作業領域として用い
るRAM、3は入力読み文字列や仮名漢字変換された漢
字仮名交じり文を表示するディスプレイ(DISP)、
4は各種のキー情報を入力するキーボードであり、41
は文書情報作成・編集のための入力キー、42は通常の
文字キーや仮名漢字変換の変換キー等である。
【0011】また、5は各種固定情報を格納するROM
であり、ROM5の領域51にはCPU1が実行する仮
名漢字変換の処理プログラムを、領域52には仮名漢字
変換で用いられる単語辞書や、用例適用処理で使用する
用例辞書を格納している。6は処理された文書データを
格納するハードディスク、7は各装置構成要素を互いに
接続するCPUバスである。
【0012】図2はROM5の領域52に格納された仮
名漢字変換に用いる辞書の構成を示す図である。この辞
書は、表記変換に用いる単語情報521と、表記変換の
際の第1の候補を決定するための用例情報522とで構
成されている。単語情報521は、その見出し語である
“読み部”、および単語の表記を格納する“表記”、単
語の品詞を格納する“品詞”等の情報から構成されてい
る。一方、用例情報522は、その見出し単語の持つ用
例情報の“個数”、その用例の読みを格納した“読み
部”、その用例の表記を格納した“表記部”、及び、用
例を構成する単語対の間に他の文節が割り込んでも用例
が成り立つかどうか、つまり、飛び越し用例が可能かど
うかの情報を格納した“飛び越し情報”等から構成され
ている。
【0013】図3は、同音語の各候補に適用される用例
の情報を格納する用例情報の集合体である用例情報プー
ルの構成を示す図である。図3(a)は用例情報プール
の全体構成を示し、これは複数の用例情報から構成され
る。図3(b)は各用例情報の構成を示した図である。
各用例情報は用例の相手となる同音語のIDを格納する
“ペア同音語ID”、適用されている用例のIDを格納
する“用例ID”、同じ同音語候補に適用されている別
の用例情報へのポインタが格納されている“用例情報ポ
インタ”等から構成されている。この用例情報プールに
は、新たに用例を追加登録することができる。
【0014】[仮名漢字変換処理]次に、以上の構成の
装置が実行する仮名漢字変換処理について、図4〜図6
に示すフローチャートと、図7に示す例文と、図8に示
す図7の例文に関する同音語情報および用例情報を参照
して説明する。
【0015】図4は本実施例に従う文字処理の概要を示
すフローチャート、図5は仮名漢字変換処理を示すフロ
ーチャート、そして、図6は用例抽出処理を示すフロー
チャートである。
【0016】まずステップS41において、本実施例の
装置はキー入力待ちとなっている。そして、キーボード
4よりキーが押下され、割り込みが発生すると、処理は
ステップS42に進み、押下されたキーがどのような種
類のキーであるかを判別し、その判別結果に従って、処
理はステップS43、ステップS44、ステップS45
のいずれかのステップに進むか、あるいは、処理を終了
する。
【0017】その判別結果で、キー入力が読みの入力で
あった場合には処理はステップS43に進み、その読み
の文字列を装置に入力する。
【0018】また、その判別結果で、キー入力が変換キ
ーの押下であった場合には処理はステップS44に進
み、ステップS43で入力された仮名漢字変換の対象と
なる文字列を漢字に変換し出力する。この漢字への変換
の際に、ROM5の領域52に格納された辞書に存在す
る用例情報を用いて、同音語の第一候補を決定する。
【0019】この仮名漢字変換処理の詳細は、図5を参
照して、以下に説明する。
【0020】まず、ステップS51では、ROM5の領
域52に格納された辞書にある単語辞書を検索参照し
て、入力された仮名漢字変換の対象となる文字列を解析
し、文節としての切り出しを行い、文節として認識され
る候補を抽出する。
【0021】次にステップS52では、ステップS51
において出力された解析結果に対して、単語辞書中に格
納されている用例のパターンが存在するかどうかをチェ
ックし、用例のパターンが存在すれば、その用例の対象
となる同音語の候補を優先候補として抽出する。この用
例候補抽出処理の詳細は後で詳細に説明する。
【0022】続いて、処理はステップS53において、
ステップS52で抽出された優先候補から、単語学習な
ども考慮に入れて、仮名漢字変換の第一候補を決定す
る。そして、ステップS54では、その第1候補を出力
バッファ(不図示)に出力して仮名漢字変換の表示出力
の準備を行う。
【0023】一方、その判別結果で、キー入力がカーソ
ル移動キーなどの文書編集で用いるキーなど(これを
“その他のキー”という)であった場合には処理はステ
ップS45に進み、その押下キーに従う公知の技術に基
づいた処理を実行する。
【0024】次に、ステップS43、S44、あるい
は、S45の処理が終わると処理はステップS46に進
み、上記の処理の結果をディスプレイに表示する。この
処理は文書中のデータ1文字1文字を順次読み込んでパ
ターンに展開し表示バッファに出力するという一般に広
く行われている処理なので、詳細な説明は省略する。
【0025】[用例候補抽出処理の詳細]ここでは、図
5のステップS52における用例候補抽出処理の詳細に
ついて、図7(a)に示す「はたをとってあげる」とい
う文字列が入力された場合を例に図6に示すフローチャ
ートを参照して説明する。また、その文字列はステップ
S51における文節候補抽出において「はたを」と、
「とって」と、「あげる」との3つの文節に分割された
とする。
【0026】まずステップS61では、用例の抽出を行
うための対象となる文節が存在するかどうかを調べる。
ここで、処理対象の文節が存在すれば処理はステップS
62に進み、対象文節がなくなれば処理を終了する。こ
こでは、「はたを」と、「とって」と、「あげる」の3
つの文節について順に処理を行う。
【0027】次にステップS62では、処理対象の文節
について同音語候補が存在するかどうかを調べる。ここ
で、同音語候補が存在すれば処理はステップS63に進
み、同音語候補がなくなれば、処理はステップS69に
進み、処理対象となる文節を次に進める。例えば、文節
「はたを」についての同音語候補が存在しないようにな
れば、処理を「とって」、次には、「あげる」に移す。
【0028】ステップS63以降、処理対象である文節
のすべての同音語候補に対して用例抽出処理を行う。い
ま、図7(a)に示す例文において、文節候補「あげ
る」について処理が行われているとし、「あげる」の同
音語候補として、図8(a)に示すように、『あげ
る』、『上げる』、『挙げる』、『揚げる』の4つが存
在するとする。
【0029】ステップS63では、対象となる同音語候
補について、その前後の文節とを組み合わせれば意味の
ある句或は文となる用例があるかどうかを辞書の用例情
報を参照してサーチし、続いて、ステップS64ではそ
のサーチ結果として用例が存在するかどうかを調べる。
そして、用例が存在すれば処理はステップS65に進
む。これに対して、用例が存在しないなら処理はステッ
プS68に進み、別の同音語の候補を処理対象として取
り上げる。例えば、対象文節「あげる」についての同音
語候補の処理が、『あげる』に関して終了したなら、そ
の処理対象を『上げる』、『挙げる』、『揚げる』と順
次移していく。
【0030】このことを、対象同音語候補が、文節候補
「あげる」に対応して同音語『揚げる』とした場合につ
いて説明する。このとき、図7(b)に示すように、
『揚げる』の前にある文節である「はたを」と、「とっ
て」とは各々、『旗を』、『取って』が文節候補となっ
ているとする。この場合、用例情報のサーチは、『揚げ
る』と『旗を』『取って』との間で行われる。サーチの
結果、図8(b)に示すように、用例「旗を揚げる」が
辞書の用例情報に存在するなら、対象同音語候補『揚げ
る』と相手同音語候補『旗を』との間で用例情報が存在
するとみなす。
【0031】処理はステップS65において、用例が存
在する同音語候補とその組み合わせとなる同音語候補と
の間に文節が割り込んでいるかどうか、即ち、用例が存
在する文節対は、飛び越し用例であるかどうかを調べ
る。ここで、飛び越しがない場合、処理はステップS6
7に進み、用例候補の登録(詳細は後述)を行う。これ
に対して、飛び越しがある場合は、処理はステップS6
6に進む。ステップS66では、図2に示した辞書の用
例情報522にある飛び越し情報を参照して、飛び越し
が可能かどうかを調べる。ここで、飛び越しが可能なら
ば処理はステップS67に進み、飛び越しが不可能なら
ば、用例候補の登録は行わずステップS68に進む。
【0032】ここで、ステップS64〜S66までの処
理を例文に基づいて説明する。
【0033】図8(b)に示すように用例「旗を揚げ
る」が辞書に存在している場合でも、図8(a)に示す
例文を考えると、対象同音語候補『揚げる』と、相手同
音語候補『旗を』との間には、文節『取って』が存在し
ている。従って、ステップS65の処理では飛び越しが
存在していると判定され、処理はステップS66に進み
用例情報の飛び越し情報(図2の523)が参照され
る。これによると、用例「旗を揚げる」は飛び越しは不
可能と判定される。この結果、処理はステップS67
(用例候補の登録)をスキップし、処理はステップS6
8に進む。
【0034】さて、ステップS67では、用例が飛び越
しがあっても良い場合や飛び越しがない場合に、図3で
示される用例情報プールにその用例候補を登録する。一
方、例文においては、用例「旗を揚げる」は飛び越しが
ある場合には用例とはならないので、用例候補の登録は
行われない。
【0035】このような処理によって最終的に、「はた
をとってあげる」という文字列は図7(c)に示すよう
に「旗を取ってあげる」と変換されて表示される。
【0036】以上の説明では、「はたをとってあげる」
という文字列を例として考えたが、「うでまえをかなり
あげる」という文字列が入力され「腕前を上げる」とい
う用例が存在する場合を図2の用例情報522を参照し
て考えてみる。この場合、「腕前を」と「上げる」は飛
び越し可能であるので、「腕前をかなり上げる」と正し
く用例を適用することができる。
【0037】従って本実施例に従えば、用例の存在する
文節間に別の文節が割り込んでいるような文字列が入力
されたとしても、その割り込んだ文節を飛び越してその
用例を仮名漢字変換の変換候補として用いてよいかどう
かを判断して処理を実行することができる。
【0038】なお本実施例において用いた辞書は単語情
報と用例情報を同一の見出し語の下に記述した構造をも
つ単一の辞書としたが本発明はこれに限定されるもので
はない。例えば、単語情報と用例情報とを分離した2つ
のテーブルからなる辞書を用いることもできる。
【0039】尚、本発明は、複数の機器から構成される
システムに適用しても良いし、1つの機器から成る装置
に適用しても良い。また、本発明はシステム或は装置に
プログラムを供給することによって達成される場合にも
適用できることは言うまでもない。
【0040】
【発明の効果】以上説明したように本発明によれば、入
力された文字列を文節に区切り、その区切られた文節に
関し、単語と別の単語を組み合わせた用例と、その用例
を構成する単語間に別の文節が割り込んでも、その用例
が用例として成り立つかどうかを考慮して、仮名漢字変
換の変換候補を抽出するので、多義性のある同音語につ
いてもより正確な仮名漢字変換を行うことができるとい
う効果がある。
【0041】これによって、仮名漢字変換の効率が高ま
り、文書処理全体の処理速度の向上に資する。
【図面の簡単な説明】
【図1】本発明の代表的な実施例である文書処理装置の
構成を示すブロック図である。
【図2】ROM5の領域52に格納された仮名漢字変換
に用いる辞書の構成を示す図である。
【図3】同音語の各候補に適用される用例の情報を格納
する用例情報の集合体である用例情報プールの構成を示
す図である。
【図4】本実施例に従う文字処理の概要を示すフローチ
ャートである。
【図5】仮名漢字変換処理を示すフローチャートであ
る。
【図6】用例抽出処理を示すフローチャートである。
【図7】本実施例で用いた入力文字列とその変換結果を
示す図である。
【図8】本実施例で用いた同音語候補と用例候補を示す
図である。
【符号の説明】
1 CPU 2 RAM 3 ディスプレイ 4 キーボード 5 ROM 6 ハードディスク 7 CPUバス

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 入力された仮名文字列を仮名漢字変換す
    る文書処理装置であって、 前記仮名文字列を入力する入力手段と、 単語の読み、前記単語の表記、及び、前記単語に付随す
    る情報を格納する第1記憶手段と、 単語と前記単語とは別の単語を組み合わせた用例と、前
    記用例を構成する単語間に別の文節が割り込んだ場合に
    前記用例が用例として成立するかどうかの情報を格納す
    る第2記憶手段と、 前記入力手段によって入力された文字列を、前記第1記
    憶手段に格納された情報を参照して1つ以上の文節に区
    切る区切り手段と、 前記区切り手段によって区切られた文節に関し、前記第
    2記憶手段に格納された情報から仮名漢字変換の変換候
    補を抽出する抽出手段と、 前記抽出手段による抽出結果と、前記第1記憶手段に格
    納された単語の表記とに基づいて、前記入力手段によっ
    て入力された文字列を仮名漢字変換する変換手段とを有
    することを特徴とする文書処理装置。
  2. 【請求項2】 単語の読み、前記単語の表記、及び、前
    記単語に付随する情報を格納する第1記憶媒体と、単語
    と前記単語とは別の単語を組み合わせた用例と、前記用
    例を構成する単語間に別の文節が割り込んだ場合に前記
    用例が用例として成立するかどうかの情報を格納する第
    2記憶媒体とを用いて、入力された仮名文字列を仮名漢
    字変換する文書処理方法であって、 前記仮名文字列を入力する入力工程と、 前記入力工程によって入力された文字列を、前記第1記
    憶媒体に格納された情報を参照して1つ以上の文節に区
    切る区切り工程と、 前記区切り工程によって区切られた文節に関し、前記第
    2記憶媒体に格納された情報から仮名漢字変換の変換候
    補を抽出する抽出工程と、 前記抽出手段による抽出結果と、前記第1記憶媒体に格
    納された単語の表記とに基づいて、前記入力工程によっ
    て入力された文字列を仮名漢字変換する変換工程とを有
    することを特徴とする文書処理方法。
JP5310530A 1993-12-10 1993-12-10 文書処理方法及びその装置 Pending JPH07160700A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5310530A JPH07160700A (ja) 1993-12-10 1993-12-10 文書処理方法及びその装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5310530A JPH07160700A (ja) 1993-12-10 1993-12-10 文書処理方法及びその装置

Publications (1)

Publication Number Publication Date
JPH07160700A true JPH07160700A (ja) 1995-06-23

Family

ID=18006349

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5310530A Pending JPH07160700A (ja) 1993-12-10 1993-12-10 文書処理方法及びその装置

Country Status (1)

Country Link
JP (1) JPH07160700A (ja)

Similar Documents

Publication Publication Date Title
JPH0433069B2 (ja)
JP3992348B2 (ja) 形態素解析方法および装置、並びに日本語形態素解析方法および装置
JPH11238051A (ja) 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体
JPH07271774A (ja) 文章入力装置
JPH07160700A (ja) 文書処理方法及びその装置
JPS61166676A (ja) 文字処理装置における辞書作成方式
JP2967275B2 (ja) 仮名漢字変換装置
JPH0380363A (ja) 文書処理装置
JP2537991B2 (ja) 文字入力装置および方法
JPH09274613A (ja) 文字列予測方法及びこの文字列予測方法を用いた文書作成装置
JP2634596B2 (ja) かな漢字変換装置
JP3949245B2 (ja) 文字処理装置および文節位置変更方法
JPH0610804B2 (ja) かな漢字変換装置
JPH0766380B2 (ja) かな漢字変換装置
JPH08147282A (ja) 仮名漢字変換装置および仮名漢字変換方法
JPH02250148A (ja) 文字処理装置
JPH01114973A (ja) 文書作成・校正支援装置
JPH0981555A (ja) 文書処理装置及びその方法
JPH0567074A (ja) かな漢字変換装置
JPH08241315A (ja) 文書処理装置の単語登録機構
JPH0727526B2 (ja) かな漢字変換装置
JPH0546612A (ja) 文章誤り検出装置
JPS61169961A (ja) ユ−ザ辞書を備えた文字処理装置
JPH02250145A (ja) 文字処理装置
JPS61239357A (ja) 電子機器