JPH04218863A - 仮名漢字変換方式 - Google Patents

仮名漢字変換方式

Info

Publication number
JPH04218863A
JPH04218863A JP2403725A JP40372590A JPH04218863A JP H04218863 A JPH04218863 A JP H04218863A JP 2403725 A JP2403725 A JP 2403725A JP 40372590 A JP40372590 A JP 40372590A JP H04218863 A JPH04218863 A JP H04218863A
Authority
JP
Japan
Prior art keywords
word
conversion
words
character string
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2403725A
Other languages
English (en)
Inventor
Shinichi Takaike
新一 高池
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2403725A priority Critical patent/JPH04218863A/ja
Publication of JPH04218863A publication Critical patent/JPH04218863A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、日本語文書作成装置に
おいて、単語の区切りが指定されていない文字列を少な
くとも1つの単語に変換する仮名漢字変換方式に関する
ものである。
【0002】
【従来の技術】まず、日本語文書作成装置(以下、ワー
ドプロセッサと称する)に用いられている従来の複数文
節仮名漢字変換方式について説明する。文字列の入力に
応じて、ワードプロセッサの処理部は、この文字列の中
に含まれる単語を検出する。このとき、処理部は、上述
した文字列を様々な位置で区切り、辞書を参照して、上
述した文字列に含まれている可能性のある単語を全て検
出する。
【0003】次に、処理部は、得られた単語を順に並べ
て変換結果の候補(以下、変換候補と称する)を作成す
る。ここで、単語を検出した際に、文字列の区切り位置
の違いに応じて、複数組の単語の組合せが検出された場
合は、これらの単語の組合せのそれぞれを組み合わせて
変換候補を作成する。このようにして得られた変換候補
それぞれについて、処理部は、変換候補に含まれる単語
の品詞をそれぞれ分析し、品詞の連結順に関する一般的
な法則を考慮して、最も確からしい変換候補を選択する
【0004】
【発明が解決しようとする課題】ところで、入力文字列
が複数の文節に対応している場合には、様々な区切り位
置の組合せが考えられるため、利用者が意図していない
単語が検出される場合がある。特に、大きな辞書は、豊
富な語彙を格納しているので、上述した様々な区切り位
置それぞれに対応して、辞書から該当する単語が検索さ
れ、これらの単語を組み合わせて多数の変換候補が作成
されるので、結果として、利用者の意図しない単語を含
んだ変換候補が変換結果とされる場合が多かった。
【0005】例えば、辞書が使用頻度の低い単語『迂生
』も格納している場合には、文字列『ぜんかのうせいを
こうりょし』を3つの文節『ぜんかの』,『うせいを』
,『こうりょし』のように区切った場合にも、各文節に
対応する単語が検出され、これらを連結した変換候補『
全科の迂生を考慮し』が、変換候補『全可能性を考慮し
』とともに得られてしまう。この場合は、上述した一般
的な法則により、変換候補『全可能性を考慮し』よりも
『全科の迂生を考慮し』の方が、より確からしい単語の
連結であるとされるので、変換候補『全科の迂生を考慮
し』が変換結果として選択され、変換ミスを起こしてし
まう。
【0006】このように、ヒット率の向上をねらって語
彙の豊富な辞書を導入したことが、却ってヒット率の低
下を招いてしまう場合があった。本発明は、単語の出現
頻度を考慮して複数文節変換結果を得る仮名漢字変換方
式を提供することを目的とする。
【0007】
【課題を解決するための手段】図1は、本発明の原理ブ
ロック図である。請求項1の発明は、単語の読みに対応
して、該当する漢字とこの単語の出現頻度に関する頻度
情報を格納する辞書101と、入力された文字列を分割
して得られる少なくとも1つの文節それぞれに対応する
単語を辞書101から検出する単語検出手段111と、
文字列が複数の文節に分割された場合に、頻度情報に基
づいて、単語検出手段111によって検出された単語の
取捨選択を行う選択手段121と、選択手段121によ
って選択された単語を組み合わせて変換結果を作成する
変換結果作成手段131と、変換結果を出力する出力手
段141とを備えたことを特徴とする。
【0008】請求項2の発明は、請求項1記載の仮名漢
字変換方式において、単語が使用された旨の情報に応じ
て、該当する単語に対応する頻度情報を変更する変更手
段151を備えたことを特徴とする。
【0009】
【作用】請求項1の発明は、入力された文字列が複数の
文節に分割されたときに、辞書101に格納された頻度
情報に基づいて、選択手段121が、単語検出手段11
1によって検出された単語の取捨選択を行い、選択され
た単語を変換結果作成手段131によって組み合わせる
。従って、単語の出現頻度を考慮して、変換結果を得る
ことができ、得られた変換結果が出力手段141によっ
て出力される。
【0010】請求項2の発明は、変更手段151が、利
用者によって使用された単語の頻度情報を変更すること
により、利用者の単語使用傾向を学習することができる
【0011】
【実施例】以下、図面に基づいて本発明の実施例につい
て詳細に説明する。図2は、本発明の仮名漢字変換方式
を適用したワードプロセッサの実施例構成を示す。図2
において、ワードプロセッサは、処理部210と、辞書
202と、キーボード204と、CRTディスプレイ(
以下、CRTと称する)205とを備えて構成されてい
る。
【0012】このワードプロセッサは、利用者によって
、キーボード204を介して入力された文字列を処理部
210に入力し、この処理部210が入力文字列を少な
くとも1つの単語に変換して、CRT205によって表
示する構成となっている。上述した処理部210は、中
央処理装置(以下、CPUと称する)211とメモリ2
12とから構成されており、CPU211は、メモリ2
12に格納されている仮名漢字変換プログラム220に
従って動作し、辞書202を参照しながら変換処理を行
う構成となっている。
【0013】この仮名漢字変換プログラム220は、単
語検出部221と、単語選択部222と、候補作成部2
23と、候補選択部224と、学習処理部225とから
構成されている。上述した単語検出部221,単語選択
部222,学習処理部225は、CPU211がこれら
の各部に従って動作することにより、単語検出手段11
1,選択手段121,変更手段151の各手段の機能を
それぞれ実現する構成となっている。また、候補作成部
223および候補選択部224は、CPU211がこれ
らの各部に従って動作することにより、変換結果作成手
段131の機能を実現する構成となっている。
【0014】また、辞書202は、表1に示すように、
単語の読みに対応して、該当する漢字とこの単語の一般
の文章における出現頻度を示す頻度フラグを格納してい
る。この頻度フラグは、該当する単語が平均的な頻度で
出現する場合に論理“0”となり、該当する単語の出現
頻度が低い場合に論理“1”となっている。
【0015】
【表1】
【0016】以下、処理部210が、各単語の出現頻度
を考慮して、仮名漢字変換を行う方法について説明する
。図3は、仮名漢字変換動作を表す流れ図である。まず
、CPU211は、単語検出部221に従って動作し、
入力された文字列を様々な位置で区切って得られる部分
列それぞれについて、辞書202から該当する単語を検
索する(ステップ301)。このとき、CPU211は
、該当する単語とともに対応する頻度フラグも辞書20
2から読み取って、得られた単語それぞれに対応して記
憶しておく。
【0017】このようにして、様々な区切り位置の組合
せに対応して、入力された文字列に含まれている可能性
のある単語の組合せが検出されるとともに、検出された
各単語の出現頻度に関する情報として、各単語に対応す
る頻度フラグが得られる。次に、CPU211は、単語
選択部222に従って動作し、上述したステップ301
で得られた各単語について、以下のステップ302〜ス
テップ305の処理を行う。
【0018】まず、CPU211は、各単語が入力文字
列を複数の文節に区切って得られた単語であるか否かを
判定する(ステップ302)。このステップ302にお
ける肯定判定の場合に、CPU211は、この単語に対
応する頻度フラグに基づいて、該当する単語の出現頻度
が低いか否かを判定し(ステップ303)、肯定判定の
場合に、該当する単語を検出結果から削除する(ステッ
プ304)。このとき、CPU211は、該当する単語
を検出した際の区切り位置を無効とし、この区切り位置
を含む区切り位置の組合せに応じて検出された単語を全
て削除する。一方、ステップ303における否定判定の
場合は、単語の削除は行わない。
【0019】このように、入力文字列を複数の文節に区
切った場合は、各単語の出現頻度が調べられ、頻度フラ
グによって平均的な頻度で現れるとされた単語の組合せ
のみが、入力文字列に含まれている可能性のある単語と
して出力される。例えば、入力文字列『ぜんかのうせい
を』に応じて、ステップ301においては、単語『全』
と単語『可能性』との組合せとともに、単語『全科』と
単語『迂生』との組合せが検索される。表1に示したよ
うに、単語『迂生』に対応する頻度フラグは論理“1”
であるので、この単語『迂生』を含む単語の組合せは、
検出結果から削除される。
【0020】一方、入力文字列に対応する1つの単語が
検索された場合は、ステップ302における否定判定と
なり、上述したステップ303,304を行わないので
、該当する単語の頻度フラグにかかわらず、入力文字列
に含まれている単語として出力される。上述したステッ
プ301で得られた全単語について、上述したステップ
302〜ステップ304の処理を終了したときに、ステ
ップ305における肯定判定となり、CPU211は単
語選択処理を終了する。
【0021】次に、CPU211は、候補作成部223
に従って、上述した単語選択処理で得られた単語を連結
して変換候補を作成する(ステップ306)。その後、
候補選択部224に従って、上述した変換候補を構成す
る単語の品詞をそれぞれ分析し、得られた品詞の連結順
序に基づいて、従来と同様に最も確からしい変換候補を
選択して(ステップ307)、変換結果としてCRT2
05に出力する。
【0022】上述したようにして、入力文字列が複数の
文節に区切られた場合に、頻度フラグによって、平均的
な頻度で出現するとされた単語のみからなる変換結果を
得ることができる。このようにして得られた変換結果が
、CRT205によって表示されると、利用者により、
表示された変換結果と利用者が意図したものとが一致し
た(ヒットした)か否かが判定され、このヒット判定結
果がキーボード204を介して入力される。
【0023】このヒット判定結果に応じて、CPU21
1は、学習処理部225に従って、以下に述べる学習動
作を行う。利用者によって変換結果がミスであるとされ
た場合は、ステップ308における否定判定となり、C
PU211は、利用者の指示に応じて変換結果の訂正を
行って変換結果を確定する(ステップ309)。また、
CPU211は、この確定された変換結果に基づいて、
同音意義語の優先順位に関する学習および文節の区切り
位置に関する学習を行った後(ステップ310)、ステ
ップ311以下の処理を行う。一方、変換結果がヒット
したとされた場合は、ステップ308における肯定判定
となる。この場合は、CPU211は、上述したステッ
プ309,310を行わないで、変換結果を確定し、ス
テップ311以下の処理を行う。
【0024】ステップ311において、CPU211は
、辞書202を参照し、確定された変換結果に含まれて
いる単語それぞれに対応する頻度フラグに基づいて、各
単語の出現頻度が低いか否かを判定する。このステップ
311における肯定判定の場合に、CPU211は辞書
202の該当する頻度フラグをクリアして論理“0”と
し(ステップ312)、処理を終了する。従って、以後
は、該当する単語は通常の頻度で出現する単語として扱
われる。一方、ステップ311における否定判定の場合
は、そのまま処理を終了する。
【0025】上述したように、複数文節変換の場合に、
頻度フラグに応じて単語を取捨選択することにより、単
語の出現頻度を考慮して、通常の出現頻度とされた単語
のみからなる変換結果を得ることが可能となる。ここで
、単語を途中で区切って偶然に現れた読みに対応して、
辞書202から検索される単語は、通常は用いられない
単語であることが多いので、文字列に含まれているとさ
れた単語から出現頻度の低い単語を排除することにより
、変換ミスを防ぎ、文書作成作業の効率を向上すること
ができる。
【0026】また、利用者によるヒット判定結果に応じ
て、該当する単語の頻度フラグを操作することにより、
利用者の単語使用傾向を学習することが可能となる。例
えば、確定した変換結果に単語『迂生』が含まれていれ
ば、この単語に対応する頻度フラグがクリアされ、以後
は、通常の単語として扱われる。これにより、利用者の
単語使用傾向に応じて、出現頻度の低い単語を含んだ変
換結果を得ることができ、ヒット率の向上を図ることが
できる。
【0027】なお、単語検出部221において、辞書2
02から1つの単語を検索するごとに、単語選択部22
2において、単語の取捨選択処理を行う構成としてもよ
い。この場合は、単語選択部222において、検索され
た単語が捨てられたときに、CPU211は、単語検出
部221に従って、別の区切り位置についての単語の検
出を行えばよい。
【0028】また、上述したステップ304において、
該当する単語を検出結果から削除する代わりに、この単
語を含む変換候補の優先順位を低くする構成としてもよ
い。この場合は、候補選択部224において、様々な品
詞の連結順序を示す連結パターンそれぞれの優先順位を
変更可能とし、単語選択部222における判定結果に応
じて、CPU211がこの優先順位を変更すればよい。
【0029】
【発明の効果】以上説明したように本発明は、複数文節
変換において、選択手段が出現頻度の低い単語を排除し
て、出現頻度の低い単語を含まない変換結果を得ること
を可能とすることにより、辞書が低頻度の単語を含んで
いることによる変換ミスを防ぐことができ、文書作成作
業の効率を向上することができる。
【0030】また、出現頻度の低い単語が使用された場
合には、変更手段により、対応する頻度情報が変更され
るので、以後は、この単語が選択手段によって排除され
ることはなく、出現頻度の低い単語を含んだ変換結果が
得られる。このようにして、利用者の単語使用傾向を学
習することにより、ヒット率を更に向上することができ
る。
【図面の簡単な説明】
【図1】本発明の原理ブロック図である。
【図2】本発明の仮名漢字変換方式を適用したワードプ
ロセッサの実施例構成図である。
【図3】仮名漢字変換動作を表す流れ図である。
【符号の説明】
101  辞書 111  単語検出手段 121  選択手段 131  変換結果作成手段 141  出力手段 151  変更手段 202  辞書 204  キーボード 205  CRTディスプレイ(CRT)210  処
理部 211  中央処理装置(CPU) 212  メモリ 220  仮名漢字変換プログラム 221  単語検出部 222  単語選択部 223  候補作成部 224  候補選択部 225  学習処理部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】  単語の読みに対応して、該当する漢字
    とこの単語の出現頻度に関する頻度情報を格納する辞書
    (101)と、入力された文字列を分割して得られる少
    なくとも1つの文節それぞれに対応する単語を前記辞書
    (101)から検出する単語検出手段(111)と、前
    記文字列が複数の文節に分割された場合に、前記頻度情
    報に基づいて、前記単語検出手段(111)によって検
    出された単語の取捨選択を行う選択手段(121)と、
    前記選択手段(121)によって選択された単語を組み
    合わせて変換結果を作成する変換結果作成手段(131
    )と、前記変換結果を出力する出力手段(141)とを
    備えたことを特徴とする仮名漢字変換方式。
  2. 【請求項2】  請求項1記載の仮名漢字変換方式にお
    いて、単語が使用された旨の情報に応じて、該当する単
    語に対応する頻度情報を変更する変更手段(151)を
    備えたことを特徴とする仮名漢字変換方式。
JP2403725A 1990-12-19 1990-12-19 仮名漢字変換方式 Pending JPH04218863A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2403725A JPH04218863A (ja) 1990-12-19 1990-12-19 仮名漢字変換方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2403725A JPH04218863A (ja) 1990-12-19 1990-12-19 仮名漢字変換方式

Publications (1)

Publication Number Publication Date
JPH04218863A true JPH04218863A (ja) 1992-08-10

Family

ID=18513456

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2403725A Pending JPH04218863A (ja) 1990-12-19 1990-12-19 仮名漢字変換方式

Country Status (1)

Country Link
JP (1) JPH04218863A (ja)

Similar Documents

Publication Publication Date Title
JPH04218863A (ja) 仮名漢字変換方式
JPS628259A (ja) かな漢字変換方式
JP3814000B2 (ja) 文字列変換装置および文字列変換方法
JPH08272780A (ja) 中国語入力処理装置及び中国語入力処理方法及び言語処理装置及び言語処理方法
JP2001109740A (ja) 中国語文書作成装置及び中国語文書作成方法
JPH0350668A (ja) 文字処理装置
JPH1097538A (ja) 機械翻訳装置
JP3273778B2 (ja) 仮名漢字変換装置及び仮名漢字変換方法
JPS60189573A (ja) 文字変換装置
JPS5998236A (ja) 日本文入力装置
JPH08241315A (ja) 文書処理装置の単語登録機構
JPS60207948A (ja) カナ漢字変換処理装置
JPS6172360A (ja) べた書きかな漢字変換方式
JPH0683807A (ja) 文書作成装置
JPH01118961A (ja) 翻訳装置
JPH0468466A (ja) かな漢字変換装置
JPH0610804B2 (ja) かな漢字変換装置
JPH08147282A (ja) 仮名漢字変換装置および仮名漢字変換方法
JPH0546612A (ja) 文章誤り検出装置
JPH0619771B2 (ja) 文字処理装置
JPH096762A (ja) 中国語用漢字変換装置及び中国語用漢字変換方法
JPS6365566A (ja) カナ漢字変換装置
JPH0991278A (ja) 文書作成装置
JPH06290182A (ja) 重辞変換装置と漢字変換装置
JPS5840650A (ja) 日本文入力方式

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20000314