JPH09185612A - 文字処理方法 - Google Patents

文字処理方法

Info

Publication number
JPH09185612A
JPH09185612A JP7344138A JP34413895A JPH09185612A JP H09185612 A JPH09185612 A JP H09185612A JP 7344138 A JP7344138 A JP 7344138A JP 34413895 A JP34413895 A JP 34413895A JP H09185612 A JPH09185612 A JP H09185612A
Authority
JP
Japan
Prior art keywords
word
dictionary
conversion
automatically registered
registered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7344138A
Other languages
English (en)
Other versions
JP3768577B2 (ja
Inventor
Koji Maekawa
浩司 前川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP34413895A priority Critical patent/JP3768577B2/ja
Publication of JPH09185612A publication Critical patent/JPH09185612A/ja
Application granted granted Critical
Publication of JP3768577B2 publication Critical patent/JP3768577B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 自動登録単語を用いた変換処理の不具合を解
消する。 【解決手段】 自動登録単語に頻度情報を持たせ、頻度
の低い自動登録単語の単語学習を禁止し、頻度情報が一
定の頻度に達した自動登録単語について、通常のかな漢
字変換辞書の単語と同じように単語学習を行なう。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字処理方法、特
に文書処理装置に入力されたかな文字列からかな漢字変
換により、かな漢字混じりの文字列を作成する文字処理
方法に関するものである。
【0002】
【従来の技術】従来の文書処理装置のかな漢字変換の処
理方法を図16のフローチャートにより説明する。
【0003】まず、文書処理装置では、かな文字列(よ
み)が入力され(ステップs1)、このかな文字列に対
してかな漢字変換を行ない変換候補を表示出力する。よ
り具体的にはかな漢字辞書を参照し、よみに対応する表
記を変換候補として抽出する(ステップs2)。変換候
補がユーザにとって希望する結果ではなかった場合、
(ステップs3)、ユーザはキーボードを操作して、入
力の文字列の区切りを変更して再変換を指示するか、ま
たは、同音異義語の他の候補を指示するかによって変換
候補を修正する(ステップs4)。s4の修正処理によ
り作成された単語(よみと表記)が辞書に存在しなかっ
た場合(ステップs5)、この単語を自動登録処理によ
って学習データ記憶領域に格納する(ステップ、s
6)。また、同時にその単語が次回の変換処理に反映さ
れるように、使用頻度について単語学習処理を行う(ス
テップs7)。
【0004】具体的なかな漢字変換の処理例を図17か
ら図19を用いて説明する。
【0005】図17において、入力文字列[だいじんし
ょう]を変換し、変換候補として[大臣章]が出力され
る。しかし、変換候補は希望する結果[大臣賞]と違う
ので、候補の修正,選択により、[章]を[賞]に変更
し、[賞]を単語学習する。
【0006】以上の操作を実行すると、次回に次に[だ
いじんしょう]と入力すると[大臣賞]の変換候補を得
ることができる。
【0007】次に図18に示すように入力文字列[でー
たしょう]を与えると、[賞]の使用頻度が高いので変
換候補として[データ賞]を出力する。しかし、変換候
補は希望する結果[データショウ]と違うので、ユーザ
は候補選択により、[賞]を[ショウ]に変換しなけれ
ばならない。変更した[ショウ]は辞書に存在しない単
語であるため、自動的に学習データに自動登録単語とし
て登録される。さらに自動登録した単語を単語学習す
る。
【0008】次に図19に示すように再び[だいじんし
ょう]を入力し変換した場合、[ショウ]が自動登録単
語として存在し、かつ前回の変換時に単語学習されてい
るために、変換候補は[大臣ショウ]となってしまう。
【0009】
【発明が解決しようとする課題】このように、従来の文
字処理方法ではもともと辞書になかった単語が辞書に登
録されると、通常の辞書の単語よりも優先されるので、
その結果、所望の変換候補がすぐに得られず、変換率が
落ちてしまうことがある。
【0010】そこで、本発明の目的は、上述の点に鑑み
て、自動登録をした単語についても好適な変換処理を行
なうことができる文字処理方法を提供することにある。
【0011】
【課題を解決するための手段】このような目的を達成す
るために、請求項1の発明は、単語のよみを表記に変換
するための辞書を有し、該辞書に記載されていない表記
がよみの変換結果として作成されたときには、以後の変
換のために当該変換結果についての単語のよみと表記を
前記辞書に自動登録することの可能な文書処理装置のた
めの文字処理方法において、前記よみから表記への変換
に際し、変換対象の単語が自動登録されている単語か予
め前記辞書に記載されている単語かを判定する第1ステ
ップと、自動登録の単語の判定の場合は当該単語の頻度
が予め定めた値に到達しているか否かを判定する第2ス
テップと、前記第1ステップの判定結果が予め前記辞書
に登録されているとなったとき、または前記第2ステッ
プの判定結果が予め定めた値に到達しているとなったと
きに、当該単語の単語学習を行う第3ステップと、前記
第2ステップの判定結果が予め定めた値に到達していな
いとなったときに当該自動登録の単語の頻度を増加さ
せ、第3ステップの終了後においては単語学習した単語
と同じよみを持つ自動登録の頻度を減少させる調節を実
行する第4ステップとを具えたことを特徴とする。
【0012】請求項2の発明は、前記辞書は自動登録の
単語を記憶する領域(4B)と漢字変換通常辞書領域
(4A)を有することを特徴とする。
【0013】請求項3の発明は、単語のよみを表記に変
換するための辞書を有し、該辞書に記載されていない表
記がよみの変換結果として作成されたときには、以後の
変換のために当該変換結果についての単語のよみと表記
を前記辞書に自動登録することの可能な文書処理装置の
ための文字処理方法において、前記よみから表記への変
換に際し、変換対象の単語が自動登録されている単語か
予め前記辞書に記載されている単語かを判定する第1ス
テップと、自動登録の単語の判定の場合は当該変換対象
の単語が変換結果として確定したときに使用頻度を増加
させる第2ステップと、予め辞書に記載の単語の判定の
場合は、当該変換対象の単語が変換結果として確定した
ときに単語学習をして、次に当該単語と同一のよみを有
する自動登録の単語の使用頻度を減少させる第3ステッ
プとを具えたことを特徴とする。
【0014】請求項4の発明は、前記辞書は自動登録の
単語を記憶する領域(4B)と漢字変換通常辞書領域
(4A)を有することを特徴とする。
【0015】
【発明の実施の形態】以下、図面を参照して本発明の1
実施形態について説明する。
【0016】図1は本発明を適用した文書処理装置のシ
ステム構成を示す。図1において入力装置(キーボード
など)1から入力されたかな文字列は、中央演算装置
(CPUなど)2によって処理され、出力装置(CRT
など)3に出力される。また、その変換の履歴(単語学
習など)は、記憶装置(ハードディスクなど)4に記憶
され次の解析の時に、変更の履歴を変換結果に反映させ
る。記憶装置4には辞書を構成するかな漢字変換用通常
辞書4Aおよび自動登録単語記憶領域4Bが設けられて
いる。
【0017】図2はCPU2の文字処理に関わる処理手
順を示す。
【0018】CPU2は入力装置1から入力された文字
列を、かな漢字変換処理によって処理して変換候補を出
力する(ステップs101→s102)。CPU2は変
換候補が希望するものかどうかを変換候補の確定の指示
の有無により判断する(ステップs103)。希望する
変換結果だった場合、変換結果の単語が自動登録かどう
か判断する(ステップs107)。希望する同音語では
なかった場合、ユーザの指示により候補修正処理を実行
していない変換候補を修正し、最終的に確定させる。修
正された後の変換候補が辞書に存在するかどうか判断す
る(ステップs105)。存在しない単語だった場合、
新たに自動登録処理(ステップs106)を行う。
【0019】確定した候補が辞書に登録されている同音
語だった場合、変換結果の単語が自動登録されているか
どうか判断する(ステップs107)。自動登録ではな
かった場合、単語学習処理(ステップs109)を行
う。変換単語が自動登録だった場合は、自動登録単語の
頻度をみて、頻度が十分に高ければ、すなわち、所定の
使用回数を超えていれば単語学習処理(ステップs10
9)を行う。さらに自動登録単語の場合には、自動登録
単語頻度調節処理を行う(ステップs10)。
【0020】図2の処理手順を実行したときの具体的な
処理内容を図3から図4を用いて説明する。
【0021】図3は、ユーザが[でーたしょう]を入力
すると、文書処理装置では辞書4Aに基づき、かな漢字
変換を行い[データ証]という変換候補を得る。この変
換候補がユーザの希望する変換結果ではないとき、ユー
ザはキーボードを操作して、希望する変換候補[データ
ショウ]に変換する。
【0022】図4のように、候補選択した[ショウ]
が、辞書A4に存在しない単語のとき文書処理装置で自
動登録処理を行う。
【0023】後にユーザが再び[でーたしょう]を入力
すると、文書処理装置では、辞書4Aに基づきかな漢字
変換を行い[データ証]という変換候補を得る。ユーザ
にとってやはり希望する変換結果ではないので、ユーザ
は希望する変換候補[データショウ]に変換する(図5
参照)。
【0024】候補選択によって選択された[ショウ]
は、自動登録単語であるので、文書処理装置は、自動登
録単語の頻度をみて、頻度が十分に高ければ(本実施形
態ではその判断値を4以上とする)単語学習処理を行
う。今の場合、頻度が0であるため、単語学習処理は行
われず、自動登録頻度調節処理によって、自動登録単語
の頻度を0から1に高める(図6参照)。
【0025】ユーザがこの単語を選択/決定していく度
に[ショウ]の頻度が高くなって、4以上になると、図
7に示すように一回目の変換結果として[ショウ]が出
力されるようになる。
【0026】図8のようにユーザが[だいじんしょう]
を入力し、かな漢字変換を行い[大臣ショウ]という変
換候補を得た場合に、この変換候補がユーザにとって希
望する変換結果ではないとき、ユーザは希望する変換結
果[大臣賞]へ候補選択により、変更する。また、
[賞]を以下のように単語学習する。すなわち、ユーザ
が第一候補になった自動登録の[ショウ]を他の候補に
変更して確定したので、文書処理装置は、自動登録頻度
調節により[ショウ]の使用頻度を1低下させる(図9
参照)。
【0027】ユーザが図10のように[でーたしょう]
を入力し、かな漢字変換を行って[データ賞]と言う変
換候補を得たとする。この変換候補は希望する変換候補
ではないため、ユーザは[賞]を[ショウ]に修正す
る。自動登録である[ショウ]が選ばれたため、文書処
理装置はこの単語について頻度が十分高いかどうか判断
する。この単語は頻度が3であり、判断値4より小さい
ため単語学習処理は行わず、自動登録頻度調節により、
頻度を高くする(頻度4,図11参照))。
【0028】ここで、図12のようにユーザが再び[だ
いじんしょう]を入力したときには、[ショウ]は学習
されておらず、[賞]の単語学習が効くために変換結果
として[大臣賞]と変換される。ユーザが図13のよう
に再び[でーたしょう]を入力したときには、やはり単
語学習が適用されるために、[データ賞]と変換され
る。しかしこの候補はユーザによって希望する候補では
ないため、ユーザは候補選択処理により[賞]を[ショ
ウ]に変換する。このとき選択した[ショウ]が自動登
録単語であるので、文書処理装置は頻度が十分に高いか
どうかをチェックする。図14に示すように、頻度が4
で判断値4に到達したので、文書処理装置はこの自動登
録単語を普通の辞書登録語と同様に扱い、単語学習処理
を行い、さらに頻度を高くする。
【0029】(他の実施例)上述の実施例では、ユーザ
が確定した変換候補が自動登録単語の場合には頻度に応
じて単語学習するか否かを決定している。しかしなが
ら、辞書4Aに記載されている単語については単語学習
し、自動登録単語については単語学習を行なわないよう
にすることができる。このための文字処理手順を図15
に示す。
【0030】図15において、図2と同様の処理につい
ては同一の符号を付している。図15のステップs20
0〜s210が自動登録単語を検出し、単語学習しない
処理のための手順を示す。
【0031】この処理手順に従うと、ユーザが[でーた
しょう]を入力し、かな漢字変換を行うと、[データ
証]という変換候補を得る(図15のステップs101
→s102)。ここでユーザにとって希望する変換候補
ではないので、キーボード装置を操作して変換候補
「証」から「ショウ」に修正する。所望の変換候補「デ
ータショウ」を取得し、変換候補の確定を指示する(図
15のステップs104、図3参照)。
【0032】文書処理装置は、確定の変換候補「ショ
ウ」が辞書4Aまたは自動登録領域4Bに存在するかを
判定する(図15のステップs105)。
【0033】この「ショウ」が辞書4Aおよび自動登録
領域4Bに存在しない場合はよみ「しょう」および表記
「ショウ」が自動登録単語に登録され、頻度が0に設定
される(図15のステップs106)。
【0034】新たにユーザが「でーたしょう」と入力す
ると文書処理装置はかな漢字変換を実行する。
【0035】上述の「ショウ」は単語学習されていない
ので、前回と同様、かな漢字変換候補として「データ
証」が得られる(図15のステップs101→s10
2)。
【0036】ユーザは変換候補の中の「証」を「ショ
ウ」に修正し、「データショウ」を確定する(図15の
ステップs104)。文書処理装置においてステップs
105の判定、すなわち、変換候補「ショウ」が辞書に
存在するかの判定が実行される。この時点で「ショウ」
は自動登録されているので肯定判定が得られる。続いて
図15のステップs200の判定でも肯定判定が得られ
るので、ステップS201の単語学習は行われず、「シ
ョウ」に関する頻度が「0」から「1」に調節される
(図15のステップs202)。
【0037】このようにして、自動登録単語については
ユーザがその単語を使用する毎に頻度が高くなるので、
他の同音の単語よりも表示順が早くなる。また、自動登
録単語については単語学習していないので、単語学習し
た、通常のかな漢字変換辞書4Aに記載された単語の方
が表示順が早くなる。
【0038】このようにして、自動登録単語を使用した
後、「ショウ」と同音のかな漢字変換辞書4Aに記載の
単語がユーザによって候補選択された場合、図15の実
行手順はステップs101〜s105→s200→s2
01経路を進み、その単語の単語学習の後、上記「ショ
ウ」の単語については頻度が−1される(図15のステ
ップs202)。
【0039】
【発明の効果】以上、説明したように、本発明では、自
動登録単語と、辞書に予め記載した単語の区別をつけ、
余り使われていない自動登録単語は変換候補としての順
位を低くする。これにより、自動登録単語を登録したこ
とによる弊害をなくした。また変換率が向上し、文書処
理装置の操作性の改善に寄与することができる。
【図面の簡単な説明】
【図1】本発明を適用した文書処理装置のシステム構成
を示すブロック図である。
【図2】文書処理装置の処理手順を示すフローチャート
である。
【図3】文書処理装置の処理内容を示す説明図である。
【図4】文書処理装置の処理内容を示す説明図である。
【図5】文書処理装置の処理内容を示す説明図である。
【図6】文書処理装置の処理内容を示す説明図である。
【図7】文書処理装置の処理内容を示す説明図である。
【図8】文書処理装置の処理内容を示す説明図である。
【図9】文書処理装置の処理内容を示す説明図である。
【図10】文書処理装置の処理内容を示す説明図であ
る。
【図11】文書処理装置の処理内容を示す説明図であ
る。
【図12】文書処理装置の処理内容を示す説明図であ
る。
【図13】文書処理装置の処理内容を示す説明図であ
る。
【図14】文書処理装置の処理内容を示す説明図であ
る。
【図15】他の実施例の処理手順を示すフローチャート
である。
【図16】従来の処理手順を示すフローチャートであ
る。
【図17】従来の処理内容を示す説明図である。
【図18】従来の処理内容を示す説明図である。
【図19】従来の処理内容を示す説明図である。
【符号の説明】
1 入力装置 2 CPU 3 出力装置 4 記憶装置 4A かな漢字変換辞書 4B 自動登録単語領域

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 単語のよみを表記に変換するための辞書
    を有し、 該辞書に未登録の単語の表記がよみの変換結果として作
    成されたときに、当該変換結果における単語のよみと表
    記を前記辞書に自動登録することの可能な文書処理装置
    のための文字処理方法において、 前記よみから表記への変換に際し、変換対象の単語が自
    動登録された単語か予め前記辞書に登録されている単語
    かを判定する第1判定ステップと、 自動登録された単語と判定された場合は当該単語の頻度
    が所定値に到達しているか否かを判定する第2判定ステ
    ップと、 前記第1判定ステップにより予め前記辞書に登録されて
    いると判定されたとき、または前記第2判定ステップに
    より前記所定値に到達していると判定されたときに、当
    該単語の単語学習を行う学習ステップと、 前記第2判定ステップにより前記所定値に到達していな
    いと判定されたときに当該自動登録された単語の頻度を
    増加させ、前記学習ステップの終了後においては単語学
    習した単語と同じよみを持つ自動登録された単語の頻度
    を減少させる調節ステップとを具えたことを特徴とする
    文字処理方法。
  2. 【請求項2】 前記辞書は自動登録の単語を記憶する領
    域(4B)と漢字変換通常辞書領域(4A)を有するこ
    とを特徴とする請求項1に記載の文字処理方法。
  3. 【請求項3】 単語のよみを表記に変換するための辞書
    を有し、 該辞書に未登録の単語の表記がよみの変換結果として作
    成されたときに、当該変換結果における単語のよみと表
    記を前記辞書に自動登録することの可能な文書処理装置
    のための文字処理方法において、 前記よみから表記への変換に際し、変換対象の単語が自
    動登録された単語か予め前記辞書に登録されている単語
    かを判定する第1判定ステップと、 自動登録された単語と判定された場合は当該変換対象の
    単語の使用頻度を増加させる第2判定ステップと、 予め辞書に登録されている単語と判定された場合は、当
    該変換対象の単語を学習をして、当該単語と同一のよみ
    を有する自動登録の単語の使用頻度を減少させる調節ス
    テップとを具えたことを特徴とする文字処理方法。
  4. 【請求項4】 前記辞書は自動登録の単語を記憶する領
    域(4B)と漢字変換通常辞書領域(4A)を有するこ
    とを特徴とする請求項3に記載の文字処理方法。
JP34413895A 1995-12-28 1995-12-28 文字処理方法 Expired - Fee Related JP3768577B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP34413895A JP3768577B2 (ja) 1995-12-28 1995-12-28 文字処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP34413895A JP3768577B2 (ja) 1995-12-28 1995-12-28 文字処理方法

Publications (2)

Publication Number Publication Date
JPH09185612A true JPH09185612A (ja) 1997-07-15
JP3768577B2 JP3768577B2 (ja) 2006-04-19

Family

ID=18366940

Family Applications (1)

Application Number Title Priority Date Filing Date
JP34413895A Expired - Fee Related JP3768577B2 (ja) 1995-12-28 1995-12-28 文字処理方法

Country Status (1)

Country Link
JP (1) JP3768577B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8892996B2 (en) 2007-02-01 2014-11-18 Nuance Communications, Inc. Spell-check for a keyboard system with automatic correction
US9092419B2 (en) 2007-02-01 2015-07-28 Nuance Communications, Inc. Spell-check for a keyboard system with automatic correction

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8892996B2 (en) 2007-02-01 2014-11-18 Nuance Communications, Inc. Spell-check for a keyboard system with automatic correction
US9092419B2 (en) 2007-02-01 2015-07-28 Nuance Communications, Inc. Spell-check for a keyboard system with automatic correction

Also Published As

Publication number Publication date
JP3768577B2 (ja) 2006-04-19

Similar Documents

Publication Publication Date Title
JPH09185612A (ja) 文字処理方法
JPH10275145A (ja) ワードプロセッサの二重言語自動変換方式
KR20050026732A (ko) 사용자별로 최적화된 오타 교정 단어 제공 방법
JP3548747B2 (ja) 記録媒体および文字入力装置
JP3032399B2 (ja) かな漢字変換装置
JP3263211B2 (ja) 文字処理方法およびその装置
JPH0721171A (ja) キー入力訂正装置
JPH07129573A (ja) 文書処理方法及び装置
JP2833650B2 (ja) 文書処理装置
JP2001175645A (ja) 中国語入力変換処理装置、中国語入力変換処理方法及び記録媒体
JPH09185616A (ja) 文字処理方法
JPH07319878A (ja) 機械翻訳装置
JPH0589094A (ja) かな漢字変換装置
JPS60200336A (ja) 音声入力処理装置
JPH05108615A (ja) 非優先学習日本語入力システム
JPH0619771B2 (ja) 文字処理装置
JPH07160696A (ja) 文書処理方法及びその装置
JPH0981555A (ja) 文書処理装置及びその方法
JPH03282875A (ja) 文書作成装置
JPH10187700A (ja) 文書処理装置
JPH03201058A (ja) 日本語文章処理装置
JPH0728828A (ja) 文字列表示装置
JPH08287062A (ja) 文字処理装置及びその方法
JPS61265664A (ja) ワ−ドプロセツサにおける同音異義語選択機構
JPH03282872A (ja) 文書作成装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20041015

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041026

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051108

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060110

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060124

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060202

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100210

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100210

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110210

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120210

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130210

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees