JP2729342B2 - 仮名漢字変換方法および装置 - Google Patents

仮名漢字変換方法および装置

Info

Publication number
JP2729342B2
JP2729342B2 JP4219548A JP21954892A JP2729342B2 JP 2729342 B2 JP2729342 B2 JP 2729342B2 JP 4219548 A JP4219548 A JP 4219548A JP 21954892 A JP21954892 A JP 21954892A JP 2729342 B2 JP2729342 B2 JP 2729342B2
Authority
JP
Japan
Prior art keywords
kana
reading
character
phrase
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP4219548A
Other languages
English (en)
Other versions
JPH0652154A (ja
Inventor
信一 鳥原
広志 野崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NIPPON AI BII EMU KK
Original Assignee
NIPPON AI BII EMU KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NIPPON AI BII EMU KK filed Critical NIPPON AI BII EMU KK
Priority to JP4219548A priority Critical patent/JP2729342B2/ja
Publication of JPH0652154A publication Critical patent/JPH0652154A/ja
Application granted granted Critical
Publication of JP2729342B2 publication Critical patent/JP2729342B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は仮名漢字変換装置およ
び方法に関し、とくに別の読みや漢字コード等を介して
入力された語句を自動的に学習できるようにしたもので
ある。
【0002】
【従来の技術】従来、辞書にない単語や変換されにくい
複数文節を入力するには、別の読みで入力したり、コー
ド変換したり、1または複数の単語や文節を入力して一
部を省略したりしている。たとえば、'形態素'の正書に
対し、'けいたいそ'の読みを入力した場合に、'系/対
ソ'(/は文節区切りを示す)が変換されたときには、
文節切り直しによって'形態/素'に変換し直す。また正
書の'注'に対して'ちゅうい'の読みを入力し'注意'を
得、後退キーで'意'を削除することもある。また正書
の'齋藤'に対して'さいとう'の読みを入力し、変換で'
斎藤'を得、こののち、コード入力で得た'齋'で置き換
えることもある。また正書の'形態素'を得るのにまず'
けいたい'を入力して'形態'を得、こののち'あじのも
と'を入力して'味の素'を得、さらに'味の'を削除する
こともある(「味の素」は登録商標)。ところで変換で
きない、または変換しにくい単語や文節をユーザ辞書に
登録すれば、後の変換では別読みで入力したり、漢字コ
ードで入力したり、一部を削除したりすることなく、確
実容易に変換が行えて便利である。しかし、このような
変換できないまたは変換しにくい単語や文節に遭遇する
都度、登録作業を行うのも、ユーザの負担になる。
【0003】
【発明が解決しようとする課題】この発明は以上の事情
を考慮してなされたものであり、とくにコード入力や、
一部削除入力で正書を得たときのように、少なくとも一
部の読みが欠落した態様で正書が確定された場合に、こ
れを暫定的に記憶し、次回この正書への変換が実行され
たときに自動的に辞書登録を行い、ユーザの負担を軽減
しようとするものである。
【0004】
【課題を解決するための手段】この発明では、以上の目
的を達成するために、まず少なくとも一部の読みが欠落
した態様で正書が確定されたかどうかを判別する。この
正書と、残っている読み(読みが残っていない場合もあ
る)とを保持する。そして次回以降の仮名漢字変換の読
み入力時に、残っている読みと正書の漢字の音訓読みと
を利用して正書の1個または複数の読み候補を生成し、
これを入力読みとマッチングさせ、マッチングしたら当
該正書をユーザに示す。ユーザがこれを確定したら、そ
の正書と、該当する読みとを辞書に自動的に登録する。
もちろん、一度のマッチングのみでなく、複数のマッチ
ングがあったときに登録する等種々の変更が可能であ
る。
【0005】
【実施例】以下、この発明を連文節仮名漢字変換機能を
有するテキスト処理装置に適用した実施例について説明
する。図1はこの実施例のテキスト処理装置を全体とし
て示すものであり、この図1において、キーボード1
は、仮名漢字変換の対象となる文字の入力のための文字
キーの他に、入力された仮名文字列を仮名漢字混じり文
に変換するための変換キー、カーソルを移動するための
カーソルキー、文字を削除するための削除キーを含む校
正編集キー、コード入力を行うキー、変換結果を確定す
るための確定キーなどから構成されている。テキスト処
理部2は、キーボード1からのキー入力に応じて、文字
列の挿入、追加、削除などの文字列編集やコード入力な
どを行う。ディスプレイ3は、キーボード1から入力さ
れた文字列、仮名漢字変換された文字列、コード入力さ
れた文字や編集中の文字列などを表示する。
【0006】連文節辞書検索部4は入力された仮名文字
列に即して、連文節辞書5および学習単語辞書6から単
語を検索する。他にユーザー辞書(図示しない)など、
仮名文字列その読みに対応した単語を持つ辞書を検索し
ても良い。文節作成部7では、連文節辞書検索の結果か
ら文節を作成する。
【0007】当字単語検索部8では、入力された仮名文
字列に即して、当字単語記憶部9を検索する。音訓辞書
検索部10は読みのない当字単語の漢字部分に対して音
訓辞書11を検索し、読みを得る。この読みは複数あっ
てもよい。人工文節作成部12では、当字単語の検索と
音訓辞書の検索により求めた当字単語の読みと入力仮名
文字列が一致するか判別し、一致すれば当字単語による
文節(これを、人工文節と呼ぶこととする)を作成する。
【0008】連文節変換候補作成部13では、文節作成
部7および人工文節作成部12で作成された文節をもと
に連文節変換候補列を作成する。なお、最終的な変換結
果としては、これらの連文節変換候補ごとに、各単語や
単語連鎖に対して付けられたスコア(ペナルティ)を用い
た評価によって決定する。単語に関するスコアは、たと
えば個々の単語の頻度情報であり、単語連鎖に関連する
スコアは例えば文法情報である。
【0009】当字単語登録部14では、当字入力の判別
を行い、それに応じた認定方法により、当字入力部分を
含めた近傍の文節をひとまとめにした単語(これを当字
単語と呼ぶ)を一時的に当字単語記憶部9に記憶する。
当字単語削除部15では、当字単語を当字単語記憶部9
から削除する。 なお、当字単語を削除するときに、人
工文節の単語(読みがすべて求まった当字単語)を学習単
語辞書6へ登録しても良い。
【0010】例として、「形態素」なる漢字列を本発明
により得る場合を示す。わかりやすく説明するために、
図2に示すように、当字単語記憶段階、当字単語引当て
段階(人工文節作成段階)、人工文節確定段階の3つの段
階に分けて説明する。
【0011】当字単語記憶段階:「けいたい」という入
力仮名文字列に対して仮名漢字変換を行い「形態」を得
たとする。次に「あじのもと」と入力し、仮名漢字変換
により「味の素」を得たとする。このとき、「形態・味
の素」が未確定文字列となっている(記号「・」は分か
りやすさのために付けてあるだけで、単なる区切りを示
す)。削除キーにより「味の」を消去する。このとき、
残りの「素」が読みの失われた当字入力部分となる。当
字入力部分は、編集およびコード入力により図5の
(a)、(b)、(c)に示すような種類がある。図5(a)は、削
除キーによって当字入力部分が作成された例であり、図
5(b)は文節の途中に文字を挿入したために、分断され
2つの当字部分が作成された例であり、図5(c)はコー
ド入力により、当字部分が作成された例である。なお、
この当字入力の判別は、図3に示す流れ図に沿って判別
される。図3の(a)、(b)、(c)はそれぞれ図5の(a)、
(b)、(c)に対応する。図3の詳細な説明は不要であろ
う。ここで「形態素」なる漢字列を得たので確定キーで
確定する。このとき、読みの失われた「素」の前の文節
をひとまとめにした「形態(けいたい)・素(*)」(記号
「*」は、その漢字列に対して読みが無いことを示すこ
ととする)を当字単語として、当字単語記憶部9に一時
的に記憶する。この当字単語の抽出は、図4で示す当字
単語抽出の流れ図とつぎの当字単語抽出条件、及び当字
単語認定方法とにより行う。
【0012】図6に当字単語とその認定方法の例を示
す。 当字単語抽出条件: 条件1: 条件3と条件4が両方成立する。 条件2: 条件3も条件4も両方成立しない。 条件3: 現在の文節より前の文節で、読みのある文節が
存在する。 条件4: 現在の文節より後ろの文節で、読みのある文節
が存在する。 当字単語認定方法: 認定方法1: 前の文節、現在の文節、後ろの文 節の3文節を1まとめにしたものを当字単語とする。 認定方法2: 最初の文節から現在の文節までを1まと
めにしたものを当字単語とし、現在の文節から最後の文
節までを1まとめにしたものも当字単語とする。 認定方法3: 前の文節及び現在の文節までを1まとめ
にしたものを当字単語とする。 認定方法4: 現在の文節及び後ろの文節までを1まと
めにしたものを当字単語とする。 これら一連の当字単語記憶段階の流れを図7に示す。
【0013】当字単語引当て(人工文節作成)段階: 「けいたいそ」と入力し、仮名漢字変換を行う。当字単
語がなければ、連文節変換候補として図9に示すような
連文節変換候補が作成される。当字単語があるときに
は、当字単語記憶部に記憶されている当字単語として
「形態(けいたい)・素(*)」があるため「素」に対し
て、音訓辞書を検索し、「もと」、「そ」、「す」の読
みを得る。しかし、入力仮名列である「けいたいそ」に
一致するのは「素」の読みが「そ」のときなので、「形
態(けいたい)・素(そ)」で文節(人工的な文節、人工文
節と呼ぶ)を作成し、連文節変換候補を作成する。な
お、仮名漢字変換の結果としては、連文節変換候補の各
々のスコアを評価して、スコア(ペナルティ)の最低点の
連文節変換候補を最終的な変換結果とする。連文節変換
候補の例として、図9を示す。ここの例では、人工文節
「形態素」が作成されたので、図9に例えばスコア10
で加わることになるので、「形態素」を得ることができ
る。なお、スコアの付け方は、文節数最小法や最長一致
法によるスコアを付けても良い。当字単語引当て段階で
の流れを図8に示す。
【0014】人工文節確定段階:求めていた「形態素」
を得たので、確定する。このとき、「形態素」は当字単
語として引き当てられた単語で、「形態素」の読みとし
て「けいたいそ」を自動的に得ているので、当字単語
「形態(けいたい)・素(*)」を当字単語記憶部から削除
する。また、このとき学習単語登録部を通して学習辞書
へ自動的に「形態(けいたい)・素(そ)」を登録しても良
い。この段階での処理の流れを図10に示す。
【0015】以上の3つの段階での実施例を図11
(a)、(b)に示す。図11(a)は、当字単語記憶段階での
操作と表示の例であり、図11(b)は、当字単語引当て
段階と人工文節確定段階での例である。四角で囲んだ部
分は、反転表示している部分を示す。
【発明の効果】以上説明したようにこの発明によれば読
みが一部欠落した正書をそのまま保持し、次回の当該正
書に対応する読み入力時に、音訓辞書を参照して自動的
に欠落部を補いマッチングを実行し、マッチングしたも
のが所望のものであることを確認したのち自動的に登録
が行われるようにしているので、変換が困難な単語等の
一部を自動的にかつ過不足なく登録できるので、ユーザ
の負担が軽減される。
【図面の簡単な説明】
【図1】 この発明の実施例を全体として示すブロック
図である。
【図2】 上述の実施例の全体的な動作を説明するフロ
ーチャートである。
【図3】 図2の当字単語記憶段階の動作を説明するフ
ローチャートである。
【図4】 図2の当字単語記憶段階の要部の動作を説明
するフローチャートである。
【図5】 図2の当字単語記憶段階の要部の動作を説明
する図である。
【図6】 図2の当字単語記憶段階の要部の動作を説明
する図である。
【図7】 図2の当字単語記憶段階の全体の動作を説明
するフローチャートである。
【図8】 図2の当字単語引当て段階の動作を説明する
フローチャートである。
【図9】 上述の実施例で用いる連文節仮名漢字変換の
例について説明する図である。
【図10】 図2の人工文節確定段階の流れを示すフロ
ーチャートである。
【図11】 上述の実施例の動作例を自動登録前と登録
後とに分けて示す図である。
【符号の説明】
6・・・学習単語辞書、8・・・当字単語検索部、9・
・・当字単語記憶部、10・・・音訓辞書検索部、11
・・・音訓辞書、12・・・人工文節作成部、14・・
・当字単語登録部、15・・・当字単語削除部。

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】仮名が入力された場合には上記仮名の変換
    後の文字を編集した後に確定することにより、又はコー
    ド入力を行うことにより、少なくとも一部の読みが欠落
    した態様で正書が確定したことを判別するステップと、 上記判別された正書と残っている読みとを記憶するステ
    ップと、 上記記憶された読みに、読みが欠落した漢字の読みを補
    充して上記正書の1または複数の読みの候補を生成し、
    入力仮名文字列にマッチングさせるステップと、 上記読みの候補が上記入力文字列に一致するときに当該
    正書を表示するステップと、 上記表示された正書が確定されたときに当該読みの候補
    および当該正書を登録するステップとを有することを特
    徴とする仮名漢字変換方法。
  2. 【請求項2】上記読みの候補および上記正書を登録する
    ときに、上記判別された正書および残っている読みの記
    憶を消失させるステップを含む請求項1記載の仮名漢字
    変換方法。
  3. 【請求項3】仮名が入力された場合には上記仮名の変換
    後の文字を編集した後に確定することにより、又はコー
    ド入力を行うことにより、少なくとも一部の読みが欠落
    した態様で正書が確定したことを判別する手段と、 上記判別された正書と残っている読みとを記憶する手段
    と、 上記記憶された読みに、読みが欠落した漢字の読みを補
    充して上記正書の1または複数の読みの候補を生成し、
    入力仮名文字列にマッチングさせる手段と、 上記読みの候補が上記入力文字列に一致するときに当該
    正書を表示する手段と、 上記表示された正書が確定されたときに当該読みの候補
    および当該正書を登録する手段とを有することを特徴と
    する仮名漢字変換装置。
JP4219548A 1992-07-28 1992-07-28 仮名漢字変換方法および装置 Expired - Fee Related JP2729342B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4219548A JP2729342B2 (ja) 1992-07-28 1992-07-28 仮名漢字変換方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4219548A JP2729342B2 (ja) 1992-07-28 1992-07-28 仮名漢字変換方法および装置

Publications (2)

Publication Number Publication Date
JPH0652154A JPH0652154A (ja) 1994-02-25
JP2729342B2 true JP2729342B2 (ja) 1998-03-18

Family

ID=16737231

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4219548A Expired - Fee Related JP2729342B2 (ja) 1992-07-28 1992-07-28 仮名漢字変換方法および装置

Country Status (1)

Country Link
JP (1) JP2729342B2 (ja)

Also Published As

Publication number Publication date
JPH0652154A (ja) 1994-02-25

Similar Documents

Publication Publication Date Title
US5794177A (en) Method and apparatus for morphological analysis and generation of natural language text
US7809744B2 (en) Method and system for approximate string matching
JP2633824B2 (ja) 仮名漢字変換装置
JP2729342B2 (ja) 仮名漢字変換方法および装置
JP3531222B2 (ja) 類似文字列検索装置
JPH1011431A (ja) 漢字検索装置および方法
JP3329476B2 (ja) かな漢字変換装置
JP3241854B2 (ja) 単語スペル自動補正装置
JPH11203281A (ja) 電子辞書検索装置及び電子辞書検索装置制御プログラムを記憶した媒体
JPH08339365A (ja) 文書作成装置及び文書作成方法
JP3048793B2 (ja) 文字変換装置
JP3344793B2 (ja) かな漢字変換装置
JPH05324610A (ja) 住所表記漢字入力装置
JPS62282364A (ja) 文字列検索方式
JPH0512252A (ja) かな漢字変換装置およびその方法
JP2001125907A (ja) 辞書検索方法、装置、および辞書検索プログラムを記録した記録媒体
JPH0785026A (ja) 辞書更生方法及び装置
JPH0721212A (ja) 文書処理装置
JP2002236680A (ja) 固有名対応付け装置及び方法、その方法をコンピュータに実行させるプログラム並びにそのプログラムを記録した記録媒体
JPH0625990B2 (ja) 中文自動区切入力方式
JPH06195372A (ja) 形態素解析装置
JPS61169961A (ja) ユ−ザ辞書を備えた文字処理装置
JPH0345423B2 (ja)
JPH04191959A (ja) 文節切り出し装置
JPH0695330B2 (ja) 文書作成装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees