JP2693467B2 - かな漢字変換処理における同音語候補の優先度制御方式 - Google Patents

かな漢字変換処理における同音語候補の優先度制御方式

Info

Publication number
JP2693467B2
JP2693467B2 JP63046822A JP4682288A JP2693467B2 JP 2693467 B2 JP2693467 B2 JP 2693467B2 JP 63046822 A JP63046822 A JP 63046822A JP 4682288 A JP4682288 A JP 4682288A JP 2693467 B2 JP2693467 B2 JP 2693467B2
Authority
JP
Japan
Prior art keywords
word
information
proper
candidate
priority
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63046822A
Other languages
English (en)
Other versions
JPH01220061A (ja
Inventor
俊雄 宮間
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP63046822A priority Critical patent/JP2693467B2/ja
Publication of JPH01220061A publication Critical patent/JPH01220061A/ja
Application granted granted Critical
Publication of JP2693467B2 publication Critical patent/JP2693467B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) この発明は、一般語および固有語が混在する辞書を用
いて文節単位のかな漢字変換を行う文書作成装置に係
り、特にかな漢字変換処理で生成される同音語候補が固
有語である場合における同音語候補の優先度制御方式に
関する。
(従来の技術) 従来、かな漢字変換方式の文書作成装置には、辞書
のデータベースの段階から一般語(動詞、名詞、副詞な
ど)と固有語(人名、地名、会社名などの固有名詞、更
には様、区など人名、地名と組合わせて用いられる接辞
語)とに品詞の分類をして、即ち一般語変換用の辞書
(一般語辞書)と固有語変換用の辞書(固有語辞書)を
用意して、一般語の変換には一般語辞書を用い、固有語
の変換には固有語辞書を用いてかな漢字変換を行うもの
と、一般語と固有語とが混在する辞書を用い、一般語
と固有語とを特に意識せずにかな漢字変換を行うものと
があった。
上記の文書作成装置では、装置自身はユーザの入力
した読みだけでは、その読みが一般語あるか固有語であ
るか判別できない。そこで、この種の文書作成装置に
は、一般語の変換を行うか固有語の変換を行うかユーザ
が装置に対して指定するためのキー、例えば「一般語キ
ー」,「固有語キー」が用意されている。この文書作成
装置では、ユーザ自身が変換種別(一般語変換,固有語
変換の種別)を指定することができるため、期待した語
への変換のヒット率、特に同音異義語の数が比較的少な
い固有語の変換ヒット率が高かった。しかし、ユーザは
入力読みに対する変換結果として一般語または固有語の
いずれを期待するかを常に意識して、上記の「一般語キ
ー」,「固有語キー」を使い分けなければならず、操作
が煩雑であった。また、「一般語キー」,「固有語キ
ー」の2種を用意することは、小型軽量化が要求される
パーソナルワードプロセッサなどでは問題であった。
一方、上記の文書作成装置では、上記したの文書
作成装置のような問題は無いものの、変換のヒット率が
低くなる問題があった。特に、固有語は一般語に比べて
同音語(同音異義語)の出力順の優先順位が低くなるよ
うになっているため、固有語の変換を期待する場合には
問題であった。
(発明が解決しようとする課題) 上記したように従来は、一般語および固有語に対する
かな漢字変換のヒット率を向上するためには、ユーザ自
身が一般語変換か固有語変換かを常に意識してその変換
種別指定のためのキーの使い分けをしなければならず操
作が煩雑となり、逆に一般語変換か固有語変換か意識し
ないで済む入力方式とすると、特に固有語を期待する場
合の変換ヒット率が低下するという問題があった。
したがってこの発明は、ユーザが一般語変換か固有語
変換かを意識して入力操作を行う方式を適用しなくて
も、特に固有語を期待する場合の変換ヒット率が向上で
き、しかも一般語の変換に影響を及ぼささないようにす
ることを解決すべき課題とする。
[発明の構成] [課題を解決するための手段] この発明は、一般語および固有語が混在する辞書を用
いてかな漢字変換を行う文書作成装置に、現変換対象文
節の前文節の同音語候補を示す品詞情報を含む全候補語
情報をスタックするための前文節情報スタック手段と、
この前文節情報スタック手段内の上記前文節の全候補語
情報中の品詞情報がいずれも固有語を示しているか否か
を判定する固有語判定手段と、現変換対象文節の候補語
情報の各々について候補語出力順の優先順位付けを行う
優先度処理手段とを設け、現変換対象文節の優先度処理
対象候補語情報中の品詞情報が固有語を示す場合に現変
換対象文節の前文節の全候補語情報中の品詞情報がいず
れも固有語を示していることが上記判定手段によって判
定されたならば、優先度処理対象候補語情報の優先順位
を上げるようにしたものである。
(作用) 上記の構成によれば、現変換対象文節の優先度処理対
象同音語候補が固有語である場合には固有語判定手段の
判定結果が利用され、前文節の同音語候補がいずれも固
有語であることが判定されていれば、優先度処理対象同
音語候補である固有語の優先順位が上げられる。したが
って、複数の固有語から成る文字列(例えば宛名、都道
府県名、市町村名など)を作成する場合には、同じ読み
で表記の異なる一般語があってもユーザの期待した文字
列を変換出力することが可能となる。
(実施例) 第1図はこの発明を適用するかな漢字変換方式の文書
作成装置の一実施例を示す要部の機能ブロック構成図で
ある。同図において、符号aで示されるブロックはかな
漢字変換処理の制御を行うかな漢字変換制御部であり、
入力文字列(ひらがな)を文節単位に分割して一般語お
よび固有語が混在する辞書(図示せず)を用いてかな漢
字変換処理を行うようになっている。以下に述べる文法
チェック部b、優先度処理部c、固有語判定部dおよび
前文節情報スタック部eは、いずれもこのかな漢字変換
制御部aの制御下で動作する。
次に符号bで示されるブロックはかな漢字変換制御部
aから渡された解析文節(現解析文節)の文法的な妥当
性を調べる文法チェック部、符号cで示されるブロック
は文法チェック部bで妥当性が確認された文節の同音語
候補(同音異義語が存在するため、当然様々な品詞の候
補が存在する)に対して、かな漢字変換の結果としてど
の候補を優先的に出力すべきかを決定するための優先順
位付けを行う優先度処理部である。この優先度処理部c
は、一般語に対する優先度処理を行う一般語優先処理部
c−1、固有語に対する優先度処理を行う固有語優先処
理部c−2、その他の例外的な優先度処理を行う優先処
理部(その他の優先処理部)c−3を有している。
また、符号dで示されるブロックは優先度処理部cに
おける固有語優先処理のために、現解析文節の直前の文
節の同音語候補の品詞が全て固有語であるか否かを判定
する固有語判定部、符号eで示されるブロックは文節間
の文法チェックおよび優先度処理のために、現解析文節
の直前の文節の情報(同音語候補を示す品詞情報を含む
全候補語情報)をスタックする前文節情報スタック部で
ある。なお、キー入力部、表示部、外部記憶装置などは
省略されている。
次に、第1図の構成の動作を第2図のフローチャート
を参照して説明する。
まず、ユーザのキー操作によって図示せぬキー入力部
から入力された“ひらがな”文字列(読みデータ列)
は、かな漢字変換制御部aに取込まれる。かな漢字変換
制御部aは取込んだ文字列を文節単位に分割し、一般語
および固有語が混在する図示せぬ辞書を用いて文節単位
でかな漢字変換を行う(ステップS1)。そしてかな漢字
変換制御部aは、分割した1文節毎にかな漢字変換で得
られる全ての候補語情報、更に具体的に述べるならば同
音語候補を示す品詞情報並びに接続情報を含む全ての候
補語情報を、現解析文節の候補語情報として1情報ずつ
順に文法チェック部bへ送る。
文法チェック部bは、かな漢字変換制御部aから1つ
の候補語情報を受取る毎に、対応する同音語候補が文法
的に文節として認定できるか否かを調べ、認定可能であ
ればその候補語情報を優先度処理部cへ送る(ステップ
S2,S3)。これに対して文節として認定不可を判定した
場合には、文法チェック部bはその候補語情報を優先度
処理部cへ送らず、かな漢字変換制御部aに対して認定
不可を示すステータスを返す。
優先度処理部cは、文法チェック部bから候補語情報
を受取ると、対応する同音語候補の出力順番を決定する
ための優先順位付けを次のように行う。まず優先度処理
部cは、現解析文節の直前の文節の候補語情報(前文節
情報)が前文節情報スタック部eにスタックされている
か否かを調べる(ステップS4)。この実施例のように1
文節目の解析を行っている場合には、前文節情報は前文
節情報スタック部eに存在しないためにステップS4の判
定はNOとなる。この場合、優先度処理部cは文法チェッ
ク部bからの候補語情報(中の品詞情報)の示す品詞に
応じて優先処理部c−1〜c−3の1つを起動し、対応
する同音語候補の品詞、接続条件等に応じた優先順位付
けを行わせる(ステップS5)。この優先順位が付された
候補語情報はかな漢字変換制御部aに戻される。かな漢
字変換制御部aは、優先度処理部cから戻された候補語
情報を、次の文節の優先度処理等のために前文節情報ス
タック部eにスタックする(ステップS6) さて、上記のようにして1文節目の全ての候補語情報
についての文法チェック、優先度処理等が終了すると、
今度は2文節目についての解析処理が次のように行われ
る。まず、かな漢字変換制御部aにおいて2文節目の全
ての候補語情報が求められ、1情報単位で文法チェック
部bに送られる。そして文法チェック部bにおいて、文
節として認定可能であることが判定されると、かな漢字
変換制御部aからの候補語情報は優先度処理部cへ送ら
れる。この際には、前文節情報スタック部eには前文節
の情報が存在することから、優先度処理部c(の固有語
優先処理部c−2)において次に述べるように固有語判
定部dを用いた優先度処理が行われる。
まず優先度処理部cは、前文節情報スタック部eに前
文節情報が存在する状態で優先度処理を行う場合、即ち
2文節目以降の名候補語情報を対象とする優先度処理を
行う場合には、前文節情報スタック部eにスタックされ
ている前文節の全ての候補語情報(中の品詞情報)がい
ずれも固有語(人名、地名、会社名などの固有名詞、更
には様,区など人名、地名と組合わせて用いられる接辞
語)を示しているか否かを判定するための判定処理(ス
テップS8)を要求する。そして優先度処理部c(内の固
有語優先処理部c−2)は、現在解析中の文節の候補語
情報(中の品詞情報)が固有語を示す場合(即ち候補語
情報の示す同音語候補の品詞が固有語の場合)、固有語
判定部dで前文節の前同音語候補がいずれも固有語であ
ることが判定されているならば、少なくとも現候補語情
報(によって示される同音語候補)の優先順位(ここで
は、前文節の名同音語候補と現文節の同音語候補との組
合せの候補の優先順位)を例えば最優先レベルに上げる
新規な優先度操作を行う(ステップS7)。以後の動作は
1文節目と同様である。
これに対して、現在解析中の文節の候補語情報が固有
語を示していても、前文節の同音語候補に一般語と固有
語の両者が混在している場合には、優先度処理部cでは
上記した新規な優先度操作は行われず、従来と同様の通
常の優先度処理が行われる。また、現在解析中の文節の
候補語情報が一般語を示している場合にも、優先度処理
部cでは(固有語判定部dの判定結果に無関係に)上記
した新規な優先度操作は行われず、通常の優先度処理が
行われる。
上記したように、この実施例では、前文節の同音語候
補が全て固有語である場合には次の文節も固有語である
確率が高いものと判断し、次の候補語情報のうち固有語
を示す候補語情報についてはその優先順位を上げるよう
にしている。即ち、この実施例によれば、通常は変換精
度を下げないようにするために固有語よりも一般語の方
が優先度が高くなるようにしていても、上記した特定の
条件を満たす場合には固有語の優先度を一般語より高め
ることができる。したがって、複数の固有語から成る文
字列(例えば宛名、都道府県名、市町村名など)を作成
する場合には、前文節の同音語候補がいずれも固有語で
あるならば、所望の文字列を最優先で出力することが可
能となる。
さて、上記の方式では、前文節の同音語候補に例えば
固有語の地名と同一読みの一般語が存在する場合には、
地名+地名または地名+地名接辞を必要としても、この
種の組合わせは優先順位が上げられないため最優先で出
力することができない。そこで、この実施例では、上記
の不都合に対処するために、前文節情報スタック部eに
スタックされている前文節の固有語を示す同音語候補の
うち地名を示す候補と、現解析文節の同音語候補のうち
の地名(または地名接辞)を示す候補との組合わせの優
先順位を、固有語優先処理部c−2において上げるよう
にしている。
[発明の効果] 以上詳述したようにこの発明によれば、現変換対象文
節の1つの同音語候補が固有語である場合、前文節情報
スタック手段にスタックされている前文節の同音語候補
がいずれも固有語であるならば、現変換対象文節の同音
語候補である固有語の優先順位が上げられる。したがっ
て、基本的には固有語の優先順位を一般語より低くなる
ようにしておいても、複数の固有語から成る文字列(例
えば宛名、都道府県名、市町村名など)を作成しようと
してユーザが一般語と固有語とを何等意識することなく
入力操作を行っても、ユーザが期待した文字列を変換出
力することが可能となる。しかも、固有語の優先順位を
最初から上げているのではないため、一般語を必要とす
る場合等の変換結果に悪影響を及ぼす虞がない。
【図面の簡単な説明】
第1図はこの発明を適用するかな漢字変換方式の文書作
成装置の一実施例を示す要部の機能ブロック構成図、第
2図は動作を説明するためのフローチャートである。 a……かな漢字変換制御部、b……文法チェック部、c
……優先度処理部、c−1……一般語優先処理部、c−
2……固有語優先処理部、d……固有語判定部、e……
前文節情報スタック部。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】入力手段から入力された読みデータ列を文
    節毎に区切り一般語および固有語が混在する辞書を用い
    て文節単位でかな漢字変換を行う文書作製装置におい
    て、現変換対象文節の前文節の同音語候補を示す品詞情
    報を含む全候補語情報をスタックするための前文節情報
    スタック手段と、この前文節情報スタック手段にスタッ
    クされている上記前文節の全候補語情報中の品詞情報が
    いずれも固有語を示しているか否かを判定する固有語判
    定手段と、上記現変換対象文節の候補語情報の各々につ
    いて対応候補語情報中の品詞情報および上記固有語判定
    手段の判定結果をもとに候補語出力順の優先順位付けを
    行う優先度処理手段とを具備し、上記優先度処理手段は
    上記現変換対象文節の優先度処理対象候補語情報中の品
    詞情報が固有語を示す場合に上記現変換対象文節の前文
    節の全候補語情報中の品詞情報がいずれも固有語を示し
    ているならば、上記優先度処理対象候補語情報の優先順
    位を上げるように構成されていることを特徴とするかな
    漢字変換処理における同音語候補の優先度制御方式。
JP63046822A 1988-02-29 1988-02-29 かな漢字変換処理における同音語候補の優先度制御方式 Expired - Lifetime JP2693467B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63046822A JP2693467B2 (ja) 1988-02-29 1988-02-29 かな漢字変換処理における同音語候補の優先度制御方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63046822A JP2693467B2 (ja) 1988-02-29 1988-02-29 かな漢字変換処理における同音語候補の優先度制御方式

Publications (2)

Publication Number Publication Date
JPH01220061A JPH01220061A (ja) 1989-09-01
JP2693467B2 true JP2693467B2 (ja) 1997-12-24

Family

ID=12758027

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63046822A Expired - Lifetime JP2693467B2 (ja) 1988-02-29 1988-02-29 かな漢字変換処理における同音語候補の優先度制御方式

Country Status (1)

Country Link
JP (1) JP2693467B2 (ja)

Also Published As

Publication number Publication date
JPH01220061A (ja) 1989-09-01

Similar Documents

Publication Publication Date Title
KR101279676B1 (ko) 언어 모델을 생성하기 위한 방법, 가나-간지 변환 방법 및그 장치
CN101815996A (zh) 检测名称实体和新词
JP2003527676A (ja) モードレス入力で一方のテキスト形式を他方のテキスト形式に変換する言語入力アーキテクチャ
JP3476007B2 (ja) 認識単語登録方法、音声認識方法、音声認識装置、認識単語登録のためのソフトウエア・プロダクトを格納した記憶媒体、音声認識のためのソフトウエア・プロダクトを格納した記憶媒体
JP2693467B2 (ja) かな漢字変換処理における同音語候補の優先度制御方式
JPH0130173B2 (ja)
JP4177195B2 (ja) 認識文法作成システム
JPS6160167A (ja) 日本語ワ−ドプロセツサ
JP3084864B2 (ja) 文章入力装置
JPS6395565A (ja) 仮名漢字変換手法
JPH0566875A (ja) キー入力装置
JPS6210762A (ja) 仮名漢字変換方式
JPH0350669A (ja) 情報処理装置
JPS60189573A (ja) 文字変換装置
JPS6391736A (ja) 読み合わせ装置
JPH0589093A (ja) 文書作成装置
JPH01128157A (ja) 日本語文書作成装置
JPH04205646A (ja) かな漢字変換方法
JPH0769911B2 (ja) かな漢字変換装置
JP2000010964A (ja) 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体
JPH0812665B2 (ja) 中文入力装置
JPH06251009A (ja) 文章校正支援装置
JPH0812664B2 (ja) 中文入力装置
JPS63263563A (ja) 文字変換装置
JPS6340936A (ja) 音声カナ漢字変換方式