JPH038053A - 仮名漢字変換システムの単語登録方法 - Google Patents
仮名漢字変換システムの単語登録方法Info
- Publication number
- JPH038053A JPH038053A JP1100067A JP10006789A JPH038053A JP H038053 A JPH038053 A JP H038053A JP 1100067 A JP1100067 A JP 1100067A JP 10006789 A JP10006789 A JP 10006789A JP H038053 A JPH038053 A JP H038053A
- Authority
- JP
- Japan
- Prior art keywords
- word
- registered
- speech
- kana
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 18
- 238000006243 chemical reaction Methods 0.000 claims abstract description 13
- 235000016496 Panda oleosa Nutrition 0.000 abstract description 4
- 240000000220 Panda oleosa Species 0.000 abstract description 4
- 230000021615 conjugation Effects 0.000 description 21
- 230000001174 ascending effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 1
Landscapes
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、日本語ワードプロセッサなどで用いられる仮
名漢字変換システムの単語登録方法に関する。
名漢字変換システムの単語登録方法に関する。
日本語仮名漢字変換システムでは、利用者が人力した仮
名文字を仮名漢字混じり文に変換するために、変換用辞
書を備えている6例えば9日立製ワークステーション2
050用r#曹保守Jの説明書によれば、この辞書には
予め多数の単語が登録されているが、予め登録されてい
ない単語であっても仮名文字を漢字に変換できるように
単語登録機能が備わっている。
名文字を仮名漢字混じり文に変換するために、変換用辞
書を備えている6例えば9日立製ワークステーション2
050用r#曹保守Jの説明書によれば、この辞書には
予め多数の単語が登録されているが、予め登録されてい
ない単語であっても仮名文字を漢字に変換できるように
単語登録機能が備わっている。
日本語には、活用のある品詞(語尾が変化する品詞)が
存在するため、単語は変換用辞書に品詞分類されて登録
されている必要がある。このことは、予め登録されてい
る単語についても、利用者が登録した単語についても同
様である。
存在するため、単語は変換用辞書に品詞分類されて登録
されている必要がある。このことは、予め登録されてい
る単語についても、利用者が登録した単語についても同
様である。
さて、従来の単語登録方式では、利用者が品詞を分類し
て登録する必要があった。しかし1品詞分類を正確に理
解している利用者は少ないので、第2図のように<It
eaできる単語の品詞を普通名詞。
て登録する必要があった。しかし1品詞分類を正確に理
解している利用者は少ないので、第2図のように<It
eaできる単語の品詞を普通名詞。
固有名詞とす変動制に限定したシステムが多かった。
登録できるI林語の品詞を普通名詞、固有名詞とす変!
1!1I4nlに限定したシステムでは、登録できない
品詞の単語に対する配慮が欠けており、す変動制以外の
動詞、形容動詞などの、登録できなし1品詞の単語を使
用したい場合、そのことを意識して人力しないと、R録
されている単語に無理やり当てはめられて変換されてし
まう。このため、第3図のように登録されている単語も
うまく変換できないという問題があった。また、l!I
?書に予め<f、Hされている送り仮名の付は方を変更
したいが、そのI¥語が登録できない品詞の場合は、か
な漢字変換を行った後で1語ごとに修正しなければなら
なし)という問題があった。
1!1I4nlに限定したシステムでは、登録できない
品詞の単語に対する配慮が欠けており、す変動制以外の
動詞、形容動詞などの、登録できなし1品詞の単語を使
用したい場合、そのことを意識して人力しないと、R録
されている単語に無理やり当てはめられて変換されてし
まう。このため、第3図のように登録されている単語も
うまく変換できないという問題があった。また、l!I
?書に予め<f、Hされている送り仮名の付は方を変更
したいが、そのI¥語が登録できない品詞の場合は、か
な漢字変換を行った後で1語ごとに修正しなければなら
なし)という問題があった。
半面、登録する単イtIの品詞を多数の中から選択でき
るシステムでは、品詞分類を理解していない利用者にと
ってわかりにくく、しばしば誤った登録をしてしまい1
M果として利用者の意図した通りの変換が行われないと
いう問題があった。
るシステムでは、品詞分類を理解していない利用者にと
ってわかりにくく、しばしば誤った登録をしてしまい1
M果として利用者の意図した通りの変換が行われないと
いう問題があった。
本発明では、登録する単語の品詞を限定することなくか
つ登録操作を容易にし、利用者の;6:回した通りの変
換が行われる単Δl’r <t 録方法を提供すること
を目的とする。
つ登録操作を容易にし、利用者の;6:回した通りの変
換が行われる単Δl’r <t 録方法を提供すること
を目的とする。
前述した問題を解決するため1本発明では2.2 Nす
る単語の語尾の変化の有無と語尾の読み方を基にして、
品詞を類推し、幾つかの候補を挙げ、候補に挙げた品詞
に基づく使用例を選択枝として表示することにした。利
用者が正しい使用例を選択することによって品詞が決定
されて登録される。
る単語の語尾の変化の有無と語尾の読み方を基にして、
品詞を類推し、幾つかの候補を挙げ、候補に挙げた品詞
に基づく使用例を選択枝として表示することにした。利
用者が正しい使用例を選択することによって品詞が決定
されて登録される。
本発明によると、ベア録される単語の語尾変化の有無や
語尾の読み方を基にして、登録される単語9品詞が類推
され、類推された品詞を基にして使h・1 用例が表示される。利用者が正しい使用例を選択するこ
とで、登録される単語の品詞が決定されるので、品詞の
分類を理解していない利用者であっても誤りなく登録す
ることができる。また、利用者が品詞分類を理解してい
る必要がないので、形容詞や形容動詞、す変動制以外の
動詞も登録でき、登録できる単語の制限がなくなること
になる。
語尾の読み方を基にして、登録される単語9品詞が類推
され、類推された品詞を基にして使h・1 用例が表示される。利用者が正しい使用例を選択するこ
とで、登録される単語の品詞が決定されるので、品詞の
分類を理解していない利用者であっても誤りなく登録す
ることができる。また、利用者が品詞分類を理解してい
る必要がないので、形容詞や形容動詞、す変動制以外の
動詞も登録でき、登録できる単語の制限がなくなること
になる。
本発明による単語(2録の実施例の流れ図を第1図に示
す。この図を基にして、利用者が「着る」という単語を
「きろ」という読み方で登録する場合の実施例を説明す
る。このIlt語は、実際には予め辞書に登録されてい
るかもしれないが、このこ−とは本質的な問題ではなく
、登録されていないものとしておく。
す。この図を基にして、利用者が「着る」という単語を
「きろ」という読み方で登録する場合の実施例を説明す
る。このIlt語は、実際には予め辞書に登録されてい
るかもしれないが、このこ−とは本質的な問題ではなく
、登録されていないものとしておく。
第4図は、利用者が単語登録を指示した時の初期表示の
例である。これは、第1図のステップ101に該当する
。まず利用者は、この画面に対し登録したい単語の表記
「着る」を1例えば「ちやく」という読み方を人力し漢
字に変換゛してrftJを得、「る」を平仮名のまま入
力することで401の「着る」が入力される(以降、こ
のことを(401)というように表記する)6次に、利
用者は単語の読み方「きる」を平仮名のまま入力する(
402)、更に、利用者は語尾変化の有無を入力する。
例である。これは、第1図のステップ101に該当する
。まず利用者は、この画面に対し登録したい単語の表記
「着る」を1例えば「ちやく」という読み方を人力し漢
字に変換゛してrftJを得、「る」を平仮名のまま入
力することで401の「着る」が入力される(以降、こ
のことを(401)というように表記する)6次に、利
用者は単語の読み方「きる」を平仮名のまま入力する(
402)、更に、利用者は語尾変化の有無を入力する。
「着る」という単語は、r着な−」、r着ます」という
ように語尾が変化するので、利用者は「語尾変化あり」
を、Ii味する「1」を入力する(403)。
ように語尾が変化するので、利用者は「語尾変化あり」
を、Ii味する「1」を入力する(403)。
第4図の画面で必要な3項目がすべて人力されると、第
1図のステップ102に進み1語尾変化があるので、更
にステップ103へ進む。語尾変化がある場合、国語辞
典の見出しの形(原則として終止形)で入力されていれ
ば語尾の行で、形賓詞、動詞の判別が可能であり、語尾
の音が「イ」であれば形容詞、つ段の音であれば動詞で
ある。
1図のステップ102に進み1語尾変化があるので、更
にステップ103へ進む。語尾変化がある場合、国語辞
典の見出しの形(原則として終止形)で入力されていれ
ば語尾の行で、形賓詞、動詞の判別が可能であり、語尾
の音が「イ」であれば形容詞、つ段の音であれば動詞で
ある。
「きる」の最後の音は「ル」なので、動詞ということに
なり、ステップ104に進む。動詞の場合は、更に活用
形の判別が必要である。現代語の動詞の活用形には、五
段活用、上一段活用、ドー段活用、す行変格活用、力行
変格活用がある。この内、力行変格活用は「来るJに限
られるので、ここでは考える必要はない。また、す行変
格括用(通當、す変と呼ばれる)はr〜するJという言
い方をする単語に限られるが1国語辞典の見出しではば
h尾の[するJを除いた部分で検索するのでここでは考
える必要はない。したがって、五段活用、上一段活用、
下一段活用の3種類を考えればよい。
なり、ステップ104に進む。動詞の場合は、更に活用
形の判別が必要である。現代語の動詞の活用形には、五
段活用、上一段活用、ドー段活用、す行変格活用、力行
変格活用がある。この内、力行変格活用は「来るJに限
られるので、ここでは考える必要はない。また、す行変
格括用(通當、す変と呼ばれる)はr〜するJという言
い方をする単語に限られるが1国語辞典の見出しではば
h尾の[するJを除いた部分で検索するのでここでは考
える必要はない。したがって、五段活用、上一段活用、
下一段活用の3種類を考えればよい。
さて、この:3種類の活用形を判別する方法があるが、
上一段活用の動詞は国語辞典の見出しの形ではすへて、
最後の音が「ル」であり、最後から2番目の音がイ段の
音である。また、下一段活用一の動詞は国語辞典の(J
、出しの形ではすべて、最後の音が「ル」であり、最後
から2tF目の音が二段の音である。一方、昇段活用の
動詞は最後の音が[ルJの場合もあり、それ以外のつ段
の音の場合もある。したがって、最後の音が「ル」でか
つ最後から2#目の音がイ段の音ならば、ステップ1@
X93からステップ104を通りステッ゛ブ106へ進
み、」下一段活用と11段活用を候補とする。最後の音
が[ルJでかつ最後から2番目の音が二段の音ならば、
ステップ10:3からステップ104を通りステップ1
07へ進み、下一段活用と昇段活用を候補とする。最後
の音が「ルj以外のつ段の音であれば、ステップ103
がらステップ105へ進み、昇段活用のみを候補とする
。最後の背が「ルJでかつ最後から2番目の音がイ段の
音でも二段の音でもない場合も、ステップ1o:3がら
ステップ104を通ってステップ105へ進み、昇段活
用のみを候補とする。ここで、FきるJという単語は、
最後の音が[ルJで最後から2番目の音がイ段の音なの
で、昇段活用と上一段活用を候補とする6 最終的な活用形は、候Mtiに基づきr〜しないjの言
い方をステップ110で表示し、利用者が正しいと判断
した候補を選択することによってステップ111で確定
する。上一段活用及び下一段活用の場合は、国語辞典の
見出しの形から、最後の音の「ル」を取り除き、〔ない
」を付けた形がr〜しないJの言い方である。昇段活用
の場合は。
上一段活用の動詞は国語辞典の見出しの形ではすへて、
最後の音が「ル」であり、最後から2番目の音がイ段の
音である。また、下一段活用一の動詞は国語辞典の(J
、出しの形ではすべて、最後の音が「ル」であり、最後
から2tF目の音が二段の音である。一方、昇段活用の
動詞は最後の音が[ルJの場合もあり、それ以外のつ段
の音の場合もある。したがって、最後の音が「ル」でか
つ最後から2#目の音がイ段の音ならば、ステップ1@
X93からステップ104を通りステッ゛ブ106へ進
み、」下一段活用と11段活用を候補とする。最後の音
が[ルJでかつ最後から2番目の音が二段の音ならば、
ステップ10:3からステップ104を通りステップ1
07へ進み、下一段活用と昇段活用を候補とする。最後
の音が「ルj以外のつ段の音であれば、ステップ103
がらステップ105へ進み、昇段活用のみを候補とする
。最後の背が「ルJでかつ最後から2番目の音がイ段の
音でも二段の音でもない場合も、ステップ1o:3がら
ステップ104を通ってステップ105へ進み、昇段活
用のみを候補とする。ここで、FきるJという単語は、
最後の音が[ルJで最後から2番目の音がイ段の音なの
で、昇段活用と上一段活用を候補とする6 最終的な活用形は、候Mtiに基づきr〜しないjの言
い方をステップ110で表示し、利用者が正しいと判断
した候補を選択することによってステップ111で確定
する。上一段活用及び下一段活用の場合は、国語辞典の
見出しの形から、最後の音の「ル」を取り除き、〔ない
」を付けた形がr〜しないJの言い方である。昇段活用
の場合は。
最後の音を最後の音と同じ行でア段の音に変え、「ない
」を付けた形がr〜しない」の言い方である。
」を付けた形がr〜しない」の言い方である。
したがって、「きる」が上一段活用であれば、「きる」
から「る」を取り除いてrない」を付けた「きないJか
、r〜しない」の言い方である。
から「る」を取り除いてrない」を付けた「きないJか
、r〜しない」の言い方である。
「きるJが昇段活用であれば、「きる」の最後のt+
rる」を同じ行で7段の音「ら」に変えて「ない」を付
けたrきらないJが、E〜しない」の言い方であろ6そ
こで、利用者に対・し「〜しない」の正しい−ぽい方が
、「きらない」 「きない」のどちらであるか問い合わ
せる(第5図)。[イするJのr〜しないJのHい方は
「きない」なので、利用者は[2」を人力し、上一段活
用であることがわかる。第5図には、「該当なし」の選
択枝もあるが、これは利用者が人力を誤った際の取り消
しのためのものであり、これが選択されると第1図の上
ではステップ111から[されないjの矢印に従ってス
テップ101へ戻る。
rる」を同じ行で7段の音「ら」に変えて「ない」を付
けたrきらないJが、E〜しない」の言い方であろ6そ
こで、利用者に対・し「〜しない」の正しい−ぽい方が
、「きらない」 「きない」のどちらであるか問い合わ
せる(第5図)。[イするJのr〜しないJのHい方は
「きない」なので、利用者は[2」を人力し、上一段活
用であることがわかる。第5図には、「該当なし」の選
択枝もあるが、これは利用者が人力を誤った際の取り消
しのためのものであり、これが選択されると第1図の上
ではステップ111から[されないjの矢印に従ってス
テップ101へ戻る。
次に、 m14尾変化のない語を登録する例として。
[発明Jという語を登録する場合の実施例を説明する。
この単語も、実際には予め辞書に<7録されているかも
しれないが、このことは本質的な問題ではなく、登録さ
れていないものとしておく。
しれないが、このことは本質的な問題ではなく、登録さ
れていないものとしておく。
利用者は、第6図のように、表記「発明Jの文字を、例
えば「はつ」という読みで人力し漢字に変換することで
「発」を得、「あかるい」という読みで人力し漢字に変
換した後「る」と「いJの文字を削除することで「明J
を得て入力する(601)。読み「はつめい」は、il
Z仮名のまま入力する(602)。「発明」という単語
は1語尾変化がないので利用者は、語尾変化なしを、ば
味する「2ノを入力する(603)。語尾変化がないの
で、第1図の上ではステップ102がらステップ112
へ進む。
えば「はつ」という読みで人力し漢字に変換することで
「発」を得、「あかるい」という読みで人力し漢字に変
換した後「る」と「いJの文字を削除することで「明J
を得て入力する(601)。読み「はつめい」は、il
Z仮名のまま入力する(602)。「発明」という単語
は1語尾変化がないので利用者は、語尾変化なしを、ば
味する「2ノを入力する(603)。語尾変化がないの
で、第1図の上ではステップ102がらステップ112
へ進む。
語尾変化がない語の品詞分類は、「−は〜である」 (
ただし、−は登録される語。以ド同様)という言い方を
するかどうか、「−する」という耳い方をするかどうか
、「−なものノという言い方をするかどうかを、スデツ
プ112でそれぞれ利用者に対し問い合わせることによ
って行う(第7図)。すべてrなし」が選択される場合
もあり、すべて「あり」が選択される場合もある。
ただし、−は登録される語。以ド同様)という言い方を
するかどうか、「−する」という耳い方をするかどうか
、「−なものノという言い方をするかどうかを、スデツ
プ112でそれぞれ利用者に対し問い合わせることによ
って行う(第7図)。すべてrなし」が選択される場合
もあり、すべて「あり」が選択される場合もある。
「発明は〜である」という言い方かあるので、利用者は
「あり」を5強味する「1」を人力する(701)。「
発明は〜である」という文では、「発明」は文の主語で
あり、名詞は主語になる語なので「発明」は名Ajjl
であることがわかる。次に、「−する」という言い方を
するかどうかを利用者に問い合わせる。r−する」とい
う7rい方をする語は、す変動用である。1゛発明する
」という耳い方があるので、利用者は「あり」を意味す
るrl」、を入力しく702)、す変動用であることが
わかる。更に、「−なもの」という言い方をするかどう
かを利用者に対し問い合わせる。「−なもの」という耳
う方をする語は、形容動詞である。1発明なもの」とい
う言う方はないので、利用者はrなしJを;は味する「
2」を人力(703)、形容動詞ではないことがわかる
。
「あり」を5強味する「1」を人力する(701)。「
発明は〜である」という文では、「発明」は文の主語で
あり、名詞は主語になる語なので「発明」は名Ajjl
であることがわかる。次に、「−する」という言い方を
するかどうかを利用者に問い合わせる。r−する」とい
う7rい方をする語は、す変動用である。1゛発明する
」という耳い方があるので、利用者は「あり」を意味す
るrl」、を入力しく702)、す変動用であることが
わかる。更に、「−なもの」という言い方をするかどう
かを利用者に対し問い合わせる。「−なもの」という耳
う方をする語は、形容動詞である。1発明なもの」とい
う言う方はないので、利用者はrなしJを;は味する「
2」を人力(703)、形容動詞ではないことがわかる
。
以上の方法によって1品Au1を分ぢiすることができ
る。
る。
本発明によると5イト録する単語の品6nJを限定する
ことなく、かつ登録操作を容易とし、利用者の意図した
通りの仮名漢字変換を行うための単H(j W’?録方
式を提供することが可能となる。
ことなく、かつ登録操作を容易とし、利用者の意図した
通りの仮名漢字変換を行うための単H(j W’?録方
式を提供することが可能となる。
第1図は、本発明の一実施例の111語登録方法のフロ
−チャート5第2図は、従来のIlj、請登録方法の例
を示した画面表示図、第3図は、<R録できない品詞が
ある場合と、ない場合を比較した説明19+、第4図〜
第7図は、本発明による!iL語登録方法の例を示す画
面表示図である。 図 152 口 第 3 Q 第41刀 茶5 面
−チャート5第2図は、従来のIlj、請登録方法の例
を示した画面表示図、第3図は、<R録できない品詞が
ある場合と、ない場合を比較した説明19+、第4図〜
第7図は、本発明による!iL語登録方法の例を示す画
面表示図である。 図 152 口 第 3 Q 第41刀 茶5 面
Claims (1)
- 【特許請求の範囲】 1、登録される単語の表記法と、読み方と、語尾変化の
有無を利用者に入力させ、 該入力情報に基づき登録される単語の品詞を類推し、類
推した品詞の候補に基づき単語の使用例を利用者に表示
し、 利用者が選択した使用例に基づいた品詞で単語を登録す
ることを特徴とする仮名漢字変換システムの単語登録方
法。 2、登録される単語の品詞分類を類推するため、登録さ
れる単語を国語辞典の見出しの形で入力することを特徴
とする請求項1記載の仮名漢字変換システムの単語登録
方法。 3、登録される単語の品詞を、名詞、サ変動詞、五段活
用動詞、上一段活用動詞、下一段活用動詞、形容詞、形
容動詞、その他に分類して登録することを特徴とする請
求項1もしくは2記載の仮名漢字変換システムの単語登
録方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1100067A JPH038053A (ja) | 1989-04-21 | 1989-04-21 | 仮名漢字変換システムの単語登録方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1100067A JPH038053A (ja) | 1989-04-21 | 1989-04-21 | 仮名漢字変換システムの単語登録方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH038053A true JPH038053A (ja) | 1991-01-16 |
Family
ID=14264121
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1100067A Pending JPH038053A (ja) | 1989-04-21 | 1989-04-21 | 仮名漢字変換システムの単語登録方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH038053A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06168230A (ja) * | 1991-03-04 | 1994-06-14 | Nec Corp | 対話型単語登録方式 |
-
1989
- 1989-04-21 JP JP1100067A patent/JPH038053A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06168230A (ja) * | 1991-03-04 | 1994-06-14 | Nec Corp | 対話型単語登録方式 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Silberztein | Formalizing natural languages: The NooJ approach | |
Shwartz et al. | Still a pain in the neck: Evaluating text representations on lexical composition | |
Lu | Computational methods for corpus annotation and analysis | |
US20080033712A1 (en) | Method of learning a second language through the guidance of pictures | |
US20150170648A1 (en) | Ebook interaction using speech recognition | |
JP3992348B2 (ja) | 形態素解析方法および装置、並びに日本語形態素解析方法および装置 | |
JP2000298667A (ja) | 構文情報による漢字変換装置 | |
US20240193194A1 (en) | Book search apparatus, book search database generation apparatus, book search method, book search database generation method, and program | |
Yuan | Is Chinese ‘daodi’‘the hell’in English speakers’ L2 acquisition of Chinese daodi… wh… questions? Effects and recoverability of L1 transfer at L2 interfaces | |
Gardner‐Chloros | Bilingual speech data: Criteria for classification | |
JPH038053A (ja) | 仮名漢字変換システムの単語登録方法 | |
JP5511161B2 (ja) | 情報処理装置および情報処理方法 | |
JP3608382B2 (ja) | 文章作成装置及び文章作成方法並びに文章作成プログラムを実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体 | |
JP2003178087A (ja) | 外国語電子辞書検索装置および方法 | |
JP2007048187A (ja) | 見出語表示制御装置及びプログラム | |
JP2010033156A (ja) | 情報処理装置および情報処理方法 | |
JP2006012188A (ja) | 文書処理方法及び装置 | |
Glass et al. | Language and computers | |
JPH0410052A (ja) | 外国語電子辞書検索方法及び装置 | |
JPH0785040A (ja) | 表記不統一検出方法およびかな漢字変換方法 | |
JPS59103136A (ja) | カナ漢字変換処理装置 | |
JPH04256159A (ja) | かな漢字変換装置 | |
JP5338482B2 (ja) | 漢文例文検索装置およびプログラム | |
JP5297234B2 (ja) | 日本語エイリアスデータベースを利用して長音及び促音に対するエラーを減らし、日本語入力機の使用の際に単字検索機能を提供する方法及びシステム | |
JPS63115264A (ja) | 文書処理装置 |