JP2000067046A - 単語入力支援装置及び単語入力支援方法 - Google Patents
単語入力支援装置及び単語入力支援方法Info
- Publication number
- JP2000067046A JP2000067046A JP10236721A JP23672198A JP2000067046A JP 2000067046 A JP2000067046 A JP 2000067046A JP 10236721 A JP10236721 A JP 10236721A JP 23672198 A JP23672198 A JP 23672198A JP 2000067046 A JP2000067046 A JP 2000067046A
- Authority
- JP
- Japan
- Prior art keywords
- spelling
- foreign language
- word
- character string
- notation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 17
- 230000002194 synthesizing effect Effects 0.000 claims description 10
- 238000000354 decomposition reaction Methods 0.000 claims description 8
- 238000012217 deletion Methods 0.000 claims description 7
- 230000037430 deletion Effects 0.000 claims description 7
- 230000001755 vocal effect Effects 0.000 abstract 1
- 238000006243 chemical reaction Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 9
- 230000001788 irregular Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 235000016496 Panda oleosa Nutrition 0.000 description 3
- 240000000220 Panda oleosa Species 0.000 description 3
- 235000008429 bread Nutrition 0.000 description 3
- 238000012790 confirmation Methods 0.000 description 3
- 206010034719 Personality change Diseases 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 101150067113 prxl2a gene Proteins 0.000 description 1
Landscapes
- Document Processing Apparatus (AREA)
Abstract
も正しい単語の候補を挙げると共に、偶然他の単語を綴
ってしまった場合にもその綴りが誤っている可能性を指
摘する。 【解決手段】 入力部1に入力されたカタカナ表記の単
語を、日本語表記・外国後綴り変換部3は、発音単位に
分解し、日本語表記・外国語綴り対応データ部2の知識
を参照しながらカタカナ表記に対応する外国語単語の候
補の綴りを合成する。外国語単語判定部5は、外国語辞
書4を参照して、合成された外国語単語の各候補が単語
として存在するのか否かを判定する。存在することが判
定された候補は、表示部6に表示される。
Description
ワードプロセッサ等を用いた文書作成装置や、単語の綴
り確認を行う装置や方法に関し、特に、使用者(オペレ
ータ)が曖昧にしか覚えていない外国語の綴りの入力を
支援する単語入力支援装置及び単語入力支援方法に関す
る。
等を用いた文書作成装置において、外国語を入力する要
求が増加している。このような、要求に対応する文書作
成装置では、予め、かな表記などの単語に対応する外国
語を辞書に格納している。そして、かな入力された単語
に対応する外国語をこの辞書から検出して変換処理、又
は表示処理を行っている。更に、特開平5−28229
3号に記載されている文書作成装置では、検出された動
詞の活用形を選択する機能が設けられている。又、英語
等の単語の綴りをチェックするための各種装置も開発さ
れている。これらは、いわゆるスペルチェッカ称されて
いる。
辞書の形式で予め保持し、チェックする文書中にこの辞
書にない単語が出現した場合、単語が誤って入力された
と仮定し、この誤った入力をユーザに通知する。スペル
チェッカは、更に、その誤って入力されたと仮定された
単語と似た綴りをもつ辞書中の単語を、修正すべき候補
の単語としてユーザに提示する。
の類似性は、綴り文字の置換距離を基本として判断され
ている。置換距離とは、元の綴り文字から結果の綴り文
字を得るのに必要な文字変化操作、即ち、文字を置換し
たり、文字を削除したり、文字を付け加えたりした操作
の回数を距離として扱う方法である。この方法では、例
えば「lite」という単語の入力に対して、「line」(一
文字置換)、「liter」(一文字追加)、「lit」(一文
字削除)などの単語が、近距離にある正しい単語の候補
として挙げられる。
前述の置換距離の近い単語が正しい単語の候補として挙
げられるので、タイプミスによる綴り誤りに対してはあ
る程度効果的に修正ができる。
成装置では、辞書に格納されているかな表記と対象外国
語表記との対応から検索されるのみである。従って、ユ
ーザが所望の単語のかな表記があいまいで間違っている
場合等、本来ユーザが望んでいる単語は、検出されな
い。特に、自国語と外国語では、音韻適違い等からこの
ような問題が数多く生じる。
りの原因はタイプミスのみに限られない。特に外国語を
書くときの綴りの誤りは、単なるタイプミスではなく、
ユーザの母国語と、今書こうとしている外国語の音韻的
な違いに起因することが多い。
発音と「R」の発音とは区別が難しい。日本語のカタカ
ナ表記に直した場合に「ライト」と表記される英語の単
語は「light」,「right」,「write」など複数があり
得る。日本人が英文を書くとき、これらの単語を混同し
て使用することが起こりうる。このように日本語の発音
に引きずられて英語のスペルを誤って綴ると、正しいス
ペルから大きく離れてしまうことがある。
e」と綴って入力してしまった場合、従来のスペルチェ
ッカでは、前述のように「line」,「liter」,「lit」
などは正しい単語の候補として挙げられる。しかし、本
来候補として欲しい「light」は「lite」からの置換距
離が遠いために、これを正しい単語の候補として挙げる
ことは困難であった。このように従来の技術では、音韻
的な原因で外国語の綴りを誤った場合に適切な修正候補
を挙げることができないという問題点がある。
持している辞書にない綴りに対してのみ処理が実行さ
れ、たまたま意図した単語とは別の単語の綴りを書いて
しまった場合にはその誤りを推測することができなかっ
た。例えば日本語のカタカナ表記で「ライト」と書かれ
る英単語としては「light」,「right」,「write」な
どが存在するが、例えば「light」の意味で「write」の
綴りを誤って書いてしまったような場合には、従来のス
ペルチェッカではその誤りの可能性を指摘することがで
きない。
の綴りを誤った場合にも正しい単語の候補を挙げること
ができ、かつ、偶然他の単語を綴ってしまった場合にも
その綴りが誤っている可能性を指摘して正しい単語の候
補を挙げることができる単語入力支援装置及び単語入力
支援方法を提供するところにある。
め、この発明の第1の観点に係る単語入力支援装置は、
日本語のローマ表記の綴りと、所望の外国語の綴りとを
音韻に基づいて対応づけて格納する第1格納手段と、入
力されたカタカナ表記の単語を発音単位に分解し、前記
第1格納手段を参照して得られる外国語の綴りを合成し
て文字列を生成する生成手段と、前記外国語の単語を格
納する第2格納手段と、前記生成手段により生成された
文字列が前記第2格納手段に単語として格納されている
か判定する判定手段と、この判定手段により前記第2格
納手段に単語として格納されていると判定された文字列
を表示する表示手段とを具備することを特徴とする。
日本語のカタカナでどのように表記されるかに関する知
識を保持している。この日本語表記・外国語綴り対応知
識の第一の表現形式として、日本語のカタカナ表記に対
応する外国語の単語の綴りをデータの形式で保持してい
る。このデータを用いることで、カタカナを入力として
それに対応する外国語の綴りの可能性が合成できる。そ
の合成された単語の可能性のある綴りを実際の外国語辞
書の見出しと照らし合わせることによって、元のカタカ
ナ表記で表される外国語の単語を得ることができる。こ
の発明によれば、綴りを明確に覚えていない外国語単語
に対してカタカナで発音を入力することで外国語の単語
の候補が表示されるので、綴り誤りを侵すことなく外国
語の単語を綴ることができる。
をローマ字表記の単語に変換した後に発音単位に分解す
るように構成しても良い。
の文字列とを慣習にもとづいて対応づけて格納する第3
格納手段を具備し、前記生成手段は、前記第3格納手段
を参照し、前記入力されたカタカナ表記の単語に対応す
る文字列を検出するようにしてもよい。
力支援装置は、所望の外国語表記の綴りと、日本語ロー
マ字表記の綴りとを音韻に基づいて対応づけて格納する
第1格納手段と、入力された外国語の文字列を発音単位
に分解し、前記第1格納手段を参照して得られる日本語
ローマ字表記の綴りを合成して文字列を生成する第1生
成手段と、日本語のローマ表記の綴りと、所望の外国語
の綴りとを音韻に基づいて対応づけて格納する第2格納
手段と、前記第1生成手段により生成された文字列を発
音単位に分解し、前記第2格納手段を参照して得られる
外国語の綴りを合成して文字列を生成する第2生成手段
と、前記外国語の単語を格納する第3格納手段と、前記
第2生成手段により生成された文字列が前記第3格納手
段に単語として格納されているか判定する判定手段と、
この判定手段により前記第2格納手段に単語として格納
されていると判定された文字列を表示する表示手段と、
を具備することを特徴とする。
の文字列を末尾から1文字ずつ削除する末尾側削除手段
と、前記第2格納手段を参照して対応する外国語の綴り
を取得する外国語綴り取得手段と、前記外国語綴り取得
手段が外国語の綴りを取得したときに前記末尾側削除手
段で削除された文字列を新たな日本語ローマ字表記の文
字列として生成する第3生成手段と、前記末尾側削除手
段、前記外国語綴り取得手段及び前記第3生成手段を繰
り返し実行させる制御手段と、該制御手段により繰り返
して実行された前記外国語綴り取得手段がそれぞれ取得
した外国語綴りを合成して文字列を生成する手段とを備
える、ようにしてもよい。
外国語の文字列とを慣習にもとづいて対応づけて格納す
る第4格納手段を具備し、前記第2生成手段は、前記第
4格納手段を参照し、前記第1生成手段により生成され
た文字列に対応する文字列を検出する手段を有するよう
にしてもよい。
力支援装置は、日本語ローマ字表記の綴りと、所望の外
国語の綴りとを音韻に基づいて対応付けて格納する格納
手段と、入力された日本語ローマ字表記の文字列を発音
単位に分解し、前記格納手段を参照して得られる外国語
の綴りを合成して文字列を生成する生成手段と、を備え
ることを特徴とする。
字列を末尾から1文字ずつ削除する末尾側削除手段と、
前記格納手段を参照して対応する外国語の綴りを取得す
る外国語綴り取得手段と、前記外国語綴り取得手段が外
国語の綴りを取得したときに前記末尾側削除手段で削除
された文字列を新たな日本語ローマ字表記の文字列とし
て生成する新文字列生成手段と、前記末尾側削除手段、
前記外国語綴り取得手段及び前記新文字列生成手段を繰
り返し実行させる制御手段と、該制御手段により繰り返
して実行された前記外国語綴り取得手段がそれぞれ取得
した外国語綴りを合成して文字列を生成する手段とを備
える、ようにしてもよい。
力支援方法は、入力されたカタカナ表記の単語を発音単
位に分解するステップと、日本語のローマ表記の綴り
と、所望の外国語の綴りとを音韻に基づいて対応づけた
情報に基づいて、発音単位に分解された文字列に対応す
る外国語の綴りを合成して文字列を生成するステップ
と、前記生成された文字列が前記外国語において単語と
して存在するか否かを判定するステップと、前記外国語
において単語として存在すると判定された文字列を表示
するステップと、を具備することを特徴とする。
力支援方法は、入力された外国語の文字列を発音単位に
分解する第1分解ステップと、所望の外国語表記の綴り
と、日本語ローマ字表記の綴りとを音韻に基づいて対応
づけた情報に従って、前記第1分解ステップにより発音
単位に分解された文字列に対応する日本語ローマ字表記
の綴りを合成して文字列を生成する第1生成ステップ
と、前記第1生成ステップにより生成された文字列を発
音単位に分解する第2分解ステップと、日本語のローマ
表記の綴りと、所望の外国語の綴りとを音韻に基づいて
対応づけた情報に従って、前記第2分解ステップにより
発音単位に分解された文字列に対応する外国語の綴りを
合成して文字列を生成する第2生成ステップと、前記第
2生成ステップにより生成された文字列が前記外国語に
おいて単語として存在するか否かを判定するステップ
と、前記外国語において単語として存在すると判定され
た文字列を表示するステップと、を具備することを特徴
とする。
綴り対応知識の第二の表現形式として、外国語の綴りに
対応する日本語のカタカナ表記をデータの形式で保持し
ている。このデータを用いることで、外国語の綴りに対
応する日本語のカタカナ表記を得ることができる。そう
して得られた日本語のカタカナ表記に対してそれに対応
する外国語の綴りの可能性を得ることで、カタカナ表記
にした時に、元の外国語単語と類似する別の単語を得る
ことができる。この発明によれば、カタカナ表記にした
時に類似する別の単語をもつ単語に対して、その別の単
語を使用者に表示して綴り誤りの可能性を指摘すること
で、綴り誤りを減少させることができる。また、この発
明によれば、使用者が書いた元の綴りが実際には当該外
国語の単語として存在しない場合にも、それがカタカナ
で表記された時に類似する外国語単語を得ることができ
るので、このような場合にも正しい外国語の単語を綴る
ことができる。
第1及び第2実施形態を説明する。先ず、この発明に係
る文字入力装置の第1の実施形態を説明する。尚、この
発明は日本語と任意の外国語との間で有効であるが、以
下ではその外国語が英語の場合を例に取り上げて説明す
る。
ブロック図である。
る入力部である。使用者が文字をこの発明の装置に入力
する場合には、入力部1は、キーボードのような文字入
力手段である。すでに入力されてある文字をこの発明の
装置に送信する場合には、入力部1は、すでに入力され
て蓄えられている文字データを読み取る手段である。
り対応データ部である。ここには日本語のカタカナ表記
に対応する外国語の綴りの可能性がデータの形で記述さ
れている。
綴り変換部である。この日本語表記・外国語綴り変換部
3は、日本語表記・外国語綴り対応データ2に格納され
ているデータを参照して、入力部1から送信されてきた
カタカナ表記に対応する外国語単語の綴りの候補を合成
する。
図1において、5は、外国語単語判定部である。この外
国語単語判定部5は、日本語表記・外国語綴り変換部3
から送信されてきた外国語単語の候補の綴りで、外国語
辞書4の見出しを検索し、実際に当該の外国語の単語と
して存在する綴りを判定する。
表示部6は、外国語単語判定部5の出力結果の外国語単
語を使用者に表示するディスプレイのような表示装置で
ある。
応データ部に格納されている2種類のデータのうちの1
種類である日本語表記・外国語綴り不規則対応データ部
21の内容の例を表す。図3は、日本語表記・外国語綴
り対応データ部に格納されている2種類のデータのうち
のもう1種類である日本語表記・外国語綴り規則対応デ
ータ部22の内容の例を表す。
規則的対応は日本語表記・外国語綴り規則対応データ部
22に格納されている。図3がその例を表す。図3は表
形式をしており、一番左の欄に記されている日本語のロ
ーマ字表記に対して中央の欄に記されている英語の綴り
が対応しうることを表す。一番右の欄は、その対応が成
り立つ時の条件を示している。例えば、単語の表記のう
ち日本語で「アイ」と発音する部分、すなわちローマ字
で「ai」と表記される部分に対応する英語の綴りとして
は「i」「igh」「ei」「eigh」「ig」「y」などがあり
得ることが図3からわかる。そしてローマ字の「ai」に
対して英語の綴りとして「ig」「y」が対応しうるのは
それぞれ「n」が後ろに接続する場合、文頭以外の場
合、であることが示されている。
対応で、日本語表記・外国語綴り規則対応データ部22
に記述し尽くせないような不規則な対応は、日本語表記
・外国語綴り不規則データ部21に記述する。図2がそ
の例を表す。
のカタカナ表記に対して右欄に記されている英語の単語
が対応することを表す。例えば「ケーキ」という日本語
のカタカナには「cake」という英単語が対応することが
図2からわかる。「cake」を規則的に日本語の発音に当
てはめると「ケーク」または「ケイク」であるが、この
「cake」という単語は歴史的に日本語では「ケーキ」と
呼ばれており、この対応は規則的な対応に当てはまらな
いので、不規則対応データとして保持しておく必要があ
る。これは歴史的・慣習的に元の外国語の発音と日本語
での発音(ローマ字表記)とが不規則な対応となってい
る例であるが、同様に、カタカナ・外国語不規則対応デ
ータ部21には他の不規則対応の単語のデータも格納し
ておく。
源としており、英語では「questionnaire」という単語
に相当する。このように得たい言語(今の場合は英語)
以外の言語を起源とする発音が日本語で標準的になって
いる場合には、その対応を不規則データとして保持して
おく。日本語で「パン」と表現される食べ物は英語では
「bread」であるがこれも同様の例である。また日本語
で夜行なわれる試合を意味する「ナイター」は、英語で
は「night game」と表現される。このような和製英語も
不規則データとして保持しておく。
における動作を説明する。先ず、カタカナ表記の単語
(文字)が入力部1に入力される(ステップS1)。入
力されたカタカナ表記の単語は、日本語表記・外国語綴
り変換部3において、ローマ字表記に変換される(ステ
ップS2)。更に、入力された単語のカタカナ表記及び
ローマ字表記を用いて対応する外国語表記が合成される
(ステップS3)。ここでは他にも日本語表記・外国語
綴り不規則対応データ部21の検索処理も実行される。
この後、合成・検出された文字が、外国語辞書4に格納
されているか否かが判定され、格納されている単語が表
示部6に表示される(ステップS4,5)。
動作を説明する。先ず、日本人が英語を書いていてこの
発明の外国語綴り確認装置を使用する場面を想定する。
この日本人使用者は「灯り」を意味する英単語「ligh
t」の綴りが明確に思い出せなかったとする。その際に
この使用者は「ライト」とカタカナをこの発明の外国語
綴り確認装置に入力する。
本語表記・外国語綴り変換部3に送信される。日本語表
記・外国語綴り変換部3は、後の処理のため、まず入力
されたカタカナをローマ字に変換する。この場合のロー
マ字は、ヘボン式を基本とするが、ヘボン式の場合には
日本語の母音の長音が明確に表示されないので、母音の
長音は「アー」の場合「aa」、「イー」の場合「ii」、
「ウー」の場合「uu」、「エー」の場合「ee」、「オ
ー」の場合「oo」と明示することにする。今の例の「ラ
イト」の場合、「raito」というローマ字が得られる。
は、日本語表記・外国語綴り対応データ部2に格納され
たデータを参照して、この「ライト」というカタカナ表
記とそれに対応する「raito」というローマ字表記に対
応する外国語表記を合成する。
語表記・外国語綴り不規則対応データ部21を検索す
る。この例の場合には不規則対応データは見つからない
とする。次に「raito」というローマ字表記で日本語表
記・外国語綴り規則対応データ部22を検索する。
マ字表記全体で日本語表記・外国語綴り規則対応データ
部22を検索する。ローマ字表記全体に対するデータは
存在しないとする。その場合、ローマ字表記の末尾から
1文字削除してその文字列でカタカナ・外国語規則対応
データ部22を検索する。この文字列に対するデータも
存在しないとする。データが存在するようになるまでこ
のような末尾の文字を1文字削除する操作を繰り返す。
いう文字でカタカナ・外国語規則対応データ部22を検
索すると、図3から対応する英単語の綴りとしては
「r」「l」「rr」「ll」「wr」などがあり得ることがわ
かる。次に、文字列全体から「r」を削除し、残りの文
字列「aito」に対して先ほどの操作を繰り返す。すなわ
ち「aito」に対してカタカナ・外国語規則対応データ部
22を検索する。この文字列に対するデータは存在しな
いとする。
検索する。これを繰り返す。すると図3により「ai」と
いう文字列で検索した場合にデータが存在し、英語の綴
り「i」「igh」「ei」「eigh」「ig」「y」等に対応す
ることがわかる。同様に「raito」という綴り全体に対
して以上の操作を繰り返す。すると、ローマ字の「r」
「ai」「t」「o」のそれぞれに対応しうる英語の綴りの
候補が複数得られる。この例を示したのが図5(a)で
ある。
したローマ字表記の部分文字列に対応する英語綴りの候
補を組み合わせてローマ字綴り全体に対する英単語の候
補の綴りを合成する。この例の場合、「r」「ai」「t」
「o」に対応する英語綴りの候補を組み合わせて「rait
o」というローマ字表記全体に対する英単語の綴りの候
補を合成する。結果として「rite」「right」「reite」
「lytto」「light」「write」「wrytto」「wreightte」
などが得られる。外国語単語判定部5は外国語辞書4の
見出しを検索してこれらの候補の綴りが実際の英語の単
語として存在するかどうかを判定する。外国語辞書4と
しては今の例では英語辞書を用いる。英単語の候補とし
て得られた綴りのうち実際の英語辞書には「rite」「ri
ght」「light」「write」などが存在することがわかる
ので、その結果を表示部6に送信する。表示部6は使用
者にその英単語を表示する。
「ライト」に対する英語の単語として「rite」「righ
t」「light」「write」などが存在することを知ること
ができる。英語辞書を検索して実際に単語が存在した場
合、綴りだけでなくその意味情報も取り出して綴りと共
に表示することもできる。このように意味情報を表示す
れば、この例のようにカタカナ表記に対応する英語の単
語が複数存在する場合に、使用者がその中から目的の単
語を正しく選択するのに役に立つ。
例にとる。この場合には、日本語表記・外国語不規則対
応データ部21にもデータが存在し、「bread」という
英単語の綴りが得られる。日本語表記・外国語綴り規則
対応データ部22からは前の例の場合と同様の手順で
「pan」「pun」「pon」「pann」「pam」「pamm」などが
単語の候補の綴りとして得られる(英語の綴り候補は図
5(b)参照)。外国語単語判定部5はこれら全てを対
象にして外国語辞書4を検索し実際に存在する単語かど
うかを判定し、結果として存在する単語である「brea
d」「pan」「pun」などを使用者に表示する。その際、
辞書からその意味も取り出して綴りと共に表示すれば単
語選択の役にたつ。
第2の実施形態について説明する。図6は、この発明請
求項2の構成例を表すブロック図である。前記図6にお
いて、参照符号1、2、3、4、5、6は図1と同様
に、それぞれ、入力部、日本語表記・外国語綴り対応デ
ータ部、日本語表記・外国語綴り変換部、外国語辞書、
外国語単語判定部、表示部である。図6において7は外
国語綴り・日本語表記対応データ部である。ここには外
国語の綴りに対応する日本語の表記に関する知識がデー
タの形で格納されている。8は外国語綴り・日本語表記
変換部である。外国語綴り・日本語表記変換部8は、外
国語綴り・日本語表記対応データ部7を参照すること
で、入力された外国語の綴りに対応する日本語の表記を
得る。
を日本語の発音に対応させた日本語での表記を得る方法
としては、特公平6−68746号特許に記載されてい
るような方法が知られているのでそれを採用することが
できるが、以下では図7を用いて説明する。図7は外国
語綴り・日本語表記対応データ部7に格納されているデ
ータの例を示した表である。一番左の欄には英語の単語
を構成する綴りが示されている。左から2番目の欄に
は、英単語の綴りが持ちうる発音が示されている。左か
ら3番目の欄には、その綴りのその発音を日本語で表記
する場合の表記の可能性がローマ字で記述してある。こ
の場合のローマ字表記は前述したものと同じくヘボン式
を基本として母音の長音を明示した表記である。
における動作を説明する。先ず、外国語表記の単語が入
力部1に入力される(ステップS11)。この入力され
た文字からカタカナ表記の文字が合成される(ステップ
S12)。合成されたカタカナ表記が用いられ、対応す
る外国語表記が合成される(ステップ13)。ここでは
他にも日本語表記・外国語綴り不規則対応データ部21
の検索処理も実行される。この後、合成・検出された文
字が、外国語辞書4に格納されているか否かが判定さ
れ、格納されている単語が表示部6に表示される(ステ
ップS14,15)。
説明する。今日本人が英語を書いていて「灯り」を意味
する英単語「light」の綴りが明確に思い出せなかった
場合にこの発明の外国語綴り確認装置を使用する場面を
想定する。この日本人使用者は、「ライト」という発音
を手がかりにして目的の英単語と思われる綴り「rite」
を入力する。この「rite」という綴りを得た外国語綴り
・日本語表記変化部8は、外国語綴り・日本語表記対応
データ部7を参照してこの「rite」という綴りに対応す
る日本語の表記を得る。
e」全体で外国語綴り・日本語表記対応データ部7を検
索する。この綴り全体に対するデータは存在しないとす
る。その場合、末尾から1文字削除した綴りで再び検索
する。この例の場合、「rit」で検索する。この操作を
外国語綴り・日本語表記対応えーた部7にデータが見つ
かるまで繰り返す。今の例の場合、図7によれば、先頭
の「r」という文字列に対してデータが存在する。この
操作を繰り返し、「r」「i」「t」「e」という英単語綴
りの単位に対して日本語表記のデータが得られる。外国
語綴り・日本語表記変換部8は綴りの各部分に対して得
られた日本語表記データを組み合わせて、入力された綴
り全体に対する日本語表記を合成する。今の例の場合、
「r」「i」「t」「e」という英単語綴りの単位に対する
日本語表記のデータを組み合わせて、「rite」全体に対
する日本語表記の候補を合成する。
ある。結果として「rite」の発音を日本語の発音体系で
表した場合の日本語の表記としては、「rite」(リ
テ)、「raite」(ライテ)、「raitii」(ライティ
ー)、「raito」(ライト)などが得られる。この結果
は日本語表記・外国語綴り変換部3に送信される。日本
語表記・外国語綴り変換部3は、日本語表記・外国語綴
り対応データ部を参照して、これらの日本語表記のそれ
ぞれに対応する英語の表記を合成する。今の例の場合、
「rite」(リテ)と日本語で表記される発音をもつ英単
語の候補の綴りとしては「litte」「wryte」などが得ら
れる。「raito」(ライト)と日本語で表記される発音
の英単語の綴りの候補としては「rite」「right」「rei
te」「lytto」「light」「write」「wrytto」「wreight
te」などが得られる。
を受け取った外国語単語判定部5は、外国語辞書4の見
出しを検索してこれらの候補が実際に単語として存在す
るかどうかを判定する。今の例の場合、英語辞書の見出
しを検索し、実際に単語として、日本語で「ライト」と
発音する単語「rite」「right」「light」「write」な
どが存在することがわかる。これらの綴りは表示部に送
信され、表示部で使用者に表示される。辞書検索の際、
綴りだけでなくその意味も辞書から取り出して表示部に
送信し、綴りと一緒に表示することも可能である。その
ようにすると使用者が正しい単語を選択する際の助けと
なる。
として「rite」と綴った使用者は、この綴りの発音を日
本語で表記した場合の「ライト」という発音と同じ発音
をもつ英単語群を得ることができる。今の例の場合、
「rite」(儀式)、「right」(右、正しい)、「ligh
t」(灯り、軽い)、「write」(書く)などが表示され
るので、使用者は「灯り」という意味を持つ目的の単語
の綴り「light」を選択することができる。この例の場
合、使用者が入力した「rite」という綴りの単語も存在
するが、この発明によれば、このような場合でも、日本
語で発音を表記した場合に類似する別の単語を表記する
ことができる。従来のスペルチェッカでは、辞書にない
単語が入力された場合にのみ正しい単語の綴りの候補を
表示する仕様になっているので、この例のようにたまた
ま別の単語の綴りを入力してしまった場合にはその誤り
の可能性を指摘し正しい単語の綴りの候補を提示するこ
とができなかった。この発明にはこのような利点があ
る。
国語の単語を書く際に、カタカナで発音を入力して所望
の単語の綴りを得ることができる。従来綴りの明確でな
い外国語の単語に関しては、一般には使用者が綴りの可
能性を一つ一つ合成して、一つ一つ辞書を調べるしか方
法がなかったので、この発明によって綴りの確認に要す
る時間を大幅に減少させることができる。また、この発
明によれば、使用者が書いた綴りが、使用者の意図した
単語と発音の似た別の単語であった場合にも、その綴り
が誤りである可能性が指摘できる。従来はたまたま別の
単語を書いてしまった場合にはその誤りの可能性を指摘
する方法がなかったが、この発明により、この種の綴り
誤りを減少させることが可能となる。
装置の構成を示すブロック図である。
規則対応データ部に格納されるデータの一例を示す図で
ある。
則対応データ部に格納されるデータの一例を示す図であ
る。
チャートである。
り変換部により合成される外国語単語の綴り候補の一例
を示す図である。
装置の構成を示すブロック図である。
応データ部に格納されるデータの一例を示す図である。
チャートである。
換部8により合成される日本語のローマ字表記の一例を
示す図である。
Claims (10)
- 【請求項1】日本語のローマ表記の綴りと、所望の外国
語の綴りとを音韻に基づいて対応づけて格納する第1格
納手段と、 入力されたカタカナ表記の単語を発音単位に分解し、前
記第1格納手段を参照して得られる外国語の綴りを合成
して文字列を生成する生成手段と、 前記外国語の単語を格納する第2格納手段と、 前記生成手段により生成された文字列が前記第2格納手
段に単語として格納されているか判定する判定手段と、 この判定手段により前記第2格納手段に単語として格納
されていると判定された文字列を表示する表示手段と、 を具備することを特徴とする単語入力支援装置。 - 【請求項2】前記生成手段は、前記カタカナ表記の単語
をローマ字表記の単語に変換した後に発音単位に分解す
ることを特徴とする請求項1に記載の単語入力支援装
置。 - 【請求項3】カタカナ表記の単語と、前記外国語の文字
列とを慣習にもとづいて対応づけて格納する第3格納手
段を具備し、 前記生成手段は、前記第3格納手段を参照し、前記入力
されたカタカナ表記の単語に対応する文字列を検出する
手段を有することを特徴とする請求項1に記載の単語入
力支援装置。 - 【請求項4】所望の外国語表記の綴りと、日本語ローマ
字表記の綴りとを音韻に基づいて対応づけて格納する第
1格納手段と、 入力された外国語の文字列を発音単位に分解し、前記第
1格納手段を参照して得られる日本語ローマ字表記の綴
りを合成して文字列を生成する第1生成手段と、 日本語のローマ表記の綴りと、所望の外国語の綴りとを
音韻に基づいて対応づけて格納する第2格納手段と、 前記第1生成手段により生成された文字列を発音単位に
分解し、前記第2格納手段を参照して得られる外国語の
綴りを合成して文字列を生成する第2生成手段と、 前記外国語の単語を格納する第3格納手段と、 前記第2生成手段により生成された文字列が前記第3格
納手段に単語として格納されているか判定する判定手段
と、 この判定手段により前記第2格納手段に単語として格納
されていると判定された文字列を表示する表示手段と、 を具備することを特徴とする単語入力支援装置。 - 【請求項5】前記第2生成手段は、日本語ローマ字表記
の文字列を末尾から1文字ずつ削除する末尾側削除手段
と、前記第2格納手段を参照して対応する外国語の綴り
を取得する外国語綴り取得手段と、前記外国語綴り取得
手段が外国語の綴りを取得したときに前記末尾側削除手
段で削除された文字列を新たな日本語ローマ字表記の文
字列として生成する第3生成手段と、前記末尾側削除手
段、前記外国語綴り取得手段及び前記第3生成手段を繰
り返し実行させる制御手段と、該制御手段により繰り返
して実行された前記外国語綴り取得手段がそれぞれ取得
した外国語綴りを合成して文字列を生成する手段と、 を備えることを特徴とする請求項4に記載の単語入力支
援装置。 - 【請求項6】日本語ローマ字表記の単語と、前記外国語
の文字列とを慣習にもとづいて対応づけて格納する第4
格納手段を具備し、 前記第2生成手段は、前記第4格納手段を参照し、前記
第1生成手段により生成された文字列に対応する文字列
を検出する手段を有する、ことを特徴とする請求項4に
記載の単語入力支援装置。 - 【請求項7】日本語ローマ字表記の綴りと、所望の外国
語の綴りとを音韻に基づいて対応付けて格納する格納手
段と、 入力された日本語ローマ字表記の文字列を発音単位に分
解し、前記格納手段を参照して得られる外国語の綴りを
合成して文字列を生成する生成手段と、 を備えることを特徴とする単語入力支援装置。 - 【請求項8】前記生成手段は、日本語ローマ字表記の文
字列を末尾から1文字ずつ削除する末尾側削除手段と、
前記格納手段を参照して対応する外国語の綴りを取得す
る外国語綴り取得手段と、前記外国語綴り取得手段が外
国語の綴りを取得したときに前記末尾側削除手段で削除
された文字列を新たな日本語ローマ字表記の文字列とし
て生成する新文字列生成手段と、前記末尾側削除手段、
前記外国語綴り取得手段及び前記新文字列生成手段を繰
り返し実行させる制御手段と、該制御手段により繰り返
して実行された前記外国語綴り取得手段がそれぞれ取得
した外国語綴りを合成して文字列を生成する手段と、 を備えることを特徴とする請求項7に記載の単語入力支
援装置。 - 【請求項9】入力されたカタカナ表記の単語を発音単位
に分解するステップと、 日本語のローマ表記の綴りと、所望の外国語の綴りとを
音韻に基づいて対応づけた情報に基づいて、発音単位に
分解された文字列に対応する外国語の綴りを合成して文
字列を生成するステップと、 前記生成された文字列が前記外国語において単語として
存在するか否かを判定するステップと、 前記外国語において単語として存在すると判定された文
字列を表示するステップと、 を具備することを特徴とする単語入力支援方法。 - 【請求項10】入力された外国語の文字列を発音単位に
分解する第1分解ステップと、 所望の外国語表記の綴りと、日本語ローマ字表記の綴り
とを音韻に基づいて対応づけた情報に従って、前記第1
分解ステップにより発音単位に分解された文字列に対応
する日本語ローマ字表記の綴りを合成して文字列を生成
する第1生成ステップと、 前記第1生成ステップにより生成された文字列を発音単
位に分解する第2分解ステップと、 日本語のローマ表記の綴りと、所望の外国語の綴りとを
音韻に基づいて対応づけた情報に従って、前記第2分解
ステップにより発音単位に分解された文字列に対応する
外国語の綴りを合成して文字列を生成する第2生成ステ
ップと、 前記第2生成ステップにより生成された文字列が前記外
国語において単語として存在するか否かを判定するステ
ップと、 前記外国語において単語として存在すると判定された文
字列を表示するステップと、 を具備することを特徴とする単語入力支援方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP23672198A JP3387421B2 (ja) | 1998-08-24 | 1998-08-24 | 単語入力支援装置及び単語入力支援方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP23672198A JP3387421B2 (ja) | 1998-08-24 | 1998-08-24 | 単語入力支援装置及び単語入力支援方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2000067046A true JP2000067046A (ja) | 2000-03-03 |
| JP3387421B2 JP3387421B2 (ja) | 2003-03-17 |
Family
ID=17004806
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP23672198A Expired - Fee Related JP3387421B2 (ja) | 1998-08-24 | 1998-08-24 | 単語入力支援装置及び単語入力支援方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3387421B2 (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2003150472A (ja) * | 2001-11-15 | 2003-05-23 | Nippon Telegr & Teleph Corp <Ntt> | ブックマーク共有方法およびその装置、並びに前記方法のプログラムおよびこのプログラムを記憶した記憶媒体 |
| JP2022075104A (ja) * | 2020-11-06 | 2022-05-18 | 富士フイルムビジネスイノベーション株式会社 | 入力支援装置、入力支援システム及びプログラム |
-
1998
- 1998-08-24 JP JP23672198A patent/JP3387421B2/ja not_active Expired - Fee Related
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2003150472A (ja) * | 2001-11-15 | 2003-05-23 | Nippon Telegr & Teleph Corp <Ntt> | ブックマーク共有方法およびその装置、並びに前記方法のプログラムおよびこのプログラムを記憶した記憶媒体 |
| JP2022075104A (ja) * | 2020-11-06 | 2022-05-18 | 富士フイルムビジネスイノベーション株式会社 | 入力支援装置、入力支援システム及びプログラム |
Also Published As
| Publication number | Publication date |
|---|---|
| JP3387421B2 (ja) | 2003-03-17 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5835924A (en) | Language processing apparatus and method | |
| US9069753B2 (en) | Determining proximity measurements indicating respective intended inputs | |
| US7149970B1 (en) | Method and system for filtering and selecting from a candidate list generated by a stochastic input method | |
| MX2007013357A (es) | Metodo y sistema para generar sugerencias ortograficas. | |
| JPH07325828A (ja) | 文法チェックシステム | |
| JP2003514304A (ja) | スペルミス、タイプミス、および変換誤りに耐性のある、あるテキスト形式から別のテキスト形式に変換する言語入力アーキテクチャ | |
| US20070288240A1 (en) | User interface for text-to-phone conversion and method for correcting the same | |
| KR20230009564A (ko) | 앙상블 스코어를 이용한 학습 데이터 교정 방법 및 그 장치 | |
| JP2004220616A (ja) | 3つ以上の対訳画面を同時に表示し編集可能にする機械翻訳装置 | |
| EP0271664B1 (en) | A morphological/phonetic method for ranking word similarities | |
| CN114429128B (zh) | 一种汉字-通用盲文对照语料库的构建方法及系统 | |
| JP2000067046A (ja) | 単語入力支援装置及び単語入力支援方法 | |
| JPS634206B2 (ja) | ||
| KR100342785B1 (ko) | 한국어 문자열간의 전역 유사도 측정 방법 | |
| JPH10198664A (ja) | 日本語入力システム及び日本語入力プログラムを記録した媒体 | |
| JPH08272780A (ja) | 中国語入力処理装置及び中国語入力処理方法及び言語処理装置及び言語処理方法 | |
| JPH07121538A (ja) | スペルチェック装置 | |
| JPH0434189B2 (ja) | ||
| JPS63316162A (ja) | 文書作成装置 | |
| JPH0696117A (ja) | 文書変更支援システム | |
| JPS60124777A (ja) | 文書処理装置 | |
| JPH0350668A (ja) | 文字処理装置 | |
| JPH0728800A (ja) | 文字処理方法および文字処理装置 | |
| JPS61235978A (ja) | 文字列訂正方式 | |
| JPH02136959A (ja) | 日本文訂正候補抽出装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080110 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090110 Year of fee payment: 6 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100110 Year of fee payment: 7 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110110 Year of fee payment: 8 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110110 Year of fee payment: 8 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120110 Year of fee payment: 9 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130110 Year of fee payment: 10 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130110 Year of fee payment: 10 |
|
| LAPS | Cancellation because of no payment of annual fees |