JP3285149B2 - 外国語電子辞書検索方法及び装置 - Google Patents

外国語電子辞書検索方法及び装置

Info

Publication number
JP3285149B2
JP3285149B2 JP11032590A JP11032590A JP3285149B2 JP 3285149 B2 JP3285149 B2 JP 3285149B2 JP 11032590 A JP11032590 A JP 11032590A JP 11032590 A JP11032590 A JP 11032590A JP 3285149 B2 JP3285149 B2 JP 3285149B2
Authority
JP
Japan
Prior art keywords
notation
phonetic
stream
character
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP11032590A
Other languages
English (en)
Other versions
JPH0410052A (ja
Inventor
忠信 宮内
義文 松永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP11032590A priority Critical patent/JP3285149B2/ja
Publication of JPH0410052A publication Critical patent/JPH0410052A/ja
Application granted granted Critical
Publication of JP3285149B2 publication Critical patent/JP3285149B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】
本発明は、外国語辞書(たとえば英和辞書)を引く際
に外国語(英語)の綴りがわからなくても、その発音を
自分の好みの日本語的表音表記(カタカナ表記)で検索
キーとして入力すれば外国語単語及びその意味等が検索
される外国語電子辞書の生成、検索に関するものであ
る。
【0002】
【従来の技術】
国際化の進展により、日本語に占める日本語的外国
語、所謂「カタカナ語」とくに「カタカナ英語」と呼ば
れる外来語の比率は増える一方である。 この種の外来語は、その発音をカタカナで表記した表
音表記として用いることが殆どである。その発音は日本
語の発音に沿ったものとして表現されているものが大勢
であるが、そのカタカナ表現やカタカナに対応したロー
マ字表現もまちまちである。また、元の言語(外国語)
の単語の意味とは違った意味に用いられているものも多
い。 従来、例えば特開昭61−100864号公報,特開昭57−16
1970号公報に開示のように、外国語のカタカナ表記もし
くはカタカナ相当のローマ字表記と当該外国語の綴りの
対応表を設けておき、カタカナ表記もしくはカタカナ相
当のローマ字表記の入力に対して外国語の単語の綴りを
表示して、それを基に辞書検索を行うようにしたものが
知られている。
【0003】
【発明が解決しようとする課題】
上記従来の技術のように、外国語のカタカナ表記もし
くはカタカナ相当のローマ字表記と当該外国語の綴りの
対応表を全ての外国語単語について作成することは膨大
な作業量を必要とするうえ、誤りの発生も避けられず、
効率の良いものとは言えず、また日々増えるカタカナ語
に対応してその改定を行うことは容易でない。
【0004】 一方、外国語の発音を表す表音表記としてIPA表記(I
nternational Phonetic Alphabet)などの統一した発音
表記があるが、これは日本人には分かり難いものである
と共に、既存の辞書の発音記号との対応において新たに
その発音表記を入力することは更に多大な労力を必要と
する。
【0005】 さらに、上記公報に開示されたような対応表を作成し
て電子辞書として登録しても、カタカナ表記には、表記
のゆれ、すなわちカタカナ表現のばらつき、不統一があ
り、全ての単語についてこのような表記のゆれを統一す
るための対応表をも作成し登録することは困難である。
たとえば、「gesture」という単語一つとってみても、
そのカタカナ表記には、「ゼスチャー」,「ゼスチュア
ー」,「ジェスチャー」・・など、数多くの曖昧な表記
(上記した表記のゆれ)が見られる。これを全ての単語
について登録することは不可能である。
【0006】 このように、外国語を日本的な表音で表記する際に、
音節に跨がった表記の異なり(上記のゆれ、詳しくは、
音韻上のゆれ)が存在するため、日本語における上記の
ような表記の曖昧さに起因する検索キー設定に困難性が
あり、外国語の検索キーとして当該検索システムにおけ
る表記基準(表記ルール)を知ることなく単にカタカナ
表記を用いることには問題があった。
【0007】 本発明の目的は、カタカナ語などのように、外国語の
日本語的表音表記から元の外国語を検索する際に、その
日本語の標準的表音表記を意識することなく好みの表記
で検索キーを入力できるように電子辞書の生成、検索を
するための方法および装置を提供することにある。
【0008】
【課題を解決するための手段】
本発明の外国語電子辞書検索装置は、外国語の発音記
号と日本語的表音表記との対応表を用いて、外国語辞書
の原データの発音記号から日本語的表音表記を生成する
カタカナ表記入力手段と、その生成した日本語的表音表
記を予め定めた短縮および置換テーブルを用いて補正す
る表音表記短縮手段と、その補正した表音表記を、前記
原データのキー情報として前記原データと共に登録した
辞書データベースを記憶した記憶手段と、前記辞書デー
タベースを検索する検索キーを日本語的表音表記で入力
する検索キー入力手段と、前記検索キー入力手段から入
力された日本語的表音表記を、前記キー情報作成と同様
に前記表音表記短縮手段で補正した日本語的表音表記に
より、前記記憶手段に登録された辞書データベースを検
索する検索手段と、前記検索手段の検索結果に基づいて
該当する外国語辞書の原データを出力する出力手段とを
含むことを特徴とする。
【0009】 また、本発明の外国語電子辞書の検索方法は、外国語
の発音記号と日本語的表音表記との対応表を用いて、外
国語辞書の原データの発音記号から日本語的発音表記を
生成し、その生成した日本語的表音表記を予め定めた短
縮および置換テーブルを用いて補正したものを、前記原
データのキー情報として前記原データと共に辞書データ
ベースに登録した外国語電子辞書の検索方法であって、 日本語的表音表記を検索キーとして入力するステップ
と、 前記検索キーとして入力された日本語的表音表記を、
前記キー情報作成の際に用いた短縮および置換テーブル
と同じテーブルを用いて、補正するステップと、 前記入力され補正された日本語的表音表記により、登
録された辞書データベースを検索するステップと、 前記検索により得られた結果に基づいて該当する外国
語辞書の原データを出力するステップと、 を含むことを特徴とする。 その補正するステップは、本発明の一態様では、 入力文字列および出力文字列のストリームを生成する
ステップ1と、 前記入力文字列のストリームの先頭から2文字をバッ
ファに読み込むステップ2と、 バッファに読み込まれた2文字を、2文字の表記とそ
の変換表記とを記憶している子音変換テーブルに応じて
置換するステップ3と、 前記子音変換テーブルで置換できなかった場合は、2
文字の表記とその短縮表記である1文字とを記憶してい
る二重母音テーブルに応じて置換するステップ4と、 前記子音変換テーブルもしくは前記二重母音テーブル
で置換できた場合は、結果を前記出力文字列のストリー
ムに出力するステップ5と、 前記子音変換テーブルもしくは前記二重母音テーブル
で置換できなかった場合は、先頭の1文字を、1文字置
換テーブルで置換しその結果を出力文字列のストリーム
に出力するステップ6と、 前記入力文字列のストリームのポジションが最後であ
るか否かを判断するステップ7と、 前記ステップ7において最後のポジションでないと判
断された場合は、前記入力文字列のストリームの次の2
文字について前記ステップ2からの処理を行うステップ
8と、 前記ステップ7において最後のポジションであると判
断された場合は、前記出力文字列のストリームの内容を
短縮表記として出力するステップ9と、 を含むことを特徴とする。
【0010】 本発明の外国語電子辞書検索装置は、2文字の表記と
その短縮表記とを記憶している子音変換テーブルと、2
文字の表記とその短縮表記である1文字とを記憶してい
る二重母音テーブルと、1文字の表記とその置換処理を
記憶している1文字置換テーブルを記憶している記憶手
段と、 入力文字列および出力文字列のストリームを生成する
手段と、 前記入力文字列のストリームから2文字を一時的に格
納するバッファと、 バッファに格納された2文字を前記子音変換テーブル
に応じて置換する第1の置換手段と、 前記子音変換テーブルで置換できなかった場合は前記
二重母音テーブルに応じて置換する第2の置換手段と、 前記第1および第2の置換手段のいずれにおいてもバ
ッファに格納された2文字を置換できない場合に、先頭
の1文字を前記1文字置換テーブルに応じて置換する第
3の置換手段と 前記子音変換テーブル、前記二重母音テーブルもしく
は前記1文字置換テーブルで置換した結果を前記出力文
字列のストリームに出力する手段と、 前記入力文字列のストリームのポジションが最後であ
るか否かを判断する判断手段と、 前記判断手段において最後のポジションであると判断
された場合は、前記出力文字のストリームの内容を短縮
表記として出力する手段と、 含むことを特徴とする。
【0011】
【作用】
外国語の原辞書データ(原データ)の発音記号から日
本語的表音表記(日本語の表音表記:カタカナ表記,ロ
ーマ字表記)を生成し、それを表音表記短縮による補正
したものをキー情報として生成し、この表音表記と共に
上記外国語の原データをデータベースとして登録してお
き、日本語的表音表記の検索キーを入力して、入力され
た日本語的表音表記をデータベースに登録されているキ
ー情報の補正方法と同様の方法で補正して表音表記を短
縮し、それによりデータベースを検索する。外国語辞書
に対して日本語的発音をそのまま表音表記とした検索キ
ーを用いて検索することが可能となり、その際、日本語
の標準的表音表記を意識することなく好みの表記で検索
キーを入力できる。
【0012】
【実施例】
以下、本発明の実施例について図面を参照して説明す
る。 図1は本発明による外国語電子辞書生成検索装置の概
略構成を示すブロック図であって、1は表音表記生成
部、2は表記補正部、3は記憶部、4は検索キー入力
部、5は検索結果出力手段である。
【0013】 同図において、表音表記生成部1は外国語辞書の原デ
ータから発音記号を抽出し、この発音記号に基づいてカ
タカナまたはローマ字表記の表音記号を生成する。 生成された表音表記は、表記補正部2において、表記
のゆれを一意的に短縮する処理、すなわち統一した短縮
表記とする補正処理を施す。 表記補正した表音表記は、原辞書である外国語辞書の
原データと共に記憶部3に登録される。記憶部3には表
音表記を検索キーとして格納する表音表記格納領域(日
本語的表音表記格納領域)と上記原データをその単語毎
ルコードとして格納する単語レコード格納領域とが少な
くとも設けられており、ユーザが検索キー入力部4から
カタカナやローマ字による外国語の表音記号(表音表
記)を入力することにより、その検索結果が検索結果出
力部5に出力される。
【0014】 図2は本発明を英和カタカナ検索システムに適用した
実施例の構成を説明するブロック図である。1は表音表
記生成部、2は表記補正部、3は記憶部、4は検索キー
入力部、5は検索結果出力部である。そして、表音表記
生成部1は外国語辞書の原データから発音記号を抽出
し、この発音記号に基づいてカタカナまたはローマ字表
記の表音記号を生成する。表音表記生成部1はMT等の形
とした原辞書(英和辞書)21と辞書読込手段22とカタカ
ナ表記入力手段23とから成る。すなわち、辞書読込手段
22は、原辞書21の辞書データをコンピュータで処理可能
な形の構造化する機能を有し、カタカナ表記入力手段23
は原辞書データから得られた発音記号を基に表音記号
(表音表記)を生成する機能を有し、ここではカタカナ
表記を生成する。
【0015】 次に、図2に示した実施例の構成の動作を説明する。 まず、原辞書である英和辞書のデータを基にして辞書
データベースを作成し、これを記憶手段3に登録する
が、一般に原辞書21はMTの形で電子的データとして供給
される。これを辞書読込手段22に読込み、予め決められ
た規則にしたがってコンピュータ処理可能に構造化した
テキストを作成する。
【0016】 図3は構造化テキスト例の説明図であって、辞書を構
成する一つの単語についてのレコードを示し、21は単語
「list」についての辞書項目(属性)のレコードで、見
出し語である単語「list」,その重要度**(この記号
は、例えば高校程度で習得すべきものに*、中学程度で
習得すべきものに**を付してある),発音記号〔lis
t〕,品詞項目からなり、更に品詞項目について分解し
たレコード22−1,22−2が木構造等の形で構造化された
単語レコードを生成する。同図の例では、単語「list」
を見出し語として、重要度**,発音〔list〕および品
詞としての名詞(意味:名簿、用例:Her name is..,慣
用句:make a list of..,・・)と他動詞(意味:表す,
用例:・・)・・・が図示のように構造化データとして
生成される。
【0017】 上記の構造化データから、その発音項目を取り出し、
その発音記号(図3の例では〔list〕)をカタカナ表記
入力手段23に渡す。 カタカナ表記入力手段23は与えられた発音記号からカ
タカナ表記を生成する。このカタカナ表記の生成は、既
知の日本語ワードプロセッサなどで用いられているロー
マ字→カナ変換と同様のアルゴリズムにより実行でき
る。
【0018】 日本語は各音節が母音で終わるのを基本としているこ
とで、英語等の外国語の表記と大きく異なる。この問題
を解決するため、カタカナ表記を生成するための前処理
として英語の発音記号について次のような補正を施す。
【0019】 図4は英語の発音記号に付加する補正情報の対応を示
す説明図であって、記号b,d,・・k,l,p,・・に対して、
それぞれブ,ド,・・ク,ル,プ,・・を付加する。 例えば、見出し語の単語deskの発音記号[desk]は、
その記号が[s][k]について、その後にそれぞれ
[u]をおぎなって[desuku]とし、このカタカナ発音
表記として[デスク]を生成する。
【0020】 しかし、発音記号のみでは曖昧母音[∂]を含む音節
の表記などが確定できない。そのため、カタカナ表記と
辞書読込手段から得られるつづり(スペリング)や音節
情報(“−”)を基に、発音補正を施す必要がある。
【0021】 図5は曖昧母音の補正対応表の説明図であって、[c
a,ke]には[ヶ]を、[cau,co]には[コ]を、・・・
のように対応させる。例えば、con−cern[k∂ns∂:r
n]の前半の音節‘con'は[k∂n]に対応するので
[コン]に、後半の音節‘cern'は[s∂:rn]に対応し
て[サーン]というように、図5に示した対応表によっ
て曖昧母音の発音を確定する。
【0022】 カタカナ表記入力手段23で生成されたカタカナ表記
(カナ表記)は表記補正部2の表音表記短縮手段241に
供給されて、表記のゆれを補正する表記短縮化処理を行
う。
【0023】 原辞書である英和辞書の発音記号から生成したカタカ
ナ表記は、日本語的な表記と異なるものが多く、また日
本語としてのカタカナ表記にも多様な表記(ゆれ)が存
在する。このような多種多様な表記についてまで辞書デ
ータベースに登録することはその生成作業の膨大さもさ
ることながら、記憶手段の容量を消費し、検索速度を低
下させるなど、システム全体からみて決して効率のよい
ものではない。 本発明のこの実施例では、上記表記のゆれを解決する
ために、このゆれを一意的に短縮する処理、すなわち統
一した短縮表記とする処理を施すものである。
【0024】 以下、このカタカナ表記短縮手段における短縮アルゴ
リズムを図6〜図9を参照して説明する(なお、後述す
る検索時の検索キーの短縮アルゴリズムも同一であ
る)。
【0025】 図6はカタカナ短縮アルゴリズムを説明するフローチ
ャート、図7は子音変換テーブル(CT)の説明図、図8
は二重母音テーブル(DT)の説明図、図9は一文字置換
テーブル(OT)の説明図である。
【0026】 まず、バッファのクリアや変数初期化を行った後(ス
テップ1、以下「S1」のように記す)、辞書読込手段22
から入力されたカタカナ文字列からカタカナ表記入力手
段23が表音表記短縮手段入力用のデータストリームRS
(発音記号から生成されたカタカナ表記を転送するため
のデータ転送構造、以下、単にストリームRSという)を
生成する(S2)。また同時に短縮結果を記憶手段25に格
納するための出力用のデータストリームWS(短縮処理さ
れたカタカナ表記を転送するためのデータ転送構造、以
下、単にストリームWSという)も生成しておく(S3)。
【0027】 表音表記短縮手段241はストリームRSから1文字目を
読み込んでバッファに蓄え(S4)、該文字がストリーム
RSの入力の最後のポジションであるか否かを判断し(S
5)、最後であるなら(S5でYES)S12に分岐する。最後
の文字でない場合には、すなわち当該カタカナ文字列に
未だ文字がある場合には(S5でNO)2文字目をバッファ
BFに読み込む(S6)。
【0028】 2文字目を読み込んだなら図7の子音テーブルDTによ
りバッファBFの内容の置換を行い、これをバッファBFに
書き込む(S7)。子音テーブルCTに対応する置換の表記
がなくて置換ができない場合には(S8でNO))、更に図
8の二重母音テーブルDTによりバッファBFの内容の置換
を行い(S9)、置換したものをバッファBFに書き込む。
なお、子音テーブルCTで置換できた場合(S8でYES)に
はS14に分岐する。
【0029】 ここで、子音テーブルCTと二重母音テーブルDTを別に
設けたのは、短縮処理時に子音→母音という表記の優先
順位をつけることにより、一意に短縮するためである。
また、2文字ずつ処理することで、後述するカタカナ語
特有の音節に跨がる表記のゆれを吸収することができ
る。 なお、ここでいう「短縮」は、ゆれを吸収するための
中間表現であり、図7のテーブルから明らかなように、
置換処理しても文字数が変わらない場合もある。
【0030】 図8の二重母音テーブルを用いてバッファBFの内容の
置換が行われた場合(S10でYES)、S14に分岐する。バ
ッファBFの内容の置換が行われなかった場合、すなわち
短縮がなされなかった場合(S10でNO)は、バッファBF
の2文字目をクリアして消去する(S11)。すなわち、
バッファBFには、ST4で書き込まれた一文字のみ存在し
ている。
【0031】 次に、このバッファBFに書き込まれている一文字につ
いて、図9に示した一文字置換テーブルOTを参照して置
換処理を行い(S12)、置換した結果をバッファBFに格
納する。この段階で、なおも置換されなかった文字はそ
のまま表記されることになる。
【0032】 この状態では、ストリームRSのポジションが一つ余分
に進んでいるため、該ストリームRSのポジションを一つ
戻し(S13)、バッファBFの内容をストリームWSに書き
込む(S14)。
【0033】 ストリームWSに内容を書き込んだ後、該バッファBFを
クリアし(S15)、ストリームRSのポジションが最後で
あるか否かを判断し(S16)、最後のポジションでなけ
れば(S16のNO)S4に戻って上記と同様の短縮処理を続
行する。また、最後であると判断された場合,すなわち
ストリームRSの読み込みが終了すると(S16のYES)、こ
の短縮処理は終了となり、ストリームWSの内容を短縮文
字列として記憶手段の検索キー格納領域に出力し(S1
7)、処理をおわる。
【0034】 以下、この短縮処理の具体例を「gesture」を例にと
って説明する。 単語「gesture」の発音のカタカナ表記として「ジェ
スチャー」が与えられた場合、まず、入力文字列のスト
リームRSから1文字目“ジ”と2文字目“ェ”が表音表
記短縮手段241のバッファBFに読み込まれる。バッファB
Fの内容が“ジェ”となる。
【0035】 このバッファBFの内容“ジェ”は図7に示した子音テ
ーブルCTを参照して“ゼ”に置換されて(すなわち、1
文字の表音表記に短縮されて)バッファBFに書き込まれ
た後、このバッファBFの内容が出力文字列のストリーム
WSに書き込まれると共に、該バッファBFはクリアされ
る。
【0036】 そして、ストリームRSの当該単語の発音記号から生成
したカタカナ表音表記には未だ「・・スチャー」がある
(すなわち、ストリームRSの入力ポジションは最後では
ない)ので、バッファBFに“ス”“チ”が読み込まれる
が、この“スチ”は子音テーブル,二重母音テーブルの
いずれのテーブルにも表記されていないため置換処理は
なされない。したがって、上記したように、バッファBF
に読み込まれた2文字目である“チ”が消去され、
“ス”が残り、図9の一文字テーブルでも置換の対象と
は成らないのでそのままストリームWSに書き込まれる。
【0037】 バッファBFをクリア後、次にストリームRSから読み込
まれた“チ",“ャ”も同様にしてストリームWSに書き込
まれていく。 そして、最後は“一”を読み込むが、これがストリー
ムRSの当該カタカナ表音表記の最後のポションであるの
で、直接一文字テーブルの置換対象となるが、同テーブ
ルでは‘削除’となっているので、バッファBFは空とな
って、ストリームWSには何も書き込まれずに短縮処理を
終了する。
【0038】 この結果、ストリームWSの内容は「ゼスチャ」となっ
ており、これが単語「gesture」の発音のカタカナ表記
の短縮文字列として記憶手段に出力される。 このように、生成された短縮表記を検索キーとして図
2の辞書読込手段22で生成された構造化単語レコードと
共に記憶手段25に登録される。これを原辞書のすべての
単語について繰り返すことで、カタカナ検索平和電子辞
書のデータベースが構築される。
【0039】 図10は検索結果出力部を構成する表示手段のビューの
模式図であって、上記の説明のようにして生成され構築
されたカタカナ検索英和電子辞書データベースを用いて
辞書検索を実行する場合、ユーザはまず、図2の検索キ
ー入力部4を構成するキーボード28から検索したい単語
をカタカナ表記で入力する(なお、検索キー入力部4,お
よび検索結果出力部5は種々の手段で構成できる)。
【0040】 入力された検索キーは、前記したデータベース生成時
と同様に、表記補正部2の表音表記短縮手段241で短縮
表記に変換され、この短縮表記と検索キーとして記憶手
段25に登録されているデータベースを検索する。この検
索キーの短縮表記もデータベース登録時と同じ一意的短
縮が行われるものであるため、ユーザは自分の好みのカ
タカナ表記で入力可能であり、標準的なカタカナ表記の
ルール(表記法)や上記した短縮アルゴリズムを意識す
る必要がない。
【0041】 ユーザが「gesture」について検索しようとする場
合、ユーザによっては、またはその時の気持ち次第で、
「ジェスチャー」,「ジェスチャ」,「ゼスチャー」,
「ゼスチャ」,‥等々、様々なカタカナ表記で検索キー
を入力する。すなわち、入力する検索キーの表記にゆれ
がある。しかし、この表記のゆれはデータベース登録時
と同一の「ジェスチャー」の場合は勿論のこと、他の場
合も全て「ゼスチャ」という短縮表記に一意に変換され
るため、記憶手段からは「ゼスチャ」を検索キーとして
「gesture」の単語レコードが検索される。
【0042】 図10においては、ユーザの入力した検索キー「ゼスチ
ュア」がユーザビュー131の入力ビュー132に表示され、
その検索結果の単語レコードが出力ビュー133に表示さ
れ、ユーザに提示される。
【0043】 このように、本実施例によれば、カタカナ表記を検索
キーとして入力する際に、カタカナ表記のルールを知ら
ないでも自己流のカタカナ表記で単語検索でき、また短
縮表記を検索キーとしたために記憶手段の容量も少なく
て済み、かつ高速の検索が可能となる。
【0044】
【発明の効果】
以上説明したように、本発明は、外国語の原辞書デー
タ(原データ)の発音記号から日本語的表音表記(日本
語の表音表記:カタカナ表記,ローマ字表記)を生成
し、それを補正したものを検索キーとして生成し、この
表音表記と共に上記外国語の原データをデータベースし
て登録しておき、日本語的表音表記の検索キーを入力し
て、入力された日本語的表音表記データベースに登録さ
れているキー情報の補正方法と同様の方法で補正して表
音表記を短縮し、それによりデータベースを検索するよ
うに構成したので、外国語辞書に対して日本語的発音を
そのまま表音表記とした検索キーを用いて検索すること
が可能となる。一般に分かり難い発音記号からローマ字
あるいはカタカナの発音表記が自動的に得られ、これを
検索キーとして外国語辞書を日本語的な表音表記を介し
て扱うことが可能となり、外国語が不得意な人でも発音
(表音表記)からの検索ができる。また、検索キーとし
てカタカナ等の表音表記を入力する際にその標準的な表
記ルールを意識することなく、ユーザの好みの表記で入
力することができると共に、外国語に馴染みが薄い人に
とっての日本語学習効果を向上させることができる。
【図面の簡単な説明】
【図1】 本発明による外国語電子辞書生成検索装置の
概略構成を示すブロック図、
【図2】 本発明の実施例である英和カタカナ検索シス
テムの構成を説明するブロック図、
【図3】 構造化テキストの説明図、
【図4】 英語の発音記号に付加する補正情報の対応を
示す説明図、
【図5】 曖昧母音の補正対応表の説明図、
【図6】 カタカナ短縮アルゴリズムを説明するフロー
チャート、
【図7】 子音変換テーブルの説明図、
【図8】 二重母音テーブルの説明図、
【図9】 一文字置換テーブルの説明図、
【図10】 検索結果出力部を構成する表示手段のビュ
ーの模式図、
【符号の説明】
1……表音表記生成部、2……表記補正部、241……表
音表記短縮手段、3……記憶部、4……検索キー入力
部、5……検索結果出力部。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 松永 義文 東京都渋谷区代々木3丁目57番6号 グ ランフォーレ 富士ゼロックス株式会社 内 (56)参考文献 特開 昭63−255767(JP,A) 特開 平2−67684(JP,A) 実開 昭57−78463(JP,U)

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】外国語の発音記号と日本語的表音表記との
    対応表を用いて、外国語辞書の原データの発音記号から
    日本語的表音表記を生成するカタカナ表記入力手段と、 その生成した日本語的表音表記を予め定めた短縮および
    置換テーブルを用いて補正する表音表記短縮手段と、 その補正した表音表記を、前記原データのキー情報とし
    て前記原データと共に登録した辞書データベースを記憶
    した記憶手段と、 前記辞書データベースを検索する検索キーを日本語的表
    音表記で入力する検索キー入力手段と、 前記検索キー入力手段から入力された日本語的表音表記
    を、前記キー情報作成と同様に前記表音表記短縮手段で
    補正した日本語的表音表記により、前記記憶手段に登録
    された辞書データベースを検索する検索手段と、 前記検索手段の検索結果に基づいて該当する外国語辞書
    の原データを出力する出力手段と、 を含むことを特徴とする外国語電子辞書検索装置。
  2. 【請求項2】外国語の発音記号と日本語的表音表記との
    対応表を用いて、外国語辞書の原データの発音記号から
    日本語的表音表記を生成し、その生成した日本語的表音
    表記を予め定めた短縮および置換テーブルを用いて補正
    したものを、前記原データのキー情報として前記原デー
    タと共に辞書データベースに登録した外国語電子辞書の
    検索方法であって、 日本語的表音表記を検索キーとして入力するステップ
    と、 前記検索キーとして入力された日本語的表音表記を、前
    記キー情報作成の際に用いた短縮および置換テーブルと
    同じテーブルを用いて、補正するステップと、 前記入力され補正された日本語的表音表記により、登録
    された辞書データベースを検索するステップと、 前記検索により得られた結果に基づいて該当する外国語
    辞書の原データを出力するステップと、 を含むことを特徴とする外国語電子辞書検索方法。
  3. 【請求項3】前記請求項2における補正は、 入力文字列および出力文字列のストリームを生成するス
    テップ1と、 前記入力文字列のストリームの先頭から2文字をバッフ
    ァに読み込むステップ2と、 バッファに読み込まれた2文字を、2文字の表記とその
    変換表記とを記憶している子音変換テーブルに応じて置
    換するステップ3と、 前記子音変換テーブルで置換できなかった場合は、2文
    字の表記とその短縮表記である1文字とを記憶している
    二重母音テーブルに応じて置換するステップ4と、 前記子音変換テーブルもしくは前記二重母音テーブルで
    置換できた場合は、結果を前記出力文字列のストリーム
    に出力するステップ5と、 前記子音変換テーブルおよび前記二重母音テーブルで置
    換できなかった場合は、先頭の1文字を、1文字置換テ
    ーブルで置換しその結果を出力文字列のストリームに出
    力するステップ6と、 前記入力文字列のストリームのポジションが最後である
    か否かを判断するステップ7と、 前記ステップ7において最後のポジションでないと判断
    された場合は、前記入力文字列のストリームの次の2文
    字について前記ステップ2からの処理を行うステップ8
    と、 前記ステップ7において最後のポジションであると判断
    された場合は、1文字置換テーブルを参照して置換処理
    を行った後、前記出力文字列のストリームの内容を短縮
    表記として出力するステップ9と、 を含むことを特徴とする請求項2に記載の外国語電子辞
    書検索方法。
  4. 【請求項4】前記請求項1における表音表記短縮手段
    は、 2文字の表記とその短縮表記とを記憶している子音変換
    テーブルと、2文字の表記とその短縮表記である1文字
    とを記憶している二重母音テーブルと、1文字の表記と
    その置換処理を記憶している1文字置換テーブルを記憶
    している記憶手段と、 入力文字列および出力文字列のストリームを生成する手
    段と、 前記入力文字列のストリームから2文字を一時的に格納
    するバッファと、 バッファに格納された2文字を前記子音変換テーブルに
    応じて置換する第1の置換手段と、 前記子音変換テーブルで置換できなかった場合は前記二
    重母音テーブルに応じて置換する第2の置換手段と、 前記第1および第2の置換手段のいずれにおいてもバッ
    ファに格納された2文字を置換できない場合に、先頭の
    1文字を前記1文字置換テーブルに応じて置換する第3
    の置換手段と 前記子音変換テーブル、前記二重母音テーブルもしくは
    前記1文字置換テーブルで置換した結果を前記出力文字
    列のストリームに出力する手段と、 前記入力文字列のストリームのポジションが最後である
    か否かを判断する判断手段と、 最後のポジションまで置換処理が終了すると、前記出力
    文字のストリームの内容を短縮表記として出力する手段
    と、 を含むことを特徴とする請求項1に記載の外国語電子辞
    書検索装置。
JP11032590A 1990-04-27 1990-04-27 外国語電子辞書検索方法及び装置 Expired - Fee Related JP3285149B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11032590A JP3285149B2 (ja) 1990-04-27 1990-04-27 外国語電子辞書検索方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11032590A JP3285149B2 (ja) 1990-04-27 1990-04-27 外国語電子辞書検索方法及び装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2000343785A Division JP2001167093A (ja) 2000-11-10 2000-11-10 外国語電子辞書の生成、検索のための方法および装置

Publications (2)

Publication Number Publication Date
JPH0410052A JPH0410052A (ja) 1992-01-14
JP3285149B2 true JP3285149B2 (ja) 2002-05-27

Family

ID=14532867

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11032590A Expired - Fee Related JP3285149B2 (ja) 1990-04-27 1990-04-27 外国語電子辞書検索方法及び装置

Country Status (1)

Country Link
JP (1) JP3285149B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3689954B2 (ja) * 1995-03-13 2005-08-31 富士ゼロックス株式会社 異種コード文字列転記装置および電子辞書
KR100923936B1 (ko) * 2008-03-14 2009-10-29 엔에이치엔(주) 일본어 사전 서비스에 있어서 2개 단어 이상의 쿼리, 한글쿼리 또는 일반적인 쿼리의 입력 시 검색 결과를 제공하는방법 및 시스템
KR101049358B1 (ko) * 2008-12-08 2011-07-13 엔에이치엔(주) 유사어 결정 방법 및 시스템

Also Published As

Publication number Publication date
JPH0410052A (ja) 1992-01-14

Similar Documents

Publication Publication Date Title
US5214583A (en) Machine language translation system which produces consistent translated words
JP4833476B2 (ja) モードレス入力で一方のテキスト形式を他方のテキスト形式に変換する言語入力アーキテクチャ
JP5535417B2 (ja) スペルミス、タイプミス、および変換誤りに耐性のある、あるテキスト形式から別のテキスト形式に変換する言語入力アーキテクチャ
JPH07325828A (ja) 文法チェックシステム
JPS62203273A (ja) 機械翻訳システム
JPH05314166A (ja) 電子化辞書および辞書検索装置
Gezmu et al. Portable spelling corrector for a less-resourced language: Amharic
JP3677016B2 (ja) 外国語電子辞書検索装置
JP3285149B2 (ja) 外国語電子辞書検索方法及び装置
JPS59165179A (ja) 辞書引方式
Saharia et al. LuitPad: a fully unicode compatible Assamese writing software
JPS60254367A (ja) 文章分析装置
L’haire FipsOrtho: A spell checker for learners of French
JP2001167093A (ja) 外国語電子辞書の生成、検索のための方法および装置
JP2915225B2 (ja) 文書作成装置
JP2819766B2 (ja) 外国語電子辞書検索方式
JPS59103136A (ja) カナ漢字変換処理装置
JPH03129568A (ja) 文書処理装置
JPH0773174A (ja) 日本語処理システム
JP2802369B2 (ja) かな漢字変換装置
JPH07121542A (ja) 機械翻訳装置
JPH0232460A (ja) 文書処理装置
JPH06119379A (ja) ふりがな機能つき機械翻訳装置および方法
JPH0410059A (ja) 外国語電子辞書検索方式
JPH0345423B2 (ja)

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080308

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090308

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100308

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees