JP3677016B2 - 外国語電子辞書検索装置 - Google Patents

外国語電子辞書検索装置 Download PDF

Info

Publication number
JP3677016B2
JP3677016B2 JP2002306148A JP2002306148A JP3677016B2 JP 3677016 B2 JP3677016 B2 JP 3677016B2 JP 2002306148 A JP2002306148 A JP 2002306148A JP 2002306148 A JP2002306148 A JP 2002306148A JP 3677016 B2 JP3677016 B2 JP 3677016B2
Authority
JP
Japan
Prior art keywords
notation
katakana
dictionary
japanese
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2002306148A
Other languages
English (en)
Other versions
JP2003178087A (ja
Inventor
忠信 宮内
義文 松永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2002306148A priority Critical patent/JP3677016B2/ja
Publication of JP2003178087A publication Critical patent/JP2003178087A/ja
Application granted granted Critical
Publication of JP3677016B2 publication Critical patent/JP3677016B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、外国語辞書の発音記号からローマ字やカタカナの日本語的表音表記を生成し、これを更に自然な日本語としての表音表記(以下、単に表記と記す場合もある)、あるいは短縮した表音表記としての表音表記のゆれ(表記のばらつき)を所定の表音表記に統一した検索キーとして上記外国語辞書データ(原データ)と共に辞書データベースとして登録することにより、外国語の日本語的表音表記のルールを意識することなく入力した日本語的表音表記の検索キーから外国語辞書データベースを検索できるようにするための、外国語電子辞書の検索に関する。
【0002】
【従来の技術】
国際化の進展により、日本語に占める日本語的外国語,所謂「カタカナ語」とくに「カタカナ英語」と呼ばれる外来語の比率は増える一方である。
この種の外来語は、その発音をカタカナで表記した表音表記として用いることが殆どである。その発音は日本語の発音に沿ったものとして表現されているものが大勢であるが、そのカタカナ表現やカタカナに対応したローマ字表現もまちまちである。また、元の言語(外国語)の単語の意味とは違った意味に用いられているものも多い。
従来、例えば特開昭61−100864号公報,特開昭57−161970号公報に開示のように、外国語のカタカナ表記もしくはカタカナ相当のローマ字表記と当該外国語の綴りの対応表を設けておき、カタカナ表記もしくはカタカナ相当のローマ字表記の入力に対して外国語の単語の綴りを表示して、それを基に辞書検索を行うようにしたものが知られている。
【0003】
【発明が解決しようとする課題】
上記従来の技術のように、外国語のカタカナ表記もしくはカタカナ相当のローマ字表記と当該外国語の綴りの対応表を全ての外国語単語について作成することは膨大な作業量を必要とするうえ、誤りの発生も避けられず、効率の良いものとは言えず、また日々増えるカタカナ語に対応してその改定を行うことは容易でない。
【0004】
一方、外国語の発音を表す表音表記としてIPA表記(International Phonetic Alphabet)などの統一した発音表記があるが、これは日本人には分かり難いものであると共に、既存の辞書の発音記号との対応において新たにその発音表記を入力することは更に多大な労力を必要とする。
【0005】
さらに、上記公報に開示されたような対応表を作成して電子辞書として登録しても、カタカナ表記には、表記のゆれ,すなわちカタカナ表現のばらつき,不統一があり、全ての単語についてこのような表記のゆれを統一するための対応表をも作成し登録することは困難である。たとえは、「gesture」という単語一つとってみても、そのカタカナ表記には、「ゼスチャー」,「ゼスチュアー」,「ジェスチャー」..など、数多くの暖昧な表記(上記した表記のゆれ)が見られる。これを全ての単語について登録することは不可能てある。
【0006】
このように、外国語を日本的な表音で表記する際に、音節に跨がった表記の異なり(上記のゆれ、詳しくは、音韻上のゆれ)が存在するため、日本語における上記のような表記の暖昧さに起因する検索キー設定に困難性があり、外国語の検索キーとして当該検索システムにおける表記基準(表記ルール)を知ることなく単にカタカナ表記を用いることには問題があった。
【0007】
本発明の目的は、カタカナ語などのように、外国語の日本語的表音表記から元の外国語を検索する際に、その日本語の標準的表音表記を意識することなく好みの表記で検索キーを入力できるように電子辞書の検索をするための装置を提供することにある。
【0008】
【課題を解決するための手段】
本発明の外国語電子辞書検索装置は、外国語辞書の原データの発音記号から生成した日本語的表音表記と前記原データとを含む外国語辞書データを、日本語的表音表記のゆれを補正した短縮表記をキー情報として登録した辞書データベースを記憶した記憶手段と、前記辞書データベースを検索する検索キーを日本語的表音表記で入力する検索キー入力手段と、前記検索キー入力手段から入力された日本語的表音表記を短縮表記に補正する補正手段と、前記補正手段により補正された短縮表記により、前記記憶手段に記憶された辞書データベースを検索する検索手段と、前記検索キー入力手段から入力された日本語的表音表記を入力ビューに表示し、前記検索手段の検索結果に基づいて該当する外国語辞書データを出力ビューに表示するように制御する出力手段とを含むことを特徴とする。
【0012】
【作用】
外国語の原辞書データ(原データ)の発音記号から日本語的表音表記(日本語の表音表記:カタカナ表記,ローマ字表記)を自動的に生成させ、この表音表記と共に上記外国語の原データをデータベースとして登録しておき、日本語的表音表記の検索キーを入力して、データベースを検索する。その検索結果に基づいて外国語辞書の原データを出力する。外国語辞書に対して日本語的発音をそのまま表音表記とした検索キーを用いて検索することが可能となり、その際、日本語の標準的表音表記を意識することなく好みの表記で検索キーを入力できる。
【0013】
【実施例】
以下、本発明の実施例を図面を参照して説明する。
図1は本発明による外国語電子辞書生成検索装置の概略構成を示すブロック図であって、1は表音表記生成部、2は表記補正部、3は記憶部、4は検索キー入力部、5は検索結果出力手段である。
【0014】
同図において、表音表記生成部1は外国語辞書の原データから発音記号を抽出し、この発音記号に基づいてカタカナまたはローマ字表記の表音記号をする。
生成された表音表記は、表記補正部2において、その綴り(スペリング)に応じ、日本語として自然となるような(日本人にとって発音し易い)表記補正を行う。
【0015】
表記補正した表音表記は、原辞書である外国語辞書の原データと共に記憶部3に登録される。記憶部3には表音表記を検索キーとして格納する表音表記格納領域(日本語的表音表記格納領域)と上記原データをその単語毎レコードとして格納する単語レコード格納領域とが少なくとも設けられており、ユーザが検索キー入力部4からカタカナやローマ字による外国語の表音記号(表音表記)を入力することにより、その検索結果が検索結果出力部5に出力される。
【0016】
図2は本発明の第1実施例である和英カタカナ検索装置の構成を説明するブロック図である。
【0017】
同図において、表音表記生成部1はMT等の形とした原辞書(英和辞書)21と辞書読込手段22とカタカナ表記入力手段23とから成る。辞書読込手段22は、原辞書21の辞書データをコンピュータで処理可能な形に構造化する機能を有し、カタカナ表記入力手段23は原辞書データから得られた発音記号を基に日本語的表音表記を生成する機能を有し、ここではカタカナ表記を生成する。
【0018】
次に、図2に示した実施例の構成の動作を説明する。
まず、原辞書である英和辞書のデータを基にして辞書データベースを作成し、これを記憶手段3に登録するが、一般に原辞書21はMTの形で電子的データとして供給される。これを辞書読込手段22に読込み、予め決められた規則にしたがってコンピュータ処理可能に構造化したテキストを作成する。
【0019】
図3は構造化テキスト例の説明図であって、辞書を構成する一つの単語についてのレコードを示し、21は単語「list」についての辞書項目(属性)のレコードで、見出し語である単語「list」,その重要度**(この記号は、例えば高校程度で習得すべきものに*、中学程度で習得すべきものに**を付してある),発音記号〔list〕,品詞項目からなり、更に品詞項目について分解したレコード22−1,22−2が木構造等の形で構造化された単語レコードを生成する。同図の例では、単語「list」を見出し語として、重要度**,発音〔list〕および品詞としての名詞(意味:名簿、用例:Her nameis..,慣用句:make a list of..,・・)と他動詞(意味:表す,用例:・・)・・・が図示のように構造化データとして生成される。
【0020】
上記の構造化データから、その発音項目を取り出し、その発音記号(図3の例では〔list〕)をカタカナ表記入力手段23に渡す。 カタカナ表記入力手段23は与えられた発音記号からカタカナ表記を生成する。このカタカナ表記の生成は、既知の日本語ワードプロセッサなどで用いられているローマ字→カナ変換と同様のアルゴリズムにより実行できる。
【0021】
カタカナ表記入力手段23で生成されたカタカナ表記(カナ表記)は補正手段24に供給されて日本語的発音表記への補正が行われる。
日本語は各音節が母音で終わるのを基本としていることで、英語等の外国語の表記と大きく異なる。この問題を解決するため、英語の発音記号について次のような補正を施す。
【0022】
図4は英語の発音記号に付加する補正情報の対応を示す説明図であって、記号b,d,..k,1,p,..に対して、それぞれブ,ド,..ク,ル,プ,..を付加する。
例えば、見出し語の単語deskの発音記号[desk]は、その記号が[s][k]について、その後にそれぞれ[u]をおぎなって[desuku]とし、このカタカナ発音表記として[デスク]を生成する。
【0023】
しかし、発音記号のみでは暖昧母音[∂]を含む音節の表記などが確定できない。そのため、カタカナ表記と辞書読込手段から得られるつづり(スペリング)や音節情報(“‐”)を補正手段24に与え、発音補正を施す必要がある。
【0024】
図5は暖昧母音の補正対応表の説明図であって、[ca,ke]には[ヶ]を、[cau,co]には[コ]を、....のように対応させる。例えば、con−cern[k∂ns∂:rn]の前半の音節’con’は[k∂n]に対応するので[コン]に、後半の音節’cern’は[s∂:rn]に対応して[サーン]というように、図5に示した対応表によって暖昧母音の発音を確定する。
【0025】
図6は記憶手段に格納される補正済のカタカナ表音表記レコードと単語レコードの内容の説明図であって、カタカナ表音表記61を検索キーとして単語レコード62が格納される。
【0026】
図7は上記のようにして生成され記憶手段に格納された英和辞書データベースを検索した出力例を示すユーザビューの説明図である。
検索キー入力部4は通常のキーボード/マウスからなる入力手段28の他に、OCR読み取り装置26や音声入力手段27で構成することができ、これらの何れかから入力した検索キーとして[イングリッシュ]と入力すると、ビュー71の入力ビュー72に検索キー[イングリッシュ]が表示され、この検索キーに基づいて検索された結果である「English」の英単語とその関連項目(発音記号,品詞,意味,…)が出力ビュー73に表示される。
【0027】
なお、この検索結果を出力する出力手段としては、上記のような表示手段のユーザビューによる視覚表示の他に、直接紙に印刷出力するハードコーピー手段30や音声で出力する音声出力手段31などで構成することもできる。
【0028】
上記説明したように生成された英和辞書等の外国語辞書は、この実施例で説明したような使い方に限らず、本来の外国語辞書としての利用,すなわち見出し語からの検索が可能であることは言うまでもない。この場合、図2の検索入力部4から入力された単語が英文字であれば、図6に示した見出し語をキーとして検索する。
【0029】
このとき、その単語レコード62に加えてカタカナ表音表記レコード61をも出力することによって、この辞書を外国人が日本語の学習のために利用するうえで学習効果が大きくなるという効用もある。最近の国際化に伴って、日本に在住する外国人の数は増える一方である。外国人が日本語を学習するうえで大きな障害となっている一つにカタカナ語がある。
【0030】
カタカナ語は、日本人の発音の都合で原語とは掛け離れた発音表記となってしまったものや、流行らす側の勝手なフィーリングに基づいて創作したものが多く、外国人にとっては困惑するものであることが殆どである。本発明は、このようなカタカナ語を理解するためにも有効な手段となる。
【0031】
図8はカタカナ語の理解のために資する利用形態を説明するユーザビューの説明図であって、ユーザを外国人として想定し、検索キー入力部4から見出し語「Japanease」を入力すると、入力した検索キーがユーザビュー81の入力ビュー82に表示され、検索された結果が出力ビュー83に表示される。
【0032】
この出力ビューには、入力した英語の見出し語に対応する前記した日本語的なカタカナ表記が出力される。このカタカナ表記により、外国人は通常の日本語の意味に加えて日本的な発音を知ることができる。これを利用して、日本語の文章を書く場合にカタカナ語を交えた日本人的な文章を作ることができ、学習効果向上の期待を持たせることができる。
【0033】
以上のように、本実施例によれば、一般に分かり難い発音記号から自動的にローマ字またはカタカナ表記が得られ、外国語辞書を日本語的な表音表記を介して利用することができる。
【0034】
次に、本発明による外国語電子辞書生成・検索装置の他の実施例を説明する。図9は本発明を英和カタカナ検索システムに適用した第2実施例の構成を説明するブロック図であって、1は表音表記生成部、2は表記補正部、3は記憶部、4は検索キー入力部、5は検索結果出力部である。そして、前記実施例と同様に、表音表記生成部は1は外国語辞書の原データから発音記号を抽出し、この発音記号に基づいてカタカナまたはローマ字表記の表音記号を生成する。表音表記生成部1はMT等の形とした原辞書(英和辞書)21と辞書読込手段22とカタカナ表記入力手段23とから成る。すなわち、辞書読込手段22は、原辞書21の辞書データをコンピュータで処理可能な形の構造化する機能を有し、カタカナ表記入力手段23は原辞書データから得られた発音記号を基に表音記号(表音表記)を生成する機能を有し、ここではカタカナ表記を生成する。
【0035】
辞書データの構造化は前記図3で詳細に説明したように、予め決められた規則にしたがってコンピュータ処理可能に構造化したテキストを作成する。
【0036】
構造化された図3に示したような単語レコードからなる辞書データは記憶部3を構成する記憶手段25に格納される。一方、上記表音表記生成部1のカタカナ表記入力手段23は辞書データの発音記号の項目を抽出し、この発音記号からカタカナ表記を生成し、生成したカタカナ表記を表記補正部2を構成する表音表記短縮手段241に与え、表記のゆれを補正する表記短縮化処理を行う。
【0037】
原辞書である英和辞書の発音記号から生成したカタカナ表記は、日本語的な表記と異なるものが多く、また日本語としてのカタカナ表記にも多様な表記(ゆれ)が存在する。このような多種多様な表記についてまで辞書データベースに登録することはその生成作業の膨大さもさることながら、記憶手段の容量を消費し、検索速度を低下させるなど、システム全体からみて決して効率のよいものではない。
本発明のこの実施例では、上記表記のゆれを解決するために、このゆれを一意的に短縮する処理、すなわち統一した短縮表記とする処理を施すものである。
【0038】
以下、このカタカナ表記短縮手段における短縮アルゴリズムを図10〜図13を参照して説明する(なお、後述する検索時の検索キーの短縮アルゴリズムも同一である)。
【0039】
図10はカタカナ短縮アルゴリズムを説明するフローチャート、図11は子音変換テーブル(CT)の説明図、図12は二重母音テーブル(DT)の説明図、図13は一文字置換テーブル(OT)の説明図である。
【0040】
まず、バッファのクリアや変数初期化を行った後(ステップ1、以下「S1」のように記す)、辞書読込手段22から入力されたカタカナ文字列からカタカナ表記入力手段23が表音表記短縮手段入力用のデータストリームRS(発音記号から生成されたカタカナ表記を転送するためのデータ転送構造、以下、単にストリームRSという)を生成する(S2)。また同時に短縮結果を記憶手段25に格納するための出力用のデータストリームWS(短縮処理されたカタカナ表記を転送するためのデータ転送構造、以下、単にストリームWSという)も生成しておく(S3)。
【0041】
表音表記短縮手段241はストリームRSから1文字目を読み込んでバッファに蓄え(S4)、該文字がストリームRSの入力の最後のポジションであるか否かを判断し(S5)、最後であるなら(S5でYES)S12に分岐する。最後の文字でない場合には,すなわち当該カタカナ文字列に未だ文字がある場合には(S5でNO)2文字目をバッファBFに読み込む(S6)。
【0042】
2文字目を読み込んだなら図11の子音テーブルDTによりバッファBFの内容の置換を行い、これをバッファBFに書き込む(S7)。子音テーブルCTに対応する置換の表記がなくて置換ができない場合には(S8でNO))、更に図12の二重母音テーブルDTによりバッファBFの内容の置換を行い(S9)、置換したものをバッファBFに書き込む。なお、子音テーブルCTで置換できた場合(S8でYES)にはS14に分岐する。
【0043】
ここで、子音テーブルCTと二重母音テーブルDTを別に設けたのは、短縮処理時に子音→母音という表記の優先順位をつけることにより、一意に短縮するためである。また、2文字づつ処理することで、後述するカタカナ語特有の音節に跨がる表記のゆれを吸収することができる。
なお、ここでいう「短縮」は、ゆれを吸収するための中間表現であり、図11のテーブルから明らかなように、置換処理しても文字数が変わらない場合もある。
【0044】
図12の二重母音テーブルを用いてバッファBFの内容の置換が行われた場合(S10でYES)、S14に分岐する。バッファBFの内容の置換が行われなかった場合、すなわち短縮がなされなかった場合(S10でNO)は、バッファBFの2文字目をクリアして消去する(S11)。すなわち、バッファBFには、ST4で書き込まれた一文字のみ存在している。
【0045】
次に、このバッファBFに書き込まれている一文字について、図13に示した一文字置換テーブルOTを参照して置換処理を行い(S12)、置換した結果をバッファBFに格納する。この段階で、なおも置換されなかった文字はそのまま表記されることになる。
【0046】
この状態では、ストリームRSのポジションが一つ余分に進んでいるため、該ストリームRSのポジションを一つ戻し(S13)、バッファBFの内容をストリームWSに書き込む(S14)。
【0047】
ストリームWSに内容を書き込んだ後、該バッファBFをクリアし(S15)、ストリームRSのポジションが最後であるか否かを判断し(S16)、最後のポジションでなければ(S16のNO)S4に戻って上記と同様の短縮処理を続行する。また、最後であると判断された場合,すなわちストリームRSの読み込みが終了すると(S16のYES)、この短縮処理は終了となり、ストリームWSの内容を短縮文字列として記憶手段の検索キー格納領域に出力し(S17)、処理をおわる。
【0048】
以下、この短縮処理の具体例を「gesture」を例にとって説明する。
単語「gesture」の発音のカタカナ表記として「ジェスチャー」が与えられた場合、まず、入力文字列のストリームRSから1文字目“ジ”と2文字目“ェ”が表音表記短縮手段241のバッファBFに読み込まれる。バッファBFの内容が“ジェ”となる。
【0049】
このバッファBFの内容“ジェ”は図11に示した子音テーブルCTを参照して“ゼ”に置換されて(すなわち、1文字の表音表記に短縮されて)バッファBFに書き込まれた後、このバッファBFの内容が出力文字列のストリームWSに書き込まれると共に、該バッファBFはクリアされる。
【0050】
そして、ストリームRSの当該単語の発音記号から生成したカタカナ表音表記には未だ「・・スチャー」がある(すなわち、ストリームRSの入力ポジションは最後ではない)ので、バッファBFに“ス”“チ”が読み込まれるが、この“スチ”は子音テーブル,二重母音テーブルのいづれのテーブルにも表記されていないため置換処理はなされない。したがって、上記したように、バッファBFに読み込まれた2文字目である“チ”が消去され、“ス”が残り、図13の一文字テーブルでも置換の対象とは成らないのでそのままストリームWSに書き込まれる。
【0051】
バッファBFをクリア後、次にストリームRSから読み込まれた“チ”,“ャ”も同様にしてストリームWSに書き込まれていく。
そして、最後は“一”を読み込むが、これがストリームRSの当該カタカナ表音表記の最後のポジションであるので、直接一文字テーブルの置換対象となるが、同テーブルでは‘削除’となっているので、バッファBFは空となって、ストリームWSには何も書き込まれずに短縮処理を終了する。
【0052】
この結果、ストリームWSの内容は「ゼスチャ」となっており、これが単語「gesture」の発音のカタカナ表記の短縮文字列として記憶手段に出力される。
このように、生成された短縮表記を検索キーとして図9の辞書読込手段22で生成された構造化単語レコードと共に記憶手段25に登録される。これを原辞書のすべての単語について繰り返すことで、カタカナ検索英和電子辞書のデータベースが構築される。
【0053】
図14は検索結果出力部を構成する表示手段のビューの模式図であって、上記の説明のようにして生成され構築されたカタカナ検索英和電子辞書データベースを用いて辞書検索を実行する場合、ユーザはまず、図9の検索キー入力部4を構成するキーボード28から検索したい単語をカタカナ表記で入力する(なお、検索キー入力部4,および検索結果出力部5は前記図2に示したような種々の手段で構成できる)。
【0054】
入力された検索キーは、前記したデータベース生成時と同様に、表記補正部2の表音表記短縮手段241で短縮表記に変換され、この短縮表記を検索キーとして記憶手段25に登録されているデータベースを検索する。この検索キーの短縮表記もデータベース登録時と同じ一意的短縮が行われるものであるため、ユーザは自分の好みのカタカナ表記で入力可能であり、標準的なカタカナ表記のルル(表記法)や上記した短縮アルゴリズムを意識する必要がない。
【0055】
ユーザが「gesture」について検索しようとする場合、ユーザによっては、またはその時の気持ち次第で、「ジェスチャー」,「ジェスチャ」,「ゼスチャー」,「ゼスチュア」,‥等々、様々なカタカナ表記で検索キーを入力する。すなわち、入力する検索キーの表記にゆれがある。しかし、この表記のゆれはデータベース登録時と同一の「ジェスチャー」の場合は勿論のこと、他の場合も全て「ゼスチャ」という短縮表記に一意に変換されるため、記憶手段からは「ゼスチャ」を検索キーとして「gesture」の単語レコードが検索される。
【0056】
図14においては、ユーザの入力した検索キー「ゼスチュア」がユーザビュー131の入力ビュー132に表示され、その検索結果の単語レコードが出力ビュー133に表示され、ユーザに提示される。
【0057】
上記説明したように生成された英和辞書等の外国語辞書はこの実施例で説明したような使い方に限らず、前記第1実施例と同様に本来の外国語辞書としての利用,すなわち見出し語からの検索が可能であることは言うまでもない。また、検索結果にその単語レコードに加えて標準的なカタカナ表記(「ジェスチャー」)をも出力することによって、この辞書を外国人が日本語の学習のために利用するうえで学習効果が大きくなるという効用もある。前記したように、カタカナ語は、日本人の発音の都合で原語とは掛け離れた発音表記となってしまったものや、日本人が勝手に創作したものが多く、外国人に困惑を招くものである場合が多い。本発明は、外国人がこのようなカタカナ語を理解するために用いて有効な手段となる。
【0058】
図15はカタカナ語の理解のために資する利用形態を説明するユーザビューの説明図であって、ユーザを外国人として想定し、検索キー入力部4から自己流のカタカナ表記「ゼスチュア」を入力すると、入力した検索キーがビュー141の入力ビュー142に表示され、検索された結果が出力ビュー143に表示される。
【0059】
これにより、当該英単語の標準的なカタカナ表記法を知らず知らずのうちに知得することができ、外国人にとって(日本人にとっても)日本語の学習効果が大きく向上する。
【0060】
このように、本実施例によれば、カタカナ表記を検索キーとして人力する際に、カタカナ表記のルールを知らないでも自己流のカタカナ表記で単語検索ができ、また短縮表記を検索キーとしたために記憶手段の容量も少なくて済み、かつ高速の検索が可能となる。
【0061】
【発明の効果】
以上説明したように、一般に分かり難い発音記号からローマ字あるいはカタカナの表音表記が自動的に得られ、これを検索キーとして外国語辞書を日本語的な表音表記を介して扱うことが可能となり、外国語が不得意な人でも発音(表音表記)からの検索ができる。また、検索キーとしてカタカナ等の表音表記を入力する際にその標準的な表記ルールを意識することなく、ユーザの好みの表記で入力することができると共に、外国語に馴染みが薄い人にとっての日本語学習効果を向上させることができる。
【図面の簡単な説明】
【図1】 本発明による外国語電子辞書生成検索装置の概略構成を示すブロック図、
【図2】 本発明の第1実施例である和英カタカナ検索装置の構成を説明するブロック図、
【図3】 構造化テキストの説明図、
【図4】 英語の発音記号に付加する補正情報の対応を示す説明図、
【図5】 暖昧母音の補正対応表の説明図、
【図6】 記憶手段に格納される補正済のカタカナ表音表記レコードと単語レコードの内容の説明図、
【図7】 記憶手段に格納された英和辞書データベースを検索した出力例の説明図、
【図8】 カタカナ語の理解に資する利用形態の説明図、
【図9】 本発明を英和カタカナ検索システムに適用した第2実施例の構成を説明するブロック図、
【図10】 カタカナ短縮アルゴリズムを説明するフローチャート、
【図11】 子音変換テーブルの説明図、
【図12】 二重母音テーブルの説明図、
【図13】 一文字置換テーブルの説明図、
【図14】 検索結果出力部を構成する表示手段のビューの模式図、
【図15】 カタカナ語の理解に資する利用形態の説明図である。
【符号の説明】
1・・・表音表記生成部、2・・・表記補正部、3・・・記憶部、4・・・検索キー入力部、5・・・検索結果出力手段。

Claims (1)

  1. 外国語辞書の原データの発音記号から生成した日本語的表音表記と前記原データとを含む外国語辞書データを、日本語的表音表記のゆれを補正した短縮表記をキー情報として登録した辞書データベースを記憶した記憶手段と、
    前記辞書データベースを検索する検索キーを日本語的表音表記で入力する検索キー入力手段と、
    前記検索キー入力手段から入力された日本語的表音表記を短縮表記に補正する補正手段と
    前記補正手段により補正された短縮表記により、前記記憶手段に記憶された辞書データベースを検索する検索手段と、
    前記検索キー入力手段から入力された日本語的表音表記を入力ビューに表示し、前記検索手段の検索結果に基づいて該当する外国語辞書データを出力ビューに表示するように制御する出力手段と、
    を含むことを特徴とする外国語電子辞書検索装置。
JP2002306148A 2002-10-21 2002-10-21 外国語電子辞書検索装置 Expired - Lifetime JP3677016B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002306148A JP3677016B2 (ja) 2002-10-21 2002-10-21 外国語電子辞書検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002306148A JP3677016B2 (ja) 2002-10-21 2002-10-21 外国語電子辞書検索装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2000343785A Division JP2001167093A (ja) 2000-11-10 2000-11-10 外国語電子辞書の生成、検索のための方法および装置

Publications (2)

Publication Number Publication Date
JP2003178087A JP2003178087A (ja) 2003-06-27
JP3677016B2 true JP3677016B2 (ja) 2005-07-27

Family

ID=19197419

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002306148A Expired - Lifetime JP3677016B2 (ja) 2002-10-21 2002-10-21 外国語電子辞書検索装置

Country Status (1)

Country Link
JP (1) JP3677016B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006031612A (ja) * 2004-07-21 2006-02-02 Seiko Instruments Inc 電子辞書
JP2006126883A (ja) * 2004-10-26 2006-05-18 Shinano Kenshi Co Ltd 情報検索装置及び情報検索方法
KR100916816B1 (ko) * 2008-03-14 2009-09-14 엔에이치엔(주) 일본어 앨리어스 데이터베이스를 이용하여 장음 및 촉음에대한 오류를 줄이고 일본어 입력기 사용 시 단자 찾기기능을 제공하는 방법 및 시스템
KR100923936B1 (ko) * 2008-03-14 2009-10-29 엔에이치엔(주) 일본어 사전 서비스에 있어서 2개 단어 이상의 쿼리, 한글쿼리 또는 일반적인 쿼리의 입력 시 검색 결과를 제공하는방법 및 시스템
KR101049358B1 (ko) * 2008-12-08 2011-07-13 엔에이치엔(주) 유사어 결정 방법 및 시스템
US8315851B2 (en) * 2010-06-30 2012-11-20 Business Objects Software Limited Phonetic keys for the Japanese language

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2515726B2 (ja) * 1985-07-10 1996-07-10 株式会社日立製作所 情報検索方法及び装置

Also Published As

Publication number Publication date
JP2003178087A (ja) 2003-06-27

Similar Documents

Publication Publication Date Title
Silberztein Formalizing natural languages: The NooJ approach
US6275789B1 (en) Method and apparatus for performing full bidirectional translation between a source language and a linked alternative language
EP1346291A1 (en) Automatic or semiautomatic translation system and method with post-editing for the correction of errors
JPH1011447A (ja) パターンに基づく翻訳方法及び翻訳システム
Somers The translator's workstation
JP3677016B2 (ja) 外国語電子辞書検索装置
JPS6149848A (ja) 中国語通信用音標文字印字装置と中国語通信用タイプライタ
Genee “It’s written niisto but it sounds like knee stew.” Handling multiple orthographies in Blackfoot language web resources
JP3285149B2 (ja) 外国語電子辞書検索方法及び装置
Gakis et al. Design and implementation of an electronic lexicon for Modern Greek
JPS6310265A (ja) 翻訳装置
JP2001167093A (ja) 外国語電子辞書の生成、検索のための方法および装置
ASAHIAH et al. A survey of diacritic restoration in abjad and alphabet writing systems
Deksne et al. Towards the Development of Language Analysis Tools for the Written Latgalian Language
JPS6037510B2 (ja) ロ−マ字漢字変換方式
Utka Towards the Development of Language Analysis Tools for the Written Latgalian
Zhou Super-Function Based Machine Translation System for Business User
Goddard Semantic Primes and Their Grammar
Han Klex: A finite-state transducer lexicon of korean
JP2802369B2 (ja) かな漢字変換装置
JP3048793B2 (ja) 文字変換装置
JP3386520B2 (ja) 仮名漢字変換装置および方法
JPH04199263A (ja) 文書作成方式
JPH06119379A (ja) ふりがな機能つき機械翻訳装置および方法
Hlaing Syllabification, Normalization and Lexicographic Ordering of Myanmar Texts using Formal Approaches

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041101

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050329

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050329

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050502

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090513

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100513

Year of fee payment: 5

EXPY Cancellation because of completion of term