JPH0410052A - 外国語電子辞書検索方法及び装置 - Google Patents

外国語電子辞書検索方法及び装置

Info

Publication number
JPH0410052A
JPH0410052A JP2110325A JP11032590A JPH0410052A JP H0410052 A JPH0410052 A JP H0410052A JP 2110325 A JP2110325 A JP 2110325A JP 11032590 A JP11032590 A JP 11032590A JP H0410052 A JPH0410052 A JP H0410052A
Authority
JP
Japan
Prior art keywords
phonetic
notation
japanese
dictionary
foreign language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2110325A
Other languages
English (en)
Other versions
JP3285149B2 (ja
Inventor
Tadanobu Miyauchi
忠信 宮内
Yoshibumi Matsunaga
義文 松永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP11032590A priority Critical patent/JP3285149B2/ja
Publication of JPH0410052A publication Critical patent/JPH0410052A/ja
Application granted granted Critical
Publication of JP3285149B2 publication Critical patent/JP3285149B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、外国語辞書の発音記号からローマ字やカタカ
ナの日本語的表音表記を生成し、これを更に自然な日本
語としての表音表記(以下、単に表記と記す場合もある
)、あるいは短縮した表音表記としての表音表記のゆれ
(表記のばらつき)を所定の表音表記に統一した検索キ
ーとして上記外国語辞書データ(原データ)と共に辞書
データベースとして登録することにより、外国語の日本
語的表音表記のルールを意識することなく入力した日本
語的表音表記の検索キーから外国語辞書データベースを
検索できるようにした外国語電子辞書生成・検索装置に
関する。
〔従来の技術〕
国際化の進展により、日本語に占める日本語的外国語、
所謂「カタカナ語」とくに「カタカナ英語」と呼ばれる
外来語の比率は増える一方である。
この種の外来語は、その発音をカタカナで表記した表音
表記として用いることが殆どである。その発音は日本語
の発音に沿ったものとして表現されているものが大勢で
あるが、そのカタカナ表現やカタカナに対応したローマ
字表現もまちまちである。また、元の言語(外国語)の
単語の意味とは違った意味に用いられているものも多い
従来、例えば特開昭61−100864号公報、特開昭
57−161970号公報に開示のように、外国語のカ
タカナ表記もしくはカタカナ相当のローマ字表記と当該
外国語の綴りの対応表を設けておき、カタカナ表記もし
くはカタカナ相当のローマ字表記の入力に対して外国語
の単語の綴りを表示して、それを基に辞書検索を行うよ
うにしたものが知られている。
〔発明が解決しようとする課題〕
上記従来の技術のように、外国語のカタカナ表記もしく
はカタカナ相当のローマ字表記と当該外国語の綴りの対
応表を全ての外国語単語について作成することは膨大な
作業量を必要とするうえ、誤りの発生も避けられず、効
率の良いものとは言えず、また日々増えるカタカナ語に
対応してその改定を行うことは容易でない。
一方、外国語の発音を表す表音表記としてIPA表記(
International Phonetic Al
phabet)などの統一した発音表記があるが、これ
は日本人には分かり難いものであると共に、既存の辞書
の発音記号との対応において新たにその発音表記を入力
することは更に多大な労力を必要とする。
さらに、上記公報に開示されたような対応表を作成して
電子辞書として登録しても、カタカナ表記には、表記の
ゆれ、すなわちカタカナ表現のばらつき、不統一があり
、全ての単語についてこのような表記のゆれを統一する
ための対応表をも作成し登録することは困難である。た
とえば、「gesture Jという単語−つとってみ
ても、そのカタカナ表記には、「ゼスチャー」、「ゼス
チュア」「ジェスチャー」1.など、数多くの曖昧な表
記(上記した表記のゆれ)が見られる。これを全ての単
語について登録することは不可能である。
このように、外国語を日本的な表音で表記する際に、音
節に跨がった表記の異なり(上記のゆれ、詳しくは、音
韻上のゆれ)が存在するため、日本語における上記のよ
うな表記の曖昧さに起因する検索キー設定に困難性があ
り、外国語の検索キーとして当該検索システムにおける
表記基準(表記ルール)を知ることなく単にカタカナ表
記を用いることには問題があった。
本発明の目的は、カタカナ語などのように、外国語の日
本語的表音表記から元の外国語を検索する際に、その日
本語の標準的表音表記を意識することなく好みの表記で
検索キーを入力できるようにした電子辞書を提供するこ
とにある。
[課題を解決するための手段] 上記目的は、外国語の原辞書データ(原データ)の発音
記号から日本語的表音表記(日本語の表音表記:カタカ
ナ表記、ローマ字表記)を生成する表音表記生成手段を
備え、外国語の発音記号から自動的に日本語の表音表記
を生成させ、この表音表記と共に上記外国語の原データ
をデータベースとして記憶手段に登録することによって
、達成される。
また、上記表音表記を生成する際に付加情報を用いて日
本語として自然な表記となるように補正し、または生成
した日本語表音表記のゆれに対して統一した短縮表記と
してデータベースの単語レコードと一意的に対応するよ
うな表記短縮補正の何れかを施す表記補正手段を備える
ことにより、さらに、上記補正手段が表音表記を短縮表
記に補正するものである場合には、検索キー入力手段か
ら入力された表音表記を上記記憶手段に登録された短縮
表記と同一に補正する表記補正手段を備えることによっ
て、達成される。
[作用] 入力された検索キーは、データベースの検索キーである
日本語的表音表記格納領域を介して原外国語辞書の単語
レコード格納領域に格納された該当単語レコードを検索
する。
外国語の原データの発音記号から日本語の表音表記を自
動生成して上記原データと共に外国語辞書データベース
を構築することで、日本語的発音をそのまま表音表記と
した検索キーに用いることが可能となる。
[実施例] 以下、本発明の実施例を図面を参照して説明する。
第1図は本発明による外国語電子辞書生成検索装置の概
略構成を示すブロック図であって、1は表音表記生成部
、2は表記補正部、3は記憶部、4は検索キー入力部、
5は検索結果出力手段である。
同図において、表音表記生成部1は外国語辞書の原デー
タから発音記号を抽出し、この発音記号に基づいてカタ
カナまたはローマ字表記の表音記号を生成する。
生成された表音表記は、表記補正部2において、その綴
り(スペリング)に応じ、日本語として自然となるよう
な(日本人にとって発音し易い)表記補正を行う。
表記補正した表音表記は、原辞書である外国語辞書の原
データと共に記憶部3に登録される。記憶部3には表音
表記を検索キーとして格納する表音表記格納領域(日本
語的表音表記格納領域)と上記原データをその単語毎の
レコードとして格納する単語レコード格納領域とが少な
くとも設けられており、ユーザが検索キー入力部4から
カタカナやローマ字による外国語の表音記号(表音表記
)を入力することにより、その検索結果が検索結果出力
部5に出力される。
第2図は本発明の第1実施例である和英カタカナ検索装
置の構成を説明するブロック図である。
同図において、表音表記生成部1はMT等の形とした原
辞書(英和辞書)21と辞書読込手段22とカタカナ表
記入力手段23とから成る。辞書読込手段22は、原辞
書21の辞書データをコンピュータで処理可能な形に構
造化する機能を有し、カタカナ表記入力手段23は原辞
書データから得られた発音記号を基に日本語的表音表記
を生成する機能を有し、ここではカタカナ表記を生成す
る。
次に、第2図に示した実施例の構成の動作を説明する。
まず、原辞書である英和辞書のデータを基にして辞書デ
ータベースを作成し、これを記憶手段3に登録するが、
一般に原辞書21はMTO形で電子的データとして供給
される。これを辞書読込手段22に読込み、予め決めら
れた規則にしたがってコンピュータ処理可能に構造化し
たテキストを作成する。
第3図は構造化テキスト例の説明図であって、辞書を構
成する一つの単語についてのレコードを示し、21は単
語rlisJについての辞書項目(属性)のレコードで
、見出し語である単語rlisJ 。
その重要度基本(この記号は、例えば高校程度で習得す
べきものに本、中学程度で習得すべきものに基本を付し
である)1発音記号(list) +品詞項目からなり
、更に品詞項目について分解したレコード22−1.2
2−2が木構造等の形で構造化された単語レコードを生
成する。同図の例では、単語I’1isJを見出し語と
して、重要度木本1允音(list)および品詞として
の名詞(意味二名簿、用例:Her namejso、
+慣用句:make a 1ist of、、、 ・・
)と他動詞(意味:表す、用例: ・・)・・・が図示
のように構造化データとして生成される。
上記の構造化データから、その発音項目を取り出し、そ
の発音記号(第3図の例では(list) )をカタカ
ナ表記入力手段23に渡す。
カタカナ表記入力手段23は与えられた発音記号からカ
タカナ表記を生成する。このカタカナ表記の生成は、既
知の日本語ワードプロセッサなどで用いられているロー
マ字→カナ変換と同様のアルゴリズムにより実行できる
カタカナ表記入力手段23で生成されたカタカナ表記(
カナ表記)は補正手段24に供給されて日本語的発音表
記への補正が行われる。
日本語は各音節が母音で終わるのを基本としていること
で、英語等の外国語の表記と大きく異なる。この問題を
解決するため、英語の発音記号について次のような補正
を施す。
第4図は英語の発音記号に付加する補正情報の対応を示
す説明図であって、記号す、(1,、、k。
1、p、、、に対して、それぞれブ、ド14.り。
ル、ブ11.を付加する。
例えば、見出し語の単語deskの発音記号[desk
]は、その記号が[s ]  [k ]  について、
その後にそれぞれ[u ]をおぎなって[desuku
]とし、このカタカナ発音表記として[デスク]を生成
する。
しかし、発音記号のみでは曖昧母音 [)] を含む音
節の表記などが確定できない。そのため、カタカナ表記
と辞書読込手段から得られるつづり(スペリング)や音
節情報(パ−”)を補正手段24に与え、発音補正を施
す必要がある。
第5図は曖昧母音の補正対応表の説明図であって、[c
a、ke ]には[ケ]を、[Cau+Co]には[コ
]を1118.のように対応させる。例えば、cOn−
cern [k) nsp :rn ]の前半の音節’
con’ は[khn]に対応するので[コン]に、後
半の音節’ cern ’は[s;z:rn]に対応し
て[サーノ]というように、第5図に示した対応表によ
って曖昧母音の発音を確定する。
第6図は記憶手段に格納される補正法のカタカナ表音表
記レコードと単語レコードの内容の説明図であって、カ
タカナ表音表記61を検索キーとして単語レコード62
が格納される。
第7図は上記のようにして生成され記憶手段に格納され
た英和辞書データベースを検索した出力例を示すユーザ
ビューの説明図である。
検索キー入力部4は通常のキーボード/マウスからなる
入力手段28の他に、OCR読み取り装置26や音声入
力手段27で構成することができ、これらの何れかから
入力した検索キーとして[イングリッシュコと入力する
と、ビューア1の入力ビュー72に検索キー[イングリ
ッシュ]が表示され、この検索キーに基づいて検索され
た結果であるrEnglisJの英単語とその関連項目
(発音記号1品詞1意味、 、、、)が出力ビュー73
に表示される。
なお、この検索結果を出力する出力手段としては、上記
のような表示手段のユーザビューによる視覚表示の他に
、直接紙に印刷出力するハードコピー手段30や音声で
出力する音声出力手段31などで構成することもできる
上記説明したように生成された英和辞書等の外国語辞書
は、この実施例で説明したような使い方に限らず、本来
の外国語辞書としての利用、すなわち見出し語からの検
索が可能であることは言うまでもない。この場合、第2
図の検索入力部4がら入力された単語が英文字であれば
、第6図に示した見出し語をキーとして検索する。
このとき、その単語レコード62に加えてカタカナ表音
表記レコード61をも出力することによって、この辞書
を外国人が日本語の学習のために利用するうえで学習効
果が大きくなるという効用もある。
最近の国際化に伴って、日本に在住する外国人の数は増
える一方である。外国人が日本語を学習するうえで大き
な障害となっている一つにカタカナ語がある。
カタカナ語は、日本人の発音の都合で原語とは掛は離れ
た発音表記となってしまったものや、流行らす側の勝手
なフィーリングに基づいて創作したものが多く、外国人
にとっては困惑するものであることが殆どある。本発明
は、このようなカタカナ語を理解するためにも有効な手
段となる。
第8図はカタカナ語の理解のために質する利用形態を説
明するユーザビューの説明図であって、ユーザを外国人
として想定し、検索キー入力部4から見出し語rJap
anease 」を入力すると、入力した検索キーがユ
ーザビュー810入カビユー82に表示され、検索され
た結果が出力ビュー83に表示される。
この出力ビューには、入力した英語の見出し語に対応す
る前記した日本語的なカタカナ表記が出力される。この
カタカナ表記により、外国人は通常の日本語の意味に加
えて日本的な発音を知ることができる。これを利用して
、日本語の文章を書く場合にカタカナ語を交えた日本人
的な文章を作ることができ、学習効果向上の期待を持た
せることができる。
以上のように、本実施例によれば、−Cに分かり難い発
音記号から自動的にローマ字またはカタカナ表記が得ら
れ、外国語辞書を日本語的な表音表記を介して利用する
ことができる。
次に、本発明による外国語電子辞書生成・検索装置の他
の実施例を説明する。
第9図は本発明を英和カタカナ検索システムに適用した
第2実施例の構成を説明するブロック図であって、■は
表音表記生成部、2は表記補正部、3は記憶部、4は検
索キー入力部、5は検索結果出力部である。そして、前
記実施例と同様に、表音表記生成部は1は外国語辞書の
原データから発音記号を抽出し、この発音記号に基づい
てカタカナまたはローマ字表記の表音記号を生成する。
表音表記生成部1はMT等の形とした原辞書(英和辞書
)21と辞書読込手段22とカタカナ表記入力手段23
とから成る。すなわち、辞書読込手段22は、原辞書2
1の辞書データをコンピュータで処理可能な形の構造化
する機能を有し、カタカナ表記入力手段23は原辞書デ
ータから得られた発音記号を基に表音記号(表音表記)
を生成する機能を有し、ここではカタカナ表記を生成す
る。
辞書データの構造化は前記第3図で詳細に説明したよう
に、予め決められた規則にしたがってコンピュータ処理
可能に構造化したテキストを作成する。
構造化された第3図に示したような単語レコードからな
る辞書データは記憶部3を構成する記憶手段25に格納
される。一方、上記表音表記生成部1のカタカナ表記入
力手段23は辞書データの発音記号の項目を抽出し、こ
の発音記号からカタカナ表記を生成し、生成したカタカ
ナ表記を表記補正部2を構成する表音表記短縮手段24
1に与え、表記のゆれを補正する表記短縮化処理を行う
原辞書である英和辞書の発音記号から生成したカタカナ
表記は、日本語的な表記と異なるものが多く、また、日
本語としてのカタカナ表記にも多様な表記(ゆれ)が存
在する。このような多種多様な表記についてまで辞書デ
ータベースに登録することはその生成作業の膨大さもさ
ることながら、記憶手段の容量を消費し、検索速度を低
下させるなど、システム全体からみて決して効率のよい
ものではない。
本発明のこの実施例では、上記表記のゆれを解決するた
めに、このゆれを一意的に短縮する処理、すなわち統一
した短縮表記とする処理を施すものである。
以下、このカタカナ表記短縮手段における短縮アルゴリ
ズムを第10図〜第13図を参照して説明する(なお、
後述する検索時の検索キーの短縮アルゴリズムも同一で
ある)。
第10図はカタカナ短縮アルゴリズムを説明するフロー
チャート、第11図は子音変換テーブル(CT)の説明
図、第12図は二重母音テーブル(DT)の説明図、第
13図は一文字置換テーブル(OT)の説明図である。
まず、バッファのクリアや変数初期化を行った後(ステ
ップ1、以下「Sl」のように記す)、辞書読込手段2
2から入力されたカタカナ文字列からカタカナ表記入力
手段23が表音表記短縮手段入力用のデータストリーム
RS(発音記号から生成されたカタカナ表記を転送すた
めのデータ転送構造、以下、単にストリームR5という
)を生成する(S2)。
また同時に短縮結果を記憶手段25に格納するための出
力用のデータストリームWS(短縮処理されたカタカナ
表記を転送するためのデータ転送構造、以下、単にスト
リーム−3という)も生成しておく(S3)。
表音表記短縮手段241はス) IJ−ムRSから1文
字目を読み込んでバッファに蓄え(S4)、該文字がス
トリームR3の入力の最後のポジションであるか否かを
判断しくS5)、最後であるなら(S5でYES) S
12に分岐する。最後の文字でない場合には、すなわち
当該カタカナ文字列に未だ文字がある場合には(S5で
No)  2文字目をバッファBFに読み込む(S6)
2文字目を読み込んだなら第11図の子音チーフルDT
によりバッファBPの内容の置換を行い、これをバッフ
ァBFに書き込む(S7)、子音テーブルCTに対応す
る置換の表記がなくて置換ができない場合には(S8で
No))、更に第12図の二重母音テーブルDTにより
バッファBFの内容の置換を行い(S9)、置換したも
のをバッファBFに書き込む。なお、子音テーブルCT
で置換できた場合(S8でYES)にはS14に分岐す
る。
ここで、子音テーブルCTと二重母音テーブルDTを別
に設けたのは、短縮処理時に子音→母音という表記の優
先順位をつけることにより、−意に短縮するためである
。また、2文字づつ処理することで、後述するカタカナ
語特有の音節に跨がる表記のゆれを吸収することができ
る。
なお、ここでいう「短縮」は、ゆれを吸収するための中
間表現であり、第11図のテーブルら明らかなように、
置換処理しても文字数が変わらない場合もある。
第12図の二重母音テーブルを用いてアツファBFの内
容の置換が行われた場合(SIOでYES)、S14に
分岐する。バッファBFの内容の置換が行われなかった
場合、すなわち短縮がなされなかった場合(S10でN
o)は、バッファBFの2文字目をクリアして消去する
(Sll)。すなわち、バッファBFには、Sr1で書
き込まれた一文字のみ存在している。
次に、このバッファBPに書き込まれている一文字につ
いて、第13図に示した一文字置換テーブルOTを参照
して置換処理を行い(S12) 、置換した結果をバッ
ファBFに格納する。この段階で、なおも置換されなか
った文字はそのまま表記されることになる。
この状態では、ストリームR3のポジションが一つ余分
に進んでいるため、該ストリームR3のポジションを一
つ戻しく513)、バッファBPの内容をストリームW
Sに書き込む(S14)。
ストリームHに内容を書き込んだ後、該バッファBPを
クリアしく515) 、ストリームR5のポジションが
最後であるか否かを判断しく516)、最後のポジショ
ンでなければ(S16のNo)S4に戻って上記と同様
の短縮処理を続行する。また、最後であると判断された
場合、すなわちストリームR5の読み込みが終了すると
(816のYES)、この短縮処理は終了となり、スト
リームWSの内容を短縮文字列として記憶手段の検索キ
ー格納領域に出力しく517)、処理をおわる。
以下、この短縮処理の具体例をrgesture」を例
にとって説明する。
単語rgesturejの発音のカタカナ表記として「
ジェスチャー」が与えられた場合、まず、入力文字列の
ストリームR3から1文字目“ジ“と2文字目“工°゛
が表音表記短縮手段241のバッファBFに読み込まれ
る。バッファBFの内容が“ジェ”となる。
このバッファBFの内容゛°ジエ“は第11図に示した
子音テーブルCTを参照して“ゼ”に置換されて(すな
わち、1文字の表音表記に短縮されて)バッファBFに
書き込まれた後、このバ・ソファBFの内容が出力文字
列のストリーム−3に書き込まれると共に、該バッファ
BFはクリアされる。
そして、ストリームR3の当該単語の発音記号から生成
したカタカナ表音表記には未だ「・・スチャー」がある
(すなわち、ストリームRSの入力ポジションは最後で
はない)ので、バッファBPに“ス”“チ”が読み込ま
れるが、この“′スチ”は子音テーブル、二重母音テー
ブルのいづれのテーブルにも表記されていないため置換
処理はなされない。したがって、上記したように、バッ
ファBFに読み込まれた2文字目である°“チ”が消去
され、゛°ス゛′が残り、第13図の一文字テーブルで
も置換の対象とは成らないのでそのままストリームWS
に書き込まれる。
バッファBFをクリア後、次にストリームR3から読み
込まれた°°チ゛°、  ヤ′°も同様にしてストリー
ムWSに書き込まれていく。
そして、最後は“°−°″を読み込むが、これがストリ
ームR3の当該カタカナ表音表記の最後のポジションで
あるので、直接−文字テーブルの置換対象となるが、同
テーブルでは゛削除 となっているので、バッファBF
は空となって、ストリームWSには何も書き込まれずに
短縮処理を終了する。
この結果、ストリームWSの内容は「ゼスチャ」となっ
ており、これが単語rgesture」の発音のカタカ
ナ表記の短縮文字列として記憶手段に出力される。
このように、生成された短縮表記を検索キーとして第9
図の辞書読込手段22で生成された構造化単語レコード
と共に記憶手段25に登録される。これを原辞書のすべ
ての単語について繰り返すことで、カタカナ検索英和電
子辞書のデータベースが構築される。
第14図は検索結果出力部を構成する表示手段のビュー
の模式図であって、上記の説明のようにして生成され構
築されたカタカナ検索英和電子辞書データベースを用い
て辞書検索を実行する場合、ユーザはまず、第9図の検
索キー入力部4を構成するキーボード28から検索した
い単語をカタカナ表記で入力する(なお、検索キー入力
部4.および検索結果出力部5は前記第2図に示したよ
うな種々の手段で構成できる)。
入力された検索キーは、前記したデータベース生成時と
同様に、表記補正部2の表音表記短縮手段241で短縮
表記に変換され、この短縮表記を検索キーとして記憶手
段25に登録されているデータベースを検索する。この
検索キーの短縮表記もデータベース登録時と同じ一意的
短縮が行われるものであるため、ユーザは自分の好みの
カタカナ表記で入力可能であり、標準的なカタカナ表記
のルール(表記法)や上記した短縮アルゴリズムを意識
する必要がない。
ユーザがrgesture 」について検索しようとす
る場合、ユーザによっては、またはその時の気持ち次第
で、「ジェスチャー」、「ジェスチャ」。
「ゼスチャー」、「ゼスチュア」121等々、様々なカ
タカナ表記で検索キーを入力する。すなわち、入力する
検索キーの表記にゆれがある。しかし、この表記のゆれ
はデータベース登録時と同一の「ジェスチャー」の場合
は勿論のこと、他の場合も全て「ゼスチャ」という短縮
表記に一意に変換されるため、記憶手段からは「ゼスチ
ャ」を検索キーとして’ ges Lure Jの単語
レコードが検索される。
第14図においては、ユーザの入力した検索キー「ゼス
チュア」がユーザビュー131の入力ビュー132に表
示され、その検索結果の単語レコードが出力ビュー13
3に表示され、ユーザに提示される。
上記説明したように生成された英和辞書等の外国語辞書
は、この実施例で説明したような使い方に限らず、前記
第1実施例と同様に本来の外国語辞書としての利用、す
なわち見出し語からの検索が可能であることは言うまで
もない。また、検索結果にその単語レコードに加えて標
準的なカタカナ表記(「ジェスチャー」)をも出力する
ことによって、この辞書を外国人が日本語の学習のため
に利用するうえで学習効果が大きくなるという効用もあ
る。前記したように、カタカナ語は、日本人の発音の都
合で原語とは掛は離れた発音表記となってしまったもの
や、日本人が勝手に創作したものが多く、外国人に困惑
を招くものである場合が多い。本発明は、外国人がこの
ようなカタカナ語を理解するために用いて有効な手段と
なる。
第15図はカタカナ語の理解のために質する利用形態を
説明するユーザビューの説明図であって、ユーザを外国
人として想定し、検索キー入力部4から自己流のカタカ
ナ表記「ゼスチュア」を入力すると、入力した検索キー
がビュー1410入力ビユー142に表示され、検索さ
れた結果が出力ビュー143に表示される。
これにより、当該英単語の標準的なカタカナ表記法を知
らず知らずのうちに知得することができ、外国人にとっ
て(日本人にとっても)日本語の学習効果が太き(向上
する。
このように、本実施例によれば、カタカナ表記を検索キ
ーとして入力する際に、カタカナ表記のルールを知らな
いでも自己流のカタカナ表記で単語検索ができ、また短
縮表記を検索キーとしたために記憶手段の容量も少なく
て済み、かつ高速の検索が可能となる。
〔発明の効果〕
以上説明したように、一般に分かり難い発音記号からロ
ーマ字あるいはカタカナの表音表記が自動的に得られ、
これを検索キーとして外国語辞書を日本語的な表音表記
を介して扱うことが可能となり、外国語が不得意な人で
も発音(表音表記)からの検索ができる。また、検索キ
ーとしてカタカナ等の表音表記を入力する際にその標準
的な表記ルールを意識することなく、ユーザの好みの表
記で入力することができると共に、外国語に馴染みが薄
い人にとっての日本語学習効果を向上させることができ
る。
【図面の簡単な説明】
第1図は本発明による外国語電子辞書生成検索装置の概
略構成を示すブロック図、第2図は本発明の第1実施例
である和英カタカナ検索装置の構成を説明するブロック
図、第3図は構造化テキストの説明図、第4図は英語の
発音記号に付加する補正情報の対応を示す説明図、第5
図は曖昧母音の補正対応表の説明図、第6図は記憶手段
に格納される補正済のカタカナ表音表記レコードと単語
レコードの内容の説明図、第7図は記憶手段に格納され
た英和辞書データベースを検索した出力例の説明図、第
8図はカタカナ語の理解に賞する利用形態の説明図、第
9図は本発明を英和カタカナ検索システムに通用した第
2実施例の構成を説明するブロック図、第10回はカタ
カナ短縮アルゴリズムを説明するフローチャート、第1
1図は子音変換テーブルの説明図、第12図は二重母音
テーブルの説明図、第13図は一文字置換テーブルの説
明図、第14図は検索結果出力部を構成する表示手段の
ビューの模式図、第15図はカタカナ語の理解に質する
利用形態の説明図である。 圧部、3・・・・記憶部、4・・・・検索キー入力部、
5・・・・検索結果出力手段。 出願人 冨士ゼロックス株式会社 代理人  弁理士 小野寺 洋二(外2名)1・・・・
表音表記生成部、2・・・・表記補第3図 第4図 第5図 第6図 第7図 第8図 第1 1図 第1 2匹石 第1 図

Claims (5)

    【特許請求の範囲】
  1. (1)外国語辞書のデータを入力する原データ入力手段
    と、 入力された原データの発音記号からその発音記号に対応
    する日本語的表音表記を生成する表音表記生成手段と、 上記表音表記を検索キーとして上記原データと共に辞書
    データベースとして登録する記憶手段と、から構成した
    外国語電子辞書生成装置。
  2. (2)外国語辞書のデータを入力する原データ入力手段
    と、 入力された原データの発音記号からその発音記号に対応
    する日本語的表音表記を生成する表音表記生成手段と、 生成した表音表記を付加情報により自然な日本語となる
    ようにその表音表記を補正する表音表記補正手段と、 補正した表音表記を検索キーとして上記言語データと共
    に登録する記憶手段と、 から構成した外国語電子辞書生成装置。
  3. (3)外国語辞書の原データを入力する原データ入力手
    段と、 入力された原データの発音記号からその発音記号に対応
    する日本語的表音表記を生成する表音表記生成手段と、 生成した表音表記のゆれを短縮した統一の表音表記に補
    正する表音表記短縮手段と、 補正した表音表記を検索キーとして上記言語データと共
    に辞書データベースとして登録する記憶手段と、 から構成した外国語電子辞書生成装置。
  4. (4)外国語辞書の原データの発音記号から生成した発
    音記号に対応する日本語的表音表記を検索キーとして上
    記原データと共に辞書データベースとして登録した記憶
    手段と、 日本語的表音表記を検索キーとして入力可能とした検索
    キー入力手段と、 検索結果を出力する出力手段と、 から構成した外国語電子辞書検索装置。
  5. (5)外国語辞書の原データの発音記号から生成した発
    音記号に対応する日本語的表音表記を検索キーとして上
    記言語データと共に辞書データベースとして登録した記
    憶手段と、日本語的表音表記を検索キーとして入力する
    検索キー入力手段と、 検索キー入力手段から入力された日本語的表音表記を上
    記記憶手段に登録された表音表記と同一の表音表記に補
    正する表音表記短縮手段と、表音表記短縮手段で補正し
    た表音表記を検索キーとして記憶手段に登録された辞書
    データベースを検索し、その検索結果を出力する出力手
    段と、から構成した外国語電子辞書検索装置。
JP11032590A 1990-04-27 1990-04-27 外国語電子辞書検索方法及び装置 Expired - Fee Related JP3285149B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11032590A JP3285149B2 (ja) 1990-04-27 1990-04-27 外国語電子辞書検索方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11032590A JP3285149B2 (ja) 1990-04-27 1990-04-27 外国語電子辞書検索方法及び装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2000343785A Division JP2001167093A (ja) 2000-11-10 2000-11-10 外国語電子辞書の生成、検索のための方法および装置

Publications (2)

Publication Number Publication Date
JPH0410052A true JPH0410052A (ja) 1992-01-14
JP3285149B2 JP3285149B2 (ja) 2002-05-27

Family

ID=14532867

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11032590A Expired - Fee Related JP3285149B2 (ja) 1990-04-27 1990-04-27 外国語電子辞書検索方法及び装置

Country Status (1)

Country Link
JP (1) JP3285149B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5890183A (en) * 1995-03-13 1999-03-30 Fuji Xerox Co., Ltd. Method, apparatus, electronic dictionary and recording medium for converting converted output into character code set accetpable for re-retrieval as original input
JP2009223895A (ja) * 2008-03-14 2009-10-01 Nhn Corp 日本語辞書サービスにおいて2単語以上のクエリー、ハングルクエリーまたは一般的なクエリーの入力の際の検索結果を提供するための方法及びシステム
JP2010134922A (ja) * 2008-12-08 2010-06-17 Nhn Corp 類似語決定方法およびシステム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5890183A (en) * 1995-03-13 1999-03-30 Fuji Xerox Co., Ltd. Method, apparatus, electronic dictionary and recording medium for converting converted output into character code set accetpable for re-retrieval as original input
JP2009223895A (ja) * 2008-03-14 2009-10-01 Nhn Corp 日本語辞書サービスにおいて2単語以上のクエリー、ハングルクエリーまたは一般的なクエリーの入力の際の検索結果を提供するための方法及びシステム
JP2010134922A (ja) * 2008-12-08 2010-06-17 Nhn Corp 類似語決定方法およびシステム

Also Published As

Publication number Publication date
JP3285149B2 (ja) 2002-05-27

Similar Documents

Publication Publication Date Title
Silberztein Formalizing natural languages: The NooJ approach
Sugandhi et al. Sign language generation system based on Indian sign language grammar
US5895446A (en) Pattern-based translation method and system
US6275789B1 (en) Method and apparatus for performing full bidirectional translation between a source language and a linked alternative language
Winograd Computer software for working with language
JP2016186805A5 (ja)
EP1346291A1 (en) Automatic or semiautomatic translation system and method with post-editing for the correction of errors
JPS62163173A (ja) 機械翻訳方法
JP2006164293A (ja) 自動自然言語翻訳
JPH05314166A (ja) 電子化辞書および辞書検索装置
Bugert et al. Generalizing cross-document event coreference resolution across multiple corpora
Sproat et al. The taxonomy of writing systems: How to measure how logographic a system is
Alkhuli A Contrastive transformational grammar
JP3677016B2 (ja) 外国語電子辞書検索装置
JPH0410052A (ja) 外国語電子辞書検索方法及び装置
Griffith et al. Early Irish Lexicography‒A Research Survey
JPS6310265A (ja) 翻訳装置
Algarni Light morphology and arabic information retrieval.
JP2958044B2 (ja) かな漢字変換方法及び装置
JP3873305B2 (ja) 仮名漢字変換装置および仮名漢字変換方法
Deksne et al. Towards the Development of Language Analysis Tools for the Written Latgalian Language
JP2924089B2 (ja) 日本語発音練習機
Li From Mandarin to Cantonese lexicography: A genealogical study of Robert Morrison’s Vocabulary of the Canton Dialect (1828)
Utka Towards the Development of Language Analysis Tools for the Written Latgalian
JP2001167093A (ja) 外国語電子辞書の生成、検索のための方法および装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080308

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090308

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100308

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees