JP2003178087A - Retrieval device and method for electronic foreign language dictionary - Google Patents

Retrieval device and method for electronic foreign language dictionary

Info

Publication number
JP2003178087A
JP2003178087A JP2002306148A JP2002306148A JP2003178087A JP 2003178087 A JP2003178087 A JP 2003178087A JP 2002306148 A JP2002306148 A JP 2002306148A JP 2002306148 A JP2002306148 A JP 2002306148A JP 2003178087 A JP2003178087 A JP 2003178087A
Authority
JP
Japan
Prior art keywords
search
dictionary
notation
foreign language
japanese
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002306148A
Other languages
Japanese (ja)
Other versions
JP3677016B2 (en
Inventor
Tadanobu Miyauchi
忠信 宮内
Yoshibumi Matsunaga
義文 松永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2002306148A priority Critical patent/JP3677016B2/en
Publication of JP2003178087A publication Critical patent/JP2003178087A/en
Application granted granted Critical
Publication of JP3677016B2 publication Critical patent/JP3677016B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To enable retrieval by inputting a retrieval key with a notation preferable for a user even without knowing the notation reference of the retrieval key concerning a foreign language dictionary retrieving device for retrieving a foreign language dictionary with the Japanese-like phonogram of a foreign word such as square forms of KANA as the retrieval key. <P>SOLUTION: When generating a foreign language dictionary, source data of the foreign language dictionary containing a foreign word and a phonetic symbol corresponding to the pronunciation of that foreign word are inputted, a correspondent Japanese-like phonogram is generated from the inputted phonetic symbol, the generated Japanese-like phonogram is registered in a storage part 3 as a retrieval key together with the source data as a dictionary database. In retrieving, the Japanese-like phonogram is inputted from a retrieval key input part 4 as a retrieval key, and the word is retrieved from the electronic foreign language dictionary database in the storage part 3 according to the inputted Japanese-like phonogram. <P>COPYRIGHT: (C)2003,JPO

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、外国語辞書の発音
記号からローマ字やカタカナの日本語的表音表記を生成
し、これを更に自然な日本語としての表音表記(以下、
単に表記と記す場合もある)、あるいは短縮した表音表
記としての表音表記のゆれ(表記のばらつき)を所定の
表音表記に統一した検索キーとして上記外国語辞書デー
タ(原データ)と共に辞書データベースとして登録する
ことにより、外国語の日本語的表音表記のルールを意識
することなく入力した日本語的表音表記の検索キーから
外国語辞書データベースを検索できるようにするため
の、外国語電子辞書の検索に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention generates Japanese phonetic transcriptions of Roman letters and katakana from phonetic symbols of foreign language dictionaries, and uses the phonetic transcriptions as natural Japanese (hereinafter,
(It may be simply referred to as notation) or a phonetic notation fluctuation (notation variation) as a shortened phonetic notation as a search key that is unified into a prescribed phonetic notation together with the foreign language dictionary data (original data) By registering as a database, it is possible to search the foreign language dictionary database from the search key of the Japanese phonetic expression entered without paying attention to the rules of the Japanese phonetic expression of the foreign language. Related to searching electronic dictionaries.

【0002】[0002]

【従来の技術】国際化の進展により、日本語に占める日
本語的外国語,所謂「カタカナ語」とくに「カタカナ英
語」と呼ばれる外来語の比率は増える一方である。この
種の外来語は、その発音をカタカナで表記した表音表記
として用いることが殆どである。その発音は日本語の発
音に沿ったものとして表現されているものが大勢である
が、そのカタカナ表現やカタカナに対応したローマ字表
現もまちまちである。また、元の言語(外国語)の単語
の意味とは違った意味に用いられているものも多い。従
来、例えば特開昭61−100864号公報,特開昭5
7−161970号公報に開示のように、外国語のカタ
カナ表記もしくはカタカナ相当のローマ字表記と当該外
国語の綴りの対応表を設けておき、カタカナ表記もしく
はカタカナ相当のローマ字表記の入力に対して外国語の
単語の綴りを表示して、それを基に辞書検索を行うよう
にしたものが知られている。
2. Description of the Related Art Due to the progress of internationalization, the proportion of foreign words in Japanese, which is a Japanese foreign language, so-called "Katakana", especially "Katakana English", is increasing. Most of these foreign words are used as phonetic transcriptions whose pronunciations are written in katakana. Most of the pronunciations are expressed as in line with the pronunciation of Japanese, but the Katakana expression and the Roman expression corresponding to Katakana are also mixed. In addition, many are used for meanings different from the meanings of the words in the original language (foreign language). Conventionally, for example, JP-A-61-100864, JP-A-5
As disclosed in Japanese Laid-Open Publication No. 7-161970, a correspondence table of foreign language katakana notation or katakana equivalent romanization and the spelling of the foreign language is prepared in advance, and foreign words are input to katakana notation or katakana equivalent romanization. It is known to display the spelling of a word and perform a dictionary search based on the spelling.

【0003】[0003]

【発明が解決しようとする課題】上記従来の技術のよう
に、外国語のカタカナ表記もしくはカタカナ相当のロー
マ字表記と当該外国語の綴りの対応表を全ての外国語単
語について作成することは膨大な作業量を必要とするう
え、誤りの発生も避けられず、効率の良いものとは言え
ず、また日々増えるカタカナ語に対応してその改定を行
うことは容易でない。
It is enormous to create a correspondence table of foreign language katakana notation or romanized notation equivalent to katakana and spelling of the foreign language for all foreign language words as in the above-mentioned conventional technique. It requires a lot of work, errors are inevitable, it cannot be said that it is efficient, and it is not easy to revise it according to the daily increase of Katakana.

【0004】一方、外国語の発音を表す表音表記として
IPA表記(International Phone
tic Alphabet)などの統一した発音表記が
あるが、これは日本人には分かり難いものであると共
に、既存の辞書の発音記号との対応において新たにその
発音表記を入力することは更に多大な労力を必要とす
る。
On the other hand, the IPA notation (International Phone) is used as a phonetic notation that represents the pronunciation of a foreign language.
There is a unified phonetic transcription such as tic Alphabet), but this is difficult for Japanese people to understand, and it is much more labor to input the new pronunciation in correspondence with the phonetic symbols of the existing dictionary. Need.

【0005】さらに、上記公報に開示されたような対応
表を作成して電子辞書として登録しても、カタカナ表記
には、表記のゆれ,すなわちカタカナ表現のばらつき,
不統一があり、全ての単語についてこのような表記のゆ
れを統一するための対応表をも作成し登録することは困
難である。たとえは、「gesture」という単語一
つとってみても、そのカタカナ表記には、「ゼスチャ
ー」,「ゼスチュアー」,「ジェスチャー」..など、
数多くの暖昧な表記(上記した表記のゆれ)が見られ
る。これを全ての単語について登録することは不可能て
ある。
Further, even if the correspondence table as disclosed in the above publication is created and registered as an electronic dictionary, the katakana notation has fluctuations in notation, that is, variations in katakana expression,
There is inconsistency, and it is difficult to create and register a correspondence table for unifying such fluctuations in notation for all words. For example, even if we take the word "gesture," the katakana notation is "gesture,""gesture,""gesture." . Such,
You can see a lot of vague notations (the fluctuation of the above notation). It is impossible to register this for all words.

【0006】このように、外国語を日本的な表音で表記
する際に、音節に跨がった表記の異なり(上記のゆれ、
詳しくは、音韻上のゆれ)が存在するため、日本語にお
ける上記のような表記の暖昧さに起因する検索キー設定
に困難性があり、外国語の検索キーとして当該検索シス
テムにおける表記基準(表記ルール)を知ることなく単
にカタカナ表記を用いることには問題があった。
As described above, when a foreign language is written in Japanese phonetics, the notation spanning syllables is different.
For details, since there is phonological fluctuation), it is difficult to set the search key due to the ambiguity of the above-mentioned notation in Japanese. There was a problem in simply using katakana notation without knowing the notation rules).

【0007】本発明の目的は、カタカナ語などのよう
に、外国語の日本語的表音表記から元の外国語を検索す
る際に、その日本語の標準的表音表記を意識することな
く好みの表記で検索キーを入力できるように電子辞書の
検索をするための方法および装置を提供することにあ
る。
An object of the present invention is to search for an original foreign language from a Japanese phonetic transcription of a foreign language, such as Katakana, without paying attention to the standard Japanese phonetic transcription. It is an object of the present invention to provide a method and apparatus for searching an electronic dictionary so that a search key can be entered with a favorite notation.

【0008】[0008]

【課題を解決するための手段】本発明の外国語電子辞書
検索装置は、上記目的を達成するために、外国語辞書の
原データの発音記号から生成した日本語的表音表記を前
記原データのキー情報として前記原データと共に登録し
た辞書データベースを記憶した記憶手段と、前記辞書デ
ータベースを検索する検索キーを日本語的表音表記で入
力する検索キー入力手段と、前記検索キー入力手段から
入力された日本語的表音表記により、前記記憶手段に登
録された辞書データベースを検索する検索手段と、前記
検索手段の検索結果に基づいて該当する外国語辞書の原
データを出力する出力手段とを含むことを特徴とする。
In order to achieve the above-mentioned object, the foreign language electronic dictionary search device of the present invention uses a Japanese phonetic transcription generated from phonetic symbols of the original data of the foreign language dictionary as the original data. Storage means for storing a dictionary database registered together with the original data as key information of, a search key input means for inputting a search key for searching the dictionary database in Japanese phonetic notation, and input from the search key input means A search means for searching the dictionary database registered in the storage means by the written Japanese phonetic notation, and an output means for outputting the original data of the corresponding foreign language dictionary based on the search result of the search means. It is characterized by including.

【0009】また、本発明の外国語電子辞書生成方法
は、外国語辞書の原データの発音記号から生成した日本
語的表音表記を前記原データのキー情報として前記原デ
ータと共に登録した辞書データベースを記憶した記憶手
段と、前記辞書データベースを検索する検索手段と、検
索結果を出力する出力手段を備えた外国語辞書検索装置
の検索方法であって、前記辞書データベースを検索する
検索キーを日本語的表音表記で入力するステップと、前
記入力された日本語的表音表記により、前記記憶手段に
登録された辞書データベースを前記検索手段により検索
するステップと、前記検索手段の検索結果に基づいて該
当する外国語辞書の原データを前記出力手段により出力
するステップとを含むことを特徴とする。
The foreign language electronic dictionary generating method of the present invention is a dictionary database in which Japanese phonetic notation generated from phonetic symbols of original data of a foreign language dictionary is registered together with the original data as key information of the original data. A search method for a foreign language dictionary search device, comprising: a storage unit that stores a search result, a search unit that searches the dictionary database, and an output unit that outputs a search result, wherein a search key for searching the dictionary database is Japanese. Based on a search result of the search means, a step of inputting in a phonetic notation, a step of searching the dictionary database registered in the storage means by the search means with the input Japanese phonetic notation Outputting the original data of the corresponding foreign language dictionary by the output means.

【0010】本発明の他の態様の外国語電子辞書生成装
置は、外国語辞書の原データの発音記号から生成した日
本語的表音表記を、前記原データのキー情報として前記
原データと共に登録した辞書データベースを記憶した記
憶手段と、前記辞書データベースを検索する検索キーを
日本語的表音表記で入力する検索キー入力手段と、前記
検索キー入力手段から入力された日本語的表音表記を補
正する補正手段と、前記補正手段により補正された日本
語的表音表記により、前記記憶手段に登録された辞書デ
ータベースを検索する検索手段と、前記検索手段の検索
結果に基づいて該当する外国語辞書の原データを出力す
る出力手段とを含むことを特徴とする。
According to another aspect of the present invention, there is provided a foreign language electronic dictionary generating apparatus which registers Japanese phonetic notation generated from phonetic symbols of original data of a foreign language dictionary together with the original data as key information of the original data. A storage means for storing the dictionary database, a search key input means for inputting a search key for searching the dictionary database in Japanese phonetic notation, and a Japanese phonetic notation input from the search key input means. Correcting means for correcting, searching means for searching the dictionary database registered in the storing means by the Japanese phonetic notation corrected by the correcting means, and a foreign language corresponding to the search result of the searching means And output means for outputting the original data of the dictionary.

【0011】また、本発明の外国電子辞書検索方法は、
外国語辞書の原データの発音記号から生成した日本語的
表音表記を前記原データのキー情報として前記原データ
と共に登録した辞書データベースを記憶した記憶手段
と、前記辞書データベースを検索する検索手段と、検索
結果を出力する出力手段を備えた外国語辞書検索装置の
検索方法であって、前記辞書データベースを検索する検
索キーを日本語的表音表記で入力するステップと、前記
検索キーとして入力された日本語的表音表記を補正する
ステップと、前記補正された日本語的表音表記により、
前記記憶手段に登録された辞書データベースを前記検索
手段により検索するステップと、前記検索手段の検索結
果に基づいて該当する外国語辞書の原データを前記出力
手段により出力するステップとを含むことを特徴とす
る。
The foreign electronic dictionary search method of the present invention is
Storage means for storing a dictionary database in which Japanese phonetic notations generated from phonetic symbols of the original data of the foreign language dictionary are registered together with the original data as key information of the original data; and search means for searching the dictionary database. A search method for a foreign language dictionary search device having output means for outputting a search result, the method comprising: inputting a search key for searching the dictionary database in Japanese phonetic notation; By the step of correcting the Japanese phonetic notation, and the corrected Japanese phonetic notation,
The method further comprises a step of searching the dictionary database registered in the storage means by the search means, and a step of outputting original data of a corresponding foreign language dictionary by the output means based on a search result of the search means. And

【0012】[0012]

【作用】外国語の原辞書データ(原データ)の発音記号
から日本語的表音表記(日本語の表音表記:カタカナ表
記,ローマ字表記)を自動的に生成させ、この表音表記
と共に上記外国語の原データをデータベースとして登録
しておき、日本語的表音表記の検索キーを入力して、デ
ータベースを検索する。その検索結果に基づいて外国語
辞書の原データを出力する。外国語辞書に対して日本語
的発音をそのまま表音表記とした検索キーを用いて検索
することが可能となり、その際、日本語の標準的表音表
記を意識することなく好みの表記で検索キーを入力でき
る。
[Function] Automatically generates Japanese phonetic notation (Japanese phonetic notation: Katakana notation, Roman alphabet notation) from phonetic symbols of foreign language original dictionary data (original data). Register the foreign language original data as a database and enter the Japanese phonetic notation search key to search the database. The original data of the foreign language dictionary is output based on the search result. It is possible to search in a foreign language dictionary by using the search key that has the Japanese pronunciation as it is, and at that time, you can search with your favorite notation without paying attention to the standard Japanese phonetic notation. You can enter the key.

【0013】[0013]

【実施例】以下、本発明の実施例を図面を参照して説明
する。図1は本発明による外国語電子辞書生成検索装置
の概略構成を示すブロック図であって、1は表音表記生
成部、2は表記補正部、3は記憶部、4は検索キー入力
部、5は検索結果出力手段である。
Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram showing a schematic configuration of a foreign language electronic dictionary generation / retrieval device according to the present invention. 1 is a phonetic transcription generation unit, 2 is a notation correction unit, 3 is a storage unit, 4 is a search key input unit, Reference numeral 5 is a search result output means.

【0014】同図において、表音表記生成部1は外国語
辞書の原データから発音記号を抽出し、この発音記号に
基づいてカタカナまたはローマ字表記の表音記号をす
る。生成された表音表記は、表記補正部2において、そ
の綴り(スペリング)に応じ、日本語として自然となる
ような(日本人にとって発音し易い)表記補正を行う。
In the figure, the phonetic transcription generation unit 1 extracts phonetic symbols from the original data of the foreign language dictionary and makes katakana or romaji phonetic symbols based on these phonetic symbols. The generated phonetic transcription is corrected by the transcription correction unit 2 according to the spelling (spelling) so that the transcription becomes natural as Japanese (easy to pronounce for Japanese).

【0015】表記補正した表音表記は、原辞書である外
国語辞書の原データと共に記憶部3に登録される。記憶
部3には表音表記を検索キーとして格納する表音表記格
納領域(日本語的表音表記格納領域)と上記原データを
その単語毎レコードとして格納する単語レコード格納領
域とが少なくとも設けられており、ユーザが検索キー入
力部4からカタカナやローマ字による外国語の表音記号
(表音表記)を入力することにより、その検索結果が検
索結果出力部5に出力される。
The corrected phonetic transcription is registered in the storage unit 3 together with the original data of the foreign language dictionary which is the original dictionary. The storage unit 3 is provided with at least a phonetic transcription storage area (Japanese phonetic transcription storage area) for storing the phonetic transcription as a search key and a word record storage area for storing the original data as a record for each word. When the user inputs a phonetic symbol (phonetic notation) of a foreign language in Katakana or Roman letters from the search key input unit 4, the search result is output to the search result output unit 5.

【0016】図2は本発明の第1実施例である和英カタ
カナ検索装置の構成を説明するブロック図である。
FIG. 2 is a block diagram for explaining the configuration of the Japanese-English katakana search device according to the first embodiment of the present invention.

【0017】同図において、表音表記生成部1はMT等
の形とした原辞書(英和辞書)21と辞書読込手段22
とカタカナ表記入力手段23とから成る。辞書読込手段
22は、原辞書21の辞書データをコンピュータで処理
可能な形に構造化する機能を有し、カタカナ表記入力手
段23は原辞書データから得られた発音記号を基に日本
語的表音表記を生成する機能を有し、ここではカタカナ
表記を生成する。
In the figure, the phonetic transcription generation unit 1 includes an original dictionary (English-Japanese dictionary) 21 in the form of MT and a dictionary reading means 22.
And katakana notation input means 23. The dictionary reading means 22 has a function of structuring the dictionary data of the original dictionary 21 into a form that can be processed by a computer, and the katakana notation input means 23 is a Japanese-based table based on phonetic symbols obtained from the original dictionary data. It has a function to generate phonetic notation, and here it generates katakana notation.

【0018】次に、図2に示した実施例の構成の動作を
説明する。まず、原辞書である英和辞書のデータを基に
して辞書データベースを作成し、これを記憶手段3に登
録するが、一般に原辞書21はMTの形で電子的データ
として供給される。これを辞書読込手段22に読込み、
予め決められた規則にしたがってコンピュータ処理可能
に構造化したテキストを作成する。
Next, the operation of the configuration of the embodiment shown in FIG. 2 will be described. First, a dictionary database is created based on the data of the English-Japanese dictionary which is the original dictionary, and this is registered in the storage means 3. Generally, the original dictionary 21 is supplied as electronic data in the form of MT. Read this into the dictionary reading means 22,
A computer-processed structured text is created according to a predetermined rule.

【0019】図3は構造化テキスト例の説明図であっ
て、辞書を構成する一つの単語についてのレコードを示
し、21は単語「list」についての辞書項目(属
性)のレコードで、見出し語である単語「list」,
その重要度**(この記号は、例えば高校程度で習得す
べきものに*、中学程度で習得すべきものに**を付し
てある),発音記号〔list〕,品詞項目からなり、
更に品詞項目について分解したレコード22−1,22
−2が木構造等の形で構造化された単語レコードを生成
する。同図の例では、単語「list」を見出し語とし
て、重要度**,発音〔list〕および品詞としての
名詞(意味:名簿、用例:Her nameis..,
慣用句:make a list of..,・・)と
他動詞(意味:表す,用例:・・)・・・が図示のよう
に構造化データとして生成される。
FIG. 3 is an explanatory view of an example of structured text, showing a record for one word constituting a dictionary, and 21 is a record of a dictionary item (attribute) for the word "list", which is a headword. A word "list",
Its importance ** (for example, those that should be learned in high school are marked with *, those that should be learned in middle school are marked with **), phonetic symbols [list], and part-of-speech items,
Furthermore, records 22-1, 22 decomposed into parts of speech items
-2 generates a word record structured in a tree structure or the like. In the example of the figure, the word "list" is used as a headword, and the importance **, pronunciation [list], and noun as a part of speech (meaning: name list, example: Her nameis ...,
Phrasebook: make a list of. . , ...) and transitive verbs (meaning: represent, example: ...) are generated as structured data as shown.

【0020】上記の構造化データから、その発音項目を
取り出し、その発音記号(図3の例では〔list〕)
をカタカナ表記入力手段23に渡す。 カタカナ表記入
力手段23は与えられた発音記号からカタカナ表記を生
成する。このカタカナ表記の生成は、既知の日本語ワー
ドプロセッサなどで用いられているローマ字→カナ変換
と同様のアルゴリズムにより実行できる。
The pronunciation item is extracted from the structured data, and its phonetic symbol ([list] in the example of FIG. 3).
To the katakana notation input means 23. The katakana notation input means 23 generates katakana notation from the given phonetic symbols. The generation of the katakana notation can be executed by the same algorithm as the Roman character → kana conversion used in a known Japanese word processor or the like.

【0021】カタカナ表記入力手段23で生成されたカ
タカナ表記(カナ表記)は補正手段24に供給されて日
本語的発音表記への補正が行われる。日本語は各音節が
母音で終わるのを基本としていることで、英語等の外国
語の表記と大きく異なる。この問題を解決するため、英
語の発音記号について次のような補正を施す。
The katakana notation (kana notation) generated by the katakana notation input means 23 is supplied to the correction means 24 to be corrected to the Japanese pronunciation notation. Japanese is based on the fact that each syllable ends with a vowel, which is very different from the notation in foreign languages such as English. To solve this problem, the following corrections are made to English phonetic symbols.

【0022】図4は英語の発音記号に付加する補正情報
の対応を示す説明図であって、記号b,d,..k,
1,p,..に対して、それぞれブ,ド,..ク,ル,
プ,..を付加する。例えば、見出し語の単語desk
の発音記号[desk]は、その記号が[s][k]に
ついて、その後にそれぞれ[u]をおぎなって[des
uku]とし、このカタカナ発音表記として[デスク]
を生成する。
FIG. 4 is an explanatory view showing the correspondence of the correction information added to the English phonetic symbols, and the symbols b, d ,. . k,
1, p ,. . , Respectively. . Ku, Le,
,. . Is added. For example, the word deskk
The phonetic symbol [desk] is [s] [k], followed by [u] and [des]
uku], and as this katakana phonetic notation [desk]
To generate.

【0023】しかし、発音記号のみでは暖昧母音[∂]
を含む音節の表記などが確定できない。そのため、カタ
カナ表記と辞書読込手段から得られるつづり(スペリン
グ)や音節情報(“‐”)を補正手段24に与え、発音
補正を施す必要がある。
However, a warm vowel [∂] is obtained only by phonetic symbols.
The syllable notation, etc., cannot be determined. Therefore, it is necessary to give the correction means 24 spelling and syllable information (“-”) obtained from the katakana notation and the dictionary reading means to correct the pronunciation.

【0024】図5は暖昧母音の補正対応表の説明図であ
って、[ca,ke]には[ヶ]を、[cau,co]
には[コ]を、....のように対応させる。例えば、
con−cern[k∂ns∂:rn]の前半の音節’
con’は[k∂n]に対応するので[コン]に、後半
の音節’cern’は[s∂:rn]に対応して[サー
ン]というように、図5に示した対応表によって暖昧母
音の発音を確定する。
FIG. 5 is an explanatory diagram of a correction correspondence table for warm vowels, where [ca, ke] is [month] and [cau, co].
Is [ko] ,. . . . Correspond as follows. For example,
The first half syllable of con-cern [k∂ns∂: rn]
The con 'corresponds to [k∂n], so [con], and the second half syllable'cern' corresponds to [s∂: rn] is [sarn]. Determine the pronunciation of the vowel vowel.

【0025】図6は記憶手段に格納される補正済のカタ
カナ表音表記レコードと単語レコードの内容の説明図で
あって、カタカナ表音表記61を検索キーとして単語レ
コード62が格納される。
FIG. 6 is an explanatory view of the contents of the corrected katakana phonetic transcription record and word record stored in the storage means, and the word record 62 is stored using the katakana phonetic transcription 61 as a search key.

【0026】図7は上記のようにして生成され記憶手段
に格納された英和辞書データベースを検索した出力例を
示すユーザビューの説明図である。検索キー入力部4は
通常のキーボード/マウスからなる入力手段28の他
に、OCR読み取り装置26や音声入力手段27で構成
することができ、これらの何れかから入力した検索キー
として[イングリッシュ]と入力すると、ビュー71の
入力ビュー72に検索キー[イングリッシュ]が表示さ
れ、この検索キーに基づいて検索された結果である「E
nglish」の英単語とその関連項目(発音記号,品
詞,意味,…)が出力ビュー73に表示される。
FIG. 7 is an explanatory diagram of a user view showing an output example of searching the English-Japanese dictionary database generated as described above and stored in the storage means. The search key input unit 4 can be composed of an OCR reading device 26 and a voice input means 27 in addition to the input means 28 consisting of a normal keyboard / mouse, and the search key input from either of them is [English]. When input, the search key [English] is displayed in the input view 72 of the view 71, and the search result "E" is displayed based on this search key.
The English word “nglish” and its related items (phonetic symbol, part of speech, meaning, ...) Are displayed in the output view 73.

【0027】なお、この検索結果を出力する出力手段と
しては、上記のような表示手段のユーザビューによる視
覚表示の他に、直接紙に印刷出力するハードコーピー手
段30や音声で出力する音声出力手段31などで構成す
ることもできる。
As the output means for outputting the retrieval result, in addition to the visual display by the user view of the display means as described above, the hard copy means 30 for directly printing out on paper or the voice output means for outputting by voice. It can also be configured with 31 or the like.

【0028】上記説明したように生成された英和辞書等
の外国語辞書は、この実施例で説明したような使い方に
限らず、本来の外国語辞書としての利用,すなわち見出
し語からの検索が可能であることは言うまでもない。こ
の場合、図2の検索入力部4から入力された単語が英文
字であれば、図6に示した見出し語をキーとして検索す
る。
The foreign language dictionary such as the English-Japanese dictionary generated as described above is not limited to the usage as described in this embodiment, but can be used as an original foreign language dictionary, that is, can be searched from a headword. Needless to say. In this case, if the word input from the search input unit 4 in FIG. 2 is an English character, the entry word shown in FIG. 6 is used as a key for searching.

【0029】このとき、その単語レコード62に加えて
カタカナ表音表記レコード61をも出力することによっ
て、この辞書を外国人が日本語の学習のために利用する
うえで学習効果が大きくなるという効用もある。最近の
国際化に伴って、日本に在住する外国人の数は増える一
方である。外国人が日本語を学習するうえで大きな障害
となっている一つにカタカナ語がある。
At this time, by outputting the katakana phonetic transcription record 61 in addition to the word record 62, the learning effect is increased when a foreigner uses this dictionary for learning Japanese. There is also. With the recent internationalization, the number of foreigners living in Japan is increasing. Katakana is one of the major obstacles for foreigners to learn Japanese.

【0030】カタカナ語は、日本人の発音の都合で原語
とは掛け離れた発音表記となってしまったものや、流行
らす側の勝手なフィーリングに基づいて創作したものが
多く、外国人にとっては困惑するものであることが殆ど
である。本発明は、このようなカタカナ語を理解するた
めにも有効な手段となる。
The Katakana language is often written in a pronunciation that is far from the original due to the pronunciation of the Japanese, and is often created based on the feeling of the fashionable side. Mostly confusing. The present invention is also an effective means for understanding such Katakana.

【0031】図8はカタカナ語の理解のために資する利
用形態を説明するユーザビューの説明図であって、ユー
ザを外国人として想定し、検索キー入力部4から見出し
語「Japanease」を入力すると、入力した検索
キーがユーザビュー81の入力ビュー82に表示され、
検索された結果が出力ビュー83に表示される。
FIG. 8 is an explanatory diagram of a user view for explaining a usage pattern that contributes to understanding of Katakana language. When the user is assumed to be a foreigner and the entry word “Japanease” is input from the search key input unit 4. , The input search key is displayed in the input view 82 of the user view 81,
The search result is displayed in the output view 83.

【0032】この出力ビューには、入力した英語の見出
し語に対応する前記した日本語的なカタカナ表記が出力
される。このカタカナ表記により、外国人は通常の日本
語の意味に加えて日本的な発音を知ることができる。こ
れを利用して、日本語の文章を書く場合にカタカナ語を
交えた日本人的な文章を作ることができ、学習効果向上
の期待を持たせることができる。
On the output view, the Japanese katakana notation corresponding to the input English headword is output. With this katakana notation, foreigners can learn Japanese pronunciation in addition to the usual Japanese meaning. By using this, when writing a Japanese sentence, it is possible to create a Japanese sentence with Katakana language, which can be expected to improve the learning effect.

【0033】以上のように、本実施例によれば、一般に
分かり難い発音記号から自動的にローマ字またはカタカ
ナ表記が得られ、外国語辞書を日本語的な表音表記を介
して利用することができる。
As described above, according to this embodiment, it is possible to automatically obtain Roman or Katakana notation from phonetic symbols that are generally difficult to understand, and to use a foreign language dictionary through Japanese phonetic notation. it can.

【0034】次に、本発明による外国語電子辞書生成・
検索装置の他の実施例を説明する。図9は本発明を英和
カタカナ検索システムに適用した第2実施例の構成を説
明するブロック図であって、1は表音表記生成部、2は
表記補正部、3は記憶部、4は検索キー入力部、5は検
索結果出力部である。そして、前記実施例と同様に、表
音表記生成部は1は外国語辞書の原データから発音記号
を抽出し、この発音記号に基づいてカタカナまたはロー
マ字表記の表音記号を生成する。表音表記生成部1はM
T等の形とした原辞書(英和辞書)21と辞書読込手段
22とカタカナ表記入力手段23とから成る。すなわ
ち、辞書読込手段22は、原辞書21の辞書データをコ
ンピュータで処理可能な形の構造化する機能を有し、カ
タカナ表記入力手段23は原辞書データから得られた発
音記号を基に表音記号(表音表記)を生成する機能を有
し、ここではカタカナ表記を生成する。
Next, generation of a foreign language electronic dictionary according to the present invention
Another embodiment of the search device will be described. FIG. 9 is a block diagram for explaining the configuration of the second embodiment in which the present invention is applied to an English-Japanese katakana search system. 1 is a phonetic notation generation unit, 2 is a notation correction unit, 3 is a storage unit, and 4 is a search. A key input unit 5 is a search result output unit. Then, as in the above embodiment, the phonetic transcription generation unit 1 extracts phonetic symbols from the original data of the foreign language dictionary and generates phonetic symbols in katakana or romaji based on the phonetic symbols. Phonetic transcription generation unit 1 is M
It comprises an original dictionary (English-Japanese dictionary) 21 in the form of T, a dictionary reading means 22 and a katakana notation input means 23. That is, the dictionary reading means 22 has a function of structuring the dictionary data of the original dictionary 21 in a form that can be processed by a computer, and the katakana notation input means 23 produces phonetic sounds based on phonetic symbols obtained from the original dictionary data. It has a function of generating symbols (phonetic notation), and here, katakana notation is generated.

【0035】辞書データの構造化は前記図3で詳細に説
明したように、予め決められた規則にしたがってコンピ
ュータ処理可能に構造化したテキストを作成する。
As for the structuring of the dictionary data, as described in detail with reference to FIG. 3, a structured text that can be processed by a computer is created according to a predetermined rule.

【0036】構造化された図3に示したような単語レコ
ードからなる辞書データは記憶部3を構成する記憶手段
25に格納される。一方、上記表音表記生成部1のカタ
カナ表記入力手段23は辞書データの発音記号の項目を
抽出し、この発音記号からカタカナ表記を生成し、生成
したカタカナ表記を表記補正部2を構成する表音表記短
縮手段241に与え、表記のゆれを補正する表記短縮化
処理を行う。
Dictionary data composed of structured word records as shown in FIG. 3 is stored in the storage means 25 constituting the storage unit 3. On the other hand, the katakana notation input means 23 of the phonetic notation generation unit 1 extracts a phonetic symbol item of dictionary data, generates katakana notation from this phonetic symbol, and forms the generated katakana notation in the notation correction unit 2. It is given to the phonetic notation shortening means 241 to perform a notation shortening process for correcting the fluctuation of the notation.

【0037】原辞書である英和辞書の発音記号から生成
したカタカナ表記は、日本語的な表記と異なるものが多
く、また日本語としてのカタカナ表記にも多様な表記
(ゆれ)が存在する。このような多種多様な表記につい
てまで辞書データベースに登録することはその生成作業
の膨大さもさることながら、記憶手段の容量を消費し、
検索速度を低下させるなど、システム全体からみて決し
て効率のよいものではない。本発明のこの実施例では、
上記表記のゆれを解決するために、このゆれを一意的に
短縮する処理、すなわち統一した短縮表記とする処理を
施すものである。
The katakana notation generated from the phonetic symbols of the English-Japanese dictionary, which is the original dictionary, is often different from the Japanese notation, and there are various notations (jitters) in the katakana notation as Japanese. Registering such a variety of notations in the dictionary database consumes a large amount of storage work as well as enormous amount of generation work.
It is not efficient in terms of the entire system, such as reducing the search speed. In this embodiment of the invention,
In order to solve the above-mentioned fluctuation of the notation, processing for uniquely shortening this fluctuation, that is, processing for making a unified shortened notation is performed.

【0038】以下、このカタカナ表記短縮手段における
短縮アルゴリズムを図10〜図13を参照して説明する
(なお、後述する検索時の検索キーの短縮アルゴリズム
も同一である)。
Hereinafter, the shortening algorithm in this katakana notation shortening means will be described with reference to FIGS. 10 to 13 (note that the retrieval key shortening algorithm at the time of retrieval, which will be described later, is also the same).

【0039】図10はカタカナ短縮アルゴリズムを説明
するフローチャート、図11は子音変換テーブル(C
T)の説明図、図12は二重母音テーブル(DT)の説
明図、図13は一文字置換テーブル(OT)の説明図で
ある。
FIG. 10 is a flow chart for explaining the Katakana reduction algorithm, and FIG. 11 is a consonant conversion table (C
T), FIG. 12 is an explanatory diagram of a double vowel table (DT), and FIG. 13 is an explanatory diagram of a one-character substitution table (OT).

【0040】まず、バッファのクリアや変数初期化を行
った後(ステップ1、以下「S1」のように記す)、辞
書読込手段22から入力されたカタカナ文字列からカタ
カナ表記入力手段23が表音表記短縮手段入力用のデー
タストリームRS(発音記号から生成されたカタカナ表
記を転送するためのデータ転送構造、以下、単にストリ
ームRSという)を生成する(S2)。また同時に短縮
結果を記憶手段25に格納するための出力用のデータス
トリームWS(短縮処理されたカタカナ表記を転送する
ためのデータ転送構造、以下、単にストリームWSとい
う)も生成しておく(S3)。
First, after the buffer is cleared and variables are initialized (step 1, hereinafter referred to as "S1"), the katakana notation input means 23 outputs a sound from the katakana character string input from the dictionary reading means 22. A data stream RS for inputting the notation shortening means (a data transfer structure for transferring the katakana notation generated from phonetic symbols, hereinafter simply referred to as stream RS) is generated (S2). At the same time, an output data stream WS (a data transfer structure for transferring the shortened katakana notation, hereinafter simply referred to as stream WS) for storing the shortened result in the storage means 25 is also generated (S3). .

【0041】表音表記短縮手段241はストリームRS
から1文字目を読み込んでバッファに蓄え(S4)、該
文字がストリームRSの入力の最後のポジションである
か否かを判断し(S5)、最後であるなら(S5でYE
S)S12に分岐する。最後の文字でない場合には,す
なわち当該カタカナ文字列に未だ文字がある場合には
(S5でNO)2文字目をバッファBFに読み込む(S
6)。
The phonetic transcription shortening means 241 is a stream RS.
The first character is read and stored in the buffer (S4), it is determined whether the character is the last position of the stream RS input (S5), and if it is the last position (YE in S5).
S) Branch to S12. If it is not the last character, that is, if there are still characters in the katakana character string (NO in S5), the second character is read into the buffer BF (S).
6).

【0042】2文字目を読み込んだなら図11の子音テ
ーブルDTによりバッファBFの内容の置換を行い、こ
れをバッファBFに書き込む(S7)。子音テーブルC
Tに対応する置換の表記がなくて置換ができない場合に
は(S8でNO))、更に図12の二重母音テーブルD
TによりバッファBFの内容の置換を行い(S9)、置
換したものをバッファBFに書き込む。なお、子音テー
ブルCTで置換できた場合(S8でYES)にはS14
に分岐する。
When the second character is read, the contents of the buffer BF are replaced by the consonant table DT of FIG. 11, and this is written in the buffer BF (S7). Consonant table C
When there is no replacement notation corresponding to T and the replacement cannot be performed (NO in S8), the double vowel table D in FIG.
The contents of the buffer BF are replaced by T (S9), and the replaced contents are written in the buffer BF. If the consonant table CT can be replaced (YES in S8), S14
Branch to.

【0043】ここで、子音テーブルCTと二重母音テー
ブルDTを別に設けたのは、短縮処理時に子音→母音と
いう表記の優先順位をつけることにより、一意に短縮す
るためである。また、2文字づつ処理することで、後述
するカタカナ語特有の音節に跨がる表記のゆれを吸収す
ることができる。なお、ここでいう「短縮」は、ゆれを
吸収するための中間表現であり、図11のテーブルから
明らかなように、置換処理しても文字数が変わらない場
合もある。
Here, the consonant table CT and the double vowel table DT are provided separately in order to uniquely shorten them by prioritizing the consonant → vowel notation during the shortening process. Further, by processing every two characters, it is possible to absorb the fluctuation of the notation spanning syllables peculiar to Katakana described later. The "shortening" here is an intermediate expression for absorbing the fluctuation, and as is clear from the table of FIG. 11, the number of characters may not change even after the replacement process.

【0044】図12の二重母音テーブルを用いてバッフ
ァBFの内容の置換が行われた場合(S10でYE
S)、S14に分岐する。バッファBFの内容の置換が
行われなかった場合、すなわち短縮がなされなかった場
合(S10でNO)は、バッファBFの2文字目をクリ
アして消去する(S11)。すなわち、バッファBFに
は、ST4で書き込まれた一文字のみ存在している。
When the contents of the buffer BF are replaced using the double vowel table of FIG. 12 (YE in S10).
S) and S14. If the contents of the buffer BF have not been replaced, that is, if the contents have not been shortened (NO in S10), the second character of the buffer BF is cleared and erased (S11). That is, only one character written in ST4 exists in the buffer BF.

【0045】次に、このバッファBFに書き込まれてい
る一文字について、図13に示した一文字置換テーブル
OTを参照して置換処理を行い(S12)、置換した結
果をバッファBFに格納する。この段階で、なおも置換
されなかった文字はそのまま表記されることになる。
Next, the one character written in the buffer BF is subjected to the replacement process with reference to the one-character replacement table OT shown in FIG. 13 (S12), and the replacement result is stored in the buffer BF. At this stage, the characters that have not been replaced are still written.

【0046】この状態では、ストリームRSのポジショ
ンが一つ余分に進んでいるため、該ストリームRSのポ
ジションを一つ戻し(S13)、バッファBFの内容を
ストリームWSに書き込む(S14)。
In this state, since the position of the stream RS is advanced by one extra position, the position of the stream RS is returned by one (S13), and the contents of the buffer BF are written in the stream WS (S14).

【0047】ストリームWSに内容を書き込んだ後、該
バッファBFをクリアし(S15)、ストリームRSの
ポジションが最後であるか否かを判断し(S16)、最
後のポジションでなければ(S16のNO)S4に戻っ
て上記と同様の短縮処理を続行する。また、最後である
と判断された場合,すなわちストリームRSの読み込み
が終了すると(S16のYES)、この短縮処理は終了
となり、ストリームWSの内容を短縮文字列として記憶
手段の検索キー格納領域に出力し(S17)、処理をお
わる。
After writing the contents to the stream WS, the buffer BF is cleared (S15) and it is judged whether the position of the stream RS is the last position (S16). If it is not the last position (NO in S16). ) Returning to S4, the same shortening process as above is continued. When it is determined that the stream is the last one, that is, when the reading of the stream RS is completed (YES in S16), the shortening process is finished, and the contents of the stream WS are output as a shortened character string to the search key storage area of the storage means. (S17), the process ends.

【0048】以下、この短縮処理の具体例を「gest
ure」を例にとって説明する。単語「gestur
e」の発音のカタカナ表記として「ジェスチャー」が与
えられた場合、まず、入力文字列のストリームRSから
1文字目“ジ”と2文字目“ェ”が表音表記短縮手段2
41のバッファBFに読み込まれる。バッファBFの内
容が“ジェ”となる。
Hereinafter, a concrete example of this shortening process will be described as "gest".
"ure" will be described as an example. The word "gestur
When a "gesture" is given as the katakana notation for the pronunciation of "e", first, the first character "ji" and the second character "e" from the stream RS of the input character string are phonetic notation shortening means 2.
It is read into the buffer BF 41. The content of the buffer BF becomes "Je".

【0049】このバッファBFの内容“ジェ”は図11
に示した子音テーブルCTを参照して“ゼ”に置換され
て(すなわち、1文字の表音表記に短縮されて)バッフ
ァBFに書き込まれた後、このバッファBFの内容が出
力文字列のストリームWSに書き込まれると共に、該バ
ッファBFはクリアされる。
The content "Je" of this buffer BF is shown in FIG.
After being written in the buffer BF after being replaced with "Ze" by referring to the consonant table CT shown in (i.e., shortened to the one-character phonetic notation), the contents of this buffer BF are the stream of the output character string. The buffer BF is cleared as it is written to WS.

【0050】そして、ストリームRSの当該単語の発音
記号から生成したカタカナ表音表記には未だ「・・スチ
ャー」がある(すなわち、ストリームRSの入力ポジシ
ョンは最後ではない)ので、バッファBFに“ス”
“チ”が読み込まれるが、この“スチ”は子音テーブ
ル,二重母音テーブルのいづれのテーブルにも表記され
ていないため置換処理はなされない。したがって、上記
したように、バッファBFに読み込まれた2文字目であ
る“チ”が消去され、“ス”が残り、図13の一文字テ
ーブルでも置換の対象とは成らないのでそのままストリ
ームWSに書き込まれる。
Since the katakana phonetic notation generated from the phonetic symbol of the word of the stream RS still has "... STUAR" (that is, the input position of the stream RS is not the last), the buffer BF has "STUDIO". ”
Although "chi" is read, this "suchi" is not written in either the consonant table or the double vowel table, so the replacement process is not performed. Therefore, as described above, the second character “H” read in the buffer BF is erased, and the “S” remains, which is not a replacement target even in the one-character table in FIG. 13 and is therefore written in the stream WS as it is. Be done.

【0051】バッファBFをクリア後、次にストリーム
RSから読み込まれた“チ”,“ャ”も同様にしてスト
リームWSに書き込まれていく。そして、最後は“一”
を読み込むが、これがストリームRSの当該カタカナ表
音表記の最後のポジションであるので、直接一文字テー
ブルの置換対象となるが、同テーブルでは‘削除’とな
っているので、バッファBFは空となって、ストリーム
WSには何も書き込まれずに短縮処理を終了する。
After clearing the buffer BF, "HI" and "CHA" read next from the stream RS are similarly written to the stream WS. And at the end "one"
However, since this is the last position of the katakana phonetic notation of the stream RS, it is directly replaced with the one-character table, but since it is'deleted 'in this table, the buffer BF becomes empty. , Nothing is written to the stream WS, and the shortening process ends.

【0052】この結果、ストリームWSの内容は「ゼス
チャ」となっており、これが単語「gesture」の
発音のカタカナ表記の短縮文字列として記憶手段に出力
される。このように、生成された短縮表記を検索キーと
して図9の辞書読込手段22で生成された構造化単語レ
コードと共に記憶手段25に登録される。これを原辞書
のすべての単語について繰り返すことで、カタカナ検索
英和電子辞書のデータベースが構築される。
As a result, the content of the stream WS is "gesture", which is output to the storage means as a shortened character string in katakana notation of the pronunciation of the word "gesture". In this way, the generated short notation is registered in the storage unit 25 together with the structured word record generated by the dictionary reading unit 22 of FIG. 9 using the generated short notation as a search key. By repeating this for all the words in the original dictionary, a database of the Katakana search English-Japanese electronic dictionary is constructed.

【0053】図14は検索結果出力部を構成する表示手
段のビューの模式図であって、上記の説明のようにして
生成され構築されたカタカナ検索英和電子辞書データベ
ースを用いて辞書検索を実行する場合、ユーザはまず、
図9の検索キー入力部4を構成するキーボード28から
検索したい単語をカタカナ表記で入力する(なお、検索
キー入力部4,および検索結果出力部5は前記図2に示
したような種々の手段で構成できる)。
FIG. 14 is a schematic view of the view of the display means constituting the search result output section, and executes the dictionary search using the Katakana search English-Japanese electronic dictionary database generated and constructed as described above. If the user first
The word to be searched is input in katakana notation from the keyboard 28 constituting the search key input section 4 of FIG. 9 (note that the search key input section 4 and the search result output section 5 are various means as shown in FIG. 2). Can be configured with).

【0054】入力された検索キーは、前記したデータベ
ース生成時と同様に、表記補正部2の表音表記短縮手段
241で短縮表記に変換され、この短縮表記を検索キー
として記憶手段25に登録されているデータベースを検
索する。この検索キーの短縮表記もデータベース登録時
と同じ一意的短縮が行われるものであるため、ユーザは
自分の好みのカタカナ表記で入力可能であり、標準的な
カタカナ表記のルル(表記法)や上記した短縮アルゴリ
ズムを意識する必要がない。
The inputted search key is converted into the shorthand notation by the phonetic notation shortening unit 241 of the notation correcting unit 2 as in the case of generating the database, and this shorthand notation is registered in the storage unit 25 as the search key. Search the database you are using. Since the abbreviated notation of this search key is also the same as the abbreviation used when registering the database, the user can enter it in their favorite katakana notation, and the standard katakana notation Lulu (notation) and the above There is no need to be aware of the shortening algorithm.

【0055】ユーザが「gesture」について検索
しようとする場合、ユーザによっては、またはその時の
気持ち次第で、「ジェスチャー」,「ジェスチャ」,
「ゼスチャー」,「ゼスチュア」,‥等々、様々なカタ
カナ表記で検索キーを入力する。すなわち、入力する検
索キーの表記にゆれがある。しかし、この表記のゆれは
データベース登録時と同一の「ジェスチャー」の場合は
勿論のこと、他の場合も全て「ゼスチャ」という短縮表
記に一意に変換されるため、記憶手段からは「ゼスチ
ャ」を検索キーとして「gesture」の単語レコー
ドが検索される。
When the user tries to search for "gesture", "gesture", "gesture", or "gesture" depends on the user or the feeling at that time.
Enter the search key in various katakana notation such as “gesture”, “gesture”, and so on. That is, there is a fluctuation in the notation of the search key to be input. However, the fluctuation of this notation is not limited to the case of the same "gesture" as when registering the database, but in all other cases, it is uniquely converted to the short notation "gesture", so "gesture" is stored in the storage means. As a search key, the word record of "gesture" is searched.

【0056】図14においては、ユーザの入力した検索
キー「ゼスチュア」がユーザビュー131の入力ビュー
132に表示され、その検索結果の単語レコードが出力
ビュー133に表示され、ユーザに提示される。
In FIG. 14, the search key “gesture” input by the user is displayed in the input view 132 of the user view 131, and the word record of the search result is displayed in the output view 133 and presented to the user.

【0057】上記説明したように生成された英和辞書等
の外国語辞書はこの実施例で説明したような使い方に限
らず、前記第1実施例と同様に本来の外国語辞書として
の利用,すなわち見出し語からの検索が可能であること
は言うまでもない。また、検索結果にその単語レコード
に加えて標準的なカタカナ表記(「ジェスチャー」)を
も出力することによって、この辞書を外国人が日本語の
学習のために利用するうえで学習効果が大きくなるとい
う効用もある。前記したように、カタカナ語は、日本人
の発音の都合で原語とは掛け離れた発音表記となってし
まったものや、日本人が勝手に創作したものが多く、外
国人に困惑を招くものである場合が多い。本発明は、外
国人がこのようなカタカナ語を理解するために用いて有
効な手段となる。
The foreign language dictionary such as the English-Japanese dictionary generated as described above is not limited to the use as described in this embodiment, but is used as an original foreign language dictionary as in the first embodiment, that is, It goes without saying that it is possible to search by entry word. Also, by outputting standard katakana notation (“gesture”) in addition to the word record in the search results, the learning effect will be greater when foreigners use this dictionary for learning Japanese. There is also a utility. As mentioned above, Katakana is a phonetic transcription that is far from the original due to the pronunciation of the Japanese, and it is often created by the Japanese arbitrarily, which causes confusion for foreigners. Often there is. The present invention is an effective means for foreigners to understand such Katakana language.

【0058】図15はカタカナ語の理解のために資する
利用形態を説明するユーザビューの説明図であって、ユ
ーザを外国人として想定し、検索キー入力部4から自己
流のカタカナ表記「ゼスチュア」を入力すると、入力し
た検索キーがビュー141の入力ビュー142に表示さ
れ、検索された結果が出力ビュー143に表示される。
FIG. 15 is an explanatory diagram of a user view for explaining a usage pattern that contributes to the understanding of Katakana language. Assuming that the user is a foreigner, the self-style katakana notation “gesture” is input from the search key input unit 4. When input, the input search key is displayed in the input view 142 of the view 141, and the search result is displayed in the output view 143.

【0059】これにより、当該英単語の標準的なカタカ
ナ表記法を知らず知らずのうちに知得することができ、
外国人にとって(日本人にとっても)日本語の学習効果
が大きく向上する。
As a result, it is possible to know the standard katakana notation of the English word without knowing it,
The learning effect of Japanese is greatly improved for foreigners (and for Japanese as well).

【0060】このように、本実施例によれば、カタカナ
表記を検索キーとして人力する際に、カタカナ表記のル
ールを知らないでも自己流のカタカナ表記で単語検索が
でき、また短縮表記を検索キーとしたために記憶手段の
容量も少なくて済み、かつ高速の検索が可能となる。
As described above, according to the present embodiment, when manually inputting the katakana notation as a search key, it is possible to perform a word search using the katakana notation of the own style without knowing the rules for katakana notation, and the abbreviation is used as the search key. Therefore, the capacity of the storage means is small, and high-speed search is possible.

【0061】[0061]

【発明の効果】以上説明したように、一般に分かり難い
発音記号からローマ字あるいはカタカナの表音表記が自
動的に得られ、これを検索キーとして外国語辞書を日本
語的な表音表記を介して扱うことが可能となり、外国語
が不得意な人でも発音(表音表記)からの検索ができ
る。また、検索キーとしてカタカナ等の表音表記を入力
する際にその標準的な表記ルールを意識することなく、
ユーザの好みの表記で入力することができると共に、外
国語に馴染みが薄い人にとっての日本語学習効果を向上
させることができる。
As described above, a phonetic transcription of Roman letters or katakana is automatically obtained from phonetic symbols that are generally difficult to understand, and this is used as a search key in a foreign language dictionary through Japanese phonetic transcription. It becomes possible to handle, and even people who are not good at foreign languages can search by pronunciation (phonetic notation). Also, when inputting phonetic notation such as katakana as a search key, without considering the standard notation rules,
It is possible to input in the notation preferred by the user and improve the Japanese learning effect for those who are not familiar with foreign languages.

【図面の簡単な説明】[Brief description of drawings]

【図1】 本発明による外国語電子辞書生成検索装置の
概略構成を示すブロック図、
FIG. 1 is a block diagram showing a schematic configuration of a foreign language electronic dictionary generation / retrieval device according to the present invention;

【図2】 本発明の第1実施例である和英カタカナ検索
装置の構成を説明するブロック図、
FIG. 2 is a block diagram illustrating the configuration of a Japanese-English katakana search device according to the first embodiment of the present invention;

【図3】 構造化テキストの説明図、FIG. 3 is an explanatory view of structured text,

【図4】 英語の発音記号に付加する補正情報の対応を
示す説明図、
FIG. 4 is an explanatory diagram showing correspondence of correction information added to English phonetic symbols,

【図5】 暖昧母音の補正対応表の説明図、FIG. 5 is an explanatory diagram of a correction correspondence table for warm vowels,

【図6】 記憶手段に格納される補正済のカタカナ表音
表記レコードと単語レコードの内容の説明図、
FIG. 6 is an explanatory diagram of the contents of corrected katakana phonetic transcription records and word records stored in the storage means,

【図7】 記憶手段に格納された英和辞書データベース
を検索した出力例の説明図、
FIG. 7 is an explanatory diagram of an output example in which the English-Japanese dictionary database stored in the storage means is searched,

【図8】 カタカナ語の理解に資する利用形態の説明
図、
FIG. 8 is an explanatory diagram of a usage pattern that contributes to understanding Katakana

【図9】 本発明を英和カタカナ検索システムに適用し
た第2実施例の構成を説明するブロック図、
FIG. 9 is a block diagram illustrating a configuration of a second embodiment in which the present invention is applied to an English-Japanese katakana search system;

【図10】 カタカナ短縮アルゴリズムを説明するフロ
ーチャート、
FIG. 10 is a flowchart illustrating a Katakana reduction algorithm,

【図11】 子音変換テーブルの説明図、FIG. 11 is an explanatory diagram of a consonant conversion table,

【図12】 二重母音テーブルの説明図、FIG. 12 is an explanatory diagram of a double vowel table,

【図13】 一文字置換テーブルの説明図、FIG. 13 is an explanatory diagram of a one-character replacement table,

【図14】 検索結果出力部を構成する表示手段のビュ
ーの模式図、
FIG. 14 is a schematic view of a view of a display unit that constitutes the search result output unit,

【図15】 カタカナ語の理解に資する利用形態の説明
図である。
FIG. 15 is an explanatory diagram of a usage pattern that contributes to understanding Katakana.

【符号の説明】[Explanation of symbols]

1・・・表音表記生成部、2・・・表記補正部、3・・
・記憶部、4・・・検索キー入力部、5・・・検索結果
出力手段。
1 ... phonetic notation generation unit, 2 ... notation correction unit, 3 ...
Storage unit, 4 ... Search key input unit, 5 ... Search result output means.

───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5B075 ND03 NK10 UU03 5B091 AA06 AB04 BA02 CC02 CC15 CC16    ─────────────────────────────────────────────────── ─── Continued front page    F-term (reference) 5B075 ND03 NK10 UU03                 5B091 AA06 AB04 BA02 CC02 CC15                       CC16

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】 外国語辞書の原データの発音記号から生
成した日本語的表音表記を前記原データのキー情報とし
て前記原データと共に登録した辞書データベースを記憶
した記憶手段と、 前記辞書データベースを検索する検索キーを日本語的表
音表記で入力する検索キー入力手段と、 前記検索キー入力手段から入力された日本語的表音表記
により、前記記憶手段に登録された辞書データベースを
検索する検索手段と、 前記検索手段の検索結果に基づいて該当する外国語辞書
の原データを出力する出力手段と、を含むことを特徴と
する外国語電子辞書検索装置。
1. A storage means for storing a dictionary database in which a Japanese phonetic notation generated from phonetic symbols of original data of a foreign language dictionary is registered together with the original data as key information of the original data, and the dictionary database. A search key input means for inputting a search key to be searched in Japanese phonetic notation, and a search for searching the dictionary database registered in the storage means by the Japanese phonetic notation input from the search key input means. A foreign language electronic dictionary search device comprising: means for outputting the original data of the corresponding foreign language dictionary based on the search result of the search means.
【請求項2】 外国語辞書の原データの発音記号から生
成した日本語的表音表記を前記原データのキー情報とし
て前記原データと共に登録した辞書データベースを記憶
した記憶手段と、前記辞書データベースを検索する検索
手段と、検索結果を出力する出力手段を備えた外国語辞
書検索装置の検索方法であって、 前記辞書データベースを検索する検索キーを日本語的表
音表記で入力するステップと、 前記入力された日本語的表音表記により、前記記憶手段
に登録された辞書データベースを前記検索手段により検
索するステップと、 前記検索手段の検索結果に基づいて該当する外国語辞書
の原データを前記出力手段により出力するステップと、
を含むことを特徴とする外国語電子辞書検索方法。
2. A storage means for storing a dictionary database in which a Japanese phonetic notation generated from phonetic symbols of original data of a foreign language dictionary is registered together with the original data as key information of the original data, and the dictionary database. A search method of a foreign language dictionary search device comprising a search means for searching and an output means for outputting a search result, wherein a step of inputting a search key for searching the dictionary database in Japanese phonetic notation, A step of searching the dictionary database registered in the storage means by the search means with the input Japanese phonetic notation; and outputting the original data of the corresponding foreign language dictionary based on the search result of the search means. A step of outputting by means,
A method for searching a foreign language electronic dictionary, which includes:
【請求項3】 外国語辞書の原データの発音記号から生
成した日本語的表音表記を、前記原データのキー情報と
して前記原データと共に登録した辞書データベースを記
憶した記憶手段と、 前記辞書データベースを検索する検索キーを日本語的表
音表記で入力する検索キー入力手段と、 前記検索キー入力手段から入力された日本語的表音表記
を補正する補正手段と、 前記補正手段により補正された日本語的表音表記によ
り、前記記憶手段に登録された辞書データベースを検索
する検索手段と、 前記検索手段の検索結果に基づいて該当する外国語辞書
の原データを出力する出力手段と、を含むことを特徴と
する外国語電子辞書検索装置。
3. Storage means for storing a dictionary database in which Japanese phonetic notation generated from phonetic symbols of original data of a foreign language dictionary is registered together with the original data as key information of the original data, and the dictionary database. Search key input means for inputting the search key in Japanese phonetic notation, correction means for correcting the Japanese phonetic notation input from the search key input means, and correction means Search means for searching the dictionary database registered in the storage means in Japanese phonetic notation; and output means for outputting the original data of the corresponding foreign language dictionary based on the search result of the search means. A foreign language electronic dictionary search device characterized in that
【請求項4】 外国語辞書の原データの発音記号から生
成した日本語的表音表記を前記原データのキー情報とし
て前記原データと共に登録した辞書データベースを記憶
した記憶手段と、前記辞書データベースを検索する検索
手段と、検索結果を出力する出力手段を備えた外国語辞
書検索装置の検索方法であって、 前記辞書データベースを検索する検索キーを日本語的表
音表記で入力するステップと、 前記検索キーとして入力された日本語的表音表記を補正
するステップと、 前記補正された日本語的表音表記により、前記記憶手段
に登録された辞書データベースを前記検索手段により検
索するステップと、 前記検索手段の検索結果に基づいて該当する外国語辞書
の原データを前記出力手段により出力するステップと、
を含むことを特徴とする外国語電子辞書検索方法。
4. A storage means for storing a dictionary database in which a Japanese phonetic expression generated from phonetic symbols of original data of a foreign language dictionary is registered together with the original data as key information of the original data, and the dictionary database. A search method of a foreign language dictionary search device comprising a search means for searching and an output means for outputting a search result, wherein a step of inputting a search key for searching the dictionary database in Japanese phonetic notation, Correcting the Japanese phonetic notation input as a search key; searching the dictionary database registered in the storage means by the searching device with the corrected Japanese phonetic notation; Outputting the original data of the corresponding foreign language dictionary based on the search result of the search means by the output means,
A method for searching a foreign language electronic dictionary, which includes:
JP2002306148A 2002-10-21 2002-10-21 Foreign language electronic dictionary search device Expired - Lifetime JP3677016B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002306148A JP3677016B2 (en) 2002-10-21 2002-10-21 Foreign language electronic dictionary search device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002306148A JP3677016B2 (en) 2002-10-21 2002-10-21 Foreign language electronic dictionary search device

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2000343785A Division JP2001167093A (en) 2000-11-10 2000-11-10 Method and device for generating and retrieving electronic foreign language dictionary

Publications (2)

Publication Number Publication Date
JP2003178087A true JP2003178087A (en) 2003-06-27
JP3677016B2 JP3677016B2 (en) 2005-07-27

Family

ID=19197419

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002306148A Expired - Lifetime JP3677016B2 (en) 2002-10-21 2002-10-21 Foreign language electronic dictionary search device

Country Status (1)

Country Link
JP (1) JP3677016B2 (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006008870A1 (en) * 2004-07-21 2006-01-26 Seiko Instruments Inc. Electronic dictionary
JP2006126883A (en) * 2004-10-26 2006-05-18 Shinano Kenshi Co Ltd Information retrieval device and the information retrieval method
JP2009223895A (en) * 2008-03-14 2009-10-01 Nhn Corp Method and system for providing retrieval result in inputting query of two or more words, hangul query or general query in japanese dictionary service
JP2010134922A (en) * 2008-12-08 2010-06-17 Nhn Corp Similar word determination method and system
JP2011129159A (en) * 2008-03-14 2011-06-30 Nhn Corp Method and system providing function which supports japanese single character input
JP2012014699A (en) * 2010-06-30 2012-01-19 Business Objects Software Ltd Phonetic key for japanese language

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6211932A (en) * 1985-07-10 1987-01-20 Hitachi Ltd Information retrieving method

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6211932A (en) * 1985-07-10 1987-01-20 Hitachi Ltd Information retrieving method

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006008870A1 (en) * 2004-07-21 2006-01-26 Seiko Instruments Inc. Electronic dictionary
JP2006126883A (en) * 2004-10-26 2006-05-18 Shinano Kenshi Co Ltd Information retrieval device and the information retrieval method
JP2009223895A (en) * 2008-03-14 2009-10-01 Nhn Corp Method and system for providing retrieval result in inputting query of two or more words, hangul query or general query in japanese dictionary service
JP2011129159A (en) * 2008-03-14 2011-06-30 Nhn Corp Method and system providing function which supports japanese single character input
JP2010134922A (en) * 2008-12-08 2010-06-17 Nhn Corp Similar word determination method and system
JP2012014699A (en) * 2010-06-30 2012-01-19 Business Objects Software Ltd Phonetic key for japanese language

Also Published As

Publication number Publication date
JP3677016B2 (en) 2005-07-27

Similar Documents

Publication Publication Date Title
JPH07325824A (en) Grammar checking system
JPH05314166A (en) Electronic dictionary and dictionary retrieval device
JPH05120324A (en) Language processing system
JP3677016B2 (en) Foreign language electronic dictionary search device
Shvedova et al. Handling of nonstandard spelling in GRAC
JP3285149B2 (en) Foreign language electronic dictionary search method and apparatus
Lane et al. Interactive word completion for morphologically complex languages
JPS6310265A (en) Translating device
JPS60254367A (en) Sentence analyzer
JPS58123129A (en) Converting device of japanese syllabary to chinese character
JP2001167093A (en) Method and device for generating and retrieving electronic foreign language dictionary
ASAHIAH et al. A survey of diacritic restoration in abjad and alphabet writing systems
Patton Review of Am Faclair Beag online Gaelic-English Dictionary
JP2819766B2 (en) Foreign language electronic dictionary search method
Patton Bauer, Michael and Robertson, William. Am Faclair Beag online Gae-lic-English dictionary. http://www. faclair. info
JP3048793B2 (en) Character converter
JP3313810B2 (en) Aspect processing device
JPH03129568A (en) Document processor
JP2802369B2 (en) Kana-Kanji conversion device
JP4023384B2 (en) Natural language translation method and apparatus and natural language translation program
JP5338482B2 (en) Chinese sentence example search device and program
JPH0773174A (en) Processing system of japanese language
PETERSEN et al. CHAPTER SIX ANNOTATING AND ANALYZING
JPH06119379A (en) System and method for machine translation provided with reading kana @(3754/24)japanese syllabary) attaching function
Petersen et al. Annotating and analyzing the Aṣṭādhyāyī

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041101

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050329

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050329

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050502

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090513

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100513

Year of fee payment: 5

EXPY Cancellation because of completion of term