JPH0785238B2 - Dictionary search device - Google Patents

Dictionary search device

Info

Publication number
JPH0785238B2
JPH0785238B2 JP59247314A JP24731484A JPH0785238B2 JP H0785238 B2 JPH0785238 B2 JP H0785238B2 JP 59247314 A JP59247314 A JP 59247314A JP 24731484 A JP24731484 A JP 24731484A JP H0785238 B2 JPH0785238 B2 JP H0785238B2
Authority
JP
Japan
Prior art keywords
dictionary
character string
long vowel
vowel symbol
long
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP59247314A
Other languages
Japanese (ja)
Other versions
JPS61125678A (en
Inventor
章子 中嶋
英行 高木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP59247314A priority Critical patent/JPH0785238B2/en
Publication of JPS61125678A publication Critical patent/JPS61125678A/en
Publication of JPH0785238B2 publication Critical patent/JPH0785238B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 産業上の利用分野 本発明は仮名漢字変換装置における辞書検索装置に係
り、特に長母音記号を含む入力文字列に対して適切な変
換処理を行なう辞書検索装置に関するものである。
Description: BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a dictionary search device in a kana-kanji conversion device, and more particularly to a dictionary search device that appropriately converts an input character string including a long vowel symbol. is there.

従来の技術 近年、日本語ワードプロセッサ等の文章作成装置が普及
してきた。この種の装置は、一般に作成文章を仮名文字
入力し、これを単語毎に漢字混じりの文字系列に変換し
て日本語文章を作成していくものである。
2. Description of the Related Art In recent years, sentence creation devices such as Japanese word processors have become popular. This type of device generally inputs a kana character into a created sentence and converts it into a character sequence containing a mixture of kanji characters for each word to create a Japanese sentence.

ところで、昨今、音声および音声に対応する字種を指定
するモード情報を入力することで、日本語情報を入力処
理する方式が提案されているが、音声により言語を入力
する際の多くの問題を生じている。
By the way, recently, a method of input processing Japanese information by inputting voice and mode information designating a character type corresponding to the voice has been proposed, but many problems in inputting a language by voice are Has occurred.

特に長母音記号を含む文字列を入力した場合は、その長
母音記号をどのような仮名文字に変換して単語辞書を検
索するかが、その検索時間に大きく影響する。たとえば
入力音声中に「えー」という文字列が含まれる場合、そ
の長母音記号を仮名文字の「え」に変換した仮名文字列
で単語辞書を検索しても、そのような仮名文字列が辞書
にない場合が多く、新たに別の仮名文字「い」に変換し
た別の仮名文字列で検索をしなおす必要があった。
In particular, when a character string including a long vowel symbol is input, how the kana character is converted into the long vowel symbol to search the word dictionary greatly affects the search time. For example, if the input voice contains the character string "e", even if you search the word dictionary with the kana character string that has converted the long vowel symbol into the kana character "e", such a kana character string will appear in the dictionary. In many cases, it was necessary to search again with another kana character string that was newly converted to another kana character “i”.

本発明者らは先に辞書検索装置としては特願昭59−9593
1号に示すものを提案した。
The present inventors have previously proposed Japanese Patent Application No. 59-9959 as a dictionary search device.
The one shown in No. 1 was proposed.

第3図はこの辞書検索装置の構成図を示すもので、1は
長母音記号を含む文字列を入力とし、「あ段」の次にあ
る長母音記号を「あ」、「い段」の次にある長母音記号
と「い」、「う段」の次にある長母音記号を「う」、
「え段」の次にある長母音記号を「い」または「え」、
「お段」の次にある長母音記号を「う」または「お」に
変換して出力し長母音記号が含まれない時はそのまま出
力する文字列変換部、2は日本語の書きことばが登録さ
れている辞書、3は文字列変換部1から得られた文字列
で辞書2を検索する辞書照合部である。
FIG. 3 shows a block diagram of this dictionary search device. 1 is a character string containing a long vowel symbol, and the long vowel symbol next to "Adan" is "A" or "Idan". The next long vowel symbol and "i", the next long vowel symbol next to "Udan" is "U",
The long vowel symbol next to "Edan" is "I" or "E",
A character string conversion unit that converts the long vowel symbol next to "Odan" to "U" or "O" and outputs it when the long vowel symbol is not included. The designated dictionary 3 is a dictionary collation unit for searching the dictionary 2 with the character string obtained from the character string conversion unit 1.

以上のように構成された辞書検索装置について以下その
動作を説明する。説明上、長母音記号を で表わす。
The operation of the dictionary search device configured as described above will be described below. For explanation purposes, Express with.

たとえば「閉鎖」を入力したい場合に、単音節「へ」及
び「さ」を音声入力した時の認識結果が表1のようであ
ったとする。
For example, suppose that when the user wants to input “closed”, the recognition result when the syllables “he” and “sa” are input by voice is as shown in Table 1.

この時、入力文字列 に対する文字列の候補として表2に示す候補が得られた
とする。
At this time, input character string It is assumed that the candidates shown in Table 2 are obtained as the candidate of the character string for.

この文字列の候補が文字列変換部1に入力されると、表
3の規則に従って文字列変換される。
When this character string candidate is input to the character string conversion unit 1, the character string is converted according to the rules in Table 3.

表3の規則に従って文字列変換した結果を表4に示す。 Table 4 shows the result of character string conversion according to the rules of Table 3.

そして表4に示された文字列の候補が辞書照合部3に送
られる。辞書2には、日本語の書きことばが登録されて
いるので、辞書照合部3では文字列の第1候補から順に
辞書と照合して、正解として対応する辞書内容を出力す
る。この例の場合は、13回辞書を検索してはじめて求め
るべき文字列「閉鎖」を得ることができる。
Then, the character string candidates shown in Table 4 are sent to the dictionary matching unit 3. Since Japanese writing words are registered in the dictionary 2, the dictionary collating unit 3 collates with the dictionary in order from the first candidate of the character string, and outputs the corresponding dictionary content as a correct answer. In the case of this example, the character string "closed" to be obtained can be obtained only after searching the dictionary 13 times.

発明が解決しようとする問題点 しかしながら上記のような構成では、例に示したような
「え段」の次に長母音記号が在るような文字列を入力し
たとき、その長母音記号を一律に「い」及び「え」に変
換した文字列で辞書と照合していたので、辞書照合に多
くの時間を要するという問題点を有していた。
DISCLOSURE OF THE INVENTION Problems to be Solved by the Invention However, in the above configuration, when a character string having a long vowel symbol next to "Edan" as shown in the example is input, the long vowel symbol is uniformly distributed. In addition, since the character strings converted into "i" and "e" are collated with the dictionary, there is a problem that it takes a lot of time to collate the dictionary.

本発明はかかる点に鑑み、日本語音声情報中の長母音を
利便性よく、かつ簡単に処理することのできる辞書検索
装置を提供することを目的とする。
The present invention has been made in view of the above circumstances, and an object of the present invention is to provide a dictionary search device capable of conveniently and easily processing long vowels in Japanese speech information.

問題点を解決するための手段 本発明は、長母音記号を含む文字列を入力した時、長母
音記号に前接する音節に着目して、前接音節が「あ段」
の時は長母音記号を「あ」、「い段」の時は「い」、
「う段」の時は「う」、「え段」の時は「い」または
「え」、「お段」の時は「う」または「お」に変換して
出力し、長母音記号が含まれない時はそのまま出力する
文字列変換部と、辞書と、文字列変換部から得られた文
字列で辞書を検索する際に、長母音記号に前接する音節
が「え段」の時は、前接音節の種類に応じて、長母音記
号を「い」または「え」に一意的に変換した文字列で辞
書を検索する辞書照合部とを備えた辞書検索装置であ
る。
Means for Solving the Problems In the present invention, when a character string including a long vowel symbol is input, the syllable preceding the long vowel symbol is focused, and the front syllable is “Adan”.
When is, the long vowel symbol is "A", when it is "Idan", it is "I",
"Udan" is converted to "U", "Edan" is converted to "I" or "E", and "Odan" is converted to "U" or "O" for output. When the syllable that precedes the long vowel is "Edan" when searching the dictionary with the character string conversion unit that outputs the string as is, and the character string obtained from the character string conversion unit Is a dictionary search device including a dictionary collating unit that searches a dictionary with a character string in which a long vowel symbol is uniquely converted into “i” or “e” according to the type of a pre-syllable.

作用 本発明は前記した構成により、「え段」の音節に後続し
た長母音記号を含む文字列に対して、長母音記号を文字
に変換して辞書検索する際に、前接音節の種類によっ
て、検索する文字列を限定することで効率よく適切なカ
ナ漢字変換出力を得ることができる。
With the above-described configuration, the present invention converts a long vowel symbol into a character string including a long vowel symbol subsequent to the "edan" syllable and converts the long vowel symbol into a character, and when searching the dictionary, , By limiting the character string to be searched, an appropriate Kana-Kanji conversion output can be efficiently obtained.

実施例 第1図は本発明の辞書検索装置の構成図を示すものであ
る。第1図において、1は文字列変換部、2は辞書で、
以上は第2図の構成と同様なものである。3は文字列変
換部1から得られた文字列で辞書2を検索する際に、長
母音記号に前接する音節が「え段」の時は、前接音節の
種類に応じて、長母音記号を「い」または「え」に一意
的に変換した文字列で辞書を検索する辞書照合部であ
る。
First Embodiment FIG. 1 shows a block diagram of a dictionary search device according to the present invention. In FIG. 1, 1 is a character string converter, 2 is a dictionary,
The above is the same as the configuration of FIG. 3 is a character string obtained from the character string conversion unit 1, and when the dictionary 2 is searched, if the syllable preceding the long vowel symbol is "Edan", the long vowel symbol is selected according to the type of the front syllable. It is a dictionary matching unit that searches a dictionary with a character string that is uniquely converted to "i" or "e".

以上のように構成された本実施例の辞書検索装置につい
て以下その動作を説明する。説明上、長母音記号を で表わす。
The operation of the dictionary search device of this embodiment configured as described above will be described below. For explanation purposes, Express with.

比較のために第3図について説明した文字列を用いて説
明する。文字列「閉鎖」を入力したい場合に、単音節
「へ」及び「さ」を音声入力した時の認識結果が表1の
ようであった時、入力文字列 に対する文字列の候補として表2に示す候補が得られ
る。そしてこの文字列候補を文字列変換部1に入力する
と表3の規則に従って文字列変換され、表4に示すよう
な文字列の候補を辞書照合部3に送る。辞書照合部3で
は、表4に示すような文字列の候補で辞書を検索する際
に、表5の規則に従って検索する。
For comparison, description will be made using the character strings described in FIG. When you want to input the character string "closed", when the recognition result when you input the monosyllabic "he" and "sa" as shown in Table 1, the input character string The candidates shown in Table 2 are obtained as the character string candidates for the. When this character string candidate is input to the character string conversion unit 1, the character string is converted according to the rules of Table 3, and the character string candidates as shown in Table 4 are sent to the dictionary matching unit 3. The dictionary collation unit 3 searches the dictionary according to the rules of Table 5 when searching the dictionary for character string candidates as shown in Table 4.

表5の規則に従うと、表4に示した文字列候補のうち、
表6に示す文字列候補についてだけ辞書を検索すればよ
いことになる。
According to the rule of Table 5, among the character string candidates shown in Table 4,
It is only necessary to search the dictionary for the character string candidates shown in Table 6.

この場合は、7回めの辞書検索で文字列「閉鎖」を得る
ことができ、従来例と比較するとほぼ半数の辞書検索で
求めるべき文字列を得ていることがわかる。
In this case, the character string "closed" can be obtained by the seventh dictionary search, and it is understood that almost half of the character strings to be obtained are obtained by the dictionary search as compared with the conventional example.

以上のように本実施例によれば、前述した表5の長母音
記号に対する変換規則を用いることによって辞書検索時
間を大幅に減少することができる。
As described above, according to this embodiment, the dictionary search time can be significantly reduced by using the conversion rule for long vowel symbols in Table 5 described above.

なお、表5に示した長母音記号に対する変換規則は以下
に示すような日本語単語としての存在の偏りに基づくも
のである。
The conversion rules for long vowel symbols shown in Table 5 are based on the bias of existence as Japanese words as shown below.

まず、3万語の日本語単語の中から連母音を含む単語を
抽出した。ここで連母音とは、1語において又は語の連
結において母音が二つ以上連続しているものを指すもの
とする。この場合、それぞれ一つの独立した母音音節の
連続とは限らず、前の音節に含まれている母音と、その
直後にある母音節との連続の場合も連母音ということに
する。
First, a word containing a continuous vowel was extracted from 30,000 Japanese words. Here, a continuous vowel refers to a vowel in which two or more vowels are continuous in one word or in word concatenation. In this case, each vowel syllable is not limited to a sequence of independent vowel syllables, but a sequence of a vowel included in the preceding syllable and a vowel syllable immediately after it is also referred to as a continuous vowel.

例えば、「愛(アイ)」,「甥(オイ)」,「魚(ウ
オ)」などは連母音であり、「貝(カイ)」,「鯉(コ
イ)」,「酸い(スイ)」などもまた連母音を含んでい
る。連母音がある場合に、それぞれの母音を孤立させて
発するものと、あとの母音が直前の母音に密接に結び付
いてあたかも一つの母音として長母音のように発するも
のがある。後者のものを、特に「重母音」ということに
する。
For example, "love", "nephew", "fish", etc. are continuous vowels, and "kai", "carp", "sui". Etc. also contain continuous vowels. When there are continuous vowels, some vowels are isolated from each other, and some vowels are closely linked to the immediately preceding vowel, and one vowel sounds like a long vowel. The latter one will be referred to as a "heavy vowel".

この装置で使用した辞書2の3万語の日本語単語の中で
連母音を含む単語について調べた結果、次のようなデー
タが得られた。
As a result of investigating a word including a continuous vowel in the 30,000 Japanese words in the dictionary 2 used in this device, the following data were obtained.

「え段」+「え」の文字列を含む単語は僅か10単語
しかない。その内、「え長」と長音的に発声され得る単
語は「あかんべえ」「ええと」「ねえさん」「ねえや」
の4単語である。
There are only 10 words that contain the character string "Edan" + "E". Of these, the words that can be uttered in the long sound as "Echo" are "Akanbee", "Ehto", "Heysan", and "Heyaya".
4 words.

「え段」+「い」の文字列を含む単語は1520単語あ
り、その内「え長」と長音的に発声され得る単語は1495
単語ある。そしてこの中には、「ねい」という文字列を
含む単語は存在しない。
There are 1520 words that include the character string “Edan” + “I”, of which 1495 is the word that can be uttered in the long sound.
There is a word. And, in this, there is no word including the character string "nei".

この装置で使用した辞書2には、上記及びのような
偏り規則が存在し、本発明はこの規則に基づいて長母音
に対する変換規則を持たせたものである。
The dictionary 2 used in this device has the above-mentioned bias rules and the present invention has a conversion rule for long vowels based on this rule.

なお本実施例の規則は、この装置で使用する辞書の偏り
に基づいて規則化したものであり、使用する辞書が異な
れば偏りにも多少の違いが生じてくるのは当然である。
よって本発明は使用する辞書にあわせた規則でもって、
辞書検索する前に検索する文字列を限定するところに特
徴がある。
The rules of the present embodiment are based on the bias of the dictionary used in this device, and it is natural that the bias will be slightly different if the dictionary used is different.
Therefore, the present invention has rules according to the dictionary used,
The feature is that the character string to be searched is limited before the dictionary search.

また、本実施例においては、辞書検索文字列の限定を辞
書照合部で行なっているが、辞書照合前ならどの段階で
行なっても同じ効果が得られ、例えば文字列変換部で限
定する時は、実際に検索する文字列にだけ長母音記号を
変換することによって限定をすればよい。
Further, in the present embodiment, the dictionary search character string is limited by the dictionary matching unit, but the same effect can be obtained at any stage before the dictionary matching. For example, when limiting by the character string converting unit, , The limitation may be made by converting the long vowel symbols into only the character string to be actually searched.

発明の効果 以上説明したように、本発明は、長母音記号を含む文字
列に対して、長母音記号を文字に変換した文字列で辞書
を検索する際に、前記音節の種類によって、検索する文
字列を限定して辞書検索するように構成しているので、
長母音記号を含む文字列に対しても効率よく適切なカナ
漢字変換出力を得ることができ、その実用的効果は大き
い。
EFFECTS OF THE INVENTION As described above, according to the present invention, a character string including a long vowel symbol is searched by a character string obtained by converting the long vowel symbol into a character according to the type of the syllable. Since it is configured to search the dictionary by limiting the character string,
An appropriate Kana-Kanji conversion output can be efficiently obtained even for a character string including a long vowel symbol, and its practical effect is great.

【図面の簡単な説明】[Brief description of drawings]

第1図は本発明における一実施例の辞書検索装置の構成
を示す概略構成図、第2図は同実施例の動作説明図、第
3図は先に提案した辞書検索装置の概略構成図である。 1……文字列変換部、2……辞書、3……辞書照合部。
FIG. 1 is a schematic configuration diagram showing a configuration of a dictionary search device according to an embodiment of the present invention, FIG. 2 is an operation explanatory diagram of the same embodiment, and FIG. 3 is a schematic configuration diagram of the dictionary search device previously proposed. is there. 1 ... Character string conversion unit, 2 ... Dictionary, 3 ... Dictionary collation unit.

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】長母音記号を含む文字列を入力した時、前
記長母音記号に前接する音節に着目して、前記前接音節
が「あ段」の時は前記長母音記号を「あ」、「い段」の
時は前記長母音記号を「い」、「う段」の時は前記長母
音記号を「う」、「え段」の時は前記長母音記号を
「い」または「え」、「お段」の時は前記長母音記号を
「う」または「お」に変換して出力し、長母音記号が含
まれない時はそのまま出力する文字列変換部と、辞書
と、前記文字列変換部から得られた文字列で前記辞書を
検索する辞書照合部とを備え、前記辞書照合部は、前記
前接音節が「え段」の時は、前記前接音節の種類に応じ
て、前記長母音記号を「い」または「え」に一意的に変
換した文字列で辞書を検索することを特徴とする辞書検
索装置。
1. When a character string including a long vowel symbol is input, paying attention to a syllable that precedes the long vowel symbol, and when the preceding syllable is "Adan", the long vowel symbol is "A". , "Idan" indicates the long vowel symbol "i", "Udan" indicates the long vowel symbol "U", and "Edan" indicates the long vowel symbol "I" or ""E","Odan", the long vowel symbol is converted to "U" or "O" and output, and when the long vowel symbol is not included, the character string conversion unit and the dictionary are output. A dictionary matching unit that searches the dictionary with a character string obtained from the character string converting unit, wherein the dictionary matching unit determines the type of the front syllable when the front syllable is “Edan”. According to the dictionary search device, the dictionary is searched with a character string in which the long vowel symbol is uniquely converted into “i” or “e”.
JP59247314A 1984-11-22 1984-11-22 Dictionary search device Expired - Lifetime JPH0785238B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59247314A JPH0785238B2 (en) 1984-11-22 1984-11-22 Dictionary search device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59247314A JPH0785238B2 (en) 1984-11-22 1984-11-22 Dictionary search device

Publications (2)

Publication Number Publication Date
JPS61125678A JPS61125678A (en) 1986-06-13
JPH0785238B2 true JPH0785238B2 (en) 1995-09-13

Family

ID=17161552

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59247314A Expired - Lifetime JPH0785238B2 (en) 1984-11-22 1984-11-22 Dictionary search device

Country Status (1)

Country Link
JP (1) JPH0785238B2 (en)

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
国立国語研究所報告75「現代表記のゆれ」国立国語研究所発行(1983)

Also Published As

Publication number Publication date
JPS61125678A (en) 1986-06-13

Similar Documents

Publication Publication Date Title
US6356865B1 (en) Method and apparatus for performing spoken language translation
EP1617409B1 (en) Multimodal method to provide input to a computing device
US5995934A (en) Method for recognizing alpha-numeric strings in a Chinese speech recognition system
Chotimongkol et al. Statistically trained orthographic to sound models for Thai.
JPS6049932B2 (en) Japanese information processing method
JPH0785238B2 (en) Dictionary search device
CN105511636B (en) Improved whole Chinese character Chinese word simply unifies input method without repeated code
JP3758241B2 (en) Voice information retrieval device
JPS58123129A (en) Converting device of japanese syllabary to chinese character
JPS61122781A (en) Speech word processor
KS et al. Canarese Real Time Text to Speech System using Concatenation Technique.
JPS62224859A (en) Japanese language processing system
JP3123181B2 (en) Character recognition device
JPS61128364A (en) Retrieving device of dictionary
KR20200072233A (en) Context-based Spoken language Understanding Method
JPS6162166A (en) Japanese language sentence writing device
Mohanty et al. S2S system for voice oriented tourism information delivery in Indian context
JPH0656557B2 (en) Word detection method
JPS61139828A (en) Language input device
JPH0695684A (en) Sound recognizing system
JPS63140329A (en) Sentence reading system
JPH0695689A (en) Speech recognition system
JPH04112269A (en) Lattice searching system using difference of similarity between recognitive candidate
WO2000045289A1 (en) A method and apparatus for example-based spoken language translation with examples having grades of specificity
JPS62208169A (en) Sentence analytical processing system

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term