JPH05342251A - Dictionary retrieval device - Google Patents
Dictionary retrieval deviceInfo
- Publication number
- JPH05342251A JPH05342251A JP3297596A JP29759691A JPH05342251A JP H05342251 A JPH05342251 A JP H05342251A JP 3297596 A JP3297596 A JP 3297596A JP 29759691 A JP29759691 A JP 29759691A JP H05342251 A JPH05342251 A JP H05342251A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- character
- pronunciation
- input
- kana
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 235000016496 Panda oleosa Nutrition 0.000 claims abstract description 59
- 240000000220 Panda oleosa Species 0.000 claims abstract description 59
- 238000006243 chemical reaction Methods 0.000 abstract description 34
- 238000010586 diagram Methods 0.000 description 2
- 208000001780 epistaxis Diseases 0.000 description 1
- 238000000034 method Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
【0001】[0001]
【産業上の利用分野】本発明は仮名漢字変換装置におけ
る辞書検索装置に係り、特に発音では区別することの難
しい仮名文字を含む入力文字列に対して適切な変換処理
を可能とする辞書検索装置に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a dictionary search device in a kana-kanji conversion device, and particularly to a dictionary search device capable of performing an appropriate conversion process on an input character string containing a kana character which is difficult to distinguish by pronunciation. Regarding
【0002】[0002]
【従来の技術】近時、日本語ワード・プロセッサ等の文
章作成装置が普及してきた。この種の装置は、一般に作
成文章を仮名文字入力し、これを単語毎に漢字混りの文
字系列に変換して日本語文章を作成していくものであ
る。この仮名・漢字変換は、単語辞書に予め登録され
た、仮名文字列にそれぞれ対応した漢字を含む文字列を
検索することによって行われる。つまり、仮名文字列に
対応して漢字を含む文字列が与えられるようになってい
る。従って仮名文字列を誤って入力した場合には、当然
のことながら漢字変換がなされなかったり、或いは誤っ
た漢字変換文字列が出力されることになる。2. Description of the Related Art Recently, sentence creating devices such as Japanese word processors have become popular. This kind of device generally inputs a kana character into a created sentence and converts it into a character sequence containing mixed kanji for each word to create a Japanese sentence. This kana / kanji conversion is performed by searching a character string, which is registered in advance in the word dictionary and includes kanji corresponding to each kana character string. That is, a character string including Kanji is provided corresponding to the kana character string. Therefore, if the kana character string is erroneously input, naturally, the kanji conversion is not performed, or the wrong kanji conversion character string is output.
【0003】[0003]
【発明が解決しようとする課題】ところが日本語単語の
中には、「ず」と「づ」、「じ」と「ぢ」等のように発
音上区別できない文字を含むものが多くある。この場
合、仮名文字列を正しく入力しないと、誤った漢字変換
が行われることになる。例えば「築く」なる文章を作成
せんとする場合、仮名文字列として「きずく」と入力す
る必要があるが、このとき「きづく」と入力すると「気
付く」なる漢字変換出力を得ることになる。従って、こ
のようなときには、仮名文字列の再入力による文章訂正
が必要となる。また近年、音声入力による文章編集が指
向されている。この装置は音声入力された音韻を解析し
て発音文字列化したのち、漢字変換して文章化するもの
であるが、このときにも上述した発音上区別することの
できない文字の取扱いが問題となる。同様に、日本語単
語には、発音に「お」なる母音を含む仮名に「お」ある
いは「う」なる仮名が続くために発音が類似するような
文字を含むものも多い。例えば「王子」なる単語を得た
い場合、仮名文字列として「おうじ」と入力する必要が
あるが、このとき誤って「おおじ」と入力すると例えば
「大路」なる漢字変換出力を得ることになり、仮名文字
列を入力し直さなければならない。これを音声入力する
ときにも、「おうじ」と「おおじ」は明確に一字ずつ発
音すれば区別はできるが、連続して発音するとその音は
似通っており、このような発音が類似した文字について
も上記と同じ問題が起こる。However, many Japanese words include characters that cannot be distinguished phonetically, such as "zu" and "zu", "ji" and "ぢ". In this case, if the kana character string is not entered correctly, incorrect Kanji conversion will be performed. For example, in the case of not creating a sentence "build", it is necessary to input "Kizuku" as a kana character string, but at this time, when "Kizuku" is input, a Kanji conversion output of "Aware" is obtained. Therefore, in such a case, it is necessary to correct the sentence by re-inputting the kana character string. Further, in recent years, text editing by voice input has been directed. This device analyzes phonemes input by voice and converts them into phonetic character strings, and then converts them into kanji characters to form sentences.At this time, however, there is a problem in handling the above-mentioned characters that cannot be distinguished in terms of pronunciation. Become. Similarly, many Japanese words include a character whose pronunciation is similar because a kana containing a vowel "o" in pronunciation is followed by a kana "o" or "u". For example, if you want to get the word "prince", you need to enter "Ouji" as a kana character string, but if you mistakenly enter "Oji" at this time, you will get a Kanji conversion output such as "Oji". , You must re-enter the kana character string. Even when inputting this by voice, "Ouji" and "Oji" can be distinguished by pronouncing them one by one, but when they are pronounced consecutively, the sounds are similar, and such pronunciation is similar. The same problem as above occurs for characters.
【0004】本発明はこのような事情を考慮してなされ
たもので、その目的とするところは、発音上区別するこ
との難しい仮名文字が含まれる文字列が入力された場合
であっても、簡易に適切な漢字変換出力を見出すことの
可能な実用性の高い辞書検索装置を提供することにあ
る。The present invention has been made in consideration of such circumstances, and an object thereof is to obtain a character string containing a kana character which is difficult to distinguish in pronunciation, It is to provide a highly practical dictionary search device capable of easily finding an appropriate kanji conversion output.
【0005】[0005]
【課題を解決するための手段】本発明は、発音に「お」
なる母音を含む仮名に「お」あるいは「う」なる仮名が
続くために発音が類似し区別することが難しい仮名文字
「お」あるいは「う」を含む入力文字列が与えられたと
き、この仮名文字「お」、「う」をそれぞれ「う」、
「お」に置換えた補助文字列を生成し、この補助文字列
と前記入力文字列との両方をもって単語辞書を検索する
ことにより、簡易に正しい変換出力である漢字を含む文
字列を得るようにしたものである。[Means for Solving the Problems] In the present invention, the pronunciation is "O".
When an input string containing the kana characters "o" or "u", which are difficult to distinguish because the kana containing the vowels are followed by the kana "o" or "u", this kana is The letters "o" and "u" are replaced with "u",
By generating an auxiliary character string replaced with "O" and searching the word dictionary with both this auxiliary character string and the input character string, it is possible to easily obtain a character string containing kanji that is the correct conversion output. It was done.
【0006】[0006]
【作用】本発明によれば、発音上区別の難しい「お」な
る母音に続く「お」あるいは「う」を含む単語であって
も、「お」あるいは「う」のどちらかを(慣習的に正し
いとされる文字でない方でも良い)入力するだけで、簡
易に適切な漢字変換処理を行うことが可能となる。According to the present invention, even a word including "O" or "U" following a vowel "O" which is difficult to distinguish in pronunciation, either "O" or "U" (conventional It is possible to perform appropriate Kanji conversion processing simply by inputting characters that are not considered to be correct.
【0007】[0007]
【実施例】以下、図面を参照して本発明の一実施例につ
き説明する。DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of the present invention will be described below with reference to the drawings.
【0008】図1は、実施例装置の要部を示す概略構成
図である。文章作成に供される仮名文字列は、図示しな
い入力装置を介して文字コード化され、また単語毎に区
切られる等の前処理がなされたのち入力される。この入
力装置は、カナ・キーボード等の鍵盤装置にて構成され
たり、音声入力認識装置で構成されたりする。しかして
このようにして入力された入力仮名文字列は、一時記憶
装置1にて一旦記憶されたのち、コード変換部2を介し
て辞書引き制御部3に与えられるようになっている。コ
ード変換部2は、発音では区別することの難しい文字
を、同発音あるいは類似した発音で異った文字と対応し
て記憶した変換テーブル記憶部4を備えており、前記記
憶装置1に記憶された入力仮名文字列中に上記発音では
区別することの難しい文字が含まれているとき、その文
字を他の文字に置換してコード変換を行っている。そし
て、このコード変換により生成された補助仮名文字列
も、前記入力仮名文字列と同様にして前記辞書引き制御
部3に与えられるようになっている。FIG. 1 is a schematic configuration diagram showing a main part of the apparatus of the embodiment. The kana character string used for writing a sentence is character-coded through an input device (not shown), and is subjected to preprocessing such as division into words, and then input. The input device may be a keyboard device such as a kana keyboard or a voice input recognition device. The input kana character string thus input is temporarily stored in the temporary storage device 1 and then given to the dictionary lookup control unit 3 via the code conversion unit 2. The code conversion unit 2 includes a conversion table storage unit 4 that stores characters that are difficult to distinguish by pronunciation in correspondence with different characters that have the same or similar pronunciation, and is stored in the storage device 1. When the input kana character string contains a character that is difficult to distinguish by the above pronunciation, the character is replaced with another character for code conversion. The auxiliary kana character string generated by this code conversion is also given to the dictionary lookup control unit 3 in the same manner as the input kana character string.
【0009】即ち、変換テーブル記憶部4は、「じ」と
「ぢ」、「ず」と「づ」、「お」と「う」等の発音上、
両者を明確に区別することが困難な文字コードを相互に
対応して記憶している。これにより、例えば「きずく」
なる入力仮名文字列が与えられたとき、「きづく」なる
補助仮名文字列が生成されるようになっている。また同
様に、「おおじ」なる入力仮名文字列が与えられたと
き、「おうじ」なる補助仮名文字列が生成されるように
なっている。In other words, the conversion table storage unit 4 produces pronunciations such as "ji" and "ji", "zu" and "zu", and "o" and "u".
Character codes that are difficult to clearly distinguish between the two are stored in correspondence with each other. In this way, for example, "Kizuku"
When an input kana character string of is given, an auxiliary kana character string of "kizuku" is generated. Similarly, when an input kana character string "Oji" is given, an auxiliary kana character string "Ouji" is generated.
【0010】一方、単語辞書である辞書記憶部5は、漢
字を含む文字列からなる単語と、その発音を示す仮名文
字列とを対応させて複数単語に亘って記憶登録してい
る。これらの単語情報は、予め登録設定されたもので、
例えば「あ」項から「ん」項に至るまで、順にアドレス
割当てして登録されている。このような辞書記憶部5に
対して、前記辞書引き制御部3は先ず、与えられた入力
仮名文字列と、辞書中の仮名文字列との照合を順次行
い、その一致検出を行っている。そして、一致検出され
た単語辞書中の漢字誤りの文字列を選択的に読出してい
る。尚、このとき、上記入力仮名文字列が発音によって
区別困難な文字を含むことがないときに は、上記選択
された漢字混りの文字列は、そのまま漢字変換出力デー
タとして出力されることになる。また入力文字列が発音
によって区別困難な文字を含むことがなく、しかも単語
辞書中に該当単語を見出し得ないときには、上記入力仮
名文字列はそのまま出力される。一方、発音によって区
別困難な文字が入力仮名文字列中に含まれる場合、辞書
引き制御部3は、先ず入力仮名文字列に対して単語辞書
の検索を行い、続いて文字コード変換により作成された
補助仮名文字列について単語辞書の検索を行う。そし
て、これらの両検索によって求められた漢字混り文字か
らなる変換出力を変換候補として得る。そして、この変
換候補出力のうちの正しいものの選択は、例えばこれを
ディスプレイ表示してオペレータの指示により行った
り、或いは文脈解析に基づいて行ったり、文章中の出現
頻度の情報を参照する等して行われる。On the other hand, the dictionary storage unit 5 which is a word dictionary stores and registers a plurality of words by associating a word consisting of a character string including Chinese characters with a kana character string indicating its pronunciation. These word information is registered and set in advance,
For example, the addresses are sequentially assigned and registered from the item "a" to the item "n". With respect to such a dictionary storage unit 5, the dictionary lookup control unit 3 first sequentially collates the given input kana character string with the kana character string in the dictionary, and detects the matching. Then, the character string having the kanji error in the word dictionary in which the match is detected is selectively read. At this time, if the input kana character string does not include characters that are difficult to distinguish by pronunciation, the selected kanji mixed character string is output as it is as kanji conversion output data. .. If the input character string does not include a character that is difficult to distinguish by pronunciation and the corresponding word cannot be found in the word dictionary, the input kana character string is output as it is. On the other hand, when the input kana character string contains a character that is difficult to distinguish by pronunciation, the dictionary lookup control unit 3 first searches the word dictionary for the input kana character string, and then creates the character code by conversion. The word dictionary is searched for the auxiliary kana character string. Then, the conversion output composed of the mixed Kanji characters obtained by these both searches is obtained as a conversion candidate. Then, the correct one of the conversion candidate outputs is selected by, for example, displaying it on the display by an operator's instruction, or by performing a context analysis, or by referring to information on the appearance frequency in the sentence. Done.
【0011】かくしてこのように構成された本装置によ
れば、「きずく」と入力された入力仮名文字列に対して
は「きづく」なる補助仮名文字列が生成され、これらの
文字列と単語辞書との照合により「築く」「気付く」な
る変換出力が求められ、そのうちの適切なものが選択出
力されることになる。また「はなじ」と誤って入力され
た入力仮名文字列に対して「はなぢ」なる補助仮名文字
列により「鼻血」なる変換出力が得られる。同様に「ま
じか」なる入力仮名文字列については「まぢか」なる補
助仮名文字列により「間近」なる漢字変換出力が得られ
ることになる。さらに「おおじ」と入力された入力仮名
文字列に対しては「おうじ」なる補助仮名文字列が生成
され、これらの文字列と単語辞書との照合により例えば
「大路」「王子」なる変換候補が求められ、それらのう
ちから文脈解析によって選ばれた適切なものが変換出力
として選択されることになる。According to the present apparatus thus constructed, the auxiliary kana character string "Kizuku" is generated for the input kana character string in which "Kizuku" is input, and these character strings and the word dictionary are generated. The conversion output of “build” and “notice” is obtained by collating with, and an appropriate one of them is selected and output. In addition, a conversion output of "nosebleed" can be obtained by the auxiliary kana character string of "hanaji" with respect to the input kana character string erroneously input as "hanaji". Similarly, for the input kana character string "majika", the kanji conversion output "close" can be obtained by the auxiliary kana character string "majika". Furthermore, an auxiliary kana character string "Ouji" is generated for the input kana character string in which "Oji" is input, and by matching these character strings with the word dictionary, conversion candidates such as "Oji" and "Oji" are generated. Then, an appropriate one selected by the context analysis is selected as the conversion output from among them.
【0012】このようにして、本装置にあっては、発音
上区別することの難しい文字を含む文字列が与えられて
も、これを効果的に正しい漢字文字に変換することがで
きる。従って、オペレータのキー入力ミスや慣習的に決
められた綴りを知らないことによる文章作成の誤りや、
これの校正作業を行う等の煩らわしさがなくなる。また
音声入力による文章作成に対しても十分に対処すること
が可能となり、その効果は非常に大きい。In this way, in this apparatus, even if a character string including a character that is difficult to distinguish in terms of pronunciation is given, this can be effectively converted into a correct Kanji character. Therefore, mistakes in writing sentences due to operator's mistakes in key entry or not knowing customary spelling,
The troublesomeness of performing the calibration work for this is eliminated. Moreover, it is possible to sufficiently deal with the text creation by voice input, and the effect is very large.
【0013】尚、本発明は上記実施例に限定されるもの
ではない。例えば単語辞書中に類似した発音の文字列
(例えば「おおじ」と「おうじ」)を相互に対応させて
登録しておき、入力された文字列により、これらを同時
に検索するようにしてもよい。また入力文字列に対して
一旦辞書照合を行ったのち、該当単語が存在しない場合
や変換出力が不適当なものであるときに、文字コード変
換を行って再度辞書照合を行うように制御シーケンスを
定めてもよい。要するに本発明はその要旨を逸脱しない
範囲で変形して実施することができる。The present invention is not limited to the above embodiment. For example, character strings with similar pronunciations (for example, "Oji" and "Ouji") may be registered in the word dictionary in association with each other, and the input character strings may be searched for at the same time. .. After the dictionary is collated once with the input character string, if the corresponding word does not exist or the conversion output is improper, the control sequence is changed so that the character code is converted and the dictionary is collated again. May be set. In short, the present invention can be modified and carried out without departing from the scope of the invention.
【0014】[0014]
【発明の効果】以上詳述したように本発明によれば、オ
ペレータの誤った仮名文字入力に対しても、また音声入
力により与えられる仮名文字列であっても、常に正確に
漢字変換して日本語文章を作成することが可能となる等
の実用上多大なる効果が奏せられる。As described above in detail, according to the present invention, even if an operator inputs an incorrect kana character or a kana character string given by voice input, the kanji character is always converted accurately. This has a great practical effect such as the ability to create Japanese sentences.
【図1】 本発明の一実施例装置の要部を示す概略構成
図。FIG. 1 is a schematic configuration diagram showing a main part of an apparatus according to an embodiment of the present invention.
1…一時記憶装置、2…コード変換部、3…辞書引き制
御部、4…変換テーブル記憶部、5…辞書記憶部。1 ... Temporary storage device, 2 ... Code conversion unit, 3 ... Dictionary lookup control unit, 4 ... Conversion table storage unit, 5 ... Dictionary storage unit.
───────────────────────────────────────────────────── フロントページの続き (72)発明者 斎藤 裕美 神奈川県川崎市幸区小向東芝町1番地株式 会社東芝総合研究所内 (72)発明者 河田 勉 神奈川県川崎市幸区小向東芝町1番地株式 会社東芝総合研究所内 ─────────────────────────────────────────────────── ─── Continuation of the front page (72) Hiromi Saito, 1 Komukai Toshiba-cho, Sachi-ku, Kawasaki-shi, Kanagawa, Ltd. Toshiba Research Institute Co., Ltd. Bashi Stock Company, Toshiba Research Institute
Claims (1)
わす文字列とともに記憶している単語辞書と、 入力された仮名文字列を一時記憶する記憶装置と、 この記憶装置に記憶された前記入力仮名文字列の中に、
発音に「お」なる母音を含む仮名に「お」あるいは
「う」なる仮名が続くために発音が類似するような仮名
文字「お」あるいは「う」を含むとき、この仮名文字
「お」、「う」をそれぞれ「う」、「お」に置換えた補
助仮名文字列を生成する手段と、 前記単語辞書を前記入力された仮名文字列および前記補
助仮名文字列でそれぞれ検索する辞書照合手段とを具備
したことを特徴とする辞書検索装置。1. A word dictionary in which a plurality of words including Chinese characters are stored together with a character string representing the pronunciation, a storage device for temporarily storing an input kana character string, and the storage device stored in the storage device. In the input kana character string,
When the pronunciation includes the kana character "o" or "u", which is similar in pronunciation because the kana character including the vowel "o" is followed by the kana character "o" or "u", the kana character "o", Means for generating an auxiliary kana character string in which “u” is replaced with “u” and “o”, and dictionary matching means for searching the word dictionary with the input kana character string and the auxiliary kana character string, respectively. A dictionary search device comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3297596A JPH05342251A (en) | 1991-10-18 | 1991-10-18 | Dictionary retrieval device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3297596A JPH05342251A (en) | 1991-10-18 | 1991-10-18 | Dictionary retrieval device |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP57004708A Division JPS58123126A (en) | 1982-01-14 | 1982-01-14 | Dictionary retrieving device |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH05342251A true JPH05342251A (en) | 1993-12-24 |
Family
ID=17848608
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3297596A Pending JPH05342251A (en) | 1991-10-18 | 1991-10-18 | Dictionary retrieval device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH05342251A (en) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5464446A (en) * | 1977-10-31 | 1979-05-24 | Fujitsu Ltd | Information processing system for japanese word |
JPS5464445A (en) * | 1977-10-31 | 1979-05-24 | Fujitsu Ltd | Information retrieval system |
-
1991
- 1991-10-18 JP JP3297596A patent/JPH05342251A/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5464446A (en) * | 1977-10-31 | 1979-05-24 | Fujitsu Ltd | Information processing system for japanese word |
JPS5464445A (en) * | 1977-10-31 | 1979-05-24 | Fujitsu Ltd | Information retrieval system |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5890182A (en) | Sentence processing method and apparatus | |
JP2595934B2 (en) | Kana-Kanji conversion processor | |
JPS5821287B2 (en) | Kana-Kanji conversion device | |
JPS58123129A (en) | Converting device of japanese syllabary to chinese character | |
JPH05342251A (en) | Dictionary retrieval device | |
JPS58123126A (en) | Dictionary retrieving device | |
JP3470927B2 (en) | Natural language analysis method and device | |
JPH0130173B2 (en) | ||
JPH0630052B2 (en) | Voice recognition display | |
JPH04365166A (en) | Sentence inspecting device | |
JPS62117060A (en) | Character/voice input conversion system | |
JP2570784B2 (en) | Document reader post-processing device | |
JPS62208169A (en) | Text analysis processing method | |
JPS62224859A (en) | Japanese language processing system | |
JPS60136865A (en) | Retrieving device of dictionary | |
JPS60176167A (en) | Voice input type dictionary retrieving device | |
JPS6175467A (en) | Kana and kanji converting device | |
JPH0460754A (en) | Kana/kanji (chinese character) conversion system | |
JPH06103457B2 (en) | Voice typewriter | |
JPH0414168A (en) | Word processor | |
JPS58123125A (en) | Documentation device | |
JPS61139828A (en) | Language input device | |
JPS5827268A (en) | Japanese word processing device | |
JPS6380361A (en) | Language information processor | |
JPH02257256A (en) | Character processor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040914 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040915 |
|
R150 | Certificate of patent (=grant) or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |