JPS60176167A - Voice input type dictionary retrieving device - Google Patents
Voice input type dictionary retrieving deviceInfo
- Publication number
- JPS60176167A JPS60176167A JP59033403A JP3340384A JPS60176167A JP S60176167 A JPS60176167 A JP S60176167A JP 59033403 A JP59033403 A JP 59033403A JP 3340384 A JP3340384 A JP 3340384A JP S60176167 A JPS60176167 A JP S60176167A
- Authority
- JP
- Japan
- Prior art keywords
- tsu
- consonant
- character string
- kana
- conversion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/53—Processing of non-Latin text
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Document Processing Apparatus (AREA)
Abstract
Description
【発明の詳細な説明】
産業上の利用分野
本発明は仮名漢字変換装置における辞書検索装置に係り
、表記通りの発声では入力が困難で、従来補助入力手段
を必要としていた促音の「ツ」を、補助入力手段を用い
ずに直音で「ツ」と音声入力しても直音の「ツ」を含む
入力文字列に対して適切な変換処理を可能とする音声入
力式辞書検索装置に関するものである。DETAILED DESCRIPTION OF THE INVENTION Field of Industrial Application The present invention relates to a dictionary search device for a kana-kanji conversion device. , relates to a voice input dictionary search device that enables appropriate conversion processing for input character strings that include the direct sound "tsu" even if the direct sound "tsu" is input without using an auxiliary input means. It is.
ゝ従来例の構成とその問題点
近年、日本語ワード・・プロセッサ等の文章作成装置が
普及してきた。この種の装置は一般に、作成したい文章
を仮名文字で入力し、これを単語毎に漢字混じシの文字
系列に変換して日本語文章を作成していくものである。ゝConventional structure and problems thereof In recent years, text creation devices such as Japanese word processors have become popular. This type of device generally creates a Japanese sentence by inputting the desired sentence in kana characters and converting it word by word into a string of characters mixed with kanji.
この仮名漢字変換は、単語辞書に予め登録された、仮名
文字列にそれぞれ対応した漢字を含む文字列を検索する
ことによって行われる。つまp1仮名文字列に対応して
漢字を含む文字列が与えられるようになっている。This kana-kanji conversion is performed by searching for character strings that are registered in the word dictionary in advance and include kanji that respectively correspond to the kana character strings. A character string including kanji is given corresponding to the p1 kana character string.
従−て、仮名文字列を誤って入力すると、漢字変換がな
されなかったり、誤った漢字変換文字列が出力されるこ
とになる。Therefore, if a kana character string is incorrectly input, the kanji conversion will not be performed or an incorrect kanji conversion character string will be output.
ところが、日本語単音節の中には、表記通りの発声では
入力が困難で、従来補助入力手段を必要としていた音節
がある。促音の「ツ」は発声上は無音区間であり、完全
に連続な発声の音声を対象とする場合には休止区間とし
て検出することも可能であるが、確度が低く、単音節の
音声入力を対象とする場合には補助入力手段、例えばキ
ー人力等で小文字であることの指示操作を実行する必要
があった。However, among Japanese monosyllables, there are some syllables that are difficult to input by pronouncing them as written, and conventionally require auxiliary input means. The consonant "tsu" is a silent interval in pronunciation, and it is possible to detect it as a pause interval when the target is a completely continuous utterance, but the accuracy is low and it is difficult to detect monosyllabic voice input. In order to make it a target, it was necessary to perform an operation to indicate that it is a lowercase letter using an auxiliary input means, such as a manual keystroke.
発明の目的
本発明の目的は、前記のような事情を考慮してなされた
もので、促音か直音かの区別のつかない仮名文字「ツ」
が含まれる文字列が入力された場合であっても、「ツ」
に後続している仮名文字を調べることによ−て、余計な
辞書検索をしないで、適切な漢字変換出力を見出すこと
の可能な実用性の高い音声入力式辞書検索装置を提供す
ることである。Purpose of the Invention The purpose of the present invention was made in consideration of the above-mentioned circumstances.
Even if a string containing
To provide a highly practical voice input type dictionary search device capable of finding an appropriate kanji conversion output by checking the kana characters following the kanji character without performing unnecessary dictionary searches. .
発明の構成
本発明の辞書検索装置は、漢字を含む複数の単語をその
読みを表す文字列に対応して記憶している単語辞書と、
入力された仮名文字列を一時記憶する一時記憶装置と、
前記入力仮名文字列が直音の「ツ」を含むとき前記直音
の「ツ」に後続する文字を調べて促音の「ツ」になり得
るときに限り前記直音の「ツ」を促音の「ツ」で置き換
えた補助板名文字列を生成するコード変換部と、前記単
語辞書を入力仮名文字列および補助板名文字列でそれぞ
れ検索して入力仮名文字列に示される漢字を含む単語を
得る辞書引き制御部とから構成され、これにより促音「
ソ〉」の入力および辞書検索が容易に行うことができる
ようにしたものである。Structure of the Invention The dictionary search device of the present invention includes a word dictionary that stores a plurality of words including kanji in correspondence with character strings representing their pronunciations;
a temporary storage device that temporarily stores the input kana character string;
When the input kana character string includes the direct sound "tsu", the character following the direct sound "tsu" is checked and only if it can be a consonant "tsu", the direct sound "tsu" is changed to a consonant. A code conversion unit that generates an auxiliary board name character string replaced with "tsu", and a code converter that searches the word dictionary for the input kana character string and the auxiliary board name character string to find words that include the kanji shown in the input kana character string. It is composed of a dictionary lookup control section to obtain the consonant "
This makes it easy to input ``So〉'' and to search in a dictionary.
実施例の説明
以下本発明の一実施例について、図面を参照しながら説
明する。DESCRIPTION OF EMBODIMENTS An embodiment of the present invention will be described below with reference to the drawings.
第1図は音声入力式辞書検索装置の要部を示す概略構成
図である。第1図において、1は入力された仮名文字列
を一時記憶する一時記憶装置、2は前記入力仮名文字列
が直音の「ツ」を含むとき前記直音の「ツ」に後続する
文字を変換判定テーブル4を用いて調べ促音の「ツ」に
なシ得Z)ときに限り前記直音の「ツ」を促音の「ン」
で置き換えた補助板名文字列を生成するコード変換部、
3は単語辞書5を入力仮名文字列および補助板名文字列
でそれぞれ検索して入力仮名文字列に示される漢字を含
む単語を得る辞書引き制御部である。FIG. 1 is a schematic diagram showing the main parts of a voice input type dictionary search device. In FIG. 1, 1 is a temporary storage device that temporarily stores the input kana character string, and 2 is a temporary storage device that stores the input kana character string when the input kana character string includes the direct sound "tsu". Check using Conversion Judgment Table 4 to find that the consonant "tsu" is not the consonant "tsu".
A code converter that generates the auxiliary board name string replaced with
Reference numeral 3 denotes a dictionary lookup control unit that searches the word dictionary 5 using the input kana character string and the auxiliary board name character string to obtain words containing the kanji characters shown in the input kana character string.
単語辞書5は、漢字を含む複数の単語をその読みを表す
文字列に対応して記憶している。また変換判定テーブル
4は外来語でない自立語において促音に後続しつる文字
を記憶している。The word dictionary 5 stores a plurality of words including kanji in correspondence with character strings representing their pronunciations. The conversion determination table 4 also stores hanging characters following consonants in independent words that are not loanwords.
以上のように構成された本実施例の音声入力式辞書検索
装置について以下その動作を説明する。The operation of the voice input type dictionary search device of this embodiment configured as described above will be explained below.
第2図は本発明装置の動作を説明するためのフローチャ
ートである。FIG. 2 is a flowchart for explaining the operation of the apparatus of the present invention.
文章作成に供される仮名文字列は、図示しない入力装置
を介して文字コード化され、また単語毎に区切られる等
の前処理がなされたのち入力される。この入力装置は、
カナ・キーボード等の鍵盤装置にて構成されたり、音声
入力認識装置で構成される(ステップn2〜n 4)。The kana character string used for creating sentences is inputted after being converted into character codes through an input device (not shown), and subjected to preprocessing such as being separated into words. This input device is
It is composed of a keyboard device such as a kana keyboard, or a voice input recognition device (steps n2 to n4).
このようにして入力された入力仮名文字列は、一時記憶
装置1にて一旦記憶されたのち(ステップns )、コ
ード変換部2を介して辞書引き制御部3に与えられる。The input kana character string thus input is once stored in the temporary storage device 1 (step ns), and then provided to the dictionary lookup control section 3 via the code conversion section 2.
コード変換部2ば、外来語でない自立語において促音に
後続しうる文字を記憶した変換判定テーブル4を備えて
おり、一時記憶装置1に記憶された入力仮名文字列中に
直音「ツ」が含まれ、その文字列が外来語でない自立語
であるとき、その直音「ツ」に後続している文字と前記
変換判定テーブル4とを比較して条件を満足するときに
限り、その直音「ソ」を促音「ン」に置換してコード変
換を行っている。The code conversion unit 2 is equipped with a conversion determination table 4 that stores characters that can follow consonants in independent words that are not loanwords, and includes a conversion determination table 4 that stores characters that can follow consonants in independent words that are not loanwords. is included, and the character string is an independent word that is not a loan word, the character string following the direct sound "tsu" is compared with the conversion judgment table 4, and only when the conditions are satisfied, the direct sound Code conversion is performed by replacing "so" with the consonant "n".
ここで、変換判定テーブル4が記憶している促音になり
うる文字列の規則性は、「外来語でない自立語において
、促音は子音「KJrTJrsJrPJの前か或いは自
立語の最後でしかあられれない」というものである。Here, the regularity of character strings that can be consonants stored in the conversion determination table 4 is ``In independent words that are not loanwords, consonants can only appear before the consonant 'KJrTJrsJrPJ or at the end of an independent word.'' That is what it is.
よって、前記条件を満足しないときは、コード変換部2
は入力仮名文字列中の直音「ツ」を促音「ツ」に置換し
ない。Therefore, when the above conditions are not satisfied, the code converter 2
does not replace the direct sound "tsu" in the input kana string with the consonant sound "tsu".
一方、その文字列が外来語であるときは、文字列中の直
音「ツ」を無条件に促音「ツ」に置換してコード変換を
行う(ステップn6〜n s )。On the other hand, if the character string is a foreign word, code conversion is performed by unconditionally replacing the direct sound "tsu" in the character string with the consonant sound "tsu" (steps n6 to n s ).
この例文として、「五月」、「殺気」、「さっき」、「
質問」、「ベッド」を挙げる。促音「ツ」は直音「ツ」
で入力する場合、入力仮名文字列はそれぞれ「サツキ」
、「サツキ」、「サツキ」。Examples of this sentence are ``May'', ``murderous intent'', ``just now'', and ``
``Question'' and ``Bed.'' The consonant “tsu” is the direct sound “tsu”
When inputting with , each input kana string is "Satsuki"
, "Satsuki", "Satsuki".
「シツモン」、「ベッド」となる。「サツキ」と入力さ
れたとき、「ツ」の後続子音rKJは変換判定テーブル
4よシ促音の後続子音になり得るので、補助板名文字列
「サツキ」を生成する。次に「シツモン」と入力された
ときには、「ツ」の後続子音rMJは促音の後続子音に
は該当しないので、補助板名文字列は生成されない。と
ころが「ベッド」と入力されたときには、「ベッド」は
外来語であるので、無条件に補助板名文字列「ベッド」
を生成することになる(ステップn 9) 0そして、
このコード変換により生成された補助板名文字列も、前
記入力仮名文字列と同様にして前記辞書引き制御部3に
与えられるようになっている。``Shitumon'' and ``bed''. When "Satsuki" is input, the consonant rKJ following "tsu" can be a consonant following the consonant according to conversion determination table 4, so the auxiliary board name character string "Satsuki" is generated. Next, when "shitsumon" is input, the consonant rMJ following "tsu" does not correspond to the consonant following a consonant, so no auxiliary board name character string is generated. However, when "bed" is input, since "bed" is a loan word, the auxiliary board name string "bed" is unconditionally input.
will generate (step n 9) 0 and
The auxiliary board name character string generated by this code conversion is also provided to the dictionary lookup control section 3 in the same manner as the input kana character string.
これにより、直音「ツ」で入力された文字が直音なのか
促音なのか確定できないとき、従来であれば両方の文字
列の検索が必要なところを、促音になりうる文字列の規
則性を利用すると、直音の「ツ」の方だけを検索すれば
よいことになり、余計な検索をしないで済むことになる
。As a result, when it cannot be determined whether a character input with the direct sound "tsu" is a direct sound or a consonant, the regular search for character strings that can be a consonant will replace the conventional search for both character strings. If you use , you only need to search for the ``tsu'' part of Naoto, and you won't have to do any unnecessary searches.
一方、単語辞書5は、漢字を含む文字列からなる単語と
、その発音を示す仮名文字列とを対応させて複数単語に
亘って記憶登録している。これらの単語情報は、予め登
録設定されたもので、例えば「あ」項から「ん」項に至
るまで、順にアドレス割当てして登録されている。この
ような単語辞書6に対して、前記辞書引き制御部3は先
ず、与えられた入力仮名文字列と、辞書中の仮名文字列
との照合を順次行い、その一致検出を行っている(ステ
ップn、。)。そして、一致検出された単語辞書中の漢
字混じりの文字列を選択的に読み出している。尚、この
とき、前記入力仮名文字列が文字「ツ」を含まないとき
には、前記選択された漢字混じりの文字列は、そのまま
漢字変換出力デー)として出力されることになる。また
入力文字列91.A
が文字「ツ」を含むことがなく、しかも単語辞書中に該
当単語を見出し得ないときには、前記入力仮名文字列は
そのまま出力される。一方、文字「ツ」が入力仮名文字
列中に含まれる場合、辞書引き制御部3は、先ず入力仮
名文字列に対して単語辞書の検索を行い、次に変換判定
テーブル4の条件を満足するときは、文字コード変換に
より作成された補助板名文字列について単語辞書の検索
を行う。そして、これらの両検索によってめられた漢字
混じり文字からなる変換出力を変換候補として得る。こ
の時、両検索によっても単語辞書中に該当単語を見出し
得ない時は、前記入力仮名文字列がそのit出力される
(ステップ”11〜n13)。そして、この変換候補出
力のうちの正しいものの選択は、例えばこれをディスプ
レイ表示してオペレータの指示により行ったり、或いは
文脈解析に基づいて行ったり、文章中の出現頻度の情報
を参照する等して行われる。On the other hand, the word dictionary 5 stores and registers a plurality of words in correspondence with words consisting of character strings including kanji and kana character strings indicating their pronunciations. These pieces of word information are registered and set in advance, and are registered by sequentially assigning addresses from, for example, the term "A" to the term "N". For such a word dictionary 6, the dictionary lookup control unit 3 first sequentially compares the given input kana character string with the kana character string in the dictionary to detect a match (step n,.). Then, character strings containing kanji in the word dictionary for which a match has been detected are selectively read out. At this time, if the input kana character string does not include the character "tsu", the selected character string mixed with kanji will be output as is (kanji conversion output data). In addition, input character string 91. If A does not include the character "tsu" and the corresponding word cannot be found in the word dictionary, the input kana character string is output as is. On the other hand, if the character "tsu" is included in the input kana character string, the dictionary lookup control unit 3 first searches the word dictionary for the input kana character string, and then satisfies the conditions of the conversion determination table 4. In this case, a word dictionary is searched for the auxiliary board name character string created by character code conversion. Then, conversion outputs consisting of characters mixed with kanji found by these two searches are obtained as conversion candidates. At this time, if the corresponding word cannot be found in the word dictionary even after both searches, the input kana character string is outputted (steps 11 to n13).Then, the correct one of the conversion candidate outputs is output. The selection is made, for example, by displaying this on a display and in response to an operator's instructions, based on context analysis, or by referring to information on the frequency of appearance in the text.
このようにして、本装置にあっては、促音の「ツ」を直
音の「ツ」で置き換えて入力しても、これを効率的に正
しい漢字文字に変換することができる。In this way, in this device, even if the consonant "tsu" is replaced with the direct sound "tsu" and input, this can be efficiently converted into a correct Kanji character.
発明の効果
以上の説明から明らかなように、本発明は、仮名文字列
の音声入力時において、発音上入力の難かしい促音「ッ
」の入力に関して、直音「ソ」で入力しても正確に漢字
変換して日本語文章を作成することを可能にし、その効
果は非常に大きい。Effects of the Invention As is clear from the above explanation, the present invention enables accurate input of the consonant "tsu", which is difficult to input in terms of pronunciation, even when inputting the direct sound "so" when inputting kana character strings by voice. It makes it possible to create Japanese sentences by converting kanji into kanji, and the effect is very large.
また装置構成としても、変換判定テーブルを参照して補
正仮名文字列を生成するだけで良いので、実用上極めて
好都合である。従って、極めて簡易に、且つ効果的な辞
書検索が可能となる0Furthermore, the device configuration is extremely convenient in practice, since it is sufficient to generate a corrected kana character string by referring to a conversion determination table. Therefore, it is possible to perform dictionary searches extremely easily and effectively.
第1図は本発明の一実施例における音声入力式辞書検索
装置の要部を示す概略構成図、第2図はその動作を説明
するフローチャートである。
1・・・・・・一時記憶装置、2・・・・・・コード変
換部、3・・・ ・辞書引き制御部、4・・・・・変換
判定テーブル、5・・・・・・単語辞書。
代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図
第2図FIG. 1 is a schematic configuration diagram showing the main parts of a voice input dictionary search device according to an embodiment of the present invention, and FIG. 2 is a flowchart explaining its operation. 1... Temporary storage device, 2... Code converter, 3... Dictionary lookup control unit, 4... Conversion determination table, 5... Word dictionary. Name of agent: Patent attorney Toshio Nakao and 1 other person No. 1
Figure 2
Claims (1)
て記憶している単語辞書と、入力された仮名文字列を一
時記憶する一時記憶装置と、前記入力仮名文字列が直音
の「ツ」を含むとき前記直音の[ツJに後続する文字を
調べて促音の「ツ」になり得るときに限り前記直音の「
ツ」を促音の「)」で置き換えた補助板名文字列を生成
するコード変換部と、前記単語辞書を入力仮名文字列お
よび補助板名文字列でそれぞれ検索して入力仮名文字列
に示される漢字を含む単語を得る辞書引き制御部とを具
備したことを特徴とする音声入力式%式%a word dictionary that stores a plurality of words including kanji in correspondence with character strings representing their pronunciations; a temporary storage device that temporarily stores input kana character strings; When the direct sound [tsu] is included, the direct sound [tsu
a code conversion unit that generates an auxiliary board name character string in which "tsu" is replaced with a consonant ")"; and a code converter that searches the word dictionary for the input kana character string and the auxiliary board name character string to find the characters indicated in the input kana character string. A voice input type % expression % characterized by comprising a dictionary lookup control unit for obtaining words including kanji.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59033403A JPS60176167A (en) | 1984-02-23 | 1984-02-23 | Voice input type dictionary retrieving device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59033403A JPS60176167A (en) | 1984-02-23 | 1984-02-23 | Voice input type dictionary retrieving device |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS60176167A true JPS60176167A (en) | 1985-09-10 |
Family
ID=12385626
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59033403A Pending JPS60176167A (en) | 1984-02-23 | 1984-02-23 | Voice input type dictionary retrieving device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS60176167A (en) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57178562A (en) * | 1981-04-27 | 1982-11-02 | Fujitsu Ltd | Dictionary file retrieval system |
JPS5876945A (en) * | 1981-11-02 | 1983-05-10 | Oki Electric Ind Co Ltd | Converting method for voice input japanese typewriter |
JPS58123129A (en) * | 1982-01-19 | 1983-07-22 | Toshiba Corp | Converting device of japanese syllabary to chinese character |
-
1984
- 1984-02-23 JP JP59033403A patent/JPS60176167A/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57178562A (en) * | 1981-04-27 | 1982-11-02 | Fujitsu Ltd | Dictionary file retrieval system |
JPS5876945A (en) * | 1981-11-02 | 1983-05-10 | Oki Electric Ind Co Ltd | Converting method for voice input japanese typewriter |
JPS58123129A (en) * | 1982-01-19 | 1983-07-22 | Toshiba Corp | Converting device of japanese syllabary to chinese character |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6490563B2 (en) | Proofreading with text to speech feedback | |
JPS634206B2 (en) | ||
JPS58123129A (en) | Converting device of japanese syllabary to chinese character | |
JPS60176167A (en) | Voice input type dictionary retrieving device | |
JPS58123126A (en) | Dictionary retrieving device | |
JPH0350668A (en) | Character processor | |
JP3048793B2 (en) | Character converter | |
JPH04232997A (en) | System for displaying result of recognition in speech recognition device | |
JPH08272780A (en) | Processor and method for chinese input processing, and processor and method for language processing | |
JPS60205594A (en) | Recognition results display system | |
JP3084864B2 (en) | Text input device | |
JPS6365566A (en) | 'kana' to 'kanji' converter | |
JPS61177575A (en) | Forming device of japanese document | |
JPH0375898B2 (en) | ||
JPH06289890A (en) | Natural language processor | |
JPS60112175A (en) | Abbreviation conversion system of kana (japanese syllabary)/kanji (chinese character) convertor | |
JPS61223971A (en) | Sentence generating device | |
JPS61177573A (en) | Forming device of japanese document | |
JPH0340060A (en) | Kana (japanese syllabary) to kanji (chinese character) converter | |
JPH0264859A (en) | Text processing device | |
JPS62208169A (en) | Sentence analytical processing system | |
JPH05342251A (en) | Dictionary retrieval device | |
JPH02257363A (en) | Automatic translation device | |
JPH06208560A (en) | Ambiguous kanji converting device | |
JPS62279458A (en) | Kana/kanji converter |