JPS5852738A - Converting method of voice input japanese type writer - Google Patents

Converting method of voice input japanese type writer

Info

Publication number
JPS5852738A
JPS5852738A JP56150584A JP15058481A JPS5852738A JP S5852738 A JPS5852738 A JP S5852738A JP 56150584 A JP56150584 A JP 56150584A JP 15058481 A JP15058481 A JP 15058481A JP S5852738 A JPS5852738 A JP S5852738A
Authority
JP
Japan
Prior art keywords
kana
input
character
converted
symbol
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP56150584A
Other languages
Japanese (ja)
Inventor
「まん」木 正義
Masayoshi Yurugi
Terukazu Kito
鬼頭 輝一
Masaji Kobayashi
正次 小林
Hidenori Naoi
直井 秀憲
Shuji Fujinaga
藤永 修二
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP56150584A priority Critical patent/JPS5852738A/en
Publication of JPS5852738A publication Critical patent/JPS5852738A/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

PURPOSE:To input data with a pronunciation which is as natural as possible without increasing the number of recognization voices of a voice recognition part, by voicing a character string while prolonged symbols of the string are substituted by characters of vowel parts of character right before the prolonged- sound symbols. CONSTITUTION:In an independent word dictionary, prolonged-sound symbols in a KANA (Japanese syllabary) index field are converted into vowel characters of character right before them. Namely, prolonged-sound symbols after ''chi'' are all converted into ''i'', those after ''no'' are converted into ''o'', and those after ''ar'' are converted into ''a'', but an array of characters is not changed at all. Consequently, an automatic KANA-to-KANJI (Chinese character) conversion processing part performs conversion by following the same procedure with conventional KANA-to-KANJI conversion processing by key input, etc.

Description

【発明の詳細な説明】 本発明は、音声認識装置を用いた音声入力和文タイプラ
イタに関する。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to a voice input Japanese typewriter using a voice recognition device.

従来の邦文タイプライタにおいては、一般文書を作成す
る場合、漢字、カナ文字、英数文字、記号等の文字がす
べて並列されtこテーブルからオペレークが文字を選択
し打鍵する方法がとられている。この方法ではテーブル
上の文字が数千種あるため、邦文タイプライタは英文タ
イプライタのように誰でもすぐ使える機器でなく、専門
のオペレータの養成が必要であった。
With conventional Japanese typewriters, when creating general documents, characters such as kanji, kana characters, alphanumeric characters, symbols, etc. are all arranged in parallel, and an operator selects characters from a table and presses the keys. . With this method, there were several thousand types of characters on the table, so Japanese typewriters were not devices that anyone could use immediately like English typewriters, and required the training of specialized operators.

これに対し、最近、カナ・英数・記号だけのキーボード
を用いて入力文の文字の読みにしたがってカナ文字で入
力し、カナを漢字に変換する機能を持つ日本語タイプラ
イタが提案されている。
In response, a Japanese typewriter has recently been proposed that uses a keyboard with only kana, alphanumeric, and symbols to input kana characters according to the pronunciation of the characters in the input sentence, and has the function of converting kana to kanji. .

このカナ漢字変換方式も種々提案されており、単にオペ
レータが指定した範囲のカナに対応する漢字があればそ
れを提示する単なる辞書引き機のようなものから、文章
をそのまま入力すれば文章の自動文法分析、意味分析な
どを行ない自動カナ漢字変換するものもある。この自動
カナ漢字変換装置の場合、装置内に国語辞書に対応する
単語辞書や文法辞書を有している。
Various kana-kanji conversion methods have been proposed, ranging from a simple dictionary lookup machine that displays kanji that correspond to the kana in a range specified by the operator, to automatic conversion of sentences by inputting the text as is. There are also tools that perform grammatical and semantic analysis and automatically convert kana to kanji. In the case of this automatic kana-kanji conversion device, the device includes a word dictionary and a grammar dictionary corresponding to the Japanese language dictionary.

この自動カナ漢字変換機能が装着された日本語タイプラ
イタは、従来の邦文タイプライタに比べ入力するための
習熟もかなり軽減され、誰もが入力することができる。
A Japanese typewriter equipped with this automatic kana-kanji conversion function requires much less learning to input than conventional Japanese typewriters, and anyone can input.

しかし、この場合も一搬の文書を入力するためKは、カ
ナ文字、カナ小文字、英数、記号等の入力を加えると1
40〜150位の入カキ−が必要であるため、入力速度
を速くするにはやはりある程度力速度が得られるものと
して、入力部に音声認識装置を用いた音声入力和文タイ
プライタが考えられる。
However, in this case as well, since a single document is input, K becomes 1 if Kana characters, Kana lowercase characters, alphanumeric characters, symbols, etc. are input.
Since 40 to 150 input keys are required, a voice input Japanese typewriter using a voice recognition device in the input section is considered as a device that can obtain a certain degree of input speed to increase the input speed.

即ち、前記自動カナ漢字変換機能を有する日本語タイプ
ライタのカナキーボードの替りに音声認識装置を使用す
るものである。゛ 音声認識装置は種々提案されている。が、音声を認識す
る場合、その対象により単語認識と単音節認識に区別さ
れる。このうち、単音節認識は音声タイプライタへの応
用を考えた場合、対象が単音節であることにより原理的
には無限の言語を認識ゝ− できることになる。
That is, a voice recognition device is used in place of the kana keyboard of the Japanese typewriter having the automatic kana-kanji conversion function. ``Various types of speech recognition devices have been proposed. However, when recognizing speech, it is divided into word recognition and monosyllable recognition, depending on the target. Among these, when considering the application of monosyllable recognition to voice typewriters, in principle it is possible to recognize an infinite number of languages because the target is a monosyllable.

単音節認識装置については、日本音響学会音声「単音節
音声タイプライタ(北天応用電気研究所)」に示されて
おり、概略第1図に示すようになる。
A monosyllable recognition device is described in the Acoustical Society of Japan's "Monosyllable Speech Typewriter (Hokuten Applied Electrical Research Institute)" and is schematically shown in FIG.

第1図妊おいて、1はマイクロフォン、2はプリアンプ
、3は16チヤネルのバンドパスフィルタ(以下16C
HBPFと記す)、4は16チヤネルのアナログ・ディ
ジタルコンバータ(以下16 CII A/Dコンバー
タと記す)、5は入方値を対数変換するリード・オンリ
・メモリ(以下対数変換ROMと記す)、6はピッチ抽
出器、7はカウンタタイマ、8はマイクロプロセッサC
以下マイクロcPUと記す)、9はパスライン(以下B
US LINEと記す)、10はリード・オン】ルメモ
リ(以下ROMと記す)、11はランダムアクセスメモ
リ(以下RAMと記す)、12はフロッピィディスクド
ライブ装置(以下FDDと記す)、13はキャラクタデ
ィスプレイ装置(以下CRTと記す)、14はキーボー
ド装置(以下KBと記す)、15はハードウェア演算器
である。
In Figure 1, 1 is a microphone, 2 is a preamplifier, and 3 is a 16-channel bandpass filter (hereinafter referred to as 16C).
4 is a 16-channel analog-to-digital converter (hereinafter referred to as 16 CII A/D converter), 5 is a read-only memory for logarithmically converting input values (hereinafter referred to as logarithmic conversion ROM), 6 is a pitch extractor, 7 is a counter timer, and 8 is a microprocessor C.
(hereinafter referred to as micro cPU), 9 is the pass line (hereinafter referred to as B
10 is a read-on memory (hereinafter referred to as ROM), 11 is a random access memory (hereinafter referred to as RAM), 12 is a floppy disk drive device (hereinafter referred to as FDD), 13 is a character display device (hereinafter referred to as CRT), 14 is a keyboard device (hereinafter referred to as KB), and 15 is a hardware arithmetic unit.

前記構成の音声タイプライタは、以下のように動作する
。まず、マイクロフォン1より入力された音声は6デシ
ベル/オクターブで減衰しているため、プリアンプ2に
おいて6デシベル/オクターブの率で高域を強調し、こ
のパワースペクトルを平坦なものにするその出力を16
CHBPF3へ入力し、200〜4400Hzの周波数
を16チヤネルに分割し、各CH毎にその出力をA/D
コンノく一夕4へ入力する。A/Dコンバータ4にて1
2bitのディジタル量に変換した後対数変換R,OM
 5へ入力し、8ビツトの対薮に変換する。これは、人
の聴覚特性が対数的であるためそれを近似するためと、
更には、パワースペクトルの正規化を行なうとき加減算
だけで演算ができるという利点をも考えた上の処理であ
′る。A/Dコンバータ4の出力をマイクロCPU8の
BUS LINE9を通じてマイクロCPU8へ引き込
む。前記マイクロCPU8には制御用のROMl0、デ
ータエリア用のRAM11、登録音声等のデータを格納
するFDD12、音声認識結果l出力表示する(lTI
3、マイクロCPU 8に対し手動で入力を行なうため
のKB 14が接続され、小型の電子計算機システムが
構成されている。
The voice typewriter having the above configuration operates as follows. First, since the audio input from microphone 1 is attenuated by 6 dB/octave, preamplifier 2 emphasizes the high range at a rate of 6 dB/octave, flattening the power spectrum and increasing its output to 16 dB/octave.
Input to CHBP3, divide the frequency from 200 to 4400Hz into 16 channels, and send the output to A/D for each CH.
Enter Konnoku Ichiyo 4. 1 at A/D converter 4
After converting to 2-bit digital quantity, logarithmic conversion R, OM
5 and convert to 8-bit pairs. This is to approximate the logarithmic nature of human auditory characteristics, and
Furthermore, this process takes into consideration the advantage that when normalizing the power spectrum, calculations can be performed using only addition and subtraction. The output of the A/D converter 4 is drawn into the micro CPU 8 through the BUS LINE 9 of the micro CPU 8. The micro CPU 8 includes a ROM 10 for control, a RAM 11 for a data area, an FDD 12 for storing data such as registered voices, and a voice recognition result output display (TITI).
3. A KB 14 for manually inputting information to the micro CPU 8 is connected to constitute a small electronic computer system.

又、16CHBPF3の出力をピンチ抽出器6へ入力し
、ピンチ周期毎に16CHA/Dコンバータをトリガす
べく構成する。ピッチ抽出器6に関する一手法は、例え
ば特開昭54−162405 「ピッチ周波数抽出装置
」に提案されているが、このような方法によりピッチ周
波数が抽出されるものと考えてよい。ピッチ周波数は母
音又は有声子音の場合存在するが、無声子誉の場合音源
は雑音であり、ピッチ周波数が存在しない。これら無声
子音をサンプリングするためにカウンタタイマ7により
一定周期、例えばl Kl(zの周波数で1 m se
c毎にパルスを発生し、16cHA/Dコンバータ4へ
入力−fる。
Further, the output of the 16 CH BPF 3 is input to the pinch extractor 6, and the configuration is configured to trigger the 16 CHA/D converter every pinch period. One method for the pitch extractor 6 is proposed in, for example, Japanese Patent Application Laid-Open No. 162405/1988 entitled "Pitch Frequency Extraction Apparatus", and it may be considered that the pitch frequency is extracted by such a method. A pitch frequency exists in the case of a vowel or a voiced consonant, but in the case of a voiceless consonant, the sound source is noise and the pitch frequency does not exist. In order to sample these unvoiced consonants, the counter timer 7 is used at a fixed period, for example, l Kl (1 m se at the frequency of z).
A pulse is generated every c and inputted to the 16c HA/D converter 4 -f.

前記16CHA/Dコンバータ4は、母音又は有声子音
の場合はピッチ周期毎に、無声子音の場合は一定周期毎
に16CHBPF3の出力をサンプリングし、アナログ
−ディジタル変換することにより入力音声波形のパワー
スペクトルの包絡特性を得ることができる。
The 16CHA/D converter 4 samples the output of the 16CH BPF 3 every pitch period in the case of a vowel or voiced consonant, and every fixed period in the case of a voiceless consonant, and performs analog-to-digital conversion to obtain the power spectrum of the input speech waveform. Enveloping properties can be obtained.

以上のようにして得られたディジタル化された人力音声
波形は、パワースペクトルの正規化を施した後登録音声
波形のそれぞれのデータとの間で2乗距離を計Wする。
The digitized human voice waveform obtained in the above manner is subjected to power spectrum normalization, and then the squared distance W is calculated between it and each data of the registered voice waveform.

この2乗距離の計算は数千回を必要とし、マイクロCP
U8で演算していたのでは実時間処理ができないため、
ハードウェア演碧器15によりハードウェア的に演算を
実施して(・る。入力音声波形と登録音声波形の間で2
乗距離前記認識単音節が順次出力され、単語又は文節と
してまとまつ1こところで前記自動カナ漢字変換装置に
入力され、漢字カナ混り文に変換される。
Calculation of this squared distance requires several thousand times, and the micro CP
Since real-time processing cannot be performed by calculating with U8,
The hardware operator 15 performs calculations on a hardware basis.
The recognized monosyllables are sequentially outputted as a single word or phrase and input into the automatic kana-kanji conversion device at one point, where they are converted into a sentence containing kanji and kana.

ダ このカナ漢字の変換には、「日本電信電話公社電気通信
研究所発行の研究実用化報告第26巻1号(1977年
1月)p353〜p369  オンラインカナ漢字変換
ンステムの試作(木村他)」に示されるような公知の手
法を用いればよい。
For this kana-kanji conversion, please refer to "Research Practical Report Vol. 26, No. 1 (January 1977) published by Nippon Telegraph and Telephone Public Corporation Telecommunications Research Institute, p353-369 Prototype of online kana-kanji conversion system (Kimura et al.)" A known method such as shown in can be used.

第2図に自動カナ漢字変換処理手順の一例を示す。FIG. 2 shows an example of the automatic kana-kanji conversion processing procedure.

第2図の処理手順を簡単に説明すると、文節単位で分か
ち書きされたカナ文が入力されろと、人力文節は最長一
致法により処理される。最長一致法とは、辞書の見出し
語との比較により、文節単位内で最も語長の長い自立語
を検出して、入力文節を自立部と付属部に分離する方法
である。この処理により、分離された付属部が更に分離
できる場合は分離し、次に、分離した自立語との接続あ
るいは付属語間の接続が可能かどうか検定する文法照合
処理を行ない、もし分離が適切ヤあれば次の処理に移り
、もし不適切であれば再度最長一致処理に戻り、次に長
い語長の自立語を検出して同じ処理な行なう。文法照合
処理で適切と判定されれば、入力文節の自立語と付属語
との分離は終了する。
Briefly explaining the processing procedure shown in FIG. 2, if a kana sentence separated into phrases is input, human phrases are processed by the longest match method. The longest match method is a method in which an independent word with the longest word length is detected in a bunsetsu unit by comparison with a dictionary headword, and the input bunsetsu is separated into an independent part and an attached part. Through this process, if the separated adjunct can be further separated, it is separated, and then a grammar matching process is performed to test whether connection with the separated independent word or connection between adjuncts is possible, and if separation is appropriate. If it is inappropriate, it moves to the next process, and if it is inappropriate, it returns to the longest match process again, detects the next independent word with the longest word length, and performs the same process. If the grammar matching process determines that it is appropriate, the separation of the input phrase into independent words and dependent words is completed.

次に、分離された自立語に間音異字語がある場合は、そ
の分離選択のため候補となっている同音異字語の意味情
報を辞書より引き出し、前後の文節間での意味的に一番
つながりの大きいものを選択する意味処理を行なう。又
、この処理だけで候補となっている同音異字語を1つに
絞れない場合は、1.11しく候補になっている同音異
字語の頻度情報を引き出し、一番頻度の高いものを最終
的な自立#riとして文節の出力処理を行なうものであ
る。
Next, if the separated independent words have intersyllabic allographs, the semantic information of the homophones that are candidates for separation and selection is extracted from the dictionary, and the semantic information of the homophones is extracted from the dictionary to find the most semantically Performs semantic processing to select items that are highly connected. In addition, if the candidate homophones cannot be narrowed down to one by this process alone, 1.11 extract the frequency information of the candidate homonyms and select the one with the highest frequency as the final one. It performs output processing of clauses as an independent #ri.

前記処理の中で、最長一致法処理と文法照合処理を行な
(・全て不適合になる場合、文節の先頭に接頭語が存在
している可能性があるため、接頭後処理により文節の接
頭語と思われる部分を取り除き、再び最長一致処理を行
なえばよい。
In the above processing, longest match processing and grammar matching processing are performed (・If all of them are non-conforming, there is a possibility that a prefix exists at the beginning of the clause, so post-prefix processing is performed to check the prefix of the clause. All you have to do is remove the part that seems to be the same and perform the longest match process again.

ここで、具体的入力として「オンセイニョリ」と[チー
ムカラーカラモ」を別にとり、最長一致処理、文法照合
処理、接頭語処理等の処理手順及プ処理結果をそれぞれ
第1表及び第2表に示す。
Here, we take "Onseinori" and "Team Color Karamo" separately as specific inputs, and the processing procedures such as longest match processing, grammar matching processing, prefix processing, etc. and the processing results are shown in Tables 1 and 2, respectively. .

第     1     表 ”″“°゛″”;□−ニ 一一−−−−ナー             −−人力
に封子; 1オン る最長の自1 ヨリ              が最
長私語を検索1 1 する 1  1 1也d(8a’l l       !  <’:’GJ ’這第    
 2     表 以上のように、単音節音声認識装置と自動カナ漢字変換
装置とを接続することにより、音声で入力した単語又は
文節を漢字カナ混り文に変換して出力する音声入力和文
タイプライタな作ることは、原理的には可能であるが、
以下のような重大な欠点がある。
Table 1"""°゛'';8a'l l! <':'GJ'
2 As shown in the table above, by connecting a monosyllabic speech recognition device and an automatic kana-kanji conversion device, a voice input Japanese typewriter that converts words or phrases input by voice into sentences containing kanji and kana and outputs them. Although it is possible in principle to make
It has serious drawbacks as follows.

即ち、日本語におけるカナ文字は、その各々が1つの独
立+−t、’−発声をもつ表音文字である。従って一般
的には、入力したい文又は言葉をカナ文字に変換しその
カナ文字通りに発声すれば入力されがある。この場合、
使用される記号は長音記号「−」である。この記号自体
には独立した発声音は持たず、その直前の文字の発声を
延ばす働きしかない。
That is, the kana characters in Japanese are phonetic characters, each of which has one independent +-t,'- utterance. Therefore, generally speaking, the sentence or words to be input can be converted into kana characters and then uttered literally. in this case,
The symbol used is the long symbol "-". This symbol itself does not have an independent phonation, but only serves to extend the utterance of the character immediately before it.

従来の自動カナ漢字変換装置の場合は、キーボードより
「−」記号を入力して対処していたが、音声入力方式の
場合の対策を考えてみると、まず、この「−」記号性の
音と「−」記号なしの音とを区別できるよう単音節認識
装置を改良することも考えられるが、その場合、「ア」
と「アー」、「イ」と「イー」、・・・・・・以下全て
の認識文字の2倍の認識が必要となるため基準データが
多くなり、が それケ記憶するメモリ容量も増し、コストアップすると
共に認識処理時間も増え、かつ各々の発生音が類似して
いることにより誤認識が多くなり、得策でない。別の方
法としては、「−」記号に対して特別の発生音を割り当
てることも考えられる。
In the case of conventional automatic kana-kanji conversion devices, this was handled by inputting the "-" symbol from the keyboard, but when considering countermeasures for the voice input method, the first thing to do is to input the symbol "-" from the keyboard. It may be possible to improve the monosyllable recognizer so that it can distinguish between sounds without an "-" symbol, but in that case, "a"
and "Ah", "I" and "E", etc. Since it is necessary to recognize twice as many characters as below, the amount of reference data increases, and the memory capacity to store it also increases. This is not a good idea because it increases the cost, increases the recognition processing time, and increases the number of erroneous recognitions due to the similarity of the generated sounds. Another possibility is to assign a special generated sound to the "-" symbol.

例えば「チョウ」という1つの連続音を作り割り当てれ
ば、キーボードからの入力と同一に扱える。
For example, if you create and assign a single continuous sound called ``Chou'', it can be treated in the same way as input from a keyboard.

しかしながらこうした場合、前記「コントロール」ある
いは「チーム」等の入力は[コ、ン、ト、口、チョウ、
ル 」あるいは「チ、チョウ、ム」等のように発声する
必要があるため、文字列と発声との間の異和感が大きく
なり、発声しづらくなり音声入力の特長が薄れるため、
得策でな見・。又もう1つの方法として、「−」記号の
部分の発声を省略して入力することも考えられる。前記
「コントロール」ヤ1チーム」は「コントロル」ヤ「チ
ム」となる。この場合、発声はしづらくないが、入力情
報の一部を省略するのであるから、当然入力情報の減少
による誤りが増す恐れが出てくる。即ち、「カー」は1
カ」、「ナース」は「ナス」、「エース」は「ニス」と
なり、別の言葉との区別がつきに(くなって、これも「
−」記号の問題に対する改善策とは言えない。
However, in such a case, the inputs such as "control" or "team" are
Because it is necessary to pronounce words such as "ru" or "chi, chou, mu," etc., the sense of incongruity between the character string and the utterance increases, making it difficult to utter and diminishing the features of voice input.
It's a good idea. Another method is to omit the utterance of the "-" symbol and enter the input. The above-mentioned ``control'' ya 1 team'' becomes ``control'' ya ``chim.'' In this case, although it is not difficult to utter, since some of the input information is omitted, there is naturally a risk that errors will increase due to the reduction in input information. In other words, "car" is 1
``ka'', ``nurse'' become ``eggplant'', and ``ace'' become ``nis'', making it easy to distinguish them from other words.
−” This cannot be said to be a solution to the problem with the symbol.

不発、明・は、これらの改善策の欠点を補い、音声認識
部の認識音数を増やすことな(、又与えられた文字列に
対しできるだけ自然な発音に近い発声により入力するこ
とを可能とした音声入力用カナ漢字変換方式を提供する
ものである。即ち、入力時の発声においては、文字列に
長音記号「−」がある場合、この「−」の替りに「−」
記号の直前の文字の母音部の文字に置き換えて発声させ
ることとし、自動カナ漢字変換処理に用いる自立語辞書
の見出し語に出現するすべての「−」記号に対して、そ
の記号の直前の文字の母音部の文字に変換しであるが、
その他の事項即ち表記、品詞等は元のままにした自立語
辞書を使用して自動カナ漢字変換処理を行なうものであ
る。したがって、発声においても、又見出し語において
も同一の変換となる。例えば、「コントロニル」は「コ
ントロ穿ル」になり、「チニム」は「チ身ム」となる。
The present invention is to compensate for the shortcomings of these improvement measures, without increasing the number of sounds recognized by the speech recognition unit (and by making it possible to input a given character string with a pronunciation that is as close to natural as possible). This method provides a kana-kanji conversion method for voice input.In other words, when inputting voice, if there is a long sound symbol "-" in the character string, "-" is used instead of this "-".
The vowel part of the character immediately before the symbol will be uttered, and for every "-" symbol that appears in the headword of the independent word dictionary used for automatic kana-kanji conversion processing, the character immediately before that symbol will be uttered. It is converted into the vowel part of the character,
Automatic kana-kanji conversion processing is performed using an independent word dictionary that leaves other matters, such as notation and parts of speech, as they were. Therefore, the conversion is the same for both utterances and headwords. For example, ``contronil'' becomes ``control perle,'' and ``chinim'' becomes ``chimimu.''

この変換発声は長音発声とは異なるが、単音節発声にお
いてはほとんど異和感がなく自然に近い。
This converted utterance is different from long-sound utterance, but in monosyllabic utterance there is almost no sense of discomfort and it is close to natural.

又、辞書の見出し語の変換による見出し語の配列順であ
るが、これは使用する辞書によって異なるが、例えば、
学習研究社の学研国語大辞典の場合、、「−」記号の見
出し語配列の処理としては、[長音は発声に従って、ア
・イ・つ・工・オのいずれかを当てた位置に置(。例バ
ーナー→バアナア」となっている。このような配列の辞
書では、本発明による文字変換においては、配列は不変
となる。
Also, the order in which the headwords are arranged by converting the dictionary headwords varies depending on the dictionary used, but for example,
In the case of Gakken Japanese Dictionary by Gakushu Kenkyusha, the processing for the headword arrangement of the "-" symbol is as follows: [Long sounds are placed in the position where either A, I, Tsu, Engineering, or O is applied according to the pronunciation ( .Example burner → Baanaa''. In a dictionary with such an arrangement, the arrangement remains unchanged in the character conversion according to the present invention.

以下、本発明の一実施例について説明する。An embodiment of the present invention will be described below.

第3図は、一般的自立語辞書の一例を示すものであり、
第4図は本発明に用いる自立語辞書の一例を示す図であ
る。
Figure 3 shows an example of a general independent word dictionary.
FIG. 4 is a diagram showing an example of an independent word dictionary used in the present invention.

自動カナ漢字変換に使用する辞書は、何らかのコード化
されたデータが各種の記憶装置に格納されているが、辞
書の見出し文字としては、容量や簡便さによりJIS−
6220コードが使用され、表記用コードとしては、漢
字を表わすことができるJIS−6226コードを使用
するのが一般的である。
Dictionaries used for automatic kana-kanji conversion have some kind of coded data stored in various storage devices, but the dictionary entry characters are JIS-1 due to their capacity and simplicity.
6220 code is used, and the JIS-6226 code, which can represent Kanji characters, is generally used as the notation code.

なお、その他の情報である品詞や頻度情報等のコードや
フォーマツ′トは、各々のシステムによって異なる。こ
のようにして作成された第3図に示す自立語辞書におい
て、カナ見出し上の長音記号r−Jは、その直前の文字
の母音文字に変換したものが第4図の自立語辞書である
。このリストの中の例では、該当する見出しKは簀印を
付加しであるが、この中で「チ」の後にある「−」記号
はすべて「イ」に変換され、「〕」の後にある「−」記
号は「オ」に、「う」の後にある「−」記号は「ア」に
変換されている。しかし、語の配列はまったく変化して
いない。又本発明が実施された場合、接辞辞書において
も見出し上の「−」記号はすべて変換されるものとする
。例えば、「オール日本」とか「オールトランジスタ」
とかの表現に使う「オール」を接頭語として扱うと便利
である。
Note that the codes and formats of other information such as part of speech and frequency information differ depending on each system. In the independent word dictionary created in this way shown in FIG. 3, the long sound symbol r-J on the kana heading is converted into the vowel character of the character immediately before it, and the independent word dictionary shown in FIG. 4 is obtained. In the example in this list, the relevant heading K is marked with a seal, but all the "-" symbols after "chi" are converted to "i", and the symbols after "]" are converted to "i". The "-" symbol is converted to "o", and the "-" symbol after "u" is converted to "a". However, the word arrangement has not changed at all. Furthermore, when the present invention is implemented, all "-" symbols on headings in the affix dictionary are also converted. For example, "all Japan" or "all transistor"
It is convenient to treat ``all'' as a prefix when used in expressions such as ``all''.

もしこの「オールコを接辞辞書に入れる場合、見出しは
「オオル」に変換される。なお、この場合も自立語辞書
と同様に、カナ見出しとは別に表記部があり、表記部は
JIS−6226コードとする。又、表記部上の1−」
記号はそのまま保存されるものとする。
If this ``oruko'' is included in the affix dictionary, the heading will be converted to ``oru''. Note that in this case as well, there is a notation section in addition to the kana headings, as in the independent word dictionary, and the notation section is in JIS-6226 code. Also, 1- on the notation section
The symbol shall be preserved as is.

このように、本発明が実施された辞書を使用して「チー
ムカラーからも」という文字列を入力した場合の処理手
順、および処理結果を第3表に示す。
Table 3 shows the processing procedure and processing results when the character string "from team color" is input using the dictionary according to the present invention.

第     3     表 この場合、まず[チームカラーからも]に対する発声入
力としては、「チームカラアカラモ」となり、元の文字
列に対してあまり異和感なく発声できる。次に、これを
入力として検定処理が行なわれる。しかし、辞書の見出
しは発声に従って変換してあっても、表記部は元の「−
」記号が保存されているため、検定、分解に誤りがなけ
れば最終出力は所望の「チームカラーからも」となる。
Table 3 In this case, the voice input for [from team color] is ``Team Kara Akaramo'', which can be uttered without feeling too strange to the original character string. Next, a verification process is performed using this as input. However, even if the dictionary heading is converted according to the pronunciation, the notation is the original "-"
” symbol is preserved, so if there are no errors in verification and decomposition, the final output will be the desired “from team color”.

以上の説明から明らかなように、本発明によれば、文字
上では独自の発音をもたない「−」記号に対し、この記
号の直前の文字の母音文字に置き換えるという元の文字
列に対してあまり異和感のない発声入力をしても、自動
カナ漢字変換処理部では、従来のキー人力等によるカナ
漢字変換処理とまった(同一処理手順にて処理すること
が可能となる。
As is clear from the above explanation, according to the present invention, the "-" symbol, which does not have its own pronunciation, is replaced with the vowel character of the character immediately before the symbol. Even if you make a voice input that doesn't feel too strange, the automatic kana-kanji conversion processing section will stop at the conventional kana-kanji conversion process using manual input (it is possible to process using the same processing procedure).

ここで、本発明な実施した場合、従来は互いに区別され
た見出しであったものが見出し上では同一となるものも
ある。例えば、第4図のチイクの見出しに対して「知育
」及び「チーク」の表記が存在することになる。このい
わゆる同音異字が多く出現することは、正しい表記を得
るためには好ましくない現象であるが、例えば、小学館
の新選国語辞典を例にとれば、全体の見出し文字数約7
万に対して、本発明の見出し変換による同音異字の増加
は約加項位しかなく、更にその中には、フーガ・・・・
・・・・・〔語釈〕遁走曲(同音異字語)風雅 チュートン・・・〔語釈〕ゲルマン民族の1つ(同音異
字語)駐屯 など、特別な言葉でどちらかの語を省略しても良いもの
もかなり含まれており、この程度の同音異字語の増加は
実用上はとんど問題ない。
Here, when the present invention is implemented, some headings that were conventionally distinct from each other may become the same on the headings. For example, for the heading ``Chiiku'' in FIG. 4, the notations ``Education'' and ``Cheek'' exist. The appearance of many so-called homonyms is an undesirable phenomenon in order to obtain correct notation, but for example, if we take Shogakukan's Newly Selected Japanese Dictionary as an example, the total number of heading characters is about 7.
Compared to 10,000 homonyms, the number of homonyms due to the heading conversion of the present invention is only increased by about an addition point, and among them, fugue...
...[Interpretation] Fugue (homophone) Teutonic... [Interpretation] One of the Germanic tribes (homophone) You can omit either word in special words such as garrison. This level of increase in homonyms is not a problem in practical terms.

なお、本発明を実施した辞書群を有する自動カナ漢字変
換処理部に音声入力以外を入力する場合、「−」記号の
入力も考えられるが、その場合は入力された「−」記号
の替りにその記号の直前の文字の母音文字に一義的に変
換すれば、何ら支障なく処理される。又、前記「−」記
号の変換が煩雑な場合には、従来の「−」記号が含まれ
たままの見出しの項を残したまま、「−」記号を母音文
字に変換した項を新たにつけ加える方法も考えられる。
In addition, when inputting something other than voice input into the automatic kana-kanji conversion processing unit having a dictionary group implementing the present invention, it is also possible to input a "-" symbol, but in that case, the input "-" symbol will be replaced with the "-" symbol. If the symbol is uniquely converted to the vowel character of the character immediately before it, processing will occur without any problem. In addition, if converting the "-" symbol is complicated, leave the previous heading section containing the "-" symbol and create a new section with the "-" symbol converted to a vowel character. You can also think of ways to add it.

ただし、この方法では項目の追加となるため、メモリの
記憶容量の追加が必要となる。
However, since this method involves adding items, it is necessary to increase the storage capacity of the memory.

いずれにしても−、本発明を実施した自動カナ漢字変換
装置において、前記のごと<「−」記号の入力に対する
変換処理か、あるいは「−」記号の見出しケ保存するこ
とにより、従来のキーボードより入力する文字列のまま
の入力も、音声による入力も混在して同時に処理するこ
とも可能となる。
In any case, in the automatic kana-kanji conversion device implementing the present invention, it is possible to perform the conversion process for the input of the "-" symbol as described above, or by saving the entry of the "-" symbol, compared to the conventional keyboard. It is also possible to process both raw character string input and voice input at the same time.

【図面の簡単な説明】[Brief explanation of drawings]

カナ混り文に変換する自動カナ漢字変換処理手順を示す
図、第3図は一般的な自立語辞書の一例、第4図は本発
明に用いる自立語辞書の一例を示す図である。 1・・・・・・マイクロフォン、 2・・・・・・プリ
アンプ、3・・・・・+6CHBPF。
FIG. 3 is an example of a general independent word dictionary, and FIG. 4 is a diagram showing an example of an independent word dictionary used in the present invention. 1...Microphone, 2...Preamplifier, 3...+6CHBPF.

Claims (1)

【特許請求の範囲】[Claims] 音声により入力されたカナ文字列を漢字カナ混り文に変
換し出力するカナ漢字変換方法において、カナ見出し上
に出現する長音記号r−Jをこの記号の直前の文字の母
音文字に置換した電子装置により構成される入力文字検
定用辞書を備え、当該入力文字検定用辞書のカナ見出し
と音声により入力されたカナ文字列とを比較して入力カ
ナ文字列に対応する表記を出力することを特徴とする音
声入力和文タイプライタにおけるカナ漢字変換方法。
In the kana-kanji conversion method that converts and outputs a kana character string input by voice into a sentence containing kanji and kana, an electronic system that replaces the long sound symbol r-J that appears on the kana heading with the vowel character of the character immediately before this symbol. It is characterized by comprising an input character verification dictionary configured by a device, comparing the kana heading of the input character verification dictionary with a kana character string input by voice, and outputting a notation corresponding to the input kana character string. A method for converting kana to kanji in a voice-input Japanese typewriter.
JP56150584A 1981-09-25 1981-09-25 Converting method of voice input japanese type writer Pending JPS5852738A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56150584A JPS5852738A (en) 1981-09-25 1981-09-25 Converting method of voice input japanese type writer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56150584A JPS5852738A (en) 1981-09-25 1981-09-25 Converting method of voice input japanese type writer

Publications (1)

Publication Number Publication Date
JPS5852738A true JPS5852738A (en) 1983-03-29

Family

ID=15500073

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56150584A Pending JPS5852738A (en) 1981-09-25 1981-09-25 Converting method of voice input japanese type writer

Country Status (1)

Country Link
JP (1) JPS5852738A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58195900A (en) * 1982-05-11 1983-11-15 電子計算機基本技術研究組合 Voice input type japanese language document processor
JPS60196869A (en) * 1984-03-19 1985-10-05 Comput Basic Mach Technol Res Assoc Voice input type japanese document processor

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58195900A (en) * 1982-05-11 1983-11-15 電子計算機基本技術研究組合 Voice input type japanese language document processor
JPS60196869A (en) * 1984-03-19 1985-10-05 Comput Basic Mach Technol Res Assoc Voice input type japanese document processor

Similar Documents

Publication Publication Date Title
US3704345A (en) Conversion of printed text into synthetic speech
TW546631B (en) Disambiguation language model
US5787230A (en) System and method of intelligent Mandarin speech input for Chinese computers
US5752227A (en) Method and arrangement for speech to text conversion
US5220639A (en) Mandarin speech input method for Chinese computers and a mandarin speech recognition machine
JP4791984B2 (en) Apparatus, method and program for processing input voice
JP5014785B2 (en) Phonetic-based speech recognition system and method
US20070088547A1 (en) Phonetic speech-to-text-to-speech system and method
KR20010096490A (en) Spelling speech recognition apparatus and method for mobile communication
US4468756A (en) Method and apparatus for processing languages
Pellegrino et al. Automatic language identification: an alternative approach to phonetic modelling
Alsharhan et al. Evaluating the effect of using different transcription schemes in building a speech recognition system for Arabic
Burileanu Basic research and implementation decisions for a text-to-speech synthesis system in Romanian
Mohanty et al. Speaker identification using SVM during Oriya speech recognition
JPS5852738A (en) Converting method of voice input japanese type writer
JPS634206B2 (en)
KR20020051842A (en) Hybrid keypad/speech recognition technique for oriental characters in adverse environments
JPS5837698A (en) Conversion method for voice input japanese language typewriter
Nga et al. A Survey of Vietnamese Automatic Speech Recognition
Laurent et al. Unsupervised acoustic model training for the Korean language
JPS5875270A (en) Method for voice inputting of japanese typewriter
JPS6312295B2 (en)
Akinwonmi Development of a prosodic read speech syllabic corpus of the Yoruba language
US20220189462A1 (en) Method of training a speech recognition model of an extended language by speech in a source language
Rahate et al. An experimental technique on text normalization and its role in speech synthesis