JPS6037501B2 - voice input typewriter - Google Patents

voice input typewriter

Info

Publication number
JPS6037501B2
JPS6037501B2 JP53049486A JP4948678A JPS6037501B2 JP S6037501 B2 JPS6037501 B2 JP S6037501B2 JP 53049486 A JP53049486 A JP 53049486A JP 4948678 A JP4948678 A JP 4948678A JP S6037501 B2 JPS6037501 B2 JP S6037501B2
Authority
JP
Japan
Prior art keywords
input
typewriter
section
voice
consonant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP53049486A
Other languages
Japanese (ja)
Other versions
JPS54141525A (en
Inventor
博昭 迫江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP53049486A priority Critical patent/JPS6037501B2/en
Publication of JPS54141525A publication Critical patent/JPS54141525A/en
Publication of JPS6037501B2 publication Critical patent/JPS6037501B2/en
Expired legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 本発明は音声により文字情報を入力するための音声入力
タイプラィタの改良に関する。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to an improvement in a voice input typewriter for inputting character information by voice.

文字情報を計算機に入力する作業は情報処理業務の中で
重要な作業となっており、その高能率化は情報処理業務
全体の高能率化のために不可欠であるとされている。
The work of inputting character information into a computer is an important work in information processing work, and improving its efficiency is considered essential for improving the efficiency of the entire information processing work.

特に我国においてはタイプラィ夕の使用が一般化してい
ないために新たな文字データ入力オペレータの養成には
大量の訓練が必要である。このため従来のキーボードー
こ代る扱い易い文字データ入力手段の開発が強く望まれ
ている。このための有力な候補として音声入力タイプラ
ィ夕の開発が試みられた。音声入力タイプラィタとは人
間が発声する音声を電子回路によって分析識別するとい
うパタン認識処理によって文字データ符号に変換する装
置である。しかし、自然音声の認識は極めて困難な問題
であって実用的な音声タイプラィタが近い将釆実現され
る可能性はほとんど無いと言われている。音声パタンの
認識を困難にしている最大の原因は子音の識別がむずか
しい点にある。例えばパ行音、タ行音、力行音等の間に
は詳細な分析によっても有効な弁別的特徴は得られず、
最も識別困難な例と言える。これは子音lpl、ltl
、lklの相互弁別が困難なためである。本発明は認識
困難な子音情報をキーボード等の別手段により入力する
ことによって子音認識の問題を回避し、これによって正
確に動作しかつ安価な文字情報入力手段たる音声入力タ
イプラィタを実現し提供することを目的としている。
Particularly in our country, since the use of typewriters is not common, a large amount of training is required to train new character data entry operators. Therefore, it is strongly desired to develop an easy-to-use character data input means that can replace the conventional keyboard. Attempts were made to develop a voice input typewriter as a promising candidate for this purpose. A voice input typewriter is a device that converts human voice into character data codes through a pattern recognition process in which the voice uttered by a person is analyzed and identified by an electronic circuit. However, recognizing natural speech is an extremely difficult problem, and it is said that there is almost no possibility that a practical speech typewriter will be realized in the near future. The biggest reason why it is difficult to recognize speech patterns is that it is difficult to identify consonants. For example, no effective discriminative features can be obtained between pa, ta, forced, etc., even by detailed analysis.
This can be said to be the most difficult example to identify. This is the consonant lpl, ltl
, lkl are difficult to distinguish from each other. The present invention avoids the problem of consonant recognition by inputting consonant information that is difficult to recognize using another means such as a keyboard, thereby realizing and providing a voice input typewriter that operates accurately and is an inexpensive means for inputting character information. It is an object.

本発明による音声入力タイプラィタは、主として子音情
報を入力するためのキーボード等の手動入力手段と、別
途入力される音声パタンを前記子音情報として指定され
る子音を有する音韻の範囲内で認識処理する機能を有す
る音声認識部とより構成されるものである。
The voice input typewriter according to the present invention mainly includes a manual input means such as a keyboard for inputting consonant information, and a function to recognize and process separately input voice patterns within the range of phonemes having consonants designated as the consonant information. It is composed of a voice recognition section having a.

かくの如き構成によると、子音認識のための複雑な処理
が不要なので全体として小形かつ安価に構成できる。
According to such a configuration, complicated processing for consonant recognition is not required, so that the overall configuration can be made compact and inexpensive.

また子音情報の入力にキーボードを使用するとしても子
音の指定ができれば十分なのでキーの数は少なくてよく
、したがって操作しやすい。以下実施例の原理を実施例
にもとづいて説明する。
Furthermore, even if a keyboard is used to input consonant information, it is sufficient to be able to specify the consonant, so the number of keys may be small, and therefore operation is easy. The principle of the embodiment will be explained below based on the embodiment.

第1図は本発明の一実施例を示す図である。この音声タ
イプラィタの使用者は、例えば“サ”という文字を入力
したい時はキMボード部10‘こよりサ行音であること
を文字“s”が記されたキーにより指定して同時にマイ
クロホン11より“サ”という音声を入力する。キーボ
−ド部10は一例として第2図の如く構成される。すな
わち文字“a”が記されたキーは母音及びそれに類した
音韻を指定する。例えばア、ィ、ウ、ェ、オ、ャ、ュ、
ョ、ワ、及びンがこのキーによって指定される。これら
を母音群と呼ぶ。また、文字“k”が記されたキーでは
力、キ、ク、ケ、コ、キャ、キュ、キョ、なる力行が指
定される。以下同様にg(ガ行音)、s(サ行音)、z
(ザ行音)t(タ行音)、d(ダ行音)、n(ナ行音)
、h(ハ行音)p(パ行音)、b(バ行音)、m(マ行
音)、r(ラ行音)等のキーが備えられている。別に通
常のタイプラィタと同様に句読点“・”“。”、及び“
改行”、“空白”等のキーが、また必要に応じて数字を
指定するキーが備えられてもよい。数字データを入力す
る時はこの“数字’’キーを押して“3”とか“8”と
か発声してマイクロホン11に入力する。キーボード部
11はキーが押されると次のようなコ−ドを子音信号c
として出力する。a→0、k→1、g→2、s→3、z
→4、t→5、d→6、n→7、h→8、p→9、b→
10、m→11、r→12、数字→13、・→14、。
FIG. 1 is a diagram showing an embodiment of the present invention. For example, when the user of this voice typewriter wants to input the character "sa", he/she must specify the letter "sa" from the keyboard section 10' using the key marked with the letter "s", and at the same time input the character "sa" from the microphone 11. Input the voice “sa”. The keyboard section 10 is constructed as shown in FIG. 2, for example. That is, a key marked with the letter "a" specifies a vowel and a phoneme similar to the vowel. For example, A, I, U, E, O, Y, U.
, wa, and n are specified by this key. These are called vowel groups. Further, the keys marked with the letter "k" specify power running such as force, ki, ku, ke, ko, kya, cu, kyo. Similarly, g (ga sound), s (sa sound), z
(za sound) t (ta sound), d (da sound), n (na sound)
, h (C sound), p (P sound), b (B sound), m (M sound), r (R sound), etc. are provided. Apart from the punctuation marks “・”, “.”, and “, just like a normal typewriter,
Keys such as "Line feed" and "Blank" may also be provided, as well as keys for specifying numbers as necessary.When entering numerical data, press this "number" key to enter "3" or "8". Say something like this and input it into the microphone 11. When a key is pressed, the keyboard section 11 outputs the following code as a consonant signal c.
Output as . a → 0, k → 1, g → 2, s → 3, z
→4, t→5, d→6, n→7, h→8, p→9, b→
10, m → 11, r → 12, number → 13, ・ → 14,.

→15、改行→10空白→17デコード回路2川ま前記
キーボード部10より与えられる子音信号cをデコード
し、子音信号cが0〜13の範囲の値の時は選択信号c
o〜c,3の内の対応するもののみを1とし他を0とす
る。
→15, Line break →10 Blank →17 Decoding circuit 2 decodes the consonant signal c given from the keyboard section 10, and when the consonant signal c has a value in the range of 0 to 13, the selection signal c
Only the corresponding one among oc and 3 is set to 1, and the others are set to 0.

例えば“サ”という文字を入力する時はキーボードの“
s”のキーが押されるから子音信号はc=3となる。従
がつて選択信号c3のみが1で他は0となる。音声認識
部は標準パタン記憶部30〜43、マイクロホン11、
分析部50、入力パタンバッファ60、マッチング部7
0、及び判定部80とより構成される。
For example, when entering the character “sa”, press “” on the keyboard.
Since the "s" key is pressed, the consonant signal becomes c=3. Therefore, only the selection signal c3 becomes 1 and the others become 0. The speech recognition section includes standard pattern storage sections 30 to 43, microphone 11,
Analysis section 50, input pattern buffer 60, matching section 7
0, and a determination unit 80.

標準パタン記憶部30,31,・・・・・・43には、
それぞれ、母音群、力行群、・・・・・・、数字(0〜
9)、の音声の標準パタンが記憶されている。
The standard pattern storage units 30, 31,...43 have the following information:
Respectively, vowel group, power group, ..., numbers (0~
9), the standard voice patterns are stored.

例えば参照数字33で示すブロックにはサ行音(サ、シ
、ス、セ、ソ、シャ、シュ、ショ)の標準パタンが記憶
されている。この標準パタンは例えば「アイイーイーイ
ートランザクシヨンVOL.ASSp−8,No.1(
197母王2月)の‘‘ダイナミックプログラミングア
ルゴリズムオプチマイゼイシヨンフオースポークンワー
ドリコグニシヨン”一〔rlEEE Transact
ion VoL.ASSp−26,No.1(1978
年 2 月 )“Dy岬mic Pro鮒ammlng
algori比m optimizat手on for
spok− en wordrecognition
’’」〕と題して発表された論文に記載されているよう
に特徴ベクトルbiの時系列B=b,Q,……,bi…
…bJ {1}として表現されている。標準パ
タン記憶部30〜43には必要なすべての音声の標準パ
タンがそれぞれm式のような形で記憶されている。選択
信号c3が1で他が0となると、参照数字33で示すブ
ロックに記憶されるサ行音の標準パタンのみがバス線b
に順次出力されれる。一方マイクロホン11より入力さ
れた“サ”と云う音声は分析部50によってスベクトラ
ム分析され、かつ一定のフレーム周期で時間標本化され
て各時点でのスベクトラム包絡を表わす特徴ベクトルa
iの時系列A=a,,a2、…・・・ai,……a・
{2}の形式でバッファ601こ入力さ
れる。このパタンAを入力パタンと称する。マッチング
部70では入力パタンバッファ60に記憶される入力パ
タンAと、前記バス線bを経由して標準パタン記憶部3
3より【11式の形式で与えられるサ行音の標準パタン
群のそれぞれとの間の比較操作が行なわれる。
For example, the block indicated by the reference numeral 33 stores standard patterns for the ``s'' sounds (sa, shi, su, se, so, sha, shu, sho). This standard pattern is, for example, “IEE Transaction VOL.ASSp-8, No.1 (
``Dynamic Programming Algorithm Optimization For Spoken Word Recognition'' (February 197) [rlEEE Transact
ion VoL. ASSp-26, No. 1 (1978
February) “Dy Misaki mic Pro carp ammlng
Algori ratio optimization method on for
word recognition
As described in the paper titled ``''], the time series B=b,Q,...,bi... of the feature vector bi.
...expressed as bJ {1}. The standard pattern storage units 30 to 43 each store all necessary standard patterns of speech in a form such as m-type. When the selection signal c3 is 1 and the others are 0, only the standard pattern of the sa-go sound stored in the block indicated by the reference numeral 33 is selected from the bus line b.
are output sequentially. On the other hand, the sound "sa" inputted from the microphone 11 is spectrum-analyzed by the analyzer 50, and time-sampled at a constant frame period to create a feature vector a representing the spectrum envelope at each point in time.
Time series A of i=a,,a2,...ai,...a・
It is input to the buffer 601 in the format {2}. This pattern A is called an input pattern. In the matching section 70, the input pattern A stored in the input pattern buffer 60 is connected to the standard pattern storage section 3 via the bus line b.
From 3 onwards, a comparison operation is performed with each of the standard pattern groups of the sa-gradation sound given in the form of Equation 11.

この比較操作は例えば前記論文に記載されているDPマ
ッチング法によるものとし、その結果時間正規化距離が
信号線dより出力される。判定部80では前記マッチン
グ部70で計算される入力パタンAと各サ行音標準パタ
ンとの間の時間正規化距離を比較してその最小となる標
準パタンを決定する。入力音声が“サ”である場合は当
然サの標準パタンとの時間正規化距離が最小となる。か
くして入力音声はサであると認識される。この認識結果
は信号vとして出力される。認識結果としては母音情報
だけが与えられれば、前記子音信号cとの合成によって
文字情報を完全に合成できるので認識結果信号vは次の
ように定める。すなわち何行音であるにかかわらずァ段
→0、ィ段→1、ウ段→2 ェ段→3、オ段→4、ヤ段→6 ュ段→6、ョ段→7、ワ段→8 ン一9 なるコードを認識結果信号vとする。
This comparison operation is performed, for example, by the DP matching method described in the above-mentioned paper, and as a result, a time-normalized distance is output from the signal line d. The determining section 80 compares the time-normalized distances between the input pattern A calculated by the matching section 70 and each of the standard patterns of the sa-gradation sound, and determines the minimum standard pattern. When the input voice is "sa", the time normalized distance from the standard pattern of "sa" is naturally the minimum. In this way, the input speech is recognized as sa. This recognition result is output as a signal v. If only vowel information is given as a recognition result, character information can be completely synthesized by combining it with the consonant signal c, so the recognition result signal v is determined as follows. In other words, regardless of the number of rows, A step → 0, A step → 1, U step → 2, E step → 3, O step → 4, Y step → 6, U step → 6, Yo step → 7, Wa step → Let the code 8-9 be the recognition result signal v.

また数字の場合には0〜9のそれぞれに対して0〜9な
るコードをそのまま認識結果信‐号vとして出力する。
本字コード合成部90は前記キーボード部10より与え
られる子音信号cと、前記判定部80より与えられる認
識結果信号vを用いて本字コードを合成する。第3図は
以上説明した本字コード合成部を議出し専用メモリーを
用いて構成した例である。
In the case of numbers, codes 0 to 9 are output as they are as recognition result signals v for each of 0 to 9.
The main character code synthesis section 90 synthesizes the main character code using the consonant signal c given from the keyboard section 10 and the recognition result signal v given from the determination section 80. FIG. 3 shows an example in which the above-described main character code synthesis section is constructed using a dedicated memory.

子音信号cと認識結果信号vによって(c,v)なる2
次元番地指定することとし、例えば(7,3)番地には
ナ行(c=7)、ェ段(v=3)の文字すなわち“ネ”
の文字コードを記憶させておく。またc=13の番地(
13,0)〜(13,9)には数字“0”〜“9”の本
字コードを記憶させておく。c=14,15,16,1
7なる番地にはvに関係なく“・”、“。”、“改行”
、“空白”のコ−ドをそれぞれプログラムしておく。か
くすると子音信号cと認識結果信号vによって指定され
る文字のコードが読み出され出力信号rとして出力ごれ
る。この出力信号はタイプラィタ印字機構、紙テープパ
ンチャー、あるいはコンピュータ等に必要に応じて接続
できる。以上本発明の原理を実施例をもとに説明したが
これらの記載は本発明の範囲を限定するものではない。
2 becomes (c, v) by the consonant signal c and the recognition result signal v
For example, at address (7, 3), the character “N” (c=7) and vert (v=3) is specified.
Memorize the character code. Also, address c=13 (
13,0) to (13,9) are stored with real character codes of numbers "0" to "9". c=14,15,16,1
Address number 7 has “・”, “.”, and “line feed” regardless of v.
, and “blank” codes are programmed. In this way, the code of the character specified by the consonant signal c and the recognition result signal v is read out and output as an output signal r. This output signal can be connected to a typewriter printing mechanism, paper tape puncher, computer, etc. as desired. Although the principle of the present invention has been explained above based on examples, these descriptions do not limit the scope of the present invention.

子音情報入力手段としてはキーボードの他にライトベン
等を使用してもよい。またキーボードを使用する場合に
はキーの配置は第2図に限定されるものではない。音声
認識部も具体的にはマイクロコン等によって構成されて
よく、また認識原理も上記実施例と異なっていてもよい
As the consonant information input means, a keyboard or the like may be used. Furthermore, when using a keyboard, the key arrangement is not limited to that shown in FIG. Specifically, the voice recognition section may also be constituted by a microcontroller or the like, and the recognition principle may also be different from that of the above embodiment.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の一実施例を示す図である。 10はキーボード部、11はマイクロホン、20はデコ
ード回路、30〜43は標準パタン記憶部、5川ま分析
部、60は入力パタンバッファ、70はマッチング部、
80は判定部、90は文字コード合成部である。 第2図はキーボード部の一構成例を示す図である。 第3図は文字コード合成部の一構成例を示す図である。
91は読み出し専用メモリーである。 弟’図弟2図 多3図
FIG. 1 is a diagram showing an embodiment of the present invention. 10 is a keyboard section, 11 is a microphone, 20 is a decoding circuit, 30 to 43 are standard pattern storage sections, 5 river analysis sections, 60 is an input pattern buffer, 70 is a matching section,
80 is a determination section, and 90 is a character code synthesis section. FIG. 2 is a diagram showing an example of the configuration of the keyboard section. FIG. 3 is a diagram showing an example of the configuration of the character code synthesis section.
91 is a read-only memory. Younger brother's younger brother 2 drawings 3 drawings

Claims (1)

【特許請求の範囲】[Claims] 1 音声入力タイプライタにおいて、少なくとも子音情
報を入力するための手動入力手段と、入力されたパタン
を前記子音情報で指定される子音を有する音韻の範囲内
で認識処理する音声認識部とを含み構成されることを特
徴とする音声入力タイプライタ。
1. A voice input typewriter, comprising at least a manual input means for inputting consonant information, and a voice recognition unit that recognizes and processes the input pattern within the range of phonemes having consonants specified by the consonant information. A voice input typewriter characterized by:
JP53049486A 1978-04-25 1978-04-25 voice input typewriter Expired JPS6037501B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP53049486A JPS6037501B2 (en) 1978-04-25 1978-04-25 voice input typewriter

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP53049486A JPS6037501B2 (en) 1978-04-25 1978-04-25 voice input typewriter

Publications (2)

Publication Number Publication Date
JPS54141525A JPS54141525A (en) 1979-11-02
JPS6037501B2 true JPS6037501B2 (en) 1985-08-27

Family

ID=12832479

Family Applications (1)

Application Number Title Priority Date Filing Date
JP53049486A Expired JPS6037501B2 (en) 1978-04-25 1978-04-25 voice input typewriter

Country Status (1)

Country Link
JP (1) JPS6037501B2 (en)

Also Published As

Publication number Publication date
JPS54141525A (en) 1979-11-02

Similar Documents

Publication Publication Date Title
JP2815579B2 (en) Word candidate reduction device in speech recognition
JPS62235998A (en) Syllable identification system
JPH11119791A (en) System and method for voice feeling recognition
US4910782A (en) Speaker verification system
JPS6037501B2 (en) voice input typewriter
Chen et al. A first study on neural net based generation of prosodic and spectral information for Mandarin text-to-speech
JPS6037500B2 (en) voice typewriter
JP3378547B2 (en) Voice recognition method and apparatus
JP3277522B2 (en) Voice recognition method
JP3240691B2 (en) Voice recognition method
JPH0632019B2 (en) How to create voice code
JPH0210957B2 (en)
JP2008249761A (en) Statistical language model generation device and method, and voice recognition device using the same
JP2862306B2 (en) Voice recognition device
JP3009709B2 (en) Japanese speech recognition method
JP2660998B2 (en) Japanese language processor
JPH0612091A (en) Japanese speech recognizing method
JPS5958493A (en) Recognition system
JPS6211732B2 (en)
JPH0731508B2 (en) Speech recognition response device
KR0175247B1 (en) Text conversion method for speech synthesis
JPS5837698A (en) Conversion method for voice input japanese language typewriter
JPS60158496A (en) Voice recognition equipment
JPH06289894A (en) Japanese speech recognizing method
JPS58123596A (en) Voice recognition system jointly using auxiliary information