JPS636355B2 - - Google Patents

Info

Publication number
JPS636355B2
JPS636355B2 JP55029803A JP2980380A JPS636355B2 JP S636355 B2 JPS636355 B2 JP S636355B2 JP 55029803 A JP55029803 A JP 55029803A JP 2980380 A JP2980380 A JP 2980380A JP S636355 B2 JPS636355 B2 JP S636355B2
Authority
JP
Japan
Prior art keywords
phoneme
kanji
code
closing
storage device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP55029803A
Other languages
Japanese (ja)
Other versions
JPS56126160A (en
Inventor
Iwao Yamabe
Akira Toda
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dai Nippon Printing Co Ltd
Original Assignee
Dai Nippon Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dai Nippon Printing Co Ltd filed Critical Dai Nippon Printing Co Ltd
Priority to JP2980380A priority Critical patent/JPS56126160A/en
Publication of JPS56126160A publication Critical patent/JPS56126160A/en
Publication of JPS636355B2 publication Critical patent/JPS636355B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 この発明は、音声を漢字コードに変換して電算
写植システムに入力するための漢字入力装置に関
する。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to a kanji input device for converting speech into kanji codes and inputting them into a computer phototypesetting system.

従来、コンピユータによる漢字処理を行なうに
際し、漢字データの入力は漢字キーボードや漢字
タブレツトを用いてオペレータが手や指で操作し
ている。このため、漢字データの入力に多大の労
力を要すると共に技術的な習熟を必要とし、肉体
的な疲労を伴うといつた欠点がある。よつて、こ
の発明の目的はこのような欠点のない印刷用漢字
入力装置を提供することにある。
Conventionally, when processing kanji using a computer, an operator inputs kanji data using a kanji keyboard or a kanji tablet using his or her hands or fingers. Therefore, inputting kanji data requires a great deal of effort, requires technical skill, and is physically tiring. Therefore, an object of the present invention is to provide a kanji input device for printing that does not have these drawbacks.

以下にこの発明を説明する。 This invention will be explained below.

この発明は音声を漢字コードに変換して電算写
植システムに入力するための印刷用漢字入力装置
に関し、第1図に示すように、マイク1から入力
される音声の特徴パラメータCPを抽出するパラ
メータ抽出装置10と、所定音素の音素パラメー
タを音素コードと共に記憶している。音素データ
記憶装置20と、パラメータ抽出装置10からの
特徴パラメータCPと音素データ記憶装置20か
らの音素パラメータSPとを比較し、所定類似度
以上でかつ最も類似度の高い音素パラメータに対
応する音素コードSCを出力する音声判定装置3
0と、話者100の唇101の開閉を監視する監
視装置200と、音声判定装置30から判別し難
い音素コードSCが出力された時に、唇開閉監視
装置200からの開閉信号NSによつて正しい音
素コードを変換用音素コードTSCとして出力す
るゲート装置40と、種々の見出語に対応する記
述語コードを国語辞書として記憶している国語辞
書記憶装置50と、ゲート装置40から出力され
る変換用音素コードTSCと国語辞書記憶装置5
0の見出語とを比較し、一致する当該見出語の記
述語データDWを呼出すと共にフオントメモリ2
からのフオント情報FIに従つて表示装置3に出
力する仮名漢字変換装置60と、表示装置3に表
示された同音異義語又は同音異種の語の1つを選
択指定すると共に、フアンクシヨン、約もの及び
該当語がない場合の所望構成文字を入力するため
の選択指定装置70と、この選択指定装置の選択
指定に従つて仮名漢字変換装置60から出力され
る漢字コードCHを記憶し、割付情報と共に電算
写植システム4に伝送するための漢字コード記憶
装置80とを設けたものである。ここにおいて、
パラメータ抽出装置10は第2図に示すように、
サンプリング信号SMに従つてマイク1からの音
声信号ASを所定間隔(たとえば10ms)毎にサ
ンプリングするサンプリング回路11と、このサ
ンプリング回路11でサンプリングされたサンプ
リングデータSDを8チヤンネルのバンドパスフ
イルタ12F1〜12F8で波するフイルタ1
2と、このフイルタ12(12F1〜12F8)
の各出力を特徴パラメータCPとしての音声量子
信号(CH1S〜CH8S;各2ビツト)に量子
化する量子化回路13とで構全されている。な
お、フイルタ12を構成するバンドパスフイルタ
12F1〜12F8の各通過バンド幅は第3図の
通りであり、音声周波数200〜5000Hzを対数的に
等分割するようになつている。
The present invention relates to a printing kanji input device for converting speech into kanji codes and inputting them into a computerized phototypesetting system.As shown in FIG. The device 10 stores phoneme parameters of a predetermined phoneme along with a phoneme code. The phoneme data storage device 20 compares the feature parameter CP from the parameter extraction device 10 with the phoneme parameter SP from the phoneme data storage device 20, and generates a phoneme code corresponding to the phoneme parameter having the highest similarity and having a predetermined degree of similarity or higher. Audio determination device 3 that outputs SC
0, the monitoring device 200 that monitors the opening and closing of the lips 101 of the speaker 100, and the speech determination device 30 output a phoneme code SC that is difficult to distinguish, and the opening/closing signal NS from the lip opening/closing monitoring device 200 determines that the phoneme code is correct. A gate device 40 that outputs a phoneme code as a conversion phoneme code TSC, a Japanese language dictionary storage device 50 that stores descriptive word codes corresponding to various headwords as a Japanese language dictionary, and a conversion output from the gate device 40. Phoneme code TSC and Japanese dictionary storage device 5
0 is compared with the entry word, and the descriptive word data DW of the matching entry word is called and the font memory 2 is
The kana-kanji conversion device 60 outputs to the display device 3 according to the font information FI from A selection designation device 70 for inputting desired constituent characters when a corresponding word does not exist, and a kanji code CH output from the kana-kanji conversion device 60 according to the selection designation of this selection designation device are stored and computerized together with the allocation information. A kanji code storage device 80 for transmission to the phototypesetting system 4 is provided. put it here,
As shown in FIG. 2, the parameter extraction device 10
A sampling circuit 11 samples the audio signal AS from the microphone 1 at predetermined intervals (for example, 10 ms) according to the sampling signal SM, and the sampling data SD sampled by the sampling circuit 11 is passed through eight channels of bandpass filters 12F1 to 12F8. Filter 1 that waves with
2 and this filter 12 (12F1 to 12F8)
The quantization circuit 13 quantizes each output into audio quantum signals (CH1S to CH8S; 2 bits each) as characteristic parameters CP. The passband widths of the bandpass filters 12F1 to 12F8 constituting the filter 12 are as shown in FIG. 3, and are designed to equally divide the audio frequency of 200 to 5000 Hz logarithmically.

また、唇開閉監視装置200は話者100の唇
101近辺を映し出すためのTVカメラ201
と、このTVカメラ201からの映像信号をデイ
ジタル信号に変換するAD変換器202と、この
AD変換器202からのデイジタル信号を1フレ
ーム毎に記憶するフレームメモリ203と、この
記憶情報から唇101の開閉を判断する開閉判断
回路204とで構成されている。
The lip opening/closing monitoring device 200 also includes a TV camera 201 for displaying the vicinity of the lips 101 of the speaker 100.
, an AD converter 202 that converts the video signal from this TV camera 201 into a digital signal, and this
It is comprised of a frame memory 203 that stores digital signals from the AD converter 202 frame by frame, and an open/close determination circuit 204 that determines whether the lips 101 are open or closed based on this stored information.

なお、音素データ記憶装置20には第4図に示
すように、5種(A〜O)の母音の音素パラメー
タ(チヤンネルCH1〜CH8)と15種(B〜Z)
の子音の音素パラメータ(チヤンネルCH1〜
CH8)とが、それぞれJISコードによる16進数
の4桁で表わされる音素コードと共に記憶されて
いる。また、国語辞書記憶装置50は第5図に示
すようにアイウエオ順に配列された見出語と、こ
れに対応する平仮名データ、片仮名データ、漢字
データ等を示す記述語データ(JISコードによる
16進数の4桁)とが記憶されており、この国語辞
書記憶装置50は日常使用する国語辞典ないし国
語辞書としての機能を有するものである。
As shown in FIG. 4, the phoneme data storage device 20 stores 5 types (A~O) of vowel phoneme parameters (channels CH1~CH8) and 15 types (B~Z) of vowel phoneme parameters.
Consonant phoneme parameters (channel CH1~
CH8) are stored together with phoneme codes each expressed as a four-digit hexadecimal number according to JIS code. The Japanese language dictionary storage device 50 also stores entry words arranged in alphabetical order as shown in FIG.
This Japanese language dictionary storage device 50 has a function as a Japanese language dictionary or a Japanese language dictionary for daily use.

このような構成において、音声入力者(音声を
漢字コードCHAに変換して電算写植システム4
に入力するオペレータ等)はTVカメラ201の
前に立つと共に、マイク1の前で所定の文章等を
いわゆるわ〓か〓ち〓読みで読むと、マイク1か
らの音声信号ASがパラメータ抽出装置10内の
サンプリング回路11に入力されてサンプリング
される。すなわち、文章が「桜は、花です。」の
場合には、「SAKURA HA TEN HANA
DESU MARU」と読む。ここに、音声信号AS
はたとえば「E」(え)の場合、第6図に示すよ
うになり、これがサンプリング回路11に入力さ
れてサンプリング信号SMに従つて10ms毎にサン
プリングされ、そのサンプリングデータSDがフ
イルタ12の8チヤンネルのバンドパスフイルタ
12F1〜12F8にそれぞれ入力される。しか
して、これらバンドパスフイルタ12F1〜12
F8はそれぞれ第3図に示すバンド幅毎にサンプ
リングデータSDを通過させ、その各通過データ
を8チヤンネルの量子化回路13Q1〜13Q8
に入力し、各バンド幅における振幅値に対応して
それぞれ特徴パラメータCPとしての4段陥(00
〜11)2ビツトの音声量子信号CH1S〜CH8
Sに変換する。ここにおいて、かかる各2ビツト
の8チヤンネル音声量子信号CH1S〜CH8S
で成る特徴パラメータCPはたとえば第7図に示
すように、サンプリング時間SAMP1,SAMP
2,……に従つて出力され、これが音声判定装置
30に入力される。しかして、音声判定装置30
には漢字入力装置を使用する作業者等の音素パラ
メータが記憶されており、たとえば第4図に示す
ように母音(A〜O)及び子音(B〜Z)に対応
する音素パラメータ、音素コードがその作業者用
として記憶されている。そして、この記憶された
音素パラメータCH1〜CH8とパラメータ抽出
装置10からの特徴パラメータCP(音声量子信号
CH1S〜CH8S)とを各サンプリング毎に比
較し、その類似度を判定する。この場合、各チヤ
ンネルのデータについて4段階の内の±1の誤差
範囲は両者が一致するとみなしてその同一となる
チヤンネル数を計数し、その計数値がたとえば
「6」(8チヤンネルのうちの6チヤンネルが一
致)の時にその音素パラメータに対応する音素コ
ードを出力する。すなわち、たとえば音素パラメ
ータQがチヤンネル1から「00」、「10」、「11」、
「01」、「00」、「10」、「10」、「01」、「00」の場
合に、
特徴パラメータCPがチヤンネル1から「01」、
「10」、「11」、「10」、「00」、「10」、「01」、「
00」と
なればチヤンネル1及び4が±1の誤差であり他
は全て一致している(この時の計数値は「8」)
ので、上記音素パラメータQに対応する音素コー
ドを出力することになる。また、上記音素パラメ
ータQに対して特徴パラメータCPがチヤンネル
1から「10」、「01」、「11」、「11」、「11」、「00
」、
「01」、「11」の場合には一致するチヤンネル数が
「2」であるので、音素コードは出力されない。
このような比較動作を各音素パラメータについて
行ない、そのうちで最も一致数の高い音素パラメ
ータに対応する音素コードを出力する。
In such a configuration, a voice inputter (who converts the voice into a kanji code CHA and inputs it into the computer phototypesetting system 4)
When an operator (such as an operator inputting data into a computer) stands in front of the TV camera 201 and reads a predetermined sentence in front of the microphone 1, the audio signal AS from the microphone 1 is transmitted to the parameter extraction device 10. The signal is input to the sampling circuit 11 in the internal circuit and sampled. In other words, if the sentence is ``Cherry blossoms are flowers,'' it would be ``SAKURA HA TEN HANA.''
DESU MARU”. Here, the audio signal AS
For example, in the case of "E" (E), it becomes as shown in FIG. are respectively input to bandpass filters 12F1 to 12F8. Therefore, these band pass filters 12F1 to 12
F8 passes the sampling data SD for each band width shown in FIG.
, and a four-stage defect (00
~11) 2-bit audio quantum signal CH1S~CH8
Convert to S. Here, each of the 2-bit 8-channel audio quantum signals CH1S to CH8S
For example, as shown in FIG. 7, the feature parameter CP consisting of sampling times SAMP1, SAMP
2, . . . and input into the speech determination device 30. However, the voice determination device 30
The phoneme parameters of the worker who uses the kanji input device are stored, and for example, as shown in Fig. 4, the phoneme parameters and phoneme codes corresponding to vowels (A to O) and consonants (B to Z) are stored. It is stored for use by that worker. Then, the stored phoneme parameters CH1 to CH8 and the feature parameter CP (speech quantum signal
CH1S to CH8S) are compared for each sampling to determine the degree of similarity. In this case, the error range of ±1 out of 4 levels for each channel's data is considered to be the same, and the number of channels that are the same is counted, and the counted value is, for example, "6" (6 out of 8 channels). When the channels match), the phoneme code corresponding to that phoneme parameter is output. That is, for example, if the phoneme parameter Q is "00", "10", "11" from channel 1,
In the case of "01", "00", "10", "10", "01", "00",
Feature parameter CP is "01" from channel 1,
"10", "11", "10", "00", "10", "01", "
00", channels 1 and 4 have an error of ±1, and everything else matches (the count value at this time is "8")
Therefore, a phoneme code corresponding to the above phoneme parameter Q is output. Also, for the above phoneme parameter Q, the feature parameter CP is from channel 1 to "10", "01", "11", "11", "11", "00".
”,
In the case of "01" and "11", the number of matching channels is "2", so no phoneme code is output.
Such a comparison operation is performed for each phoneme parameter, and a phoneme code corresponding to the phoneme parameter with the highest number of matches among them is output.

そして、かかる音素コードが所定時間(たとえ
ば30ms)だけ継続した時、すなわちサンプリン
グ時間SAM1,SAM2,……について3回以上
同一の音素コードが続いた時に限り当該音素コー
ドを判別した音素コードSCとしてまとめて出力
する。したがつて、特徴パラメータCPと音素パ
ラメータSPとの比較から、たとえば第8図Aの
如き比較結果が出た場合、その出力すべき音素コ
ードSCは同図Bの如き音素コード列となり、3
回以上続いた場合に限り同図Cのように1まとめ
にした形態で出力する。このようにして出力され
た音素コードSCはゲート装置40に入力される。
Then, only when such a phoneme code continues for a predetermined time (for example, 30ms), that is, when the same phoneme code continues three or more times for sampling times SAM1, SAM2, ..., the phoneme code is summarized as a discriminated phoneme code SC. and output it. Therefore, if a comparison result as shown in FIG. 8A is obtained from the comparison between the feature parameter CP and the phoneme parameter SP, the phoneme code SC to be outputted will be a phoneme code string as shown in FIG.
Only when it continues more than once, it is output in a form as shown in C of the same figure. The phoneme code SC output in this manner is input to the gate device 40.

一方、オペレータ等の音声入力時、その唇10
1の動きはTVカメラ201に映し出され、その
開閉の状態を監視するが、その動作を第9図のフ
ローチヤートを参照して説明する。
On the other hand, when an operator or the like inputs voice, the lips 10
1 is projected onto the TV camera 201, and its opening/closing status is monitored.The operation will be explained with reference to the flowchart of FIG.

先ず、TVカメラ201の画面にオペレータ等
の話者100の唇101が映し出されるように、
TVカメラ201がセツトされる。しかして、画
面の映像はAD変換器202でデイジタル信号に
変換され、そのデイジタル映像信号や1フレーム
毎にフレームメモリ203に記憶される。そし
て、フレームメモリ203に記憶された情報を開
閉判断回路204が読出して処理し、唇101の
開閉を判断すると共に、その対応を開閉信号NS
として出力する。また、マイク1からの音声処理
においては鼻音の「M」、「N」の区別及び無声破
裂音「P」、「T」の区別についての特徴パラメー
タを抽出し難く、その判別が困難である。しかし
て、鼻音「M」及び破裂音「P」は唇101が閉
じている時に発せられ、鼻音「N」及び破裂音
「T」は唇101が開いている時に発せられるこ
とが分つているので、この「M」、「N」音の判別
を唇開閉監視装置200からの開閉信号NSによ
つて行なう。すなわちゲート装置40は、「M」、
「N」、「P」、「T」音以外の音素については前述
のような音声判定装置30による出力動作を行な
い、鼻音の「M」、「N」音又は破裂音「P」、
「T」音が検知された時にのみ唇開閉監視装置2
00からの開閉信号NSを参照し、正しい音素を
変換用音素コードTSCとして出力する。
First, the lips 101 of the speaker 100 such as an operator are displayed on the screen of the TV camera 201.
TV camera 201 is set. The image on the screen is converted into a digital signal by the AD converter 202, and the digital image signal and each frame are stored in the frame memory 203. Then, the open/close determination circuit 204 reads out and processes the information stored in the frame memory 203, determines whether the lips 101 are open or closed, and receives the corresponding open/close signal NS.
Output as . Furthermore, in processing the sound from the microphone 1, it is difficult to extract characteristic parameters for distinguishing between the nasal sounds "M" and "N" and the voiceless plosive sounds "P" and "T", making it difficult to distinguish between them. Therefore, it is known that the nasal sound "M" and the plosive sound "P" are produced when the lips 101 are closed, and the nasal sound "N" and the plosive sound "T" are produced when the lips 101 are open. , the "M" and "N" sounds are discriminated based on the opening/closing signal NS from the lip opening/closing monitoring device 200. That is, the gate device 40 is "M",
For phonemes other than the "N", "P", and "T" sounds, the output operation is performed by the speech determination device 30 as described above, and the nasal "M", "N" sounds or the plosive "P",
Lip opening/closing monitoring device 2 only when “T” sound is detected
Referring to the opening/closing signal NS from 00, the correct phoneme is output as the conversion phoneme code TSC.

このようにして得られたゲート装置40からの
変換用音素コードTSCは仮名漢字変換装置60
に入力される。たとえば「桜は、花です。」とい
う文章を入力した場合には、その変換用音素コー
ドTSCの内容は「SAKURA HA TEN HANA
DESU MARU」となり、これら各音素を16進4
桁のJISコードで表わしたデータとなる。かくし
て仮名漢字変換装置60は入力される変換用音素
コードTSCを順次国語辞書記憶装置50に伝送
し、その音索列に該当する見出語があるか否かを
チエツクし、ある場合にはその都度見出語に対応
する記述語データDWを呼出して来る。これと同
時にその記述語データDWをフオントメモモリ2
に送り、これに相当するフオント情報FIを呼出
して、このフオント情報FIに従つて上記記述語
データDWの全てを表示装置3に表示する。この
場合、記述語データDWに同音異義(たとえば第
5図の「橋」、「端」、「箸」)又は同音異種(たと
えば第5図の「さくら」、「サクラ」、「桜」)の語
がない時には、その記述語データDWをそのまま
漢字コードCHとして漢字コード記憶装置80に
出力する。しかして、表示装置3には当該見出語
に対応する記述語データDWの全て、たとえば見
出語「SAKURA」についてはその記述語データ
DWである「さくら(2435、242F、2469)」、「サ
クラ(2535、252F、2569)」、「桜(6115)」がそ
の整理番号1〜3と共に表示されるので、オペレ
ータはこの中から所望の語を選択指定装置70に
よつて該当番号を指定することによつて選択す
る。かくして、選択指定装置70で所望の語を選
択指定すると、その選択された語のみが表示装置
3に再表示されると共に、その漢字コードCHが
出力されて漢字コード記憶装置80に記憶され
る。このような選択指定装置70による選択指定
動作は入力される変換用音素コードTSCに従つ
て順次行なわれ、選択指定された漢字コードCH
が漢字コード記憶装置80に記憶される。なお、
選択指定装置70は記述語データDWの選択指定
のほかに、クワタ(1字分のスペース)、復帰改
行(強制的に次行の行頭に折り返す)、ルビ(ふ
り仮名)、傍線(字に罫線や傍点をふる)、改段
(次段に移る)、改頁(次頁に移る)等のフアンク
シヨン指令を行なうと共に、記号(たとえば
「、」、(、)、;)や絵(たとえば■、〓、〓、〓)
の約ものについての指定も行なう。また、国語辞
書記憶装置50に登録された見出語がない場合
や、登録してあつても読み方が異なつている場合
等にも選択指定装置70によつて所望の語を入力
指定することになる。
The conversion phoneme code TSC from the gate device 40 obtained in this way is transferred to the kana-kanji conversion device 60.
is input. For example, if you input the sentence "Cherry blossoms are flowers," the conversion phoneme code TSC would be "SAKURA HA TEN HANA."
DESU MARU” and convert each of these phonemes into hexadecimal 4
The data is expressed in digit JIS code. In this way, the kana-kanji conversion device 60 sequentially transmits the input conversion phoneme codes TSC to the Japanese language dictionary storage device 50, checks whether or not there is an entry word that corresponds to the phoneme string, and if so, The descriptive word data DW corresponding to the headword is called each time. At the same time, the descriptor data DW is transferred to the font memory 2.
, the corresponding font information FI is called, and all of the descriptor word data DW is displayed on the display device 3 in accordance with this font information FI. In this case, the descriptive word data DW contains homophones (for example, "hashi", "edge", and "chopsticks" in Figure 5) or homophones (for example, "sakura", "sakura", and "cherry blossom" in Figure 5). When there is no word, the descriptor word data DW is directly output to the kanji code storage device 80 as the kanji code CH. Therefore, all of the descriptor data DW corresponding to the entry word, for example, the descriptor data DW for the entry word "SAKURA" are displayed on the display device 3.
The DWs “Sakura (2435, 242F, 2469),” “Sakura (2535, 252F, 2569),” and “Sakura (6115)” are displayed together with their serial numbers 1 to 3, so the operator can choose from among them. The word is selected by specifying the corresponding number using the selection specifying device 70. Thus, when a desired word is selected and specified by the selection and specification device 70, only the selected word is re-displayed on the display device 3, and its Kanji code CH is output and stored in the Kanji code storage device 80. Such a selection designation operation by the selection designation device 70 is performed sequentially according to the input conversion phoneme code TSC, and the selected kanji code CH
is stored in the kanji code storage device 80. In addition,
In addition to selecting and specifying the descriptor data DW, the selection specifying device 70 also selects and specifies quarters (a space for one character), carriage return (forcibly wraps to the beginning of the next line), ruby (furikana), and sidelines (ruled lines and Function commands such as line break (move to the next column), page break (move to the next page), etc., as well as symbols (for example, ",", (, ), ;) and pictures (for example, ■, 〓 ,〓,〓)
We also specify the terms of . Furthermore, even if there is no entry word registered in the Japanese dictionary storage device 50, or if the entry word is registered but has different pronunciations, the selection and designation device 70 can be used to input and designate the desired word. Become.

このようにして出力される仮名漢字変換装置6
0からの漢字コードCHは一旦漢字コード記憶装
置80に記憶され、この記憶データが電算写植シ
ステム4の漢字コードCHAとして出力される。
この場合、電算写植システム4には見出の位置及
び大きさ、1頁分の段や欄の構成、1行の字数、
文字の大きさや種類等の割付を指定する割付情報
LYも同時に入力されるようになつている。
Kana-kanji conversion device 6 output in this way
The kanji code CH starting from 0 is temporarily stored in the kanji code storage device 80, and this stored data is output as the kanji code CHA of the computer phototypesetting system 4.
In this case, the computer phototypesetting system 4 includes the position and size of headings, the structure of columns and columns for one page, the number of characters in one line,
Layout information that specifies the layout of font size, type, etc.
LY is also entered at the same time.

以上のようにこの発明によれば、音声認識をマ
イクからの音声信号による特徴パラメータで行な
うと共に、話者の唇開閉監視装置からの開閉信号
によつても行なつているので、極めて正確な音声
−漢字コード変換を実現することができる。
As described above, according to the present invention, voice recognition is performed using the characteristic parameters of the voice signal from the microphone, and is also performed using the opening/closing signals from the speaker's lip opening/closing monitoring device, so that extremely accurate voice can be obtained. - Kanji code conversion can be realized.

以上の説明では文章をいわゆるわ〓か〓ち〓読
みで入力する例について述べているが、文章を単
音節で発声して別途選択指定装置70でわ〓か〓
ち〓記号(わ〓か〓ち〓読みの空白部に相当する
もの)を入力するようにしても良い。また上述の
実施例では音声の特徴パラメータを8チヤンネル
のバンドパスフイルタ等で得ているが、これは16
チヤンネルが20チヤンネルでも可能であり、音声
量子信号の各チヤンネルビツト数も任意(たとえ
ば8ビツト)にすることもできる。
The above explanation describes an example in which sentences are input in the so-called wakachi reading.
It is also possible to input a chi symbol (corresponding to the blank space in the waka chi reading). In addition, in the above embodiment, the voice characteristic parameters are obtained using an 8-channel bandpass filter, etc., but this is 16 channels.
It is possible to have 20 channels, and the number of bits in each channel of the audio quantum signal can also be arbitrary (for example, 8 bits).

【図面の簡単な説明】[Brief explanation of the drawing]

第1図はこの発明の一実施例を示すブロツク構
成図、第2図はパラメータ抽出装置の構成例を示
すブロツク図、第3図はこの発明に用いるフイル
タ(8チヤンネル)のバンド幅の例を示す図、第
4図は音素データ記憶装置に記憶されているデー
タの様子を示す図、第5図は国語辞書記憶装置の
記憶状態の一例を示す図、第6図は音声信号の一
例を示す図、第7図はパラメータ抽出装置の出力
である特徴パラメータの一例を示す図、第8図A
〜Cは音声判定装置からの音素コードの出力の様
子を示す図、第9図はこの発明の音素コード出力
までの動作を示すフローチヤートである。 1……マイク、2……フオントメモリ、3……
表示装置、4……電算写植システム、10……パ
ラメータ抽出装置、11……サンプリング回路、
12……フイルタ、13……量子化回路、20…
…音素データ記憶装置、30……音声判定装置、
40……ゲート装置、50……国語辞書記憶装
置、60……仮名漢字変換装置、70……選択指
定装置、80……漢字コード記憶装置、100…
…話者(オペレータ等)、101……唇、200
……唇開閉監視装置、201……TVカメラ、2
02……AD変換器、203……フレームメモ
リ、204……開閉判断回路、CP……特徴パラ
メータ、SP……音素パラメータ、PS……パラト
グラフ信号、SC……音素コード、TSC……変換
用音素コード、DW……記述語データ、FI……フ
オント情報、AS……音声信号、SM……サンプ
リング信号、SD……サンプリングデータ、PD…
…パラトグラフデータ、LY…割付情報。
FIG. 1 is a block diagram showing an embodiment of this invention, FIG. 2 is a block diagram showing an example of the configuration of a parameter extraction device, and FIG. 3 is an example of the bandwidth of a filter (8 channels) used in this invention. 4 is a diagram showing the state of data stored in the phoneme data storage device, FIG. 5 is a diagram showing an example of the storage state of the Japanese language dictionary storage device, and FIG. 6 is a diagram showing an example of the audio signal. 7A and 7B are diagrams showing an example of feature parameters that are output from the parameter extraction device, and FIG. 8A
-C are diagrams showing how the phoneme code is output from the speech determination device, and FIG. 9 is a flowchart showing the operation up to the output of the phoneme code of the present invention. 1...Microphone, 2...Font memory, 3...
Display device, 4... Computer phototypesetting system, 10... Parameter extraction device, 11... Sampling circuit,
12... Filter, 13... Quantization circuit, 20...
...Phoneme data storage device, 30...Speech determination device,
40...Gate device, 50...Japanese language dictionary storage device, 60...Kana-kanji conversion device, 70...Selection specification device, 80...Kanji code storage device, 100...
...Speaker (operator, etc.), 101...Lip, 200
...Lip opening/closing monitoring device, 201...TV camera, 2
02...AD converter, 203...Frame memory, 204...Opening/closing judgment circuit, CP...Characteristic parameter, SP...Phoneme parameter, PS...Paratograph signal, SC...Phoneme code, TSC...Conversion phoneme Code, DW...descriptive word data, FI...font information, AS...audio signal, SM...sampling signal, SD...sampling data, PD...
...paratograph data, LY...allocation information.

Claims (1)

【特許請求の範囲】 1 (a) 入力される音声の特徴パラメータを抽出
するパラメータ抽出装置と、 (b) 所定音素の音素パラメータを音素コードと共
に記憶している音素データ記憶装置と、 (c) 前記特徴パラメータと音素パラメータとを比
較し、所定類似度以上でかつ最も類似度の高い
音素パラメータに対応する前記音素コードを出
力する音声判定装置と、 (d) 話者の唇の開閉を監視する唇開閉監視装置
と、 (e) 前記音声判定装置から判別し難い音素コード
が出力された時に、前記唇開閉監視装置からの
開閉信号によつて正しい音素コードを出力する
ゲート装置と、 (f) 種々の見出語に対応する記述語コードを国語
辞書として記憶している国語辞書記憶装置と、 (g) 前記ゲート装置から出力される変換用音素コ
ードと前記国語辞書記憶装置の見出語とを比較
し、一致する当該見出語の記述語データをフオ
ントメモリからのフオント情報に従つて表示装
置に出力する仮名漢字変換装置と、 (h) 表示装置に表示された同音異義又は同音異種
の語の1つを選択指定すると共に、フアンクシ
ヨン、約もの及び該当語がない場合の所望構成
文字を入力するための選択指定装置と、 (i) この選択指定装置の選択指定に従つて前記仮
名漢字変換装置から出力される漢字コードを記
憶し、割付情報と共に電算写植システムに伝送
するための漢字コード記憶装置と、 を具えたことを特徴とする印刷用漢字入力装置。
[Scope of Claims] 1 (a) A parameter extraction device that extracts feature parameters of input speech; (b) A phoneme data storage device that stores phoneme parameters of a predetermined phoneme along with a phoneme code; (c) (d) monitoring the opening and closing of the speaker's lips; a lip opening/closing monitoring device; (e) a gate device that outputs a correct phoneme code based on an opening/closing signal from the lip opening/closing monitoring device when a phoneme code that is difficult to distinguish is output from the speech determining device; (f) (g) a phoneme code for conversion outputted from the gate device and the entry word of the Japanese dictionary storage device; (h) a kana-kanji conversion device that compares the descriptive word data of the corresponding headword and outputs it to a display device according to the font information from the font memory; a selection and designation device for selecting and designating one of the words and inputting a function, a punctuation, and a desired constituent character in the case where the corresponding word does not exist; A kanji input device for printing, comprising: a kanji code storage device for storing kanji codes output from a conversion device and transmitting the kanji codes together with layout information to a computer phototypesetting system.
JP2980380A 1980-03-11 1980-03-11 Inputting device for printing of chinese character Granted JPS56126160A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2980380A JPS56126160A (en) 1980-03-11 1980-03-11 Inputting device for printing of chinese character

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2980380A JPS56126160A (en) 1980-03-11 1980-03-11 Inputting device for printing of chinese character

Publications (2)

Publication Number Publication Date
JPS56126160A JPS56126160A (en) 1981-10-02
JPS636355B2 true JPS636355B2 (en) 1988-02-09

Family

ID=12286167

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2980380A Granted JPS56126160A (en) 1980-03-11 1980-03-11 Inputting device for printing of chinese character

Country Status (1)

Country Link
JP (1) JPS56126160A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0461073U (en) * 1990-10-04 1992-05-26

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0461073U (en) * 1990-10-04 1992-05-26

Also Published As

Publication number Publication date
JPS56126160A (en) 1981-10-02

Similar Documents

Publication Publication Date Title
US4769845A (en) Method of recognizing speech using a lip image
US3946157A (en) Speech recognition device for controlling a machine
US4757541A (en) Audio visual speech recognition
JPS6147440B2 (en)
JPS5953590B2 (en) translation device
JPS6120886B2 (en)
JPS636355B2 (en)
US6212499B1 (en) Audible language recognition by successive vocabulary reduction
JPS6316766B2 (en)
JPS6120887B2 (en)
JPS6132679B2 (en)
JPS6120888B2 (en)
JPH0968998A (en) Method and device for recognizing voice
JPS6255170B2 (en)
JPS6151798B2 (en)
JP3808732B2 (en) Speech recognition method and system
EP0336032A1 (en) Audio visual speech recognition
JPS6211732B2 (en)
JP3515143B2 (en) Pattern registration device
JPS63189933A (en) Device for reading sentence aloud
AU613904B2 (en) Audio visual speech recognition
JPS5837698A (en) Conversion method for voice input japanese language typewriter
JPH0731508B2 (en) Speech recognition response device
JPS6218954B2 (en)
JPS62180397A (en) Registration system for voice pattern