JPH0812535B2 - Pronunciation training device - Google Patents

Pronunciation training device

Info

Publication number
JPH0812535B2
JPH0812535B2 JP63058267A JP5826788A JPH0812535B2 JP H0812535 B2 JPH0812535 B2 JP H0812535B2 JP 63058267 A JP63058267 A JP 63058267A JP 5826788 A JP5826788 A JP 5826788A JP H0812535 B2 JPH0812535 B2 JP H0812535B2
Authority
JP
Japan
Prior art keywords
voice
memory
flow
data
key
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP63058267A
Other languages
Japanese (ja)
Other versions
JPH01232379A (en
Inventor
定明 江沢
良一 遠藤
克博 橋本
道子 仁瓶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kawai Musical Instrument Manufacturing Co Ltd
Original Assignee
Kawai Musical Instrument Manufacturing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kawai Musical Instrument Manufacturing Co Ltd filed Critical Kawai Musical Instrument Manufacturing Co Ltd
Priority to JP63058267A priority Critical patent/JPH0812535B2/en
Publication of JPH01232379A publication Critical patent/JPH01232379A/en
Priority to US07/735,108 priority patent/US5142657A/en
Publication of JPH0812535B2 publication Critical patent/JPH0812535B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、音声分析技術を応用して英語等の発音訓練
を効果的に行なう発音訓練装置に関する。
Description: TECHNICAL FIELD The present invention relates to a pronunciation training device that effectively applies pronunciation training for English and the like by applying a voice analysis technique.

(従来の技術) 従来、外国語の発音訓練を行なう場合、外国語を母国
語とする人に発音評価を頼る方法や、市販されているカ
セットテープ、ビデオテープ、レコード等によって自己
訓練する方法とがある。
(Prior Art) Conventionally, when training pronunciation of a foreign language, there is a method of relying on a person whose native language is a foreign language for pronunciation evaluation, and a method of self-training with a commercially available cassette tape, video tape, record, or the like. There is.

(発明が解決しようとする課題) 上述の外国語を母国語とする人に発音評価を頼る方法
は、その人が学習者に微妙な発音の違いを説明するのが
困難であるという不都合がある。カセットテープ、ビデ
オテープ等による方法は、いずれも正しい発音に近づい
ているかどうかの確認手段がなく、学習者の聴覚で判断
し自分の発音を評価せざるを得ないという不都合があ
る。
(Problems to be Solved by the Invention) The above method of relying on a person whose native language is a foreign language for pronunciation evaluation has a disadvantage that it is difficult for that person to explain a subtle difference in pronunciation to a learner. . None of the methods using a cassette tape, a video tape, etc. has a method for confirming whether or not the pronunciation is close to the correct pronunciation, and there is an inconvenience that the learner's hearing must judge and evaluate his own pronunciation.

そこで本出願人は、先に、自己の発音に伴う音声を分
析し、その結果得られた波形、パワー、ピッチ(音の高
低)、サウンドスペクトログラフ等の音声パラメータを
ディスプレイに表示し、その音声パラメータのパターン
から測定した発音特徴データと手本の発音特徴データと
を比較し、その比較結果からその結果に対応した矯正コ
メントを得て能率よく教師による標準の音声パターンに
近づくようにストレスアクセント、イントネーション、
母音及び子音等の発音訓練を行なう発音訓練装置を提案
した(特願昭61−303772号参照)。本発明は、該発音訓
練装置の改良に係り、より効率的に発音訓練が可能な発
音訓練装置を提供することをその目的とするものであ
る。
Therefore, the present applicant first analyzed the voice associated with his or her own pronunciation, and displayed on the display the voice parameters such as the waveform, power, pitch (pitch of sound), sound spectrograph, etc., and the voice Compare the pronunciation feature data measured from the parameter pattern with the model pronunciation feature data, obtain a corrective comment corresponding to the result from the comparison result, and stress accent to efficiently approach the standard voice pattern by the teacher, intonation,
We proposed a pronunciation training device for training pronunciation of vowels and consonants (see Japanese Patent Application No. 61-303772). The present invention relates to an improvement of the pronunciation training device, and an object thereof is to provide a pronunciation training device capable of more efficiently performing pronunciation training.

(課題を解決するための手段) 上記目的を達成するために、本発明の発音訓練装置
は、請求項1記載のように、音声信号発生手段と、音声
信号から発音に伴う音声を分析する音声分析手段と、少
なくとも音声データ及び音声分析結果を格納するメモリ
と、有効画面を上半分、下半分の一対の画面構成とする
ディスプレイと、それぞれの画面に対応して少なくとも
同じ訓練項目を同じ相対位置に配列した複数の操作キー
から成る2組のキー群と、該キー群の操作によって前記
ディスプレイ上の一対の画面構成をそれぞれ独立に制御
して音声分析結果を比較表示する手段とを備える発音訓
練装置において、前記メモリに書き込まれたピッチ値デ
ータを順次読み出し、該ピッチ値データが有声音の時は
該ピッチ値データを前記ディスプレイに表示し、読み出
されたピッチ値データが有声音であり、かつ次に読み出
されたピッチ値データが無音又は無音声になった時は、
それまで連続して読み出された有声音のピッチ値データ
に対応する音声を再生し、所定時間経過後残りの前記ピ
ッチ値データについて再び前記一連の動作を行なうイン
トネーション分析動作手段を備えることを特徴とし、請
求項2記載のように、請求項1記載の発音訓練装置にお
いて、前記メモリは、音声データを格納する音声メモリ
及び音声立上りメモリを有し、該音声立上りメモリに対
して書き込み動作を循環させて該音声立上りメモリに音
声データの立上り部分を書き込み、音声データが一定値
以上になった時に書き込み動作を前記音声メモリに切換
え、該音声メモリの音声立上りメモリに相当する未格納
領域に続いて音声データを書き込み、その書き込みの終
了後に前記音声立上りメモリに書き込まれた音声データ
を前記音声メモリの未格納領域に転送する録音動作手段
を備えることを特徴とし、また請求項1又は2記載の発
音訓練装置において、マイクロホン以外の音声信号発生
手段の信号伝送回路に録音レベル調整ボリュームを備え
ることを特徴とする。
(Means for Solving the Problems) In order to achieve the above object, the pronunciation training apparatus of the present invention has a voice signal generating means and a voice for analyzing a voice associated with pronunciation from a voice signal as described in claim 1. An analysis means, a memory for storing at least voice data and a voice analysis result, a display having a pair of screens of an effective screen in an upper half and a lower half, and at least the same training item at the same relative position corresponding to each screen. Pronunciation training provided with two sets of key groups consisting of a plurality of operation keys arranged in a row, and means for comparing and displaying voice analysis results by independently controlling a pair of screen configurations on the display by operating the key groups. In the device, the pitch value data written in the memory is sequentially read out, and when the pitch value data is a voiced sound, the pitch value data is displayed on the display. , If the read pitch value data is voiced and the next read pitch value data is silent or unvoiced,
Intonation analysis operation means for reproducing the voice corresponding to the pitch value data of the voiced sound read continuously until then and performing the series of operations again for the remaining pitch value data after a lapse of a predetermined time is provided. As described in claim 2, in the pronunciation training apparatus according to claim 1, the memory has a voice memory for storing voice data and a voice rising memory, and a write operation is circulated to the voice rising memory. Then, the rising portion of the voice data is written in the voice rising memory, and when the voice data exceeds a certain value, the writing operation is switched to the voice memory, and the unstored area of the voice memory corresponding to the voice rising memory is continued. After writing the voice data, the voice data written in the voice rising memory after the writing is finished is written in the voice memory. 3. The sounding training device according to claim 1, further comprising a recording operation means for transferring to a non-stored area, wherein the signal transmission circuit of the sound signal generating means other than the microphone is provided with a recording level adjusting volume. And

(作 用) 教師用キー及び学習者用キーを教師及び学習者がそれ
ぞれ操作することによってディスプレイに表示される音
声分析結果を示す一対の画面が互いに独立して制御され
る。
(Operation) When the teacher and the learner operate the teacher key and the learner key, respectively, a pair of screens showing the voice analysis result displayed on the display are controlled independently of each other.

イントネーション分析やサウンドスペクトログラフ分
析をするときは、音声メモリに格納された音声メモリか
ら音声データが読み出され、これがフィルタを通って前
記分析に適した音声データに変換され、ワーキングメモ
リに書き込まれる。音声分析はワーキングメモリに格納
された音声データについて行なわれる。
When performing intonation analysis or sound spectrograph analysis, voice data is read from the voice memory stored in the voice memory, passed through a filter, converted into voice data suitable for the analysis, and written into the working memory. The voice analysis is performed on the voice data stored in the working memory.

音声信号発生手段から出力する音声データを録音する
ときは、音声データの立上り部分が書き込み動作を循環
して行なう音声立上りメモリに書き込まれ、音声データ
が一定値以上になった時に音声メモリに書き込まれる。
そして音声メモリに音声データの書き込みが終了した後
に音声立上りメモリに格納された立上り部分が音声メモ
リの音声立上りメモリに相当する未格納領域に書き込ま
れる。
When recording the audio data output from the audio signal generating means, the rising portion of the audio data is written in the audio rising memory which is circulated through the writing operation, and is written in the audio memory when the audio data exceeds a certain value. .
After the writing of the voice data to the voice memory is completed, the rising portion stored in the voice rising memory is written in an unstored area of the voice memory corresponding to the voice rising memory.

イントネーションの訓練をするときは、メモリに格納
された流れるように発音する長めの文章についてのピッ
チ値データを順次読み出し、読み出されたピッチ値デー
タが有声音のときは該ピッチ値データをディスプレイに
表示し、読み出されたピッチ値データが有声音でおりか
つ次に読み出されたピッチ値データが無音又は無声音に
なった時は、それまで連続して読み出された有声音のピ
ッチ値データに対応する音声を再生し、所定時間経過後
残りの前記ピッチ値データについて再び前記一連の動作
を行なう。
When training intonation, the pitch value data stored in the memory for the long sentences to be pronounced in a fluent manner are sequentially read, and when the read pitch value data is voiced, the pitch value data is displayed on the display. When the displayed and read pitch value data is voiced and the next read pitch value data becomes unvoiced or unvoiced, the pitch value data of the voiced sound read continuously until then The voice corresponding to is reproduced, and after a lapse of a predetermined time, the series of operations is performed again for the remaining pitch value data.

音声信号発生手段のうちマイクロホンの出力はその大
きさを調整されることなく音声メモリに格納される。
The output of the microphone of the audio signal generating means is stored in the audio memory without its size being adjusted.

(実施例) 以下本発明の実施例を図面につき説明する。Embodiment An embodiment of the present invention will be described below with reference to the drawings.

第1図は、本発明の発音訓練装置の外観を示す。 FIG. 1 shows the appearance of the pronunciation training apparatus of the present invention.

同図において、1はパーソナルコンピュータ(以下パ
ソコンという)、2はディスプレイ、3は専用キーボー
ド、4は外部回路を収納したユニット(以下専用ユニッ
トという)、5はマイクロホン、6はスピーカ、7はハ
ードコピーや印字出力を得る周知のプリンタである。
In the figure, 1 is a personal computer (hereinafter referred to as a personal computer), 2 is a display, 3 is a dedicated keyboard, 4 is a unit accommodating an external circuit (hereinafter referred to as a dedicated unit), 5 is a microphone, 6 is a speaker, and 7 is a hard copy. It is a well-known printer that obtains a print output.

前記専用キーボード3は、第2図に示すように、中央
に通常の英数字キー10が配置され、左右に1対の特別な
キーである教師用キー(以下SCR1キーという)11及び学
習者用キー(以下SCR2という)12が配置されて構成され
ている。SCR1キー11とSCR2キー12は、共に複数個の操作
キー11−1〜11−17、12−3〜12−17で構成されてお
り、両者の相違は、SCR1キー11にBEGINキー11−1とEND
キー11−2があることで、その他のキーは同じように配
置されている。BEGINキー11−1は訓練開始を入力する
キーであり、ENDキー11−2は終了を入力するキーであ
って、これ等のキーをSCR1キーのみに設けたのは、その
操作を教師の判断に任せるためである。
As shown in FIG. 2, the special keyboard 3 has a normal alphanumeric key 10 in the center, and a pair of special keys for the teacher (hereinafter referred to as the SCR1 key) 11 and for the learner. A key (hereinafter referred to as SCR2) 12 is arranged and configured. Both the SCR1 key 11 and the SCR2 key 12 are composed of a plurality of operation keys 11-1 to 11-17 and 12-3 to 12-17. The difference between them is that the SCR1 key 11 and the BEGIN key 11-1 are different. And END
With the key 11-2, the other keys are arranged in the same way. The BEGIN key 11-1 is a key for inputting the start of training, the END key 11-2 is a key for inputting the end, and these keys are provided only on the SCR1 key because the operation is judged by the teacher. To leave it to.

キーの総数は一般のコンピュータ用キーボードと大差
がないので、該コンピュータ用キーボードの中央に配置
した英数字キー以外のキーの位置と名称を第2図示のSC
R1キー11及びSCR2キー12のように変更するだけでよい。
したがって専用キーボード3のキー走査とパソコン1と
のキー情報通信は周知の方式で行なわれる。
Since the total number of keys is not much different from that of general computer keyboards, the positions and names of keys other than the alphanumeric keys arranged in the center of the computer keyboard are shown in SC in the second illustration.
It only needs to be changed like the R1 key 11 and SCR2 key 12.
Therefore, the key scanning of the dedicated keyboard 3 and the key information communication with the personal computer 1 are performed by a known method.

パソコン1は、第3図示のようにCPU13、メモリ14及
びディスク15を主な構成要件としている。
As shown in FIG. 3, the personal computer 1 has a CPU 13, a memory 14, and a disk 15 as main constituent elements.

メモリ14は、処理プログラム及びバッファメモリ、制
御パラメータ・フラグメモリ、音声立上りメモリ、音声
メモリ、ワーキングメモリ並びに画像メモリとして用い
られ、処理プログラム及びバッファメモリは、SCR1キー
11及びSCR2キー12に共通に設けられ、その他のメモリは
SCR1キー11及びSCR2キー12のそれぞれに別個に設けられ
ている。
The memory 14 is used as a processing program and buffer memory, a control parameter / flag memory, a voice rising memory, a voice memory, a working memory and an image memory. The processing program and the buffer memory are SCR1 keys.
11 and SCR2 key 12 are provided in common, other memory is
The SCR1 key 11 and the SCR2 key 12 are provided separately.

音声メモリは分析する音声信号のディジタルサンプル
値を格納し、音声立上りメモリは音声の立上りの音声信
号のディジタルサンプル値を一時的に格納するもので、
該ディジタルサンプル値は録音完了時に音声メモリの対
応する領域に転送される。ワーキングメモリは、サウン
ドスペクトログラフ分析(以下パターン分析という)を
求めるときにその結果をバランス良く均一な濃淡で表現
するために高域周波数成分を強調した音声信号のディジ
タル値を格納したり、あるいは、音声のピッチ分析(以
下イントネーション分析という)を求めるときに、ピッ
チである基本周波数成分を抽出しやすくなるように不必
要な高域周波数を低減しかつサンプル間隔を減じた音声
信号を格納するものである。画像メモリはディスプレイ
2に表示する内容を格納するものである。
The voice memory stores the digital sample value of the voice signal to be analyzed, and the voice rising memory temporarily stores the digital sample value of the voice signal of the voice rising.
The digital sample value is transferred to the corresponding area of the voice memory upon completion of recording. The working memory stores a digital value of a voice signal in which a high frequency component is emphasized in order to express the result in a well-balanced and uniform shade when obtaining a sound spectrograph analysis (hereinafter referred to as a pattern analysis), or Stores a voice signal with unnecessary high frequencies reduced and sample intervals reduced so that the fundamental frequency component, which is the pitch, can be easily extracted when a pitch analysis (hereinafter referred to as intonation analysis) of the voice is obtained. is there. The image memory stores the contents displayed on the display 2.

パソコン1の処理は、SCR1キー11及びSCR2キー12のう
ち先に押圧された方を優先して行う。
The processing of the personal computer 1 is performed by giving priority to the SCR1 key 11 or the SCR2 key 12 that is pressed first.

録音された音声メモリのディジタルサンプル値から音
声分析をして画像メモリにその結果を格納してディスプ
レイ2に表示する一連の処理は、前述の特願昭61−3037
72号の明細書に記載されているので、詳記しない。
A series of processes for performing voice analysis from the recorded digital sample value of the voice memory, storing the result in the image memory and displaying it on the display 2 are described in the above-mentioned Japanese Patent Application No. 61-3037.
Since it is described in the specification of No. 72, it will not be described in detail.

専用ユニット4の詳細な外観は第4図(A)(B)に
示され、その中に収納する外部回路は第5図に示されて
いる。
The detailed appearance of the dedicated unit 4 is shown in FIGS. 4A and 4B, and the external circuit housed therein is shown in FIG.

第4図及び第5図において、16は入力セレクタで、該
入力セレクタ16はスイッチA1,A2,Mから成り、該スイッ
チA1はテープレコーダ(図示しない)の音声出力を録音
するときに使用する入力端子AUX1と外部回路、スイッチ
A2はビデオディスク(図示しない)の音声出力を録音す
るときに使用する入力端子AUX2と外部回路、スイッチM
はマイクロホン5の音声出力を録音するときに使用する
入力端子MICと外部回路とをそれぞれ択一選択接続する
もので、スイッチA1はオンにするとラインL17が高レベ
ル“H"となって電子スイッチ17がオンになり、入力端子
AUX1の入力信号をバッファアンプ18に入力する。スイッ
チA2をオンにすると、ラインL19が“H"となって電子ス
イッチ19がオンになり、入力端子AUX2の入力信号がバッ
ファアンプ18に入力する。スイッチMをオンにすると、
ラインL20が“H"となって電子スイッチ20がオンとなり
入力端子MICの入力信号をバッファアンプ21を介してバ
ッファアンプ22に入力する。スイッチMをオフのとき
は、ラインL20は“L"であるので、電子スイッチ20がオ
フになり、NOT回路23の出力が“H"となるので電子スイ
ッチ24がオンとなる。したがってスイッチA1又はA2をオ
ンにしたときは、入力端子AUX1又はAUX2の入力信号をバ
ッファアンプ18を介してバッファアンプ22に入力する。
In FIGS. 4 and 5, reference numeral 16 is an input selector, and the input selector 16 is composed of switches A1, A2, and M, and the switch A1 is an input used when recording the audio output of a tape recorder (not shown). Terminal AUX1 and external circuit, switch
A2 is an input terminal AUX2 used for recording the audio output of a video disc (not shown), an external circuit, and a switch M.
Is for selectively connecting the input terminal MIC used for recording the voice output of the microphone 5 and the external circuit. When the switch A1 is turned on, the line L17 becomes the high level "H" and the electronic switch 17 Turns on and the input terminal
The input signal of AUX1 is input to the buffer amplifier 18. When the switch A2 is turned on, the line L19 becomes "H", the electronic switch 19 is turned on, and the input signal of the input terminal AUX2 is input to the buffer amplifier 18. When switch M is turned on,
The line L20 becomes “H”, the electronic switch 20 is turned on, and the input signal of the input terminal MIC is input to the buffer amplifier 22 via the buffer amplifier 21. When the switch M is off, the line L20 is "L", the electronic switch 20 is off, and the output of the NOT circuit 23 is "H", so the electronic switch 24 is on. Therefore, when the switch A1 or A2 is turned on, the input signal of the input terminal AUX1 or AUX2 is input to the buffer amplifier 22 via the buffer amplifier 18.

入力端子AUX1,AUX2の入力信号がバッファアンプ22に
入力するとき、録音レベル調整ボリューム25(LEVEL VO
L.)によって音声信号の大きさが調整されるようになっ
ているのに対し、入力端子MICの入力信号がバッファア
ンプ22に入力するときは、入力信号は該ボリューム25を
経由しないようになっている。したがってこの入力信号
の大きさによって発音の声の大きさを判定することがで
きる。声の大きさは発音の訓練上重要であって、日本人
が英語を発音したとき声量の不足が一つの問題点とな
る。すなわち、腹式呼吸によって発生する英語に対して
胸式呼吸による日本語はどうしてもパワー不足となるの
である。そこで、口とマイクロフォン5の距離を一定に
して発音したときの音声の波形をディスプレイ2で見れ
ば、第6図の(α)で示すようにその振幅が点線LV,LV
の間に入った時は、声量不足であり、(β)で示すよう
にその振幅が点線LV,LVから十分はみだした時は合格で
あると判定できる。
When the input signals from the input terminals AUX1 and AUX2 are input to the buffer amplifier 22, the recording level adjustment volume 25 (LEVEL VO
L.) adjusts the size of the audio signal, whereas when the input signal of the input terminal MIC is input to the buffer amplifier 22, the input signal does not pass through the volume 25. ing. Therefore, it is possible to determine the loudness of the voice to be pronounced based on the loudness of the input signal. The loudness of voice is important for pronunciation training, and one of the problems is the lack of voice volume when Japanese speak English. In other words, Japanese with chest breathing is inevitably inadequate in power of English caused by abdominal breathing. Therefore, when the waveform of the sound produced when the sound is produced with the distance between the mouth and the microphone 5 being fixed is seen on the display 2, the amplitude is dotted lines LV and LV as shown in (α) of FIG.
It is possible to judge that the voice volume is insufficient when the interval is entered, and when the amplitude is sufficiently out of the dotted lines LV and LV as shown by (β), it is determined to be a pass.

因みに、マイクロホン5は、第1図示のように卓上型
でも支障はないが、ヘッドホンと一体になった頭にかけ
る方式ならば、口とマイクロホン5の距離関係が固定で
きて都合がよい。
Incidentally, although the microphone 5 may be a desk-top type as shown in the first illustration, there is no problem, but if it is a method of putting on the head integrated with the headphone, it is convenient because the distance relationship between the mouth and the microphone 5 can be fixed.

前記バッファアンプ18の出力は、前記バッファアンプ
22に入力すると共にモニター信号として加算アンプ26に
入力し、その出力はサンプリング雑音を除去するための
ローパスフィルタ27とスピーカボリューム28(VOLUME)
を経て出力端子REC.OUTに送出する一方、パワーアンプ2
9に入力し、その出力をスピーカ6を接続する出力端子S
P.OUTと、一対のヘッドホンボリューム301,302(PH.1 V
OL.及びPH.2 VOL)を経てヘッドホンを接続する出力端
子PHONE1,PHONE2へ送出するようになっている。該一対
の出力端子PHONE1,PHONE2はSCR1キー11及びSCR2キー12
の使用者に個別に用意したものであり、またヘッドホン
ボリューム301,302を設けたことで各自の好みの音量に
設定することができる。前記ローパスフィルタ27は例え
ばカットオフ周波数6KHz,−24dB/OCT程度の特性を有す
る。
The output of the buffer amplifier 18 is the buffer amplifier.
22 and a monitor signal to a summing amplifier 26, the output of which is a low-pass filter 27 for removing sampling noise and a speaker volume 28 (VOLUME).
Power amplifier 2 while sending to the output terminal REC.OUT via
Input to 9 and its output is connected to speaker 6. Output terminal S
P.OUT and a pair of headphones volume 30 1 , 30 2 (PH.1 V
OL. And PH.2 VOL), and outputs to the output terminals PHONE1, PHONE2 that connect headphones. The pair of output terminals PHONE1 and PHONE2 are SCR1 key 11 and SCR2 key 12
Is prepared for each user, and the volume can be set to his or her own preference by providing the headphone volumes 30 1 and 30 2 . The low-pass filter 27 has a cutoff frequency of 6 KHz and a characteristic of about -24 dB / OCT, for example.

31は外部回路をパソコン1に接続するために使用する
I/Oインターフェースコネクタで、該コネクタ31にはデ
コーダ32(DEC)が接続されている。該デコーダ32はパ
ソコン1から入力するアドレス線上のポート指定信号、
入力コマンドパルスIOR、出力コマンドパルスIOWをデコ
ードして入力ポート33(IN1)へ供給する読み込みパル
スや出力ポート34(OUT1)、出力ポート35(OUT2)及び
出力ポート36(OUT3)へそれぞれ供給する書き込みパル
スを発生するものである。入力ポート33の入力線には、
A−D変換器37(ADC)が接続され、該A−D変換器37
は、加算アンプ38及び声音の周波数帯域である6KHzまで
は通過させ、それ以上は遮断するような例えばカットオ
フ周波数6KHz,−70db程度の特性を有するアンチエリア
シングフィルタ39を介して電子スイッチ40及び41に接続
されており、加算アンプ38から入力するアナログ音声信
号を12KHzのメイン発振器42の出力信号に従ってディジ
タル音声信号に変換する。出力ポート34の出力端子Q1,Q
2,Q3,Q4……QPには、録音時間(REC.TIME)を表示する
録音時間インディケータ60の発光ダイオード(LED)6
11,612,613…が接続されており、その1つの発光ダイオ
ード611と出力端子Q1との間にはAND回路62とOR回路63が
介入され、AND回路62の−入力端子は、メイン発振器42
の出力周波数を1/4096にして3Hzとする分周器64に接続
されている。出力ポート35には、ラッチ65を介してD−
A変換器66(DAC)が接続され、該D−A変換器66は電
子スイッチ67を介して前記加算アンプ26に接続されると
共に、パターン分析で必要となる音声の高域周波数成分
を強調するためのハイパスフィルタ68を介して前記電子
スイッチ41に接続され、また、イントネーション分析で
必要となるピッチである基本周波数成分以外の不必要な
高域周波数を低減するローパスフィルタ69及び電子スイ
ッチ70を介して前記加算アンプ38に接続されている。出
力ポート36(OUT3)の出力端子RECは録音動作時に“H"
になり、それによって電子スイッチ40をオンにして音声
信号をA−D変換器37に入力させ、また電子スイッチ71
をオンにしてレベル表示器72(LDS)を駆動し、レベル
メータ73を構成する複数のLED74を入力レベルに応じた
数だけ点灯する。出力ポート36の出力端子PIはイントネ
ーション分析動作の時に“H"となり、それによって電子
スイッチ70をオンにして出力ポート35から出力した音声
信号をローパスフィルタ69を経由してA−D変換器37
(ADC)に入力させ、出力ポート36の出力端子SGはパタ
ーン分析動作の時に“H"となり、それによって電子スイ
ッチ41をオンにして出力ポート35から出力した音声信号
をハイパスフィルタ68を経由してA−D変換器37に入力
させるようになっている。
31 is used to connect the external circuit to the PC 1
An I / O interface connector, to which a decoder 32 (DEC) is connected. The decoder 32 is a port designation signal on the address line input from the personal computer 1.
Read pulse to decode input command pulse IOR and output command pulse IOW to supply to input port 33 (IN1) and write to supply to output port 34 (OUT1), output port 35 (OUT2) and output port 36 (OUT3) respectively It generates a pulse. In the input line of the input port 33,
The A / D converter 37 (ADC) is connected to the A / D converter 37.
Is a summing amplifier 38 and an electronic switch 40 through an anti-aliasing filter 39 having a characteristic of about 6 KHz, −70 db, for example, which cuts off frequencies beyond 6 KHz, which is the frequency band of the voice sound. It is connected to 41 and converts the analog audio signal input from the addition amplifier 38 into a digital audio signal in accordance with the output signal of the 12 KHz main oscillator 42. Output port of output port 34 Q 1 , Q
2, Q 3, Q 4 in the ...... Q P, the light emitting diode of the recording time indicator 60 for displaying the recording time (REC.TIME) (LED) 6
1 1 , 61 2 , 61 3 ... are connected, and an AND circuit 62 and an OR circuit 63 are interposed between the one light emitting diode 61 1 and the output terminal Q 1, and the-input terminal of the AND circuit 62 is connected. The main oscillator 42
It is connected to the frequency divider 64 that makes the output frequency of 1/4096 to 3Hz. D- via the latch 65 to the output port 35
An A converter 66 (DAC) is connected, and the D-A converter 66 is connected to the summing amplifier 26 via an electronic switch 67, and emphasizes a high frequency component of voice necessary for pattern analysis. Is connected to the electronic switch 41 via a high-pass filter 68, and via a low-pass filter 69 and an electronic switch 70 for reducing unnecessary high frequency components other than the fundamental frequency component which is the pitch required for intonation analysis. Connected to the summing amplifier 38. Output port REC of output port 36 (OUT3) is "H" during recording operation
Then, the electronic switch 40 is turned on to input the audio signal into the AD converter 37, and the electronic switch 71
Is turned on to drive the level indicator 72 (LDS), and a plurality of LEDs 74 constituting the level meter 73 are turned on according to the input level. The output terminal PI of the output port 36 becomes "H" at the time of intonation analysis operation, whereby the electronic switch 70 is turned on and the audio signal output from the output port 35 is passed through the low pass filter 69 to the AD converter 37.
(ADC), the output terminal SG of the output port 36 becomes “H” during the pattern analysis operation, thereby turning on the electronic switch 41 and transmitting the audio signal output from the output port 35 through the high pass filter 68. It is adapted to be input to the A / D converter 37.

第4図において、75は電源コード、76は電源スイッチ
である。
In FIG. 4, 75 is a power cord and 76 is a power switch.

前記ディスプレイ2には、第6図示のように、前記SC
R1キー11及びSCR2キー12によってそれぞれ独立に制御さ
れる上半分及び下半分の一対の画面構成SCREEN1,SCREEN
2が表示されるようになっている。第6図示のディスプ
レイ2上には、主要ポイントの座標を記入したがX軸が
1024点,Y軸が348×2点程度のグラフィック能力がある
パソコン1やディスプレイ2を使用すればよいので、一
般市販品で十分に間に合い、中級クラスのパソコンでよ
く低コストである。
As shown in FIG. 6, the SC is displayed on the display 2.
A pair of screen configurations SCREEN1, SCREEN of the upper half and the lower half which are independently controlled by the R1 key 11 and the SCR2 key 12, respectively.
2 is displayed. The coordinates of the main points are entered on the display 2 shown in FIG.
Since it is sufficient to use a personal computer 1 or a display 2 having a graphic capability of 1024 points and a Y axis of about 348 × 2 points, a general commercial product will suffice, and an intermediate class personal computer will be good and low cost.

前記ディスプレイ2に表示される画面構成としての分
析画面には、第7図示のように、音声波形と分析モード
を表示するPT1と、パターン分析を表示するPT2と、イン
トネーション分析を表示するPT3などの3種類がある。
第8図は前記PT2に音声のパワー分析(以下アクセント
分析という)を追加表示したものである。
As shown in FIG. 7, the analysis screen as a screen configuration displayed on the display 2 includes a PT1 displaying a voice waveform and an analysis mode, a PT2 displaying a pattern analysis, a PT3 displaying an intonation analysis, and the like. There are three types.
FIG. 8 shows a voice power analysis (hereinafter referred to as accent analysis) additionally displayed on the PT2.

前記PT1の上半分には、日本人が発音した/a/,/b/,/c/
の音声波形を例示し、下半分には分析モード「LOW」を
例示している。分析モードには「LOW」と「HIGH」とが
あり、これは学習者の声の高低に応じて高速フーリェ変
換する際の窓の大きさやピッチを捜す際の周波数範囲を
規定するものである。PT2はPT1のカーソル80,81で囲ま
れた範囲をパターン分析したものであり、図形82はカー
ソル83,84のうち左側のカーソル83の線上におけるスペ
クトルの断面図(スペクトルの大きさを線の長さで示す
図)である。三角印87は第1ホルマントを、三角印88は
第2ホルマントを学習者が捜すときのマーカである。PT
3はPT1は全体のイントネーション分析を示す。
In the upper half of PT1, / a /, / b /, / c /
Of the voice waveform, and the analysis mode “LOW” is illustrated in the lower half. There are "LOW" and "HIGH" in the analysis modes, which define the frequency range for searching the window size and pitch in the high-speed Fourier transform according to the height of the learner's voice. PT2 is a pattern analysis of the area enclosed by the cursors 80 and 81 of PT1, and the figure 82 is a cross-sectional view of the spectrum on the line of the cursor 83 on the left side of the cursors 83 and 84 (the size of the spectrum indicates the length of the line). It is a figure shown in FIG. The triangle mark 87 is a marker when the learner searches for the first formant and the triangle mark 88 is for searching the second formant. PT
3 shows PT1 whole intonation analysis.

以上のPT1〜PT3のいずれか1つはSCR1キー11及びSCR2
キー12を操作することにより算出されてディスプレイ2
上の上半分のSCREEN1及び下半分のSCREEN2にそれぞれ表
示される。
Any one of the above PT1 ~ PT3 is SCR1 key 11 and SCR2
Display 2 calculated by operating key 12
It is displayed in SCREEN1 in the upper half of the upper part and SCREEN2 in the lower half.

第6図に示すディスプレイ2のSCREEN1にはPT1の波形
と分析モード「LOW」が設定され、SCREEN2にはPT1の波
形と分析モード「HIGH」が設定されている。
The waveform of PT1 and the analysis mode "LOW" are set in SCREEN1 of the display 2 shown in FIG. 6, and the waveform of PT1 and the analysis mode "HIGH" are set in SCREEN2.

次に、SCR1キー11及びSCR2キー12により第6図乃至第
8図に図示の分析画面が表示される処理関係を第9図の
基本フローチャートの概要により説明する。
Next, the processing relationship in which the analysis screens shown in FIGS. 6 to 8 are displayed by the SCR1 key 11 and the SCR2 key 12 will be described with reference to the outline of the basic flowchart of FIG.

電源スイッチ76をオンすると、フロー100でタイトル
画像情報をSCR1キー11及びSCR2キー12の画像メモリに格
納してディスプレイ2にタイトルを表示する。フロー10
1でSCR1キー11にあるBEGINキー11−1の押圧を検出して
訓練がスタートする。フロー102と103でSCR1キー11の押
圧かSCR2キー12の押圧を検出する。これらのフローはキ
ー入力待ちのフローであり、処理を終えてL100を経て戻
ってきた場合もこのフローに来て次のキー入力を待つ。
SCR1キー11の押圧であれば、フロー104でENDキー11−2
が押圧されたかどうかを検出する。ENDキー11−2が押
圧されていればフロー100のタイトル映像に戻り、そう
でなければフロー105でSCR1キー用の制御パラメータ・
フラグを設定する。同様にフロー103でSCR2キー12の押
圧を検出した時はフロー106でSCR2キー用の制御パラメ
ータ・フラグを設定する。該フラグを設定することによ
り以後の処理はSCR1キー11及びSCR2キー12別にメモリ14
の制御パラメータ・フラグメモリ上に設定された情報を
読み書きすることにより行なう。
When the power switch 76 is turned on, the title image information is stored in the image memory of the SCR1 key 11 and the SCR2 key 12 in flow 100, and the title is displayed on the display 2. Flow 10
At 1, the pressing of the BEGIN key 11-1 on the SCR1 key 11 is detected to start the training. Pressing SCR1 key 11 or SCR2 key 12 is detected in flows 102 and 103. These flows are waiting for key input, and even when the process is completed and the process returns via L100, the process also comes to this flow and waits for the next key input.
If SCR1 key 11 is pressed, END key 11-2 in flow 104
Detects whether or not was pressed. If the END key 11-2 is pressed, the flow returns to the title image of flow 100, otherwise, in flow 105, the control parameter for the SCR1 key
Set the flag. Similarly, when the pressing of the SCR2 key 12 is detected in the flow 103, the control parameter flag for the SCR2 key is set in the flow 106. By setting this flag, the subsequent processing is performed by the memory 14 for each SCR1 key 11 and SCR2 key 12.
Control parameters and flags are read and written from the information set on the memory.

制御パラメータ・フラグメモリには、アドレスポイン
タ、「LOW」「HIGH」の分析モード別とこれに伴う高速
フーリェ変換の窓長とピッチ抽出の周波数範囲情報、カ
ーソルの位置情報、分析画面(第7図のPT1〜PT3)の区
別とそれに伴うフラグ(FSCR,FCL1〜3)などのSCR1キ
ー11及びSCR2キー12の処理に必要な情報が格納されてい
る。ステップ107でWAVE MODEキー11−7又は12−7の押
圧であることが検出されたら、フロー108でフラグFCL1
が“1"か“0"かを判定する。フラグFCL1は、前回迄の分
析画面PT1がディスク15に格納されているかどうかを示
すフラグで、“1"ならば格納されていないので、フロー
109で新たに実行処理して分析画面PT1を表示し、フロー
110でFCL1を“0"にしてフロー111で処理結果をディスク
15に格納する。フロー108で“0"と判定されると前回ま
での処理結果がディスク15に格納されているので、フロ
ー112でこれを読出して表示する。フロー109,112の(PL
AY)はこれらの処理中にPLAYキー11−12又は12−12が押
圧された時、処理を一旦停止して音声メモリの内容を再
生することを表わしている。(PLAY)については、以後
も同様の意味を有する。フロー113でフラグFSCRを“1"
にする。フラグFSCRは表示中の分析画面を表わしてお
り、“1"の時はPT1、“2"の時はPT2、“3"の時はPT3を
表わしている。以上で処理が終了したことになり、L100
を経てフロー102,103で次のキー入力待ちとなる。
In the control parameter / flag memory, there are address pointers, "LOW" and "HIGH" analysis modes, and the associated window length of high-speed Fourier transform and frequency range information for pitch extraction, cursor position information, analysis screen (Fig. 7). PT1 to PT3) and associated flags (FSCR, FCL1 to 3) and other information necessary for processing the SCR1 key 11 and SCR2 key 12 are stored. If it is detected in step 107 that the WAVE MODE key 11-7 or 12-7 has been pressed, in step 108 the flag FCL1
Whether is "1" or "0". The flag FCL1 is a flag indicating whether or not the analysis screen PT1 up to the previous time is stored in the disk 15, and if it is “1”, it is not stored.
In 109, newly execute processing, display analysis screen PT1, and
Set FCL1 to "0" at 110 and record the processing result at flow 111.
Store in 15. If it is determined to be "0" in the flow 108, the processing result up to the previous time is stored in the disk 15, so this is read and displayed in the flow 112. Flow 109,112 (PL
AY) indicates that when the PLAY key 11-12 or 12-12 is pressed during these processes, the process is temporarily stopped and the contents of the audio memory are reproduced. The meaning of (PLAY) has the same meaning thereafter. Flag FSCR is set to "1" in flow 113
To The flag FSCR indicates the analysis screen being displayed, and indicates "1" for PT1, "2" for PT2, and "3" for PT3. With the above, the processing is completed, and L100
After that, the process waits for the next key input in flows 102 and 103.

次にフロー114でパターン分析であるPATTERNキー11−
8又は12−8の押圧を検出した時は、フロー115でフラ
グFCL2が“1"か“0"かを判定する。フラグFCL2は前回ま
での分析画面PT2がディスク15に格納されているかどう
かを示すフラグである。以後L100に至るまでの処理は、
WAVE MODEキー11−3又は12−3のときと同じフローに
なるので、その説明を省略する。次にフロー116でイン
トネーションの訓練をするためにINTONATIONキー11−10
又は12−10キーの押圧を検出した時は、フロー117でフ
ラグFCL3が“1"か“0"かを判定する。フラグFCL3は前回
までの分析画面PT3がディスク15に格納されているかど
うかを示すフラグである。以後L100に至るまでの処理は
前記と同様なフローとなる。
Next, in PATTERN key 11-
When the pressure of 8 or 12-8 is detected, the flow 115 determines whether the flag FCL2 is "1" or "0". The flag FCL2 is a flag indicating whether or not the analysis screen PT2 up to the previous time is stored in the disk 15. After that, the process up to L100 is
Since the flow is the same as that for the WAVE MODE key 11-3 or 12-3, its explanation is omitted. Next, in flow 116, INTONATION key 11-10 for training intonation
Alternatively, when the press of the 12-10 key is detected, it is determined in the flow 117 whether the flag FCL3 is "1" or "0". The flag FCL3 is a flag indicating whether or not the analysis screen PT3 up to the previous time is stored in the disk 15. After that, the process up to L100 is similar to the above.

フロー118でRECORDキー11−11又は12−11の押圧を検
出した時は、フロー119で前回までの分析画面PT1をディ
スク15から読出しディスプレイ2に表示する。これは前
回録音したものを消去してよいものかどうかの注意とな
る。STOPキー11−13又は12−13を押圧した時はL100へ抜
けられる。フロー120で録音を実行するが、まず、音声
立上りメモリへの録音が開始される。音声入力が立上ら
ないうちにSTOPキー11−13又は12−13が押圧されると、
入力が何もなかったことになるので、事実上録音キャン
セルとみなされ、前回までの音声メモリの内容を消去す
ることなくフロー121を経てL100に至る。録音が完全に
終了した場合と、音声入力が立上ってからSTOPキー11−
13又は12−13が押圧された場合には音声メモリに新たな
音声データが書き込まれる。その後、音声入力の立上り
部分が録音された音声立上りメモリの内容を音声メモリ
に転送してフロー122に向う。この囲み部分Iの詳細は
第11図で説明する。音声メモリがリフレッシュしたの
で、ディスク15に格納された前回までの分析画面をすべ
て無効とするためにフロー122ではFCL1〜3をすべて
“1"にして新たに実行処理するようにしてからフロー10
8に向う。そしてフロー108,109,110,111,113を経て新た
に入力した音声データの分析画面PT1を表示しL100に至
る。したがって教師又は学習者は自分で入力した音声波
形を見ることになり、第6図で説明したように、波形α
が点線LV,LVの間に入ってしまった時は、再度RECORDキ
ー11−11又は12−11を押圧してフロー119以後の処理を
行なう。
When the pressing of the RECORD key 11-11 or 12-11 is detected in the flow 118, the previous analysis screen PT1 is read from the disk 15 and displayed on the display 2 in the flow 119. This is a caution as to whether or not the previously recorded one can be erased. When you press the STOP key 11-13 or 12-13, you can exit to L100. Recording is executed in the flow 120, but first, recording in the voice rising memory is started. If the STOP key 11-13 or 12-13 is pressed before voice input rises,
Since there is no input, it is considered that the recording has been canceled, and the flow reaches the L100 through the flow 121 without erasing the contents of the voice memory up to the previous time. When recording is completed or after the voice input rises, press the STOP key 11-
When 13 or 12-13 is pressed, new voice data is written in the voice memory. After that, the content of the voice rising memory in which the rising portion of the voice input is recorded is transferred to the voice memory, and the flow proceeds to the flow 122. Details of the enclosed portion I will be described with reference to FIG. Since the voice memory has been refreshed, in order to invalidate all the analysis screens up to the previous time stored in the disk 15, in the flow 122, FCL1 to 3 are all set to "1" and a new execution process is performed, and then the flow 10
Go to 8. Then, the analysis screen PT1 of the newly input voice data is displayed through the flows 108, 109, 110, 111, 113, and the process reaches L100. Therefore, the teacher or the learner sees the voice waveform input by himself / herself, and as shown in FIG.
When is entered between the dotted lines LV and LV, the RECORD key 11-11 or 12-11 is pressed again to perform the processing after the flow 119.

フロー123でACCENTキー11−9又は12−9の押圧を検
出した時は、フロー124,125で表示中の分析画面がPT1
(FSCR=1)かあるいはPT2(FSCR=2)であるかを判
定する。PT2の場合は、フロー126により第8図に示すよ
うにアクセント分析が追加され、PT1の場合はフロー127
によりアクセント分析(パワー)を追加するかあるいは
分析モードの代りにアクセント分析を表示し、L100に至
る。
When the press of the ACCENT key 11-9 or 12-9 is detected in the flow 123, the analysis screen displayed in the flows 124 and 125 is PT1.
It is determined whether (FSCR = 1) or PT2 (FSCR = 2). In the case of PT2, accent analysis is added by flow 126 as shown in FIG. 8, and in the case of PT1, flow 127.
To add accent analysis (power) or to display accent analysis instead of analysis mode, leading to L100.

音声メモリの内容をファイルとして保存しておきたい
ときは、SAVEキー11−6又は12−6を押圧する。この時
はフロー128,129を経てフロー130で専用キーボード3の
英数字キー10によりファイル名を入力し、フロー131でS
AVEを実行し、音声メモリの内容をディスク15に格納
し、フロー132に向う。もしもフロー130でSTOPキー11−
13又は12−13を押圧すると、ファイル化をキャンセルし
たとみなされ、直接フロー132に向う。フロー132ではフ
ァイルインデックスを表示する前の分析画面に戻す。
To save the contents of the audio memory as a file, press the SAVE key 11-6 or 12-6. At this time, the file name is input by the alphanumeric key 10 of the dedicated keyboard 3 in flow 130 through flow 128 and 129, and in flow 131 S
AVE is executed, the contents of the audio memory are stored in the disk 15, and the flow goes to 132. If flow 130, STOP key 11-
When 13 or 12-13 is pressed, it is considered that filing is canceled, and the flow directly goes to the flow 132. In the flow 132, the analysis screen before displaying the file index is returned.

逆に、保存しておいたファイルから音声メモリの内容
を読み出したい時はLOADキー11−4又は12−4を押圧す
る。
On the contrary, to read the contents of the voice memory from the saved file, press the LOAD key 11-4 or 12-4.

フロー133,134を経てフロー135でファイル名を英数字
キー10により入力し、フロー136でLOADを実行し、音声
メモリの内容をディスク15から読み出す。この場合も音
声メモリがリフレッシュしたので、再度音声分析してデ
ィスク15に格納するためにフロー137ではFCL1〜3をす
べて“1"にしてフロー108に向い、新たな音声データの
分析画面PT1を表示してL100に至る。
The file name is input by the alphanumeric key 10 in flow 135 through flows 133 and 134, LOAD is executed in flow 136, and the contents of the audio memory are read from the disk 15. In this case as well, since the voice memory is refreshed, in order to analyze the voice again and store it in the disk 15, all the FCL1 to FCL1 to 3 are set to "1" in the flow 137, and the flow 108 is displayed, and a new voice data analysis screen PT1 is displayed. Then it reaches L100.

もしもフロー135でSTOPキー11−13又は12−13を押圧
した時はファイルの読み出しをキャンセルしたとみなさ
れ、フロー138でファイルインデックスを表示する前の
分析画面に戻し、L100に至る。
If the STOP key 11-13 or 12-13 is pressed in the flow 135, it is considered that the reading of the file is canceled, and in the flow 138, the analysis screen before displaying the file index is returned to L100.

フロー139でMODEキー11−3又は12−3の押圧を検出
した時は、フロー140で表示中の分析画面がPT1(FSCR=
1)かどうかを判定する。分析画面PT1が表示されてい
るときは、フロー141で分析モードの修正を実行する。
すなわち、「LOW」→「HIGH」あるいは「HIGH」→「LO
W」と表示変更する。これに伴ってメモリ14の制御パラ
メータ・フラグメモリの高速フーリェ変換の窓長やピッ
チ抽出の周波数範囲情報が変更される。
When the press of the MODE key 11-3 or 12-3 is detected in flow 139, the analysis screen displayed in flow 140 is displayed as PT1 (FSCR =
1) Determine if it is. When the analysis screen PT1 is displayed, the analysis mode is corrected in the flow 141.
That is, “LOW” → “HIGH” or “HIGH” → “LO
Change the display to "W". Along with this, the window length for high-speed Fourier transform and the frequency range information for pitch extraction in the control parameter / flag memory of the memory 14 are changed.

したがって分析画面PT2,PT3は再度計算する必要があ
り、フロー142でフラグFCL2,FCL3をそれぞれ“1"にして
新たに分析処理するように配慮してL100に向う。
Therefore, it is necessary to recalculate the analysis screens PT2 and PT3, and in the flow 142, the flags FCL2 and FCL3 are set to "1", and the analysis processing is newly performed toward the L100.

フロー143で横方向移動カーソル・キー11−151又は12
−151の押圧を検出した時は、フロー144で例えば左のカ
ーソル80(第7図)の移動を実行する。移動したカーソ
ル80の位置は制御パラメータ・フラグメモリのカーソル
位置情報を書き換える。分析画面PT1においては、左右
のカーソル80,81ではさまれた部分をパターン分析する
のであるから、カーソル80を動かせば新たに分析処理を
するように配慮する必要がある。分析画面PT3において
は、左右のカーソル85,86ではさまれた部分の音声再生
をするのみであるから、カーソル85,86を動かしても新
たに分析処理をしなくてよい。分析画面PT2もPT3と同様
にカーソル83,84間の音声再生をするのみであるから新
たに分析処理をしなくてよい。したがってフロー145で
分析画面がPT1(FSCR=1)の場合を判定してフロー146
でフラグFCL2を“1"にして新たに分析処理をするように
配慮してL100に向う。
Move horizontally in flow 143 Cursor keys 11-15 1 or 12
When the pressure of -15 1 is detected, the left cursor 80 (FIG. 7) is moved in the flow 144, for example. The position of the moved cursor 80 rewrites the cursor position information in the control parameter / flag memory. In the analysis screen PT1, since the pattern sandwiched between the left and right cursors 80 and 81 is subjected to pattern analysis, it is necessary to consider performing a new analysis process by moving the cursor 80. In the analysis screen PT3, since only the portion of the sound sandwiched by the left and right cursors 85 and 86 is reproduced, even if the cursors 85 and 86 are moved, new analysis processing is not required. Like the analysis screen PT2, the analysis screen PT2 only reproduces the sound between the cursors 83 and 84, so that the analysis process need not be newly performed. Therefore, the flow 145 determines whether the analysis screen is PT1 (FSCR = 1) and the flow 146
Set the flag FCL2 to "1" and proceed to the L100, taking into consideration a new analysis process.

フロー147で横方向移動カーソル・キー11−152又は12
−152の押圧を検出した時は、フロー148で例えば右のカ
ーソル81(第7図)の移動を実行する。左のカーソル80
と同様にカーソル位置情報が書き換えられるのでフロー
145に向う。フロー144と148の星印は☆キー11−17,12−
17が横方向移動カーソルキー11−151又は11−152,12−1
51又は12−152と同時に押圧されたときはカーソル80,81
が高速に移動することを表わしている。星印について
は、これ以後も同様の意味を有する。
Move horizontally in flow 147 Cursor keys 11-15 2 or 12
Upon detecting the pressing of -15 2 executes the movement of the flow 148, for example, the right of the cursor 81 (Figure 7). Left cursor 80
Since the cursor position information is rewritten like
Go to 145. The stars of flow 144 and 148 are ☆ keys 11-17, 12-
17 is moved horizontally Cursor keys 11-15 1 or 11-15 2 , 12-1
5 1 or 12-15 2 When pressed simultaneously, cursors 80, 81
Indicates that it moves at high speed. The asterisk has the same meaning thereafter.

フロー149で縦方向移動カーソルキー11−161,12−161
の押圧を検出した時は、フロー150で表示中の分析画面
がPT2(FSCR=2)であるかどうかを判定する。このキ
ーは、第7図では、第1ホルマントを指し示す三角印87
が移動する。したがってフロー151で分析画面PT2のとき
にのみ第1ホルマント指示用三角印87を移動する。
Move vertically in flow 149 Cursor keys 11-16 1 , 12-16 1
When the press of is detected, it is determined whether the analysis screen being displayed in flow 150 is PT2 (FSCR = 2). This key is shown in Figure 7 as a triangle 87 pointing to the first formant.
Moves. Therefore, in the flow 151, the first formant designating triangular mark 87 is moved only when the analysis screen PT2 is displayed.

フロー152で縦方向移動カーソルキー11−162,12−162
の押圧を検出すした時もカーソルキー11−161,12−161
と同様にフロー153で分析画面PT2の場合を選択し、フロ
ー154で第7図の第2ホルマントを指し示す三角印88の
移動を行なう。
Move vertically in flow 152 Cursor keys 11-16 2 , 12-16 2
Even when the press of is detected, the cursor keys 11-16 1 , 12-16 1
Similarly to the above, the case of the analysis screen PT2 is selected in the flow 153, and the triangle mark 88 indicating the second formant in FIG. 7 is moved in the flow 154.

フロー155でPRINTキー11−5,12−5の押圧を検出した
時はフロー156で表示画面のハードコピーが印刷され
る。途中でSTOPキー11−13,12−13が押圧されると印刷
は中止する。
When the press of the PRINT keys 11-5 and 12-5 is detected in flow 155, a hard copy of the display screen is printed in flow 156. If the STOP key 11-13, 12-13 is pressed midway, printing is stopped.

フロー157でPLAYキー11−12,12−12の押圧を検出した
時はフロー158で音声メモリを再生する。
When the press of the PLAY keys 11-12 and 12-12 is detected in flow 157, the voice memory is reproduced in flow 158.

第9図には図示しなかったが、HOMEキー11−14,12−1
4を押圧した時、カーソル80と81,83と84,85,86はそれぞ
れ左端と右端に移動し、三角印87と88は下端に移動す
る。
Although not shown in FIG. 9, HOME key 11-14, 12-1
When 4 is pressed, the cursors 80 and 81, 83 and 84, 85, 86 move to the left and right ends, respectively, and the triangular marks 87 and 88 move to the lower end.

次に、第9図の基本フローチャート中に示した録音動
作(囲み部分I)、イントネーション分析動作(囲み部
分II)及びパターン分析動作(囲み部分IV)について詳
細なフローチャートを参照しながら説明する。
Next, the recording operation (box I), intonation analysis operation (box II), and pattern analysis operation (box IV) shown in the basic flowchart of FIG. 9 will be described with reference to a detailed flowchart.

録音動作 音声メモリは、第10図に示すように、例えばvoice
(0)〜voice(59531)に59532個の音声データを格納
できる。アナログ音声データは、12KHzのメイン発振器4
2に従ってA−D変換器37でディジタルデータD2〜D
13(12ビット)に変換されて音声メモリに格納されてい
くので、音声データ1個当りの時間長は0.083ミリ秒と
なる。したがって音声メモリには、59532個では約4.96
秒の長さの音声データを格納できる。
Recording operation The voice memory is, for example, voice as shown in Fig. 10.
59532 pieces of voice data can be stored in (0) to voice (59531). Analog voice data is a 12KHz main oscillator 4
In accordance with 2, digital data D 2 to D are converted by the AD converter 37.
Since it is converted into 13 (12 bits) and stored in the voice memory, the time length per voice data is 0.083 milliseconds. Therefore, in the voice memory, 59,532 units are about 4.96.
It can store voice data of a length of seconds.

この59532という個数は画面表示に関係する。第6図
に示したディスプレイ2において、波形表示の可能なX
軸方向範囲は1023−120−1=902ドットとなるから、音
声メモリの内容を波形表示する時、59532/902=66から6
6個の音声データを1ドットとして表示すればよい。こ
のまとめ方については66個のうちの最大値と最小値を探
索して結線する等の方法がある(詳細は特願昭61−3037
72号の明細書を参照されたい)。
The number of 59532 is related to the screen display. On the display 2 shown in FIG. 6, an X that can display a waveform is displayed.
The axial range is 1023−120−1 = 902 dots, so when displaying the contents of the voice memory in waveform, 59532/902 = 66 to 6
It is sufficient to display 6 voice data as 1 dot. There is a method to connect this by searching for the maximum value and the minimum value out of 66 (see Japanese Patent Application No. 61-3037 for details).
See the specification of No. 72).

音声立上りメモリは音声入力が十分に立上ったかどう
かを判定するバッファ的な役目を有するもので、第10図
に示すように、例えばvrise(0)〜vrise(4095)の40
96個のメモリ容量を有し、約341ミリ秒の長さの音声デ
ータを格納できる。
The voice rising memory has a role as a buffer for determining whether or not the voice input has risen sufficiently, and as shown in FIG. 10, for example, 40 of vrise (0) to vrise (4095).
It has a memory capacity of 96 and can store audio data with a length of about 341 milliseconds.

音声立上りメモリと音声メモリとの関係を第11図によ
り説明する。
The relationship between the voice rising memory and the voice memory will be described with reference to FIG.

まず、フロー200で、第5図示の出力ポート36(OUT
3)の出力端子RECを“H"にすると、電子スイッチ40,71
がオンになる。入力セレクタ16で選択された入力端子MI
C,AUX1及びAUX2のいずれか1つの入力信号(音声信号)
が、電子スイッチ40、アンチエリアシングフィルタ39及
び加算アンプ38を経てA−D変換器37へ入力する。その
入力レベルは電子スイッチ71を経てレベル表示器72を駆
動し、レベルメータ73のLED74を入力レベルに応じて点
灯させる。これから音声のレベルをチェックする。
First, in the flow 200, the output port 36 (OUT
When the output terminal REC of 3) is set to “H”, the electronic switches 40,71
Turns on. Input terminal MI selected by input selector 16
Any one input signal (audio signal) of C, AUX1 and AUX2
Input to the AD converter 37 via the electronic switch 40, the anti-aliasing filter 39 and the summing amplifier 38. The input level drives the level indicator 72 via the electronic switch 71 to turn on the LED 74 of the level meter 73 according to the input level. Check the audio level from now on.

フロー201で音声立上りメモリポインタr=0とす
る。フロー202で出力ポート34(OUT1)の出力端子Q1
“H"とすると、AND回路62を分周器64の3Hz出力が通過
し、OR回路63を経て録音時間インディケータ60のLED611
を点滅させる。これにより使用者は録音動作に入ったこ
とを確認する。フロー203でSTOPキー11−13又は12−13
が押圧されたかを検出する。音声が立上らないうちにST
OPキー11−13又は12−13が押圧されると、録音キャンセ
ルであるから、録音動作を終了する。フロー204,205で
入力ポート33(IN1)の端子D1に入力されるメイン発振
器42の12KHzの信号を検出する。A−D変換器37のA−
D変換のタイミングは、メイン発振器42の出力によって
第12図に示すように実行されるので、フロー204でメイ
ン発振器42の出力の“L"を検出した後、フロー205で
“H"を検出した直後に変換データを入力ポート33に取り
込めばよい。フロー206で入力ポート33に入力する変換
データD2〜D13を音声立上りメモリのvrise(r)に格納
する。フロー207でポインタをインクリメントし、フロ
ー208,209でポインタの循環を行なう。フロー210で音声
信号の変換データD2〜D13が一定値以上かどうか、すな
わち音声データが立上ったかどうかを判定する。立上ら
ないうちはL200を回ってフロー203に向い、音声立上り
メモリの4096個のvrise(0),vrise(1),vrise
(2)…vrise(4095)に変換データD2〜D13が第10図の
FLOW1で示したように循環して書込まれる。音声信号の
変換データD2〜D13が一定値を越えた時はL201へ進み、
第10図のFLOW2で示したように引き続き変換データを音
声メモリの4097個目のvoice(4096)から書込んでい
く。
In the flow 201, the voice rising memory pointer r = 0. When the output terminal Q 1 of the output port 34 (OUT1) is set to “H” in the flow 202, the 3 Hz output of the frequency divider 64 passes through the AND circuit 62, passes through the OR circuit 63, and the LED 61 1 of the recording time indicator 60.
Flashes. Thereby, the user confirms that the recording operation is started. STOP key 11-13 or 12-13 in flow 203
Detects whether or not was pressed. ST before the voice rises
When the OP key 11-13 or 12-13 is pressed, since the recording is canceled, the recording operation is ended. The flows 204 and 205 detect the 12 KHz signal of the main oscillator 42 input to the terminal D 1 of the input port 33 (IN1). A- of A-D converter 37
Since the timing of D conversion is executed by the output of the main oscillator 42 as shown in FIG. 12, after detecting “L” of the output of the main oscillator 42 in Flow 204, “H” is detected in Flow 205. Immediately after that, the converted data may be taken into the input port 33. The conversion data D 2 to D 13 input to the input port 33 in the flow 206 are stored in vrise (r) of the voice rising memory. In step 207, the pointer is incremented, and in steps 208 and 209, the pointer is circulated. In flow 210, it is determined whether or not the converted data D 2 to D 13 of the audio signal is a certain value or more, that is, whether the audio data has risen. Before rising, it goes around the L200 and goes to the flow 203, and 4096 vrise (0), vrise (1), vrise of the voice rising memory
(2)… Converted data D 2 to D 13 to vrise (4095) are shown in Fig. 10.
It is written cyclically as shown in FLOW1. If the conversion data D 2 to D 13 of the audio signal exceeds a certain value, proceed to L201,
As shown by FLOW2 in FIG. 10, the conversion data is continuously written from the 4097th voice (4096) of the voice memory.

フロー211で音声メモリポインタv=4096とし、フロ
ー212でSTOPキー11−13又は12−13が押圧されたかを検
出する。録音途中でSTOPキー11−13又は12−13が押圧さ
れたときは音声メモリへの書込みを中止しL202に向う。
前と同様にフロー213,214で入力ポート33の端子D1
“L",“H"を検出してフロー215で変換データD2〜D13
音声メモリvoice(v)に格納する。フロー216でポイン
タ(v)のインクリメントを行ない、フロ217でポイン
タ(v)のカウントアップに従って録音時間インディケ
ータ60のLED612〜61Pの点灯を移動していき、音声メモ
リへの録音時間の進展状況を使用者に知らせる。すなわ
ち、500ミリ秒経過毎に点灯を進めるとすれば、500/0.0
83=6000よりvが6000カウントアップする毎に出力ポー
ト34(OUT1)の出力端子Q2→Q3→Q4の順に“H"にしてい
けばよい。例えばvが6000を越えてQ1からQ2へ“H"が移
動すると、AND回路62はオフになりOR回路63の出力はQ2
により“H"となって点滅していたLED611が点灯に変わ
る。vが12,000を越えてQ2からQ3へ“H"が移動すると、
OR回路63の出力は“L"となり、LED611は消灯し、2番目
のLED612が点灯する。vが18000を越えてQ3からQ4
“H"が移動すれば2番目のLED612が消灯し、3番目のLE
D613点灯する。以下同様である。フロー218でv>59531
になるとフロー218で録音の終了を検出する。音声メモ
リの最後部をすぎないうちは、L203を回って戻り、音声
メモリのvoice(4096),voice(4097),voice(409
8),…voice(59531)に音声データを次々に書込んで
いく。録音が終了すると、音声立上りメモリの内容を音
声メモリに転送して音声メモリへの格納を完全なものに
する。すなわち、フロー218が終了するとL202を経てフ
ロー219で音声メモリポインタv=0とする。フロー220
で音声立上りメモリvrice(r)の内容を1個だけメモ
リに転送する。フロー221で2つのポインタv,rをインク
リメントし、フロー222,223で音声立上りポインタrの
循環を行なう。フロー224で転送の終了を検出する。音
声立上りメモリのすべての内容を転送しないうちはL204
を回って戻り、次々に転送を行なっていく。転送が終了
すれば音声メモリは完全なものとなるので、L205へ抜
け、第9図のフロー122を経て分析画面PT1の波形表示へ
向う。フロー220での音声立上りメモリの音声メモリへ
の転送はフロー210で変換データD2〜D13が一定値以上と
判定されたときよりも1つだけ進んだ内容から順に音声
メモリに転送される。これはフロー207で音声立上りメ
モリポインタrがインクリメントされているためであ
る。例えば音声立上りメモリのvrise(1525)の変換デ
ータD2〜D13が一定値以上とフロー210で検出されたとき
は音声立上りメモリの内容の時間経過はvrise(1525)
の次のvrise(1526)の内容が最も古く、vrise(152
7),vrise(1528),vrise(1529),…を経てvrise(15
25)が最も新しい。したがってvrise(1526)をvoice
(0),vrise(1527)をvoice(1),vrise(1528)をv
oice(2),…を経てvrise(1525)をvoice(4095)へ
転送することにより音声メモリの録音時間経過は完全な
ものとなる。第11図に適用して考えてみると、フロー20
6で変換データD2〜D13をvrise(1525)に格納し、フロ
ー207でr=1526となってフロー210で一定値以上と判定
されてL201へ抜ける。従ってフロー220では最初にvrise
(1526)をvoice(0)に転送し、フロー221で2つのポ
インタがインクリメントされるので、次はvrise(152
7)をvoice(1)へ転送する。以下同様である。
In flow 211, the voice memory pointer v is set to 4096, and in flow 212 it is detected whether the STOP key 11-13 or 12-13 is pressed. When the STOP key 11-13 or 12-13 is pressed during recording, the writing to the voice memory is stopped and the process goes to L202.
As in the previous case, the flows 213 and 214 detect "L" and "H" of the terminal D 1 of the input port 33, and the flow 215 stores the conversion data D 2 to D 13 in the voice memory voice (v). In the flow 216, the pointer (v) is incremented, and in the flow 217, the LEDs 61 2 to 61 P of the recording time indicator 60 are turned on according to the count-up of the pointer (v), and the progress of the recording time to the voice memory is progressed. To inform the user. That is, if the lighting is advanced every 500 milliseconds, 500 / 0.0
Every time v counts up 6000 from 83 = 6000, output port 34 (OUT1) output terminals Q 2 → Q 3 → Q 4 may be set to “H” in that order. For example, if v is "H" from Q 1 to Q 2 beyond 6000 moves, the AND circuit 62 is the output of the OR circuit 63 turns off Q 2
Causes the LED 61 1 that has changed to “H” and blinking to turn on. When v goes over 12,000 and "H" moves from Q 2 to Q 3 ,
The output of the OR circuit 63 becomes “L”, the LED 61 1 goes off, and the second LED 61 2 goes on. v is if the movement is "H" to Q 4 2 th LED 61 2 is turned off from Q 3 exceeds 18000, the third LE
D61 3 Lights up. The same applies hereinafter. With flow 218 v> 59531
Then, the end of recording is detected in flow 218. If it is not past the end of the voice memory, go back around L203 to return to voice (4096), voice (4097), voice (409
8), ... Write voice data to voice (59531) one after another. When the recording is complete, the contents of the voice rise memory are transferred to the voice memory to complete the storage in the voice memory. That is, when the flow 218 ends, the voice memory pointer v = 0 is set in a flow 219 via L202. Flow 220
Then, only one content of the voice rising memory vrice (r) is transferred to the memory. In the flow 221, the two pointers v and r are incremented, and in the flows 222 and 223, the voice rising pointer r is circulated. The flow 224 detects the end of transfer. L204 unless all the contents of the voice start-up memory are transferred
It goes around and returns, and transfers are made one after another. When the transfer is completed, the voice memory is complete, so the flow advances to L205 to proceed to the waveform display of the analysis screen PT1 via the flow 122 of FIG. The transfer of the voice rising memory to the voice memory in the flow 220 is sequentially transferred to the voice memory from the content which is advanced by one from that when the converted data D 2 to D 13 is determined to be a certain value or more in the flow 210. This is because the voice rising memory pointer r is incremented in the flow 207. For example, when the conversion data D 2 to D 13 of the vrise (1525) of the voice rising memory is detected to be a certain value or more in the flow 210, the elapsed time of the contents of the voice rising memory is vrise (1525).
The next vrise (1526) is the oldest, and the vrise (152
7), vrise (1528), vrise (1529), and so on through vrise (15
25) is the newest. Therefore, voice vrise (1526)
(0), vrise (1527) to voice (1), vrise (1528) to v
By transferring vrise (1525) to voice (4095) via oice (2), ..., the recording time of the voice memory becomes complete. Applying to Fig. 11 and considering it, the flow 20
In step 6, the converted data D 2 to D 13 are stored in the rise (1525), and in the flow 207, r = 1526 and the flow 210 determines that the value is equal to or more than a certain value, and the process exits to L201. Therefore, in flow 220, first vrise
(1526) is transferred to voice (0), and the two pointers are incremented in flow 221.
Transfer 7) to voice (1). The same applies hereinafter.

以上説明したように音声立上りメモリを設けたことに
より、音声入力が立上ると自動的に音声メモリへの録音
が開始され、立上らないうちにストップキー11−13,12
−13の押圧したときは録音がキャンセルできるし、前回
の音声メモリの内容を消去することもない。また、音声
立上りメモリには、立上る前の音声データが約340ミリ
秒格納されるので、録音が途中から始まる心配もない。
As described above, by providing the voice start-up memory, recording to the voice memory automatically starts when voice input rises, and the stop key 11-13, 12
When -13 is pressed, the recording can be canceled and the previous contents of the voice memory will not be erased. Also, since the voice data before rising is stored in the voice rising memory for about 340 milliseconds, there is no concern that recording will start halfway.

イントネーション分析動作 イントネーション分析動作は第9図示の基本フローチ
ャートのフロー117の次の囲み部分IIで行なわれるが、
その詳細は第13図のフローチャートに示されている。
Intonation analysis operation Intonation analysis operation is performed in the next box portion II of the flow 117 of the basic flowchart shown in FIG.
The details are shown in the flowchart of FIG.

先ず、フロー300で出力ポート36(OUT3)の出力端子P
Iを“H"にすると、電子スイッチ70がオンとなる。D−
A変換器66の出力がローパスフィルタ69、電子スイッチ
70、加算アンプ38を経てA−D変換器37へ入力する。
First, in flow 300, output port P of output port 36 (OUT3)
When I is set to "H", the electronic switch 70 is turned on. D-
The output of the A converter 66 is a low-pass filter 69, an electronic switch
It is input to the A / D converter 37 via 70 and the addition amplifier 38.

フロー301で音声メモリポインタv=0、ワーキング
メモリポインタw=0、カウンタc=3としてから、フ
ロー302,303で入力ポート33(IN1)の端子D1に入力され
るメイン発振器42の12KHzの出力を検出する。端子Dが
“L"から“H"になると、フロー304で音声メモリのvoice
(r)から音声データを出力ポート35(OUT2)に出力す
る。この出力のタイミングはパソコン1の判定タイミン
グに依存するため、定時間とならずにジッタが含まれて
いるので、ラッチ65で12KHzの出力の立上りエッジで同
期をとってから、D−A変換器66でアナログ音声信号に
変換する(第12図を参照)。このアナログ音声信号をロ
ーパスフィルタ69でピッチ抽出にとって不必要な高域周
波数を低減してからA−D変換器37で再度ディジタル音
声信号に変換する。フロー305ではこの変換データD2〜D
13を取り込んでワーキングメモリのw mem(W)に格納
するフロー306で音声メモリポインタをインクリメント
し、フロー307でカウンタcのディクリメントを行な
う。フロー308〜310では、そのフローを見れば判るよう
にワーキングメモリポインタwはc=0になるまでイン
クリメントしない。換言すれば、フロー305を通過する
毎に変換データD2〜D13をワーキングメモリのw mem
(W)に3回重ね書きしてからインクリメントされる。
従って残存する変換データは3回目毎に書き込まれたも
のとなる。これは、ワーキングメモリw mem(W)のサ
ンプリング周波数が12KHz/3=4KHzに落ちたことを意味
する。ローパスフィルタ69でアナログ音声信号の帯域を
900Hz程度に狭めたので、これでも十分である。従って
この場合のワーキングメモリの容量は音声メモリの1/3
(59532/3=19844よりw mem(0)〜w mem(19843))
以上であればよい。フロー311で音声メモリの再生の終
了を検出する。音声メモリの最後部を越えないうちは、
L300を回って戻り、ワーキングメモリに変換データD2
D13を次々に書込んでいく。
The flow memory 301 sets the voice memory pointer v = 0, the working memory pointer w = 0, and the counter c = 3, and then the flows 302 and 303 detect the 12 KHz output of the main oscillator 42 input to the terminal D 1 of the input port 33 (IN1). To do. When the terminal D changes from "L" to "H", the flow of voice memory voice
The audio data is output from (r) to the output port 35 (OUT2). Since the timing of this output depends on the judgment timing of the PC 1, jitter is not included in the fixed time, so the latch 65 synchronizes with the rising edge of the output of 12 KHz, and then the DA converter. At 66, it is converted to an analog audio signal (see Fig. 12). The analog voice signal is reduced by the low-pass filter 69 to eliminate high frequencies that are unnecessary for pitch extraction, and then converted into a digital voice signal again by the AD converter 37. In flow 305, this converted data D 2 ~ D
The voice memory pointer is incremented in a flow 306 in which 13 is fetched and stored in w mem (W) of the working memory, and the counter c is decremented in a flow 307. In the flows 308 to 310, the working memory pointer w is not incremented until c = 0, as can be seen from the flow. In other words, every time the flow 305 is passed, the conversion data D 2 to D 13 are transferred to the working memory w mem.
It is incremented after overwriting (W) three times.
Therefore, the remaining conversion data is written every third time. This means that the sampling frequency of the working memory w mem (W) has dropped to 12 KHz / 3 = 4 KHz. The low-pass filter 69 reduces the bandwidth of the analog audio signal.
Since it was narrowed down to about 900Hz, this is sufficient. Therefore, the working memory capacity in this case is 1/3 of the voice memory.
(From 59532/3 = 19844 w mem (0) to w mem (19843))
The above is sufficient. In flow 311, the end of reproduction of the audio memory is detected. As long as the last part of the voice memory is not exceeded,
Turn around L300 to return, and convert data to working memory D 2 ~
Write D 13 one after another.

以上のようにして変換データD2〜D13を格納したワー
キングメモリの内容をもとにフロー312においてピッチ
抽出分析を行ない、その結果をピッチ値データpitch
(i)としてバッファメモリに格納する。いま、ワーキ
ングメモリの88個の変換データ毎に1つのピッチ値デー
タを得るとする。すなわち、w mem(0)〜w mem(87)
でpitch(0),w mem(88)〜w mem(175)でpitch
(1),…というように算出していく。ワーキングメモ
リのメモリ数が19844であるから19844/88=225.5とな
り、結局ピッチ値データpitch(0)〜pitch(224)が
算出される。
Based on the contents of the working memory storing the conversion data D 2 to D 13 as described above, the pitch extraction analysis is performed in the flow 312, and the result is the pitch value data pitch.
It is stored in the buffer memory as (i). Now, it is assumed that one pitch value data is obtained for every 88 converted data in the working memory. That is, w mem (0) to w mem (87)
At pitch (0), w mem (88) ~ w mem (175) at pitch
(1), and so on. Since the number of working memories is 19844, 1984/88 = 225.5, so that pitch value data pitch (0) to pitch (224) are calculated.

ピッチ値データの算出法は本発明の主旨ではないの
で、詳述しない(特願昭61−303772号の明細書を参照さ
れたい。)。
The method of calculating the pitch value data is not the main purpose of the present invention, and therefore will not be described in detail (see the specification of Japanese Patent Application No. 61-303772).

フロー313以後は、イントネーションの表示と発音音
声を断続的に再生してイントネーションの表示と発音音
声との対応を明確にする断続再生動作を実行する。
After the flow 313, the intermittent reproduction operation is executed to intermittently reproduce the display of the intonation and the sounded sound to clarify the correspondence between the display of the intonation and the sounded sound.

断続再生動作の例を第14図について説明する。第14図
(A)において区間k1〜k7に示したイントネーション表
示について断続再生動作を行なう場合、ピッチ値データ
pitch(i)が抽出できてグラフ表示が可能なk2,k4,k6
は、母音などのように比較的安定した波形が繰返す線ス
ペクトル構造に近い有声音の区間であり、これに対して
抽出できずにpitch(i)=0となってしまってグラフ
表示できないk1,k3,k5,k7は無音区間が或はランダム性
の波形が続く連続スペクトル構造の無声音の区間であ
る。
An example of the intermittent playback operation will be described with reference to FIG. When the intermittent reproduction operation is performed for the intonation display shown in the sections k 1 to k 7 in FIG. 14 (A), the pitch value data
k 2 , k 4 , k 6 where pitch (i) can be extracted and graph can be displayed
Is a section of a voiced sound close to a line spectrum structure in which a relatively stable waveform such as a vowel repeats. For this, pitch (i) = 0 cannot be extracted and graph display is not possible k 1 , k 3 , k 5 and k 7 are unvoiced intervals having a continuous spectral structure with silent intervals or random waveforms.

学習者は第14図(A)を見て自分のイントネーション
の欠点をつかむ必要があるが発音内容と第4図(A)の
イントネーション表示との対応関係が判らず困惑するこ
とがある。特にイントネーションは流れるように発音す
る長めの文章を扱うので、k1〜k7までを連続して再生し
ても対応関係をつかむには相当の訓練が必要である。断
続再生動作はのような不都合を解決するものであって、
イントネーション表示と再生を断続的に進めて発音内容
とイントネーション表示との対応関係をつかみ易くす
る。すなわち、第14図(B)に示すように、k1,k2まで
のイントネーション表示をした後再生し、500ミリ秒待
った後、第4図(C)に示すようにk3k4の区間のイント
ネーション表示をし、その後再生する。以下同様に500
ミリ秒程度の間合い時間をとって第4図(D)→第4図
(E)に断続的に移っていく。500ミリ秒の間合い時間
は対応がつかみ易く、かつ発音の全体の流れもつかみや
すい印象を与える。第14図(A)に示すように、断続点
の境界p1,p2,p3を有声音の後部とするときは問題ない
が、前部にもっていくと、音声の立上り部によく見られ
る無声音が断続再生の開始時に聴えない場合が多くな
り、言葉を理解する上で重要な音声の立上り部の情報が
欠ける場合が多くなるので好ましくない。
The learner must look at FIG. 14 (A) to grasp the defects of his / her intonation, but the learner may be confused by not knowing the correspondence between the pronunciation content and the intonation display of FIG. 4 (A). Intonation in particular deals with long sentences pronounced fluently, so considerable training is required to grasp the correspondence even if k 1 to k 7 are played continuously. The intermittent playback operation solves such inconveniences as
The intonation display and the playback are intermittently advanced so that the correspondence between the pronunciation content and the intonation display can be easily grasped. That is, as shown in FIG. 14 (B), after the intonation display up to k 1 and k 2 is displayed, the reproduction is performed and after waiting for 500 milliseconds, as shown in FIG. 4 (C), a section of k 3 k 4 is displayed. The intonation of is displayed and then played. And so on 500
The time shifts from FIG. 4 (D) to FIG. 4 (E) intermittently with a waiting time of about milliseconds. The 500 ms waiting time gives an impression that the correspondence is easy to grasp and the whole flow of pronunciation is easily grasped. As shown in FIG. 14 (A), see there is no problem when the boundary p 1, p 2, p 3 intermittent point the rear of the voiced and bring the front, often rising portion of the speech It is not preferable because the unvoiced sound generated is often inaudible at the start of intermittent reproduction, and the information on the rising portion of the voice, which is important for understanding words, is often omitted.

フロー313でピッチデータポインタi=0、音声メモ
リポインタv=0、音声メモリ第2ポインタdv=0とす
る。フロー314でピッチ値データpitch(i)が有声音か
無音又は無声音かを判定する。pitch(i)>0なら有
声音であるから、フロー315でpitch(i)を画面に表示
してフロー316に向う。pitch(i)=0のときは無音又
は無声音であるから直接フロー316に向う。フロー316で
は再正時に使用する音声メモリポインタvの修正を行な
うが、音声メモリの1/3のサンプル周波数に落したワー
キングメモリ88個毎にピッチデータポインタiをインク
リメントしてピッチ値データを得ているので、音声メモ
リポインタvを88×3進める必要がある。フロー317で
断続点(第14図のp1,p2,p3)を検出する。現在処理中の
ピッチ値データpitch(i)が有声音であり、かつ1つ
だけ進んだpitch(i+1)が無音又は無声音ならば断
続点と判断してフロー318へ向うが、断続的でなければ
続けてピッチ値データをグラフ表示しなければならない
ので、フロー321へ向う。フロー321でピッチデータポイ
ンタiをインクリメントし、フロー322でピッチ値デー
タの最後部i=224をすぎないうちはL301を回ってフロ
ー314に戻る。フロー317で断続点と判断した時は、既に
断続点までのピッチ値データの表示が終了しているの
で、フロー318で断続点までの音声を再生する。すなわ
ち、音声メモリのvoice(dv)からvoice(V)までの音
声データが出力ポート35(OUT2)へ出力し、D−A変換
器66でアナログ音声信号に変換される。このとき出力ポ
ート36(OUT3)の出力端子PLが“H"になって電子スイッ
チ67がオンになるので、該アナログ音声信号は電子スイ
ッチ67、加算アンプ26、ローパスフィルタ27及びパワー
アーアンプ29を経て出力端子SP.OUT,PHONE1,PHONE2から
スピーカ及びヘッドホンを駆動する。第14図で説明する
と、最初にフロー318に来たときは、第14図(B)に示
すようにk1k2のイントネーションが表示されてdv=0で
v=p1の位置を指示しているから、区間k1k2のイントネ
ーションに対応する音声が再生される。フロー319で500
ミリ秒待った後フロー320でdv=p1としておく。L301を
回って次にフロー318に来たときは、第14図(C)に示
すように、k3,k4におけるイントネーションが表示され
てdv=p1でv=p2の位置を指示しているから、区間k3k4
のイントネーションの表示に対応する音声が再生され
る。同様に次のk5,k6のイントネーションが第4図
(D)のように表示されてdv=p2でv=p3の位置を指示
しているから、区間k5k6のイントネーション表示に対応
する音声が再生される。フロー323は、第4図(E)の
区間k7の再生を行なうものであり、dv=p3であるから、
音声データvoice(p3)から最後のvoice(59531)まで
が再生される。
In flow 313, pitch data pointer i = 0, voice memory pointer v = 0, and voice memory second pointer dv = 0. In flow 314, it is determined whether the pitch value data pitch (i) is voiced sound, unvoiced sound, or unvoiced sound. If pitch (i)> 0, it is a voiced sound, and therefore flow 315 displays pitch (i) on the screen and goes to flow 316. When pitch (i) = 0, there is no sound or unvoiced sound, so the flow goes directly to the flow 316. In the flow 316, the voice memory pointer v used at the time of re-correction is corrected. The pitch data pointer i is incremented for each 88 working memories dropped to a sampling frequency of 1/3 of the voice memory to obtain pitch value data. Therefore, it is necessary to advance the voice memory pointer v by 88 × 3. At flow 317, the intermittent points (p 1 , p 2 , p 3 in FIG. 14) are detected. If the pitch value data pitch (i) currently being processed is a voiced sound and the pitch (i + 1) advanced by one is silent or unvoiced, it is judged to be an interruption point and the flow proceeds to the flow 318. Since it is necessary to display the pitch value data in a graph continuously, the flow goes to the flow 321. In flow 321, the pitch data pointer i is incremented, and in flow 322, until the last part i = 224 of the pitch value data is passed, the process goes around L301 and returns to flow 314. When it is determined in the flow 317 that it is the intermittent point, the display of the pitch value data up to the intermittent point has already been completed, so the voice up to the intermittent point is reproduced in the flow 318. That is, the voice data from voice (dv) to voice (V) in the voice memory is output to the output port 35 (OUT2), and is converted into an analog voice signal by the DA converter 66. At this time, the output terminal PL of the output port 36 (OUT3) becomes "H" and the electronic switch 67 is turned on. Therefore, the analog audio signal is transferred to the electronic switch 67, the addition amplifier 26, the low-pass filter 27 and the power amplifier 29. Then drive speakers and headphones from the output terminals SP.OUT, PHONE1 and PHONE2. Referring to FIG. 14, when the flow 318 first comes, as shown in FIG. 14 (B), the intonation of k 1 k 2 is displayed, and the position of v = p 1 is designated with dv = 0. Therefore, the sound corresponding to the intonation of the section k 1 k 2 is reproduced. Flow 319 to 500
After waiting for milliseconds, flow 320 sets dv = p 1 . When the player turns around L301 and then comes to flow 318, as shown in FIG. 14 (C), the intonation at k 3 and k 4 is displayed, and the position of v = p 2 is indicated by dv = p 1. Section k 3 k 4
The sound corresponding to the display of the intonation of is played. Similarly, the next intonation of k 5 and k 6 is displayed as shown in FIG. 4 (D), and the position of v = p 3 is indicated by dv = p 2 , so the intonation display of the section k 5 k 6 is displayed. The sound corresponding to is played. The flow 323 is for reproducing the section k 7 in FIG. 4 (E), and since dv = p 3 ,
The voice data voice (p 3 ) to the last voice (59531) are played.

第9図における囲み部分IIIでは、前回までのバッフ
ァメモリのピッチ抽出の内容をディスクから再度読出し
てきて直接フロー313以後の断続再生動作を行なえばよ
い。
In the boxed portion III in FIG. 9, the contents of the pitch extraction of the buffer memory up to the previous time may be read again from the disk and the intermittent reproduction operation after the direct flow 313 may be performed.

パターン分析動作 パターン分析動作は、第9図示の基本フローチャート
のフロー115の次の囲み部分IVで行なわれるが、その詳
細は第15図に示される。
Pattern Analysis Operation The pattern analysis operation is performed in the next boxed portion IV of the flow 115 of the basic flowchart shown in FIG. 9, the details of which are shown in FIG.

まず、フロー400で出力ポート36(OUT3)の出力端子S
Gを“H"にすると、電子スイッチ41がオンとなり、D−
A変換器66の出力をハイパスフィルタ68、電子スイッチ
41、アンチエリアシングフィルタ39、加算アンプ38を経
てA−D変換器37へ入力する回路が形成される。フロー
401で音声メモリポインタv=v1、ワーキングメモリポ
インタw=0とする。第7図で説明したようにパターン
分析である分析画面PT2は分析画面PT1のカーソル80−81
で囲まれた範囲をパターン分析したものであり、カーソ
ル80,81の音声メモリ上の位置がそれぞれvoice(v1)と
voice(v2)である。
First, in Flow 400, output terminal S of output port 36 (OUT3)
When G is set to "H", the electronic switch 41 is turned on and D-
The output of the A converter 66 is a high-pass filter 68, an electronic switch
A circuit for inputting to the AD converter 37 via 41, the anti-aliasing filter 39, and the adding amplifier 38 is formed. flow
In 401, the voice memory pointer v = v 1 and the working memory pointer w = 0 are set. As described in FIG. 7, the analysis screen PT2 which is the pattern analysis is the cursor 80-81 of the analysis screen PT1.
This is a pattern analysis of the area surrounded by, and the positions of the cursors 80 and 81 in the voice memory are voice (v 1 ) and
voice (v 2 ).

フロー402,403で入力ポート33(IN1)の端子D1へ入力
するメイン発振器42の12KHzの出力を検出し、フロー404
で音声メモリのvoice(V)の音声データを出力ポート3
5(OUT2)に出力してD−A変換器66からアナログ音声
信号を出力する。このフロー402〜404の詳細な動作はフ
ロー302〜304で説明したのと同様である。このアナログ
音声信号がA−D変換器37に入力するまでの間にハイパ
スフィルタ68でパターン分析で必要な高域周波数成分が
強調され、さらに、アンチエリアシングフィルタ39で音
声の帯域周波数以外の成分が除去され、A−D変換器37
で再度ディジタル音声信号に変換される。フロー405で
は、この変換データD2〜D13を取り込んでワーキングメ
モリw mem(W)に格納する。フロー406,407でポインタ
をインクリメントし、フロー408では音声メモリ上のカ
ーソルの範囲を出ないうちは、L400を回って戻り、ワー
キングメモリに変換データD2〜D13を次々に書込んでい
く。
The flows 402 and 403 detect the 12 KHz output of the main oscillator 42 input to the terminal D 1 of the input port 33 (IN1), and the flow 404
Outputs voice data of voice (V) in voice memory at port 3
The analog audio signal is output from the DA converter 66 by outputting to 5 (OUT2). The detailed operation of the flows 402 to 404 is the same as that described in the flows 302 to 304. The high-pass filter 68 emphasizes the high-frequency components necessary for pattern analysis until the analog voice signal is input to the A / D converter 37, and the anti-aliasing filter 39 further components other than the voice band frequency. Is removed, and the AD converter 37
Is converted into a digital voice signal again. In the flow 405, the converted data D 2 to D 13 are fetched and stored in the working memory w mem (W). The pointers are incremented in the flows 406 and 407, and in the flow 408, the converted data D 2 to D 13 are written in the working memory one after another while returning by going back to the L400 before returning from the cursor range on the voice memory.

以上のようにして格納したワーキングメモリの内容を
もとにフロー409において高速フーリェ変換してパワー
スペクトル値を算出し、これを濃淡階調の階調番号に変
換してバッファメモリに格納する。階調は7階調程度で
十分であるから1〜7の数値となる。処理結果をディス
クに格納するときにはこの階調番号データを格納する。
Based on the contents of the working memory stored as described above, a high speed Fourier transform is performed in flow 409 to calculate a power spectrum value, which is converted into a grayscale number of grayscale and stored in the buffer memory. About 7 gradations are sufficient, so the numerical values are 1 to 7. This gradation number data is stored when the processing result is stored in the disc.

さらに1〜7の階調番号データをもとに濃淡データを
選択して画像メモリに格納する。濃淡データとしては、
第16図に示すようなビットパターンセグメントなどがあ
る(濃部は“H"、薄部は“L")。結局第16図のビットパ
ターンセグメントがタイルを敷くように画像メモリに格
納されて分析画面PT2のような濃淡画像を形成する。
Further, the grayscale data is selected based on the gradation number data of 1 to 7 and stored in the image memory. As the grayscale data,
There are bit pattern segments as shown in Fig. 16 ("H" for dark areas, "L" for thin areas). Eventually, the bit pattern segments shown in FIG. 16 are stored in the image memory so as to lay tiles to form a grayscale image such as the analysis screen PT2.

再生動作 再生動作は、第17図に示すようなフローチャートに従
って行なわれる。
Reproduction Operation The reproduction operation is performed according to the flowchart shown in FIG.

まず、フロー500で出力ポート36(OUT3)の出力端子P
Lを“H"にすると、電子スイッチ67がオンとなり、D−
A変換器66の出力が加算アンプ26、ローパスフィルタ27
を経てパワーアンプ29へ入力する。パターン分析と同様
にフロー501で音声メモリポインタv=v1とし、フロー5
02,503で入力ポート38(IN1)の端子D1におけるメイン
発振器42の12KHzの出力を検出し、フロー504で音声メモ
リのvoice(V)の内容を出力ポート35(OUT2)に出力
してD−A変換器66からアナログ音声信号を出力する。
フロー505でポインタvをインクリメントし、フロー506
で音声メモリ上のカーソルの範囲(v1〜v2)から出ない
うちは再生動作を繰返すようにL500を回って戻る。以上
のように再生動作はカーソル間に限定するので、録音し
た波形上の任意の区間を再生して波形と発音との対応関
係をつかむことができる。また、もし第7図に示すよう
なパターン分析であるPT2上において再生動作をさせた
ときは、カーソル間の距離v0=v2−v1はPT2上のカーソ
ル83,84の音声メモリ上の位置voice(v1),voice(v2
から求められることになる。したがってパターン上の任
意の区間を再生してパターンと発音との対応関係をつか
むことができる。
First, in flow 500, output port P of output port 36 (OUT3)
When L is set to "H", electronic switch 67 is turned on and D-
The output of the A converter 66 is a summing amplifier 26 and a low pass filter 27.
And input to the power amplifier 29. Similar to the pattern analysis, the voice memory pointer v = v 1 is set in the flow 501, and the flow 5
02 and 503 detect the 12 KHz output of the main oscillator 42 at the terminal D 1 of the input port 38 (IN1), and the flow 504 outputs the contents of voice (V) of the voice memory to the output port 35 (OUT2) and DA The converter 66 outputs an analog audio signal.
The pointer v is incremented in flow 505, and flow 506
In one not out of the range of the cursor on the voice memory (v 1 ~v 2) returns around the L500 to repeat the reproduction operation. As described above, since the reproduction operation is limited to the cursor, it is possible to reproduce an arbitrary section on the recorded waveform and grasp the correspondence between the waveform and the pronunciation. If the reproducing operation is performed on PT2, which is the pattern analysis as shown in FIG. 7, the distance v 0 between cursors v 0 = v 2 −v 1 is the voice memory of cursors 83 and 84 on PT2. Position voice (v 1 ), voice (v 2 )
Will be required from. Therefore, it is possible to reproduce the arbitrary section on the pattern and grasp the correspondence between the pattern and the pronunciation.

(発明の効果) 本発明は上述のとおり構成されているので、次に記載
する効果を奏する。請求項1の発音訓練装置によれば、
教師と学習者の音声分析結果をそれぞれディスプレイに
一対の画面として表示できるから、教師は即座に学習者
の発音の誤りを指摘できるとともに学習者も納得しやす
い。また教師及び学習者は、それぞれのキーによって能
率よく自分の希望する音声分析結果を選択することがで
きるから能率的である。そしてイントネーションの訓練
をするとき、イントネーションのディスプレイへの表示
と発音音声との対応関係を、流れるように発音する長め
の文章でも明確につかむことができる。請求項2の記載
の発音訓練装置によれば、音声が立上ると自動的に音声
メモリへの録音が開始され、録音が途中から始まること
がない。請求項3記載の発明によれば、学習者の発音の
大きさが判定できるとともにそれ以外の音声信号発生手
段例えばテープレコーダ等の音声信号の録音レベルを所
望値に調整することができる。
(Effects of the Invention) Since the present invention is configured as described above, it has the effects described below. According to the pronunciation training device of claim 1,
Since the voice analysis results of the teacher and the learner can be respectively displayed on the display as a pair of screens, the teacher can immediately point out the learner's pronunciation error and the learner can easily understand. In addition, the teacher and the learner can efficiently select the desired voice analysis result by each key, which is efficient. Then, when training intonation, it is possible to clearly grasp the correspondence between the display of intonation and the pronunciation sound even in a long sentence that is pronounced fluently. According to the pronunciation training apparatus of the second aspect, when the voice rises, the recording in the voice memory is automatically started, and the recording does not start halfway. According to the invention described in claim 3, it is possible to determine the loudness of the pronunciation of the learner and adjust the recording level of the audio signal of other audio signal generating means such as a tape recorder to a desired value.

【図面の簡単な説明】[Brief description of drawings]

第1図は本発明の一実施例の外観を示す斜視図、第2図
はその専用キーボードの平面図、第3図はそのパソコン
の線図、第4図(A)(B)はその専用ユニットの正面
図及び裏面図、第5図はその外部回路の回路図、第6図
はそのディスプレイ表示の一例を示す正面図、第7図は
そのデイスプレイに表示される分析画面の3つの例を示
す図、第8図はその変形例を示す図、第9図はその基本
フローチャート、第10図はそのメモリの説明図、第11図
はその要部のフローチャート、第12図はその要部の作動
説明図、第13図は他の要部のフローチャート、第14図
(A)〜(E)はその作動説明図、第15図及び第17図は
それぞれ他の要部のフローチャート、第16図は濃淡階調
の階調番号と濃淡データとの対応説明図である。 1……パーソナルコンピュータ 2……ディスプレイ、3……専用キーボード 4……専用ユニット、11……教師用キー 12……学習者用キー
FIG. 1 is a perspective view showing the external appearance of an embodiment of the present invention, FIG. 2 is a plan view of the dedicated keyboard, FIG. 3 is a diagram of the personal computer, and FIGS. Front and rear views of the unit, FIG. 5 is a circuit diagram of its external circuit, FIG. 6 is a front view showing an example of its display, and FIG. 7 is three examples of analysis screens displayed on the display. FIG. 8, FIG. 8 is a diagram showing a modified example thereof, FIG. 9 is a basic flowchart thereof, FIG. 10 is an explanatory diagram of the memory thereof, FIG. 11 is a flowchart of its main part, and FIG. 12 is its main part. Operation explanatory diagram, FIG. 13 is a flowchart of other main parts, FIGS. 14 (A) to (E) are operation explanatory diagrams thereof, and FIGS. 15 and 17 are flowcharts of other main parts, FIG. 16 respectively. FIG. 6 is an explanatory diagram of correspondence between gradation numbers of gradations and gradation data. 1 ... Personal computer 2 ... Display, 3 ... dedicated keyboard 4 ... dedicated unit, 11 ... teacher key 12 ... learner key

───────────────────────────────────────────────────── フロントページの続き (72)発明者 橋本 克博 静岡県浜松市寺島町200番地 株式会社河 合楽器製作所内 (72)発明者 仁瓶 道子 静岡県浜松市寺島町200番地 株式会社河 合楽器製作所内 (56)参考文献 特開 昭61−121077(JP,A) 特開 昭61−6730(JP,A) 特開 昭61−6732(JP,A) 特開 昭59−214880(JP,A) 特開 昭59−12479(JP,A) 特開 昭57−96377(JP,A) ─────────────────────────────────────────────────── ─── Continuation of the front page (72) Inventor Katsuhiro Hashimoto 200 Terashimacho Hamamatsu City, Shizuoka Prefecture Kawai Musical Instrument Co., Ltd. (72) Inventor Michiko Nihei 200 Terashimacho Hamamatsu City Shizuoka Prefecture Kawai Musical Instrument Co., Ltd. (56) References JP 61-121077 (JP, A) JP 61-6730 (JP, A) JP 61-6732 (JP, A) JP 59-214880 (JP, A) JP-A-59-12479 (JP, A) JP-A-57-96377 (JP, A)

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】音声信号発生手段と、音声信号から発音に
伴う音声を分析する音声分析手段と、少なくとも音声デ
ータ及び音声分析結果を格納するメモリと、有効画面を
上半分、下半分の一対の画面構成とするディスプレイ
と、それぞれの画面に対応して少なくとも同じ訓練項目
を同じ相対位置に配列した複数の操作キーから成る2組
のキー群と、該キー群の操作によって前記ディスプレイ
上の一対の画面構成をそれぞれ独立に制御して音声分析
結果を比較表示する手段とを備える発音訓練装置におい
て、前記メモリに書き込まれたピッチ値データを順次読
み出し、該ピッチ値データが有声音の時は該ピッチ値デ
ータを前記ディスプレイに表示し、読み出されたピッチ
値データが有声音であり、かつ次に読み出されたピッチ
値データが無音又は無音声になった時は、それまで連続
して読み出された有声音のピッチ値データに対応する音
声を再生し、所定時間経過後残りの前記ピッチ値データ
について再び前記一連の動作を行なうイントネーション
分析動作手段を備えることを特徴とする発音訓練装置。
1. A voice signal generating means, a voice analyzing means for analyzing a voice associated with pronunciation from a voice signal, a memory for storing at least voice data and a voice analysis result, and a pair of an effective screen upper half and lower half. A display having a screen configuration, two sets of key groups consisting of a plurality of operation keys in which at least the same training items are arranged at the same relative positions corresponding to the respective screens, and a pair of keys on the display are operated by operating the key groups. In a pronunciation training apparatus provided with means for controlling and independently displaying the screen configuration and comparing and displaying the voice analysis results, the pitch value data written in the memory is sequentially read out, and when the pitch value data is voiced, the pitch value data is read. The value data is displayed on the display, the read pitch value data is voiced, and the next read pitch value data is silent or When it becomes a voice, an intonation analysis is performed in which the voice corresponding to the pitch value data of the voiced sound read continuously until then is reproduced, and after a lapse of a predetermined time, the series of operations is performed again for the remaining pitch value data. A pronunciation training device comprising an operating means.
【請求項2】前記メモリは、音声データを格納する音声
メモリ及び音声立上りメモリを有し、該音声立上りメモ
リに対して書き込み動作を循環させて該音声立上りメモ
リに音声データの立上り部分を書き込み、音声データが
一定値以上になった時に書き込み動作を前記音声メモリ
に切換え、該音声メモリの音声立上りメモリに相当する
未格納領域に続いて音声データを書き込み、その書き込
みの終了後に前記音声立上りメモリに書き込まれた音声
データを前記音声メモリの未格納領域に転送する録音動
作手段を備えることを特徴とする請求項1記載の発音訓
練装置。
2. The memory includes a voice memory for storing voice data and a voice rising memory, wherein a write operation is circulated to the voice rising memory to write a rising portion of the voice data to the voice rising memory, When the voice data exceeds a certain value, the writing operation is switched to the voice memory, the voice data is written following the unstored area corresponding to the voice rise memory of the voice memory, and after the writing is finished, the voice rise memory is written. 2. The pronunciation training apparatus according to claim 1, further comprising recording operation means for transferring the written voice data to an unstored area of the voice memory.
【請求項3】マイクロホン以外の音声信号発生手段の信
号伝送回路に録音レベル調整ボリュームを備えることを
特徴とする請求項1又は請求項2記載の発音訓練装置。
3. The pronunciation training apparatus according to claim 1, wherein a recording level adjusting volume is provided in the signal transmission circuit of the audio signal generating means other than the microphone.
JP63058267A 1988-03-14 1988-03-14 Pronunciation training device Expired - Fee Related JPH0812535B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP63058267A JPH0812535B2 (en) 1988-03-14 1988-03-14 Pronunciation training device
US07/735,108 US5142657A (en) 1988-03-14 1991-07-23 Apparatus for drilling pronunciation

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63058267A JPH0812535B2 (en) 1988-03-14 1988-03-14 Pronunciation training device

Publications (2)

Publication Number Publication Date
JPH01232379A JPH01232379A (en) 1989-09-18
JPH0812535B2 true JPH0812535B2 (en) 1996-02-07

Family

ID=13079394

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63058267A Expired - Fee Related JPH0812535B2 (en) 1988-03-14 1988-03-14 Pronunciation training device

Country Status (1)

Country Link
JP (1) JPH0812535B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009028298A (en) * 2007-07-27 2009-02-12 Tokyo Metropolitan Univ Method and apparatus for evaluating abdominal breathing

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160163226A1 (en) * 2013-07-19 2016-06-09 Benesse Corporation Information processing device, information processing method, and program

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5796377A (en) * 1980-12-05 1982-06-15 Matsushita Electric Ind Co Ltd Pronuntiation training apparatus
JPS5912479A (en) * 1982-07-12 1984-01-23 三洋電機株式会社 Pronuntiation practicing apparatus
JPS59214880A (en) * 1983-05-20 1984-12-04 キヤノン株式会社 Information processor
JPS616730A (en) * 1984-06-21 1986-01-13 Fujitsu Ltd Vocal training device
JPS616732A (en) * 1984-06-21 1986-01-13 Fujitsu Ltd Vocal training device
JPH0685105B2 (en) * 1984-11-19 1994-10-26 富士通株式会社 Vocal training method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009028298A (en) * 2007-07-27 2009-02-12 Tokyo Metropolitan Univ Method and apparatus for evaluating abdominal breathing

Also Published As

Publication number Publication date
JPH01232379A (en) 1989-09-18

Similar Documents

Publication Publication Date Title
US7579541B2 (en) Automatic page sequencing and other feedback action based on analysis of audio performance data
US6358054B1 (en) Method and apparatus for teaching prosodic features of speech
US5563358A (en) Music training apparatus
US4969194A (en) Apparatus for drilling pronunciation
US4771671A (en) Entertainment and creative expression device for easily playing along to background music
US7094962B2 (en) Score data display/editing apparatus and program
US20090114079A1 (en) Virtual Reality Composer Platform System
US20080010068A1 (en) Method and apparatus for language training
US5142657A (en) Apparatus for drilling pronunciation
US9601029B2 (en) Method of presenting a piece of music to a user of an electronic device
KR20170120234A (en) System for providing music synchronized with syllable of english words
JP2008139426A (en) Data structure of data for evaluation, karaoke machine, and recording medium
JPH0812535B2 (en) Pronunciation training device
JP4456088B2 (en) Score data display device and program
JP2003015672A (en) Karaoke device having range of voice notifying function
CN110956870A (en) Solfeggio teaching method and device
JPH0554960B2 (en)
JP2004144867A (en) Singing practice assisting system of karaoke device
JP2007225916A (en) Authoring apparatus, authoring method and program
JPS60221786A (en) Instructing apparatus for singing
JPS59204095A (en) Musical sound pitch varying apparatus
WO2011060504A1 (en) Music tuition or practice method and apparatus
JP7456430B2 (en) Information processing device, electronic musical instrument system, electronic musical instrument, syllable progression control method and program
WO2023120288A1 (en) Information processing device, electronic musical instrument system, electronic musical instrument, syllable progression control method, and program
JP4716192B2 (en) Language learning system and language learning program

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees