JPH10207349A - Card type language learning machine and voice comparing system - Google Patents

Card type language learning machine and voice comparing system

Info

Publication number
JPH10207349A
JPH10207349A JP967297A JP967297A JPH10207349A JP H10207349 A JPH10207349 A JP H10207349A JP 967297 A JP967297 A JP 967297A JP 967297 A JP967297 A JP 967297A JP H10207349 A JPH10207349 A JP H10207349A
Authority
JP
Japan
Prior art keywords
utterance
learner
model
feature
matching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP967297A
Other languages
Japanese (ja)
Inventor
Katsuyasu Shimazaki
勝康 島崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mamiya OP Co Ltd
Original Assignee
Mamiya OP Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mamiya OP Co Ltd filed Critical Mamiya OP Co Ltd
Priority to JP967297A priority Critical patent/JPH10207349A/en
Publication of JPH10207349A publication Critical patent/JPH10207349A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To objectively and exactly judge the uttering of learning person. SOLUTION: When a magnetic data reading mechanism part 2 reads the model uttering of magnetic tape 1a, a model uttering feature extracting means 3 extracts the respective features of accent and intonation from this read model uttering. On the other hand, the uttering of learning person is collected from a microphone 4. A learning person uttering feature extracting means 5 extracts the respective features of accent and intonation in the uttering of learning person. A pattern matching means 6 performs pattern matching between the respective extracted features in model uttering and learning person uttering. While using three kinds of LED 8a, 8b and 8c of display panel, for example, a matching display means 7 displays the result of pattern matching.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は語学学習を行うため
のカード式語学学習機および音声比較システムに関し、
特に学習者の発声と模範発声とを比較する機能を有する
カード式語学学習機および音声比較システムに関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a card type language learning machine for performing language learning and a voice comparison system.
In particular, the present invention relates to a card-type language learning machine and a voice comparison system having a function of comparing a student's utterance with a model utterance.

【0002】[0002]

【従来の技術】従来、カード式語学学習機としては、例
えば実用新案登録第3023873号に見られるよう
に、プログラムカードと呼ばれる磁気カードをレールに
沿って搬送し、磁気カードに貼られた磁気テープに記録
された模範発声を読み取って、スピーカから出力するよ
うにしたものがある。
2. Description of the Related Art Conventionally, as a card type language learning machine, a magnetic card called a program card is conveyed along a rail as shown in Utility Model Registration No. 3023873, and a magnetic tape attached to the magnetic card is used. There is a device that reads a model utterance recorded in a speaker and outputs it from a speaker.

【0003】このようなカード式語学学習機による学習
の手順は、 磁気カードに記録された模範発声をスピーカで聴く。 学習者自身がマイクに向かって発声し、磁気カードに
記録する。
[0003] In the learning procedure by such a card-type language learning machine, a model utterance recorded on a magnetic card is listened to by a speaker. The learner himself speaks into the microphone and records it on a magnetic card.

【0004】磁気カードを再生して、模範発声と学習
者自身との発声を聴き比べる。 というのが一般的である。そして、学習者は、自分の発
声が模範発声に近くなるように〜を繰り返して練習
する。
[0004] By reproducing the magnetic card, the model utterance is compared with the utterance of the learner himself. It is common. Then, the learner practices by repeating ~ to make his or her utterance closer to the model utterance.

【0005】[0005]

【発明が解決しようとする課題】しかし、従来のカード
式語学学習機では、学習者が自分の発声と模範発声とを
比較するのみなので、両者の違いを客観的にかつ正確に
判断することができなかった。
However, in the conventional card type language learning machine, since the learner only compares his / her own utterance with the model utterance, it is not possible to objectively and accurately judge the difference between the two. could not.

【0006】これに対し、一般のパソコン用の語学教材
ソフトでは、発音の波形をCRT等に表示して模範発声
と学習者の発声とを比較できるようにしたものがある。
しかし、発声の要素としては、発音以外にも、アクセン
トやイントネーションも含まれている。すなわち、これ
らの要素の調和がとれたときに正しい発声となる。よっ
て、従来のように発音の波形を比べるだけでは、十分と
は言えなかった。
[0006] On the other hand, some language teaching software for general personal computers displays a pronunciation waveform on a CRT or the like so that a model utterance can be compared with a student's utterance.
However, utterance elements include accent and intonation as well as pronunciation. That is, when these elements are harmonized, a correct utterance is obtained. Therefore, it is not enough to compare the waveforms of the sounds as in the related art.

【0007】本発明はこのような点に鑑みてなされたも
のであり、学習者の発声を客観的にかつ正確に判断する
ことのできるカード式語学学習機および音声比較システ
ムを提供することを目的とする。
The present invention has been made in view of the above points, and has as its object to provide a card-type language learning machine and a voice comparison system capable of objectively and accurately determining the utterance of a learner. And

【0008】[0008]

【課題を解決するための手段】本発明では上記課題を解
決するために、磁気カードを使用して語学学習を行うた
めのカード式語学学習機において、模範発声が録音され
た模範発声データ領域を有する磁気カードの磁気データ
を読み取る磁気データ読み取り機構部と、前記学習者発
声を集音するマイクと、前記磁気カードの模範発声のア
クセントおよびイントネーションの各特徴を抽出する模
範発声特徴抽出手段と、前記学習者発声のアクセントお
よびイントネーションの各特徴を抽出する学習者発声特
徴抽出手段と、前記抽出された模範発声の各特徴と前記
学習者発声の各特徴とをパターンマッチングするパター
ンマッチング手段と、前記パターンマッチングの結果を
表示するマットング表示手段と、を有することを特徴と
するカード式語学学習機が提供される。
According to the present invention, in order to solve the above-mentioned problems, in a card-type language learning machine for performing language learning using a magnetic card, an exemplary utterance data area in which an exemplary utterance is recorded is stored. A magnetic data reading mechanism for reading the magnetic data of the magnetic card, a microphone for collecting the learner's utterance, an exemplary utterance feature extracting means for extracting each characteristic of accent and intonation of the exemplary utterance of the magnetic card, Learner utterance feature extraction means for extracting each feature of the accent and intonation of the learner utterance; pattern matching means for pattern matching each of the extracted model utterance features and each of the learner utterance features; And a matting display means for displaying a result of the matching.習機 is provided.

【0009】このようなカード式語学学習機では、磁気
データ読み取り機構部により、磁気カードの磁気データ
を読み取り、模範発声を読み取る。この読み取られた模
範発声から、模範発声特徴抽出手段がそのアクセントお
よびイントネーションの各特徴を抽出する。一方、マイ
クからは、学習者発声が集音される。この集音された学
習者発声から、学習者発声特徴抽出手段がそのアクセン
トおよびイントネーションの各特徴を抽出する。
In such a card-type language learning machine, the magnetic data reading mechanism reads magnetic data of a magnetic card and reads model speech. From the read model utterance, the model utterance feature extracting unit extracts each feature of the accent and intonation. On the other hand, learners' utterances are collected from the microphone. From the collected learner utterances, the learner utterance feature extraction means extracts each feature of the accent and intonation.

【0010】パターンマッチング手段は、抽出された模
範発声の各特徴と学習者発声の各特徴とをパターンマッ
チングする。そして、マッチング表示手段が、パターン
マッチングの結果を表示する。これにより、学習者発声
と模範発声との違いが客観的にかつ正確に評価され、そ
れが一目で確認できる。
The pattern matching means performs pattern matching between each feature of the extracted model utterance and each feature of the learner utterance. Then, the matching display means displays the result of the pattern matching. Thereby, the difference between the learner utterance and the model utterance is objectively and accurately evaluated, and it can be confirmed at a glance.

【0011】[0011]

【発明の実施の形態】以下、本発明の一形態を図面を参
照して説明する。図1は本形態のカード式語学学習機の
機能の概念を示す図である。磁気カード1の磁気テープ
1aには、少なくとも模範発声の磁気データが記録され
ている。磁気データ読み取り機構部2は、この磁気テー
プ1aの模範発声を読み取る。模範発声特徴抽出手段3
は、この読み取られた模範発声からアクセントおよびイ
ントネーションの各特徴を抽出する。一方、マイク4か
らは、学習者発声が集音される。学習者発声特徴抽出手
段5は、学習者発声のアクセントおよびイントネーショ
ンの各特徴を抽出する。
DESCRIPTION OF THE PREFERRED EMBODIMENTS One embodiment of the present invention will be described below with reference to the drawings. FIG. 1 is a diagram showing the concept of the function of the card type language learning machine of the present embodiment. On the magnetic tape 1a of the magnetic card 1, at least magnetic data of the model utterance is recorded. The magnetic data reading mechanism 2 reads the model utterance of the magnetic tape 1a. Model utterance feature extraction means 3
Extracts the features of accent and intonation from the read model utterance. On the other hand, learners' utterances are collected from the microphone 4. The learner utterance feature extraction means 5 extracts each feature of the accent and intonation of the learner utterance.

【0012】パターンマッチング手段6は、抽出された
模範発声の各特徴と学習者発声の各特徴とをパターンマ
ッチングする。マッチング表示手段7は、例えば表示パ
ネル8の3種類のLED8a,8b,8cを使用して、
パターンマッチングの結果を表示する。すなわち、マッ
チングの度合いが悪ければLED8aを点灯させ、良け
ればLED8bを点灯させ、非常に良ければLED8c
を点灯させる。
The pattern matching means 6 performs pattern matching between each feature of the extracted model utterance and each feature of the learner utterance. The matching display means 7 uses, for example, three types of LEDs 8a, 8b, 8c of the display panel 8,
Displays the result of pattern matching. That is, if the degree of matching is bad, the LED 8a is turned on, if it is good, the LED 8b is turned on, and if it is very good, the LED 8c is turned on.
Lights up.

【0013】図2は本形態のカード式語学学習機の外観
構成を示す斜視図である。カード式語学学習機10の上
側ケース12には、後述する様々な操作を行うための操
作部13、ケース内部の後述のスピーカ34からの音声
を出力する音声出力部14、磁気カード16用の搬送読
み取り機構部15等が設けられている。
FIG. 2 is a perspective view showing the external configuration of the card type language learning machine of the present embodiment. The upper case 12 of the card-type language learning machine 10 includes an operation unit 13 for performing various operations described later, a sound output unit 14 for outputting a sound from a speaker 34 described later inside the case, and a transport for the magnetic card 16. A reading mechanism 15 and the like are provided.

【0014】搬送読み取り機構部15は、そのレールに
磁気カード16を挿入することにより、図の矢印方向に
磁気カード16を搬送しながら、磁気テープ16aに発
声データを録音したり、読み取ったりする。
The transport reading mechanism 15 inserts the magnetic card 16 into the rail, thereby recording and reading utterance data on the magnetic tape 16a while transporting the magnetic card 16 in the direction of the arrow in the figure.

【0015】操作部13には、生徒モードボタン21、
先生モードボタン22、録音ボタン23、マッチングス
イッチ24、ボリューム25、マイク孔26、表示部2
7が設けられている。生徒モードボタン21は、学習者
の発声を録音したり再生したりするときに押すボタンで
ある。この生徒モードボタン21を録音ボタン23と同
時に押すことにより、磁気カード16の磁気テープ16
aに学習者の発声を録音することができる。また、生徒
モードボタン21のみが押されている場合には、磁気カ
ード16の磁気テープ16aに録音された学習者の発声
が、音声出力部14から出力される。
The operation unit 13 includes a student mode button 21,
Teacher mode button 22, Record button 23, Matching switch 24, Volume 25, Microphone hole 26, Display unit 2
7 are provided. The student mode button 21 is a button that is pressed when recording or reproducing a student's utterance. When the student mode button 21 is pressed at the same time as the recording button 23, the magnetic tape 16 of the magnetic card 16 is pressed.
The utterance of the learner can be recorded in a. When only the student mode button 21 is pressed, the learner's utterance recorded on the magnetic tape 16 a of the magnetic card 16 is output from the audio output unit 14.

【0016】一方、先生モードボタン22は、磁気テー
プ16aに録音された模範発声を聴くときに押すボタン
である。マッチングスイッチ24は、模範発声と学習者
発声とのパターンマッチングを行うためのスイッチであ
る。このマッチングスイッチ24がオンになった状態で
先生モードボタン22が押され、磁気カード16が読み
取られると、磁気テープ16aの模範発声が読み取ら
れ、後述する手順によって模範発声の特徴が抽出され、
内部のメモリに格納される。一方、マッチングスイッチ
24がオンになった状態で生徒モードボタン21が押さ
れ、マイク孔26を介して後述のマイク35から学習者
発声が集音されると、後述する手順によって学習者発声
の特徴が抽出される。そして、先に格納された模範発声
と学習者発声の特徴が、後述する手法によりパターンマ
ッチングされ、その結果、両者の類似度が表示部27に
表示される。
On the other hand, the teacher mode button 22 is a button to be pressed when listening to the model utterance recorded on the magnetic tape 16a. The matching switch 24 is a switch for performing pattern matching between the model utterance and the learner utterance. When the teacher mode button 22 is pressed with the matching switch 24 turned on and the magnetic card 16 is read, the model utterance of the magnetic tape 16a is read, and the characteristics of the model utterance are extracted by the procedure described later.
Stored in internal memory. On the other hand, when the student mode button 21 is pressed in a state where the matching switch 24 is turned on and a learner's utterance is collected from a microphone 35 to be described later through the microphone hole 26, the characteristics of the learner's utterance are described by a procedure described later. Is extracted. Then, the features of the model utterance and the learner utterance stored earlier are subjected to pattern matching by a method described later, and as a result, the similarity between the two is displayed on the display unit 27.

【0017】図3は表示部27の構成の一例を示す図で
ある。この表示部27には、例えば3つの絵柄の表示
欄、すなわち、丸表示欄27a、2重丸表示欄27b、
花丸表示欄27cが設けられている。各表示欄27a,
27b,27cには、内部に図示されていないLEDが
設けられており、そのLEDが点灯することにより、各
絵柄が表示される。ここでは、パターンマッチングの結
果、模範発声と学習者発声の特徴のマッチングの度合い
が低い場合には、丸表示欄27aが点灯し、中程度の場
合には2重丸表示欄27bが、高い場合には花丸表示欄
27cが点灯する。
FIG. 3 is a diagram showing an example of the configuration of the display unit 27. The display section 27 includes, for example, display fields for three pictures, that is, a circle display field 27a, a double circle display field 27b,
A flower circle display field 27c is provided. Each display column 27a,
LEDs (not shown) are provided inside 27b and 27c, and when the LEDs are turned on, each picture is displayed. Here, as a result of the pattern matching, when the degree of matching between the model utterance and the feature of the learner utterance is low, the circle display field 27a is turned on. When the degree is medium, the double circle display field 27b is high. , The flower circle display field 27c is turned on.

【0018】図4はカード式語学学習機10内部のハー
ドウェアの構成を示すブロック図である。制御回路31
は、例えばロジック回路で構成されている。制御回路3
1は、生徒モードボタン21、先生モードボタン22、
録音ボタン23、マッチングスイッチ24、図示されて
いないセンサ等の状態に応じて、搬送読み取り機構部1
5を駆動して、カード式語学学習機10全体の動作制御
を行う。
FIG. 4 is a block diagram showing a hardware configuration inside the card type language learning machine 10. As shown in FIG. Control circuit 31
Is composed of, for example, a logic circuit. Control circuit 3
1 is a student mode button 21, a teacher mode button 22,
The transport reading mechanism 1 according to the state of the recording button 23, the matching switch 24, a sensor (not shown), and the like.
5 to control the operation of the entire card type language learning machine 10.

【0019】音声処理回路32は、例えばロジック回路
で構成されている。音声処理回路32は、後述するマッ
チング処理回路、プリアンプ回路、メモリ、周波数変調
回路等を有している。すなわち、音声処理回路32は、
マイク35で集音された学習者発声を読み取り、その特
徴(アクセントおよびイントネーション)を抽出する。
その一方で、音声処理回路32は、制御回路31からの
指令に応じて、磁気ヘッド151によって磁気カード1
6の模範発声データを読み取り、模範発声の特徴(アク
セントおよびイントネーション)を抽出する。そして、
学習者発声の特徴と模範発声の特徴をパターンマッチン
グして、その結果を制御回路31に送る。
The audio processing circuit 32 is constituted by, for example, a logic circuit. The audio processing circuit 32 includes a later-described matching processing circuit, a preamplifier circuit, a memory, a frequency modulation circuit, and the like. That is, the audio processing circuit 32
The learner's utterance collected by the microphone 35 is read, and its features (accent and intonation) are extracted.
On the other hand, the audio processing circuit 32 controls the magnetic card 1 by the magnetic head 151 in response to a command from the control circuit 31.
6 to read the model utterance data and extract the features (accents and intonation) of the model utterance. And
The feature of the learner utterance and the feature of the model utterance are subjected to pattern matching, and the result is sent to the control circuit 31.

【0020】パターンマッチングの結果を受けた制御回
路31は、学習者発声の特徴と模範発声の特徴の類似度
を表示部27によって表示する。また、音声処理回路3
2は、磁気カード16の模範発声データを読み取ると、
それを増幅してパワーアンプ33に送る。音声処理回路
32から送られた模範発声をボリューム25の調節度合
いに応じて増幅し、スピーカ34に出力する。なお、マ
イク35で集音された学習者の発声も、磁気カード16
に録音したり、スピーカ34から出力することもでき
る。
The control circuit 31 receiving the result of the pattern matching displays the similarity between the feature of the learner's utterance and the feature of the model utterance on the display unit 27. Also, the audio processing circuit 3
2 reads the model utterance data of the magnetic card 16,
It is amplified and sent to the power amplifier 33. The model utterance sent from the audio processing circuit 32 is amplified according to the degree of adjustment of the volume 25 and output to the speaker 34. Note that the learner's utterance collected by the microphone 35 is
, Or output from the speaker 34.

【0021】図5は音声処理回路32内のマッチング処
理回路の具体的な構成を示すブロック図である。また、
図6は音声信号入力から特徴パターン抽出までのマッチ
ング処理回路の機能を示す図である。図5のマッチング
処理回路40には、例えば図6に示すような波形を持つ
模範発声または学習者発声の音声信号51が入力され
る。入力された音声信号51は、アクセント検出回路4
1およびイントネーション検出回路42に送られる。
FIG. 5 is a block diagram showing a specific configuration of the matching processing circuit in the audio processing circuit 32. Also,
FIG. 6 is a diagram showing functions of a matching processing circuit from input of an audio signal to extraction of a feature pattern. The matching processing circuit 40 shown in FIG. 5 receives, for example, a model utterance or a learner utterance voice signal 51 having a waveform as shown in FIG. The input audio signal 51 is input to the accent detection circuit 4.
1 and sent to the intonation detection circuit 42.

【0022】アクセント検出回路41は、音声信号51
からアクセントの変化を検出する回路であり、整流器、
平滑LPF(ローパスフィルタ)等で構成されている。
アクセント検出回路41では、音声信号51の波形を整
流した後、数十Hz程度のカットオフ周波数を持つLP
Fで平滑し、図6のグラフ52に示すような信号を得
る。ここで、グラフ52の横軸は時間を、縦軸は検出さ
れた音声振幅の電圧レベルをそれぞれ示している。アク
セントの認識は、音声の強弱の変化が合っていればよい
ので、音声の強弱の大きさまで合っている必要はない。
したがって、アクセントの特徴パターン抽出は、音声の
強弱のレベル圧縮やパターンをモデル化する等の方法で
認識率の向上を図るようにする。
The accent detection circuit 41 has a voice signal 51
Is a circuit that detects changes in accent from the rectifier,
It is composed of a smooth LPF (low-pass filter) or the like.
In the accent detection circuit 41, after rectifying the waveform of the audio signal 51, the LP having a cutoff frequency of about several tens Hz
The signal is smoothed by F to obtain a signal as shown in a graph 52 of FIG. Here, the horizontal axis of the graph 52 indicates time, and the vertical axis indicates the voltage level of the detected audio amplitude. The recognition of the accent only needs to match the strength of the voice, so it is not necessary to match the strength of the voice.
Therefore, in the extraction of the accent feature pattern, the recognition rate is improved by a method such as level compression of the voice level or modeling of the pattern.

【0023】一方、イントネーション検出回路42は、
音声信号51からイントネーション波形、すなわち、音
声周波数の高低の変化を検出する回路であり、LPF、
零交差波検出回路、F/V(周波数/電圧)変換回路等
で構成されている。イントネーション検出回路42で
は、音声信号51の基本ピッチ周波数の変化の検出によ
って、図6のグラフ53のような信号を得る。基本ピッ
チ周波数は、成人の男性で125Hz、女性で250H
z程度である。ここでは、高い方の周波数である250
Hzにイントネーションの変化分αを加え、(250+
α)Hzのカットオフ周波数を持つLPFで検出する。
グラフ53では、処理の都合上F/V変換がなされてお
り、縦軸は電圧レベルとなっているが、電圧レベルの変
化は基本ピッチの変化に対応している。
On the other hand, the intonation detection circuit 42
This circuit detects an intonation waveform from the audio signal 51, that is, a change in the level of the audio frequency, and includes a LPF,
It is composed of a zero-crossing wave detection circuit, an F / V (frequency / voltage) conversion circuit, and the like. In the intonation detection circuit 42, a signal as shown by a graph 53 in FIG. 6 is obtained by detecting a change in the basic pitch frequency of the audio signal 51. Basic pitch frequency is 125Hz for adult men and 250H for women
about z. Here, the higher frequency, 250
Hz plus the intonation change α, (250+
α) It is detected by an LPF having a cutoff frequency of Hz.
In the graph 53, the F / V conversion is performed for the sake of processing, and the vertical axis indicates the voltage level, but the change in the voltage level corresponds to the change in the basic pitch.

【0024】一般的に、イントネーションの変化態様は
少ないため、アクセントの場合より容易にモデル化が可
能である。また、発声が途切れたときに検出できなかっ
た基本ピッチは、その前後を滑らかにパターン化する。
In general, since the variation of intonation is small, modeling is easier than in the case of accent. The basic pitch that could not be detected when the utterance was interrupted is smoothly patterned before and after the basic pitch.

【0025】このようにしてアクセントとイントネーシ
ョンの波形が検出されると、図5のマルチプレクサ43
が両者を直列にしてA/D変換回路44に送る。A/D
変換回路44は、アナログ信号をディジタル信号に変換
する。
When the accent and intonation waveforms are detected in this manner, the multiplexer 43 shown in FIG.
Sends them to the A / D conversion circuit 44 in series. A / D
The conversion circuit 44 converts an analog signal into a digital signal.

【0026】特徴パターン抽出回路45は、検出された
アクセントおよびイントネーションの波形からそれぞれ
特徴パターンを抽出する。この特徴パターンの抽出方法
としては、一般に、線型予測係数、PARCOR係数、
帯域フィルタ出力、零交差波係数、エネルギー、自己相
関関数等に基づく方法がある。これらの何れを用いても
本形態の実行が可能である。アクセントおよびイントネ
ーションの各特徴パターンを、それぞれ図6の表54お
よび表55に示す。
The feature pattern extraction circuit 45 extracts a feature pattern from each of the detected accent and intonation waveforms. As a method for extracting the feature pattern, generally, a linear prediction coefficient, a PARCOR coefficient,
There is a method based on band filter output, zero crossing wave coefficient, energy, autocorrelation function, and the like. This embodiment can be executed by using any of these. The respective characteristic patterns of accent and intonation are shown in Tables 54 and 55 of FIG. 6, respectively.

【0027】図5の特徴パターン抽出回路45で抽出さ
れた各特徴パターンは、切換スイッチ46を介して、模
範発声記憶回路47またはパターンマッチング回路48
に送られる。すなわち、抽出された特徴パターンが模範
発声の信号のものであれば、制御回路31側からの指令
により切換スイッチ46が切り換えられて、模範発声記
憶回路47に送られ、そこで一時的に記憶される。一
方、抽出された特徴パターンが学習者発声の信号のもの
であれば、パターンマッチング回路48に直接送られ
る。
Each characteristic pattern extracted by the characteristic pattern extraction circuit 45 shown in FIG.
Sent to That is, if the extracted feature pattern is a model utterance signal, the changeover switch 46 is switched by a command from the control circuit 31 and sent to the model utterance storage circuit 47, where it is temporarily stored. . On the other hand, if the extracted feature pattern is a signal of a learner's utterance, it is sent directly to the pattern matching circuit 48.

【0028】パターンマッチング回路48は、模範発声
記憶回路47に記憶された模範発声のアクセントおよび
イントネーションと、学習者発声のアクセントおよびイ
ントネーションとをそれぞれ比較し、両者の類似の度合
いを計算する。ここでは、パターンマッチングとしてD
P(ダイナミックプログラミング)マッチングを使用す
る。
The pattern matching circuit 48 compares the accent and intonation of the model utterance stored in the model utterance storage circuit 47 with the accent and intonation of the learner's utterance, and calculates the degree of similarity between the two. Here, the pattern matching is D
Use P (dynamic programming) matching.

【0029】次に、DPマッチングを用いた本形態のパ
ターンマッチングの具体例について説明する。図7は模
範発声と学習者発声の各アクセントの特徴パターンの比
較方法を示す図である。ここで、模範発声については、
図6で示した表54の特徴パターンを使用する。この模
範発声の特徴パターンは、図に示すように、サンプリン
グ時間t0 〜t12の間に納まっている。一方、学習者発
声は、これよりもテンポが速く、短い時間間隔t0 〜t
9 の間に納まっている。DPマッチングによれば、模範
発声と学習者発声とで、できるだけ近い値をとるデータ
どうしの誤差を計算していく。ただし、前後が交差して
図の矢印が交差するような計算の仕方は禁止される。
Next, a specific example of pattern matching of the present embodiment using DP matching will be described. FIG. 7 is a diagram showing a method of comparing the feature patterns of each accent of the model utterance and the learner utterance. Here, about the model utterance,
The feature pattern of Table 54 shown in FIG. 6 is used. Characteristic pattern of this exemplary utterance, as shown, are accommodated between the sampling time t 0 ~t 12. On the other hand, learner utterance, this faster tempo than the short time interval t 0 ~t
Fits between nine . According to the DP matching, an error between data having values as close as possible between the model utterance and the learner utterance is calculated. However, calculation methods in which the front and rear cross and the arrows in the figure cross are prohibited.

【0030】この方法で、各データどうしの誤差を計算
し、それらの絶対値の合計(以後、「距離」と呼ぶ)を
計算すると、ここでは0となる。すなわち、図7の例で
は、テンポは異なっても、模範発声と学習者発声のアク
セントは非常に類似していることが分かる。
When the error between each data is calculated by this method and the sum of their absolute values (hereinafter, referred to as “distance”) is calculated, it becomes 0 here. That is, in the example of FIG. 7, it can be seen that the accents of the model utterance and the learner utterance are very similar even if the tempo is different.

【0031】パターンマッチング回路48は、同様の方
法によって、模範発声と学習者発声のイントネーション
についても計算を行う。そして、各特徴パターンのマッ
チングが終了すると、その類似判定結果を制御回路31
に送る。
The pattern matching circuit 48 calculates the intonation between the model utterance and the learner utterance in the same manner. When the matching of each feature pattern is completed, the similarity determination result is sent to the control circuit 31.
Send to

【0032】これを受けた制御回路31は、それに応じ
た表示を表示部27で行う。例えば、アクセントとイン
トネーションの各距離の平均が9以上ならば、図3で示
した丸表示欄27aを点灯させる。また、5以上8以下
ならば、2重丸表示欄27bを点灯させ、4以下ならば
花丸表示欄27cを点灯させる。
The control circuit 31 which has received the instruction causes the display unit 27 to perform a display corresponding thereto. For example, if the average of each distance between the accent and the intonation is 9 or more, the circle display field 27a shown in FIG. 3 is turned on. If the number is 5 or more and 8 or less, the double circle display section 27b is turned on. If the number is 4 or less, the flower circle display section 27c is turned on.

【0033】なお、アクセントとイントネーションを別
個に表示したい場合には、図3の各表示欄27a,27
b,27cに色の異なるLEDを1対ずつ設け、それぞ
れを上述のような点数配分に応じて点灯させればよい。
When it is desired to display accents and intonations separately, display columns 27a and 27 in FIG.
A pair of LEDs having different colors may be provided for b and 27c, and each of them may be turned on according to the above-mentioned point distribution.

【0034】図8はマッチング処理回路40による手順
を示すフローチャートである。 〔S1〕本体の操作部13が先生モードになっているか
否かを判断し、なっていればステップS2に進み、なっ
ていなければステップS7に進む。 〔S2〕図5で示した切換スイッチ46を模範発声記憶
回路47側に切り換える。 〔S3〕模範発声のアクセントおよびイントネーション
を検出する。 〔S4〕検出した信号のA/D変換を行う。 〔S5〕模範発声のアクセントおよびイントネーション
の各特徴パターンを抽出する。
FIG. 8 is a flowchart showing a procedure performed by the matching processing circuit 40. [S1] It is determined whether or not the operation unit 13 of the main unit is in the teacher mode. If yes, the process proceeds to step S2, and if not, the process proceeds to step S7. [S2] The changeover switch 46 shown in FIG. 5 is switched to the model utterance storage circuit 47 side. [S3] The accent and intonation of the model utterance are detected. [S4] A / D conversion of the detected signal is performed. [S5] The accent and intonation feature patterns of the model utterance are extracted.

【0035】〔S6〕抽出したパターンを模範発声記憶
回路47に登録する。 〔S7〕切換スイッチ46をパターンマッチング回路4
8側に切り換える。 〔S8〕学習者発声のアクセントおよびイントネーショ
ンを検出する。 〔S9〕検出した信号のA/D変換を行う。 〔S10〕学習者発声のアクセントおよびイントネーシ
ョンの各特徴パターンを抽出する。 〔S11〕模範発声および学習者発声の各特徴パターン
のパターンマッチングを行う。 〔S12〕両者の類似度を表示させる。
[S6] The extracted pattern is registered in the model utterance storage circuit 47. [S7] Set the changeover switch 46 to the pattern matching circuit 4
Switch to 8 side. [S8] The accent and intonation of the learner's utterance are detected. [S9] A / D conversion of the detected signal is performed. [S10] Each feature pattern of the accent and intonation of the learner's utterance is extracted. [S11] Pattern matching of each characteristic pattern of the model utterance and the learner utterance is performed. [S12] The similarity between the two is displayed.

【0036】このように、本形態では、模範発声および
学習者発声のアクセントおよびイントネーションを比較
して、その類似の度合いを表示するようにしたので、学
習者発声と模範発声との違いを客観的にかつ正確に評価
でき、それを一目で確認することができる。
As described above, in the present embodiment, the degree of similarity is displayed by comparing the accent and intonation of the model utterance and the learner's utterance, so that the difference between the learner's utterance and the model utterance is objectively determined. And can be evaluated accurately and at a glance.

【0037】また、本形態では、パターンマッチングの
方法として、DPマッチングを用いるようにしたので、
学習者発声と模範発声とのテンポが異なっても、正確に
マッチングを行うことができる。
In this embodiment, DP matching is used as a pattern matching method.
Even if the learner utterance and the model utterance have different tempos, accurate matching can be performed.

【0038】なお、本形態では、カード式語学学習機1
0を使用する例を示したが、音声入力ボードを取り付け
ることにより、通常のパソコン等でも本形態の機能の実
行が可能である。このとき、パターンマッチングの処理
はソフトウェアで、また、類似度の表示はモニタ等で行
う。
In this embodiment, the card type language learning machine 1
Although the example using 0 is shown, the function of the present embodiment can be executed by a normal personal computer or the like by attaching a voice input board. At this time, the pattern matching process is performed by software, and the similarity is displayed on a monitor or the like.

【0039】[0039]

【発明の効果】以上説明したように本発明では、模範発
声からそのアクセントおよびイントネーションの各特徴
を抽出する一方、マイクから集音された学習者発声から
そのアクセントおよびイントネーションの各特徴を抽出
し、抽出された模範発声の各特徴と学習者の発声の各特
徴とをパターンマッチングし、そのパターンマッチング
の結果を表示するようにしたので、学習者の発声と模範
発声との違いを客観的にかつ正確に評価することがで
き、それを一目で確認することが可能となる。
As described above, according to the present invention, each feature of the accent and intonation is extracted from the model utterance, while each feature of the accent and intonation is extracted from the learner utterance collected from the microphone. Each feature of the extracted model utterance and each feature of the learner's utterance were subjected to pattern matching, and the results of the pattern matching were displayed, so that the difference between the learner's utterance and the model utterance was objectively and Accurate evaluation can be made, and it can be confirmed at a glance.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本形態のカード式語学学習機の機能の概念を示
す図である。
FIG. 1 is a diagram showing a concept of a function of a card-type language learning machine of the present embodiment.

【図2】本形態のカード式語学学習機の外観構成を示す
斜視図である。
FIG. 2 is a perspective view showing an external configuration of a card-type language learning machine of the present embodiment.

【図3】表示部の構成の一例を示す図である。FIG. 3 is a diagram illustrating an example of a configuration of a display unit.

【図4】カード式語学学習機内部のハードウェアの構成
を示すブロック図である。
FIG. 4 is a block diagram showing a hardware configuration inside the card type language learning machine.

【図5】音声処理回路内のマッチング処理回路の具体的
な構成を示すブロック図である。
FIG. 5 is a block diagram showing a specific configuration of a matching processing circuit in the audio processing circuit.

【図6】音声信号入力から特徴パターン抽出までのマッ
チング処理回路の機能を示す図である。
FIG. 6 is a diagram illustrating functions of a matching processing circuit from input of an audio signal to extraction of a feature pattern.

【図7】模範発声と学習者発声の各アクセントの特徴パ
ターンの比較方法を示す図である。
FIG. 7 is a diagram showing a method of comparing feature patterns of accents of a model utterance and a learner utterance.

【図8】マッチング処理回路による手順を示すフローチ
ャートである。
FIG. 8 is a flowchart illustrating a procedure performed by a matching processing circuit.

【符号の説明】[Explanation of symbols]

1 磁気カード 2 磁気データ読み取り機構部 3 模範発声特徴抽出手段 4 マイク 5 学習者発声特徴抽出手段 6 パターンマッチング手段 7 マッチング表示手段 8 表示パネル 10 カード式語学学習機 13 操作部 16 磁気カード 16a 磁気テープ 21 生徒モードボタン 22 先生モードボタン 23 録音ボタン 24 マッチングスイッチ 27 表示部 31 制御回路 32 音声処理回路 35 マイク 40 マッチング処理回路 DESCRIPTION OF SYMBOLS 1 Magnetic card 2 Magnetic data reading mechanism part 3 Model utterance feature extraction means 4 Microphone 5 Learner utterance feature extraction means 6 Pattern matching means 7 Matching display means 8 Display panel 10 Card language learning machine 13 Operation part 16 Magnetic card 16a Magnetic tape 21 Student Mode Button 22 Teacher Mode Button 23 Record Button 24 Matching Switch 27 Display 31 Control Circuit 32 Audio Processing Circuit 35 Microphone 40 Matching Processing Circuit

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】 磁気カードを使用して語学学習を行うた
めのカード式語学学習機において、 模範発声が録音された模範発声データ領域を有する磁気
カードの磁気データを読み取る磁気データ読み取り機構
部と、 学習者発声を集音するマイクと、 前記磁気カードの模範発声のアクセントおよびイントネ
ーションの各特徴を抽出する模範発声特徴抽出手段と、 前記学習者発声のアクセントおよびイントネーションの
各特徴を抽出する学習者発声特徴抽出手段と、 前記抽出された前記模範発声特徴と前記学習者発声特徴
とをパターンマッチングするパターンマッチング手段
と、 前記パターンマッチングの結果を表示するマッチング表
示手段と、 を有することを特徴とするカード式語学学習機。
1. A card-type language learning machine for performing language learning using a magnetic card, comprising: a magnetic data reading mechanism for reading magnetic data of a magnetic card having a model utterance data area in which a model utterance is recorded; A microphone that collects learner utterances; a model utterance feature extraction unit that extracts each feature of accent and intonation of the model utterance of the magnetic card; a learner utterance that extracts each feature of accent and intonation of the learner utterance A card comprising: a feature extracting unit; a pattern matching unit that performs pattern matching between the extracted model utterance feature and the learner utterance feature; and a matching display unit that displays a result of the pattern matching. Expression language learning machine.
【請求項2】 前記パターンマッチングは、DP(ダイ
ナミック・プログラミング)マッチングであることを特
徴とする請求項1記載のカード式語学学習機。
2. The card-type language learning machine according to claim 1, wherein the pattern matching is DP (Dynamic Programming) matching.
【請求項3】 前記マッチング表示手段は、前記マッチ
ングの類似度に対応した絵柄表示を行うように構成され
ていることを特徴とする請求項1記載のカード式語学学
習機。
3. The card-type language learning machine according to claim 1, wherein the matching display means is configured to display a picture corresponding to the degree of similarity of the matching.
【請求項4】 模範発声と学習者発声とを比較するため
の音声比較システムにおいて、 模範発声が格納された模範発声データ格納手段と、 学習者発声を集音するマイクと、 前記模範発声のアクセントおよびイントネーションの各
特徴を抽出する模範発声特徴抽出手段と、 前記学習者の発声のアクセントおよびイントネーション
の各特徴を抽出する学習者発声特徴抽出手段と、 前記抽出された前記模範発声特徴と前記学習者発声特徴
とをパターンマッチングするパターンマッチング手段
と、 前記パターンマッチングの結果を表示するマッチング表
示手段と、 を有することを特徴とする音声比較システム。
4. A voice comparison system for comparing a model utterance with a learner utterance, comprising: a model utterance data storage unit storing a model utterance; a microphone for collecting a learner utterance; and an accent of the model utterance. Model utterance feature extraction means for extracting each feature of the learner and intonation; learner utterance feature extraction means for extracting each feature of the learner's utterance accent and intonation; the extracted model utterance feature and the learner A voice comparison system comprising: a pattern matching unit that performs pattern matching with an utterance feature; and a matching display unit that displays a result of the pattern matching.
JP967297A 1997-01-22 1997-01-22 Card type language learning machine and voice comparing system Pending JPH10207349A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP967297A JPH10207349A (en) 1997-01-22 1997-01-22 Card type language learning machine and voice comparing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP967297A JPH10207349A (en) 1997-01-22 1997-01-22 Card type language learning machine and voice comparing system

Publications (1)

Publication Number Publication Date
JPH10207349A true JPH10207349A (en) 1998-08-07

Family

ID=11726709

Family Applications (1)

Application Number Title Priority Date Filing Date
JP967297A Pending JPH10207349A (en) 1997-01-22 1997-01-22 Card type language learning machine and voice comparing system

Country Status (1)

Country Link
JP (1) JPH10207349A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030064116A (en) * 2002-01-25 2003-07-31 주식회사 엠티컴 Methods for analyzing human voice and systems thereof
KR100423759B1 (en) * 2000-08-03 2004-03-22 주식회사 지와이인텍 a acoustic education method using internet

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100423759B1 (en) * 2000-08-03 2004-03-22 주식회사 지와이인텍 a acoustic education method using internet
KR20030064116A (en) * 2002-01-25 2003-07-31 주식회사 엠티컴 Methods for analyzing human voice and systems thereof

Similar Documents

Publication Publication Date Title
US4969194A (en) Apparatus for drilling pronunciation
US6358054B1 (en) Method and apparatus for teaching prosodic features of speech
TWI742486B (en) Singing assisting system, singing assisting method, and non-transitory computer-readable medium comprising instructions for executing the same
JP2006276693A (en) Singing evaluation display apparatus and program
JP2007264569A (en) Retrieval device, control method, and program
RU2510954C2 (en) Method of re-sounding audio materials and apparatus for realising said method
WO2014087571A1 (en) Information processing device and information processing method
JPS6038718B2 (en) singing self-study device
JP4048651B2 (en) Pronunciation scoring device
JP3362491B2 (en) Voice utterance device
JPH10207349A (en) Card type language learning machine and voice comparing system
JP4862413B2 (en) Karaoke equipment
JPH03273280A (en) Voice synthesizing system for vocal exercise
JP2006048073A (en) Pronunciation evaluating device
JP2006023758A (en) Pronunciation evaluation system
JPS616732A (en) Vocal training device
JP2008040258A (en) Musical piece practice assisting device, dynamic time warping module, and program
KR20190055931A (en) A System Providing Vocal Training Service Based On Subtitles
JP3988270B2 (en) Pronunciation display device, pronunciation display method, and program for causing computer to execute pronunciation display function
JPS5887600A (en) Decoding of karaoke sound
Zimmer VATA: An improved personal computer-based vowel articulation training aid
JPH0344314B2 (en)
JPS61162097A (en) Accompanied music reproducer
JPS6360484A (en) Enunciation training machine
JPS616730A (en) Vocal training device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20031212

A131 Notification of reasons for refusal

Effective date: 20050719

Free format text: JAPANESE INTERMEDIATE CODE: A131

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20051115