JPS60237495A - Voice recognition equipment - Google Patents

Voice recognition equipment

Info

Publication number
JPS60237495A
JPS60237495A JP59093355A JP9335584A JPS60237495A JP S60237495 A JPS60237495 A JP S60237495A JP 59093355 A JP59093355 A JP 59093355A JP 9335584 A JP9335584 A JP 9335584A JP S60237495 A JPS60237495 A JP S60237495A
Authority
JP
Japan
Prior art keywords
speech
rate
recognition
section
voice recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP59093355A
Other languages
Japanese (ja)
Other versions
JPH0217119B2 (en
Inventor
和彦 松尾
岩橋 弘幸
充宏 斗谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP59093355A priority Critical patent/JPS60237495A/en
Publication of JPS60237495A publication Critical patent/JPS60237495A/en
Publication of JPH0217119B2 publication Critical patent/JPH0217119B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 く技術分野〉 本発明は日本語の音声認識装置に関する。[Detailed description of the invention] Technical fields> The present invention relates to a Japanese speech recognition device.

〈従来技術〉 従来の音声認識装置には、話者が認識率の向上を計るだ
めの目安となる発声速度、識別率の表示装置が設けられ
ていなかっただめ、話者は最良の発声状態を自覚するこ
とができなかった。
<Prior art> Conventional speech recognition devices were not equipped with display devices for displaying speech rate and recognition rate, which would be used as a guideline for speakers to improve their recognition rate. I couldn't realize it.

〈発明の目的〉 本発明の目的は、発声速度と識別率が可視表示され、識
別率の向上を計りながら発声することのできる音声認識
装置を提供することにある。
<Object of the Invention> An object of the present invention is to provide a speech recognition device that visually displays the speech rate and recognition rate, and is capable of uttering while trying to improve the recognition rate.

〈実施例〉 以下、本発明の構成を、実施例により説明する。<Example> Hereinafter, the configuration of the present invention will be explained using examples.

第1図に本発明装置のブロック構成図を示す。FIG. 1 shows a block diagram of the apparatus of the present invention.

マイクロホン1に入力された音声信号は、アナログ入力
部2で増幅及びデジタル変換され、音声分析部3及び音
節セグメンテーション部4に導入される。音声分析部3
は、入力された音声信号を16m8程度のフレームに分
け、スペクトル分析を行ない、8m8程度の間隔で音節
セグメンテーション部4−\、その音声の特徴パターン
情報、ハワー零交差数等の情報を転送する。
A voice signal input to the microphone 1 is amplified and digitally converted by the analog input section 2, and then introduced to the voice analysis section 3 and the syllable segmentation section 4. Voice analysis section 3
divides the input speech signal into frames of about 16m8, performs spectrum analysis, and transfers information such as the characteristic pattern information of the speech and the number of Hower zero crossings to the syllable segmentation unit 4-\ at intervals of about 8m8.

音節セグメンテーション部4ば、音声分析部3から送ら
れた種々な情報に基いて音節を切り出す。
The syllable segmentation section 4 cuts out syllables based on various information sent from the speech analysis section 3.

また、入力音声の無音区間、有音区間の識別を行ない、
各区間について時間計測が8mS毎に行なわれ、計測さ
れたデータは発声速度の計算データとしてCPU5に送
られる。
It also identifies silent sections and sound sections of the input audio,
Time measurement is performed for each section every 8 mS, and the measured data is sent to the CPU 5 as calculation data of the speaking rate.

音節セグメンテーション部4において切り出された音節
の特徴パターンは、CPU5を通じてパターンメモリ6
内の特徴パターンメモリ7に格納され、標準パターンメ
モリ8に予め登録されている標準パターンと、単音節認
識部9にて比較される。その比較結果はCPU5に戻さ
れ、CPU5はそれを認識結果格納メモリ10に貯蔵し
、表示装置12に表示する。キーボード11は表示され
た入力音声を修正するために用いられる。
The characteristic patterns of the syllables extracted by the syllable segmentation unit 4 are stored in the pattern memory 6 through the CPU 5.
The monosyllable recognition unit 9 compares the standard pattern with a standard pattern registered in advance in the standard pattern memory 8. The comparison result is returned to the CPU 5, which stores it in the recognition result storage memory 10 and displays it on the display device 12. The keyboard 11 is used to modify the displayed input voice.

第2図に音節セグメンテーション部40発声速度演算処
理用プログラムのフローチャートを示す。
FIG. 2 shows a flowchart of the utterance rate calculation processing program of the syllable segmentation unit 40.

無音区間と有音区間は交互に繰返される。無音区間と有
音区間の時間計測のカウント数をそれぞれPi、Viと
し、無音区間のカウント数P1を累積記憶するレジスタ
の内容をP、有音区間のカウント数■1を累積記憶する
レジスタの内容をV、無音区間P1のいき値をlとする
。このいき値jは促音、語頭の音節を無視するように設
定される。
Silent sections and sound sections are repeated alternately. Let Pi and Vi be the count numbers for time measurement in the silent section and the sound section, respectively, P are the contents of the register that cumulatively stores the count number P1 of the silent period, and the contents of the register that cumulatively store the count number ■1 of the sound period. is V, and the threshold value of the silent section P1 is l. This threshold value j is set so as to ignore consonants and word-initial syllables.

ステップ81.S2にて各レジスタ及びカウンタがクリ
ヤされる。無音区間と判断されているときには8mS毎
にカウンタP1がカウントされ(S5)、有音区間と判
断されているときには8mS毎にカウンタ■1がカウン
ト (S6)される。すなわち、 P 1←P 1 +1 Vi−Vi−1−1 が実行される。次にP i ) /3が判断され、NO
であれば P←P−1−Pi V←V+V 工 の累積が実行され(S9. 510)、つづいて切り出
された音節のカウント C−C+1 が実行される(S 11) 。11’:>lがyesで
あれば89. SlO,Sllの処理は省かれる。最後
に、S’12にて1音節の平均時間Tと32秒毎の平均
発声速度Mが次式により算出される。
Step 81. Each register and counter are cleared in S2. When it is determined that it is a silent section, the counter P1 is counted every 8 mS (S5), and when it is determined that it is a sound section, the counter P1 is counted every 8 mS (S6). That is, P 1←P 1 +1 Vi-Vi-1-1 is executed. Next, P i ) /3 is determined and NO
If so, the accumulation of P←P-1-Pi V←V+V is executed (S9.510), and then the count of cut out syllables C-C+1 is executed (S11). 11':>89 if l is yes. The processing of SlO and Sll is omitted. Finally, in S'12, the average time T of one syllable and the average speech rate M every 32 seconds are calculated using the following equations.

1000 M =− この算出結果はCPUに転送される。1000 M=- This calculation result is transferred to the CPU.

第3図に識別率の演算処理するプログラムのフローチャ
ートを示す。S21にてカウンタC1゜C2がクリアさ
れ、前記した処理により切り出された音節か入力され(
S 22) 、その内容が認識され(f924)、認識
結果が表示装置12に表示され(S25)、この処理が
単語終了まで行われる。ここで、発声した内容と表示さ
れた内容が相違していると、認識結果をキーボードによ
り修正する作業が行われる(EI27)。この修正は、
認識結果の複数の候補より第−位の候補の認識結果につ
いて修正の必要がある場合に行われる。修正後、CPU
において第−位の候補の認識結果の単語と、確認もしく
は修正によって正しく改められた認識結果の単語との間
で各音節ごとに比較が行われ(S28〜533)、識別
率にの算出l [=□  2 が実行され、発声速度Mの算出 が実行され、表示される。例えば、「はじめ」と発音し
たとき「かしめ」と表示されたため第一文字「か」を「
は」に修正したさきは識別率に一区−66・7チ と算出され、表示される。
FIG. 3 shows a flowchart of a program for calculating the identification rate. At S21, counters C1 and C2 are cleared, and the syllables cut out by the above processing are input (
S22), its content is recognized (f924), the recognition result is displayed on the display device 12 (S25), and this process is continued until the end of the word. Here, if the uttered content and the displayed content are different, the recognition result is corrected using the keyboard (EI27). This modification is
This is carried out when it is necessary to correct the recognition result of the candidate ranked lower than the plurality of recognition result candidates. After modification, CPU
A comparison is made for each syllable between the word of the recognition result of the -th candidate and the word of the recognition result corrected by confirmation or correction (S28 to 533), and the recognition rate is calculated l[ =□ 2 is executed, and the speech rate M is calculated and displayed. For example, when you pronounce ``hajime,'' the first character ``ka'' is displayed as ``kajime.''
After correcting it to ``ha'', the identification rate is calculated and displayed as -66.7chi.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明実施例のブロック構成図、第2図及び第
3図は本発明実施例のプログラムを示すフローチャート
である。 特許出願人 ンヤープ株式会社 代 理 人 弁理士西1) 新
FIG. 1 is a block diagram of an embodiment of the present invention, and FIGS. 2 and 3 are flowcharts showing programs of the embodiment of the present invention. Patent applicant Nyaap Co., Ltd. Agent Patent attorney Nishi 1) Shin

Claims (1)

【特許請求の範囲】[Claims] 日本語の音声を音節単位に認識する単音節認識装置にお
いて、発声速度演算手段と、識別率演算手段と、発声速
度表示手段と、識別率表示手段を有する音声認識装置。
A monosyllable recognition device for recognizing Japanese speech in units of syllables, comprising a speech rate calculation means, a discrimination rate calculation means, a speech rate display means, and a discrimination rate display means.
JP59093355A 1984-05-09 1984-05-09 Voice recognition equipment Granted JPS60237495A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59093355A JPS60237495A (en) 1984-05-09 1984-05-09 Voice recognition equipment

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59093355A JPS60237495A (en) 1984-05-09 1984-05-09 Voice recognition equipment

Publications (2)

Publication Number Publication Date
JPS60237495A true JPS60237495A (en) 1985-11-26
JPH0217119B2 JPH0217119B2 (en) 1990-04-19

Family

ID=14079968

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59093355A Granted JPS60237495A (en) 1984-05-09 1984-05-09 Voice recognition equipment

Country Status (1)

Country Link
JP (1) JPS60237495A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62294297A (en) * 1986-06-13 1987-12-21 松下電器産業株式会社 Voice input unit
JP2001100790A (en) * 1999-08-30 2001-04-13 Koninkl Philips Electronics Nv Method and device for speech recognition

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62294297A (en) * 1986-06-13 1987-12-21 松下電器産業株式会社 Voice input unit
JP2001100790A (en) * 1999-08-30 2001-04-13 Koninkl Philips Electronics Nv Method and device for speech recognition

Also Published As

Publication number Publication date
JPH0217119B2 (en) 1990-04-19

Similar Documents

Publication Publication Date Title
JPS58130393A (en) Voice recognition equipment
JP2008309856A (en) Speech recognition device and conference system
JPS60237495A (en) Voice recognition equipment
JPS645320B2 (en)
JP2528890B2 (en) Vocal training machine
JPS63217399A (en) Voice section detecting system
JPS60164800A (en) Voice recognition equipment
JPH0635494A (en) Speech recognizing device
JPH0236960B2 (en)
JPS63303398A (en) Voice recognition equipment
JP2744622B2 (en) Plosive consonant identification method
JPS58116595A (en) Word voice recognition equipment
JPS6147997A (en) Voice recognition equipment
JPS61138296A (en) Voice recognition equipment
JPH0451036B2 (en)
JPS58176699A (en) Voice standard pattern registration system
JPH0564800B2 (en)
JPS63220200A (en) Vowel deliverer
JPS61203499A (en) Voice recognition system
JPS63254497A (en) Pattern recognition equipment
JPS6296998A (en) Enunciation training apparatus
JPS6148899A (en) Voice recognition equipment
JPS6237797B2 (en)
JPS58134696A (en) Speech training apparatus
JPS62121499A (en) Voice recognition equipment