JPH0217119B2 - - Google Patents
Info
- Publication number
- JPH0217119B2 JPH0217119B2 JP59093355A JP9335584A JPH0217119B2 JP H0217119 B2 JPH0217119 B2 JP H0217119B2 JP 59093355 A JP59093355 A JP 59093355A JP 9335584 A JP9335584 A JP 9335584A JP H0217119 B2 JPH0217119 B2 JP H0217119B2
- Authority
- JP
- Japan
- Prior art keywords
- speech
- rate
- section
- recognition
- syllable
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 238000004364 calculation method Methods 0.000 claims description 7
- 230000011218 segmentation Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000000034 method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
Description
【発明の詳細な説明】
<技術分野>
本発明は日本語の音声認識装置に関する。
<従来技術>
従来の音声認識装置には、話者が認識率の向上
を計るための目安となる発声速度、識別率の表示
装置が設けられていなかつたため、話者は最良の
発声状態を自覚することができなかつた。
を計るための目安となる発声速度、識別率の表示
装置が設けられていなかつたため、話者は最良の
発声状態を自覚することができなかつた。
<発明の目的>
本発明の目的は、発声速度と識別率が可視表示
され、識別率の向上を計りながら発声することの
できる音声認識装置を提供することにある。
され、識別率の向上を計りながら発声することの
できる音声認識装置を提供することにある。
<実施例>
以下、本発明の構成を、実施例により説明す
る。
る。
第1図に本発明装置のブロツク構成図を示す。
マイクロホン1に入力された音声信号は、アナ
ログ入力部2で増幅及びデジタル変換され、音声
分析部3及び音節セグメンテーシヨン部4に導入
される。音声分析部3は、入力された音声信号を
16mS程度のフレームに分け、スペクトル分析を
行ない、8mS程度の間隔で音節セグメンテーシヨ
ン部4へ、その音声の特徴パターン情報、パワー
零交差数等の情報を転送する。
ログ入力部2で増幅及びデジタル変換され、音声
分析部3及び音節セグメンテーシヨン部4に導入
される。音声分析部3は、入力された音声信号を
16mS程度のフレームに分け、スペクトル分析を
行ない、8mS程度の間隔で音節セグメンテーシヨ
ン部4へ、その音声の特徴パターン情報、パワー
零交差数等の情報を転送する。
音節セグメンテーシヨン部4は、音声分析部3
から送られた種々な情報に基いて音節を切り出
す。また、入力音声の無音区間、有音区間の識別
を行ない、各区間について時間計測が8mS毎に行
なわれ、計測されたデータは発声速度の計算デー
タとしてCPU5に送られる。
から送られた種々な情報に基いて音節を切り出
す。また、入力音声の無音区間、有音区間の識別
を行ない、各区間について時間計測が8mS毎に行
なわれ、計測されたデータは発声速度の計算デー
タとしてCPU5に送られる。
音節セグメンテーシヨン部4において切り出さ
れた音節の特徴パターンは、CPU5を通じてパ
ターンメモリ6内の特徴パターンメモリ7に格納
され、標準パターンメモリ8に予め登録されてい
る標準パターンと、単音節認識部9に比較され
る。その比較結果はCPU5に戻され、CPU5は
それを認識結果格納メモリ10に貯蔵し、表示装
置12に表示する。キーボード11は表示された
入力音声を修正するために用いられる。
れた音節の特徴パターンは、CPU5を通じてパ
ターンメモリ6内の特徴パターンメモリ7に格納
され、標準パターンメモリ8に予め登録されてい
る標準パターンと、単音節認識部9に比較され
る。その比較結果はCPU5に戻され、CPU5は
それを認識結果格納メモリ10に貯蔵し、表示装
置12に表示する。キーボード11は表示された
入力音声を修正するために用いられる。
第2図に音節セグメンテーシヨン部4の発声速
度演算処理用プログラムのフローチヤートを示
す。
度演算処理用プログラムのフローチヤートを示
す。
無音区間と有音区間は交互に繰返される。無音
区間と有音区間の時間計測のカウント数をそれぞ
れPi、Viとし、無音区間のカウント数Piを累積
記憶するレジスタの内容をP、有音区間のカウン
ト数Viを累積記憶するレジスタの内容をV、無
音区間Piのいき値をlとする。このいき値lは促
音、語頭の音節を無視するように設定される。ス
テツプS1,S2にて各レジスタ及びカウンタがク
リヤされる。無音区間と判断されているときには
8mS毎にカウンタPiがカウントされ(S5)、有音
区間と判断されているときには8mS毎にカウンタ
Viがカウント(S6)される。すなわち、 Pi←Pi+1 Vi←Vi+1 が実行される。次にPi>lが判断され、NOであ
れば、 P←P+Pi V←V+Vi の累積が実行され(S9,S10)、つづいて切り出
された音節のカウント C←C+1 が実行される(S11)。Pi>lがYesであればS9,
S10,S11の処理は省かれる。最後に、S12にて1
音節の平均時間Tと1秒毎の平均発声速度Mが次
式により算出される。
区間と有音区間の時間計測のカウント数をそれぞ
れPi、Viとし、無音区間のカウント数Piを累積
記憶するレジスタの内容をP、有音区間のカウン
ト数Viを累積記憶するレジスタの内容をV、無
音区間Piのいき値をlとする。このいき値lは促
音、語頭の音節を無視するように設定される。ス
テツプS1,S2にて各レジスタ及びカウンタがク
リヤされる。無音区間と判断されているときには
8mS毎にカウンタPiがカウントされ(S5)、有音
区間と判断されているときには8mS毎にカウンタ
Viがカウント(S6)される。すなわち、 Pi←Pi+1 Vi←Vi+1 が実行される。次にPi>lが判断され、NOであ
れば、 P←P+Pi V←V+Vi の累積が実行され(S9,S10)、つづいて切り出
された音節のカウント C←C+1 が実行される(S11)。Pi>lがYesであればS9,
S10,S11の処理は省かれる。最後に、S12にて1
音節の平均時間Tと1秒毎の平均発声速度Mが次
式により算出される。
N=8×(P+V)/C
M=1000/N
この算出結果はCPUに転送される。
第3図に識別率の演算処理するプログラムのフ
ローチヤートを示す。S21にてカウンタC1,C
2がクリアされ、前記した処理により切り出され
た音節が入力され(S22)、その内容が認識され
(S24)、認識結果が表示装置12に表示され
(S25)、この処理が単語終了まで行われる。ここ
で、発声した内容と表示された内容が相違してい
ると、認識結果をキーボードにより修正する作業
が行われる(S27)。この修正は、認識結果の複
数の候補より第一位の候補の認識結果について修
正の必要がある場合に行われる。修正後、CPU
において第一位の候補の認識結果の単語と、確認
もしくは修正によつて正しく改められた認識結果
の単語との間で各音節ごとに比較が行われ(S28
〜S33)、識別率Kの算出 K=C1/C2 が実行され、発声速度Mの算出 M=1000n/8×(P+V) が実行され、表示される。例えば、「はじめ」と
発音したとき「かじめ」と表示されたため第一文
字「か」を「は」に修正したときは識別率 K=2/3=66.7% と算出され、表示される。
ローチヤートを示す。S21にてカウンタC1,C
2がクリアされ、前記した処理により切り出され
た音節が入力され(S22)、その内容が認識され
(S24)、認識結果が表示装置12に表示され
(S25)、この処理が単語終了まで行われる。ここ
で、発声した内容と表示された内容が相違してい
ると、認識結果をキーボードにより修正する作業
が行われる(S27)。この修正は、認識結果の複
数の候補より第一位の候補の認識結果について修
正の必要がある場合に行われる。修正後、CPU
において第一位の候補の認識結果の単語と、確認
もしくは修正によつて正しく改められた認識結果
の単語との間で各音節ごとに比較が行われ(S28
〜S33)、識別率Kの算出 K=C1/C2 が実行され、発声速度Mの算出 M=1000n/8×(P+V) が実行され、表示される。例えば、「はじめ」と
発音したとき「かじめ」と表示されたため第一文
字「か」を「は」に修正したときは識別率 K=2/3=66.7% と算出され、表示される。
第1図は本発明実施例のブロツク構成図、第2
図及び第3図は本発明実施例のプログラムを示す
フローチヤートである。
図及び第3図は本発明実施例のプログラムを示す
フローチヤートである。
Claims (1)
- 1 日本語の音声を音節単位に認識する単音節認
識装置において、発声速度演算手段と、識別率演
算手段と、発声速度表示手段と、識別率表示手段
を有する音声認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59093355A JPS60237495A (ja) | 1984-05-09 | 1984-05-09 | 音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59093355A JPS60237495A (ja) | 1984-05-09 | 1984-05-09 | 音声認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS60237495A JPS60237495A (ja) | 1985-11-26 |
JPH0217119B2 true JPH0217119B2 (ja) | 1990-04-19 |
Family
ID=14079968
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59093355A Granted JPS60237495A (ja) | 1984-05-09 | 1984-05-09 | 音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS60237495A (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2574242B2 (ja) * | 1986-06-13 | 1997-01-22 | 松下電器産業株式会社 | 音声入力装置 |
DE19941227A1 (de) * | 1999-08-30 | 2001-03-08 | Philips Corp Intellectual Pty | Verfahren und Anordnung zur Spracherkennung |
-
1984
- 1984-05-09 JP JP59093355A patent/JPS60237495A/ja active Granted
Also Published As
Publication number | Publication date |
---|---|
JPS60237495A (ja) | 1985-11-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4867804B2 (ja) | 音声認識装置及び会議システム | |
JPH0252279B2 (ja) | ||
JPH0217119B2 (ja) | ||
JPH0546557B2 (ja) | ||
JPS645320B2 (ja) | ||
JP2528890B2 (ja) | 発声訓練機 | |
JP2578771B2 (ja) | 音声認識装置 | |
JPS63217399A (ja) | 音声区間検出装置 | |
JP2679039B2 (ja) | 母音切出し装置 | |
JPS6237797B2 (ja) | ||
JPH02239291A (ja) | 文節音声認識装置 | |
JPS63161499A (ja) | 音声認識装置 | |
JPS6370298A (ja) | 促音認識装置 | |
JPS60164800A (ja) | 音声認識装置 | |
JPS59211098A (ja) | 音声認識装置 | |
JPS63161500A (ja) | 音声認識装置 | |
JPH0635494A (ja) | 音声認識装置 | |
JPS6310437B2 (ja) | ||
JPS61203499A (ja) | 音声認識方式 | |
JPS6026400A (ja) | 連続音声認識装置 | |
JPH0887292A (ja) | 単語音声認識装置 | |
JPS63303398A (ja) | 音声認識装置 | |
JPH03145167A (ja) | 音声認識方式 | |
JPS60170900A (ja) | 音節音声標準パタン登録方式 | |
JPH0554117B2 (ja) |