JPS5852698A - 音声認識処理システム - Google Patents
音声認識処理システムInfo
- Publication number
- JPS5852698A JPS5852698A JP56151089A JP15108981A JPS5852698A JP S5852698 A JPS5852698 A JP S5852698A JP 56151089 A JP56151089 A JP 56151089A JP 15108981 A JP15108981 A JP 15108981A JP S5852698 A JPS5852698 A JP S5852698A
- Authority
- JP
- Japan
- Prior art keywords
- data
- section
- voice
- input
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
本発明は、音声認識処理システム、特に入力された発声
データにもとづいて音声区間を切出す切出し処理に当っ
て、切出し態様を異にする複数個の切出し位置計算部を
用いて、切出された始端点と終端点とを統合して、可能
性のある複数個の切出しに対応した音声区間データを抽
出するようにし、上記切出し位置が非所望であることに
起因する認識処理の誤りを防止するよう構成した音声認
識処理システムに関するものである。
データにもとづいて音声区間を切出す切出し処理に当っ
て、切出し態様を異にする複数個の切出し位置計算部を
用いて、切出された始端点と終端点とを統合して、可能
性のある複数個の切出しに対応した音声区間データを抽
出するようにし、上記切出し位置が非所望であることに
起因する認識処理の誤りを防止するよう構成した音声認
識処理システムに関するものである。
音声認識処理システムにおいては、発声データにもとづ
いて抽出された標準音声区間データを格納している辞書
部をそなえると共に、当該辞書部の内容と認識のために
入力された未知入力発声データから抽出された未知音声
区間データとを照合するようにされる。上記標準音声区
間データや未知音声区間データを上記発声データから切
出すに当っては、例えば音声エネルギを抽出し当該エネ
ルギが所定の閾値を超えている点をもって始端点および
終端点として切出すなどの手段が用いられる。しかし、
発声状態や、場合によっては雑音が石畳された状態など
にもとづいて、上記切出しが常に最適な位置となるとは
限らない。このために、])P照合などの手法が用いら
れるが、該DP照合などの手法を用いている場合でも、
上記切出し位置の不適正に起因する誤認識が発生し得る
。
いて抽出された標準音声区間データを格納している辞書
部をそなえると共に、当該辞書部の内容と認識のために
入力された未知入力発声データから抽出された未知音声
区間データとを照合するようにされる。上記標準音声区
間データや未知音声区間データを上記発声データから切
出すに当っては、例えば音声エネルギを抽出し当該エネ
ルギが所定の閾値を超えている点をもって始端点および
終端点として切出すなどの手段が用いられる。しかし、
発声状態や、場合によっては雑音が石畳された状態など
にもとづいて、上記切出しが常に最適な位置となるとは
限らない。このために、])P照合などの手法が用いら
れるが、該DP照合などの手法を用いている場合でも、
上記切出し位置の不適正に起因する誤認識が発生し得る
。
本発明は上記の点を解決することを目的としており、本
発明の音声認識処理システムは、発声データにもとづい
て切出された音声区間に対応する標準音角区間データを
格納する辞書部をそなえると共に、未知入力発声データ
にもとづいて切出された音声区間に対応する未知音声区
間データと上記辞書部に格納されている標準音声区間デ
ータとを照合して上記未知入力発声データの上記音声区
間に対応するカテゴリを決定する音声認識処理システム
において、入力された発声データを保持する入力データ
保持部、入力された発声データにもとづいて夫々異なる
切出し態様のもとて当該発声データを切出す複数個の切
出し位置計算部、該各切出し位置計算部からの切出し結
果にもとづいて上記入力された発声データの始端点群と
当該入力された発声データの終端点群とを抽出しかつ存
在し得る始端・終端対を上記始端点群と終端点群との組
合わせによって抽出する切出し位置統合部、該切出し位
置統合部によって抽出された始端・終端対にもとづいて
上記入力データ保持部の内容に対して切出しを行なう切
出し処理部、および該切出し処理部によって切出された
上記組合わせに対応する個数に見合う音声区間データを
格納するデータ格納部をそなえてなり、該データ格納部
の内答全して上記標準音声区間データおよび/または未
知音声区間データどして用いて、上記照合を行なうよう
構成したことを特徴としている。以下図面を参照しつつ
説明する。
発明の音声認識処理システムは、発声データにもとづい
て切出された音声区間に対応する標準音角区間データを
格納する辞書部をそなえると共に、未知入力発声データ
にもとづいて切出された音声区間に対応する未知音声区
間データと上記辞書部に格納されている標準音声区間デ
ータとを照合して上記未知入力発声データの上記音声区
間に対応するカテゴリを決定する音声認識処理システム
において、入力された発声データを保持する入力データ
保持部、入力された発声データにもとづいて夫々異なる
切出し態様のもとて当該発声データを切出す複数個の切
出し位置計算部、該各切出し位置計算部からの切出し結
果にもとづいて上記入力された発声データの始端点群と
当該入力された発声データの終端点群とを抽出しかつ存
在し得る始端・終端対を上記始端点群と終端点群との組
合わせによって抽出する切出し位置統合部、該切出し位
置統合部によって抽出された始端・終端対にもとづいて
上記入力データ保持部の内容に対して切出しを行なう切
出し処理部、および該切出し処理部によって切出された
上記組合わせに対応する個数に見合う音声区間データを
格納するデータ格納部をそなえてなり、該データ格納部
の内答全して上記標準音声区間データおよび/または未
知音声区間データどして用いて、上記照合を行なうよう
構成したことを特徴としている。以下図面を参照しつつ
説明する。
第1図は本発明の一実施例要部構成、第2図は第1図図
示の切出し位置統合部における処理の一実施り11態様
を説明する説明図を示す。
示の切出し位置統合部における処理の一実施り11態様
を説明する説明図を示す。
第1図において、1は入力データ保持部であって例えば
マイクロフォンによって得られた音声信号に対して従来
周知の処理を行なって得られた発声データを時系列にし
たがって保持するもの、2−1ないし2〜Nは夫々切出
し位置計算部であって夫々が例えば音声エネルギ閾値レ
ベルを異にするガどによって夫々異なった切出し位置を
決定l−得るもの、3は切出し位置統合部であって例え
ば第2図を参照して説明する如き始端・終端対を抽出す
るもの、4は始端点群保持部、5は終端点群保持部、6
は切出し処理部であって上記切出し位置統合部3からの
複数個の始端・終端対にもとづいて上記入力データ保持
部1の内容から複数閏の切出しデータ全抽出するもの、
7はデータ格納部であって切出された切出しデータ■、
■、■。
マイクロフォンによって得られた音声信号に対して従来
周知の処理を行なって得られた発声データを時系列にし
たがって保持するもの、2−1ないし2〜Nは夫々切出
し位置計算部であって夫々が例えば音声エネルギ閾値レ
ベルを異にするガどによって夫々異なった切出し位置を
決定l−得るもの、3は切出し位置統合部であって例え
ば第2図を参照して説明する如き始端・終端対を抽出す
るもの、4は始端点群保持部、5は終端点群保持部、6
は切出し処理部であって上記切出し位置統合部3からの
複数個の始端・終端対にもとづいて上記入力データ保持
部1の内容から複数閏の切出しデータ全抽出するもの、
7はデータ格納部であって切出された切出しデータ■、
■、■。
■、・・・・・・・・・・・・全格納するもの、8−1
ないし8−4は夫々切出しデータ(音声区間データ)を
示している。
ないし8−4は夫々切出しデータ(音声区間データ)を
示している。
発声データが例えば入力データ保持部lから読出されて
、各切出し位置剖算部2−1ないし2−Nに供給される
。各切出し位置計算部においては夫々自己が判定した始
端点と終端点とを切出[7位置統合部3に通知する。今
例えば第2図図示の如く、音声区間と雑音とが一緒に上
記発声データ中に存在しているものとするとき、各切出
し位置計算部2−1ないし2−Nにおいては、第2図図
示S。
、各切出し位置剖算部2−1ないし2−Nに供給される
。各切出し位置計算部においては夫々自己が判定した始
端点と終端点とを切出[7位置統合部3に通知する。今
例えば第2図図示の如く、音声区間と雑音とが一緒に上
記発声データ中に存在しているものとするとき、各切出
し位置計算部2−1ないし2−Nにおいては、第2図図
示S。
Eの如く夫々が判定した始端点Sと終端点Eとを切出し
位置統合部3に通知する。
位置統合部3に通知する。
切出し位置統合部3においては、夫々の切出し位置計算
部2−1ない1〜2−1’Jから通知された始端点Sを
始端点群保持部4に収集し、−また終端点Eを終端点群
保持部5に収集する。そして、該切出し位置統合部3は
、第2図図示の如く、存在する例えば2つの始端点Sl
、S2と存在する例えば2つの終端点El 、E2と
にもとづいて、4個の始端・終端対即ち(S2.El)
、(S2.p、:)。
部2−1ない1〜2−1’Jから通知された始端点Sを
始端点群保持部4に収集し、−また終端点Eを終端点群
保持部5に収集する。そして、該切出し位置統合部3は
、第2図図示の如く、存在する例えば2つの始端点Sl
、S2と存在する例えば2つの終端点El 、E2と
にもとづいて、4個の始端・終端対即ち(S2.El)
、(S2.p、:)。
(SIIEI)l(s1+E ) を抽出し、切出し
処理部6に通知する。
処理部6に通知する。
このとき、入力データ保持部lの同各である発生データ
が切出し処理部6に供給され、上記始端・終端対に対応
して第2図図示の切出しデータ■。
が切出し処理部6に供給され、上記始端・終端対に対応
して第2図図示の切出しデータ■。
■、■、■が音声区間データ即ち図示データ8−1ない
し8−4として抽出され、データ格納部7に格納される
。言うまでもなく、図示の場合、各切出し位置計算部2
−1ないし2−Hのいずれもが正しい切出しを行ない得
なかった場合においても、データ■の如く音声区間に正
しく対応したデータを抽出することが可能となる。
し8−4として抽出され、データ格納部7に格納される
。言うまでもなく、図示の場合、各切出し位置計算部2
−1ないし2−Hのいずれもが正しい切出しを行ない得
なかった場合においても、データ■の如く音声区間に正
しく対応したデータを抽出することが可能となる。
データ格納部7に格納された切出しデータ即ち音声区間
データ8−1 、8−2 、・・・・・・・・・は、本
発明にいう標準音声区間データとしておよび/−!たけ
未知音声区間データとして、音声認識処理における周知
の認識処理の如く利用される。
データ8−1 、8−2 、・・・・・・・・・は、本
発明にいう標準音声区間データとしておよび/−!たけ
未知音声区間データとして、音声認識処理における周知
の認識処理の如く利用される。
以上説明した如く、本発明によれば、データ格納部に格
納された音声区間データ中には一般に適正なあるいは適
正なものに近似した形で切出された音声区間データが存
在し、切出し位置の不適正に起因する誤認識率が大きく
減少する。
納された音声区間データ中には一般に適正なあるいは適
正なものに近似した形で切出された音声区間データが存
在し、切出し位置の不適正に起因する誤認識率が大きく
減少する。
第1図は本発明の一実施例要部構成、第2図は第1図図
示の切出し位置統合部における処理の一実施例態様を説
明する説明図を示す。 図中、lは入力データ保持部、2は切出し位置計算部、
3は切出し位置統合部、6は切出し処理部、7はデータ
格納部、8は切出しデータ又は音声区間データを表わす
。 特許出願人 富士通株式会社
示の切出し位置統合部における処理の一実施例態様を説
明する説明図を示す。 図中、lは入力データ保持部、2は切出し位置計算部、
3は切出し位置統合部、6は切出し処理部、7はデータ
格納部、8は切出しデータ又は音声区間データを表わす
。 特許出願人 富士通株式会社
Claims (1)
- 発声データにもとづいて切出された音声区間に対応する
標準音声区間データを格納する辞書部をそなえると共に
、未知入力発声データにもとづいて切出された音声区間
に対応する未知音声区間データと上記辞書部に格納され
ている標準音声区間データとを照合して上記未知入力発
声データの上記音声区間に対応するカテゴリを決定する
音声認識処理システムにおいて、入力された発声データ
を保持する入力データ保持部、入力された発声データに
もとづいて夫々異なる切出し態様のもとて当該発声デー
タを切出す複数個の切出し位置計算部、該各切出し位置
計算部からの切出し結果にもとづいて上記入力された発
声データの始端点群と当該入力された発声データの終端
点群とを抽出しかつ存在し得る始端・終端対を上記始端
点群と終端点群との組合わせによって抽出する切出し位
置統合部、該切出し位置統合部によって抽出された始端
・終端対にもとづいて上記入力データ保持部の内容に対
して切出しを行なう切出し処理部、および該切出し処理
部によって切出された上記組合わせに対応する個数に見
合う音声区間データを格納するデータ格納部をそなえて
々す、該データ格納部の内容をして上記標準音声区間デ
ータおよび/′1.たは未知音声区間データとして用い
て、上記照合を行なうよう構成したことを特徴とする音
声認識処理システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP56151089A JPS5852698A (ja) | 1981-09-24 | 1981-09-24 | 音声認識処理システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP56151089A JPS5852698A (ja) | 1981-09-24 | 1981-09-24 | 音声認識処理システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS5852698A true JPS5852698A (ja) | 1983-03-28 |
JPH021317B2 JPH021317B2 (ja) | 1990-01-11 |
Family
ID=15511082
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP56151089A Granted JPS5852698A (ja) | 1981-09-24 | 1981-09-24 | 音声認識処理システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS5852698A (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59211098A (ja) * | 1983-05-16 | 1984-11-29 | 富士通株式会社 | 音声認識装置 |
JPS61223796A (ja) * | 1985-03-29 | 1986-10-04 | 沖電気工業株式会社 | 音声区間検出回路 |
JPS62100799A (ja) * | 1985-10-28 | 1987-05-11 | 松下電器産業株式会社 | 音声認識方法 |
JPS62100800A (ja) * | 1985-10-29 | 1987-05-11 | 松下電器産業株式会社 | 音声認識方法 |
JPH01193900A (ja) * | 1988-01-29 | 1989-08-03 | Toshiba Corp | 単語音声認識装置 |
JP2003280678A (ja) * | 2002-03-20 | 2003-10-02 | Asahi Kasei Corp | 音声認識装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57129500A (en) * | 1980-12-19 | 1982-08-11 | Western Electric Co | Method of and apparatus for detecting voice separations |
-
1981
- 1981-09-24 JP JP56151089A patent/JPS5852698A/ja active Granted
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57129500A (en) * | 1980-12-19 | 1982-08-11 | Western Electric Co | Method of and apparatus for detecting voice separations |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59211098A (ja) * | 1983-05-16 | 1984-11-29 | 富士通株式会社 | 音声認識装置 |
JPS61223796A (ja) * | 1985-03-29 | 1986-10-04 | 沖電気工業株式会社 | 音声区間検出回路 |
JPS62100799A (ja) * | 1985-10-28 | 1987-05-11 | 松下電器産業株式会社 | 音声認識方法 |
JPH054678B2 (ja) * | 1985-10-28 | 1993-01-20 | Matsushita Electric Ind Co Ltd | |
JPS62100800A (ja) * | 1985-10-29 | 1987-05-11 | 松下電器産業株式会社 | 音声認識方法 |
JPH054679B2 (ja) * | 1985-10-29 | 1993-01-20 | Matsushita Electric Ind Co Ltd | |
JPH01193900A (ja) * | 1988-01-29 | 1989-08-03 | Toshiba Corp | 単語音声認識装置 |
JP2003280678A (ja) * | 2002-03-20 | 2003-10-02 | Asahi Kasei Corp | 音声認識装置 |
Also Published As
Publication number | Publication date |
---|---|
JPH021317B2 (ja) | 1990-01-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4408490B2 (ja) | データベース照会を実行する方法及びその装置 | |
US20170270923A1 (en) | Voice processing device and voice processing method | |
CN110807093A (zh) | 语音处理方法、装置及终端设备 | |
JPS5852698A (ja) | 音声認識処理システム | |
JPS6123560B2 (ja) | ||
JPH02210500A (ja) | 標準パターン登録方式 | |
JPS59185400A (ja) | 単音節音声認識方式 | |
CN106951091B (zh) | 处理方法及设备 | |
JPS61180297A (ja) | 話者照合装置 | |
JPS59189398A (ja) | 連続音声認識方式 | |
JPS59204899A (ja) | 音声パタ−ン照合装置 | |
JP3535711B2 (ja) | 通話表を作成する作成方法、ならびに当該作成方法を記述したプログラムを格納した記憶媒体、ならびに当該作成方法で作成された通話表、ならびに当該通話表を作成するための装置 | |
JPH0376471B2 (ja) | ||
JPS63306499A (ja) | 不特定話者音声認識装置 | |
JPS63306498A (ja) | 音声区間検出方式 | |
JPS6315295A (ja) | 音声認識装置 | |
JPS6064397A (ja) | 音声認識装置 | |
JPS59121097A (ja) | 音声認識装置 | |
JPS5936299A (ja) | 音声認識装置 | |
JPS58159598A (ja) | 単音節音声認識方式 | |
JPS6287993A (ja) | 音声認識装置 | |
JPS59124394A (ja) | 単音節音声認識方式 | |
JPS61278896A (ja) | 話者照合装置 | |
JPS6167897A (ja) | 音声認識装置 | |
JPS63254498A (ja) | 音声認識応答装置 |