JPH021317B2 - - Google Patents

Info

Publication number
JPH021317B2
JPH021317B2 JP56151089A JP15108981A JPH021317B2 JP H021317 B2 JPH021317 B2 JP H021317B2 JP 56151089 A JP56151089 A JP 56151089A JP 15108981 A JP15108981 A JP 15108981A JP H021317 B2 JPH021317 B2 JP H021317B2
Authority
JP
Japan
Prior art keywords
data
section
speech
input
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP56151089A
Other languages
English (en)
Other versions
JPS5852698A (ja
Inventor
Juji Kijima
Akihiro Kimura
Yasuhiro Nara
Atsuhito Kobayashi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP56151089A priority Critical patent/JPS5852698A/ja
Publication of JPS5852698A publication Critical patent/JPS5852698A/ja
Publication of JPH021317B2 publication Critical patent/JPH021317B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 本発明は、音声認識処理システム、特に入力さ
れた発声データにもとづいて音声区間を切出す切
出し処理に当つて、切出し態様を異にする複数個
の切出し位置計算部を用いて、切出された始端点
と終端点とを統合して、可能性のある複数個の切
出しに対応して音声区間データを抽出するように
し、上記切出し位置が非所望であることに起因す
る認識処理の誤りを防止するように構成した音声
認識処理システムに関するものである。
音声認識処理システムにおいては、発声データ
にもとづいて抽出された標準音声区間データを格
納している辞書部をそなえると共に、当該辞書部
の内容と認識のために入力された未知入力発声デ
ータから抽出された未知音声区間データとを照合
するようにされる。上記標準音声区間データや未
知音声区間データを上記発声データから切出すに
当つては、例えば音声エネルギを抽出し当該エネ
ルギが所定の閾値を超えている点をもつて始端点
および終端点として切出すなどの手段が用いられ
る。しかし、発声状態や、場合によつては雑音が
重畳された状態などにもとづいて、上記切出しが
常に最適な位置となるとは限らない。このため
に、DP照合などの手法が用いられるが、該DP照
合などの手法を用いている場合でも、上記切出し
位置の不適正に起因する誤認識が発生し得る。
本発明は上記の点を解決することを目的として
おり、本発明の音声認識処理システムは、発声デ
ータにもとづいて切出された音声区間に対応する
標準音声区間データを格納する辞書部をそなえる
と共に、未知入力発声データにもとづいて切出さ
れた音声区間に対応する未知音声区間データと上
記辞書部に格納されている標準音声区間データと
を照合して上記未知入力発声データの上記音声区
間に対応するカテゴリを決定する音声認識処理シ
ステムにおいて、 入力された発声データを保持する入力データ保
持部、 入力された発声データにもとづいて夫々異なる
切出し態様のもとで当該発声データを切出す複数
個の切出し位置計算部、 該各切出し位置計算部からの切出し結果にもと
づいて上記入力された発声データの始端点群と当
該入力された発声データの終端点群とを抽出しか
つ存在し得る始端・終端対を上記始端点群と終端
点群との組合わせによつて抽出する切出し位置統
合部、 該切出し位置統合部によつて抽出された始端・
終端対にもとづいて上記入力データ保持部の内容
に対して切出しを行なう処理部、 および該切出し処理部によつて切出された上記
組合わせに対応する個数に見合う音声区間データ
を格納するデータ格納部をそなえてなり、 該データ格納部の内容をして上記標準音声区間
データとして保持すると共に未知音声区間データ
として用い上記標準音声区間データとの上記照合
を行なうよう構成したことを特徴としている。以
下図面を参照しつつ説明する。
第1図は本発明の一実施例要部構成、第2図は
第1図図示の切出し位置統合部における処理の一
実施例態様を説明する説明図を示す。
第1図において、1は入力データ保持部であつ
て例えばマイクロフオンによつて得られた音声信
号に対して従来周知の処理を行なつて得られた発
声データを時系列にしたがつて保持するもの、2
―1ないし2―Nは夫々切出し位置計算部であつ
て夫々が例えば音声エネルギ閾値レベルを異にす
るなどによつて夫々異なつた切出し位置を決定し
得るもの、3は切出し位置統合部であつて例えば
第2図を参照して説明する如き始端・終端対を抽
出するもの、4は始端点群保持部、5は終端点群
保持部、6は切出し処理部であつて上記切出し位
置統合部3からの複数個の始端・終端対にもとづ
いて上記入力データ保持部1の内容から複数個の
切出しデータを抽出するもの、7はデータ格納部
であつて切出された切出しデータ,,,
,……を格納部するもの、8―1ないし8―4
は夫々切出しデータ(音声区間データ)を示して
いる。
発声データが例えば入力データ保持部1から読
出されて、各切出し位置計算部2―1ないし2―
Nに供給される。各切出し位置計算部においては
夫々自己が判定した始端点と終端点とを切出し位
置統合部3に通知する。今例えば第2図図示の如
く、音声区間と雑音とが一緒に上記発声データ中
に存在しているものとするとき、各切出し位置計
算部2―1ないし2―Nにおいては、第2図図示
S,Eの如く夫々が判定した始端点Sと終端点E
とを切出し位置統合部3に通知する。
切出し位置統合部3においては、夫々の切出し
位置計算部2―1ないし2―Nから通知された始
端点Sを始端点群保持部4に収集し、また終端点
Eを終端点群保持部5に収集する。そして、該切
出し位置統合部3は、第2図図示の如く、存在す
る例えば2つの始端点S1,S2と存在する例え
ば2つの終端点E1,E2とにもとづいて、4個
の始端・終端対即ち(S2,E1),(S2,E
2),(S1,E1),(S1,E2)を抽出し、切
出し処理部6に通知する。
このとき、入力データ保持部1の内容である発
生データが切出し処理部6に供給され、上記始
端・終端対に対応して第2図図示の切出しデータ
,,,が音声区間データ即ち図示データ
8―1ないし8―4として抽出され、データ格納
部7に格納される。言うまでもなく、図示の場
合、各切出し位置計算部2―1ないし2―Nのい
ずれもが正しい切出しを行ない得なかつた場合に
おいても、データの如く音声区間に生しく対応
したデータを抽出することが可能となる。
データ格納部7に格納された切出しデータ即ち
音声区間データ8―1,8―2,……は、本発明
にいう標準音声区間データとしておよび/または
未知音声区間データとして、音声認識処理におけ
る周知の認識処理の如く利用される。
以上説明した如く、本発明によれば、データ格
納部に格納された音声区間データ中には一般に適
正なあるいは適正なものに近似した形で切出され
た音声区間データが標準音声区間データとしてか
つまた未知音声区間データとして存在し、切出し
位置の不適正に起因する誤認識率が大きく減少す
る。
【図面の簡単な説明】
第1図は本発明の一実施例要部構成、第2図は
第1図図示の切出し位置統合部における処理の一
実施例態様を説明する説明図を示す。 図中、1は入力データ保持部、2は切出し位置
計算部、3は切出し位置統合部、6は切出し処理
部、7はデータ格納部、8は切出しデータ又は音
声区間データを表わす。

Claims (1)

  1. 【特許請求の範囲】 1 発声データにもとづいて切出された音声区間
    に対応する標準音声区間データを格納する辞書部
    をそなえると共に、未知入力発声データにもとづ
    いて切出された発音区間に対応する未知音声区間
    データと上記辞書部に格納されている標準音声区
    間データとを照合して上記未知入力発声データの
    上記音声区間に対応するカテゴリを決定する音声
    認識処理システムにおいて、 入力された発声データを保持する入力データ保
    持部、 入力された発声データにもとづいて夫々異なる
    切出し態様のもとで当該発声データを切出す複数
    個の切出し位置計算部、 該各切出し位置計算部からの切出し結果にもと
    づいて上記入力された発声データの始端点群と当
    該入力された発声データの終端点群とを抽出しか
    つ存在し得る始端・終端対を上記始端点群と終端
    点群との組合わせによつて抽出する切出し位置統
    合部、 該切出し位置統合部によつて抽出された始端・
    終端対にもとづいて上記入力データ保持部の内容
    に対して切出しを行なう切出し処理部、 および該切出し処理部によつて切出された上記
    組合わせに対応する個数に見合う音声区間データ
    を格納するデータ格納部をそなえてなり、 該データ格納部の内容をして上記標準音声区間
    データとして保持すると共に未知音声区間データ
    として用い上記標準音声区間データとの上記照合
    を行なうよう構成したことを特徴とする音声認識
    処理システム。
JP56151089A 1981-09-24 1981-09-24 音声認識処理システム Granted JPS5852698A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56151089A JPS5852698A (ja) 1981-09-24 1981-09-24 音声認識処理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56151089A JPS5852698A (ja) 1981-09-24 1981-09-24 音声認識処理システム

Publications (2)

Publication Number Publication Date
JPS5852698A JPS5852698A (ja) 1983-03-28
JPH021317B2 true JPH021317B2 (ja) 1990-01-11

Family

ID=15511082

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56151089A Granted JPS5852698A (ja) 1981-09-24 1981-09-24 音声認識処理システム

Country Status (1)

Country Link
JP (1) JPS5852698A (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06100918B2 (ja) * 1983-05-16 1994-12-12 富士通株式会社 音声認識装置
JPH0673079B2 (ja) * 1985-03-29 1994-09-14 沖電気工業株式会社 音声区間検出回路
JPS62100799A (ja) * 1985-10-28 1987-05-11 松下電器産業株式会社 音声認識方法
JPS62100800A (ja) * 1985-10-29 1987-05-11 松下電器産業株式会社 音声認識方法
JP2892004B2 (ja) * 1988-01-29 1999-05-17 株式会社東芝 単語音声認識装置
JP2003280678A (ja) * 2002-03-20 2003-10-02 Asahi Kasei Corp 音声認識装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57129500A (en) * 1980-12-19 1982-08-11 Western Electric Co Method of and apparatus for detecting voice separations

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57129500A (en) * 1980-12-19 1982-08-11 Western Electric Co Method of and apparatus for detecting voice separations

Also Published As

Publication number Publication date
JPS5852698A (ja) 1983-03-28

Similar Documents

Publication Publication Date Title
US20080294433A1 (en) Automatic Text-Speech Mapping Tool
JP4950024B2 (ja) 会話システムおよび会話ソフトウェア
JPH021317B2 (ja)
Villing et al. Performance limits for envelope based automatic syllable segmentation
JPS58108590A (ja) 音声認識装置
JPS61180297A (ja) 話者照合装置
JP2757356B2 (ja) 単語音声認識方法および装置
JPH0119597B2 (ja)
JPH0211919B2 (ja)
JPS59185400A (ja) 単音節音声認識方式
JPS63798B2 (ja)
JP2891259B2 (ja) 音声区間検出装置
JPH0567039B2 (ja)
JP2528105B2 (ja) 音声認識装置
JPS62223798A (ja) 音声認識装置
JPS59189398A (ja) 連続音声認識方式
JPS6315295A (ja) 音声認識装置
JPS6078491A (ja) 辞書更新方式
JPH079598B2 (ja) 音声認識装置における標準パラメ−タの修正方法
JPH0316038B2 (ja)
JPS62258500A (ja) 単音節音声の母音部切出方法
JPS59204099A (ja) 音声認識方式
JPS5944640B2 (ja) 音声情報サンプリング装置
JPS5936299A (ja) 音声認識装置
JPS6240497A (ja) 音声パタ−ン分類方式