JPS59124399A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS59124399A
JPS59124399A JP57234085A JP23408582A JPS59124399A JP S59124399 A JPS59124399 A JP S59124399A JP 57234085 A JP57234085 A JP 57234085A JP 23408582 A JP23408582 A JP 23408582A JP S59124399 A JPS59124399 A JP S59124399A
Authority
JP
Japan
Prior art keywords
input
section
voice
level
parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57234085A
Other languages
English (en)
Inventor
宇佐美 隆一
松本 正至
横溝 信一
新家 修
三郎 安藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP57234085A priority Critical patent/JPS59124399A/ja
Publication of JPS59124399A publication Critical patent/JPS59124399A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は、入力音声がある一定のピーク・レベルを越え
た場合には騒音等のノイズと判断し、認識動作を禁止す
るようにした音声認識装置に関するものである。
〔従来技術と問題点〕
第1図は従来の音声認識装置の構成例を示す図である。
第1図において、1は音声入力部、2は入力パラメタ抽
出部%3はアッチング部、4は辞書、5はホスト・プロ
セッサを示す。
第1図において、入力パラメタ抽出部2は、音声入力部
からの入力音声の特徴量、所謂パラメタを抽出するもの
であシ、辞書4は音声のパラメタを蓄積するものである
。マツチング部3は、入力パラメタ抽出部2によって抽
出された入力音声のパラメタと辞書4に蓄積されている
蓄積パラメタとの比較を行ない、最も確からしい蓄積バ
ラメタに対応する認識文字列をホスト・プロセッサ5に
送出するもので−ある。マツチング部3の比較方式には
、時間的な要素を無視して1対1対応を取る線形マツチ
ングや1時間軸の伸縮を行なうDPマツチングなどがあ
る。ホスト・プロセッサ5は、音声認識装置を、OCR
や紙テープ・リーダ等と同列のI10装置として扱うも
のであり、データの加工、処理がホスト、・プロセッサ
5でなされる。
マツチング部4におけるマツチング動作は、通常0.2
ないし0.3秒であり、さらに表示の時間を含めると一
秒程度となり、その間入力はロック状態となる。
このような音声認識装置において、音声区間の検出法と
しては、主として、音声のパワーにより決定する方式か
一般的である。この方式の問題点は、工場や工事現場の
ようにノ・ンマ音等が間欠的に発生する高騒音下におい
て音声認識を行なう場合、音声入力処理としては高騒音
が入力されるとリジェクトされる。従って間欠的な騒音
が続いている間は、煩繁にリジェクトが生じ、この期間
は入力が不能になるという問題が生じる。
〔発明の目的〕
本発明は、上記の考察に基づくものであって、高騒音下
においても音声認識装置がむだな動作をすることなく、
入力音声に対応する音声入力処理を行ない得るようにな
った音声認識装置を提供することを目的とする。
〔発明の構成〕
そのために本発明の音声認識装置は、音声入力部、該音
声入力部からの入力音声のパラメタを抽出する入力バラ
メタ抽出部、上記パラメタを蓄積する辞書、及び上艙人
カパラメタ抽出部によって抽出された入力音声のパラメ
タと土間辞書に蓄積された蓄積パラメタとを比較し認識
文字列をホスト・プロセッサに通知するマツチング部を
有する音声認識装置において、入力音声のレベルを検出
するレベル検出部を設け、該レベA・検出部は、入力音
声がある一定のピーク・レベルを越えたことを検出した
ときには上記マツチング部に通知するように構成され、
上記マツチング部1l−I%上記レベル検出部から入力
音声がある一定のピーク・レベルを越えたことを検出し
て通知を受けたと4きは、認識動作の起動を禁止するよ
うに構成されたことを特徴とするものである。
〔発明の実施例〕
以下、本発明の実施例を図面を参照しつつ説明する・ 第2図は本発明の1実施例構成を示す図、第3図は騒音
と音声のパワー・レベルを示す図である。
第2図において、1ないし5は第1図に対応するものを
示し、6はノヘイレベル検出部を示す。
第、2図において、ノ・イレベル検出部6は、音声入力
部1からの入力音声のピーク・パワーがある一定の値P
w−Maxを超えるのを検出するものであり、その場合
にはマツチング部3に通知される。
人間の音声のピーク・パワーは、通常の会話レベルにお
いてはある上限が存在し、例えば工場や工事現場におけ
る間欠的な騒音に比較して、第3図に示1−ように人間
の音声のピーク・パワーの値は小さい。本発明では、こ
のような考察に基づき、人間の音声のピーク・パワーの
値の上限より若干大キいピーク・パワーの値を先に述べ
たハイレベル検出部6における一定の値Pw−Ma’x
とする。マツチング部3におけるマツチング動作の開始
灸件は、音声パワーPwがある一定値を越えである一定
時間継続している場合とするのが基本であり、実際上は
さらに種々のパラメタが付加される。しかし、ハイレベ
ル検出部6において、先に述べたように通常の音声では
表われ得ないようなハイレベルの信号が検出されると、
その旨がマツチング部3に通知されるので、マツチング
部3では、ハイレベル検出部6から通知があった場合に
は、マツチング動作の起動が抑制される。
以上の説明では1通常の音声では表われ得ないようなハ
イレベルの信号が入力されたことがハイレベル検出器で
検出されたとき、マツチング部にその旨を通知するよう
にしたが、入力パラメタ抽出部、もしくはマツチング部
の入力をカットするように構成してもよい・ 〔発明の効朱〕 以上の説明から明らかなように、ボ発明によれば、高騒
音が音声入力部から入力された場合にはマツチング動作
を行なわないようにするので、高騒音、によって音声認
識処理がディスターブされることがなく、無駄な動作を
することがない。従って音声認識装置は、音声入力に対
して有効に対応し、認識動作を行なうことができ、認識
効率の向上を計ることができる。
【図面の簡単な説明】
第1図は従来の音声認識装置の構成例を示す図、第2図
は本発明の1実施例構成を示す図、第3図は騒音と音声
のパワー・レベルを示す図である。 1・・・音声入力部、2・・・入力パラメタ抽出部、3
・・・マツチング、4・・・辞書、5・・・ホスト・プ
ロセッサ、6・・・ハイレベル検出部。 特出願人 富士通株式会社 代理人弁理士  京 谷 匹 部

Claims (1)

    【特許請求の範囲】
  1. 音声入力部、該音声入力部からの入力音声のパラメタを
    抽出する入カパラメタ抽出部、上記ノくラメタな蓄積す
    る辞書、及び上記入カッ(ラメタ抽出部によって抽出さ
    れた入力音声のパラメタと上記辞書に蓄積された蓄積パ
    ラメタとを比較し認識文字列をホスト・プロセ・ソサに
    通知するマ・ソチング部を有する音声認識装置において
    、入力音声のレベルを検出するレベル検出部を設け、該
    レベル検出部は、入力音声がある一定のピーク・レベル
    を越えたことを検出したときには上記マツチング部に通
    知するように構成され、上記マツチング部は、上記レベ
    ル検出部から入力音声がある一定のピーク・レベルを越
    えたことを検出して通知を受けたときは認識動作の起動
    を禁止するように構成されたことを特徴とする音声認識
    装置。
JP57234085A 1982-12-30 1982-12-30 音声認識装置 Pending JPS59124399A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57234085A JPS59124399A (ja) 1982-12-30 1982-12-30 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57234085A JPS59124399A (ja) 1982-12-30 1982-12-30 音声認識装置

Publications (1)

Publication Number Publication Date
JPS59124399A true JPS59124399A (ja) 1984-07-18

Family

ID=16965371

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57234085A Pending JPS59124399A (ja) 1982-12-30 1982-12-30 音声認識装置

Country Status (1)

Country Link
JP (1) JPS59124399A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0394943A2 (en) 1989-04-25 1990-10-31 Fuji Photo Film Co., Ltd. Silver halide color photographic material
WO2014065254A1 (ja) * 2012-10-25 2014-05-01 京セラ株式会社 携帯端末装置および入力操作受け付け方法
JP2016540276A (ja) * 2013-09-30 2016-12-22 クゥアルコム・インコーポレイテッドQualcomm Incorporated 既知の、まだ着用されていないセンサの使用によるジェスチャ検出システムの分類
JP2020129080A (ja) * 2019-02-08 2020-08-27 三浦 浩之 音声認識システム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0394943A2 (en) 1989-04-25 1990-10-31 Fuji Photo Film Co., Ltd. Silver halide color photographic material
WO2014065254A1 (ja) * 2012-10-25 2014-05-01 京セラ株式会社 携帯端末装置および入力操作受け付け方法
JP2014085954A (ja) * 2012-10-25 2014-05-12 Kyocera Corp 携帯端末装置、プログラムおよび入力操作受け付け方法
US9760165B2 (en) 2012-10-25 2017-09-12 Kyocera Corporation Mobile terminal device and input operation receiving method for switching input methods
JP2016540276A (ja) * 2013-09-30 2016-12-22 クゥアルコム・インコーポレイテッドQualcomm Incorporated 既知の、まだ着用されていないセンサの使用によるジェスチャ検出システムの分類
JP2020129080A (ja) * 2019-02-08 2020-08-27 三浦 浩之 音声認識システム

Similar Documents

Publication Publication Date Title
ATE412223T1 (de) Prüfung von bildaufnahmen von personen
MXPA01010594A (es) Sistema de reconocimiento en radiodifusion para verificar palabras clave de frecuencia bucal.
JPS5852695A (ja) 車両用音声検出装置
JPS59124399A (ja) 音声認識装置
JPS61233791A (ja) 音声認識装置における音声区間検出方式
JP3023365B2 (ja) 音声認識制御装置
JP3023137B2 (ja) 音声認識制御装置
KR20040082756A (ko) 비음성 제거에 의한 음성 추출 방법
JP2654008B2 (ja) 音声認識方式
JPS59228300A (ja) 音声区間検出方式
JPS63220295A (ja) 音声区間検出方式
JPS62238599A (ja) 音声区間検出方法
JPS6250837B2 (ja)
JPS62244100A (ja) 音声区間検出方式
JPS59114599A (ja) 音声検出方式
JPS61260299A (ja) 音声認識装置
JPS61259296A (ja) 音声区間検出方式
CN115231398A (zh) 一种基于ai手势、语音识别的方法及系统
JPS59105697A (ja) 音声認識装置
JPS6377095A (ja) 音声区間の始端検出装置
JP3474072B2 (ja) 音声認識装置および音声認識方法
JPS6265092A (ja) 音声認識装置
JPS6177100A (ja) 音声区間検出回路
JPS61258298A (ja) 音声無音区間検出方式
CN113660537A (zh) 一种字幕生成方法和装置