JPS62300000A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS62300000A
JPS62300000A JP61145141A JP14514186A JPS62300000A JP S62300000 A JPS62300000 A JP S62300000A JP 61145141 A JP61145141 A JP 61145141A JP 14514186 A JP14514186 A JP 14514186A JP S62300000 A JPS62300000 A JP S62300000A
Authority
JP
Japan
Prior art keywords
word
synchronization signal
segmentation
input section
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61145141A
Other languages
English (en)
Inventor
謙二 松井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP61145141A priority Critical patent/JPS62300000A/ja
Publication of JPS62300000A publication Critical patent/JPS62300000A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 3、発明の詳細な説明 産業上の利用分野  □ 本発明は連続して発声された音声を認識する音声認識装
置に関するものである。
従来の技術 一般に、音声認識アルゴリズムはセグメンテーション部
とセグメンテーションによって区切られた単語などの単
位毎の入力バタンを標準バタンと比較するバタンマツチ
ング部から構成される。セ2ペーノ グメンテーションとは入力された音声データの時系列を
単語の単位に区切る場合や更にその単語を音節などに切
り分ける操作のことである。また、2段DPアルゴリズ
ム等のようにセグメンテーションを行わずいきなり音節
や単語単位の標準バタンと入力バタンをマツチングさせ
て認識を行う方法もあ名が、アルゴリズムが単純になる
反面、計算量が膨大になるという欠点がある。従って、
もし、音節や単語の大まかな位置や個数が既知であれば
セグメンテーシヨンは非常に容易になるし、2段DPア
ルゴリズム等の場合でも計算量が大幅に減少するので極
めて有用であると言える。
現状の技術では、セグメンテーションは音声の電力の変
化やスペクトルの変化を基に行っているが正確に行うこ
とは極めて難しく、発声が連続や自然発声になればなる
ほどさらに難しくなる。
発明が解決しようとする問題点 音声認識技術の究極の目的は自然に発声された音声を正
しく認識することにあるが、現在の音声認識技術では連
続発声された音声を認識するとと3ベ−7 は極めて難しい。この要因の一つに上記の音声のセグメ
ンテーションの問題がある。セグメンテーションが適切
に行われないと次段のバタンマツチング部の性能がいか
に良くても意味の無いことになる。従って、適切なセグ
メンテーション操作を行うことが高認識率のキーポイン
トである。しかるに連続発声された音声では調音結合や
有声音の無声化等により適切なセグメンテーションが難
しく決定的な方法が無いのが現状である。
本発明は、かかる点に鑑み単語の同期信号を用いること
により安定した単語のセグメンテーションを行い高認識
率の得られる音声認識装置を提供することを目的とする
問題点を解決するだめの手段 上記問題点を解決するだめの本発明の技術的な手段を以
下に示す。
発声した音声を音響−電気変換する音声入力部と、単語
を発声する毎にキースイッチ等を押すことにより単語の
発声を入力する単語同期信号入力部と、上記音声入力部
の出力信号を上記単語同期信号入力部からの単語同期信
すに同期させてセグメンテーションを行う音声認識部と
を用いて認識を行うものである3゜ 作用 この技術的手段による作用は次のようになる。
即ち、単語を発声する毎にキースイッチ等を押すことに
より単語の発声を知らせる単語同期信号′入力部の出力
は、パルス状の信号でありその立ち上がりエツジは各単
語の発声開始位置に対応する。
この信シジを用いることにより安定したセグメンテーシ
ョンが行え認識率の向上が図れる。
実施例 第1図は本発明の実施例に於ける音声認識装置の構成を
示すものである3、同図に於いて1は音声入力部、2は
特徴抽出部、3は本発明による単語同期信号入力部、4
はセグメンテーション部、6はバタンマツチング部、6
は標準バタン記憶部、7は出力部である。
上記のように構成された本発明の実施例の音声認識装置
について、以下その動作を説明する。
6ベーノ 発声された音声は音声入力部1に入力され入力部ではこ
の音声信号を電気信号に変換しさらにディジタル化する
。この信号は特徴抽出部2において周波数分析等の手段
によって特徴抽出される。
また、話者は単語を発声する毎に単語同期信号入力部3
のキースイッチ等を押すことにより単語の発声を知らせ
る単語同期信号がセグメンテーション部4に送られる。
セグメンテーション部4は上記特徴抽出された音声デー
タを上記単語同期信号に従って各単語に切り分ける。単
語同期信号は、パルス状の信号でありその立ち上がりエ
ツジは各単語の発声開始位置に対応する。。この様子を
第2図に示す。バタンマツチング部6はセグメンテーシ
ョン部4で切り分けられた音声データを標準ノくタン記
憶部6の単語標準バタンと・くタンマツチングを行い最
も類似した単語に対応したコードを出力部7に送る。出
力部7では、得られた単語の認識結果を所望のフォーマ
ットに変換し認識結果として出力する。
尚、単語同期信号入力部3はポインティング装6ペーノ 置としてよく用いられるマウスの付属スイッチ等と併用
すれば操作性の向上がより期待できる。
発明の効果 以上、説明したように本発明によれば、(1)話者は単
語を発声する毎に単語同期信号入力部のキースイッチ等
を押すことにより認識装置に対して単語の区切り情報を
正確に伝えることができ安定で且つ高精度の認識が可能
となる。
(2)認識装置のセグメンテーション部の構成が簡単に
なるので認識装置の低コスト化に有効である。
t3)話者が単語を発声する毎に単語同期信号入力部の
キースイッチ等を押すことは即ち、話者自身が発声動作
をリズミカルに行うことになり単語の発声が安定し認識
率の向上が図れる。
(4)  単語同期信号が入力されなければ認識動作を
行わないようにしておけばマイクスイッチ等の必要が無
く装置の低コスト化が図れる。等の実用的効果が期待で
きる。
【図面の簡単な説明】
7ペーノ 第1図は本発明に於ける一実施例の音声認識装置のブロ
ック図、第2図は同実施例の単語同期信号の説明図であ
る。 1・・・・・・音声入力部、2・・・・・・特徴抽出部
、3・・・・・・単語同期信号入力部、4・・・・・・
セグメンテーション部、6・・・・・バタンマツチング
部、6・・・・・・標準バタン記憶部、7・・・・・・
出力部。

Claims (1)

    【特許請求の範囲】
  1. 発声した音声を音響−電気変換する音声入力部と、単語
    を発声する毎にキースイッチ等を押すことにより単語の
    発声を入力する単語同期信号入力部と、上記音声入力部
    の出力信号を上記単語同期信号入力部からの単語同期信
    号に同期させて音声認識を行う音声認識部とを具備した
    ことを特徴とする音声認識装置。
JP61145141A 1986-06-20 1986-06-20 音声認識装置 Pending JPS62300000A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61145141A JPS62300000A (ja) 1986-06-20 1986-06-20 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61145141A JPS62300000A (ja) 1986-06-20 1986-06-20 音声認識装置

Publications (1)

Publication Number Publication Date
JPS62300000A true JPS62300000A (ja) 1987-12-26

Family

ID=15378362

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61145141A Pending JPS62300000A (ja) 1986-06-20 1986-06-20 音声認識装置

Country Status (1)

Country Link
JP (1) JPS62300000A (ja)

Similar Documents

Publication Publication Date Title
JPS6147440B2 (ja)
JP2006251147A (ja) 音声認識方法
US20220238118A1 (en) Apparatus for processing an audio signal for the generation of a multimedia file with speech transcription
CN108172241B (zh) 一种基于智能终端的音乐推荐方法及音乐推荐系统
TW533404B (en) Hybrid keypad/speech recognition technique for oriental characters in adverse environments
JPS62300000A (ja) 音声認識装置
JPS597998A (ja) 連続音声認識装置
JP2002229592A (ja) 音声認識装置
JPS6265094A (ja) 音声認識装置
JPH0774960B2 (ja) テンプレ−ト連鎖モデルを使用するキ−ワ−ド認識方法およびシステム
JPH10133678A (ja) 音声再生装置
JPS6126678B2 (ja)
JPH10116093A (ja) 音声認識装置
JPS638798A (ja) 音声認識装置
JP2000125397A (ja) 話者識別型ディジタル補聴器
JPH08110790A (ja) 音声認識装置
JPS60166996A (ja) 音声標準パタン登録方法
JPS6235120Y2 (ja)
JPS6120094A (ja) 音声認識合成装置
JP2888556B2 (ja) 音声認識装置
JPS58176699A (ja) 音声標準パタ−ン登録方式
JPS58111097A (ja) 音声入力認識装置
JP2000029487A (ja) 発音記号を用いた音声データ変換・復元装置
CN85100180B (zh) 一种利用计算机对汉语语音进行识别的装置
JPH06130988A (ja) テキスト入力装置