JPH06175677A - 音声認識方法 - Google Patents

音声認識方法

Info

Publication number
JPH06175677A
JPH06175677A JP4326671A JP32667192A JPH06175677A JP H06175677 A JPH06175677 A JP H06175677A JP 4326671 A JP4326671 A JP 4326671A JP 32667192 A JP32667192 A JP 32667192A JP H06175677 A JPH06175677 A JP H06175677A
Authority
JP
Japan
Prior art keywords
boundary
section
voice
segment
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4326671A
Other languages
English (en)
Inventor
Masatoshi Tachibana
正敏 立花
Tadashi Kawanobe
正 川野辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP4326671A priority Critical patent/JPH06175677A/ja
Publication of JPH06175677A publication Critical patent/JPH06175677A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 連続音声の中からキーワードを連続して確度
高く抽出することができる音声認識方法を提供する。 【構成】 例えば質問に対して応答する会話における応
答音声からキーワードを認識する音声認識方法におい
て、特徴抽出機能1により音声から韻律情報を抽出し、
境界点検出2−1により韻律情報が局所的に強調されて
いる区間と当該区間以外の区間との間の境界点を検出
し、境界区間設定2−2により境界点の内の任意の1個
に跨り、他の境界点を含まない境界区間を生成し、候補
作成2−3およびセグメント抽出2−4により音声から
境界区間の全てを除外した区間をキーワードが存在し得
る候補セグメントとして抽出する音声認識方法。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、音声認識方法に関
し、特に連続した音声の韻律情報から抽出した単語の存
在区間を使用した音声認識方法に関する。
【0002】
【従来の技術】連続した音声について単語認識をする音
声認識方法の認識処理アルゴリズムは音声から音声の音
韻的情報を連続的に抽出しながら、音声の各時点を候補
単語の開始時点と仮定し、この候補単語を前もって作成
しておいた登録単語の標準パターン或は規則その他の基
準データと比較し、基準データとの間の類似度に基づい
て入力単語を登録単語として識別する一連の動作を基本
動作とし、基本動作を各時点において連続的に繰り返し
てキーワードを認識している。
【0003】
【発明が解決しようとする課題】上述された音声認識方
法の認識処理アルゴリズムは、連続した音声のすべての
時点を均一に開始時点として認識し、キーワードの存在
区間以外の区間の不要な時点をも開始点として処理する
ことに起因してデータ処理量が増加し、結局データ処理
速度は遅延するに到り、更に、類似語の出現の可能性を
増加することとなるので認識率を悪化させる処理アルゴ
リズムである。
【0004】この様な従来の音声認識方法は、主として
利用する情報は音韻情報であって、音声合成に利用され
ているピッチ周波数或は音声パワーの如き韻律情報は利
用してはおらず、音声に内在する情報を充分に活用しき
れていないうらみがある。ところで、最近、音声合成音
の自然性を得るために特定語に対して局所的に強調され
た韻律情報が付加され、その生成規則を解析することの
研究開発が進められている(「日本語文音声におけるプ
ロミネンスの韻律的特徴の解析」および「日本語文音声
におけるプロミネンス生成規則の作成と評価」 日本音
響学会誌第47巻第6号参照)。一方において、質問に
対して応答する会話においては、応答する話者は質問の
中のキーワードを意識して発話する傾向のあることがわ
かっている。従って、会話の中のキーワードの存在を韻
律情報により識別することができるであろうことが類推
される。
【0005】以上のことから、この発明は、音声合成お
よび音声認識に利用されている韻律情報からキーワード
の存在区間を抽出し、これをマスクとして連続音声の中
からキーワードを連続して確度高く抽出する音声認識方
法を提供するものである。
【0006】
【課題を解決するための手段】音声からキーワードを認
識する音声認識方法において、特徴抽出機能1およびセ
グメント機能2により音声から韻律情報を抽出し、境界
点検出2−1により韻律情報が局所的に強調されている
区間と当該区間以外の区間との間の境界点を検出し、境
界区間設定2−2により境界点の内の任意の1個に跨
り、他の境界点を含まない境界区間を生成し、候補作成
2−3およびセグメント抽出2−4により音声から境界
区間の全てを除外した区間をキーワードが存在し得る候
補セグメントとして抽出する音声認識方法を構成した。
【0007】
【実施例】この発明の実施例を図1および図2を参照し
て説明する。図1において、1は特徴抽出機能であり、
入力される音声からピッチ周波数或は音声パワーその他
の韻律情報を分析してその韻律情報をセグメント機能2
に入力する。ここで、セグメント機能2は境界点検出2
−1、境界区間設定2−2、候補作成2−3およびセグ
メント抽出2−4により成る。韻律情報の波形は図2に
時間推移として示されている。
【0008】セグメント機能2はその境界点検出2−1
において、入力されるピッチ周波数或は音声パワーその
他の韻律情報と境界点を決定する基準・規則(例えば、
変分或はレベルのいき値)とを比較して局所的に強調さ
れる区間とそうではない区間との間の境界点1、2、
3、4を検出する。境界区間設定2−2においては、境
界点検出2−1により検出された境界点と境界区間を決
定する基準とを比較して境界点1、2、3、4に跨る境
界区間1、2、3、4を設定する。候補作成2−3にお
いては、境界区間設定2−2により設定された境界区間
1、2、3、4を韻律情報の全体区間から除外した残余
の区間を、質問に対するキーワードが存在する可能性の
ある区間である候補セグメント1、2、3、4として設
定する。セグメント抽出2−4においては、候補セグメ
ント区間を決定する基準・規則(例えば、レベルの持続
性)と比較して候補セグメント1、2、3、4をキーワ
ードが存在するかどうかを判断し、抽出する。
【0009】3はキーワードスポッティング機能であ
り、音声が連続的に入力され、登録されている単語を連
続的に認識し、キーワードとしての候補単語名を抽出
し、この候補単語名と単語の音声上の存在区間とを認識
結果として出力する。4はキーワード確定機能であり、
セグメント機能2からセグメント区間が入力されると共
にキーワードスポッティング機能3からその認識結果で
ある候補単語名と単語の音声上の存在区間が入力され、
セグメント機能2から入力されたセグメント区間とほぼ
一致する認識結果の存在区間の単語をキーワードとして
断定するところである。
【0010】この発明の音声認識方法は、上述された通
りの構成を採用することにより、韻律情報から得られる
結果である存在区間が音韻情報から得られる認識結果で
ある存在区間と候補単語を絞り込むためのマスクとして
の役目を果たすこととなり、キーワードを検出する。
【0011】
【発明の効果】以上の通りであって、この発明の音声認
識方法は、韻律情報から得られる結果である存在区間が
音韻情報から得られる認識結果である存在区間と候補単
語を絞り込むためのマスクとしての役目を果すこととな
り、この存在区間外における候補は除外されるので、除
外された分だけ候補選択が高効率化されると共に認識効
率も向上する。
【0012】存在区間外を照合しない認識アルゴリズム
を採用すれば、認識すべき区間が削減されるので演算処
理量がそれだけ減少し、認識速度の向上につながる。存
在区間抽出の精度を高くすることにより、キーワードス
ポッティングアルゴリズムと比較して簡素である単語認
識アルゴリズムを使用して連続音声からキーワードを認
識することができる。
【0013】この発明は、質問に対して応答する電話番
号案内サービスの如く、質問の内容に含まれるキーワー
ドが応答に存在するサービスにおいて格別の効果を奏す
るものである。
【図面の簡単な説明】
【図1】この発明の実施例を説明する図。
【図2】韻律情報の波形を示す図。
【符号の説明】
1 特徴抽出機能 2 セグメント機能 2−1 境界点検出 2−2 境界区間設定 2−3 候補作成 2−4 セグメント抽出 3 キーワードスポッティング機能 4 キーワード確定機能

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 音声からキーワードを認識する音声認識
    方法において、 音声から韻律情報を抽出し、 韻律情報が局所的に強調されている区間と当該区間以外
    の区間との間の境界点を検出し、 境界点の内の任意の1個に跨り、他の境界点を含まない
    境界区間を生成し、 音声から境界区間の全てを除外した区間をキーワードが
    存在し得る候補セグメントとして判断し、 候補セグメントを抽出する、 ことを特徴とする音声認識方法。
JP4326671A 1992-12-07 1992-12-07 音声認識方法 Pending JPH06175677A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4326671A JPH06175677A (ja) 1992-12-07 1992-12-07 音声認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4326671A JPH06175677A (ja) 1992-12-07 1992-12-07 音声認識方法

Publications (1)

Publication Number Publication Date
JPH06175677A true JPH06175677A (ja) 1994-06-24

Family

ID=18190368

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4326671A Pending JPH06175677A (ja) 1992-12-07 1992-12-07 音声認識方法

Country Status (1)

Country Link
JP (1) JPH06175677A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100369732B1 (ko) * 1999-12-21 2003-01-30 주식회사 글로벌데이타시스템. 전문가 시스템을 이용한 음성인식 기반의 지능형 대화장치 및 그 방법
JP2010079235A (ja) * 2008-09-28 2010-04-08 Avaya Inc 個人(オーディ)情報を含まないメディア・ストリームを保存する方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100369732B1 (ko) * 1999-12-21 2003-01-30 주식회사 글로벌데이타시스템. 전문가 시스템을 이용한 음성인식 기반의 지능형 대화장치 및 그 방법
JP2010079235A (ja) * 2008-09-28 2010-04-08 Avaya Inc 個人(オーディ)情報を含まないメディア・ストリームを保存する方法

Similar Documents

Publication Publication Date Title
WO2020211354A1 (zh) 基于说话内容的说话者身份识别方法、装置及存储介质
JP3162994B2 (ja) 音声のワードを認識する方法及び音声のワードを識別するシステム
EP1298645A1 (en) Method for detecting emotions in speech, involving linguistic correlation information
JP5201053B2 (ja) 合成音声判別装置、方法及びプログラム
CN112231440A (zh) 一种基于人工智能的语音搜索方法
Zhang et al. Anchoring hypothesis and its application to tone recognition of Chinese continuous speech
JPS6138479B2 (ja)
JPH06175677A (ja) 音声認識方法
CN1337670A (zh) 特定人汉语短语语音识别快速方法
JPS63165900A (ja) 会話音声認識方式
JPS59216242A (ja) 音声認識応答装置
JP2757356B2 (ja) 単語音声認識方法および装置
Deekshitha et al. Prosodically guided phonetic engine
JP3061292B2 (ja) アクセント句境界検出装置
JP2664136B2 (ja) 音声認識装置
JPH1097269A (ja) 音声検出装置及び方法
JPH01158499A (ja) 定常雑音除去方式
Post et al. Transcribing intonational variation at different levels of analysis
JP2002341891A (ja) 音声認識装置および音声認識方法
JPS63173100A (ja) キ−ワ−ド抽出装置
Patil et al. Comparison of Speech Emotion Recognition Performance with Different System Features
JP2655637B2 (ja) 音声パターン照合方式
JPH05173589A (ja) 音声認識応答装置
CN117975970A (zh) 录音质量检测方法、装置、设备及计算机可读取存储介质
Zhang et al. A Long-Term Feature Selection Based on Heuristic Strategy for Speaker Diarization.