JPH07334186A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH07334186A
JPH07334186A JP13162894A JP13162894A JPH07334186A JP H07334186 A JPH07334186 A JP H07334186A JP 13162894 A JP13162894 A JP 13162894A JP 13162894 A JP13162894 A JP 13162894A JP H07334186 A JPH07334186 A JP H07334186A
Authority
JP
Japan
Prior art keywords
word
voice
incidental
speech
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP13162894A
Other languages
English (en)
Inventor
Nobuyuki Kono
信幸 香野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP13162894A priority Critical patent/JPH07334186A/ja
Publication of JPH07334186A publication Critical patent/JPH07334186A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 音声入力に付帯語があっても精度よく認識で
きる音声認識装置を提供する。 【構成】 音声辞書ファイル3は、あらかじめ発声入力
した単語の音声信号の特徴データを記憶しており、認識
動作において、音声入力手段1から入力した音声信号の
特徴データを特徴抽出部2で抽出し、照合判定部4はそ
の特徴データを音声辞書ファイル3内の特徴データと比
較参照して一致度の高い部分を単語部分として見い出
し、判定結果出力部8によりその単語部分を使用者に確
認させ、単語部分と確認された残りの部分を付帯語候補
として付帯語候補格納部5に格納する。付帯語候補比較
部6は付帯語候補格納部5中で検索して所定数以上ある
場合、付帯語としてファイル更新部7により音声辞書フ
ァイルに登録し、単語と付帯語とを記憶することにな
り、照合判定部4は入力音声を音声辞書ファイル3中の
単語と付帯語とを参照して、単語部分を見つけるように
する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、単語音声を認識して認
識結果を出力する音声認識装置に関する。
【0002】
【従来の技術】近年、音声認識装置が活用されるように
なってきたが、その認識精度が課題である。
【0003】以下、従来の音声認識装置について説明す
る。従来の、単語音声を認識する音声認識装置では、音
声辞書ファイルの中から利用者の発声した音声の特徴デ
ータと一致度の高い特徴データを持つ単語を見つけ、認
識結果として出力していた。このとき、利用者は発声中
に単語に「えー」、「えーと」、「あのー」や「です」
と言った付帯語を付随させることがある。このような付
帯語による影響を排除する対策として、発声音声の中か
ら単語の部分だけを見つけるワードスポティングの手法
がとられている。
【0004】
【発明が解決しようとする課題】このような従来の音声
認識装置では、発声音声から単語の部分を見つける場
合、発声音声の一部が音声辞書ファイル中の単語と、ど
の程度一致しているかを照合していくだけであり、付帯
語が何であったかを考慮していなかった。そのため付帯
語として無視した部分が単語の一部であったりするなど
により、認識の正確さが不十分であった。
【0005】本発明は上記の課題を解決するもので、付
帯語があっても高い精度で認識できる音声認識装置を提
供することを目的とする。
【0006】
【課題を解決するための手段】本発明は上記の目的を達
成するために、単語音声の音声信号を入力するための音
声入力手段と、前記音声信号から特徴データを抽出する
特徴抽出部と、あらかじめ発声した単語音声の音声信号
から抽出した特徴データを記憶している音声辞書ファイ
ルと、前記特徴抽出部で抽出した音声入力の特徴データ
を前記音声辞書ファイル内の特徴データと照合して一致
度の大きい部分を見つけ、それを単語部分として使用者
に判定させる照合判定部と、前記照合判定部の処理で単
語部分と判定された残りの部分を付帯語候補として格納
する付帯語候補格納部と、前記付帯語候補を前記付帯語
候補格納部内に格納された付帯語候補と比較して同一付
帯語候補が所定数以上存在する場合、その付帯語候補を
付帯語と判断する付帯語候補比較部と、判定された付帯
語の特徴データを前記音声辞書ファイルに登録するファ
イル更新部と、認識結果を出力する判定結果出力部とを
備え、前記照合判定部は音声信号を音声辞書ファイルに
登録された単語および付帯語とにより単語部分を見つけ
るようにした音声認識装置である。
【0007】
【作用】本発明は上記の構成において、照合判定部にお
いて発声音声から単語部分を見つけたのち、利用者によ
りこの単語が認識結果として正しいと判断された場合、
この単語部分の前または後ろにある音声部分を付帯語候
補として音声認識装置内に保持し、付帯語候補比較部
は、利用者がこの音声認識装置を使用している間に同じ
付帯語候補が複数個現れた場合、その付帯語候補を付帯
語として判定し、ファイル更新部により通常の単語登録
と同様に音声辞書ファイルに登録する。照合判定部は、
ワードスポティングのときに付帯語も単語と同じように
見つけるようにする。
【0008】
【実施例】以下、本発明の音声認識装置の一実施例につ
いて図面を参照しながら説明する。
【0009】図1は本実施例の構成を示すブロック図で
ある。図において、1は話者が発声した単語音声を入力
するための音声入力手段、2は音声入力手段1により入
力された音声信号から、その特徴データを抽出する特徴
抽出部、3はあらかじめ発声した単語音声の音声信号か
ら抽出した特徴データを蓄積している音声辞書ファイ
ル、4は特徴抽出部2で抽出した特徴データと音声辞書
ファイル3内の特徴データとを照合する照合判定部、5
は照合判定部4で判断された付帯語候補を格納する付帯
語候補格納部、6は付帯語候補格納部5に格納された付
帯語候補を相互に比較する付帯語候補比較部、7は付帯
語候補比較部6で同一と判断された付帯語候補を付帯語
として音声辞書ファイル3に登録するファイル更新部、
8は認識結果を出力する判定結果出力部である。
【0010】図2は本実施例の回路構成を示すブロック
図である。図において、9は音声を入力するマイクロホ
ン(以下、マイクと称す)であって、音声入力手段1を
構成し、10は装置の認識動作のプログラムを記憶して
いるリードオンメモリ(以下、ROMと称す)、11は
装置全体の動作を制御する中央処理装置(以下、CPU
と称す)であって、特徴抽出部2、照合判定部4、付帯
語候補比較部6およびファイル更新部7の各動作を、R
OM10とRAM12およびファイル装置14とデータ
のやりとりを行いながらROM10に記憶されたプログ
ラムにより実行する。12はランダムアクセスメモリ
(以下、RAMと称す)、13は使用者と装置が対話
し、認識結果を出力するためのモニタ、14は音声辞書
ファイル3および付帯語候補格納部5を構成するファイ
ル装置である。
【0011】上記構成においてその動作を説明する。図
3は本実施例の動作を示すフローチャートである。ま
た、図4は音声辞書ファイル3の構成を示す要部模式図
であって、初期状態では、図4に示す地名の単語のみが
登録されており、付帯語は一切登録されていないものと
する。
【0012】以下、音声辞書ファイ3ルに登録された地
名「九州」に付帯語「えー」が前に付き、音声「えー九
州」が与えられた場合の動作について説明する。
【0013】ステップ(3−1)において、音声入力手
段1により発声音声「えー九州」が入力されると、ステ
ップ(3−2)において、特徴抽出部2により特徴抽出
を行って、発声音声の特徴データを抽出する。つぎに、
ステップ(3−3)において照合判定部4により、前記
抽出した特徴データのある部分が音声辞書ファイル3の
特徴データと一致しているか否かを、発声音声の特徴デ
ータから照合に用いる部分を微少に変化させながら照合
して見つけようとする。(この処理をワードスポティン
グと称している)。本実施例では、発声音声「えー九
州」のうち「九州」の部分が音声辞書ファイル3に登録
済みであるため、「九州」と高い一致率が得られる。し
かし、この段階では、「えー」の部分は本当に付帯語な
のか、または単語の一部であるのかは音声認識装置から
は不明であり、「えー九州」と図4に示した地名「北九
州」、「南九州」もある一致率で照合されてしまい、正
確な判定が下せない。
【0014】ステップ(3−4)で、判定結果出力部8
により、利用者に判定結果を通知し、判定結果が正しい
か否かを判断させる。ここで判定結果「九州」が正しか
った場合はステップ(3−5)に移行し、正しくなかっ
た場合には終了に移行する。ステップ(3−5)におい
ては、発声音声「えー九州」のうち「九州」が正しかっ
たので、「九州」以外の音声部分「えー」を付帯語候補
として付帯語候補格納部5に格納し、ステップ(3−
6)に移行して、付帯語候補比較部6において、付帯語
候補格納部5に格納された付帯語候補のなかで、同じも
のがあるか否かを比較する。本実施例では、付帯語候補
格納部5にはまだ前記「えー」の1候補しか格納されて
いないので、同じものがなく、終了に移行する。
【0015】上記処理を経過したのち、図4に示した地
名「関東」に対して、「えー関東」など、付帯語「え
ー」の付いた発声音声の入力があった場合、前述のステ
ップ(3−1)からステップ(3−4)の処理を同様に
行い、ステップ(3−5)に移行して「えー」が付帯語
候補格納部5に格納される。つぎに、ステップ(3−
6)において、付帯語候補比較部6は、付帯語候補格納
部5に格納された付帯語候補の中に、「えー」という同
じ付帯語候補があると判断するので、ステップ(3−
7)に移行し、ファイル更新部7が「えー」を付帯語と
して、その特徴データを音声辞書ファイル3に登録す
る。この段階で音声認識装置は付帯語「えー」を単語と
して検出できるようになる。
【0016】つぎに、上記の処理が完了したのち、最初
に入力された発声音声「えー九州」が音声認識装置に再
度入力された場合について説明する。ステップ(3−
1)からステップ(3−2)の動作は前述と同様であ
る。つぎに、ステップ(3−3)でにおいて照合判定部
4は、発声音声「えー九州」のうち、「九州」の部分が
音声辞書ファイル3に登録済みであるため、「九州」と
高い一致率を得るが、さらに付帯語「えー」も音声辞書
ファイル3に登録済みとなっているため、「えー九州」
のうち「えー」の部分も高い一致率を得る。そのため、
単語「九州」に付帯する「えー」の部分が、単語の一部
である可能性はないことが明白となり、「えー九州」と
「北九州」、「南九州」がある一致率で照合されても正
確に「えー九州」は「九州」であると判定が下せる。
【0017】以上のように、本実施例の音声認識装置に
よれば、付帯語も通常の単語と同様に音声辞書ファイル
に登録するようにしたことにより、入力音声を単語も付
帯語もともに照合して、単語部分を見つけるようにした
ことにより、付帯語があっても一致率の高い判定がで
き、認識精度を高めることができる。
【0018】
【発明の効果】以上の説明から明らかなように、本発明
は、単語音声の音声信号を入力するための音声入力手段
と、前記音声信号から特徴データを抽出する特徴抽出部
と、あらかじめ発声した単語音声の音声信号から抽出し
た特徴データを記憶している音声辞書ファイルと、前記
特徴抽出部で抽出した音声入力の特徴データを前記音声
辞書ファイル内の特徴データと照合して一致度の大きい
部分を見つけ、それを単語部分として使用者に判定させ
る照合判定部と、前記照合判定部の処理で単語部分と判
定された残りの部分を付帯語候補として格納する付帯語
候補格納部と、前記付帯語候補を前記付帯語候補格納部
内に格納された付帯語候補と比較して同一付帯語候補が
所定数以上存在する場合、その付帯語候補を付帯語と判
断する付帯語候補比較部と、判定された付帯語の特徴デ
ータを前記音声辞書ファイルに登録するファイル更新部
と、認識結果を出力する判定結果出力部とを備え、前記
照合判定部は音声信号を音声辞書ファイルに登録された
単語および付帯語とにより単語部分を見つけるようにし
たことにより、通常のワードスポティングにより、単語
と同様に、利用者がよく発声する付帯語も検出でき、単
語部分の決定の正確さが増し、高い認識精度を得ること
ができる。
【図面の簡単な説明】
【図1】本発明の一実施例の構成を示すブロック図
【図2】同実施例の回路構成を示すブロック図
【図3】同実施例の動作を示すフローチャート
【図4】同実施例における音声辞書ファイルが地名を記
憶している状態を示す模式図
【符号の説明】
1 音声入力手段 2 特徴抽出部 3 音声辞書ファイル 4 照合判定部 5 付帯語候補格納部 6 付帯語候補比較部 7 ファイル更新部 8 判定結果出力部

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 単語音声の音声信号を入力するための音
    声入力手段と、前記音声信号から特徴データを抽出する
    特徴抽出部と、あらかじめ発声した単語音声の音声信号
    から抽出した特徴データを記憶している音声辞書ファイ
    ルと、前記特徴抽出部で抽出した音声入力の特徴データ
    を前記音声辞書ファイル内の特徴データと照合して一致
    度の大きい部分を見つけ、それを単語部分として使用者
    に判定させる照合判定部と、前記照合判定部の処理で単
    語部分と判定された残りの部分を付帯語候補として格納
    する付帯語候補格納部と、前記付帯語候補を前記付帯語
    候補格納部内に格納された付帯語候補と比較して同一付
    帯語候補が所定数以上存在する場合、その付帯語候補を
    付帯語と判断する付帯語候補比較部と、判定された付帯
    語の特徴データを前記音声辞書ファイルに登録するファ
    イル更新部と、認識結果を出力する判定結果出力部とを
    備え、前記照合判定部は音声信号を音声辞書ファイルに
    登録された単語および付帯語とにより単語部分を見つけ
    るようにした音声認識装置。
JP13162894A 1994-06-14 1994-06-14 音声認識装置 Pending JPH07334186A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP13162894A JPH07334186A (ja) 1994-06-14 1994-06-14 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP13162894A JPH07334186A (ja) 1994-06-14 1994-06-14 音声認識装置

Publications (1)

Publication Number Publication Date
JPH07334186A true JPH07334186A (ja) 1995-12-22

Family

ID=15062501

Family Applications (1)

Application Number Title Priority Date Filing Date
JP13162894A Pending JPH07334186A (ja) 1994-06-14 1994-06-14 音声認識装置

Country Status (1)

Country Link
JP (1) JPH07334186A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001005488A (ja) * 1999-06-18 2001-01-12 Mitsubishi Electric Corp 音声対話システム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001005488A (ja) * 1999-06-18 2001-01-12 Mitsubishi Electric Corp 音声対話システム

Similar Documents

Publication Publication Date Title
CN105723449B (zh) 言语内容分析系统和言语内容分析方法
US7974843B2 (en) Operating method for an automated language recognizer intended for the speaker-independent language recognition of words in different languages and automated language recognizer
USRE38101E1 (en) Methods and apparatus for performing speaker independent recognition of commands in parallel with speaker dependent recognition of names, words or phrases
US6122361A (en) Automated directory assistance system utilizing priori advisor for predicting the most likely requested locality
US20020169600A1 (en) Multi-stage large vocabulary speech recognition system and method
KR101526918B1 (ko) 다언어 이국 음성 인식
US5937383A (en) Apparatus and methods for speech recognition including individual or speaker class dependent decoding history caches for fast word acceptance or rejection
JP2002533789A (ja) 自動音声認識システムにおけるnベストリストに用いる知識ベース戦略
US8108215B2 (en) Speech recognition apparatus and method
JPH01167898A (ja) 音声認識装置
JPS62217295A (ja) 音声認識方式
JP2808906B2 (ja) 音声認識装置
JPH07334186A (ja) 音声認識装置
US7251599B2 (en) Automatic construction of unique signatures and confusable sets for database access
JP4282354B2 (ja) 音声認識装置
KR20100051214A (ko) 화자 독립 음성 인식 처리 방법
JP6991409B2 (ja) 情報処理装置、プログラム及び情報処理方法
US8688452B2 (en) Automatic generation of distractors for special-purpose speech recognition grammars
JPS6239749B2 (ja)
KR0173914B1 (ko) 음성 다이얼링 시스템에서의 명칭 검색 방법
JP3916792B2 (ja) 音声認識装置
JP2995941B2 (ja) 不特定話者用音声認識装置
KR20040100592A (ko) 이동 기기에서의 실시간 화자독립가변어 음성인식 방법
JPH10171488A (ja) 音声認識方法及び装置及び記憶媒体
JPH1097284A (ja) 音声認識方法,音声認識装置,及び記憶媒体