JPH0836396A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH0836396A
JPH0836396A JP16921694A JP16921694A JPH0836396A JP H0836396 A JPH0836396 A JP H0836396A JP 16921694 A JP16921694 A JP 16921694A JP 16921694 A JP16921694 A JP 16921694A JP H0836396 A JPH0836396 A JP H0836396A
Authority
JP
Japan
Prior art keywords
interjection
section
voice
input
input voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP16921694A
Other languages
English (en)
Inventor
Mariko Izawa
真理子 井澤
Akio Amano
明雄 天野
Nobuo Hataoka
信夫 畑岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP16921694A priority Critical patent/JPH0836396A/ja
Publication of JPH0836396A publication Critical patent/JPH0836396A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】入力音声中に間投詞が含まれても、単語音声と
誤認識されることのない音声認識装置を提供する。 【構成】アナログ入力音声1をディジタル音声に変換す
る音声入力手段2,入力音声の音声区間を検出する音声
区間検出手段3,入力音声の特徴パラメータを検出する
音声分析手段4,入力音声中の間投詞を検出する間投詞
検出手段5,入力音声の特徴パタンと標準パタンとを照
合する照合手段6,該照合結果の判定を行う判定手段
7,標準パタン格納手段8を備えた。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声認識装置に係り、
入力音声中に「あのー」,「えー」などの間投詞が含ま
れても良好に動作する音声認識装置に関する。
【0002】
【従来の技術】従来の音声認識装置は、例えば、斉藤収
三,中田和男著、「音声情報処理の基礎」オーム社(1
981)p.183〜p.184に記載のように、入力さ
れたアナログ音声をディジタル値に変換したのち、音響
的分析を行って音声特徴パタンを抽出し、これとあらか
じめ用意した標準音声の特徴パタンとを比較照合し、入
力された音声に最も類似している標準音声を入力音声の
認識結果として出力する。
【0003】
【発明が解決しようとする課題】上記の音声認識装置
は、入力音声中に認識対象の音声だけが含まれているこ
とを前提としている。
【0004】しかし、我々人間が言葉を話す場合、発話
内容を考えながら発声するときなどには、「えー」,
「あのー」などの間投詞を発声してしまうことが多い。
音声認識装置では、入力音声に認識対象の音声だけが含
まれていることを前提としているため、入力音声中の間
投詞もいずれかの単語として認識してしまうことがあっ
た。例えば、「えー、ひめじ」と発声したときに、「え
ー、ひめ(じ)」の部分に類似している「えひめ」とい
う単語に誤認識されたり、全く異なる単語に認識された
り、また、リジェクトされたりする。
【0005】本発明の目的は、「えー」,「あのー」な
どの間投詞が含まれた音声に対しても、誤認識すること
のない音声認識装置を提供することにある。
【0006】
【課題を解決するための手段】「えー」,「うーん
と」,「あのー」、などの間投詞は、/e/,/u/,
/o/、などの母音性をもった音声区間が長く持続する
という特徴をもつ。このため、入力音声中に/e/,/
u/,/o/、などの母音性の特徴が継続して検出され
れば、この区間は間投詞である可能性が高い。そこで、
/e/,/u/,/o/、などの母音性の継続が検出さ
れた音声区間については、間投詞である可能性があると
して、照合の範囲から外すようにすれば、間投詞に起因
する誤動作を回避できる。
【0007】上記の目的は、入力された音声中の音声区
間を検出する手段,母音性の持続を検出する手段,入力
音声の特徴パタンと標準パタンとを照合する手段,照合
結果の判定を行う手段,母音性の継続の検出結果に基づ
いて入力音声の照合範囲を制限する手段とを備えること
により達成される。
【0008】
【作用】本発明によれば、母音性の継続により、間投詞
の可能性が高いと判定された区間に対しては、照合を行
わないようにできるので、間投詞部分を他の単語に誤認
識することのない音声認識装置を提供できる。
【0009】
【実施例】図1は本発明の音声認識装置の一実施例を示
すブロック図である。入力音声1は音声入力部2により
取り込まれ、音声区間検出部3に送られる。音声区間検
出部3では、入力された音声のうち言葉が実際に発声さ
れている音声区間を検出する。間投詞「えー」なども音
声区間の中に含まれて検出される。さらに、音声分析部
4で分析され、入力音声の特徴パタンが抽出される。得
られた入力音声の特徴パタンは、間投詞検出部5に送ら
れる。間投詞検出部5では、音声分析部4から得られた
入力音声の特徴パタンに基づいて入力音声中の間投詞部
分が検出される。
【0010】一方、音声分析部4から得られた入力音声
の特徴パタンは照合部6へも送られ、照合部6では、標
準パタン格納部8から読み込まれた標準パタンとの照合
を行い、各標準パタンとの照合値を算出する。なお、照
合部6における照合は、間投詞検出部5から得られた間
投詞検出結果に基づいて、入力音声中の間投詞区間を除
いた区間について行うようにする。
【0011】照合部6で得られた各標準パタンとの照合
結果は、判定部7に送られる。判定部7では、照合部6
から得られた各標準パタンとの照合結果のうち、照合結
果の良い上位N(Nは例えば3)候補を認識結果として
出力する。
【0012】なお、説明では、照合部6における照合処
理を間投詞区間を除いて行うと説明したが、間投詞区間
を含めて照合する場合と、間投詞区間を除いて照合する
場合の双方を行い、双方の照合結果を判定部7に送るよ
うにすることも考えられる。
【0013】なお、音声区間検出方法,音声分析方法に
ついては、特開昭62−50800 号公報に記載されている方
法を用いれば良い。
【0014】次に、図2から図4を用いて、本発明の主
点である間投詞検出部5について説明する。
【0015】間投詞を検出する手段には、いくつかの方
法が考えられるが、まず、母音性の継続の検出に基づい
て行う方法を説明する。
【0016】図2は、間投詞検出部5の内部構造を示す
ブロック図である。音声分析部4により、入力音声の特
徴パタンが抽出され、間投詞検出部5に送られると、無
音区間検出部51では、入力音声中の無音部区間が検出
される。フレーム間相関計算部52では、入力音声の特
徴パタン自身のフレーム間相関の計算、および、入力音
声の特徴パタンと母音標準パタン格納部55から読み込
まれた日本語の5母音(/a/,/i/,/u/,/e
/,/o/)の特徴パタン間の類似度の計算を行い、得
られる相関(距離)行列が定常部区間セグメンテーショ
ン部53へ送られる。
【0017】定常部区間セグメンテーション部53で
は、送られた相関(距離)行列に基づき、入力音声の音
声区間中の母音性定常部区間を検出し、間投詞判断部5
4へ母音性定常部区間の個数、および、位置を送る。間
投詞判断部54では、検出された母音性定常部区間が間
投詞であるかどうかの判断を行う。
【0018】なお、無音声区間検出方法,フレーム間相
関計算方法,定常部区間セグメンテーション方法につい
ては、特開昭62−50800 号公報に記載されている方法を
用いれば良い。
【0019】次に、間投詞判断部54の処理を、フロー
チャートを用いて詳細に説明する。
【0020】図3に間投詞判断部54の一処理例のフロ
ーチャートを示す。このフローチャートは、言いよどん
だときに発声される「えー」などの間投詞を検出するた
めのフローである。言いよどんだときには、間投詞の特
徴である継続した母音性定常部区間に加えて、その前後
に長い無音区間を含む。従って、継続する母音性定常部
区間が検出され、さらに、この母音性定常部区間の前後
にしきい値以上の長さを持つ無音区間が検出されたなら
ば、この区間は間投詞であると判断することができる。
【0021】以下、図3のフローチャートにそって説明
する。
【0022】定常部セグメンテーション部53により求
められた入力音声中の母音性定常部区間をSn、その母
音性定常部区間長をLsn(n=1〜N、Nは検出され
た母音性定常部区間の個数)とする。
【0023】間投詞判断処理を入力音声中始めに現われ
る母音性定常部区間S1(n=1)についてまず行う
(処理P102)。Lsnがしきい値Ts以上であれば
(処理P103)、この母音性定常部区間Snは間投詞
である可能性があるので、Snの前の無音区間Pbnの
有無を調べる(処理P104)。Snの前に無音区間P
bnが存在し、その長さがしきい値Tpb以上であれば
(処理P105)、さらにSnの後の無音区間Panの
有無を調べる(処理P106)。Snの後に無音区間P
anが存在し、その長さがしきい値Tpa以上であれば
(処理P107)、この母音性定常部区間Snは間投詞で
あると判断できる(処理P108)。今述べた条件が一
つでも満たされないのであれば、この母音性定常部区間
Snは間投詞ではないと判断する(処理P111)。母
音性定常部区間Snが間投詞であるかどうかの判断がN
個すべてに対して終了していないのであれば(処理P10
9)、nを更新し(処理P110)、次の入力音声中の母
音性定常部区間の間投詞判断を行うために再び処理P1
03へ戻る。N個すべてに対し間投詞であるかどうかの
判断を終えたならば、間投詞判断処理を終了する。
【0024】以上、間投詞区間を断定的に検出する一例
をフローチャートを用いて説明したが、間投詞検出結果
は、必ずしも断定的な結果である必要はなく、例えば、
ある長さ以上の母音性定常部区間が検出されたならば、
その区間は全て間投詞の可能性があるとし、警告信号の
ような形として、検出結果を出力しても良い。
【0025】次に、間投詞検出部5の他の実施例とし
て、間投詞標準パタンを用いて間投詞の検出を行う方法
を説明する。
【0026】図4は間投詞標準パタンを用いて間投詞の
検出を行うような間投詞検出部の内部構造を示すブロッ
ク図である。音声分析部4により、入力音声の特徴パタ
ンが抽出されると、得られた特徴パタンは間投詞照合部
56へ送られる。間投詞照合部56では、間投詞標準パ
タン格納部57から読み込まれた間投詞標準パタンとの
照合を、入力音声パタン全体に対して行う。なお、ここ
で行う照合は、古井貞煕著、「ディジタル音声処理」東
海大学出版会(1985)p.176〜p.177に記載さ
れているようなワードスポッティングの手法を用いれば
よい。間投詞判断部58では、間投詞標準パタンとの距
離がある閾値以下になる区間を間投詞区間の候補と判断
し、この判断結果を照合部6へ送る。
【0027】
【発明の効果】本発明によれば、入力音声中に「え
ー」,「あのー」などの間投詞が含まれていても、これ
を検出し、間投詞の区間を照合の対象から外すので、他
の単語への誤認識のない音声認識装置を提供できる。
【図面の簡単な説明】
【図1】本発明の音声認識装置の構成を示すブロック
図。
【図2】間投詞検出部の内部構成を示すブロック図。
【図3】間投詞判断部の処理フローの一例を示すフロー
チャート。
【図4】間投詞標準パタンを用いて間投詞検出を行う間
投詞検出部の内部構成を示すブロック図。
【符号の説明】 1…入力音声、2…音声入力部、3…音声区間検出部、
4…音声分析部、5…間投詞検出部、6…照合部、7…
判定部、8…標準パタン格納部。

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】音声を入力する音声入力手段と、入力され
    た音声中の音声区間を検出する音声区間検出手段と、所
    定時間ごとに入力音声の特徴パタンを抽出する音声分析
    手段と、入力音声の特徴パタンと標準パタンとを照合す
    る手段と、照合結果の判定を行う手段とを含む音声認識
    装置において、前記入力された音声に間投詞が存在する
    かどうかを判断する間投詞検出手段を含むことを特徴と
    する音声認識装置。
  2. 【請求項2】請求項1において、前記入力音声の特徴パ
    タンと標準パタンとを照合する手段は、前記間投詞検出
    手段により、間投詞として検出された区間以外の入力音
    声区間に対してのみ照合を行う音声認識装置。
  3. 【請求項3】請求項1または2において、前記間投詞検
    出手段は、入力音声の定常性および/または母音性の検
    出結果に基づいて間投詞の検出を行う音声認識装置。
  4. 【請求項4】請求項1,2または3において、前記間投
    詞検出手段は、間投詞の標準パタンを用意し、入力音声
    と間投詞標準パタンと照合するようにし、照合結果に基
    づいて検出する音声認識装置。
JP16921694A 1994-07-21 1994-07-21 音声認識装置 Pending JPH0836396A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP16921694A JPH0836396A (ja) 1994-07-21 1994-07-21 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP16921694A JPH0836396A (ja) 1994-07-21 1994-07-21 音声認識装置

Publications (1)

Publication Number Publication Date
JPH0836396A true JPH0836396A (ja) 1996-02-06

Family

ID=15882373

Family Applications (1)

Application Number Title Priority Date Filing Date
JP16921694A Pending JPH0836396A (ja) 1994-07-21 1994-07-21 音声認識装置

Country Status (1)

Country Link
JP (1) JPH0836396A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007057844A (ja) * 2005-08-24 2007-03-08 Fujitsu Ltd 音声認識システムおよび音声処理システム
JP2016133774A (ja) * 2015-01-22 2016-07-25 富士通株式会社 音声処理装置、音声処理方法および音声処理プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007057844A (ja) * 2005-08-24 2007-03-08 Fujitsu Ltd 音声認識システムおよび音声処理システム
JP2016133774A (ja) * 2015-01-22 2016-07-25 富士通株式会社 音声処理装置、音声処理方法および音声処理プログラム

Similar Documents

Publication Publication Date Title
KR100834679B1 (ko) 음성 인식 오류 통보 장치 및 방법
CA2158849C (en) Speech recognition with pause detection
JP4237713B2 (ja) 音声処理装置
EP0237934A1 (en) Speech recognition system
US4769844A (en) Voice recognition system having a check scheme for registration of reference data
Dey et al. Exploiting sequence information for text-dependent speaker verification
KR101122591B1 (ko) 핵심어 인식에 의한 음성 인식 장치 및 방법
JPH0836396A (ja) 音声認識装置
KR20050049207A (ko) 대화형 연속 음성인식 시스템 및 이를 이용한 음성끝점검출방법
Rose et al. A hybrid barge-in procedure for more reliable turn-taking in human-machine dialog systems
KR100391123B1 (ko) 피치 단위 데이터 분석을 이용한 음성인식 방법 및 시스템
JP4219603B2 (ja) 音声認識装置
KR20080061901A (ko) 로봇의 입출력 장치에 의한 효율적인 음성인식 방법 및시스템
JP3615088B2 (ja) 音声認識方法及び装置
JPH05173592A (ja) 音声/非音声判別方法および判別装置
JP2001175276A (ja) 音声認識装置及び記録媒体
JP4391031B2 (ja) 音声認識装置
JP3207378B2 (ja) 音声認識方法
JPH0997095A (ja) 音声認識装置
Nofal et al. Arabic/English automatic spoken language identification
JP2882791B2 (ja) パターン比較方式
JPH0950292A (ja) 音声認識装置
JPS6336678B2 (ja)
JPH071438B2 (ja) 音声中の複数話者の発話区間自動検出同定装置
KR100396748B1 (ko) 유음구간추출처리장치및방법