WO2007066433A1

WO2007066433A1 - 音声認識装置

Info

Publication number: WO2007066433A1
Application number: PCT/JP2006/316257
Authority: WO
Inventors: Masanobu Osawa; Reiko Okada; Takashi Ebihara
Original assignee: Mitsubishi Electric Corporation
Priority date: 2005-12-07
Filing date: 2006-08-18
Publication date: 2007-06-14
Also published as: CN101326571B; US8060368B2; DE112006002979T5; JP4846734B2; US20090228276A1; CN101326571A; JPWO2007066433A1

Abstract

　音声認識装置１０は、音声認識辞書を参照して入力音声を音声認識して音声認識結果を出力しており、外部接続機器２０－１～２０－Ｎが接続され外部接続機器からその種別を取得するとともに外部接続機器に登録されたデータを取得する外部情報取得手段１４と、データから語彙を抽出語彙として抽出し抽出語彙を解析して当該抽出語彙にヨミを付与して解析データとする語彙抽出解析手段１５及び１６と、種別に対応する音声認識辞書に解析データを格納する辞書生成手段１７とを有し、外部接続機器の種別毎に音声認識辞書１３－１～１３－Ｎを備える。

Description

認識

術分野

０００1 この、複数の声認識書を備えて、音声認識を〒声認識置に関し特に、携帯電話機の器に対応した音声認識書を備える音声認識置に関するものである。０００2 般に、音声認識置におては、音声認識書に登録された単語( )を参照して音声認識を行ており、音声認識を向上さるためには音声認識書に多数の語を登録する必要がある。このため、音声認識置には、既存の声認識書に単語を追加録して音声認識書を更新する機能及び又は人用の声認識書を作成する機能を有するものがある。

０００3 えば、音声認識置におて、音声入力による電子メの成におて使用される音声認識書の成の、メ理が開始されたことを検出すると、アプケョンにおて取得された文書デタを読み込んで文書デタを解析し、既存の声認識書に存在しな未知を抽出して、抽出したを含む声認、書を作成するよにしたものがある( えば、特許 )。

０００4 さらに、音声認識書を作成・新する際、第の書記憶に日常用されるの記及び等が登録されたの書を記憶し、 2の書記憶に特殊なの記及び等が登録された 2の書を記憶して、テキストで両書を用て態素〒方、読み付与 2で入力態素に読みを付与する際に、 2の書の関して 2の書のみの他の候補のとを対応テに記録して、音声認識によて対応テの容に基て音声認識書を作成して、音声認識書を、認識語彙 2の書の記及び他の音補とのけに基て作成するよにしたものがある( えば、特許 2 )。０００5 1 2 4 233577 ( 3 ～ 9 、～ 9 ) 2 2 3 27 83 ( 6 ～ 2 、～ 7 ) ０００6 来の声認識以上のよに構成されてるので、音声認識書を作成・新する際の対象が文書デタの受信が可能なアプケョンに限られており、音声認識置に接続される外部器によて認識の際の単語の用頻度が大き異なることがあり、さらには、外部器によて認識に使用する単語・異なることもあることを考慮すると、単一のアプケョン( まり、単一の

のための声認識書を作成・新するよにしたのでは、外部器が異なると効率的に音声認識を〒ことができなと題があた。

０００7 また、従来の声認識置では、単一の声認識書に解析した単語を登録してるので、登録語数が増加すると、音声認識書の索に時間がり、効率的に音声認識を行えなばり、が多なて認識が低下することがある。０００8 この上記のよ課題を解決するためになされたもので、外部器に応じて効率的に音声認識を〒ことのできる音声認識置を得ることを目的とする。

明の

０００9 この明に係る音声、音声認識書を参照して人力声を声認識して音声認識果を出力しており、外部器が接続され器らその別を取得するとともに外部器に登録されたデタを取得する外部得手段と、デタら語彙を抽出語彙として出し出語彙を解析して出語彙にを付与して解析デタとする段と、別に対応する音声認識書に解析デタを納する書生成段とを有し、外部器の音声認識書を備えることを特徴とするものである。

００1０上のよに、この明によれば、音声認識果にて認識である否を判定して、認識であると判定すると、音声認識書を切り替えて音声認識理を継続するよに構成したので、特別の作を〒ことな、音声認識書を切り替えて音声認識を〒ことができ、その果、音声認識間を短縮して認識を向上さることができると果がある。

００11 の明の施のによる音声認識置の例を外部器とともにック図である。

2 に示す声認識置におて音声認識書の録を説明するためのチヤトである。

3 に示す声認識置におて音声認識書の新及び新成を説明するためのチヤトである。

4 の明の施の 2による音声認識置の例を外部器とともに示すック図である。

5 4に示す声認識置におて音声認識書をアクティとする動作を説明するためのチヤトである。

6 の明の施の 3による音声認識置の例を外部器とともに示すック図である。

7 6に示す声認識置におて外部段の作を説明するためのチヤトである。

8 6に示す声認識置におて語彙段の作を説明するための図であり、 (a) (b)はそれぞれ段によて提示される補の例を示す図である。

明を実施するための良の

下、この明をより細に説明するために、この明を実施するための良の態にて、の面に従て説明する。

施の・

はこの明の施のによる音声認識置の例を示すック図であり、の声認識０は、例えば、ナビゲョン置で用られる。声認識はイク等の音声入力、音声認識 2、数の声認、 ( に辞書と呼ぶ) 3 3 ( は2 上の整 )を備えるとともに、外部得手段 4、外部 5、外部 6 、外部書生成 ( 書生成 ) 7、語彙 8、 C ( ンクトディスクデタベス C に収録された楽曲に関する情報を C ソト又は周辺器に提供するためのデタベス) 9を備えてる。そして、外部得手段 4には複数の 2 2 が接続される。００13 なお、外部 5、外部 6、語彙

8、 C によて語彙段が成され、語彙 8 C によて解析書が成される。

００14 2 2 は、例えば、携帯電話機、小型、クプヤ( えば Pod( 品名) 、キボド、又はP (Pe so a a ss s a )であり、互に異なる装置であり、辞書 3 3 はそれぞれ

2 2 に対応してる。

００15 声認識を〒際には、音声入力皿ら入力された音声が音声認識 2 に与えられ、音声認識 2は、後述するよにして生成された辞書 3 3 のずれを参照して人力声を認識して、音声認識果を出する。まり、外部 2 ( はらまでのずれの数)に関して音声認識を行際には、辞書 3 を用て音声認識が行われる。

００16 なお、上述の声認識果に応じて、例えば、カナビゲョン置では、画面外部 2 の作を、遷移の外部器の果がタ等に表示される。

００17 次に動作にて説明する。

2を参照して、辞書 3 3 の成にて説明すると、、外部 2 が外部得手段 4に接続されると、外部 2 ら機器を特定するための f 号が外部得手段 4に与えられる。これによて、外部得手段 4は外部 2 の類を判別する。

００18 て、外部得手段 4は外部 2 内に記憶されたデタ( えば、携帯電話機であれば受信メ、 Po であれば、アティスト、アム )を取得した(ステップS )後、外部書生成 7に外部 2 の ( )を通知する(ステップS 2)。なお、外部得手段 4に接続される外部 2 が変更されると、同様にして、ステップS S 2が実行される。

００19 得手段 4で取得されたデタは、外部 5に渡され、ここで解析象となる部分( えば、受信メの文、曲、アティスト、又はアム )を抽出してデタとして外部 6に渡す(ステップS 3)

００2０ 6では、抽出されたデタがメ章のよ文章である際には、形態素、語彙 8を参照して、文章を単語に切り分け、解析の際に得られるを語に付与して解析デタを得る(ステップS 4) 方、抽出されたデタがアティストの語である場合には、外部

6はその記をとしてC を検索して、を取得し当付与して解析デタとする。

００21 これら解析デタは外部 6 ら外部書生成 7に渡されて、外部書生成 7は、外部得手段 4 ら送られた外部別に基て、外部 2 に対応する 3 に解析デタを納する(ステップS 5)。このよにして、外部 2 2 に対応して辞書 3 3 を生成することになる。

００22 ころで、前述の 3 3 は、メ中の辞域に保存され、所定の外によて削除されることはな。そして、音声認識を起動する都度、又は外部 2 を切り替える際に外部 2 に対応する 3 が用られる。

００23 て、 3を参照して、前述のステップ 5にて詳し説明すると、外部書生成 7では解析デタを辞書 3 に納する際、まず、外部 2 の別に基て該当する 3 が存在する否を判定し(

ステップS 6)、当する 3 が存在しなと、辞書に新たに辞書 3 を作成して( ステップS 7)、この新 3 に解析デタを納する。

００24 方、ステップS 6におて、外部 2 に対応する 3 が存在すると判定した場合には、外部書生成 7は、辞書 3 中の語調て、解析デタに一致するがある否を調る。まり、解析デタら辞書 3 に存在しなデタを抽出して(ステップS 8)、辞書 3 に存在しなデタのみを辞書 3 に納して、辞書 3 を更新する( 新手段ステップS g)。そして、外部書生成 7は、辞書 3 に既に存在する解析デタを破棄する。

００25 なお、辞書新の、辞書に存在する解析デタに含まれてな

削除するよにしてもよ。このよにすれば、辞書に納されるデタ量の増加を防止でき、その率的に音声認識を〒ことができる。

００26 上のよに、この施のによれば、外部器の別に応じて辞書を生成するよに構成したので、外部の書を用て音声認識を〒にすれば、認識率が向上するばりでな、認識が向上し、外部器を容易に音声入力によてすることができる果がある。

００27 この施のによれば、外部器を外部得手段に接続すると、自動的に対応する書が更新される結果、意識することな辞書の新が行える果がある。

００28 施の 2・

4はこの明の施の 2による音声認識置の例を示すック図であり、の声認識 3 におて、に示す声認識同一の素にては同一の号を付す。声認識 3 はさらに音声認識御手段3 を有しており、外部得手段 4は外部 2 の別を声認識御手段3 にも通知する。

００29 5も参照して、ま、外部 2 が変更されると、前述したよに、外部得手段 4は外部 2 らデタを取得した(ステップS )後、外部得手段 7に外部報機器2 の別を通知するとともに、音声認識御手段3 に外部報機器2 の別を通知する(ステップS ) ００3０で関連して説明したよに、外部得手段 4で取得されたデタら、外部 5によて解析象となる部分が出されてデタとして外部 6に渡される(ステップS )。そして、外部

6では、語彙 8又はC を参照して、解析デタ( を付与した語彙)を得る(ステップS )。書生成 7は、外部 4 ら送られた外部別に基て、外部 2 に対応する 3 に解析デタを納する(ステップS 4)

００31 方、音声認識御手段3 は、外部別に応じてこの

2 に対応する 3 をアクティにする(ステップS 5)。なお、複数の器が外部得手段 4に接続されてる際には、これら複数の器に各に対応する書がアクティとされる。

００32 上のよに、この施の 2によれば、外部器の別に応じて対応する書をアクティとするよに構成したので、音声認識を〒、外部得手段に外部器を接続すれば、辞書が切り替えられることになて、辞書のり替えを意識することな、音声入力を〒ことができる果がある。

００33 この施の 2によれば、外部得手段に接続された外部器に対応する書のみがアクティとなる結果、音声認識の際に参照すき辞書を削減することができ、音声認識を率的に行ことができるばりでな、認識を向上さることができる果がある。

００34 施の 3・

6はこの明の施の 3による音声認識置の例を示すック図であり、の声認識 4 におて、に示す声認識同一の素にては同一の号を付す。声認識 4 はさらに語彙補選択 4

42を有しており、後述するよに、外部

5で出されたデタ( )を外部 6で解析した結果られた解析デタ( が付与された語彙)にゆらぎが存在する場合( えば、複数の補が存在する場合)、外部 6はその

42に連絡する。

００35 42では複数の補を、例えば、タ ( ず)に表示して、選択を促す。語彙補選択 4 によて複数の補らの補を選択として選択すると、この外部

6に与えられ、外部 6は選択解析デタとして外部書生成 7に渡す。そして、外部書生成 7は、外部得手段 4 ら送られた外部別に基て、外部 2 に対応する 3 に解析デタを納する。

００36 7 8も参照して、ま、 Podのよ音楽デタ器が外部

2 として外部得手段 4に接続されてるとすると、前述したよに、外部得手段 4は外部 2 の別を外部書生成 7に渡すとともに、外部 2 らデタを取得して(ステップS 6)、このデタを外部 5に送る。

００37 5は、外部得手段 4で取得されたデタら解析象となる部分を抽出してにこでは、例えば、、アティスト、アムデタが出されるステップS 7)、抽出デタとして外部 6に送る。 6では、まず、抽出デタがメ章のよ文章である否を判定して(ステップS 8)、抽出デタが文章であると、外部 6は形態素、語彙 8を参照して、文章を単語( )に切り分け、解析の際に得られるを語に付与して解析デタを得る(ステップS g)

００38 このデタは外部 6 ら外部書生成 7に送られ、外部書生成 7は、外部得手段 4 ら送られた外部

2 の別に対応する 2 に解析デタを納する(ステップS 2 ) ００39 方、ステップS 8におて、抽出デタが文章でなと判定されると、外部

6ではその記をとしてC を検索して(ステップS 2 )、検索果である存在する否を判定する( まり、一致するがあるを判断するステッ S 22)。致するがあると、外部 6 はを付与して解析デタとする(ステップS 23)。その、外部書生成 7によてステップS 2 が行われる。

００4０ころで、、アティスト、又はアム名にゆらぎがあると、抽出デタ一致する C に存在ず、ステップS 22におて、外部

6は検索果が存在しな判断する。えば、 8(a に示すよに、外部 2 に登録されてるデタの記が x であり、C に録されてるの記が x 等であると、抽出デタ一致する C に存在しな。この合、外部

6では、抽出デタに類似する語彙補として選択して(ステップS 24 )、語彙 42によてタ ( )43に語彙補を提示する。００41 8(a)に示す例では、提示 43に語彙補として、 O x O X が提示され、ザが語彙補選択 4 によて語彙補らの補を選択として選択すると、ステップS 23におて外部 6 は選択を付与して解析デタとする。その、外部書生成 7 によてステップS 2 が行われる。

００42 6におてデタ登録との類を判定する際には、抽出デタの登録の記の文字の、なに変換した際の文文字の用て類 ( 数に対する字数の )が求められる。えば、 (また一致してな )～ ( 全に一致してる)までの合を有し、が予定された ( えば、8 ) 上であると、外部 6はその語彙補として語彙 42によて提示 43に提示する。示の例では、ステップS 22 S 24 が段に相当する。

００43 8 b 示す例では、外部 2 に登録されてるデタの記がウィッカムズトゥであり、C に登録されてるの記がウィッカムトゥ等であると、抽出デタ一致する C に存在しなものの、定によて、外部 6は、語彙 42によて提示 43に語彙補としてウィッカムトゥを提示する。

００44 上のよに、この施の 3によれば、外部器に登録されてるデタの記に一致する存在しな場合におても、する補を提示してザが語彙補らの補を選択すると、選択として辞書に登録するよに構成したので、辞書の度よすることができ、認識を低減することができる果がある。

上の利用，上のよに、この明に係る音声認識、外部器に応じて効率的に音声認識を行ことのできるので、例えば帯電話機で用られる音声認識置に用るのに適してる。

Claims

求の

声認識書を参照して人力声を声認識して音声認識果を出する音声認識置におて、

外部器が接続され器らその別を取得するとともに前記器に登録されたデタを取得する外部得手段と、前記デタら語彙を抽出語彙として出し出語彙を解析して出語彙にを付与して解析デタとする段と、

前記別に対応する前記声認識書に前記デタを納する書生成段とを有し、

前記器の前記声認識書を備えることを特徴とする音声認、

2 書生成解析デタを受けた器の別に対応する音声認識書が存在する否を判定する種別段と、

前記器の別に対応する音声認識書が存在しなと別に対応する音声認識書を新規に作成する段と、

前記器の別に対応する音声認識書が存在すると別に対応する音声認識書を更新する新手段とを有することを特徴とする

載の声認識。

3 得手段に接続された外部器の別を受け、別に対応する音声認識書のみをアクティとする音声認識御手段を有することを特徴とする載の声認識。

4 、抽出語彙を解析する際に用る解析書と、

前記出語彙に一致する前記書に存在しなと出語彙に類似する前記書に存在する否を判定する類段とを有し、

前記出語彙に類似する前記書に存在するとする語彙補として提示する段を備えることを特徴とする載の声認識。 5 段によて提示された語彙補らの補を選択として選択する補選択段を有し、

語彙前記を付与して解析デタとすることを特徴とする 4 載の声認識。