JP2001249688A - 電話自動受付装置 - Google Patents

電話自動受付装置

Info

Publication number
JP2001249688A
JP2001249688A JP2000060233A JP2000060233A JP2001249688A JP 2001249688 A JP2001249688 A JP 2001249688A JP 2000060233 A JP2000060233 A JP 2000060233A JP 2000060233 A JP2000060233 A JP 2000060233A JP 2001249688 A JP2001249688 A JP 2001249688A
Authority
JP
Japan
Prior art keywords
word
correct
caller
competitive
answer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000060233A
Other languages
English (en)
Inventor
Shingo Kuroiwa
眞吾 黒岩
Toru Shimizu
徹 清水
Norio Higuchi
宜男 樋口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2000060233A priority Critical patent/JP2001249688A/ja
Publication of JP2001249688A publication Critical patent/JP2001249688A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

(57)【要約】 【課題】 電話による懸賞やクイズの解答入力を音声入
力とする。 【解決手段】 クイズや懸賞等を電話で受け付ける際
に、発呼者1に対してアナウンス生成部6から質問を発
し、この質問に対し発呼者1が正解語を発声したか否か
を音声認識部7で判断し、発呼者1が正解語を発声した
と判断した場合に電話を受け付けること、あるいは、以
降の各種サービスメニューへ進むことを許可する。この
場合、正解としたくない語を登録部8に登録しておき、
この語に対しては誤受理率を低くする。また、競合語生
成部9により正解語の読みから競合語を自動的に生成
し、正解誤排除率および不正解誤受理率を抑える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は発呼者の音声を対象
とする電話自動受付装置に関し、例えば、クイズや懸賞
等の自動受付、いたずら呼の自動排除、要求されるサー
ビスの自動判別に適用して有用なものである。
【0002】
【従来の技術】クイズや懸賞等を電話で自動的に受け付
ける場合、従来は、解答入力はプッシュボタン入力に限
られており、音声で入力することはできなかった。
【0003】
【発明が解決しようとする課題】商品キャンペーンにお
いてユーザに商品名を知ってもらうには、クイズや懸賞
等でユーザに商品名を発声させることが効果的である
が、プッシュボタン入力では、その効果が薄い。また、
競合他社の商品名を発声した場合には、積極的に不正解
としたいという要望がある。また、一般に、発声が正解
であるか否かを高い制度で判定する必要がある。
【0004】本発明は、上述した要求に応えた電話自動
受付装置を提供することを目的とする。
【0005】
【課題を解決するための手段】請求項1に係る発明は上
記目的を達成する電話自動受付装置であり、発呼者に対
して質問を発する質問送出手段と、この質問に対し前記
発呼者が正解語を発声したか否かを判断する音声認識手
段を具備し、前記発呼者が正解語を発声したと前記音声
認識手段が判断した場合に電話を受け付けることを特徴
とし、請求項2に係る発明は、請求項1の発明におい
て、前記発呼者が正解語を発声したと前記音声認識手段
が判断した場合は、以降の各種サービスメニューへ進む
こと許可することを特徴とする。
【0006】請求項3に係る発明は、請求項1の発明に
おいて、正解としたくない語を登録する登録手段を具備
し、前記音声認識手段は前記登録した語に対しては誤受
理率を低くすることを特徴とする。
【0007】請求項4に係る発明は、請求項1の発明に
おいて、前記音声認識手段は競合語を用いて正解誤排除
率および不正解誤受理率を抑えることを特徴とし、請求
項5に係る発明は、請求項4の発明において、前記競合
語を前記正解語の読みから自動的に生成する競合語生成
手段を具備することを特徴とし、請求項6に係る発明
は、請求項5の発明において、前記競合語生成手段は前
記競合語として、辞書から、前記正解語との音響的な距
離が所定範囲内の語のうち正解語に近い方から所定数N
個選択することを特徴とし、請求項7に係る発明は、請
求項6の発明において、前記競合語生成手段はn+1個
目(ただし、n+1≦N)の語を選択する際に、既に選
択したn個全ての語に対し所定距離以上の語のみを選択
することを特徴とし、請求項8に係る発明は、請求項5
の発明において、前記競合語生成手段は前記競合語とし
て、文字数が前記正解語の1/K1倍からK2倍の範囲の音
節連鎖を用い、これから、前記正解語との音響的な距離
が所定範囲内の音節連鎖のうち正解語に近い方から所定
数N個選択することを特徴とし、請求項9に係る発明
は、請求項8の発明において、前記競合語生成手段はn
+1個目(ただし、n+1≦N)の音節連鎖を選択する
際に、既に選択したn個全ての音節連鎖に対し所定距離
以上の音節連鎖のみを選択することを特徴とする。
【0008】
【発明の実施の形態】図1は本発明の第1実施形態例に
係る電話自走受付装置4を示し、この例の装置4はユー
ザ(発呼者)1の電話と公衆回線網2および構内交換機
(PBX)3を介して接続される。図2は本発明の第2
実施形態例に係る電話自動受付装置4を示し、この例の
装置4はユーザ(発呼者)1の電話と公衆回線網2を介
して接続される。つまり、図1の構内交換機(PBX)
3がないものである。
【0009】電話自動受付装置4は電話回線インタフェ
ース5と、アナウンス生成部6と、音声認識部7と、登
録部8と、競合語生成部9と、対話管理部10を有して
いる。電話回線インタフェース5は公衆回線網2または
構内交換機(PBX)3とアナウンス生成部6および音
声認識部7を接続するものである。
【0010】アナウンス生成部6は電話がかかってくる
と、対話管理部10の管理の下で発呼者1に対して質問
を発する。音声認識部7は発呼者1がこの質問に対して
正解語を発声したか否かを音声認識により判断する。音
声認識部7には正解語(キーワード)11が予め入力さ
れる。対話管理部10は発呼者1が正解語を発声したと
音声認識部7が判断した場合、その旨のアナウンスをア
ナウンス生成部6に行わせ電話を受け付けること、ある
いは、以降の各種サービスメニューへ進むことを許可す
る。発呼者1が正解語を発声したとは音声認識部7が判
断しない場合は、電話を受け付けない旨のアナウンスを
アナウンス生成部6に行わせて電話を切る。
【0011】例えば、「いろは商会ラッキーキャンペー
ンのお電話有り難うございます。それでは問題です。
今、街で一番キュートな携帯電話の名称は何でしょうか
?」という質問を発呼者1に発し、発呼者1が「イロハ
フォン」と発声した場合、「ピンポーン。正解です。そ
れではイロハフォン獲得ビンゴゲームを開始します。お
好きな4桁の数字を言って下さい……(以下、省略)」
というように、電話の自動受付を行い、また、以降のサ
ービスメニューへ進むことを許可する。この場合、「イ
ロハフォン」が正解語である。不正解の場合は、例え
ば、「残念でした。不正解です。またチャレンジして下
さい。」等とアナウンスして、電話の受付および以降の
サービスメニューへ進むことを拒否する。
【0012】これに加えて本例では、競合他社の商品名
等、正解としたくない語(優先棄却語)12を登録部8
に1個または複数個予め任意に登録できるようにしてあ
り、発呼者1が正解語を発声したか否かの判断におい
て、音声認識部7は登録された優先棄却語12に対して
は別途閾値を用いて誤受理率を低くするようにしてい
る。即ち、優先棄却語12を発声した場合は積極的に不
正解とする。
【0013】キーワード11としては、図3に示すよう
に、キーワードの読み11aからキーワードモデル11
bが作成される。また、後述するように、キーワードの
読み11aからキーワード依存競合モデル13aが作成
される。図4にキーワードモデル11bの例を示し、キ
ーワードの読み12aに従い音響モデル(音素HMM)
を連結して作成されている。
【0014】優先棄却語12の登録としては、図5に示
すように、優先棄却語の読み12aから優先棄却単語モ
デル12bが作成される。例えば、優先棄却単語モデル
12bは優先棄却語の読み12aに従い音響モデル(音
素HMM)を連結して作成することができる。
【0015】また、音声認識部7は、キーワード依存競
合語13および一般競合語14を用いて、正解誤排除率
および不正解誤受理率を抑えるようにしている。これに
より音声認識の照合性能が向上する。
【0016】キーワード依存競合語13は正解誤排除率
および不正解誤受理率を抑えるために用いられ、キーワ
ード11の読みから競合語生成部9が1つまたは複数自
動的に生成する。
【0017】キーワード依存競合語13の生成手法の一
例として、競合語生成部9は10万語程度の辞書から、
キーワード11との音響的な距離(例えば、DPマッチ
ングによる距離)が所定範囲(X1〜X2)内の語のうちキ
ーワード11に近い方から所定数N個選択する。但し、
n+1個目(n+1≦N)の語を選択する際に、既に選
択したn個全ての語に対し所定距離X3以上の語のみを選
択するようにして、キーワード依存競合語13の集合が
キーワード11の周囲になるべく均等に分散するように
する。
【0018】キーワード依存競合語13の生成手法の他
の例として、競合語生成部9は文字数がキーワード11
の1/K1倍からK2倍の範囲の音節連鎖を用い、これか
ら、キーワード11との音響的な距離が所定範囲(X1
X2)内の音節連鎖のうちキーワード11に近い方から所
定数N個選択する。この場合も、キーワード依存競合語
+3の集合がキーワード11の周囲になるべく均等に分
散するように、n+1個目(n+1≦N)の音節連鎖を
選択する際に、既に選択したn個全ての音節連鎖に対し
所定距離X3以上の音節連鎖のみを選択すると良い。
【0019】図6に、音声空間におけるキーワード(正
解語)11と、優先棄却語(正解としたくない語)12
とキーワード依存競合語13の関係を模式的に示す。
【0020】このようなキーワード依存競合語13の集
合を用いることにより、キーワード11に近い競合語で
あるから、正解誤排除率および不正解誤受理率を効果的
に抑えることができ、音声認識の照合性能が極めて向上
する。
【0021】一般競合語14も正解誤排除率および不正
解誤受理率を抑えるために用いられるが、これはキーワ
ード11の読みとは関係なく作成される。例えば、日本
語音節を連接したモデルを用いたり、タスクの語彙を連
接したモデルを用いたり、あるいは、タスクデータから
頻繁に出現する音節系列を抽出して作成したモデルを用
いて、一般競合語14を作成することができることが知
られている。日本語音節を連接したモデルを用いた場合
は、図7に示すように、一般競合語14の集合は音声空
間を隈なく網羅する。タスクの語彙を連接したモデルを
用いた場合は、図8に示すように、一般競合語14の集
合は音声空間内に適度に分散する。
【0022】音声認識部7がキーワード11の他に、優
先棄却語12、キーワード依存競合語13および一般競
合語14を用いて、発呼者1が正解を発声したか否か判
断する場合の手法例を図9に示す。図9では、入力音声
15に対するキーワード11のモデルの尤度Lk(一般に
対数尤度、以下同じ)の計算16、一般競合語14のモ
デルの尤度Lgの計算17、キーワード依存競合語13の
モデルの尤度Laの計算18および優先棄却語12 のモデ
ルの尤度Lrの計算19を行い、閾値との比較20を行
う。この例の比較20では、適宜な閾値Threshold1、Th
reshold2、Threshold3を用意しておき、尤度差Lk−Lgと
閾値Threshold1を大小比較し、尤度差Lk−Laと閾値Thre
shold2を大小比較し、尤度差Lk−Lrと閾値Threshold3を
大小比較し、Lk−Lg>Threshold1かつLk−La>Threshol
d2かつLk−Lr>Threshold3が成立する場合に、入力音声
15が正解であると判断することにしている。従って、
いずれか1つが不成立の場合は、不正解と判断される。
【0023】なお、LkとLrの計算16、19を行い、尤
度差Lk−Lrの比較を先に行ってLk−Lr≦Threshold3であ
ればこの段階で不正解であると判断しても良い。次に、
Laの計算18を行い、尤度差Lk−Laの比較でLk−La≦Th
reshold3であればこの段階で不正解であると判断しても
良い。これにより、計算量が軽減する。
【0024】もちろん、サービスによては、図9の比較
20において、各条件(Lk−Lg>Threshold1、Lk−La>
Threshold2、Lk−Lr>Threshold3)をORにする等、各
条件を任意の組み合わせで用いることが可能である。O
R(論理和)の場合は、Lk−Lg>Threshold1またはLk−
La>Threshold2またはLk−Lr>Threshold3が成立する場
合に、入力音声15が正解であると判断することにな
る。つまり、いずれか1つでも成立する場合、正解と判
断される。
【0025】閾値Threshold1、Threshold2、Threshold3
は適宜設定することができ、それらの大小関係もThresh
old1<Threshold2<Threshold3等任意であるが、一例を
挙げれば、Threshold1=−5、Threshold2=−2、Thre
shold3=−0.5等がある。
【0026】以上の説明は、商品キャンペーン等におけ
るクイズや懸賞の電話自動受付についてのものである
が、本発明は、パスワード発声により電話の接続を切り
換えるイタズラ電話防止装置やイタズラ呼排除装置、サ
ービス自動判別装置等に適用可能である。正解語(キー
ワード)11や優先棄却語12は1個でも、複数個でも
良い。また、キーワード依存競合語13や一般競合語1
4の個数は限定されない。
【0027】イタズラ電話防止装置やイタズラ呼排除装
置の場合は、例えば、発呼者1に対する質問としてパス
ワードの発声を求め、発呼者1が正しいパスワードを発
声したと音声認識により判断した場合のみ、電話を受け
付ける。この場合、優先棄却語12として正解としたく
ない、即ち、接続したくない語を登録しておくことによ
り、効果的にイタズラ電話やイタズラ呼を排除できる。
また、キーワード依存競合語13を正解のパスワードか
ら生成することにより、正解誤排除率および不正解誤受
理率を効果的に抑えることができるので、音声認識の照
合性能が向上する。
【0028】サービス自動判別装置の場合は、例えば、
発呼者1に対する質問として発呼者1が所望するサービ
ス名の発声を求め、発呼者1の所望サービスを音声認識
により判別し、これがシステムが提供するサービスであ
れば、電話を受け付ける。この場合、優先棄却語12と
して正解としたくない、即ち、システムが提供するサー
ビス名でないない語を登録しておくことにより、効果的
にサービスを判別できる。また、キーワード依存競合語
13を正解のパスワードから生成することにより、正解
誤排除率および不正解誤受理率を効果的に抑えることが
できるので、音声認識の照合性能が向上する。
【0029】さらに、電話以外の入力音声を対象とする
ことにより、キーワード11、優先棄却語12、キーワ
ード依存競合語13、一般競合語14を用いて、ユーザ
が正解を発声したか否かを音声認識により判断する装置
とすることも可能である。
【0030】
【発明の効果】本発明には、下記の効果がある。 (1) 従来プッシュホン入力に限られていた電話による懸
賞やクイズの解答入力を音声入力することが可能とな
る。 (2) システム提供者が正解としたくない語(例えば、競
合製品名)を登録することにより、それらの語の誤受理
を高い精度で排除することが可能となる。 (3) キーワードに応じた競合語を作成することにより、
音声認識の照合性能が向上し、正解と不正解の識別性能
が向上する。
【図面の簡単な説明】
【図1】本発明の第1実施形態例に係る電話自動受付装
置の構成を示す図。
【図2】本発明の第2実施形態例に係る電話自動受付装
置の構成を示す図。
【図3】キーワードの読みと、キーワードモデルおよび
キーワード依存競合モデルの関係を示す図。
【図4】キーワードの読みとキーワードモデルの関係を
示す図。
【図5】優先棄却語の読みと優先棄却モデルの関係を示
す図。
【図6】音声空間におけるキーワードと、キーワード依
存競合モデルと、優先棄却モデルの関係を示す図。
【図7】日本語音節を連接した作成した一般競合語の集
合例を示す図。
【図8】タスクの語彙を連接したモデルを用いて作成し
た一般競合語の集合例を示す図。
【図9】音声認識部の判断手法例を示す図。
【符号の説明】
1 発呼者 2 公衆回線網 3 PBX 4 電話自動受付装置 5 電話回線インタフェース 6 アナウンス部 7 音声認識部 8 登録部 9 競合語生成部 10 対話管理部 11 キーワード(正解語) 11a キーワードの読み 11b キーワードモデル 12 優先棄却語(正解としたくない語) 12a 優先棄却語の読み 12b 優先棄却モデル 13 キーワード依存競合語 13a キーワード依存競合モデル 14 一般モデル競合語 15 入力音声 16、17、18、19 尤度計算 20 比較
フロントページの続き (72)発明者 樋口 宜男 埼玉県上福岡市大原二丁目1番15号 株式 会社ケイディディ研究所内 Fターム(参考) 5D015 GG03 KK02 LL03 5K015 AA06 AA07 GA00 GA04 GA07 5K024 AA79 BB01 BB02 CC01 DD01 EE09 FF06 GG00 GG05 9A001 HZ17

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 電話を自動的に受け付ける装置におい
    て、発呼者に対して質問を発する質問送出手段と、この
    質問に対し前記発呼者が正解語を発声したか否かを判断
    する音声認識手段を具備し、前記発呼者が正解語を発声
    したと前記音声認識手段が判断した場合に電話を受け付
    けることを特徴とする電話自動受付装置。
  2. 【請求項2】 請求項1において、前記発呼者が正解語
    を発声したと前記音声認識手段が判断した場合は、以降
    の各種サービスメニューへ進むことを許可することを特
    徴とする電話自動受付装置。
  3. 【請求項3】 請求項1において、正解としたくない語
    を登録する登録手段を具備し、前記音声認識手段は前記
    登録した語に対しては誤受理率を低くすることを特徴と
    する電話自動受付装置。
  4. 【請求項4】 請求項1において、前記音声認識手段は
    競合語を用いて正解誤排除率および不正解誤受理率を抑
    えることを特徴とする電話自動受付装置。
  5. 【請求項5】 請求項4において、前記競合語を前記正
    解語の読みから自動的に生成する競合語生成手段を具備
    することを特徴とする電話自動受付装置。
  6. 【請求項6】 請求項5において、前記競合語生成手段
    は前記競合語として、辞書から、前記正解語との音響的
    な距離が所定範囲内の語のうち正解語に近い方から所定
    数N個選択することを特徴とする電話自動受付装置。
  7. 【請求項7】 請求項6において、前記競合語生成手段
    はn+1個目(ただし、n+1≦N)の語を選択する際
    に、既に選択したn個全ての語に対し所定距離以上の語
    のみを選択することを特徴とする電話自動受付装置。
  8. 【請求項8】 請求項5において、前記競合語生成手段
    は前記競合語として、文字数が前記正解語の1/K1倍か
    らK2倍の範囲の音節連鎖を用い、これから、前記正解語
    との音響的な距離が所定範囲内の音節連鎖のうち正解語
    に近い方から所定数N個選択することを特徴とする電話
    自動受付装置。
  9. 【請求項9】 請求項8において、前記競合語生成手段
    はn+1個目(ただし、n+1≦N)の音節連鎖を選択
    する際に、既に選択したn個全ての音節連鎖に対し所定
    距離以上の音節連鎖のみを選択することを特徴とする電
    話自動受付装置。
JP2000060233A 2000-03-06 2000-03-06 電話自動受付装置 Pending JP2001249688A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000060233A JP2001249688A (ja) 2000-03-06 2000-03-06 電話自動受付装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000060233A JP2001249688A (ja) 2000-03-06 2000-03-06 電話自動受付装置

Publications (1)

Publication Number Publication Date
JP2001249688A true JP2001249688A (ja) 2001-09-14

Family

ID=18580579

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000060233A Pending JP2001249688A (ja) 2000-03-06 2000-03-06 電話自動受付装置

Country Status (1)

Country Link
JP (1) JP2001249688A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014191567A (ja) * 2013-03-27 2014-10-06 Nippon Telegraph & Telephone East Corp 応募システム、応募受付方法及びコンピュータプログラム
JP2016062059A (ja) * 2014-09-22 2016-04-25 富士通株式会社 音声認識装置、音声認識方法、及び、プログラム
JP7418526B2 (ja) 2018-08-21 2024-01-19 グーグル エルエルシー 自動アシスタントを起動させるための動的および/またはコンテキスト固有のホットワード

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014191567A (ja) * 2013-03-27 2014-10-06 Nippon Telegraph & Telephone East Corp 応募システム、応募受付方法及びコンピュータプログラム
JP2016062059A (ja) * 2014-09-22 2016-04-25 富士通株式会社 音声認識装置、音声認識方法、及び、プログラム
JP7418526B2 (ja) 2018-08-21 2024-01-19 グーグル エルエルシー 自動アシスタントを起動させるための動的および/またはコンテキスト固有のホットワード

Similar Documents

Publication Publication Date Title
US6438520B1 (en) Apparatus, method and system for cross-speaker speech recognition for telecommunication applications
CA2105034C (en) Speaker verification with cohort normalized scoring
US7660716B1 (en) System and method for automatic verification of the understandability of speech
US6487530B1 (en) Method for recognizing non-standard and standard speech by speaker independent and speaker dependent word models
US7529667B1 (en) Automated dialog system and method
US8964949B2 (en) Voice response apparatus and method of providing automated voice responses with silent prompting
EP0780829B1 (en) Method for automatic speech recognition in telephony
US6882973B1 (en) Speech recognition system with barge-in capability
EP1019904B1 (en) Model enrollment method for speech or speaker recognition
US6496799B1 (en) End-of-utterance determination for voice processing
AU667871B2 (en) Voice controlled messaging system and processing method
US5912949A (en) Voice-dialing system using both spoken names and initials in recognition
US7058573B1 (en) Speech recognition system to selectively utilize different speech recognition techniques over multiple speech recognition passes
US6101241A (en) Telephone-based speech recognition for data collection
JPH07210190A (ja) 音声認識方法及びシステム
US8515025B1 (en) Conference call voice-to-name matching
US20020087306A1 (en) Computer-implemented noise normalization method and system
JPH10513033A (ja) 電気通信網に基づく音声ダイヤル呼び出しのための自動語彙作成
US5930336A (en) Voice dialing server for branch exchange telephone systems
US20010056345A1 (en) Method and system for speech recognition of the alphabet
Lennig et al. Directory assistance automation in Bell Canada: Trial results
EP1377000B1 (en) Method used in a speech-enabled automatic directory system
JP2001249688A (ja) 電話自動受付装置
EP1385148B1 (en) Method for improving the recognition rate of a speech recognition system, and voice server using this method
Vysotsky VoiceDialing-the first speech recognition based telephone service delivered to customer's home

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040914

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20061003

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061010

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070220