JP2002372989A - 数字音声入力方法、その装置、そのプログラム及びその記録媒体 - Google Patents

数字音声入力方法、その装置、そのプログラム及びその記録媒体

Info

Publication number
JP2002372989A
JP2002372989A JP2001178745A JP2001178745A JP2002372989A JP 2002372989 A JP2002372989 A JP 2002372989A JP 2001178745 A JP2001178745 A JP 2001178745A JP 2001178745 A JP2001178745 A JP 2001178745A JP 2002372989 A JP2002372989 A JP 2002372989A
Authority
JP
Japan
Prior art keywords
voice
digits
digit
recognition
response
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001178745A
Other languages
English (en)
Inventor
Shunichiro Yamamoto
俊一郎 山本
Takeshi Kawabata
豪 川端
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2001178745A priority Critical patent/JP2002372989A/ja
Publication of JP2002372989A publication Critical patent/JP2002372989A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 連続数字音声を入力させる際に認識率を向上
させる。 【解決手段】 音声入力されるべき、クレジットカード
番号、電話番号などの決った桁数によって区切られた連
続数字における前記区切桁数情報を格納部107に登録
しておき、入力部101に入力された数字音声を認識部
102で認識処理して順次得られた認識候補を応答判定
部105に入力し、その尤度がしきい値以上であれば桁
数カウンタ106を1つ歩進し、カウンタ106の計数
値と格納部107の情報とが一致すると一致検出部10
9から応答生成命令を応答生成部103へ出力し、これ
よりあいづちなどの確認応答を出力し、ユーザをこの確
認応答によりどの桁まで入力されたかを知り、次の桁の
発声入力を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、例えば対話シス
テムに適用され、クレジットカード番号や電話番号など
の連続数字の音声を音声認識し、数字音声入力方法、そ
の装置、そのプログラム及びその記録媒体に関する。
【0002】
【従来の技術】従来の対話システムは、図4に示すよう
に、音声入力部301から入力された音声を音声認識部
302で認識処理し、入力された音声全体に対する認識
処理が終了し、音声認識結果が得られると、その音声認
識結果を応答生成部303に送り、応答生成部303は
その音声認識結果に応じた応答信号を生成し、応答出力
部304からその応答信号を出力する。この従来の対話
システムにおいて、連続した数字を音声入力するには、
ユーザ(利用者)は全ての数字を連続して音声入力する
必要があった。例えば、クレジットカードの番号をユー
ザが音声入力する場合、ユーザは「ぜろいちにーさんよ
んごーろくななはちきゅーぜろいちにーさんよんごー」
といったように、16桁の数字を連続して音声入力する
必要があった。
【0003】
【発明が解決しようとする課題】上述したように、従来
の連続数字の音声入力方法では、ユーザは全ての数字を
連続して音声入力する必要があった。しかし、一度に入
力する桁数が多くなるほど音声認識の精度が劣化すると
いう問題があることが判明した。
【0004】
【課題を解決するための手段】この発明によれば、連続
数字をユーザが音声入力する際に、その決められた桁数
までの音声入力が完了する度に応答を出力する。これに
よって、ユーザはそれを確認しながら音声入力を継続す
ることができ、その確認ごとに区切が生じ、少ない桁数
の連続数字が発声されることになり、音声認識率が向上
する。
【0005】
【発明の実施の形態】この発明の実施形態を実施例によ
り説明する。この実施例では決められた桁数で区切りを
持つある連続数字の音声を入力する場合である。システ
ムの質問に対して、ユーザが発声した連続数字の音声は
図1に示すように音声入力部101から入力され、音声
入力部101から電気的音声信号とされて音声認識部1
02に供給される。音声認識部102ではその音声信号
に対して認識処理される。音声認識部102は上記入力
音声に対して数字1桁分ずつ認識処理を進め、認識候補
となる数字列を展開していき、最も尤度が高くなる数字
列を最終認識結果として出力する。
【0006】この実施例では、その最終認識結果が得ら
れる前に、数字1桁分の認識候補が得られると、その数
字1桁分の認識候補は応答判定部105に送られる。応
答判定部105は、何桁目まで認識処理が進行している
かを記憶する認識桁数カウンタ106と、事前に登録さ
れる上記連続数字に決められた区切りの桁数の情報を格
納した格納部107を備え、更に入力された認識候補の
尤度が所定値以上かを比較する比較部108と、認識桁
数カウンタ106の計数値と格納部107に格納されて
いる各区切り桁数データとの一致を検出する一致検出部
109を備えている。
【0007】応答判定部105は音声認識部102から
数字1桁分の認識候補を受け取ると、まず受け取った認
識候補の尤度があるしきい値を超えているか否かの判断
を比較部108で行い、受け取った認識候補の尤度があ
るしきい値を超えている場合のみ認識桁数カウンタ10
6の値を1加算し、認識桁数カウンタ106に保持され
ている値と、格納部107内の各区切り桁数データの比
較を一致検出部109で行い、両者の数値が一致してい
る場合、応答生成命令信号を応答生成部103に送る。
【0008】応答生成命令信号を受け取った応答生成部
103は応答信号を生成し、その応答信号を応答出力部
104はユーザが聴覚又は/及び視覚的に知ることがで
きるような確認応答として出力する。この確認応答の例
としては、「はい」「うん」などの音声を録音しておい
て再生したり、合成音声で応答したり、ビープ音を用い
たり、あるいは、画面表示が利用できる場合には、人が
うなずく画像、「OK」の文字画像を表示するなど、ま
たこれらの組合せなど多くのバリエーションが考えられ
る。
【0009】例えば、クレジットカードの番号の入力を
求めるシステムの質問に従って、ユーザがクレジットカ
ードの番号を音声入力する場合にこの発明を適用するこ
とを考える。クレジットカードの番号は、4桁ずつハイ
フンで区切られた16桁の連続数字で構成されている。
従って、ユーザから4桁分の連続数字が音声入力される
度に確認応答を挿入すれば、ユーザに違和感を与えるこ
となくユーザが一度に発声する連続数字を限定すること
ができ、音声認識の精度を向上させることができる。
【0010】つまりこの例では格納部107に区切り桁
数データとして4と8と12とが格納され、認識桁数カ
ウンタ106の計数値が4,8及び12になるとそれぞ
れ一致検出部109から応答生成命令信号が出力される
ことになる。このように予め決められた桁数の区切りが
4桁ごとの場合は、格納部107に区切り桁数データと
して4のみを格納しておき、認識桁数カウンタ106の
計数値が4になるごとに応答生成命令信号を出力すると
共に認識桁数カウンタ106をクリアするようにしても
よい。
【0011】図2に、「クレジットカードの番号をお話
しください」というシステムの質問に対し、ユーザが
「ぜろいちにーさんよん」201と最初の5桁分の発声
まで完了した時点での処理例を示す。ユーザの発声20
1は入力音声信号202として順次音声入力部101か
ら音声認識部102へ送られる。音声認識部102は入
力音声202に対して数字1桁分ずつ認識処理を進め、
認識候補となる数字列203〜215を展開し、それら
の認識候補を応答判定部105に順次送る(216〜2
28)。
【0012】応答判定部105は認識候補を順次受け取
ると、その各受け取った認識候補の尤度があるしきい値
を超えているか否かの判断を比較部108で行い(22
9〜242)、その尤度があるしきい値を超えている場
合のみ認識桁数カウンタ106に保持される値を1加算
する。この例では、認識候補204,206,210,
212,214についてはその尤度があるしきい値を超
えていると判定され(230,233,237,23
9,241)、認識桁数カウンタ106が1ずつ加算さ
れて計数値が1,2,3,4,5となる(243〜24
7)。
【0013】このような処理を行う事で、ユーザの発声
が現在どの桁数まで進んでいるかを精度良く判定するこ
とができる。応答判定部105には、ユーザに質問した
連続数字に決められた区切りの桁数それぞれを示す情報
データが格納部107に登録されている。この例では、
システムはクレジットカードの番号の入力をユーザに求
めているため、クレジットカードの番号に決められた区
切りの桁数の情報が登録されている。クレジットカード
の番号は、4桁ずつハイフンで区切られた16桁の連続
数字で構成されているため、4桁目、8桁目、12桁目
に区切りがあるという情報が登録されている。
【0014】認識桁数カウンタ106が1加算されると
(243〜247)、認識桁数カウンタ106が保持し
ている値と格納部107に格納されているその区切り桁
数の情報4,8,12とを比較し(248〜252)、
両者が一致している場合、確認応答253が生成、出力
される。この例は最初の5桁目までユーザの音声入力が
進んだ時点での処理例を示しているため、最初の4桁目
までユーザの音声入力が進んだ時点で確認応答252が
出力されている様子がわかる。ユーザが4桁目を発声
し、それが入力されたことの確認応答をユーザが確認し
て、5桁目の発声を行うため、4桁目の発声と5桁目の
発声との間に、図2に示すように間隔D1が生じる。
【0015】この例には記述していないが、この後ユー
ザの発声は継続し、8桁目、12桁目までの入力がそれ
ぞれ終了した段階でも同様に確認応答が出力され、よっ
て8桁目の発声と9桁目の発声との間、また12桁目の
発声と13桁目の発声との間にそれぞれ間隔が生じる。
このように16桁の連続数字が4桁ずつ区切られて発声
されるため、この区切りを設けないで発声した場合より
認識率が向上する。以上述べた数字音声入力方法におけ
る認識側装置の処理手順の例を図3に示す。発声された
音声を入力処理し(S1)、得られた電気的入力音声信
号を音声認識処理して認識候補となる数字列に展開し
(S2)、順次得られる認識候補について、その尤度が
しきい値以上か否かの尤度判定処理を行い(S3)、尤
度がしきい値を超えた場合は桁数N(Nは予め0に初期
化されてある)を+1し(S4)、更新された桁数N
が、設定された区切り桁数と一致したかを調べ(S
5)、一致していなければ、ステップS4に戻り、一致
していれば確認応答を生成出力してステップS4に戻る
(S6)。なお、音声入力処理(S1)、音声認識処理
(S2)、尤度判定処理(S3)は、数字音声が入力さ
れている間常時行っている。
【0016】先に述べたように、連続数字を一定桁数M
ごとに確認応答を生成出力する場合は、ステップS5で
NとMとが一致したか調べ、一致すれば確認応答を生成
出力し(S6)、破線で示すようにNを0に初期化して
ステップS4に戻る(S7)。上述において、音声入力
されるべき連続数字を予め決められた桁数で区切る場合
は、その要求される数字情報に応じて、クレジットカー
ド番号や電話番号のように予め決められた桁数で区切り
を持つ場合はその区切りを区切り桁数情報として格納部
107に格納するとよい。この格納区切り桁数は4桁
目、6桁目など各種の場合がある。音声入力を要求され
る数字情報が区切りをもたない場合は、一定の桁数ごと
に区切り桁数の情報を設定すればよい。
【0017】図1に示した装置はコンピュータによりプ
ログラムを実行させて機能させることもできる。その数
字音声入力プログラムは図3に示した手順をコンピュー
タにより実行するものであり、CD−ROM、磁気ディ
スク、フレキシブルディスクなどからコンピュータ内の
メモリにインストールして、又は通信回線を通じてコン
ピュータ内のメモリにダウンロードして利用することに
なる。
【0018】
【発明の効果】以上述べたように、この発明によれば、
連続数字をユーザが音声入力する際に、予め決められた
桁数まで音声入力が完了する度に確認応答が挿入され
る。これによって、ユーザは予め決められた桁数までの
音声入力が完了したことを知ることができ、予め決めら
れた桁数に区切られた少ない桁数の連続数字を発声する
ことになり、一度に入力する桁数が少なくなるため、音
声認識の精度が向上する。例えば16桁の数字を連続発
声入力した場合の認識率は85%〜90%弱程度である
が、4桁づつ区切って発声入力した場合の認識率は95
%強程度に向上することが確認された。
【図面の簡単な説明】
【図1】この発明方法の実施例の機能構成例を示すブロ
ック図。
【図2】この発明方法を具体的に示す図。
【図3】この発明方法の実施例を示す流れ図。
【図4】従来の対話システムの機能構成例を示すブロッ
ク図。

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 入力された数字音声を音声認識処理し、
    その認識した数字が、予め決められた桁数に達するごと
    に確認応答を出力することを特徴とする数字音声入力方
    法。
  2. 【請求項2】 入力されるべき数字音声はクレジットカ
    ード番号や電話番号などのように、予め決められた桁数
    によって区切られた連続数字であって、上記予め決めら
    れた桁数は上記予め区切られた桁数であることを特徴と
    する請求項1記載の数字音声入力方法。
  3. 【請求項3】 上記音声認識処理で順次得られる各桁の
    認識候補がしきい値以上の尤度を有するか否かを判断
    し、しきい値以上の尤度をもつ認識候補が得られるごと
    に認識した数字の桁数を1加算することを特徴とする請
    求項1又は2記載の数字音声入力方法。
  4. 【請求項4】 上記予め決められた桁数を格納してお
    き、上記加算した桁数が上記予め決められた桁数と一致
    するか否かを判定し、一致と判定されると可聴的又は/
    及び可視的確認応答の生成を行い、生成された確認応答
    を出力することを特徴とする請求項3記載の数字音声入
    力方法。
  5. 【請求項5】 入力された数字音声を電気的音声信号に
    変換する音声入力手段と、 音声入力手段よりの電気的音声信号が入力され、上記入
    力された数字音声を数字1桁分ずつ認識処理を行い認識
    候補を求める音声認識手段と、 上記音声認識手段で求められた各1桁の認識候補が入力
    され、その認識結果が予め決められた数に達するとこれ
    を検出して応答生成命令信号を出力する応答判定手段
    と、 上記応答生成命令信号が入力され、可聴的及び/又は可
    視的確認応答を出力する応答生成手段と、を具備する数
    字音声入力装置。
  6. 【請求項6】 上記応答判定手段は、桁数情報が登録さ
    れた格納部と、上記入力された各認識候補の尤度がしき
    い値以上か否か判断する比較部と、尤度がしきい値以上
    と判断されるごとに認識結果の数を1加算する桁数カウ
    ンタと、その桁数カウンタの計数値が上記登録された桁
    数情報と一致すると上記応答生成命令信号を出力する一
    致検出部とを有することを特徴とする請求項5記載の数
    字音声入力装置。
  7. 【請求項7】 入力されるべき連続数字音声の連続数字
    は決められた桁数で区切りを持つものであって、その各
    区切りの桁数が上記桁数情報として登録されていること
    を特徴とする請求項6記載の数字音声入力装置。
  8. 【請求項8】 請求項1乃至4の何れかに記載の数字音
    声入力方法をコンピュータにより実行させるための数字
    音声入力プログラム。
  9. 【請求項9】 請求項8記載の数字音声入力プログラム
    が記録されたコンピュータ読み取り可能な記録媒体。
JP2001178745A 2001-06-13 2001-06-13 数字音声入力方法、その装置、そのプログラム及びその記録媒体 Pending JP2002372989A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001178745A JP2002372989A (ja) 2001-06-13 2001-06-13 数字音声入力方法、その装置、そのプログラム及びその記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001178745A JP2002372989A (ja) 2001-06-13 2001-06-13 数字音声入力方法、その装置、そのプログラム及びその記録媒体

Publications (1)

Publication Number Publication Date
JP2002372989A true JP2002372989A (ja) 2002-12-26

Family

ID=19019397

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001178745A Pending JP2002372989A (ja) 2001-06-13 2001-06-13 数字音声入力方法、その装置、そのプログラム及びその記録媒体

Country Status (1)

Country Link
JP (1) JP2002372989A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010091962A (ja) * 2008-10-10 2010-04-22 Denso Corp 情報処理装置,インタフェース提供方法およびプログラム
JP2019016337A (ja) * 2016-09-23 2019-01-31 Hoyaサービス株式会社 Ivrを用いた自動音声案内方法およびivrシステム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010091962A (ja) * 2008-10-10 2010-04-22 Denso Corp 情報処理装置,インタフェース提供方法およびプログラム
JP2019016337A (ja) * 2016-09-23 2019-01-31 Hoyaサービス株式会社 Ivrを用いた自動音声案内方法およびivrシステム

Similar Documents

Publication Publication Date Title
JP4672003B2 (ja) 音声認証システム
US8886534B2 (en) Speech recognition apparatus, speech recognition method, and speech recognition robot
JP3284832B2 (ja) 音声認識対話処理方法および音声認識対話装置
JP3180655B2 (ja) パターンマッチングによる単語音声認識方法及びその方法を実施する装置
JP3337233B2 (ja) 音声符号化方法及び装置
EP1355295B1 (en) Speech recognition apparatus, speech recognition method, and computer-readable recording medium in which speech recognition program is recorded
US6922668B1 (en) Speaker recognition
JPS62231997A (ja) 音声認識システム及びその方法
JPH0876788A (ja) 音声認識における混同しやすい語の検出方法
JP2008309856A (ja) 音声認識装置及び会議システム
EP3567586B1 (en) Voice interaction system, voice interaction method, and program
JP6280074B2 (ja) 言い直し検出装置、音声認識システム、言い直し検出方法、プログラム
JP2004101901A (ja) 音声対話装置及び音声対話プログラム
CN110689895B (zh) 语音校验方法、装置、电子设备及可读存储介质
JP2004294755A (ja) 話者認証装置及び話者認証プログラム
JP2013257418A (ja) 情報処理装置、および情報処理方法、並びにプログラム
JP2996019B2 (ja) 音声認識装置
JP2002372989A (ja) 数字音声入力方法、その装置、そのプログラム及びその記録媒体
JP2013083796A (ja) 男女声識別方法、男女声識別装置及びプログラム
KR101925253B1 (ko) 문맥 독립형 화자확인 장치 및 이를 이용한 화자확인 방법
JP2006039382A (ja) 音声認識装置
JPH11202895A (ja) 音声認識システムと方法およびそのプログラムを記録した記録媒体
US6438521B1 (en) Speech recognition method and apparatus and computer-readable memory
JP2005283646A (ja) 音声認識率推定装置
JPS645320B2 (ja)

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050802

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050823

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20051220