JP2004007634A - スピード音声ダイアル装置および方法 - Google Patents
スピード音声ダイアル装置および方法 Download PDFInfo
- Publication number
- JP2004007634A JP2004007634A JP2003125831A JP2003125831A JP2004007634A JP 2004007634 A JP2004007634 A JP 2004007634A JP 2003125831 A JP2003125831 A JP 2003125831A JP 2003125831 A JP2003125831 A JP 2003125831A JP 2004007634 A JP2004007634 A JP 2004007634A
- Authority
- JP
- Japan
- Prior art keywords
- abbreviated
- user
- abbreviated number
- telephone
- speed voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/26—Devices for calling a subscriber
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/26—Devices for calling a subscriber
- H04M1/27—Devices whereby a plurality of signals may be stored simultaneously
- H04M1/271—Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Telephone Function (AREA)
- Telephonic Communication Services (AREA)
Abstract
【解決手段】スピード音声ダイアルモード設定部51は、ユーザからスピード音声ダイアルモード設定のコマンドを受け取った場合、スピード音声ダイアルモードを設定し、短縮番号データベース52は、ユーザが使う電話番号を保存して管理し、前記電話番号から短縮番号を抽出して短縮番号リストを構築し、短縮番号検出部53は、前記スピード音声ダイアルモード設定部において前記スピード音声ダイアルモードが設定された場合、ユーザが短縮番号を発声すれば、前記短縮番号データベースの前記短縮番号リストから前記ユーザが発声した短縮番号を検出し、電話番号連結部54は、前記短縮番号検出部において検出された短縮番号に対応する電話番号につなぐ。
【選択図】 図5
Description
【発明が属する技術分野】
本発明は音声を用いて迅速で且つ便利にダイアルを行う装置および方法に係り、特に、話者独立数字音認識エンジンを数字ダイアルに適用するに当たり、ユーザの使い勝手を高めるとともに、認識エンジンの効率を極大化させる装置および方法に関する。
【0002】
【従来の技術】
従来の音声ダイアルは、音声登録された名前を発声したり(話者従属音声認識)、電話帳に入力された人の名前を発声したり(話者独立音声認識)、あるいは電話番号を全て発声して電話をかける方法である。最近、携帯電話などにおける電話連結をさらに便利にするために、音声登録過程を経なければならない話者従属音声認識機に留まらず、音声登録無しでも認識可能な話者独立音声認識エンジンが適用されている。
【0003】
従来の音声認識数字ダイアルの場合、電話番号の長さによって認識率の違いが大きく、発声の最中に誤認識が起こって間違った数字が現れる場合、該当数字のみ修正されるといった不都合があった。電話番号のうち中間の一つが間違って該当数字のみを入れ直すには、ユーザが液晶ディスプレイを見つめる過程と、適当なキーを押してカーソルを間違った個所まで移したり音声により該当数字を呼び出す過程とを経なければならない。他の方法として、電話番号の間違い数を問わずに、全ての電話番号を再び発声する方法がある。2つの方法ともにユーザに大きな不都合を与える。
【0004】
音声認識機にとっては、どこがいかほどに間違ったかが分からず、たとえ再び発声するとしても、電話番号の全てを正しく発声する確率は以前と同じである。さらに、ユーザが記憶している電話番号の数に限界があるため、7桁以上の電話番号を音声によりダイアルするには難点があり、頻繁に使う番号の場合にはさらに煩わしい。なお且つ、音声認識エンジンにより組み合わせ可能な数字列の数が極めて多く、認識の速度および認識の性能に低下を来たす。
【0005】
従来、電話番号を音声によりダイアルするに当たり、7桁以上よりなる電話番号の場合、認識エンジンがこれをよく認識できず、発声者にとっても長い電話番号をいちいち発声しなければならないという不具合があった。特に、認識の最中に雑音が入るなどして認識の結果が間違った場合、既に発声した番号を再び発声しなければならないなど、実効性に劣っていた。
【0006】
さらに、従来の音声認識ダイアルの場合、電話帳に登録された者の電話番号は記憶しているものの、その者の登録名を記憶していない場合、音声認識名前ダイアル機能を使うことができない。
【0007】
【発明が解決しようとする課題】
本発明が解決しようとする技術的な課題は、ユーザが通話しようとする電話番号の数字列を全て発声することなく、電話番号の一部(例えば、下4桁番号)のみを発声することにより、それに対応する電話番号を探し出して電話連結を可能にするためのスピード音声ダイアル装置および方法を提供するところにある。
【0008】
【課題を解決するための手段】
前記問題点を解決するために、本発明は、ユーザからスピード音声ダイアルモード設定のコマンドを受け取った場合、スピード音声ダイアルモードを設定するスピード音声ダイアルモード設定部、ユーザが使う電話番号を保存して管理し、前記電話番号から短縮番号を抽出して短縮番号リストを構築する短縮番号データベース、前記スピード音声ダイアルモード設定部において前記スピード音声ダイアルモードが設定された場合、ユーザが短縮番号を発声すれば、前記短縮番号データベースの前記短縮番号リストから前記ユーザが発声した宿約番号を検出する短縮番号検出部および前記短縮番号検出部において検出された短縮番号に対応する電話番号につなぐ電話番号連結部を備える装置を提供する。
【0009】
【発明の実施の形態】
以下、添付した図面に基づき、本発明の好適な実施形態について詳細に説明する。
【0010】
図1は、従来の音声ダイアル装置の構成図である。
【0011】
図1を参照すれば、音声入力部11は、ユーザが音声を入力すれば、それに応じて音声ダイアルモードを設定する。フィーチャ変換部12は、前記音声入力部11から入力したユーザの音声をコーデックを介してフィーチャベクトルに変換する。名前マッチング部15は、名前モードの場合、このようにして変換されたフィーチャベクトルおよび電話帳に書き込まれたテキストに基づき該当テキストを構成するモデルシーケンスとのパターンマッチングを行う。ここで、前記モデルシーケンスは、名前テキストデータベース14に保存されて管理され、前記名前テキストデータベース14は、電話番号データベース13から名前部分のみを抽出して構築される。電話番号選択部16は、前記名前マッチング部15において認識された名前に対応する電話番号を選択し、連結部19は、前記選択された電話番号にダイアルする。電話番号マッチング部17は、数字モードの場合、一定の文法によって再構成された数字音に関するモデルおよび入力されたフィーチャベクトル間のパターンマッチングを行う。電話番号確認部18は、前記電話番号マッチング部17から出力された電話番号を確かめる。連結部19は、前記確かめられた電話番号にダイアルする。
【0012】
前記従来の音声ダイアル装置の動作は、下記の通りに行われる。
【0013】
まず、発声者は、電話連結を希望する者の名前や電話番号を発声する。このようにして発声された音声はコーデック装置を介してパルス符号変調(以下、PCM)データに変換され、このPCMデータは音声認識により認識可能なフィーチャベクトルに変換される。ターゲットプラットフォーム(携帯電話など)においては、設定されたモードに応じて、名前モードであれば電話帳から名前リストを得、数字モードであれば電話帳から電話番号リストを得る。前記名前モードの場合、入力された前記フィーチャベクトルおよび既に保存されているモデルを名前リストに合わせて再構成したモデル列間のパターンマッチングを行う。次いで、前記電話帳から音声認識の結果として得られた電話番号にダイアルする。前記数字モードの場合には、入力された前記フィーチャベクトルおよびN個の単独数字音が数字の数だけ出るように構成してパターンマッチングを行う。次いで、前記名前モードと同様に、認識の結果として得られた電話番号にダイアルする。
【0014】
図2は、従来の音声ダイアル装置の数字フィーチャベクトルの構造図である。
【0015】
図3は、従来のスピードダイアルを行う方法の構造図である。
【0016】
従来のスピードダイアルは、ボタンを押すことにより電話連結を行う方法であって、2種類に分けられる。一つの方法は、電話番号データベースに登録された番号のうち下4桁番号に当たるボタンを長く押すことによりダイアルする方法である。もう一つの方法は、電話番号データベースに登録された番号の番地数に当たるボタンを長く押すことによりダイアルする方法である。
【0017】
図4は、本発明に係るスピード音声ダイアル装置が取り付けられた改良音声ダイアル装置の構成図である。
【0018】
スピード音声ダイアルモード設定部401は、ユーザの音声または音声スピードボタンによる入力により音声スピードダイアルモードを設定する。電話番号リスト構築部407は、電話番号データベース404から下4桁番号を得てこの下4桁番号よりなるリストを認識対象語彙として選定し、ネットワークを構成する。フィーチャ変換部403は、入力された音声を認識に用いるためにフィーチャベクトルに変え、短縮番号マッチング部408は、このように構成されたネットワーク下で形成されたモデルパターンおよび入力された前記フィーチャベクトルをマッチングする。電話番号確認部411は、認識の結果として得られた下4桁番号に対応する電話番号をユーザに確認させ、電話番号選択部412は、前記電話番号確認部411において確認された電話番号が多数である場合、前記多数の電話番号のうち一つを選択する。そして、電話番号連結部413は、前記確認または選択された電話番号にダイアルする。取消し部414は、前記電話番号確認部411における電話番号がユーザが通話しようとする電話番号ではない場合、前記電話番号を取り消す。名前モードにおける名前マッチング部406および名前リスト構築部405は、前記図1における名前マッチング部15および名前テキストデータベース14にそれぞれ対応する。テキスト・ツー・スピーチ(TTS)エンジン410は、テキスト形式の文書が入ればそれを自動的に音声に変える。本発明に係る装置はユーザの音声を入力されて処理するものであるため、ユーザの便宜を考慮に入れて出力も音声にする。
【0019】
図5は、本発明に係るスピード音声ダイアル装置の構成図である。
【0020】
図5を参照すれば、本発明に係るスピード音声ダイアル装置は、スピード音声ダイアルモード設定部51、短縮番号データベース52、短縮番号検出部53および電話番号連結部54を備えてなる。前記スピード音声ダイアルモード設定部51は、ユーザからスピード音声ダイアルモード設定のコマンドを受け取った場合、スピード音声ダイアルモードを設定する。すなわち、ユーザは、このスピード音声ダイアルモード設定部51を用いてあらかじめスピード音声ダイアルモードを設定しておいても良く、前記スピード音声ダイアルモードのボタンを用いて音声ダイアルを始めても良い。短縮番号データベース52は、ユーザが使う電話番号を保存して管理し、前記電話番号から短縮番号を抽出して短縮番号リストを構築する。既にスピード音声ダイアルモードが設定されているため、短縮番号データベース52は、電話番号データベースから下4桁番号を抽出してリストを作った後にネットワークを構成することにより、短縮番号データベースを構築する。前記短縮番号検出部53は、前記スピード音声ダイアルモード設定部51において前記スピード音声ダイアルモードが設定された場合、ユーザが短縮番号を発声すれば、前記短縮番号データベース52の前記短縮番号リストから前記ユーザが発声した短縮番号を検出する。前記スピード音声ダイアルモード設定部51における設定によりスピード音声ダイアルモードが設定されれば、入力されたユーザ音声はコーデックを介してPCMデータに変換され、前記変換されたPCMデータは音声認識に用いられるためにフィーチャに変えられる。前記フィーチャおよび短縮番号データベース52に保存された短縮番号をマッチングすることにより、同じものを探し出す認識過程が行われる。前記電話番号連結部54は、前記短縮番号検出部53において検出された短縮番号に対応する電話番号につなぐ。認識の結果として得られた短縮番号は、ユーザによる確認を通じてユーザにより選択された電話番号につながる。前記短縮番号は、任意の電話番号の桁数が4以上である場合には前記電話番号から下4桁番号を抽出して生成され、任意の電話番号の桁数が4未満である場合には前記電話番号が短縮番号となる。ここで、桁数が4未満である任意の電話番号は、112,119などの緊急電話番号を意味する。但し、今後、電話番号の桁数のフォーマットが変わる場合、ユーザの便宜のために短縮番号の長さも変わる。
【0021】
図6は、図5の短縮番号データベース52の詳細構成図である。
【0022】
前記短縮番号データベース52は、電話番号データベース61および短縮番号リスト構築部62を備えてなる。前記電話番号データベース61は、ユーザが保存した電話番号およびユーザが最近かけた電話番号を保存して管理する。したがって、過去にかけた電話番号の場合、ユーザが保存をしなかったならば、前記電話番号データベースに保存されない。一般に、ユーザが最近かけた電話番号は最近通話リストとして表示される。前記短縮番号リスト構築部62は、前記電話番号データベース61に保存された前記電話番号から短縮番号を抽出して短縮番号リストを構築する。ユーザが既にスピード音声ダイアルモードを設定した場合やボタンを押してスピード音声ダイアルモードを設定した場合には、スピード音声ダイアルモードが始まると同時に、スピード音声ダイアルモード情報が前記電話番号データベース61へ伝わり、前記短縮番号リスト構築部62が前記電話番号データベース61から下4桁数を得て認識の対象を作る。
【0023】
図7は、図5の短縮番号検出部53の詳細構成図である。
【0024】
前記短縮番号検出部53は、発声指示部71、PCMフィーチャ変換部72、マッチング検出部73および短縮番号出力部74を備えてなる。
【0025】
前記発声指示部71は、前記スピード音声ダイアルモード設定部においてスピード音声ダイアルモードが設定された場合、ユーザに通話しようとする電話番号の短縮番号を発声することを指示する。前記指示は、通常、TTSエンジンを介して音声によりなされる。前記PCMフィーチャ変換部72は、前記発声指示部71の前記指示に従ってユーザが短縮番号を発声すれば、前記発声された短縮番号をPCMデータに変換し、前記PCMデータをフィーチャに変換する。すなわち、前記PCMフィーチャ変換部72は、ユーザが案内メッセージに従って4桁の番号を発声すれば、前記発声された短縮番号をPCMデータに変換し、前記PCMデータをフィーチャに変換する。前記マッチング検出部73は、前記短縮番号データベース52の前記短縮番号リストおよび前記PCMフィーチャ変換部72の前記フィーチャをマッチングさせて前記フィーチャと同じ短縮番号を前記短縮番号リストから検出する。前記短縮番号出力部74は、前記マッチング検出部において検出された短縮番号をユーザに出力する。この時にも同様に、前記出力がTTSエンジンを介して音声によりなされる。前記音声として出力された短縮番号をユーザが聴き、ユーザが発声した短縮番号と同じである旨を認めれば、すなわち、ユーザが“ハイ”と発声すれば、前記電話番号連結部54は、前記短縮番号検出部53において検出された前記短縮番号に対応する番号が一つである場合、前記検出された短縮番号に対応する前記一つの電話番号につなぐ。これに対し、前記電話番号連結部54は、前記短縮番号検出部において検出された短縮番号に対応する番号が多数である場合には、TTSエンジンを介して前記多数の名前を音声として出力し、前記音声として出力された多数の名前をユーザが聴き、ユーザが通話しようとする一つの電話番号を選択した場合、前記短縮番号を前記一つの電話番号につなぐ。
【0026】
仮に、前記短縮番号検出部53において検出された前記短縮番号に対応する番号が存在しない場合、前記短縮番号出力部74は、ユーザに、前記短縮番号に対応する番号が存在しないために再発声することを指示する。ユーザが短縮番号を再発声すれば、前記短縮番号検出部53は、前記短縮番号データベース52の前記短縮番号リストから前記ユーザが再発声した短縮番号を検出する。以下における検出後の電話番号の連結過程は、前述した通りである。但し、違いがあれば、前記短縮番号検出部53において検出された、前記ユーザが再発声した短縮番号に対応する番号が存在しない場合には、ユーザの便宜のために、前記短縮番号に類似した短縮番号につなごうとする試みをする点である。ここで、類似した短縮番号への連結は、類似番号検索部、類似番号出力部および類似番号選択部によりなされる。類似番号検索部は、前記短縮番号リストから前記短縮番号に類似した短縮番号を検索する。類似番号出力部は、前記類似番号検索部において検索された前記類似した短縮番号が存在する場合、前記短縮番号に類似した短縮番号をユーザに出力する。そして、類似番号選択部は、前記類似番号出力部から出力された短縮番号のうちユーザが通話しようとする短縮番号を選択する。ここで、前記類似番号出力部は、前記類似番号検索部において検索された前記類似した短縮番号が存在しない場合、認識失敗である旨をユーザに出力する。前記類似番号選択部において選択された短縮番号は、前記電話番号連結部54によりユーザが通話しようとする電話番号につながる。
【0027】
図8は、図7のPCMフィーチャ変換部72の詳細構成図である。
【0028】
これを参照すれば、本発明に係るPCMフィーチャ変換部72は、PCMデータ変換部81およびフィーチャ変換部82を備えてなる。前記PCMデータ変換部81は、前記発声指示部(図7の71)の前記指示に従ってユーザが短縮番号を発声すれば、前記発声された短縮番号をコーデックを介して2進デジタルデータであるPCMデータに変換する。前記フィーチャ変換部82は、前記PCMデータ変換部81の前記PCMデータをテキストデータであるフィーチャに変換する。これにより、音声およびテキストデータである前記短縮番号間の1対1の比較作業が可能になる。
【0029】
図9は、本発明に係るスピード音声ダイアル方法のフローチャートである。
【0030】
これを参照すれば、ユーザからスピード音声ダイアルモード設定のコマンドを受け取った場合、スピード音声ダイアルモードを設定し(ステップ91)、ユーザが使う電話番号を保存して管理し、且つ、前記電話番号から短縮番号を抽出して短縮番号リストを構築する(ステップ92)。前記スピード音声ダイアルモードが設定された場合、ユーザが短縮番号を発声すれば、前記短縮番号リストから前記ユーザが発声した短縮番号を検出し(ステップ93)、前記検出された短縮番号に対応する電話番号につなぐ(ステップ94)。
【0031】
図10は、本発明に係るスピード音声ダイアル方法のうち短縮番号リスト構築方法(図9のステップ92)の詳細フローチャートである。
【0032】
図10を参照すれば、ユーザが使う電話番号を保存して管理し(ステップ101)、前記保存された電話番号から短縮番号を抽出して短縮番号リストを構築する(ステップ102)。
【0033】
図11は、本発明に係るスピード音声ダイアル方法のうち短縮番号検出方法(図9のステップ93)の詳細フローチャートである。
【0034】
図11を参照すれば、前記スピード音声ダイアルモードが設定された場合、ユーザに通話しようとする電話番号の短縮番号を発声することを指示し(ステップ111)、前記指示に従ってユーザが短縮番号を発声すれば、前記発声された短縮番号をコーデックを介して2進デジタルデータであるPCMデータに変換し、さらに前記PCMデータをテキストデータであるフィーチャに変換する(ステップ112)。次いで、前記短縮番号リストおよび前記フィーチャをマッチングさせて前記フィーチャと同じ短縮番号を前記短縮番号リストから検出し(ステップ113)、前記検出された短縮番号をユーザに出力する(ステップ114)。
【0035】
図12は、本発明に係るスピード音声ダイアル方法のうち前記検出された短縮番号の処理方法(図9のステップ94)のフローチャートである。
【0036】
前記検出された短縮番号に対応する番号が存在する場合(ステップ1201)、ステップ1202において、前記検出された短縮番号に対応する番号が一つであれば、前記検出された短縮番号に対応する前記一つの電話番号につなぐ(ステップ1203)。仮に、前記ステップ1202において、前記検出された短縮番号に対応する番号が多数である場合には、TTSエンジンを介して音声により多数である旨を出力し、ユーザが前記多数の番号から一つを選択したならば(ステップ1204)、前記短縮番号を前記一つの電話番号につなぐ(ステップ1203)。これに対し、前記ステップ1201において、短縮番号に対応する番号が存在しない場合、ユーザに短縮番号を再発声することを要請する(ステップ1205)。前記要請に応じてユーザが短縮番号を再発生すれば、前記短縮番号データベースの前記短縮番号リストから前記ユーザが再発声した短縮番号を検出し(ステップ1206)、ステップ1207において、ユーザが再発声された短縮番号に対応する番号が存在すれば、前記検出された短縮番号に対応する電話番号につなぐ(ステップ1203)。これに対し、ステップ1207において、ユーザが再発声した短縮番号に対応する番号が存在しない場合、前記短縮番号リストから前記短縮番号に類似した短縮番号を検索する(ステップ1208)。ステップ1209において、前記類似した短縮番号が存在する場合、前記類似した短縮番号をユーザに出力し(ステップ1210)、前記出力された類似した短縮番号のうちユーザが通話しようとする前記類似した短縮番号を選択した後(ステップ1211)、前記選択された短縮番号に対応する電話番号につなぐ(ステップ1203)。これに対し、ステップ1209において、前記類似した短縮番号が存在しない場合、認識失敗である旨をユーザに出力する(ステップ1212)。
【0037】
すなわち、該当短縮番号に多数の登録者が存在すれば、TTSエンジンは、該当番号に保存された登録者のリストを聞かせることにより、ユーザをして希望する番号の選択を可能にする。フィードバックされた結果が本人の発声と一致しない場合、最初に間違った場合にはさらに発声させ、2回目に間違った場合には類似番号の存否を確かめて類似番号のリストをフィードバックし、類似番号さえない場合には現在の発声環境が認識に適していないと判断して認識失敗である旨を知らせる。
【0038】
将来、任意の電話番号に直接的にマッチング可能なほどに認識率が上がれば、前記短縮番号データベースが不要になる可能性もある。このように、短縮番号データベースを備えないスピード音声ダイアル装置は、ユーザからスピード音声ダイアルモード設定のコマンドを受け取った場合、スピード音声ダイアルモードを設定するスピード音声ダイアルモード設定部、前記スピード音声ダイアルモード設定部において前記スピード音声ダイアルモードが設定された場合、ユーザが短縮番号を発声すれば、前記電話番号データベースの電話番号リストから前記ユーザが発声した短縮番号を検出する短縮番号検出部および前記短縮番号検出部において検出された短縮番号に対応する電話番号につなぐ電話番号連結部を備える。さらに、短縮番号データベースを備えないスピード音声ダイアル方法は、ユーザからスピード音声ダイアルモード設定のコマンドを受け取った場合、スピード音声ダイアルモードを設定する段階、前記スピード音声ダイアルモードが設定された場合、ユーザが短縮番号を発声すれば、前記電話番号データベースの電話番号リストから前記ユーザが発声した短縮番号を検出する段階および前記検出された短縮番号に対応する電話番号につなぐ段階を含む。
【0039】
一方、前述した本発明の実施形態はコンピュータにて実行可能なプログラムにて作成可能であり、コンピュータにて読取り可能な記録媒体を用いて前記プログラムを動作させる汎用のデジタルコンピュータにより具現できる。
【0040】
前記コンピュータにて読取り可能な記録媒体は、マグネチック貯蔵媒体(例えば、ROM,フロッピー(登録商標)ディスク、ハードディスク等)、光学的な判読媒体(例えば、CD−ROM、DVDなど)およびキャリアウェーブ(例えば、インターネットを介した伝送)などの貯蔵媒体を含む。
【0041】
以上、本発明についてその好適な実施形態を中心に述べてきた。本発明が属する技術分野における当業者であれば、本発明が本発明の本質的な特性から逸脱しない範囲であれば、変形された形として具現可能であるということが理解できるであろう。よって、開示された実施形態は限定的な観点ではなく、説明的な観点から考慮さるべきである。本発明の範囲は前述した説明ではなく、特許請求の範囲上に現れており、それと同等な範囲内にあるあらゆる違いは本発明に含まれるものとして解釈されるべきである。
【0042】
【発明の効果】
上述したように、本発明によれば、電話帳に保存されている電話番号の下4桁番号のみを発声することにより、7桁以上よりなる電話番号への連結をより良好な認識性能および処理速度にて行うことができ、既に電話帳に保存された番号を対象とするために組み合わせ可能な数字も電話帳に登録されたリストの数と同じであり、認識速度および性能を高めることができる。さらに、ユーザが頻繁に使う番号は電話帳にあらかじめ登録しておく点に着目し、電話帳に入力された電話番号に対しては7桁以上の電話番号を全て発声しなくても、下4桁番号のみを発声すれば通話できるようにすることにより、認識率、認識速度および電話連結の速度など、全体のシステムの性能を高めることができる。特に、ユーザにとっては、4桁の番号のみを発声しても簡単に通話可能になるが、雑音など何らかの要因により音声認識の結果が間違ったとしても、4桁を発声することが全く煩わしくないため、商品化への実効性およびユーザの使い勝手を大幅に高めることができる。
【図面の簡単な説明】
【図1】従来の音声ダイアル装置の構成図である。
【図2】従来の音声ダイアル装置の数字フィーチャベクトルの構造図である。
【図3】従来のスピードダイアルを行う方法の構造図である。
【図4】本発明が採用された改良音声ダイアル装置の構成図である。
【図5】本発明に係るスピード音声ダイアル装置の構成図である。
【図6】本発明のうち短縮番号データベースの詳細構成図である。
【図7】本発明のうち短縮番号検出部の詳細構成図である。
【図8】本発明のうちPCMフィーチャ変換部の詳細構成図である。
【図9】本発明に係るスピード音声ダイアル方法のフローチャートである。
【図10】本発明のうち短縮番号リスト構築方法の詳細フローチャートである。
【図11】本発明のうち短縮番号検出方法の詳細フローチャートである。
【図12】本発明のうち検出された短縮番号の処理方法のフローチャートである。
【符号の説明】
401 スピード音声ダイアルモード設定部
402 音声入力部
403 フィーチャ変換部
404 電話番号データベース
405 名前リスト構築部
406 名前マッチング部
407 電話番号リスト構築部
408 短縮番号マッチング部
409 電話番号マッチング部
410 テキスト・ツー・スピーチ(TTS)エンジン
411 電話番号確認部
412 電話番号選択部
413 電話番号連結部
414 取消し部
51 スピード音声ダイアルモード設定部
52 短縮番号データベース
53 短縮番号検出部
54 電話番号連結部
61 電話番号データベース
62 短縮番号リスト構築部
71 発声指示部
72 PCMフィーチャ変換部
73 マッチング検出部
74 短縮番号出力部
81 PCMデータ変換部
82 フィーチャ変換部
Claims (25)
- ユーザからスピード音声ダイアルモード設定のコマンドを受け取った場合、スピード音声ダイアルモードを設定するスピード音声ダイアルモード設定部と、
ユーザが使う電話番号を保存して管理し、前記電話番号から短縮番号を抽出して短縮番号リストを構築する短縮番号データベースと、
前記スピード音声ダイアルモード設定部において前記スピード音声ダイアルモードが設定された場合、ユーザが短縮番号を発声すれば、前記短縮番号データベースの前記短縮番号リストから前記ユーザが発声した短縮番号を検出する短縮番号検出部と、
前記短縮番号検出部において検出された短縮番号に対応する電話番号につなぐ電話番号連結部と
を備えることを特徴とするスピード音声ダイアル装置。 - 前記短縮番号は、任意の電話番号の桁数が4以上である場合には前記電話番号から下4桁番号を抽出して生成され、任意の電話番号の桁数が4未満である場合には前記電話番号が短縮番号となることを特徴とする請求項1に記載のスピード音声ダイアル装置。
- 前記短縮番号データベースは、
ユーザが保存した電話番号およびユーザが最近かけた電話番号を保存して管理する電話番号データベースと、
前記電話番号データベースに保存された前記電話番号から短縮番号を抽出して短縮番号リストを構築する短縮番号リスト構築部と
を備えることを特徴とする請求項1に記載のスピード音声ダイアル装置。 - 前記短縮番号検出部は、
前記スピード音声ダイアルモード設定部において前記スピード音声ダイアルモードが設定された場合、ユーザに通話しようとする電話番号の短縮番号を発声することを指示する発声指示部と、
前記発声指示部の前記指示に従ってユーザが短縮番号を発声すれば、前記発声された短縮番号をパルス符号変調データに変換し、前記パルス符号変調データをフィーチャに変換するパルス符号変調フィーチャ変換部と、
前記短縮番号データベースの前記短縮番号リストおよび前記パルス符号変調フィーチャ変換部の前記フィーチャをマッチングさせて前記フィーチャと同じ短縮番号を前記短縮番号リストから検出するマッチング検出部と、
前記マッチング検出部において検出された短縮番号をユーザに出力する短縮番号出力部と
を備えることを特徴とする請求項1に記載のスピード音声ダイアル装置。 - 前記パルス符号変調フィーチャ変換部は、
前記発声指示部の前記指示に従ってユーザが短縮番号を発声すれば、前記発声された短縮番号をコーデックを介して2進デジタルデータであるパルス符号変調データに変換するパルス符号変調データ変換部と、
前記パルス符号変調データ変換部の前記パルス符号変調データをテキストデータであるフィーチャに変換するフィーチャ変換部と
を備えることを特徴とする請求項4に記載のスピード音声ダイアル装置。 - 前記電話番号連結部は、前記短縮番号検出部において検出された前記短縮番号に対応する番号が一つである場合、前記検出された短縮番号に対応する前記一つの電話番号につなぐことを特徴とする請求項1に記載のスピード音声ダイアル装置。
- 前記電話番号連結部は、前記短縮番号検出部において検出された短縮番号に対応する番号が多数である場合、ユーザが前記多数の番号から一つを選択すれば、前記短縮番号を前記選択された一つの電話番号につなぐことを特徴とする請求項1に記載のスピード音声ダイアル装置。
- 前記短縮番号検出部は、前記短縮番号検出部において検出された前記短縮番号に対応する番号が存在しない場合、ユーザが短縮番号を再発声すれば、前記短縮番号データベースの前記短縮番号リストから前記ユーザが再発声した短縮番号を検出することを特徴とする請求項1に記載のスピード音声ダイアル装置。
- 前記短縮番号検出部は、
前記短縮番号検出部において検出された前記ユーザが再発声した短縮番号に対応する番号が存在しない場合、前記短縮番号リストから前記短縮番号に類似した短縮番号を検索する類似番号検索部と、
前記類似番号検索部において検索された前記類似した短縮番号が存在する場合、前記短縮番号に類似した短縮番号をユーザに出力する類似番号出力部と、
前記類似番号出力部から出力された前記類似した短縮番号のうちユーザが通話しようとする前記類似した短縮番号を選択する類似番号選択部と
を備えることを特徴とする請求項1に記載のスピード音声ダイアル装置。 - 前記類似番号出力部は、前記類似番号検索部において検索された前記類似した短縮番号が存在しない場合、認識失敗である旨をユーザに出力することを特徴とする請求項9に記載のスピード音声ダイアル装置。
- (a)ユーザからスピード音声ダイアルモード設定のコマンドを受け取った場合、スピード音声ダイアルモードを設定する段階と、
(b)ユーザが使う電話番号を保存して管理し、前記電話番号から短縮番号を抽出して短縮番号リストを構築する段階と、
(c)前記スピード音声ダイアルモードが設定された場合、ユーザが短縮番号を発声すれば、前記短縮番号リストから前記ユーザが発声した短縮番号を検出する段階と、
(d)前記検出された短縮番号に対応する電話番号につなぐ段階と
を含むことを特徴とするスピード音声ダイアル方法。 - 前記短縮番号は、任意の電話番号の桁数が4以上である場合には前記電話番号から下4桁番号を抽出して生成され、任意の電話番号の桁数が4未満である場合には前記電話番号が短縮番号となることを特徴とする請求項11に記載のスピード音声ダイアル方法。
- 前記(b)段階は、
(b1)ユーザが保存した電話番号およびユーザが最近かけた電話番号を保存して管理する段階と、
(b2)前記保存された電話番号から短縮番号を抽出して短縮番号リストを構築する段階と
を含むことを特徴とする請求項11に記載のスピード音声ダイアル方法。 - 前記(c)段階は、
(c1)前記スピード音声ダイアルモードが設定された場合、ユーザに通話しようとする電話番号の短縮番号を発声することを指示する段階と、
(c2)前記指示に従ってユーザが短縮番号を発声すれば、前記発声された短縮番号をパルス符号変調データに変換し、前記パルス符号変調データをフィーチャに変換する段階と、
(c3)前記短縮番号リストおよび前記フィーチャをマッチングさせて前記フィーチャと同じ短縮番号を前記短縮番号リストから検出する段階と、
(c4)前記検出された短縮番号をユーザに出力する段階と
を含むことを特徴とする請求項11に記載のスピード音声ダイアル方法。 - 前記(c2)段階は、
(c21)前記指示に従ってユーザが短縮番号を発声すれば、前記発声された短縮番号をコーデックを介して2進デジタルデータであるパルス符号変調データに変換する段階と、
(c22)前記パルス符号変調データをテキストデータであるフィーチャに変換する段階と
を含むことを特徴とする請求項14に記載のスピード音声ダイアル方法。 - 前記(d)段階は、前記検出された短縮番号に対応する番号が一つである場合、前記検出された短縮番号に対応する前記一つの電話番号につなぐことを特徴とする請求項11に記載のスピード音声ダイアル方法。
- 前記(d)段階は、前記検出された短縮番号に対応する番号が多数である場合、ユーザが前記多数の番号から一つを選択すれば、前記短縮番号を前記選択された一つの電話番号につなぐことを特徴とする請求項11に記載のスピード音声ダイアル方法。
- 前記(d)段階は、
(d1)前記検出された短縮番号に対応する番号が存在しない場合、ユーザが短縮番号を再発声すれば、前記短縮番号リストから前記ユーザが再発声した短縮番号を検出する段階と、
(d2)前記検出された短縮番号に対応する電話番号につなぐ段階と
を含むことを特徴とする請求項11に記載のスピード音声ダイアル方法。 - 前記(d)段階は、
(d1)ユーザが再発声した短縮番号に対応する番号が存在しない場合、前記短縮番号リストから前記短縮番号に類似した短縮番号を検索する段階と、
(d2)前記検索の結果、前記類似した短縮番号が存在する場合、前記類似した短縮番号をユーザに出力する段階と、
(d3)前記出力された類似した短縮番号のうちユーザが通話しようとする前記類似した短縮番号を選択する段階と、
(d4)前記選択された短縮番号に対応する電話番号につなぐ段階と
を含むことを特徴とする請求項11に記載のスピード音声ダイアル方法。 - 前記(d)段階は、
(d1)ユーザが再発声した短縮番号に対応する番号が存在しない場合、前記短縮番号リストから前記短縮番号に類似した短縮番号を検索する段階と、
(d2)前記検索の結果、前記類似した短縮番号が存在しない場合、認識失敗である旨をユーザに出力する段階と
を含むことを特徴とする請求項11に記載のスピード音声ダイアル方法。 - ユーザからスピード音声ダイアルモード設定のコマンドを受け取った場合、スピード音声ダイアルモードを設定するスピード音声ダイアルモード設定部と、
前記スピード音声ダイアルモード設定部において前記スピード音声ダイアルモードが設定された場合、ユーザが短縮番号を発声すれば、前記電話番号データベースの電話番号リストから前記ユーザが発声した短縮番号を検出する短縮番号検出部と、
前記短縮番号検出部において検出された短縮番号に対応する電話番号につなぐ電話番号連結部と
を備えることを特徴とする短縮番号データベースを備えないスピード音声ダイアル装置。 - 前記短縮番号は、任意の電話番号の桁数が4以上である場合には前記電話番号から下4桁番号を抽出して生成され、任意の電話番号の桁数が4未満である場合には前記電話番号が短縮番号となることを特徴とする請求項21に記載の短縮番号データベースを備えないスピード音声ダイアル装置。
- ユーザからスピード音声ダイアルモード設定のコマンドを受け取った場合、スピード音声ダイアルモードを設定する段階と、
前記スピード音声ダイアルモードが設定された場合、ユーザが短縮番号を発声すれば、電話番号データベースの電話番号リストから前記ユーザが発声した短縮番号を検出する段階と、
前記検出された短縮番号に対応する電話番号につなぐ段階と
を含むことを特徴とする短縮番号データベースを備えないスピード音声ダイアル方法。 - 前記短縮番号は、任意の電話番号の桁数が4以上である場合には前記電話番号から下4桁番号を抽出して生成され、任意の電話番号の桁数が4未満である場合には前記電話番号が短縮番号となることを特徴とする請求項23に記載の短縮番号データベースを備えないスピード音声ダイアル方法。
- 請求項11ないし請求項20、あるいは、請求項23または請求項24のうち何れか1項に記載の方法をコンピュータにて実行するためのプログラムを記録したコンピュータにて読取り可能な記録媒体。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2002-0029119A KR100433550B1 (ko) | 2002-05-25 | 2002-05-25 | 스피드 음성 다이얼 장치와 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004007634A true JP2004007634A (ja) | 2004-01-08 |
Family
ID=29546372
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003125831A Pending JP2004007634A (ja) | 2002-05-25 | 2003-04-30 | スピード音声ダイアル装置および方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US7477728B2 (ja) |
JP (1) | JP2004007634A (ja) |
KR (1) | KR100433550B1 (ja) |
CN (1) | CN1231038C (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7383268B2 (en) * | 2003-07-31 | 2008-06-03 | Itxc Ip Holdings S.A.R.L. | Indexing technique for an efficient best-pattern matched lookup |
GB0327416D0 (en) * | 2003-11-26 | 2003-12-31 | Ibm | Directory dialler name recognition |
US8789107B2 (en) * | 2008-01-09 | 2014-07-22 | Verizon Patent And Licensing Inc. | Intelligent automatic digital video recorder |
TWI360109B (en) * | 2008-02-05 | 2012-03-11 | Htc Corp | Method for setting voice tag |
US7409047B1 (en) * | 2008-02-24 | 2008-08-05 | International Business Machines Corporation | Personalized telephone directory and calling system |
CN104092829A (zh) * | 2014-07-21 | 2014-10-08 | 苏州工业园区服务外包职业学院 | 基于语音识别的语音呼叫方法和接入网关 |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3885683T2 (de) * | 1987-09-11 | 1994-03-10 | Toshiba Kawasaki Kk | Telefonapparat. |
US5204894A (en) * | 1990-11-09 | 1993-04-20 | Bell Atlantic Network Services, Inc. | Personal electronic directory |
JPH04192852A (ja) | 1990-11-27 | 1992-07-13 | Murata Mach Ltd | ダイヤル番号発信方法 |
JPH0541249A (ja) | 1991-08-01 | 1993-02-19 | Toyo Takasago Kandenchi Kk | リチウム二次電池及びそれに使用する負極構造体へのリチウムイオンの注入方法 |
JP3141301B2 (ja) | 1992-02-28 | 2001-03-05 | ソニー株式会社 | 電話機 |
JPH0730629A (ja) * | 1993-07-07 | 1995-01-31 | Yuhshin Co Ltd | 音声ダイヤリング装置 |
US5568546A (en) * | 1994-10-31 | 1996-10-22 | Lucent Technologies, Inc. | Method and apparatus for dynamic abbreviated dialing assignment |
JPH08314495A (ja) | 1995-05-22 | 1996-11-29 | Sanyo Electric Co Ltd | 数字列音声認識装置及びビデオレコーダシステム |
US5912949A (en) * | 1996-11-05 | 1999-06-15 | Northern Telecom Limited | Voice-dialing system using both spoken names and initials in recognition |
US6208713B1 (en) * | 1996-12-05 | 2001-03-27 | Nortel Networks Limited | Method and apparatus for locating a desired record in a plurality of records in an input recognizing telephone directory |
US5859896A (en) * | 1997-03-05 | 1999-01-12 | Rosen; Howard B. | Telephone line automatic prefix dialer |
US6320943B1 (en) * | 1997-06-12 | 2001-11-20 | Legerity, Inc. | Electronic directory system and method |
KR100232873B1 (ko) * | 1997-07-21 | 1999-12-01 | 윤종용 | 음성인식처리용 메모리를 가지는 휴대용 전화기 |
US6098040A (en) * | 1997-11-07 | 2000-08-01 | Nortel Networks Corporation | Method and apparatus for providing an improved feature set in speech recognition by performing noise cancellation and background masking |
KR19990060315A (ko) * | 1997-12-31 | 1999-07-26 | 윤종용 | 전화번호 음성 입력에 의한 음성다이얼링 방법 |
KR100278020B1 (ko) * | 1998-04-14 | 2001-01-15 | 윤종용 | 휴대폰에서 저장된 전화번호를 검색하여 다이얼링하는 방법 |
JP2000032108A (ja) | 1998-07-10 | 2000-01-28 | Brother Ind Ltd | 通信装置 |
US6608895B1 (en) * | 1998-11-04 | 2003-08-19 | Tadiran Telecom Business Systems, Ltd. | Method of anticipatory dialing |
KR20000073412A (ko) * | 1999-05-10 | 2000-12-05 | 유명호 | 휴대용단말기에서의 음성자동다이얼방법 |
US6442270B1 (en) * | 1999-11-24 | 2002-08-27 | Qualcomm, Incorporated | Telephone number lookup with reduced scrolling |
KR20000012484A (ko) * | 1999-12-07 | 2000-03-06 | 김종진 | 음성인식 기능을 갖춘 핸드폰 |
US20020003867A1 (en) * | 2000-04-20 | 2002-01-10 | Peter Rothschild | Systems and methods for connecting customers to merchants over a voice communication network |
US6980642B1 (en) * | 2000-10-31 | 2005-12-27 | Sprint Spectrum L.P. | Method and apparatus for abbreviated dialing in a subscriber terminal |
US6697455B2 (en) * | 2001-02-27 | 2004-02-24 | Gary F. Krofchalk | Voice activated dialing apparatus |
US7103168B2 (en) * | 2002-04-16 | 2006-09-05 | Bellsouth Intellectual Property Corporation | Methods and systems for implementing personal dialing plans |
-
2002
- 2002-05-25 KR KR10-2002-0029119A patent/KR100433550B1/ko not_active IP Right Cessation
-
2003
- 2003-03-28 CN CNB031085032A patent/CN1231038C/zh not_active Expired - Fee Related
- 2003-04-04 US US10/406,608 patent/US7477728B2/en not_active Expired - Fee Related
- 2003-04-30 JP JP2003125831A patent/JP2004007634A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
CN1459967A (zh) | 2003-12-03 |
KR100433550B1 (ko) | 2004-05-31 |
CN1231038C (zh) | 2005-12-07 |
KR20030091241A (ko) | 2003-12-03 |
US7477728B2 (en) | 2009-01-13 |
US20040018856A1 (en) | 2004-01-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5613335B2 (ja) | 音声認識システム、認識辞書登録システム及び音響モデル識別子系列生成装置 | |
JP4542974B2 (ja) | 音声認識装置、音声認識方法および音声認識プログラム | |
JP4481972B2 (ja) | 音声翻訳装置、音声翻訳方法及び音声翻訳プログラム | |
US7783475B2 (en) | Menu-based, speech actuated system with speak-ahead capability | |
US6687673B2 (en) | Speech recognition system | |
US5752230A (en) | Method and apparatus for identifying names with a speech recognition program | |
US8374862B2 (en) | Method, software and device for uniquely identifying a desired contact in a contacts database based on a single utterance | |
JP5471106B2 (ja) | 音声翻訳システム、辞書サーバ装置、およびプログラム | |
WO2001099096A1 (fr) | Systeme de communication a entree vocale, terminal d'utilisateur et systeme central | |
JPH10215319A (ja) | 音声によるダイヤル方法および装置 | |
JP2003022089A (ja) | オーディオ専用インターフェースにおけるボイス・スペリング | |
JPH10503033A (ja) | 新ワードのモデル化に基づく音声認識方法及びその装置 | |
JPH10198396A (ja) | ユーザが定義したフレーズの話者に依存しない認識方法及びシステム | |
US7269563B2 (en) | String matching of locally stored information for voice dialing on a cellular telephone | |
TW200304638A (en) | Network-accessible speaker-dependent voice models of multiple persons | |
JP2004503183A (ja) | 電気通信セッションの進行中に電話番号を自動的に記録する方法と装置 | |
JP2004007634A (ja) | スピード音声ダイアル装置および方法 | |
US20050049858A1 (en) | Methods and systems for improving alphabetic speech recognition accuracy | |
JP2006058390A (ja) | 音声認識装置 | |
US20070129945A1 (en) | Voice quality control for high quality speech reconstruction | |
US7437294B1 (en) | Methods for selecting acoustic model for use in a voice command platform | |
KR20010020871A (ko) | 개선된 어구 저장, 사용, 변환, 전달 및 인식을 갖춘 음성제어된 디바이스를 위한 방법 및 장치 | |
CA2597826C (en) | Method, software and device for uniquely identifying a desired contact in a contacts database based on a single utterance | |
JP2010276869A (ja) | 自動翻訳対応電話機および自動翻訳対応電話システム | |
JP3278595B2 (ja) | 携帯電話 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20050725 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060124 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060419 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20060516 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060817 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20060915 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20061020 |