JP2004007634A - スピード音声ダイアル装置および方法 - Google Patents

スピード音声ダイアル装置および方法 Download PDF

Info

Publication number
JP2004007634A
JP2004007634A JP2003125831A JP2003125831A JP2004007634A JP 2004007634 A JP2004007634 A JP 2004007634A JP 2003125831 A JP2003125831 A JP 2003125831A JP 2003125831 A JP2003125831 A JP 2003125831A JP 2004007634 A JP2004007634 A JP 2004007634A
Authority
JP
Japan
Prior art keywords
abbreviated
user
abbreviated number
telephone
speed voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003125831A
Other languages
English (en)
Inventor
Hee-Seon Park
朴 喜仙
Chang-Dae Bang
方 昶大
Ho-Chul Shin
申 昊▲チュル▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2004007634A publication Critical patent/JP2004007634A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/271Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)

Abstract

【課題】電話番号の数字列を全て発声せずに、電話番号の一部のみを発声することにより、それに対応する電話番号を探し出して電話連結を可能にする。
【解決手段】スピード音声ダイアルモード設定部51は、ユーザからスピード音声ダイアルモード設定のコマンドを受け取った場合、スピード音声ダイアルモードを設定し、短縮番号データベース52は、ユーザが使う電話番号を保存して管理し、前記電話番号から短縮番号を抽出して短縮番号リストを構築し、短縮番号検出部53は、前記スピード音声ダイアルモード設定部において前記スピード音声ダイアルモードが設定された場合、ユーザが短縮番号を発声すれば、前記短縮番号データベースの前記短縮番号リストから前記ユーザが発声した短縮番号を検出し、電話番号連結部54は、前記短縮番号検出部において検出された短縮番号に対応する電話番号につなぐ。
【選択図】 図5

Description

【0001】
【発明が属する技術分野】
本発明は音声を用いて迅速で且つ便利にダイアルを行う装置および方法に係り、特に、話者独立数字音認識エンジンを数字ダイアルに適用するに当たり、ユーザの使い勝手を高めるとともに、認識エンジンの効率を極大化させる装置および方法に関する。
【0002】
【従来の技術】
従来の音声ダイアルは、音声登録された名前を発声したり(話者従属音声認識)、電話帳に入力された人の名前を発声したり(話者独立音声認識)、あるいは電話番号を全て発声して電話をかける方法である。最近、携帯電話などにおける電話連結をさらに便利にするために、音声登録過程を経なければならない話者従属音声認識機に留まらず、音声登録無しでも認識可能な話者独立音声認識エンジンが適用されている。
【0003】
従来の音声認識数字ダイアルの場合、電話番号の長さによって認識率の違いが大きく、発声の最中に誤認識が起こって間違った数字が現れる場合、該当数字のみ修正されるといった不都合があった。電話番号のうち中間の一つが間違って該当数字のみを入れ直すには、ユーザが液晶ディスプレイを見つめる過程と、適当なキーを押してカーソルを間違った個所まで移したり音声により該当数字を呼び出す過程とを経なければならない。他の方法として、電話番号の間違い数を問わずに、全ての電話番号を再び発声する方法がある。2つの方法ともにユーザに大きな不都合を与える。
【0004】
音声認識機にとっては、どこがいかほどに間違ったかが分からず、たとえ再び発声するとしても、電話番号の全てを正しく発声する確率は以前と同じである。さらに、ユーザが記憶している電話番号の数に限界があるため、7桁以上の電話番号を音声によりダイアルするには難点があり、頻繁に使う番号の場合にはさらに煩わしい。なお且つ、音声認識エンジンにより組み合わせ可能な数字列の数が極めて多く、認識の速度および認識の性能に低下を来たす。
【0005】
従来、電話番号を音声によりダイアルするに当たり、7桁以上よりなる電話番号の場合、認識エンジンがこれをよく認識できず、発声者にとっても長い電話番号をいちいち発声しなければならないという不具合があった。特に、認識の最中に雑音が入るなどして認識の結果が間違った場合、既に発声した番号を再び発声しなければならないなど、実効性に劣っていた。
【0006】
さらに、従来の音声認識ダイアルの場合、電話帳に登録された者の電話番号は記憶しているものの、その者の登録名を記憶していない場合、音声認識名前ダイアル機能を使うことができない。
【0007】
【発明が解決しようとする課題】
本発明が解決しようとする技術的な課題は、ユーザが通話しようとする電話番号の数字列を全て発声することなく、電話番号の一部(例えば、下4桁番号)のみを発声することにより、それに対応する電話番号を探し出して電話連結を可能にするためのスピード音声ダイアル装置および方法を提供するところにある。
【0008】
【課題を解決するための手段】
前記問題点を解決するために、本発明は、ユーザからスピード音声ダイアルモード設定のコマンドを受け取った場合、スピード音声ダイアルモードを設定するスピード音声ダイアルモード設定部、ユーザが使う電話番号を保存して管理し、前記電話番号から短縮番号を抽出して短縮番号リストを構築する短縮番号データベース、前記スピード音声ダイアルモード設定部において前記スピード音声ダイアルモードが設定された場合、ユーザが短縮番号を発声すれば、前記短縮番号データベースの前記短縮番号リストから前記ユーザが発声した宿約番号を検出する短縮番号検出部および前記短縮番号検出部において検出された短縮番号に対応する電話番号につなぐ電話番号連結部を備える装置を提供する。
【0009】
【発明の実施の形態】
以下、添付した図面に基づき、本発明の好適な実施形態について詳細に説明する。
【0010】
図1は、従来の音声ダイアル装置の構成図である。
【0011】
図1を参照すれば、音声入力部11は、ユーザが音声を入力すれば、それに応じて音声ダイアルモードを設定する。フィーチャ変換部12は、前記音声入力部11から入力したユーザの音声をコーデックを介してフィーチャベクトルに変換する。名前マッチング部15は、名前モードの場合、このようにして変換されたフィーチャベクトルおよび電話帳に書き込まれたテキストに基づき該当テキストを構成するモデルシーケンスとのパターンマッチングを行う。ここで、前記モデルシーケンスは、名前テキストデータベース14に保存されて管理され、前記名前テキストデータベース14は、電話番号データベース13から名前部分のみを抽出して構築される。電話番号選択部16は、前記名前マッチング部15において認識された名前に対応する電話番号を選択し、連結部19は、前記選択された電話番号にダイアルする。電話番号マッチング部17は、数字モードの場合、一定の文法によって再構成された数字音に関するモデルおよび入力されたフィーチャベクトル間のパターンマッチングを行う。電話番号確認部18は、前記電話番号マッチング部17から出力された電話番号を確かめる。連結部19は、前記確かめられた電話番号にダイアルする。
【0012】
前記従来の音声ダイアル装置の動作は、下記の通りに行われる。
【0013】
まず、発声者は、電話連結を希望する者の名前や電話番号を発声する。このようにして発声された音声はコーデック装置を介してパルス符号変調(以下、PCM)データに変換され、このPCMデータは音声認識により認識可能なフィーチャベクトルに変換される。ターゲットプラットフォーム(携帯電話など)においては、設定されたモードに応じて、名前モードであれば電話帳から名前リストを得、数字モードであれば電話帳から電話番号リストを得る。前記名前モードの場合、入力された前記フィーチャベクトルおよび既に保存されているモデルを名前リストに合わせて再構成したモデル列間のパターンマッチングを行う。次いで、前記電話帳から音声認識の結果として得られた電話番号にダイアルする。前記数字モードの場合には、入力された前記フィーチャベクトルおよびN個の単独数字音が数字の数だけ出るように構成してパターンマッチングを行う。次いで、前記名前モードと同様に、認識の結果として得られた電話番号にダイアルする。
【0014】
図2は、従来の音声ダイアル装置の数字フィーチャベクトルの構造図である。
【0015】
図3は、従来のスピードダイアルを行う方法の構造図である。
【0016】
従来のスピードダイアルは、ボタンを押すことにより電話連結を行う方法であって、2種類に分けられる。一つの方法は、電話番号データベースに登録された番号のうち下4桁番号に当たるボタンを長く押すことによりダイアルする方法である。もう一つの方法は、電話番号データベースに登録された番号の番地数に当たるボタンを長く押すことによりダイアルする方法である。
【0017】
図4は、本発明に係るスピード音声ダイアル装置が取り付けられた改良音声ダイアル装置の構成図である。
【0018】
スピード音声ダイアルモード設定部401は、ユーザの音声または音声スピードボタンによる入力により音声スピードダイアルモードを設定する。電話番号リスト構築部407は、電話番号データベース404から下4桁番号を得てこの下4桁番号よりなるリストを認識対象語彙として選定し、ネットワークを構成する。フィーチャ変換部403は、入力された音声を認識に用いるためにフィーチャベクトルに変え、短縮番号マッチング部408は、このように構成されたネットワーク下で形成されたモデルパターンおよび入力された前記フィーチャベクトルをマッチングする。電話番号確認部411は、認識の結果として得られた下4桁番号に対応する電話番号をユーザに確認させ、電話番号選択部412は、前記電話番号確認部411において確認された電話番号が多数である場合、前記多数の電話番号のうち一つを選択する。そして、電話番号連結部413は、前記確認または選択された電話番号にダイアルする。取消し部414は、前記電話番号確認部411における電話番号がユーザが通話しようとする電話番号ではない場合、前記電話番号を取り消す。名前モードにおける名前マッチング部406および名前リスト構築部405は、前記図1における名前マッチング部15および名前テキストデータベース14にそれぞれ対応する。テキスト・ツー・スピーチ(TTS)エンジン410は、テキスト形式の文書が入ればそれを自動的に音声に変える。本発明に係る装置はユーザの音声を入力されて処理するものであるため、ユーザの便宜を考慮に入れて出力も音声にする。
【0019】
図5は、本発明に係るスピード音声ダイアル装置の構成図である。
【0020】
図5を参照すれば、本発明に係るスピード音声ダイアル装置は、スピード音声ダイアルモード設定部51、短縮番号データベース52、短縮番号検出部53および電話番号連結部54を備えてなる。前記スピード音声ダイアルモード設定部51は、ユーザからスピード音声ダイアルモード設定のコマンドを受け取った場合、スピード音声ダイアルモードを設定する。すなわち、ユーザは、このスピード音声ダイアルモード設定部51を用いてあらかじめスピード音声ダイアルモードを設定しておいても良く、前記スピード音声ダイアルモードのボタンを用いて音声ダイアルを始めても良い。短縮番号データベース52は、ユーザが使う電話番号を保存して管理し、前記電話番号から短縮番号を抽出して短縮番号リストを構築する。既にスピード音声ダイアルモードが設定されているため、短縮番号データベース52は、電話番号データベースから下4桁番号を抽出してリストを作った後にネットワークを構成することにより、短縮番号データベースを構築する。前記短縮番号検出部53は、前記スピード音声ダイアルモード設定部51において前記スピード音声ダイアルモードが設定された場合、ユーザが短縮番号を発声すれば、前記短縮番号データベース52の前記短縮番号リストから前記ユーザが発声した短縮番号を検出する。前記スピード音声ダイアルモード設定部51における設定によりスピード音声ダイアルモードが設定されれば、入力されたユーザ音声はコーデックを介してPCMデータに変換され、前記変換されたPCMデータは音声認識に用いられるためにフィーチャに変えられる。前記フィーチャおよび短縮番号データベース52に保存された短縮番号をマッチングすることにより、同じものを探し出す認識過程が行われる。前記電話番号連結部54は、前記短縮番号検出部53において検出された短縮番号に対応する電話番号につなぐ。認識の結果として得られた短縮番号は、ユーザによる確認を通じてユーザにより選択された電話番号につながる。前記短縮番号は、任意の電話番号の桁数が4以上である場合には前記電話番号から下4桁番号を抽出して生成され、任意の電話番号の桁数が4未満である場合には前記電話番号が短縮番号となる。ここで、桁数が4未満である任意の電話番号は、112,119などの緊急電話番号を意味する。但し、今後、電話番号の桁数のフォーマットが変わる場合、ユーザの便宜のために短縮番号の長さも変わる。
【0021】
図6は、図5の短縮番号データベース52の詳細構成図である。
【0022】
前記短縮番号データベース52は、電話番号データベース61および短縮番号リスト構築部62を備えてなる。前記電話番号データベース61は、ユーザが保存した電話番号およびユーザが最近かけた電話番号を保存して管理する。したがって、過去にかけた電話番号の場合、ユーザが保存をしなかったならば、前記電話番号データベースに保存されない。一般に、ユーザが最近かけた電話番号は最近通話リストとして表示される。前記短縮番号リスト構築部62は、前記電話番号データベース61に保存された前記電話番号から短縮番号を抽出して短縮番号リストを構築する。ユーザが既にスピード音声ダイアルモードを設定した場合やボタンを押してスピード音声ダイアルモードを設定した場合には、スピード音声ダイアルモードが始まると同時に、スピード音声ダイアルモード情報が前記電話番号データベース61へ伝わり、前記短縮番号リスト構築部62が前記電話番号データベース61から下4桁数を得て認識の対象を作る。
【0023】
図7は、図5の短縮番号検出部53の詳細構成図である。
【0024】
前記短縮番号検出部53は、発声指示部71、PCMフィーチャ変換部72、マッチング検出部73および短縮番号出力部74を備えてなる。
【0025】
前記発声指示部71は、前記スピード音声ダイアルモード設定部においてスピード音声ダイアルモードが設定された場合、ユーザに通話しようとする電話番号の短縮番号を発声することを指示する。前記指示は、通常、TTSエンジンを介して音声によりなされる。前記PCMフィーチャ変換部72は、前記発声指示部71の前記指示に従ってユーザが短縮番号を発声すれば、前記発声された短縮番号をPCMデータに変換し、前記PCMデータをフィーチャに変換する。すなわち、前記PCMフィーチャ変換部72は、ユーザが案内メッセージに従って4桁の番号を発声すれば、前記発声された短縮番号をPCMデータに変換し、前記PCMデータをフィーチャに変換する。前記マッチング検出部73は、前記短縮番号データベース52の前記短縮番号リストおよび前記PCMフィーチャ変換部72の前記フィーチャをマッチングさせて前記フィーチャと同じ短縮番号を前記短縮番号リストから検出する。前記短縮番号出力部74は、前記マッチング検出部において検出された短縮番号をユーザに出力する。この時にも同様に、前記出力がTTSエンジンを介して音声によりなされる。前記音声として出力された短縮番号をユーザが聴き、ユーザが発声した短縮番号と同じである旨を認めれば、すなわち、ユーザが“ハイ”と発声すれば、前記電話番号連結部54は、前記短縮番号検出部53において検出された前記短縮番号に対応する番号が一つである場合、前記検出された短縮番号に対応する前記一つの電話番号につなぐ。これに対し、前記電話番号連結部54は、前記短縮番号検出部において検出された短縮番号に対応する番号が多数である場合には、TTSエンジンを介して前記多数の名前を音声として出力し、前記音声として出力された多数の名前をユーザが聴き、ユーザが通話しようとする一つの電話番号を選択した場合、前記短縮番号を前記一つの電話番号につなぐ。
【0026】
仮に、前記短縮番号検出部53において検出された前記短縮番号に対応する番号が存在しない場合、前記短縮番号出力部74は、ユーザに、前記短縮番号に対応する番号が存在しないために再発声することを指示する。ユーザが短縮番号を再発声すれば、前記短縮番号検出部53は、前記短縮番号データベース52の前記短縮番号リストから前記ユーザが再発声した短縮番号を検出する。以下における検出後の電話番号の連結過程は、前述した通りである。但し、違いがあれば、前記短縮番号検出部53において検出された、前記ユーザが再発声した短縮番号に対応する番号が存在しない場合には、ユーザの便宜のために、前記短縮番号に類似した短縮番号につなごうとする試みをする点である。ここで、類似した短縮番号への連結は、類似番号検索部、類似番号出力部および類似番号選択部によりなされる。類似番号検索部は、前記短縮番号リストから前記短縮番号に類似した短縮番号を検索する。類似番号出力部は、前記類似番号検索部において検索された前記類似した短縮番号が存在する場合、前記短縮番号に類似した短縮番号をユーザに出力する。そして、類似番号選択部は、前記類似番号出力部から出力された短縮番号のうちユーザが通話しようとする短縮番号を選択する。ここで、前記類似番号出力部は、前記類似番号検索部において検索された前記類似した短縮番号が存在しない場合、認識失敗である旨をユーザに出力する。前記類似番号選択部において選択された短縮番号は、前記電話番号連結部54によりユーザが通話しようとする電話番号につながる。
【0027】
図8は、図7のPCMフィーチャ変換部72の詳細構成図である。
【0028】
これを参照すれば、本発明に係るPCMフィーチャ変換部72は、PCMデータ変換部81およびフィーチャ変換部82を備えてなる。前記PCMデータ変換部81は、前記発声指示部(図7の71)の前記指示に従ってユーザが短縮番号を発声すれば、前記発声された短縮番号をコーデックを介して2進デジタルデータであるPCMデータに変換する。前記フィーチャ変換部82は、前記PCMデータ変換部81の前記PCMデータをテキストデータであるフィーチャに変換する。これにより、音声およびテキストデータである前記短縮番号間の1対1の比較作業が可能になる。
【0029】
図9は、本発明に係るスピード音声ダイアル方法のフローチャートである。
【0030】
これを参照すれば、ユーザからスピード音声ダイアルモード設定のコマンドを受け取った場合、スピード音声ダイアルモードを設定し(ステップ91)、ユーザが使う電話番号を保存して管理し、且つ、前記電話番号から短縮番号を抽出して短縮番号リストを構築する(ステップ92)。前記スピード音声ダイアルモードが設定された場合、ユーザが短縮番号を発声すれば、前記短縮番号リストから前記ユーザが発声した短縮番号を検出し(ステップ93)、前記検出された短縮番号に対応する電話番号につなぐ(ステップ94)。
【0031】
図10は、本発明に係るスピード音声ダイアル方法のうち短縮番号リスト構築方法(図9のステップ92)の詳細フローチャートである。
【0032】
図10を参照すれば、ユーザが使う電話番号を保存して管理し(ステップ101)、前記保存された電話番号から短縮番号を抽出して短縮番号リストを構築する(ステップ102)。
【0033】
図11は、本発明に係るスピード音声ダイアル方法のうち短縮番号検出方法(図9のステップ93)の詳細フローチャートである。
【0034】
図11を参照すれば、前記スピード音声ダイアルモードが設定された場合、ユーザに通話しようとする電話番号の短縮番号を発声することを指示し(ステップ111)、前記指示に従ってユーザが短縮番号を発声すれば、前記発声された短縮番号をコーデックを介して2進デジタルデータであるPCMデータに変換し、さらに前記PCMデータをテキストデータであるフィーチャに変換する(ステップ112)。次いで、前記短縮番号リストおよび前記フィーチャをマッチングさせて前記フィーチャと同じ短縮番号を前記短縮番号リストから検出し(ステップ113)、前記検出された短縮番号をユーザに出力する(ステップ114)。
【0035】
図12は、本発明に係るスピード音声ダイアル方法のうち前記検出された短縮番号の処理方法(図9のステップ94)のフローチャートである。
【0036】
前記検出された短縮番号に対応する番号が存在する場合(ステップ1201)、ステップ1202において、前記検出された短縮番号に対応する番号が一つであれば、前記検出された短縮番号に対応する前記一つの電話番号につなぐ(ステップ1203)。仮に、前記ステップ1202において、前記検出された短縮番号に対応する番号が多数である場合には、TTSエンジンを介して音声により多数である旨を出力し、ユーザが前記多数の番号から一つを選択したならば(ステップ1204)、前記短縮番号を前記一つの電話番号につなぐ(ステップ1203)。これに対し、前記ステップ1201において、短縮番号に対応する番号が存在しない場合、ユーザに短縮番号を再発声することを要請する(ステップ1205)。前記要請に応じてユーザが短縮番号を再発生すれば、前記短縮番号データベースの前記短縮番号リストから前記ユーザが再発声した短縮番号を検出し(ステップ1206)、ステップ1207において、ユーザが再発声された短縮番号に対応する番号が存在すれば、前記検出された短縮番号に対応する電話番号につなぐ(ステップ1203)。これに対し、ステップ1207において、ユーザが再発声した短縮番号に対応する番号が存在しない場合、前記短縮番号リストから前記短縮番号に類似した短縮番号を検索する(ステップ1208)。ステップ1209において、前記類似した短縮番号が存在する場合、前記類似した短縮番号をユーザに出力し(ステップ1210)、前記出力された類似した短縮番号のうちユーザが通話しようとする前記類似した短縮番号を選択した後(ステップ1211)、前記選択された短縮番号に対応する電話番号につなぐ(ステップ1203)。これに対し、ステップ1209において、前記類似した短縮番号が存在しない場合、認識失敗である旨をユーザに出力する(ステップ1212)。
【0037】
すなわち、該当短縮番号に多数の登録者が存在すれば、TTSエンジンは、該当番号に保存された登録者のリストを聞かせることにより、ユーザをして希望する番号の選択を可能にする。フィードバックされた結果が本人の発声と一致しない場合、最初に間違った場合にはさらに発声させ、2回目に間違った場合には類似番号の存否を確かめて類似番号のリストをフィードバックし、類似番号さえない場合には現在の発声環境が認識に適していないと判断して認識失敗である旨を知らせる。
【0038】
将来、任意の電話番号に直接的にマッチング可能なほどに認識率が上がれば、前記短縮番号データベースが不要になる可能性もある。このように、短縮番号データベースを備えないスピード音声ダイアル装置は、ユーザからスピード音声ダイアルモード設定のコマンドを受け取った場合、スピード音声ダイアルモードを設定するスピード音声ダイアルモード設定部、前記スピード音声ダイアルモード設定部において前記スピード音声ダイアルモードが設定された場合、ユーザが短縮番号を発声すれば、前記電話番号データベースの電話番号リストから前記ユーザが発声した短縮番号を検出する短縮番号検出部および前記短縮番号検出部において検出された短縮番号に対応する電話番号につなぐ電話番号連結部を備える。さらに、短縮番号データベースを備えないスピード音声ダイアル方法は、ユーザからスピード音声ダイアルモード設定のコマンドを受け取った場合、スピード音声ダイアルモードを設定する段階、前記スピード音声ダイアルモードが設定された場合、ユーザが短縮番号を発声すれば、前記電話番号データベースの電話番号リストから前記ユーザが発声した短縮番号を検出する段階および前記検出された短縮番号に対応する電話番号につなぐ段階を含む。
【0039】
一方、前述した本発明の実施形態はコンピュータにて実行可能なプログラムにて作成可能であり、コンピュータにて読取り可能な記録媒体を用いて前記プログラムを動作させる汎用のデジタルコンピュータにより具現できる。
【0040】
前記コンピュータにて読取り可能な記録媒体は、マグネチック貯蔵媒体(例えば、ROM,フロッピー(登録商標)ディスク、ハードディスク等)、光学的な判読媒体(例えば、CD−ROM、DVDなど)およびキャリアウェーブ(例えば、インターネットを介した伝送)などの貯蔵媒体を含む。
【0041】
以上、本発明についてその好適な実施形態を中心に述べてきた。本発明が属する技術分野における当業者であれば、本発明が本発明の本質的な特性から逸脱しない範囲であれば、変形された形として具現可能であるということが理解できるであろう。よって、開示された実施形態は限定的な観点ではなく、説明的な観点から考慮さるべきである。本発明の範囲は前述した説明ではなく、特許請求の範囲上に現れており、それと同等な範囲内にあるあらゆる違いは本発明に含まれるものとして解釈されるべきである。
【0042】
【発明の効果】
上述したように、本発明によれば、電話帳に保存されている電話番号の下4桁番号のみを発声することにより、7桁以上よりなる電話番号への連結をより良好な認識性能および処理速度にて行うことができ、既に電話帳に保存された番号を対象とするために組み合わせ可能な数字も電話帳に登録されたリストの数と同じであり、認識速度および性能を高めることができる。さらに、ユーザが頻繁に使う番号は電話帳にあらかじめ登録しておく点に着目し、電話帳に入力された電話番号に対しては7桁以上の電話番号を全て発声しなくても、下4桁番号のみを発声すれば通話できるようにすることにより、認識率、認識速度および電話連結の速度など、全体のシステムの性能を高めることができる。特に、ユーザにとっては、4桁の番号のみを発声しても簡単に通話可能になるが、雑音など何らかの要因により音声認識の結果が間違ったとしても、4桁を発声することが全く煩わしくないため、商品化への実効性およびユーザの使い勝手を大幅に高めることができる。
【図面の簡単な説明】
【図1】従来の音声ダイアル装置の構成図である。
【図2】従来の音声ダイアル装置の数字フィーチャベクトルの構造図である。
【図3】従来のスピードダイアルを行う方法の構造図である。
【図4】本発明が採用された改良音声ダイアル装置の構成図である。
【図5】本発明に係るスピード音声ダイアル装置の構成図である。
【図6】本発明のうち短縮番号データベースの詳細構成図である。
【図7】本発明のうち短縮番号検出部の詳細構成図である。
【図8】本発明のうちPCMフィーチャ変換部の詳細構成図である。
【図9】本発明に係るスピード音声ダイアル方法のフローチャートである。
【図10】本発明のうち短縮番号リスト構築方法の詳細フローチャートである。
【図11】本発明のうち短縮番号検出方法の詳細フローチャートである。
【図12】本発明のうち検出された短縮番号の処理方法のフローチャートである。
【符号の説明】
401 スピード音声ダイアルモード設定部
402 音声入力部
403 フィーチャ変換部
404 電話番号データベース
405 名前リスト構築部
406 名前マッチング部
407 電話番号リスト構築部
408 短縮番号マッチング部
409 電話番号マッチング部
410 テキスト・ツー・スピーチ(TTS)エンジン
411 電話番号確認部
412 電話番号選択部
413 電話番号連結部
414 取消し部
51 スピード音声ダイアルモード設定部
52 短縮番号データベース
53 短縮番号検出部
54 電話番号連結部
61 電話番号データベース
62 短縮番号リスト構築部
71 発声指示部
72 PCMフィーチャ変換部
73 マッチング検出部
74 短縮番号出力部
81 PCMデータ変換部
82 フィーチャ変換部

Claims (25)

  1. ユーザからスピード音声ダイアルモード設定のコマンドを受け取った場合、スピード音声ダイアルモードを設定するスピード音声ダイアルモード設定部と、
    ユーザが使う電話番号を保存して管理し、前記電話番号から短縮番号を抽出して短縮番号リストを構築する短縮番号データベースと、
    前記スピード音声ダイアルモード設定部において前記スピード音声ダイアルモードが設定された場合、ユーザが短縮番号を発声すれば、前記短縮番号データベースの前記短縮番号リストから前記ユーザが発声した短縮番号を検出する短縮番号検出部と、
    前記短縮番号検出部において検出された短縮番号に対応する電話番号につなぐ電話番号連結部と
    を備えることを特徴とするスピード音声ダイアル装置。
  2. 前記短縮番号は、任意の電話番号の桁数が4以上である場合には前記電話番号から下4桁番号を抽出して生成され、任意の電話番号の桁数が4未満である場合には前記電話番号が短縮番号となることを特徴とする請求項1に記載のスピード音声ダイアル装置。
  3. 前記短縮番号データベースは、
    ユーザが保存した電話番号およびユーザが最近かけた電話番号を保存して管理する電話番号データベースと、
    前記電話番号データベースに保存された前記電話番号から短縮番号を抽出して短縮番号リストを構築する短縮番号リスト構築部と
    を備えることを特徴とする請求項1に記載のスピード音声ダイアル装置。
  4. 前記短縮番号検出部は、
    前記スピード音声ダイアルモード設定部において前記スピード音声ダイアルモードが設定された場合、ユーザに通話しようとする電話番号の短縮番号を発声することを指示する発声指示部と、
    前記発声指示部の前記指示に従ってユーザが短縮番号を発声すれば、前記発声された短縮番号をパルス符号変調データに変換し、前記パルス符号変調データをフィーチャに変換するパルス符号変調フィーチャ変換部と、
    前記短縮番号データベースの前記短縮番号リストおよび前記パルス符号変調フィーチャ変換部の前記フィーチャをマッチングさせて前記フィーチャと同じ短縮番号を前記短縮番号リストから検出するマッチング検出部と、
    前記マッチング検出部において検出された短縮番号をユーザに出力する短縮番号出力部と
    を備えることを特徴とする請求項1に記載のスピード音声ダイアル装置。
  5. 前記パルス符号変調フィーチャ変換部は、
    前記発声指示部の前記指示に従ってユーザが短縮番号を発声すれば、前記発声された短縮番号をコーデックを介して2進デジタルデータであるパルス符号変調データに変換するパルス符号変調データ変換部と、
    前記パルス符号変調データ変換部の前記パルス符号変調データをテキストデータであるフィーチャに変換するフィーチャ変換部と
    を備えることを特徴とする請求項4に記載のスピード音声ダイアル装置。
  6. 前記電話番号連結部は、前記短縮番号検出部において検出された前記短縮番号に対応する番号が一つである場合、前記検出された短縮番号に対応する前記一つの電話番号につなぐことを特徴とする請求項1に記載のスピード音声ダイアル装置。
  7. 前記電話番号連結部は、前記短縮番号検出部において検出された短縮番号に対応する番号が多数である場合、ユーザが前記多数の番号から一つを選択すれば、前記短縮番号を前記選択された一つの電話番号につなぐことを特徴とする請求項1に記載のスピード音声ダイアル装置。
  8. 前記短縮番号検出部は、前記短縮番号検出部において検出された前記短縮番号に対応する番号が存在しない場合、ユーザが短縮番号を再発声すれば、前記短縮番号データベースの前記短縮番号リストから前記ユーザが再発声した短縮番号を検出することを特徴とする請求項1に記載のスピード音声ダイアル装置。
  9. 前記短縮番号検出部は、
    前記短縮番号検出部において検出された前記ユーザが再発声した短縮番号に対応する番号が存在しない場合、前記短縮番号リストから前記短縮番号に類似した短縮番号を検索する類似番号検索部と、
    前記類似番号検索部において検索された前記類似した短縮番号が存在する場合、前記短縮番号に類似した短縮番号をユーザに出力する類似番号出力部と、
    前記類似番号出力部から出力された前記類似した短縮番号のうちユーザが通話しようとする前記類似した短縮番号を選択する類似番号選択部と
    を備えることを特徴とする請求項1に記載のスピード音声ダイアル装置。
  10. 前記類似番号出力部は、前記類似番号検索部において検索された前記類似した短縮番号が存在しない場合、認識失敗である旨をユーザに出力することを特徴とする請求項9に記載のスピード音声ダイアル装置。
  11. (a)ユーザからスピード音声ダイアルモード設定のコマンドを受け取った場合、スピード音声ダイアルモードを設定する段階と、
    (b)ユーザが使う電話番号を保存して管理し、前記電話番号から短縮番号を抽出して短縮番号リストを構築する段階と、
    (c)前記スピード音声ダイアルモードが設定された場合、ユーザが短縮番号を発声すれば、前記短縮番号リストから前記ユーザが発声した短縮番号を検出する段階と、
    (d)前記検出された短縮番号に対応する電話番号につなぐ段階と
    を含むことを特徴とするスピード音声ダイアル方法。
  12. 前記短縮番号は、任意の電話番号の桁数が4以上である場合には前記電話番号から下4桁番号を抽出して生成され、任意の電話番号の桁数が4未満である場合には前記電話番号が短縮番号となることを特徴とする請求項11に記載のスピード音声ダイアル方法。
  13. 前記(b)段階は、
    (b1)ユーザが保存した電話番号およびユーザが最近かけた電話番号を保存して管理する段階と、
    (b2)前記保存された電話番号から短縮番号を抽出して短縮番号リストを構築する段階と
    を含むことを特徴とする請求項11に記載のスピード音声ダイアル方法。
  14. 前記(c)段階は、
    (c1)前記スピード音声ダイアルモードが設定された場合、ユーザに通話しようとする電話番号の短縮番号を発声することを指示する段階と、
    (c2)前記指示に従ってユーザが短縮番号を発声すれば、前記発声された短縮番号をパルス符号変調データに変換し、前記パルス符号変調データをフィーチャに変換する段階と、
    (c3)前記短縮番号リストおよび前記フィーチャをマッチングさせて前記フィーチャと同じ短縮番号を前記短縮番号リストから検出する段階と、
    (c4)前記検出された短縮番号をユーザに出力する段階と
    を含むことを特徴とする請求項11に記載のスピード音声ダイアル方法。
  15. 前記(c2)段階は、
    (c21)前記指示に従ってユーザが短縮番号を発声すれば、前記発声された短縮番号をコーデックを介して2進デジタルデータであるパルス符号変調データに変換する段階と、
    (c22)前記パルス符号変調データをテキストデータであるフィーチャに変換する段階と
    を含むことを特徴とする請求項14に記載のスピード音声ダイアル方法。
  16. 前記(d)段階は、前記検出された短縮番号に対応する番号が一つである場合、前記検出された短縮番号に対応する前記一つの電話番号につなぐことを特徴とする請求項11に記載のスピード音声ダイアル方法。
  17. 前記(d)段階は、前記検出された短縮番号に対応する番号が多数である場合、ユーザが前記多数の番号から一つを選択すれば、前記短縮番号を前記選択された一つの電話番号につなぐことを特徴とする請求項11に記載のスピード音声ダイアル方法。
  18. 前記(d)段階は、
    (d1)前記検出された短縮番号に対応する番号が存在しない場合、ユーザが短縮番号を再発声すれば、前記短縮番号リストから前記ユーザが再発声した短縮番号を検出する段階と、
    (d2)前記検出された短縮番号に対応する電話番号につなぐ段階と
    を含むことを特徴とする請求項11に記載のスピード音声ダイアル方法。
  19. 前記(d)段階は、
    (d1)ユーザが再発声した短縮番号に対応する番号が存在しない場合、前記短縮番号リストから前記短縮番号に類似した短縮番号を検索する段階と、
    (d2)前記検索の結果、前記類似した短縮番号が存在する場合、前記類似した短縮番号をユーザに出力する段階と、
    (d3)前記出力された類似した短縮番号のうちユーザが通話しようとする前記類似した短縮番号を選択する段階と、
    (d4)前記選択された短縮番号に対応する電話番号につなぐ段階と
    を含むことを特徴とする請求項11に記載のスピード音声ダイアル方法。
  20. 前記(d)段階は、
    (d1)ユーザが再発声した短縮番号に対応する番号が存在しない場合、前記短縮番号リストから前記短縮番号に類似した短縮番号を検索する段階と、
    (d2)前記検索の結果、前記類似した短縮番号が存在しない場合、認識失敗である旨をユーザに出力する段階と
    を含むことを特徴とする請求項11に記載のスピード音声ダイアル方法。
  21. ユーザからスピード音声ダイアルモード設定のコマンドを受け取った場合、スピード音声ダイアルモードを設定するスピード音声ダイアルモード設定部と、
    前記スピード音声ダイアルモード設定部において前記スピード音声ダイアルモードが設定された場合、ユーザが短縮番号を発声すれば、前記電話番号データベースの電話番号リストから前記ユーザが発声した短縮番号を検出する短縮番号検出部と、
    前記短縮番号検出部において検出された短縮番号に対応する電話番号につなぐ電話番号連結部と
    を備えることを特徴とする短縮番号データベースを備えないスピード音声ダイアル装置。
  22. 前記短縮番号は、任意の電話番号の桁数が4以上である場合には前記電話番号から下4桁番号を抽出して生成され、任意の電話番号の桁数が4未満である場合には前記電話番号が短縮番号となることを特徴とする請求項21に記載の短縮番号データベースを備えないスピード音声ダイアル装置。
  23. ユーザからスピード音声ダイアルモード設定のコマンドを受け取った場合、スピード音声ダイアルモードを設定する段階と、
    前記スピード音声ダイアルモードが設定された場合、ユーザが短縮番号を発声すれば、電話番号データベースの電話番号リストから前記ユーザが発声した短縮番号を検出する段階と、
    前記検出された短縮番号に対応する電話番号につなぐ段階と
    を含むことを特徴とする短縮番号データベースを備えないスピード音声ダイアル方法。
  24. 前記短縮番号は、任意の電話番号の桁数が4以上である場合には前記電話番号から下4桁番号を抽出して生成され、任意の電話番号の桁数が4未満である場合には前記電話番号が短縮番号となることを特徴とする請求項23に記載の短縮番号データベースを備えないスピード音声ダイアル方法。
  25. 請求項11ないし請求項20、あるいは、請求項23または請求項24のうち何れか1項に記載の方法をコンピュータにて実行するためのプログラムを記録したコンピュータにて読取り可能な記録媒体。
JP2003125831A 2002-05-25 2003-04-30 スピード音声ダイアル装置および方法 Pending JP2004007634A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-2002-0029119A KR100433550B1 (ko) 2002-05-25 2002-05-25 스피드 음성 다이얼 장치와 방법

Publications (1)

Publication Number Publication Date
JP2004007634A true JP2004007634A (ja) 2004-01-08

Family

ID=29546372

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003125831A Pending JP2004007634A (ja) 2002-05-25 2003-04-30 スピード音声ダイアル装置および方法

Country Status (4)

Country Link
US (1) US7477728B2 (ja)
JP (1) JP2004007634A (ja)
KR (1) KR100433550B1 (ja)
CN (1) CN1231038C (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7383268B2 (en) * 2003-07-31 2008-06-03 Itxc Ip Holdings S.A.R.L. Indexing technique for an efficient best-pattern matched lookup
GB0327416D0 (en) * 2003-11-26 2003-12-31 Ibm Directory dialler name recognition
US8789107B2 (en) * 2008-01-09 2014-07-22 Verizon Patent And Licensing Inc. Intelligent automatic digital video recorder
TWI360109B (en) * 2008-02-05 2012-03-11 Htc Corp Method for setting voice tag
US7409047B1 (en) * 2008-02-24 2008-08-05 International Business Machines Corporation Personalized telephone directory and calling system
CN104092829A (zh) * 2014-07-21 2014-10-08 苏州工业园区服务外包职业学院 基于语音识别的语音呼叫方法和接入网关

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3885683T2 (de) * 1987-09-11 1994-03-10 Toshiba Kawasaki Kk Telefonapparat.
US5204894A (en) * 1990-11-09 1993-04-20 Bell Atlantic Network Services, Inc. Personal electronic directory
JPH04192852A (ja) 1990-11-27 1992-07-13 Murata Mach Ltd ダイヤル番号発信方法
JPH0541249A (ja) 1991-08-01 1993-02-19 Toyo Takasago Kandenchi Kk リチウム二次電池及びそれに使用する負極構造体へのリチウムイオンの注入方法
JP3141301B2 (ja) 1992-02-28 2001-03-05 ソニー株式会社 電話機
JPH0730629A (ja) * 1993-07-07 1995-01-31 Yuhshin Co Ltd 音声ダイヤリング装置
US5568546A (en) * 1994-10-31 1996-10-22 Lucent Technologies, Inc. Method and apparatus for dynamic abbreviated dialing assignment
JPH08314495A (ja) 1995-05-22 1996-11-29 Sanyo Electric Co Ltd 数字列音声認識装置及びビデオレコーダシステム
US5912949A (en) * 1996-11-05 1999-06-15 Northern Telecom Limited Voice-dialing system using both spoken names and initials in recognition
US6208713B1 (en) * 1996-12-05 2001-03-27 Nortel Networks Limited Method and apparatus for locating a desired record in a plurality of records in an input recognizing telephone directory
US5859896A (en) * 1997-03-05 1999-01-12 Rosen; Howard B. Telephone line automatic prefix dialer
US6320943B1 (en) * 1997-06-12 2001-11-20 Legerity, Inc. Electronic directory system and method
KR100232873B1 (ko) * 1997-07-21 1999-12-01 윤종용 음성인식처리용 메모리를 가지는 휴대용 전화기
US6098040A (en) * 1997-11-07 2000-08-01 Nortel Networks Corporation Method and apparatus for providing an improved feature set in speech recognition by performing noise cancellation and background masking
KR19990060315A (ko) * 1997-12-31 1999-07-26 윤종용 전화번호 음성 입력에 의한 음성다이얼링 방법
KR100278020B1 (ko) * 1998-04-14 2001-01-15 윤종용 휴대폰에서 저장된 전화번호를 검색하여 다이얼링하는 방법
JP2000032108A (ja) 1998-07-10 2000-01-28 Brother Ind Ltd 通信装置
US6608895B1 (en) * 1998-11-04 2003-08-19 Tadiran Telecom Business Systems, Ltd. Method of anticipatory dialing
KR20000073412A (ko) * 1999-05-10 2000-12-05 유명호 휴대용단말기에서의 음성자동다이얼방법
US6442270B1 (en) * 1999-11-24 2002-08-27 Qualcomm, Incorporated Telephone number lookup with reduced scrolling
KR20000012484A (ko) * 1999-12-07 2000-03-06 김종진 음성인식 기능을 갖춘 핸드폰
US20020003867A1 (en) * 2000-04-20 2002-01-10 Peter Rothschild Systems and methods for connecting customers to merchants over a voice communication network
US6980642B1 (en) * 2000-10-31 2005-12-27 Sprint Spectrum L.P. Method and apparatus for abbreviated dialing in a subscriber terminal
US6697455B2 (en) * 2001-02-27 2004-02-24 Gary F. Krofchalk Voice activated dialing apparatus
US7103168B2 (en) * 2002-04-16 2006-09-05 Bellsouth Intellectual Property Corporation Methods and systems for implementing personal dialing plans

Also Published As

Publication number Publication date
CN1459967A (zh) 2003-12-03
KR100433550B1 (ko) 2004-05-31
CN1231038C (zh) 2005-12-07
KR20030091241A (ko) 2003-12-03
US7477728B2 (en) 2009-01-13
US20040018856A1 (en) 2004-01-29

Similar Documents

Publication Publication Date Title
JP5613335B2 (ja) 音声認識システム、認識辞書登録システム及び音響モデル識別子系列生成装置
JP4542974B2 (ja) 音声認識装置、音声認識方法および音声認識プログラム
JP4481972B2 (ja) 音声翻訳装置、音声翻訳方法及び音声翻訳プログラム
US7783475B2 (en) Menu-based, speech actuated system with speak-ahead capability
US6687673B2 (en) Speech recognition system
US5752230A (en) Method and apparatus for identifying names with a speech recognition program
US8374862B2 (en) Method, software and device for uniquely identifying a desired contact in a contacts database based on a single utterance
JP5471106B2 (ja) 音声翻訳システム、辞書サーバ装置、およびプログラム
WO2001099096A1 (fr) Systeme de communication a entree vocale, terminal d'utilisateur et systeme central
JPH10215319A (ja) 音声によるダイヤル方法および装置
JP2003022089A (ja) オーディオ専用インターフェースにおけるボイス・スペリング
JPH10503033A (ja) 新ワードのモデル化に基づく音声認識方法及びその装置
JPH10198396A (ja) ユーザが定義したフレーズの話者に依存しない認識方法及びシステム
US7269563B2 (en) String matching of locally stored information for voice dialing on a cellular telephone
TW200304638A (en) Network-accessible speaker-dependent voice models of multiple persons
JP2004503183A (ja) 電気通信セッションの進行中に電話番号を自動的に記録する方法と装置
JP2004007634A (ja) スピード音声ダイアル装置および方法
US20050049858A1 (en) Methods and systems for improving alphabetic speech recognition accuracy
JP2006058390A (ja) 音声認識装置
US20070129945A1 (en) Voice quality control for high quality speech reconstruction
US7437294B1 (en) Methods for selecting acoustic model for use in a voice command platform
KR20010020871A (ko) 개선된 어구 저장, 사용, 변환, 전달 및 인식을 갖춘 음성제어된 디바이스를 위한 방법 및 장치
CA2597826C (en) Method, software and device for uniquely identifying a desired contact in a contacts database based on a single utterance
JP2010276869A (ja) 自動翻訳対応電話機および自動翻訳対応電話システム
JP3278595B2 (ja) 携帯電話

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050725

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060419

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060516

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060817

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20060915

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20061020