JP4812928B2 - Voiceprint phone system - Google Patents
Voiceprint phone system Download PDFInfo
- Publication number
- JP4812928B2 JP4812928B2 JP2000241148A JP2000241148A JP4812928B2 JP 4812928 B2 JP4812928 B2 JP 4812928B2 JP 2000241148 A JP2000241148 A JP 2000241148A JP 2000241148 A JP2000241148 A JP 2000241148A JP 4812928 B2 JP4812928 B2 JP 4812928B2
- Authority
- JP
- Japan
- Prior art keywords
- voiceprint
- voice
- telephone
- data
- call center
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Telephonic Communication Services (AREA)
- Telephone Function (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は、声紋電話システムに関するものであり、詳しくは電話機からの音声データの声紋により特定データを認識して相手方への接続等ができるようにした声紋電話システムに関する。
【0002】
【従来の技術】
従来技術における電話機、特に携帯電話機は、急速に普及してきており、従来のテンキーや圧縮機能を使って特定相手先を呼出して会話をすることから、この会話をすることに加えて附加価値を付けたサービス等のその使い勝手も様々なものが存在する。
【0003】
【発明が解決しようとする課題】
しかしながら、上述の電話機、特に携帯電話機においては、音声を認識する音声認識電話機は既に周知であるが、現実問題として電話機又は音声を受信する端末器側で音声認識をするため、音声の認識率が悪いという問題がある。又、携帯電話機を紛失した場合には、紛失した携帯電話機に登録してある電話帳を再度作成し直す必要があり、又、電話番号の変更毎にその電話番号を変更する必要がある。更に、電話のみを使用する分には問題がないが電話番号の登録とか予約とか等の操作についてはテンキー以外の機能を醸し出す必要があるため、特別な操作をする必要があり、結構面倒であるため、宣伝文句にはうたっているが実際に使用されていないのが現状である。又、携帯電話機においては、操作面が一般的に小さいため、表示する文字数字等も小さくなり視力の弱い人や暗所での使用においては更に見づらいという問題も指摘されている。
【0004】
従って、電話機において、テンキー等を使わずに所望の相手方を呼出して会話できる手法を基本として、この手法により派生する機能に解決しなければならない課題を有する。
【0005】
【課題を解決するための手段】
上記課題を解決するため、本発明に係る声紋電話システムは次のような構成にすることである。
【0006】
(1) 少なくともマイクとスピーカとパワー手段とを備えた電話機であって、前記電話機は、前記パワー手段により電話ができるようになった時に所定の声紋を解読する機能を備えた声紋電話コールセンターを呼び出して接続し、前記マイクから入力した音声データを前記声紋電話コールセンター側でその声紋を解読し、該解読された声紋が特定の音声データであることを認識したときに、当該音声データが記憶されているかを検索し、該検索の結果、記憶されていれば記憶されている当該音声データに対応して記憶されている相手先番号に基づき相手先を呼び出す機能を有することを特徴とする声紋電話システム。
【0007】
このように、電話機との間にコールセンターを備え、声紋により特定の音声データを認識して相手側と会話等ができるようにしたことにより、所望の相手側の電話番号を指定する必要がなくなると共に、一度使用した相手先の番号等は音声データとして蓄積しておくことにより、例えば「昨日かけたAさん」とか「Bくん」という通常の会話形式で相手側と接続することが可能になる。
【0008】
【発明の実施の形態】
次に、本発明に係る声紋電話システムの種々の実施の形態について図面を参照して説明する。
【0009】
本願発明に係る第1の実施の形態の声紋電話システムは、図1に示すように、声紋式電話機10又はテンキー式電話機11から声紋電話コールセンター13を呼び出して所望の相手側と電話等できるシステムであり、声紋式電話機10の場合は自動的又は音声により声紋電話コールセンター13に接続するようにし、テンキー式電話機の場合はテンキーをプッシュして声紋電話コールセンター13に接続する。
【0010】
声紋電話コールセンター13においては、声紋式又はテンキー式電話機10、11と接続状態にあり、何れかの電話機10、11から音声データ14を入力すると、その音声データ14の声紋の解読15をする。ここで予め設定されている特定声紋と一致すれば、声紋電話コールセンターを利用することができる者であるとの認証ができたことになり、音声データ14に含まれている文言を予め翻訳解読したデータを蓄積してある声紋データベースと付き合わせることにより、その文言の意味を解読する。
【0011】
このような翻訳機能16には、量的学習マスター機能と質的学習マスター機能とがあり、量的学習マスター機能は単純に情報を累積(蓄積)していくもので、いわば百科事典のようなものであり、情報のボリュームとして自動的に増殖してゆく仕組みが必要である。実際には、新しい言葉が次々と登場し続ける中で、その言葉を登録することになる。
【0012】
質的学習マスター機能は、人口知能ともいうべきもので、翻訳機能16の中枢であり、特徴的な点は人間や企業の習慣に着目したことである。即ち、翻訳の質的能力は慣習に依存している事実に着目すると、習慣(慣習)はメリットによって成り立っている。従って、メリットがなければ習慣として定着しないということになる。例えば、個人が電話をする相手は、ほぼ特定され限定されているという習慣がある。又、挨拶文や年賀状とうのものには、ほぼ定型化された慣習化されている。更に、企業も取引慣行という商慣習により特定化され限定されている。小売業においては、Aメーカーの商品はB問屋を経由して納品されるという商慣習が存在する。従って、新商品発売時にはメーカー名だけ判別すれば取引問屋名が自動的に判別できることになる。同様に、新商品のジャンル判別にも応用できる。販売マージンも慣習化されており、この慣習学習マスターを活用することにより、小売業の販売価格を自動的に決定することができるのである。このようにして個人も企業も慣習に支配され、習慣により言動を行っているのであり、習慣を学習すれば翻訳能力は向上する。
【0013】
このような翻訳機能を駆使して音声データ14から所望の項目を決定する。実施例においては、「oo会社のAさん」と判断すれば相手先接続のルーチン17に行き、「Eメール」と判断すれば音声Eメールのルーチン18に行き、「ワープロ」と判断すれば音声ワープロのルーチン19に行き、「インターネット」と判断すれば「音声インターネット」のルーチン20に行き、「電子商取引」と判断すれば音声電子商取引のルーチン21に行く。以下、それぞれのルーチンにおける構成及び処理形態について説明する。
【0014】
相手先の接続のためのルーチンにおける構成及びその処理形態は、図2に示すように、声紋電話機30と、交換機網等からなり電話の接続ができるネットワーク31と、このネットワーク31に接続することができる声紋電話コールセンター13Aと、不特定多数の相手方の電話機32とから構成されている。ネットワーク31は、電話機が互いに接続できるものであれば良く、家庭用のものからオフィス用の企業LAN等を含むものまで、又は電話交換機網、サテライト網の全てを含む概念である。
【0015】
声紋電話機30は、図2(B)に示すように、所謂、携帯電話機が代表的なものであり、少なくともマイク33、スピーカ34、パワー手段35、ネットワーク31に対して接続要求をする接続部36と、マイク33から入力した音声信号を信号処理してネットワーク31に音声データを送信し、又はネットワーク31を介して音声データを受信するデータ送受信部37とを備えた構成となっている。ここで、ネットワーク31に対する接続要求信号には、自動的に声紋電話コールセンター13Aを呼び出して接続するようになっている。パワー手段35は、手動によりオンするスイッチで構成され、オンすると自動的に接続部36から接続要求信号が送信され、声紋電話コールセンター13Aと接続状態になる。このパワー手段35であるスイッチは、マイク33から入力された音声信号に基づいてオンするようにしてもよい。又、声紋電話コールセンター13Aと接続状態にある時には、音声入力可能を示す特定の表示手段を点灯又は点滅させ、視認できるようにしておいてもよい。データ送受信部37は、予め特定の声紋データを記録しておく機能を有しており、特定の声紋以外の音声が入力した時に、この声紋データ以外の音声データを削除して声紋電話コールセンター13Aに送るフイルタの役目をする。従って、声紋電話機30を利用する外部環境に左右されないで特定者の音声のみを送ることが可能である。又、このフイルタは特定者以外には使用させない機能を付けるようにしてもよい。
【0016】
声紋電話コールセンター13Aは、図2(A)に示すように、不特定多数の声紋電話機30からの接続要求に応じることができるセンターであり、声紋電話機30から要求した相手側の電話機32に接続するための切換部40と、声紋電話機30からの音声データを受信する音声データ受信部41と、受信した音声データの声紋を解析して特定の音声データであることを認識するための声紋解析部42と、声紋解析部42で得られた特定の音声データに基づいて、その中に含まれている音声データにより相手先に接続する電話番号等を検索する声紋検索部43と、声紋検索部43の要求により検索され、特定の音声データを有する特定者による接続要求等のデータが蓄積してある声紋データベース44と、検索されたデータに基づいて相手先の電話機に接続する相手先接続部45とから構成されている。
【0017】
このような構成からなる声紋電話システムにおける一般的な処理形態は、図3に示すように、発信側の「甲さん」が所有する声紋電話機30のパワーがオンになると自動的に声紋電話コールセンター13Aを呼び出す発呼動作をする(ステップST10)。
【0018】
声紋電話機30と声紋電話コールセンター13Aとが接続状態である時に、声紋電話機30から相手先を呼び出すための音声が発生すると、その音声データは声紋電話コールセンター13Aで受信され、声紋識別及び解読がなされる(ステップST11、ST12)。
【0019】
声紋解読が成功すると、次に、音声データに含まれている相手先を特定するためのデータ、例えば「Aさん」というデータに基づいてデータベースの検索がなされ、過去に使用した又は予め入力してある「Aさん」のデータを検索する。ヒットすると、その相手側である「Aさん」の電話を呼び出す(ステップST13、ST14)。
【0020】
相手側の「Aさん」の電話を呼び出す行為が開始すると共に、発信側と着信側とに接続を切り替えることにより、発信側の「甲さん」は着信側の「Aさん」に接続し会話等ができるのである(ステップST15、ST16)。
【0021】
さて、このような一般的な接続状態のみでは、発信側と着信側とは接続することができず、接続するためには種々の経過が必要である。以下、図2に示す全体構成図を参考にして、発信側からの呼出し、声紋解読、声紋データベースによる検索等に分けて説明する。
【0022】
声紋電話機30側の発信側からの声紋電話コールセンター13Aの呼出しは、図4に示すように、声紋電話機30のスイッチがオンされていることが条件となる(ステップST20、ST21)。即ち、発信者側の音声を入力する時には、予め声紋電話コールセンター13Aと接続されている事が必要である。この接続には、機械的な電源スイッチオンで起動するようにしてもよく、又はソフトウェア的に発信者側の何れかの音声信号の入力、又は特定の音声信号を識別して声紋電話コールセンター13Aに接続するようにしてもよい。
【0023】
このようにして、スイッチがオンされると、声紋電話コールセンター13Aを呼び出すための特定の電話番号により自動呼出しが行われる(ステップST22)。この特定の電話番号は、声紋電話機30に予め組み込まれており、単一又は複数の電話番号から構成されている。
【0024】
自動呼び出しが行われ、接続を試み、接続が無事完了すると音声入力タイマーをスタートさせ、マイクからの音声入力を待つ。タイマーがスタートして所定時間内に音声入力がないとタイマーはタイムアウトの状態になりパワースイッチをオフする(ST23、ST24、ST25、ST26)。タイマー時間内に音声信号を入力すると、入力した音声データは声紋電話コールセンター13Aに送られ、声紋の認識及び所望の相手先への接続等が行われる(ステップST26)。この点については、後述する声紋電話コールセンターのルーチンの項で詳細に説明する。
【0025】
ステップST23において、自動呼び出しによる接続が失敗した場合には、リコールカウンターのカウントをアップさせ、予め設定されているカウントの値より以下の場合は再度自動呼び出しのリトライを心掛ける(ステップST27、ST28、ST29)。もし、リコールカウントの値が予め設定されている値以上に達した場合には、自動呼び出しによる第1の電話番号を終了させ、次の第2の電話番号に切り替えて自動呼び出しを続行する(ステップST30、ST31)。ここで自動呼び出し電話番号を全て使用しても接続に失敗した場合には手動による接続をするために、手動音声番号呼び出しルーチンに行く。
【0026】
図5は、手動音声番号呼び出しルーチンを示したもので、手動により声紋電話コールセンター13Aを呼び出す。この声紋電話コールセンター13Aを呼び出すためには、発信者特有の暗唱番号の音声入力(暗号符号音声データ)が必要になっている(ステップST40)。
【0027】
声紋電話機30においては、暗証番号を信号処理して声紋電話コールセンター13Aを呼び出すための電話番号である暗号符号音声データに変換して送信し、声紋電話コールセンターを呼び出す(ステップST41、ST42)。
【0028】
接続が完了した場合には、図4に示す音声入力タイマーを始動させ、発信者側の音声入力を待つ(ステップST43)。
【0029】
ステップST43において、接続が失敗してリコールカウント値が所定値以下の場合はリトライをするため再度声紋電話コールセンターの呼び出しを試みる(ステップST44、ST45、ST46)。ステップST43において、接続が失敗した場合にはリコールカウンタをカウントアップし、カウント値が所定の値以上の場合は接続不能として処理し、声紋電話コールセンター13Aへの接続は終了する(ステップST47)。
【0030】
次に、このようにして声紋電話コールセンター13Aに接続した状態において、発信者側から音声入力を認識した場合の声紋電話コールセンター13A側での処理について、図6に示すフローチャートを参照して説明する。
【0031】
先ず、「甲さん」の音声入力が「AAさん」であるとすると、予め接続されている声紋電話コールセンター13Aにこの「AAさん」の音声信号が入力され、切換部40を介して音声データ受信部41で受け取る(図2参照)。音声データ受信部41においては、フイルター等を通過させてノイズ等のキャンセルが行われ、声紋解析部42に送られる。声紋解析部42においては声紋の解析が行われ、「甲さん」特有の声紋の検出が行われる(ステップST50、ST51、ST52、ST53)。
【0032】
ステップST53において、検出した音声データが「甲さん」特有の特定者として認識できなかった場合には、発信者側再音声入力処理ルーチンにゆく。特定者と認識された場合には、特定者(「甲さん」)接続ヒストリデータベースの検索にゆく(ステップST54)。この接続ヒストリーデータベースには、特定者(「甲さん」)が今までに接続を要望又は実際に接続した相手側のネーム、フルネーム、又は通常の会話で呼び合っているペンネーム等が蓄積され、独自の手法により順序の並べかえ、及び使用頻度に応じた優先順位を付けて検索する構成となっている。この点については図6を参照して後述する。例えば、図6に示すデータベースにおいては、▲1▼a月b日c時には「Cさん」と接続し、その時の接続電話番号は「aaaa」である。 ▲2▼a月b日d時には「Dさん」と接続し、その時の接続電話番号は「bbbb」である。▲3▼a月b日e時には「AAさん」と接続し、その時の接続電話番号は「cccc」である。
【0033】
従って、今回の発信者(「甲さん」)からの音声入力データに含まれている「AAさん」は、▲3▼a月b日e時における「AAさん」と同一人物であると判明することができ、検索対象者ありと判断してデータベースの更新し、接続対象者への接続を行うと同時に特定された「Aさん」の情報を発信者側にコールバックしてもよい(ステップST55、ST56、ST57)。
【0034】
ここで検索対象者がデータベースに存在しない場合には、接続相手側処理ルーチンにゆき、初めての接続相手側との接続する手続きを行う(ステップST58)。
【0035】
相手側との接続がされたならば、切換部40(図3参照)を駆動させ、回線の切換を行い、ネットワークを介して「AAさん」との接続を完了させ、「甲さん」と「AAさん」との会話が成立する(ステップST59)。接続ができても留守の場合には、音声データを蓄積しておき相手側に伝言ありのメッセージ及び伝言を伝えるいわゆる音声留守録機能がある(ステップST60)。更に、この音声留守録機能に加えて音声データの解析によって所定の時間にコールする音声予約コール機能を付加してもよい。この音声予約コールの場合には、予約した時間の以前の特定時間に発信者側にコールバックするようにすることができる。接続ができない時には、話中、回線障害、相手側不在等の種々の要件があり、諸条件に合わせた接続態様処理を行う。
【0036】
次に、上記した特定者接続ヒストリーデータベースにおける蓄積手法について、図7を参照して説明する。このデータベースは、入力した音声データを文言毎に第1の声紋データから第nの声紋データに分解して蓄積する構成となっており、且つその中で使用頻度の多い順に並び替えを行って優先順位を付けて応答性を速くした構成となっている。
【0037】
例えば、「甲さん」が発声した音声信号が▲1▼「Cさん」であれば、「C」と「さん」が第1及び第2の声紋データとなる。▲4▼「oo会社のBさん」であれば、「oo会社」が第1の声紋データ、「B」が第2の声紋データ、「さん」が第3の声紋データとなる。このようにして蓄積されているデータベースの検索において、例えば▲4▼の場合には第1の声紋データ「経理」と第2の声紋データ「B」が一致すれば「経理のBさん」であると判断して、「eeee」に電話することができる。このようにして一つの文言と、主語述語に分解して、その分解した文言との突き合わせを行えばよいことになる。尚、このような検索手法に限定されることなく、要は、言葉での要求に対応したデータベースであればよい。
【0038】
発信者側再音声入力処理ルーチンは、図8に示すように、特定者の音声データを再試行するルーチンであり、先ず、特定者の音声調整をする(ステップST65)。これは、予め取得してある特定者の音声データの基準値を変化させて特定者を特定するものであり、基準となるものは、過去に取得した特定者の音声データに基づいて特定者の音声調整をする。
【0039】
この特定者の音声調整をしても特定できない時には、実際に発信者側から音声の発声、実施例においては母音(アイウエオ)の発声要求をする(ステップST66、ST67)。この母音に限定することなく適宜、環境に合わせた基準音を発声させることにより特定者の特定音声データを調整することができる。
【0040】
母音の音声入力が行われると、入力された母音に基づく声紋と予め蓄積されている声紋特定データとの比較が行われる(ステップST69)。異なる場合には所定のカウント値になるまで繰り返し母音の入力による声紋特定データとの比較が行われる。もし所定のカウント値まで繰り返し声紋特定データの比較が行われてもNGの場合には特定者特定不能として終了する(ステップST70、ST71、ST72)。ステップST69において、もし、入力した母音の音声データと声紋特定データとが一致した時には、その一致した微少に異なる声紋特定データは蓄積しておき後の声紋特定をする際に使用される(ステップST70)。このようにして、外部環境と発信者の声紋の変化をその都度取り込んで蓄積しておくことにより、上述した翻訳機能を強化させることができ、音声の変化に幅のある声紋特定データを得ることができる。
【0041】
次に、図6において発生した接続相手側電話番号入力ルーチンについて、図9を参照して説明する。
【0042】
声紋解析が完了して相手先の電話番号が特定者接続ヒストリーデータベースに蓄積されていない場合には、新たに音声入力して相手先の電話番号を入力する必要がある。先ず、相手先電話番号が存在しない場合には相手先電話番号を入力するように発信者側に要求する(ステップST75)。
【0043】
この要求に応じて発信者側から相手先電話番号の入力があると、入力された電話番号を返答して正しいか否かの確認をする(ステップST76、ST77)。
【0044】
この相手先電話番号が正しい時には、図6に戻り、声紋データベースの更新を行うと共に、この新しい電話番号による接続を行う(ステップST78)。
【0045】
ステップST78において、音声入力された相手側電話番号が解読できなかったり、不適切な電話番号の場合には、再度返答要求することを所定回数行い、それでも解読不能の場合には相手先電話接続不能として処理する(ステップST79、ST80、ST81)。
【0046】
このようにして、声紋電話システムにおいては、電話機にて個々に認識する従来の方式(端末翻訳)に対して、声紋電話コールセンター13A(図2参照)にて一括して認識するセンター翻訳方式に改善することにより、先ず、声紋電話コールセンター13Aを呼び出し、音声にて「oo会社のAさんにつないで」といえば、声紋電話コールセンター13Aのコンピュータが音声を認識して、即、そのAさんに接続される。このようにしたことにより次に示すようなメリットが存在する。
【0047】
(1)声紋電話コールセンター13Aの大型コンピュータを使用するため、記憶容量は無限大となり、よって認識率(翻訳能力)が飛躍的に向上する。(2)電話機30を紛失したり、新製品に買い換えた場合でも、声紋電話コールセンター13Aにて電話帳(声紋データベース)に保存されているため変更作業が不要である。(3)電話帳の登録方法は声紋電話コールセンター13Aにて電話して、声にて登録が可能であり、誰でも簡単に使用することができる。(4)携帯電話機の文字盤が不要となり、文字盤の操作に不慣れ、又は見えにくい場所であっても使用する事が可能である。(4)文字盤やボタン(テンキー)が不要であり、その分電話機が小型化し、カード型や腕時計方式の電話機にすることが可能になる。
【0048】
次に、第2の実施の形態の声紋電話システムについて、図10を参照して説明する。
【0049】
第2の実施の形態の声紋電話システムは、図10に示すように、音声データを文章化してEメールの文書を作成して相手先に伝えるEメール機能を備えたシステムであり、その構成は、声紋電話機30と、交換機網等からなり電話の接続ができるネットワーク31と、このネットワーク31に接続することができる声紋電話コールセンター13Bと、不特定多数の相手方のEメールを受信して表示することができるディスプレイを備えた情報機器50とから構成されている。
【0050】
声紋電話機30は、図2(B)示した構成となっており、既に説明したのでその説明は省略する。
【0051】
声紋電話コールセンター13Bは、不特定多数の声紋電話機30からの接続要求に応じることができるセンターであり、声紋電話機30から要求した相手側の情報機器50に接続するための切換部40と、声紋電話機30からの音声データを受信する音声データ受信部41と、受信した音声データの声紋を解析して特定の音声データであることを認識するための声紋解析部42と、声紋解析部42で得られた特定の音声データに基づいて、その中に含まれている音声データにより相手先の情報機器50に接続する電話番号等を検索する声紋検索部43と、声紋検索部43の要求により検索され、特定の音声データを有する特定者による接続要求等のデータが蓄積してある声紋データベース44と、音声データに「Eメール」のキーワードを認識した時に、音声データを文章に変換する音声データ文章変換部51と、特定者接続ヒストリーデータベース(図7参照)を検索して得られたデータに基づいて相手先の情報機器50に接続する相手先接続部52とから構成されている。
【0052】
情報機器50は、少なくとも電話機能を有し且つディスプレイを備えた機器であり、例えば電話機とパソコンを組み合わせた構成でも良く、その構成は決められたものではない。
【0053】
このような構成からなる声紋電話システムにおける一般的な処理形態は、発信側の声紋電話機30のパワーがオンになると自動的に声紋電話コールセンター13Bを呼び出し、声紋電話コールセンター13Bと接続状態になると、その音声データは声紋電話コールセンター13Bで受信され、声紋識別及び解読がなされる。
【0054】
声紋解読が成功すると、次に、音声データに含まれている内容、この場合「Eメール」というキーワードのデータを確認する、ない場合には他の処理ルーチンに行き、「Eメール」であると判断した場合には、音声データに含まれている音声文章の文章化を行い記憶する。同時に相手先を特定するためのデータ、例えば「Aさん」というデータに基づいて特定者接続ヒストリーデータベース(図7参照)の検索がなされ、過去に使用したものであること又は予め入力してある「Aさん」のデータを検索して電話番号を確保する。
【0055】
相手側の「Aさん」の電話を呼び出す行為が開始すると共に、発信側と着信側とが接続できるように切り替えることにより、発信側の「甲さん」は着信側の「Aさん」に接続し、Eメールデータを相手先に送信することができるのである。尚、「Eメール」というキーワードは適宜変更する事ができることは勿論のことである。
【0056】
その他の声紋データベース、声紋電話コールセンターの呼び出し等は第1の実施の形態で説明した声紋電話システムと同様であるので、その説明は省略する。
【0057】
次に、第3の実施の形態の声紋電話システムについて、図11を参照して説明する。
【0058】
第3の実施の形態の声紋電話システムは、図11に示すように、音声データを文章化したテキストデータを取り込み表示することができるワープロ機能を備えたシステムであり、その構成は、声紋電話機を備えた情報機器30Aと、交換機網等からなり電話の接続ができるネットワーク31と、このネットワーク31に接続することができる声紋電話コールセンター13Cとから構成されている。
【0059】
声紋電話機を備えた情報機器30Aは、声紋電話機とディスプレイを備えた機器、例えばパソコンとから構成され、声紋電話機は第1の実施の形態の図2(B)で説明した構成となっており、既に説明したのでその説明は省略する。
【0060】
声紋電話コールセンター13Cは、不特定多数の情報機器30Aからの接続要求に応じることができるセンターであり、情報機器30Aからの音声データを受信する音声データ受信部41と、受信した音声データの声紋を解析して特定の音声データであることを認識するための声紋解析部42と、声紋解析部42で得られた特定の音声データに基づいて、その中に含まれている音声データにより特定者と認識する声紋検索部43と、声紋検索部43の要求により検索され、特定の音声データを有する特定者による接続要求等のデータが蓄積してある声紋データベース44と、「ワープロ」のキーワードを認識して音声データを文章化してテキストデータを作成すると共に文書を整列する文書変換部60と、この整列された文書をディスプレイに表示する音声送信部61とから構成されている。
【0061】
このような構成からなる声紋電話システムにおける一般的な処理形態は、発信側の情報機器30Aが声紋電話コールセンター13Cを呼び出し、声紋電話コールセンター13Cが接続状態になると、その音声データは声紋電話コールセンター13Cで受信され、声紋識別及び解読がなされる。
【0062】
声紋解読が成功すると、次に、音声データに含まれている内容、この場合「ワープロ」というキーワードのデータを確認する。ない場合には他の処理ルーチンに行き、「ワープロ」であると判断した場合には、音声データに含まれている音声文章の文章化(テキストデータの作成)を行い整列して記憶する。
【0063】
このようにして、音声データが文書化されたものは音声送信部61から情報機器30Aのディスプレイに送られ表示される。従って、情報機器30Aを使用しているものは、「ワープロ」というキーワードの音声を発した後に、文書化したい文言を発声すれば、その言葉がテキストデータとなって、ディスプレイに表示されるのである。このようなことが簡単にできるのは、声紋電話コールセンター13Cにおいて専門的に音声解読及び音声データのテキストデータ化をするから実現できるのである。尚、「ワープロ」というキーワードはこれに限定されることなく、学習機能により蓄積されたキーワードでもよく、その設定は適宜設定変更できることは勿論のことである。
【0064】
その他の声紋データベース(特定者接続ヒストリーデータベース)、声紋電話コールセンターの呼び出し等は第1の実施の形態で説明した声紋電話システムと同様であるので、その説明は省略する。
【0065】
次に、第4の実施の形態の声紋電話システムについて、図12を参照して説明する。
【0066】
第4の実施の形態の声紋電話システムは、図12に示すように、音声データを取り込んで音声によりインターネットにアクセスすることができるインターネットアクセス機能を備えたシステムであり、その構成は、声紋電話機を備えた情報機器30Aと、交換機網等からなり電話の接続ができるネットワーク31と、このネットワーク31に接続することができる声紋電話コールセンター13Dとから構成されている。
【0067】
声紋電話機を備えた情報機器30Aは、声紋電話機とディスプレイを備えた機器とから構成され、声紋電話機は、第1の実施の形態の図2(B)を用いて既に説明してあるのでその説明は省略する。
【0068】
声紋電話コールセンター13Dは、不特定多数の声紋電話機からの接続要求に応じることができるセンターであり、声紋電話機からの音声データを受信する音声データ受信部41と、受信した音声データの声紋を解析して特定の音声データであることを認識するための声紋解析部42と、声紋解析部42で得られた特定の音声データに基づいて、その中に含まれている音声データによりインターネットにアクセスするための相手先の情報機器に接続する電話番号等を検索する声紋検索部43と、声紋検索部43の要求により検索され、特定の音声データを有する特定者による接続要求等のデータが蓄積してある声紋データベース44と、「インターネット」のキーワードを認識してインターネットにアクセスするインターネットアクセス部65と、インターネットのアクセスに際してアクセス用の音声を入力するインターネットアクセス用音声入力部66と、インターネットをアクセスして得られたデータを音声データに基づいて取捨選択してインターネットデータベース68に蓄積するインターネットアクセスデータ部67と、所望のアクセスデータを情報機器30Aのディスプレイ側に送るデータ送信部69とから構成されている。
【0069】
このような構成からなる声紋電話システムにおける一般的な処理形態は、発信側の情報機器30Aが声紋電話機を利用して声紋電話コールセンター13Dを自動又は手動音声で呼び出し、声紋電話コールセンター13Dが接続状態になると、声紋電話機からの音声データは声紋電話コールセンター13Dで受理され、声紋解析部42により声紋識別及び解読がなされる。
【0070】
声紋解読が成功すると、次に、音声データに含まれている内容、この場合「インターネット」というキーワードデータを確認する、ない場合には他の処理ルーチンに行き、「インターネット」であると認識した場合には、インターネットをアクセスするためにネットワークに接続する。インターネットにアクセスしたデータはデータ送信部69を介して情報機器30Aのディスプレイに表示される。利用者は、このディスプレイの表示に対して音声により応答すると、その応答した音声データが声紋電話コールセンター13Dに送信され、インターネットへの応答となりアクセスを遂行させる。
【0071】
このようにして、インターネットをアクセスして得られたデータはデータ送信部69からディスプレイに逐次送られ表示されるため、声紋電話機を使用しているものは、「インターネット」というキーワードの音声を発した後に、ディスプレイに表示されるインターネット情報を見ながら入力する文言を発声すれば、その言葉に基づいてインターネットをアクセスすることができるのである。このようなことが簡単にできるのは、声紋電話コールセンター13Dにおいて専門的に音声解読及び音声データを解析する機能及び学習機能が有効的に働くから実現できるのである。尚、「インターネット」というキーワードは、好みのキーワードに設定変更できることは勿論のことである。
【0072】
その他の声紋データベース(特定者接続ヒストリーデータベース)、声紋電話コールセンターの呼び出し等は第1の実施の形態で説明した声紋電話システムと同様であるので、その説明は省略する。
【0073】
次に、第5の実施の形態の声紋電話システムについて、図13を参照して説明する。
【0074】
第5の実施の形態の声紋電話システムは、図13に示すように、特定の声紋を有する特定者の認証をすることで音声による電子商取引ができるシステムであり、その構成は、声紋電話機を備えた情報機器30Aと、交換機網等からなり電話の接続ができるネットワーク31と、このネットワーク31に接続することができる声紋電話コールセンター13Eとから構成されている。
【0075】
声紋電話機を備えた情報機器30Aは、声紋電話機とディスプレイを備えた機器、例えばパソコンとから構成され、声紋電話機は、第1の実施の形態の図2(B)を用いて既に説明してあるのでその説明は省略する。
【0076】
声紋電話コールセンター13Eは、不特定多数の声紋電話機からの接続要求に応じることができるセンターであり、情報機器30Aの声紋電話機からの音声データを受信する音声データ受信部41と、受信した音声データの声紋を解析して特定の音声データであることを認識するための声紋解析部42と、声紋解析部42で得られた特定の音声データに基づいて特定者を特定すると共に声紋データベース44に蓄積してある暗唱番号、ショッピング情報、過去の決済状態情報等を検索認証する声紋検索部43と、商取引用キーワード、例えば「ショッピング」のキーワードを認識してバーチャルショッピング75にアクセスするショッピングアクセス部70と、バーチャルショッピング75にアクセスして実際の商品の状態等を視認するための商品検索部71と、このバーチャルショッピングをアクセスして得られた商品データを情報機器30Aに送信するデータ送信部72と、所望の商品を検索してヒットした場合に、その決済を行う決済部73とから構成されている。
【0077】
このような構成からなる声紋電話システムにおける一般的な処理形態は、発信側の情報機器30Aの声紋電話機が自動又は手動音声により声紋電話コールセンター13Eを呼び出し、声紋電話コールセンター13Eが接続状態になると、その音声データは声紋電話コールセンター13Eで受信され、声紋解析部42により声紋識別及び解読がなされる。
【0078】
声紋解読が成功すると、次に、音声データに含まれている内容、この場合商取引用キーワードの「ショッピング」というキーワードデータを確認する、ない場合には他の処理ルーチンに行き、「ショッピング」であると判断した場合には、声紋検索部43で検索した内容の内、ショッピング情報や決済情報も基づきショッピング可能条件を認識した後に、ショッピング可能であればバーチャルショッピング75をアクセスするためにネットワーク31に接続する。バーチャルショッピング75にアクセスしたデータはデータ送信部72を介して情報機器30Aのディスプレイに表示される。利用者は、この情報機器30Aのディスプレイの表示に対して音声により応答すると、その応答した音声データが声紋電話コールセンター13Eに送信され、バーチャルショッピング75をアクセスして表示した内容に対する応答となる。
【0079】
このようにして、バーチャルショッピング75をアクセスして得られたデータはデータ送信部72から情報機器30Aのディスプレイに送られて表示されるため、声紋電話機を使用しているものは、「ショッピング」というキーワードの音声を発した後に、ディスプレイに表示されるバーチャルショッピング情報を見ながら入力する文言を発声すれば、その言葉に基づいてバーチャルショッピング75をアクセスすることができるのである。このようなことが簡単にできるのは、声紋電話コールセンターにおいて専門的に音声解読及び音声データを解析する機能及び学習機能が有効的に働くから実現できるのである。尚、商取引用キーワードの「ショッピング」というキーワードは設定変更できることは勿論のことである。例えば、「XXX(男性用)のYYY(セーター)が欲しい」、「XXX(男性用)のYYY(セーター)が買いたい」、「YYY(セーター)が欲しい」、「YYY(セーター)が買いたい」というように言葉でショッピングを要望したとすると、この「XXX」と「YYY」の項目を検索入力データとしてバーチャルショッピング75をアクセスして、その結果をディスプレイに表示して好みの商品を選ぶことができる。又、ショッピングに限定したが商取引全体に適用できることは勿論のことである。
【0080】
このようにして、所望のショッッピングが成立して商品がヒットすると、次に決済部73により商品と金額との決済をする必要がある。この決済は、声紋電話コールセンター13Eに予め設定されている暗唱番号や提携ローン等の手段により行われる。従って、この声紋電話コールセンター13Eは、声紋により特定された特定者に関するショッッピング情報及び決済情報を常に把握している構成となっているため、決済においても、その情報を利用して円滑な決済が行われる。決済が終了すると一連の商取引は終了する。
【0081】
その他の声紋データベース(特定者接続ヒストリーデータベース)、声紋電話コールセンター13Eの呼び出し等は第1の実施の形態で説明した声紋電話システムと同様であるので、その説明は省略する。
【0082】
次に、第6の実施の形態の声紋電話システムについて図14を参照して説明する。
【0083】
第6の実施の形態の声紋電話システムは、通常一般に普及している電話機を利用して声紋により相手先に接続して電話をするものであり、その構成は、図14に示すように、少なくともマイク及びスピーカ及びテンキー等のテンキーを備えている電話機(実施例において携帯電話機)80と、交換機網等の相手側に電話ができるように接続ができるネットワーク31と、このネットワーク31に接続することができる声紋電話コールセンター13Fと、不特定多数の相手方の電話機(実施例において携帯電話機)80とから構成されている。
【0084】
声紋電話コールセンター13Fは、不特定多数の電話機80からの接続要求に応じることができるセンターであり、特定の電話機80から要求した相手側の電話機80aに接続するための切換部40と、電話機80からのテンキー等のテンキーに応答するテンキー応答接続部81と、特定の電話機80と接続状態の時に音声データを受信する音声データ入力部41と、受信した音声データの声紋を解析して特定の音声データであることを認識するための声紋解析部42と、声紋解析部42で得られた特定の音声データに基づいて、その中に含まれている音声データにより相手先に接続する電話番号等を検索する声紋検索部43と、声紋検索部43の要求により検索され、特定の音声データを有する特定者による接続要求等のデータが蓄積してある声紋データベース(特定者接続ヒストリーデータベース)44と、検索されたデータに基づいて相手先の電話機80aに接続する相手先接続部45とから構成されている。
【0085】
このような構成からなる声紋電話システムにおける一般的な処理形態は、図15に示すように、発信側の「甲さん」が所有する電話機80から声紋電話コールセンターを呼び出すためにテンキーインする(ステップST90)。
【0086】
すると、交換機網を介して声紋電話コールセンター13Fを呼び出すテンキーによる発呼動作をするとダイヤル応答接続部81が起動して電話機80と声紋電話コールセンター13Fと接続状態にする(ステップST91)。
【0087】
「甲さん」が所有する電話機80と声紋電話コールセンター13Fとが接続状態になり、電話機80から相手先を呼び出すための音声が発生すると、その音声データは声紋電話コールセンター13Fで受信され、声紋解析部42により声紋識別及び解読がなされる(ステップST92、ST93、ST94)。
【0088】
声紋解読が成功すると、次に、声紋検索部43により音声データに含まれている相手先を特定するためのデータ、例えば「Aさん」というデータ(キータームになる)に基づいてデータベースの検索がなされ、過去に使用した又は予め入力してある「Aさん」のデータを検索する。ヒットすると、相手先接続部45によりその相手側である「Aさん」の電話を呼び出す(ステップST95)。
【0089】
相手側の「Aさん」の電話を呼び出す行為が開始すると共に、切換部40を発信側と着信側とに接続を切り替えることにより、発信側の「甲さん」は着信側の「Aさん」に接続し会話等ができるのである(ステップST96)。
【0090】
以上のようにして、発信者側の電話機80においては、テンキーインして声紋電話コールセンター13Fに接続さえすれば、電話機への音声による要求に基づいてコールセンターが自動的に相手方と接続をしてくれるのである。この接続するに際して使用する声紋データベース(特定者接続ヒストリーデータベース)、声紋データベースに相手側電話番号を入力するルーチン等は第1の実施の形態で説明したものと同じであるのでその説明は省略する。
【0091】
このようにして、声紋電話コールセンター13Fを設置することにより、一般家庭や企業に普及している電話機(黒電話機等)や携帯電話機等あらゆる電話機を使用して電話番号を使わずに音声により相手方を呼び出して会話をすることができるようになる。
【0092】
又、第2〜第5の実施の形態で説明した声紋電話機に変えて一般のテンキー式の電話機にすれば、声紋電話コールセンター13Fを呼び出すのがテンキーインで行うか音声で行うかの違いだけであり、接続状態になった後においては様々機能、例えば、音声Eメール(第2の実施の形態)、音声ワープロ(第3の実施の形態)、音声インターネット(第4の実施の形態)、音声電子商取引(第5の実施の形態)の全てに適用できる。
【0093】
次に、第7の実施の形態の声紋電話システムについて図15を参照して説明する。
【0094】
第7の実施の形態の声紋電話システムは、声紋の解読を、予め一致しているアナログ音声信号を記録しておき、電話機から入力した音声信号とこの一致しているアナログ音声信号とを比較することにより行うようにしたことである。
【0095】
このようなアナログ信号を利用した声紋を解読するための構成は、図16に示すように、電話機100からの音声を入力してアナログ信号を生成するアナログ信号生成部110と、この生成されたアナログ信号を蓄積するアナログデータ蓄積部120と、生成されたアナログ信号をデジタル値に変換するA/D変換部130と、デジタル値に変換された音声データと予め一致と見なされている音声信号とを比較する声紋一致回路140と、デジタル値で一致した音声信号をアナログ信号で比較する比較回路150と、アナログ信号で一致した時にその音声信号を抽出するアナログ音声一致回路160と、一致したアナログ音声信号を蓄積する声紋一致アナログデータ蓄積部170と、一致したアナログ音声信号をデジタルに変換するA/D変換部180とから構成されている。
【0096】
このような構成からなるアナログ信号による声紋の解読は、先ず、入力した音声信号をデジタル値で一致するかどうかの判定をし、もし一致したときには、予めアナログ信号で保存している声紋一致アナログ信号とでアナログ値により比較するようにして、より高度な声紋の比較を行うことにより、声紋の一致作業が極めて高精度に行えるのである。
【0097】
【発明の効果】
以上説明したように、本発明に係る声紋電話システムは、音声データの声紋を認識して相手側に電話等をする声紋電話コールセンターを設けたことにより、電話番号等を選択しなくとも、通常呼んでいる言葉からなる音声データにより所望の相手側に接続することができるという効果がある。
【図面の簡単な説明】
【図1】本願発明に係る声紋電話システムの全体構成を示した説明図である。
【図2】同第1の実施の形態の声紋電話システムにおいて相手方に電話接続するための全体構成図である。
【図3】同声紋電話コールセンターを経由して相手先と接続するための一般的な接続形態を示したブロック図である。
【図4】同声紋電話機から声紋電話コールセンターの呼び出しルーチンを示したフローチャートである。
【図5】同声紋電話機から声紋電話コールセンターの呼び出しルーチンを示したフローチャートである。
【図6】同声紋電話コールセンターでの処理ルーチンを示したフローチャートである。
【図7】同声紋データベースの一部内容を示したものである。
【図8】同発信者側再音声入力処理ルーチンを示したフローチャートである。
【図9】同接続相手側電話番号入力ルーチンのフローチャートである。
【図10】第2の実施の形態の声紋電話システムのうち、声紋式音声Eメールシステムの処理ルーチンを示したフローチャートである。
【図11】第3の実施の形態の声紋電話システムのうち、声紋音声ワープロシステムの処理ルーチンを示したフローチャートである。
【図12】第4の実施の形態の声紋電話システムのうち、声紋音声インターネットシステムの処理ルーチンを示したフローチャートである。
【図13】第5の実施の形態の声紋電話システムのうち、声紋式音声電子商取引システムの処理ルーチンを示したフローチャートである。
【図14】第6の実施の形態の声紋電話システムのうち、テンキー式声紋電話システムの全体構成図である。
【図15】同テンキー式による一般的な接続形態を示したブロック図である。
【図16】第7の実施の形態の声紋電話システムのうち、アナログ信号を用いた声紋の解読を行うための要部ブロック図である。
【符号の説明】
10;声紋式電話機、11;テンキー式電話機、13;声紋電話コールセンター、13A;声紋電話コールセンター、13B;声紋電話コールセンター、13C;声紋電話コールセンター、13D;声紋電話コールセンター、13E;声紋電話コールセンター、14;音声データ、15;声紋解読、16;翻訳機能、17;相手先接続、18;音声Eメール、19;音声ワープロ、20;音声インターネット、21;音声電子商取引、30、声紋電話機、31;ネットワーク、32;電話機、33;マイク、34;スピーカ、35;パワー手段、36;接続部、37;データ送受信部、40;切換部、41;音声データ受信部、42;声紋解析部、43;声紋検索部、44;声紋データベース(特定者接続ヒストリーデータベース)、45;相手先接続部、50;情報機器、51;音声データ文章変換部、52;相手先接続部、65;インターネットアクセス部、66;インターネットアクセス用音声入力部、67;インターネットアクセスデータ部、68;インターネットデータベース、69;データ送信部、70;ショッピングアクセス部、71;商品検索部、72;データ送信部、73;決済部、80;電話機、80a;電話機、81;ダイヤル応答接続部、100;電話機、110;アナログ信号生成部、120;アナログデータ蓄積部、130;A/D変換部、140;デジタル声紋一致回路、150;比較回路、160;アナログ音声一致回路、170;声紋一致アナログデータ蓄積部、180;A/D変換部[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a voiceprint telephone system, and more particularly to a voiceprint telephone system that recognizes specific data from a voiceprint of voice data from a telephone and enables connection to the other party.
[0002]
[Prior art]
Telephones in the prior art, especially mobile phones, are rapidly becoming popular, and they add value in addition to this conversation because they use a conventional numeric keypad and compression function to call a specific destination and have a conversation. There are various ways to use such services.
[0003]
[Problems to be solved by the invention]
However, in the above-described telephone set, particularly a mobile phone, a voice recognition telephone that recognizes voice is already well known. However, since the telephone or the terminal that receives voice is recognized as a real problem, the voice recognition rate is low. There is a problem of being bad. When the mobile phone is lost, it is necessary to re-create the telephone directory registered in the lost mobile phone, and it is necessary to change the phone number every time the phone number is changed. Furthermore, there is no problem with using only the phone, but it is necessary to create functions other than the numeric keypad for operations such as registration of phone numbers and reservations. Therefore, the current situation is that it is advertised but not actually used. In addition, since the operation surface of a mobile phone is generally small, the letters and numbers to be displayed are also small, and it has been pointed out that it is more difficult to see when used in a person with low vision or in a dark place.
[0004]
Therefore, there is a problem that a function derived from this method must be solved based on a method in which a telephone can call and talk to a desired partner without using a numeric keypad.
[0005]
[Means for Solving the Problems]
In order to solve the above problems, the voiceprint telephone system according to the present invention is configured as follows.
[0006]
(1) A telephone having at least a microphone, a speaker, and power means, and the telephone calls a voiceprint telephone call center having a function of decoding a predetermined voiceprint when the power means can make a call. The voice data inputted from the microphone is decoded at the voice print telephone call center side, and when the decoded voice print is recognized as the specific voice data, the voice data is stored. A voiceprint telephone system having a function of calling a destination based on a stored destination number corresponding to the stored voice data if it is stored as a result of the search .
[0007]
As described above, a call center is provided between the telephone and a specific voice data is recognized by a voiceprint so that a conversation or the like can be performed with the other party. By storing the number of the other party once used as voice data, for example, it becomes possible to connect to the other party in a normal conversation format such as “Mr. A who went yesterday” or “B-kun”.
[0008]
DETAILED DESCRIPTION OF THE INVENTION
Next, various embodiments of a voiceprint telephone system according to the present invention will be described with reference to the drawings.
[0009]
As shown in FIG. 1, the voiceprint telephone system according to the first embodiment of the present invention is a system in which a voiceprint
[0010]
The voice print
[0011]
Such a
[0012]
The qualitative learning master function, which should be called artificial intelligence, is the center of the
[0013]
Using such a translation function, a desired item is determined from the
[0014]
As shown in FIG. 2, the configuration in the routine for connecting to the other party and the processing form thereof can be connected to the
[0015]
As shown in FIG. 2B, the
[0016]
As shown in FIG. 2A, the voiceprint
[0017]
As shown in FIG. 3, a general processing form in the voiceprint telephone system having such a configuration is as follows. When the power of the
[0018]
When the
[0019]
If the voiceprint decoding is successful, the database is searched based on the data for identifying the other party included in the voice data, for example, “Mr. A”, which has been used in the past or entered in advance. Search for data of a certain “Mr. A”. When a hit is made, the telephone of “Mr. A” who is the other party is called (steps ST13 and ST14).
[0020]
The act of calling the other party's “Mr. A” phone starts, and by switching the connection between the caller and the callee, the caller “Mr. Ko” connects to the caller “Mr. A” and has a conversation, etc. (Steps ST15 and ST16).
[0021]
Now, only in such a general connection state, the caller side and the callee side cannot be connected, and various processes are necessary for connection. In the following, with reference to the overall configuration diagram shown in FIG. 2, the description will be divided into calling from the calling side, voiceprint decoding, search by voiceprint database, and the like.
[0022]
Invoking the voiceprint
[0023]
Thus, when the switch is turned on, automatic calling is performed by a specific telephone number for calling the voiceprint
[0024]
An automatic call is made, a connection is attempted, and when the connection is successfully completed, a voice input timer is started and a voice input from the microphone is waited. If there is no voice input within a predetermined time after the timer starts, the timer will time out and turn off the power switch (ST23, ST24, ST25, ST26). When an audio signal is input within the timer time, the input audio data is sent to the voiceprint
[0025]
In step ST23, if the connection by automatic call fails, the recall counter is incremented, and if it is less than the preset count value, automatic call retry is attempted again (steps ST27, ST28, ST29). ). If the value of the recall count reaches a preset value or more, the first telephone number by automatic call is terminated, and the automatic call is continued by switching to the next second telephone number (step). ST30, ST31). Here, if the connection fails even if all of the automatic call telephone numbers are used, a manual voice number calling routine is performed in order to establish a manual connection.
[0026]
FIG. 5 shows a manual voice number calling routine, which manually calls the voiceprint
[0027]
The
[0028]
When the connection is completed, the voice input timer shown in FIG. 4 is started and the voice input on the caller side is awaited (step ST43).
[0029]
In step ST43, if the connection fails and the recall count value is equal to or smaller than the predetermined value, the voiceprint telephone call center is called again to retry (steps ST44, ST45, ST46). In step ST43, if the connection fails, the recall counter is incremented, and if the count value is equal to or greater than a predetermined value, the connection is treated as impossible, and the connection to the voiceprint
[0030]
Next, processing on the voiceprint
[0031]
First, assuming that the voice input of “Mr. A” is “Mr. AA”, the voice signal of “Mr. AA” is input to the voice print
[0032]
In step ST53, when the detected voice data cannot be recognized as a specific person unique to “Mr. A”, the process goes to the caller side re-voice input processing routine. When it is recognized as a specific person, the specific person ("Mr. Ko") connection history database is searched (step ST54). In this connection history database, the name (full name) of the other party that the specific person ("Mr. Kou") has requested to connect to or has actually connected, or the pen name that is called in the normal conversation is stored. This is a configuration in which the order is sorted by the above method and a priority is assigned according to the frequency of use. This point will be described later with reference to FIG. For example, in the database shown in FIG. 6, {circle around (1)} a month b day c is connected to “Mr. C”, and the connection telephone number at that time is “aaa”. (2) At the time of a month b day d, connection is made with “Mr. D”, and the connection telephone number at that time is “bbbb”. (3) At the time of a month b day e, “AA” is connected, and the connection telephone number at that time is “cccc”.
[0033]
Therefore, “Mr. AA” included in the voice input data from the caller (“Mr. Ko”) this time is found to be the same person as “Mr. AA” at the time of e. It is possible to determine that there is a search target person, update the database, connect to the connection target person, and at the same time, call back the specified “Mr. A” information to the caller side (step ST55). , ST56, ST57).
[0034]
Here, if the search target person does not exist in the database, the process goes to the connection partner processing routine, and a procedure for connecting to the connection partner for the first time is performed (step ST58).
[0035]
When the connection with the other party is established, the switching unit 40 (see FIG. 3) is driven to switch the line and complete the connection with “Mr. AA” via the network. A conversation with “AA” is established (step ST59). In the case of absence, even if connection is possible, there is a so-called voice message recording function that accumulates voice data and transmits a message with a message and a message to the other party (step ST60). Further, in addition to the voice mail recording function, a voice reservation call function for calling at a predetermined time by analyzing voice data may be added. In the case of this voice reservation call, the caller side can be called back at a specific time before the reserved time. When connection is not possible, there are various requirements such as busy, line failure, absence of the other party, and connection mode processing is performed according to various conditions.
[0036]
Next, an accumulation method in the above-described specific person connection history database will be described with reference to FIG. This database has a configuration in which input voice data is decomposed and accumulated from the first voice print data to the nth voice print data for each wording, and is rearranged in descending order of frequency of use and prioritized. It has a structure in which ranking is given and responsiveness is made faster.
[0037]
For example, if the voice signal uttered by “Mr. Ko” is (1) “Mr. C”, “C” and “Mr.” are the first and second voiceprint data. {Circle around (4)} “O company company B” is the first voice print data, “B” is the second voice print data, and “san” is the third voice print data. In the search of the database stored in this way, for example, in the case of (4), if the first voiceprint data “Accounting” and the second voiceprint data “B” match, “Mr. B of accounting” is obtained. It is possible to call “eeee”. In this way, it is only necessary to decompose one sentence and the subject predicate and match the decomposed sentence. It should be noted that the database is not limited to such a search method, and may be any database corresponding to a request in words.
[0038]
As shown in FIG. 8, the caller side re-speech input processing routine is a routine for retrying the voice data of the specific person. First, the specific person's voice is adjusted (step ST65). This is to specify the specific person by changing the reference value of the voice data of the specific person acquired in advance, and the reference is based on the voice data of the specific person acquired in the past. Adjust the audio.
[0039]
When the voice cannot be specified even by adjusting the voice of the specific person, the voice is actually requested from the caller side, and in the embodiment, a vowel voice is requested (steps ST66 and ST67). Without being limited to this vowel, the specific sound data of the specific person can be adjusted by appropriately uttering a reference sound that matches the environment.
[0040]
When the vowel voice is input, the voice print based on the input vowel is compared with the voice print specifying data stored in advance (step ST69). If they are different from each other, the comparison with the voiceprint specifying data by repeatedly inputting vowels is performed until a predetermined count value is reached. Even if the voice print specifying data is repeatedly compared up to a predetermined count value, in the case of NG, it is determined that the specific person cannot be specified, and the process ends (steps ST70, ST71, ST72). In step ST69, if the input vowel voice data and the voiceprint identification data match, the slightly different voiceprint identification data that coincides is stored and used for later voiceprint identification (step ST70). ). In this way, by capturing and accumulating changes in the external environment and the voiceprint of the caller each time, the translation function described above can be strengthened, and voiceprint specific data having a wide range of voice changes can be obtained. Can do.
[0041]
Next, the connection partner side telephone number input routine generated in FIG. 6 will be described with reference to FIG.
[0042]
When the voiceprint analysis is completed and the other party's telephone number is not stored in the specific person connection history database, it is necessary to newly input voice and input the other party's telephone number. First, if the destination telephone number does not exist, the caller side is requested to input the destination telephone number (step ST75).
[0043]
In response to this request, when there is an input of the other party's telephone number from the sender side, the input telephone number is returned to check whether it is correct (steps ST76 and ST77).
[0044]
When the destination telephone number is correct, the process returns to FIG. 6 to update the voiceprint database and connect with the new telephone number (step ST78).
[0045]
In step ST78, if the other party's telephone number input by voice cannot be decoded or is an inappropriate telephone number, a response request is made again a predetermined number of times. (Steps ST79, ST80, ST81).
[0046]
In this way, the voiceprint telephone system is improved to a central translation system that recognizes the voiceprint
[0047]
(1) Since the large-scale computer of the voice print
[0048]
Next, a voiceprint telephone system according to a second embodiment will be described with reference to FIG.
[0049]
As shown in FIG. 10, the voiceprint telephone system according to the second embodiment is a system having an e-mail function in which voice data is converted into text, an e-mail document is created and transmitted to the other party, and the configuration is as follows. The
[0050]
The
[0051]
The voiceprint telephone call center 13B is a center that can respond to connection requests from an unspecified number of
[0052]
The
[0053]
A general processing form in the voiceprint telephone system having such a configuration is that when the
[0054]
If the voiceprint decoding is successful, the contents included in the voice data, in this case, the keyword data “E-mail” are checked. If not, the process goes to another processing routine. If it is determined, the speech text included in the speech data is converted into a sentence and stored. At the same time, the specific person connection history database (see FIG. 7) is searched based on the data for specifying the other party, for example, the data “Mr. A”, and it is used in the past or inputted in advance. Search for "Mr. A"'s data and secure a phone number.
[0055]
The act of calling the phone of “Mr. A” on the other side starts, and the caller “Mr. A” connects to “Mr. A” on the called side by switching so that the calling side and the called side can be connected. Email data can be sent to the other party. Of course, the keyword “E-mail” can be changed as appropriate.
[0056]
The other voiceprint database, calling of the voiceprint telephone call center, and the like are the same as those of the voiceprint telephone system described in the first embodiment, and thus description thereof is omitted.
[0057]
Next, a voiceprint telephone system according to a third embodiment will be described with reference to FIG.
[0058]
As shown in FIG. 11, the voiceprint telephone system according to the third embodiment is a system having a word processor function capable of capturing and displaying text data obtained by converting voice data into text, and the configuration thereof is a voiceprint telephone. It comprises an
[0059]
The
[0060]
The voiceprint telephone call center 13C is a center that can respond to connection requests from an unspecified number of
[0061]
A general processing form in the voiceprint telephone system having such a configuration is that when the
[0062]
If the voiceprint decoding is successful, the contents included in the voice data, in this case, the data of the keyword “word processor” are checked. If not, the process goes to another processing routine, and if it is determined that the word processor is “word processor”, the speech text included in the speech data is converted into text (created as text data) and stored in an aligned manner.
[0063]
In this way, the documented voice data is sent from the
[0064]
The other voiceprint database (specific person connection history database), calling of the voiceprint telephone call center, and the like are the same as those of the voiceprint telephone system described in the first embodiment, and thus description thereof is omitted.
[0065]
Next, a voiceprint telephone system according to a fourth embodiment will be described with reference to FIG.
[0066]
As shown in FIG. 12, the voiceprint telephone system according to the fourth embodiment is a system having an internet access function capable of capturing voice data and accessing the internet by voice. It comprises an
[0067]
The
[0068]
The voiceprint
[0069]
A general processing form in the voiceprint telephone system having such a configuration is that the originating
[0070]
If the voiceprint decoding is successful, then check the content contained in the voice data, in this case the keyword data “Internet”, if not, go to another processing routine and recognize it as “Internet” Connect to the network to access the Internet. The data accessed to the Internet is displayed on the display of the
[0071]
In this way, since data obtained by accessing the Internet is sequentially sent from the
[0072]
The other voiceprint database (specific person connection history database), calling of the voiceprint telephone call center, and the like are the same as those of the voiceprint telephone system described in the first embodiment, and thus description thereof is omitted.
[0073]
Next, a voiceprint telephone system according to a fifth embodiment will be described with reference to FIG.
[0074]
As shown in FIG. 13, the voiceprint telephone system of the fifth embodiment is a system capable of performing electronic commerce by voice by authenticating a specific person having a specific voiceprint, and the configuration includes a voiceprint telephone.
[0075]
The
[0076]
The voiceprint telephone call center 13E is a center that can respond to connection requests from an unspecified number of voiceprint telephones. The voiceprint telephone call center 13E receives voice data from the voiceprint telephone of the
[0077]
A general processing form in the voiceprint telephone system having such a configuration is that when the voiceprint telephone of the
[0078]
If the voiceprint decoding is successful, the contents included in the voice data, in this case, the keyword data “shopping” of the commercial transaction keyword is confirmed. If not, the process goes to another processing routine, and “shopping”. If it is determined, after recognizing the shopping possible condition based on the shopping information and the settlement information among the contents searched by the
[0079]
Thus, since the data obtained by accessing the
[0080]
In this way, when the desired shopping is established and the product is hit, the
[0081]
Since the other voiceprint database (specific person connection history database), calling of the voiceprint telephone call center 13E, and the like are the same as those of the voiceprint telephone system described in the first embodiment, the description thereof is omitted.
[0082]
Next, a voiceprint telephone system according to a sixth embodiment will be described with reference to FIG.
[0083]
The voiceprint telephone system according to the sixth embodiment is a system for making a call by connecting to the other party by a voiceprint using a telephone set that is generally spread, and the configuration is at least as shown in FIG. Connecting to a telephone 31 (a mobile phone in the embodiment) 80 having a numeric keypad such as a microphone, a speaker, and a numeric keypad, a
[0084]
The voiceprint
[0085]
As shown in FIG. 15, a general processing form in the voiceprint telephone system having such a configuration is a numeric keypad for calling the voiceprint telephone call center from the
[0086]
Then, when a calling operation is performed using the numeric keypad for calling the voiceprint
[0087]
When the
[0088]
If the voiceprint decoding is successful, the
[0089]
The act of calling the telephone of “Mr. A” on the other side starts, and the switching
[0090]
As described above, in the
[0091]
In this way, by setting up the voice print
[0092]
In addition, if the voice print telephone described in the second to fifth embodiments is replaced with a general ten-key telephone, only the difference between calling the voice print
[0093]
Next, a voiceprint telephone system according to a seventh embodiment will be described with reference to FIG.
[0094]
In the voiceprint telephone system according to the seventh embodiment, the analog voice signal that matches the voiceprint is recorded in advance, and the voice signal input from the telephone is compared with the matching analog voice signal. This is what we did.
[0095]
As shown in FIG. 16, the configuration for decoding a voiceprint using such an analog signal includes an analog
[0096]
In the decoding of a voice print by an analog signal having such a configuration, first, it is determined whether or not the input voice signal matches with a digital value. If they match, the voice print matching analog signal stored in advance as an analog signal is determined. Thus, the voice print matching operation can be performed with extremely high accuracy by comparing the voice prints by analog values and comparing the voice prints at a higher level.
[0097]
【The invention's effect】
As described above, the voiceprint telephone system according to the present invention provides a voiceprint telephone call center that recognizes a voiceprint of voice data and makes a call to the other party, so that a normal call can be made without selecting a telephone number or the like. There is an effect that it is possible to connect to a desired other party by voice data consisting of the words that appear.
[Brief description of the drawings]
FIG. 1 is an explanatory diagram showing the overall configuration of a voiceprint telephone system according to the present invention.
FIG. 2 is an overall configuration diagram for telephone connection to the other party in the voiceprint telephone system according to the first embodiment;
FIG. 3 is a block diagram showing a general connection form for connecting to the other party via the voice print telephone call center.
FIG. 4 is a flowchart showing a calling routine from a voice print telephone to a voice print telephone call center.
FIG. 5 is a flowchart showing a calling routine from a voice print telephone to a voice print telephone call center.
FIG. 6 is a flowchart showing a processing routine in the voice print telephone call center.
FIG. 7 shows a part of the contents of the voice print database.
FIG. 8 is a flowchart showing the same caller side re-voice input processing routine;
FIG. 9 is a flowchart of the other party telephone number input routine.
FIG. 10 is a flowchart showing a processing routine of a voiceprint type voice email system in the voiceprint telephone system of the second embodiment.
FIG. 11 is a flowchart showing a processing routine of a voiceprint voice word processor system in the voiceprint telephone system of the third embodiment.
FIG. 12 is a flowchart showing a processing routine of a voiceprint voice internet system in the voiceprint telephone system of the fourth embodiment.
FIG. 13 is a flowchart showing a processing routine of a voiceprint type voice electronic commerce system in the voiceprint telephone system of the fifth embodiment.
FIG. 14 is an overall configuration diagram of a numeric keypad voice print phone system in a voice print phone system according to a sixth embodiment;
FIG. 15 is a block diagram showing a general connection form using the numeric keypad.
FIG. 16 is a principal block diagram for decoding a voiceprint using an analog signal in the voiceprint telephone system according to the seventh embodiment;
[Explanation of symbols]
10; Voiceprint phone, 11; Tenkey phone, 13; Voiceprint phone call center, 13A; Voiceprint phone call center, 13B; Voiceprint phone call center, 13C; Voiceprint phone call center, 13D; Voiceprint phone call center, 13E; Voice data, 15; voiceprint decoding, 16; translation function, 17; destination connection, 18; voice email, 19; voice word processor, 20; voice Internet, 21; voice electronic commerce, 30, voiceprint phone, 31; 32; Telephone, 33; Microphone, 34; Speaker, 35; Power means, 36; Connection section, 37; Data transmission / reception section, 40; Switching section, 41; Voice data reception section, 42; Voiceprint analysis section, 43; Part 44; voiceprint database (specific person connection history database) 45; Hand connection unit, 50; information device, 51; voice data sentence conversion unit, 52; partner connection unit, 65; internet access unit, 66; voice input unit for internet access, 67; internet access data unit, 68; internet database 69; data transmission unit, 70; shopping access unit, 71; merchandise search unit, 72; data transmission unit, 73; settlement unit, 80; telephone, 80a; telephone, 81; dial response connection unit, 100; Analog signal generation unit, 120; analog data storage unit, 130; A / D conversion unit, 140; digital voiceprint matching circuit, 150; comparison circuit, 160; analog voice matching circuit, 170; voiceprint matching analog data storage unit, 180 ; A / D converter
Claims (1)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000241148A JP4812928B2 (en) | 2000-08-09 | 2000-08-09 | Voiceprint phone system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000241148A JP4812928B2 (en) | 2000-08-09 | 2000-08-09 | Voiceprint phone system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002057811A JP2002057811A (en) | 2002-02-22 |
JP4812928B2 true JP4812928B2 (en) | 2011-11-09 |
Family
ID=18732379
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000241148A Expired - Fee Related JP4812928B2 (en) | 2000-08-09 | 2000-08-09 | Voiceprint phone system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4812928B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116312567A (en) | 2010-02-18 | 2023-06-23 | 株式会社尼康 | Portable device and information processing system |
JP2015149780A (en) * | 2015-04-20 | 2015-08-20 | 株式会社ニコン | Information processing unit |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2559031B2 (en) * | 1986-09-01 | 1996-11-27 | 富士通株式会社 | Voice recognition system |
JPH04230152A (en) * | 1990-12-27 | 1992-08-19 | Daini Denden Kk | Help service system in busy state or non-reply in public network |
JPH0730629A (en) * | 1993-07-07 | 1995-01-31 | Yuhshin Co Ltd | Voice dialing device |
JPH07321940A (en) * | 1994-05-27 | 1995-12-08 | Sharp Corp | Telecontrol device |
JPH0851481A (en) * | 1994-08-05 | 1996-02-20 | Kokusai Denshin Denwa Co Ltd <Kdd> | Voice dialing service device |
JP3570017B2 (en) * | 1995-07-19 | 2004-09-29 | 村田機械株式会社 | Communication terminal device |
JPH09233187A (en) * | 1996-02-23 | 1997-09-05 | Toshiba Corp | Exchange system |
US5802149A (en) * | 1996-04-05 | 1998-09-01 | Lucent Technologies Inc. | On-line training of an automated-dialing directory |
JP4197195B2 (en) * | 1998-02-27 | 2008-12-17 | ヒューレット・パッカード・カンパニー | Providing audio information |
US6337899B1 (en) * | 1998-03-31 | 2002-01-08 | International Business Machines Corporation | Speaker verification for authorizing updates to user subscription service received by internet service provider (ISP) using an intelligent peripheral (IP) in an advanced intelligent network (AIN) |
JP2000215118A (en) * | 1999-01-21 | 2000-08-04 | Nec Corp | Method and device for vocal e-mail transmission |
-
2000
- 2000-08-09 JP JP2000241148A patent/JP4812928B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2002057811A (en) | 2002-02-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6580790B1 (en) | Calling assistance system and method | |
US6621892B1 (en) | System and method for converting electronic mail text to audio for telephonic delivery | |
EP0943203B1 (en) | Method and apparatus for locating a desired record in a telephone directory | |
US6243445B1 (en) | Method and apparatus for telephone data network access | |
AU673480B2 (en) | Voice command control and verification system and method | |
KR100689396B1 (en) | Apparatus and method of managing call history using speech recognition | |
US20090124240A1 (en) | System and a method for connecting telephone calls directly on the basis of a text query | |
JP2000013510A (en) | Automatic calling and data transfer processing system and method for providing automatic calling or message data processing | |
JPH09321894A (en) | Information processor | |
JP2003169147A (en) | Client response system and method | |
EP2050263A1 (en) | Interactive natural language calling system | |
KR100301219B1 (en) | Voice Portal Service System Using Speech Recognition/Text-to-Speech at Communication Network and Method thereof | |
US6581035B1 (en) | System and method for voice-enabled transactions | |
KR100363656B1 (en) | Internet service system using voice | |
US20050130635A1 (en) | Method of determining the technical address of a communication partner and telecommunications apparatus | |
JP4812928B2 (en) | Voiceprint phone system | |
JPH11272775A (en) | Information processing system for transaction by telephone | |
EP1076979A1 (en) | Personalized information system | |
JP3440015B2 (en) | Content registration device and recording medium recording the program | |
CA2383029A1 (en) | Public telephone name server network | |
KR100660063B1 (en) | System for providing service of transform text message into voice message and method thereof | |
KR100763306B1 (en) | Mobile phone for communicating a using of a multi-communication id and method of the same | |
US20040066953A1 (en) | Recognising people using a mobile appliance | |
JP4087787B2 (en) | User information registration system | |
JP2001313724A (en) | Method for vicariously executing reception of demand for materials |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070730 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090625 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090702 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090831 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100202 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100402 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100622 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100819 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101014 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101210 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110310 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110609 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20110616 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110726 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110824 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140902 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |