JP2017529711A - 音声確認のための方法、装置、及びシステム - Google Patents

音声確認のための方法、装置、及びシステム Download PDF

Info

Publication number
JP2017529711A
JP2017529711A JP2016559912A JP2016559912A JP2017529711A JP 2017529711 A JP2017529711 A JP 2017529711A JP 2016559912 A JP2016559912 A JP 2016559912A JP 2016559912 A JP2016559912 A JP 2016559912A JP 2017529711 A JP2017529711 A JP 2017529711A
Authority
JP
Japan
Prior art keywords
voice
voice confirmation
user
information
network side
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016559912A
Other languages
English (en)
Other versions
JP2017529711A5 (ja
JP6470306B2 (ja
Inventor
シャオハン ワン
シャオハン ワン
ヤン ドン
ヤン ドン
ヨン グアン
ヨン グアン
Original Assignee
バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド
バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド, バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド filed Critical バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド
Publication of JP2017529711A publication Critical patent/JP2017529711A/ja
Publication of JP2017529711A5 publication Critical patent/JP2017529711A5/ja
Application granted granted Critical
Publication of JP6470306B2 publication Critical patent/JP6470306B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/06Decision making techniques; Pattern matching strategies
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/32User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/30Payment architectures, schemes or protocols characterised by the use of specific devices or networks
    • G06Q20/32Payment architectures, schemes or protocols characterised by the use of specific devices or networks using wireless devices
    • G06Q20/325Payment architectures, schemes or protocols characterised by the use of specific devices or networks using wireless devices using wireless networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4014Identity check for transactions
    • G06Q20/40145Biometric identity checks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/22Interactive procedures; Man-machine interfaces
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/08Network architectures or network communication protocols for network security for authentication of entities
    • H04L63/0815Network architectures or network communication protocols for network security for authentication of entities providing single-sign-on or federations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/32Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols including means for verifying the identity or authority of a user of the system or for message authentication, e.g. authorization, entity authentication, data integrity or data verification, non-repudiation, key authentication or verification of credentials
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/40Network security protocols
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/38Graded-service arrangements, i.e. some subscribers prevented from establishing certain connections
    • H04M3/382Graded-service arrangements, i.e. some subscribers prevented from establishing certain connections using authorisation codes or passwords
    • H04M3/385Graded-service arrangements, i.e. some subscribers prevented from establishing certain connections using authorisation codes or passwords using speech signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W12/00Security arrangements; Authentication; Protecting privacy or anonymity
    • H04W12/06Authentication
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/08Network architectures or network communication protocols for network security for authentication of entities
    • H04L63/0861Network architectures or network communication protocols for network security for authentication of entities using biometrical features, e.g. fingerprint, retina-scan
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/10Aspects of automatic or semi-automatic exchanges related to the purpose or context of the telephonic communication
    • H04M2203/105Financial transactions and auctions, e.g. bidding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/30Aspects of automatic or semi-automatic exchanges related to audio recordings in general
    • H04M2203/306Prerecordings to be used during a voice call
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/60Aspects of automatic or semi-automatic exchanges related to security aspects in telephonic communication systems
    • H04M2203/6054Biometric subscriber identification
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/60Aspects of automatic or semi-automatic exchanges related to security aspects in telephonic communication systems
    • H04M2203/6081Service authorization mechanisms
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/22Arrangements for supervision, monitoring or testing
    • H04M3/2281Call monitoring, e.g. for law enforcement purposes; Call tracing; Detection or prevention of malicious calls
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/42025Calling or Called party identification service
    • H04M3/42085Called party identification service
    • H04M3/42102Making use of the called party identifier
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/51Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
    • H04M3/5158Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing in combination with automated outdialling systems

Abstract

本発明は、音声確認のための方法、装置、及びシステムを提供し、前記方法は、ネットワーク側で、ユーザ側からの音声確認要求に従ってユーザ音声通信番号を取得し、音声確認要求に対応する音声確認情報を決定するステップと、ネットワーク側で、ユーザ音声通信番号に従って対応するユーザへの通話を開始し、コールスルーの場合、決定された音声確認情報をユーザに対して再生するステップと、ユーザ側で、ユーザが呼び出されることを監視するとき、自動リスニング及び記録操作を実行し、通話が終了すると、記録から得られた記録情報をネットワーク側に送信するステップと、ネットワーク側で、音声確認情報及び記録情報に従って確認結果を決定するステップとを含む。本発明によって提供される技術的な解決策は、確認の利便性を高め、確認の不確実さを減らし、確認の実施形態の方法を充実させる。

Description

関連出願の相互参照
本出願は、2015年6月30日に出願した「Method of voice verification, Apparatus, And System」と題した中国特許出願第201510378018.X号の優先権を主張するものであり、この特許出願の内容は、参照によって本明細書に組み込まれる。
本発明は、確認技術に関し、より詳細には、音声確認の方法、音声確認装置、及び音声確認システムに関する。
ユーザの財産の喪失及びユーザ情報の漏洩を防止するためのユーザアカウントのセキュリティ又はユーザ情報のセキュリティを守るために、確認が、ネットワーク決済及びユーザのログオンのようなプロセスに広く適用されてきた。
既存の確認プロセスは、通常、(マルチメディアメッセージングサービス(MMS,Multimedia Messaging Service)メッセージを含む)ショートメッセージングサービス(SMS,Short Messaging Service)メッセージに基づいて実装される。特定の実施形態のプロセスは、概して、ユーザ機器から確認要求を受信した後、サーバ(例えば、決済サーバ又はログオンサーバ)によって、ユーザによって予約されたモバイル電話番号を検索し、確認コードが数字又はアルファベット又は数字及びアルファベットの組合せである可能性がある、確認要求に関する確認コードを生じさせること、サーバによって、ユーザによって予約されたモバイル電話番号に従ってSMSサーバを介してユーザに確認コードを含むSMSメッセージを送信すること、SMSを受信した後にユーザによって、対応するページの入力ボックスにSMSの確認コードを入力すること、ユーザ機器から確認コードを受信した後にサーバによって、前に生じさせられた確認コード及び受信された確認コードに従って確認を行うことを含む。確認結果は、主として、サーバがその後の手順(例えば、その後のログオン手順又は決済手順など)を決めるためのものである。
本発明を生み出す過程で、発明者らは、既存の確認方法がネットワーク攻撃及び確認要求の偽造を含む違法行為によるユーザアカウント及びユーザ情報に対するセキュリティの問題をある程度防止することができるが、不便さ、不確実さ、及び単一の確認手段のような問題に対処するための改善をまだ必要とすることを発見している。特に、SMSメッセージが記憶及び転送メカニズム(storage and forwarding mechanism)を介して送信されるので、SMSサーバは、SMSメッセージを送信するときに受信者のステータス(例えば、受信者が電源がオンであるかどうか又は信号のカバーエリア内にあるかどうか)を知らず、したがって、受信者がSMSメッセージを受信する時間が予測できず、このことは、確認プロセスに不確実さを加え、通常の状況においては、SMSをユーザに送信するのに約5〜10秒を要し、ユーザは確認コードが受信されるまで待つ必要があり、さらに、既存の確認方法は、ユーザが受信された確認コードを手動で入力することを必要とするので不便であり、確認コードの手動入力は、確認プロセス中に人為的な瑕疵を持ち込み、確認プロセスの利便性をさらに損なう可能性がある。
本発明の目的は、音声確認のための方法、装置、及びシステムを提供することである。
本発明の一態様によれば、音声確認の方法であって、以下のステップを含む、方法が提供される。
本発明の別の態様によれば、音声確認装置であって、以下を含む、装置も提供される。
本発明のさらなる態様によれば、音声確認システムであって、以下を含む、システムがさらに提供される。
従来技術と比較して、本発明は、以下の利点、すなわち、ユーザ側からの音声確認要求に応答してユーザへの通話を開始し、ユーザに対して音声確認情報を再生することによって、ネットワーク側がユーザ側のステータスと音声確認情報がユーザ側に対して正常に再生されたかどうかとをはっきりと知り得るという利点を有し、本発明は、ネットワーク側がユーザのステータスを知ることができないことによって引き起こされる確認プロセスのある程度の不確実さを避ける。ユーザ側に監視、自動リスニング、自動音声記録、及びネットワークワークへの記録情報の自動送信などの操作を実行させることによって、本発明の実施形態によれば、ネットワーク側がその後の音声確認操作を速やかで円滑に実行し得るように、確認を必要とする情報(すなわち、記録情報)がネットワーク側に、手動操作を導入することなく自動的に送り返される可能性があり、それは、確認コードの手動入力、ユーザが確認を必要とする情報の受信を待たなければならないこと、及び確認プロセスに人為的な過失を招くことなどによって引き起こされる確認プロセスの不便さのような問題を防止する。したがって、本発明によって提供される技術的な解決策は、確認の利便性を高め、不確実さを減らし、確認の実施形態の方法を充実させることが分かる。
添付の図面を参照して非限定的な実施形態の詳細な説明を読むことによって、本発明のその他の特徴、目的、及び利点がさらに明らかになるであろう。
本発明の第1の実施形態による音声確認の方法の流れ図である。 本発明の第2の実施形態による音声確認の方法の流れ図である。 本発明の第3の実施形態による音声確認システムの概略図である。 本発明の第4の実施形態による音声確認装置の概略図である。 本発明の第5の実施形態による音声確認装置の概略図である。
図面において、同じ又は同様の参照番号は、同じ又は同様の構成要素を表す。
例示的な実施形態をより詳細に検討する前に、一部の例示的な実施形態が流れ図の形態で処理又は方法として説明されることが言及されるべきである。流れ図はそれぞれの操作を順次処理されるものとして示すが、流れ図中の多くの操作は、平行して、同時に、又は一斉に実施される可能性がある。加えて、さまざまな操作が、順序を変えられ得る。操作が完了されるとき、処理は終了される可能性がある。しかし、添付の図面に含まれないさらなるステップが含まれる可能性がある。処理は、方法、機能、仕様、サブルーチン、サブプログラムなどに対応する可能性がある。
文脈の中で言及される「サーバ」は、論理的サーバ又はエンティティサーバ(entity server)を含む可能性があり、エンティティサーバは、「ネットワークデバイス」とも呼ばれる可能性があり、「ネットワークデバイス」とはすなわち、ネットワーク側に設けられ、所定のプログラム又は命令を実行することによって数値計算及び/又は論理計算のような所定の処理手順を実行し得るインテリジェントな電子デバイスである。ネットワークデバイスは、プロセッサ及びメモリを含む可能性があり、プロセッサは、所定の処理手順を実行するための予め記憶されたプログラム命令を実行し、所定の処理手順は、ASIC、FPGA、及びDSPなどのハードウェアによって実行されるか、又は命令及びハードウェアの組合せによって実行される可能性もある。
エンティティサーバは、小型のタブレットデバイス又は大型のタブレットデバイスである可能性がある。サーバは単なる例であり、本発明に適用可能であるならば、その他の既存の又は将来登場するであろうネットワークデバイスも本発明の保護範囲に含まれるべきであり、参照により本明細書に組み込まれることに留意する必要がある。
下で検討される方法(その一部は流れ図によって示される)は、概して、ハードウェア、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語、又はこれらの任意の組合せによって実装される可能性がある。それらの方法がソフトウェア、ファームウェア、ミドルウェア、又はマイクロコードを用いて実装されるとき、必要なタスクを実行するためのプログラムコード又はコードセグメントは、機械又はコンピュータ可読媒体(例えば、ストレージ媒体)に記憶される可能性がある。(1又は2以上の)プロセッサが、必要なタスクを実施する可能性がある。
本明細書において開示される特定の構造及び機能の詳細は、本発明の例示的な実施形態を説明することを目的とした見本であるに過ぎない。むしろ、本発明は、多くの代替的な実施形態によって特に実装され得る。したがって、本発明は本明細書に示される実施形態にのみ限定されると理解されるべきでない。
しかし、「第1の」及び「第2の」のような用語がそれぞれのユニットを説明するために本明細書において使用される可能性があるが、これらのユニットはこれらの用語によって限定されるべきでないことを理解されたい。これらの用語の使用は、ユニットを区別するためのものであるに過ぎない。例えば、例示的な実施形態の範囲を逸脱することなく、第1のユニットが第2のユニットと呼ばれる可能性があり、同様に、第2のユニットが第1のユニットと呼ばれる可能性がある。本明細書において使用される用語「及び/又は」は、列挙された1又は2以上の関連する項目の任意の及びすべての組合せを含む。
1つのユニットがさらなるユニットに「接続される」又は「結合される」とき、そのユニットはさらなるユニットに直接接続されるか若しくは結合される可能性があり、又は中間ユニットが存在する可能性がある。対照的に、ユニットがさらなるユニットに「直接接続される」又は「直接結合される」とき、中間ユニットは存在しない。ユニットの間の関係を説明するためのその他の用語(例えば、「〜の間に配される」対「〜の間に直接配される」、「隣接する」対「直に隣接する」など)は、同様にして解釈されるべきである。
本明細書において使用される用語は、好ましい実施形態を説明するためのものに過ぎず、例示的な実施形態を限定するように意図されていない。別途示されない限り、本明細書において使用される単数形「1つの(a)」又は「1つの(one)」は、複数形も含むように意図される。本明細書において使用される用語「含む(comprise)」及び/又は「含む(include)」は、記載された特徴、整数(integer)、ステップ、操作、ユニット、及び/又は構成要素の存在を規定するが、1若しくは2以上のその他の特徴、整数、ステップ、操作、ユニット、構成要素、及び/又はこれらの組合せの存在又は追加を除外しないことも理解されたい。
一部の代替的な実施形態においては、記載された機能/アクションが図面において示されるものとは異なる順序で行われる可能性があることにも留意されたい。例えば、含まれる機能/アクションに応じて、2つの連続的に示された図が、実質的に同時に又はときには逆の順序で実行される可能性がある。
以降で、本発明が、図面に関連してさらに詳細に説明される。
実施形態1:音声確認の方法
図1は、本実施形態の音声確認の方法の流れ図を示し、図1に示される方法は、主として、ステップS100、ステップS110、ステップS120、及びステップS130を含む。以降、図1のそれぞれのステップが示される。
S100:ネットワーク側で、ユーザ側からの音声確認要求に従ってユーザ音声通信番号(user voice communication number)を取得し、音声確認要求に対応する音声確認情報を決定する。
特に、ネットワーク側は、ユーザによって予約された複数のユーザ音声通信番号を予め記憶する。これらのユーザ音声通信番号は、通信番号の組を形成する。ネットワーク側は、通信番号の予め記憶された組から音声確認要求に対応するユーザ音声通信番号を取得し得る。特定の例において、ネットワーク側の通信番号の組は、ユーザ音声通信番号とユーザ識別子(例えば、ユーザのログオンアカウント又はユーザの決済アカウント情報など。以降、説明はユーザの決済アカウント情報を例として用いて行われる)との間の複数の対応関係を含む。ネットワーク側は、ユーザ側から音声確認要求を受信するとき、まず、音声確認要求で運ばれる情報からユーザの決済アカウント情報を取得する可能性があり、それから、ネットワーク側は、ユーザの決済アカウント情報に対応するユーザ音声通信番号を取得するためにユーザアカウント決済情報を用いて組からマッチング及び検索を実行する。本実施形態は、ネットワーク側で音声確認要求に従ってユーザ音声通信番号を取得する特定の実施形態に限定されない。
本実施形態において取得されるユーザ音声通信番号は、主として、ネットワーク側とユーザ側との間の音声通話接続を確立するためのものである。本実施形態におけるユーザ音声通信番号は、ユーザのモバイル電話番号である可能性がある。
1つの応用シナリオでは、本実施形態において、ユーザ音声通信番号に対応するユーザデバイス及び音声確認要求を送信するユーザ機器は、同じユーザ機器であり、例えば、ユーザは、そのユーザのスマートモバイル電話(又は電話機能を有するタブレットコンピュータ)を用いて決済操作又はログオン操作などを実行し、単に、スマートモバイル電話(又は電話機能を有するタブレットコンピュータ)の番号(すなわち、ユーザのモバイル電話番号)が、ユーザ識別子(例えば、ユーザのログオンアカウント又はユーザの決済アカウント情報など)に対応するユーザ音声通信番号である。
別の応用シナリオでは、本実施形態において、ユーザ音声通信番号に対応するユーザ機器は、音声確認要求を送信するユーザ機器と異なり、例えば、ユーザが、そのユーザのスマートフォン(又は電話機能を有するタブレットコンピュータ)を用いて決済操作又はログオン操作などを実行する一方、ネットワーク側に記憶されたユーザ識別子情報に対応するユーザ音声通信番号は、ユーザのスマートフォンの番号であり、別の例においては、ユーザが、スマートフォンを用いて決済操作を実行する一方、スマートフォンの番号(すなわち、ユーザのモバイル電話番号)は、ユーザ識別子情報(例えば、ユーザのログオンアカウント又はユーザの決済アカウント情報)に対応するユーザ音声通信番号ではなく、つまり、ユーザ識別子情報に対応するユーザ音声通信番号は、決済操作又はログオン操作を実行するためにユーザによって使用されるスマートモバイル電話番号の番号と同一ではない。
本実施形態において、特定の期間(例えば、数時間又は数十時間又は数日)内に異なる音声確認要求に関してネットワーク側で決定される音声確認情報は、通常、反復的でない。言い換えると、本発明のネットワーク側は、特定の期間内に異なる音声確認要求が異なる音声確認情報に対応すべきであることを保証すべきである。
本実施形態のネットワーク側によって、音声確認要求に対応する音声確認情報を決定する特定の例が、下で与えられ、ネットワーク側は、複数のオーディオファイル(音声ファイルとも呼ばれる可能性がある)を予め記憶し、複数のオーディオファイルの特性は、大きく異なり、すべてのオーディオファイルが、オーディオファイルセットを形成する可能性があり、音声確認要求を受信するとき、ネットワーク側は、オーディオファイルセットからオーディオファイルを無作為に選択し、無作為に選択されたオーディオファイルを音声確認要求に対応する音声確認情報として使用する。
本実施形態のネットワーク側によって、音声確認要求に対応する音声確認情報を決定する別の特定の例が、下で与えられ、ネットワーク側は、音声確認要求を受信した後、オーディオファイルを無作為に生じさせ、無作為に生じさせられたオーディオファイルを音声確認要求に対応する音声確認情報として使用する。ネットワーク側でオーディオファイルを無作為に生じさせる方法は、予め記憶されたオーディオファイルからオーディオ情報の小さなセグメントを無作為に取り込み、それによって、新しいオーディオファイルを生じさせることである可能性があり、その新しいオーディオファイルは単に、無作為に生じさせられたオーディオファイルである。ネットワーク側でオーディオファイルを無作為に生じさせる方法は、2又は3以上の予め記憶されたオーディオファイルを新しいオーディオファイルへと無作為に合成することである可能性もあり、その新しいオーディオファイルは単に、無作為に生じさせられたオーディオファイルである。
本実施形態は、ネットワーク側が音声確認要求に対応する音声確認情報を決定するための特定の実施形態の方法を、特定のフォーマットのオーディオファイル、又はネットワーク側がオーディオファイルを無作為に生じさせるための特定の実施形態の方法などに限定しない。
本実施形態の音声確認情報は、音楽音声確認情報(musical voice verification information)を再生するため、又は数及び/若しくはアルファベット及び/若しくは語及び/若しくは漢字の形態の音声確認情報を再生するために使用される可能性があり、加えて、音声確認情報を再生する継続時間は、通常、非常に短く、例えば、おおむね1〜5秒などである。本実施形態は、音声確認情報によって再生される特定の内容又は音声確認情報を再生する時間の長さを限定しない。
本実施形態において、すべての音声確認情報は、対応する一意識別子を有し、つまり、1つの音声確認情報が、1つの識別子を用いて一意に決定され得る。識別子は、音声確認情報の識別子と呼ばれる可能性がある。音声確認情報に対応する識別子は、特に、オーディオファイルのファイル名、若しくはオーディオファイルの記憶パス及びファイル名の組合せ、又はオーディオファイルのインデックス値、又は無作為生成アルゴリズムを用いて無作為に生じさせられた識別子である可能性がある。本実施形態は、音声確認情報の識別子の特定の表現形態に限定されない。
本実施形態の音声確認情報に対応する識別子は、確認プロセス(例えば、決済確認プロセス)のために使用される可能性があり、音声マッチングアルゴリズムにおいて識別子を追加することによって、音声確認の結果の正確さが、さらに保証される可能性がある。
一実施形態においては、音声確認要求に対応する音声確認情報を決定する間に、ネットワーク側は、例えば、オーディオファイルのファイル名又はインデックス値を音声確認情報として取得し、別の例として、オーディオファイルの記憶パス及びファイル名を音声確認情報として取得するなど、音声確認情報に対応する識別子をやはり取得する可能性があり、それから、ネットワーク側は、音声確認情報に対応する識別子をユーザ側に提供する可能性がある。通常の状況においては、ネットワーク側は、決定された音声確認情報に対応する識別子を、ユーザ側の音声確認要求を送信するユーザ機器に提供し得る。音声確認要求を送信するユーザ機器がユーザ音声通信番号に対応するユーザ機器でない場合、音声確認要求を送信するユーザ機器は、ネットワーク側から送信された音声確認情報に対応する識別子をユーザ音声通信番号に対応するユーザ機器に提供する可能性があり、例えば、音声確認要求を送信するユーザ機器は、WiFi又はBluetoothなどのワイヤレス送信方法によって、音声確認情報に対応する識別子を、ユーザ音声通信番号に対応するユーザ機器に提供し、別の例として、音声確認要求を送信するユーザ機器は、ユーザ音声通信番号に対応するユーザ機器が2次元コードをスキャンすることによって音声確認情報に対応する識別子を取得し得るように2次元コードを表示し、もちろん、音声確認要求を送信するユーザ機器は、ネットワーク側から送信された音声確認情報に対応する識別子をユーザ音声通信番号に対応するユーザ機器に提供するためにその他の都合の良い送信方法を採用する可能性もあり、加えて、音声確認要求を送信するユーザ機器は、ユーザ音声通信番号に対応するユーザ機器がその後の記録から得られる記録情報の受信者を知り得るように、識別子を送信するとき、音声確認要求に関する受信者情報もユーザ音声通信番号に対応するユーザ機器に提供する可能性がある。本実施形態は、音声確認要求を送信するユーザ機器がネットワーク側から送信された音声確認情報に対応する識別子をユーザ音声通信番号に対応するユーザ機器にどのようにして提供するかに関して特定の実施形態の方法を限定しない。
実際の応用シナリオでは、本実施形態のネットワーク側が音声確認情報に対応する識別子をユーザ側に提供する可能性があるが、それは、本実施形態のネットワーク側が音声確認情報に対応する識別子をユーザ側に提供しなければならないことを意味せず、つまり、ネットワーク側が音声確認情報に対応する識別子をユーザ側に提供しないとき、本実施形態の確認手順がやはり実施され得ることに特に留意されたい。
S110:ネットワーク側で、ユーザ音声通信番号に従って対応するユーザへの通話を開始し、コールスルー(call through)の場合、決定された音声確認情報をユーザに対して再生する。
特に、本実施形態のネットワーク側は、ユーザ側との音声通話接続(すなわち、音声リンク)を確立するためにユーザ音声通信番号に従って対応する通話操作を実行する可能性がある。本実施形態のネットワーク側は、既存の通話方法を使用してユーザ側との音声通話接続を確立する可能性があり、例えば、ネットワーク側は、公衆交換電話網(PSTN,Public Switched Telephone Network)によってインターネットプロトコル(IP,Internet Protocol)ネットワークに接続し、又はネットワーク側は、自動音声応答(IVR,Interactive Voice Response)技術を用いてユーザ側との音声通話接続を確立する。ユーザ側との音声通話接続を正常に確立する(例えば、ユーザが着信に答える)とき、ネットワーク側は、音声通話接続に基づいてユーザに対して上で決定された音声確認情報を再生する。本実施形態は、ネットワーク側によって対応するユーザへの通話を開始し、ネットワーク側によって音声通話接続を通じてユーザに対して音声確認情報を再生する特定の実施形態の方法を限定しない。
本実施形態のネットワーク側は、ユーザに対して音声確認情報を正常に再生することができるように通話反復機能(call repeating function)を提供し、例えば、音声通話接続がユーザの現在の通話のために正常に確立されない場合、又は音声通話接続がユーザの現在の通話のために正常に確立されたが、音声確認情報が正常に再生されない場合、ネットワーク側は、ユーザのために通話機能を再び実行するべきである。
ネットワーク側で通話を繰り返す特定の例は、ネットワーク側がユーザ音声通信番号の加入位置(subscription location)を決定することができない場合、ネットワーク側が、ユーザ音声通信番号に対して調整を実行し(例えば、現在の通話に対応する特定の失敗理由に基づいてユーザ音声通信番号をどのようにして調整すべきかを決め)、調整後にユーザを呼び出す操作を再実行する可能性があり、例えば、ネットワーク側が、ユーザ音声通信番号の前に0をダイヤルし、ユーザを再び呼び出し、別の例として、ネットワーク側が、ユーザ音声通信番号の前に加えられた0を削除し、ユーザを再び呼び出すことである。
ネットワーク側で通話を繰り返す別の特定の例は、現在の通話によって使用される発呼者の番号に異常が起こる(例えば、発呼者の番号がPSTNによって遮られるなど)場合、ネットワーク側が、その他の発呼者の番号を用いてユーザを呼び出す操作を再び実行する可能性があることである。言い換えると、複数の発呼者の番号が、ネットワーク側において与えられ、ネットワーク側が発呼者の番号に由来する原因でユーザ側との音声通話接続を正常に確立することができない場合、ネットワーク側は、発呼者の番号を変更し、新しい発呼者の番号を用いてユーザ側との音声通話接続を確立しようと再び試みるべきである。
ネットワーク側で通話を繰り返すさらなる特定の例は、ネットワーク側が現在の通話のためにユーザ側との音声通話接続を正常に確立したが、接続の中断のような理由で音声確認情報を正常に再生することができないとき、ネットワーク側が、音声確認情報を正常に再生することができるようにユーザを呼び出す操作を再び実行する可能性があることである。
S120.ユーザ側で、ユーザが呼び出されることを監視するとき、自動リスニング及び記録操作を実行し、通話が終了すると、記録から得られた記録情報をネットワーク側に送信する。
特に、ユーザ側は、音声確認要求を送信した後、通話監視ステータスになる可能性があり、例えば、ユーザ側は、確認サービスを開始した後、通話監視ステータスになり、着信があることを監視するとき、ユーザ側は、リスニング操作を自動的に実行し、記録サービスなどを呼び出すことによって音声通話接続で再生されたオーディオ信号を記録し、通話が終了する(例えば、電話が切られる)と、ユーザ側は、ネットワーク側が音声確認メッセージに関する音声確認操作を実行し得るように、記録情報を含む音声確認メッセージをネットワーク側に自動的に送信し、例えば、ネットワーク側は、ハイパーテキスト転送プロトコル(HTTP,HyperText Transfer Protocol)によってネットワーク側に記録情報を送信する。
その他の通話(確認と関係がない通話)に対して自動リスニング及び記録操作を実行することを防止するために、本実施形態のユーザ側は、通話監視ホワイトリストを予め記憶し、ユーザ側は、監視される通話の発呼側が予め記憶された通話ホワイトリスト内の発呼側に属するときに自動リスニング及び自動記録操作を実行するだけであり、そうでないとき、ユーザ側は、自動リスニング及び自動記録操作を実行しない。
ユーザ側は、ネットワーク側から送信された音声確認情報に対応する識別子を受信する場合、記録情報を受信された識別子と共にネットワーク側に送信する可能性があり、例えば、ユーザ側は、記録情報及び識別子を含むHTTPに基づく音声確認メッセージをネットワーク側に送信する。
上の例について続けると、音声確認要求を送信するユーザ機器がユーザ音声通信番号に対応するユーザ機器ではないとき、ユーザ音声通信番号に対応するユーザ機器は、音声確認要求及び音声確認要求に関する受信者情報を送信するユーザ機器から送信された音声確認情報に対応する識別子を受信した後、音声確認要求内の識別子及び受信者情報をバッファリングし、記録情報をネットワーク側に送信するときに、受信者情報に基づいてネットワーク側に識別子及び記録情報を共に送信する。
S130.ネットワーク側で、音声確認情報及び記録情報に従って確認結果を決定する。
特に、ネットワーク側は、それによって音声マッチング操作の正確さを高めるために受信された記録された情報を前処理した後、音声マッチングの操作を実行する可能性がある。ここで、前処理は、雑音低減処理及び正規化(normalization)処理を指す。
本実施形態において確認結果を決定する特定の例は、ネットワーク側が、受信された記録情報とネットワーク側に記憶されたそれぞれの音声確認情報との間でそれぞれ音声マッチングを実行し、記録情報に一致する音声確認情報がネットワーク側によって前に決定された音声確認情報であるとき、今回の音声確認が成功したと決定し、そうでないとき、今回の音声確認が失敗したと決定されることである。
本実施形態において確認結果を決定する別の特定の例は、ネットワーク側が、受信された記録情報とネットワーク側によって前に決定された音声確認情報との間で音声マッチングを実行し、音声マッチングの結果がそれらの情報が一致するということであるとき、今回の音声確認が成功したと決定し、一方、音声マッチングの結果がそれらの情報が一致しないということであるとき、今回の音声確認が失敗したと決定することである。
ネットワーク側が記録情報を受信するだけでなく、ユーザ側から送信された音声確認情報に対応する識別子も受信する場合、本実施形態において確認結果を決定する特定の例は、ネットワークが、受信された識別子に従ってネットワーク側に記憶されたすべての音声確認情報から音声確認情報の一部を選び出し、受信された記録情報と音声確認情報の一部との間でそれぞれ音声マッチングを実行し、記録情報に一致する音声確認情報がネットワーク側によって前に決定された音声確認情報であるとき、今回の音声確認が成功したと決定し、そうでないとき、今回の音声確認が失敗したと決定することである。
ネットワーク側は、識別子及び記録情報を用いて音声確認を実行するためにその他の方法を採用する可能性もあり、例えば、ユーザから送信された識別子が前に決定された識別子と一致し、記録情報も前に決定された音声確認情報と一致すると決定する場合、今回の音声確認が成功したと決定し、そうでないとき、今回の音声確認が失敗したと決定する。
実施形態の音声確認情報に対応する識別子が音声確認を決定する過程で補助情報として働く可能性があり、例えば、それが音声マッチングの回数を減らすか、又は音声確認を決定するための条件として働く可能性があることが、上の説明から分かる。
本実施形態の音声マッチングプロセスは、記録情報内の特徴を抽出することと、抽出された特徴を音声確認の特徴と比較することとを含む可能性があり、本実施形態におけるそれぞれの音声確認情報の特徴が、予め抽出され、ネットワーク側に記憶される可能性がある。本実施形態の音声マッチングプロセスは、記録情報に対して音声認識を実行することと、記録情報に対する音声認識の結果を音声確認情報に対する音声認識の結果と比較することとをさらに含む可能性があり、本実施形態におけるそれぞれの音声確認情報の音声認識の結果は、予め実行され、ネットワーク側に記憶された音声認識である可能性がある。もちろん、本実施形態は、音声マッチングを実行するためにその他の音声マッチングアルゴリズムを使用する可能性もある。本実施形態は、音声マッチングの特定の実施形態の方法を限定しない。
音声確認が成功したとき、ネットワーク側は、その後の処理手順(例えば、その後の決済手順又はその後のユーザログオン手順など)に進み得る。加えて、この決済手順が(成功か若しくは失敗かにかかわらず)完了されるか又はログオン手順が(ログオン失敗か若しくはログオン成功かにかかわらず)完了されるとき、ユーザ側は、ユーザの通話をもはや監視しない可能性があり、例えば、ユーザ側は、現在開始されている監視サービスなどを閉じる。
実施形態2:音声確認の方法
本実施形態は、スマートモバイル電話を用いてユーザによってネットワーク決済を実行する例を取りあげ、図2を参照して本実施形態の音声確認の方法を示す。本実施形態においては、ユーザによって使用されるスマートモバイル電話の番号が、ネットワーク側のユーザによって予約されたユーザの決済アカウント情報に対応するユーザ音声通信番号である。
図2において、スマートモバイル電話は、ユーザ側に属する。ワイヤレス決済クライアントが、スマートモバイル電話内に提供される。決済サーバ、コールセンター、及び音声マッチングサーバは、ネットワーク側に属する。
本実施形態におけるワイヤレス決済クライアントは、特に、スマートモバイル電話のモバイル決済ソフトウェア開発キット(SDK,Software Development Kit)又はAPP製品の形態である可能性があり、本実施形態における決済サーバ、コールセンター、及び音声マッチングサーバは、ネットワークデバイス(例えば、サーバ)の同じセットに集中的に設けられる可能性があり、又は異なるネットワークデバイスの2つ若しくは3つのセットに別々に配される可能性がある。本実施形態は、ワイヤレス決済クライアント、決済サーバ、コールセンター、及び音声マッチングサーバの特定の表現形態に限定されない。
ステップ1:ネットワーク決済プロセスの間に、ワイヤレス決済クライアントが、音声確認要求を開始し、そのワイヤレス決済クライアントが置かれるスマートモバイル電話の着信を監視し始め、例えば、ワイヤレス決済クライアントは、通話ステータス監視サービスを開始することによって着信を監視する。
ステップ2.ワイヤレス決済クライアントから音声確認要求を受信するとき、決済サーバが、音声確認要求で運ばれた情報(例えば、ユーザの決済アカウント情報)に従ってその決済サーバのローカルに記憶された情報(例えば、ユーザの決済アカウント情報とスマートモバイル電話番号との間の対応関係の組)から音声確認要求に対応するスマートモバイル電話番号を検索し、決済サーバは、その決済サーバが予め記憶するオーディオファイルの識別子の組から識別子を無作為に選択し、識別子をワイヤレス決済クライアントに提供する。
本実施形態におけるすべてのオーディオファイルは、決済サーバに記憶されるか又はコールセンターに記憶される可能性がある。もちろん、すべてのオーディオファイルは、決済サーバ及びコールセンターとは独立したその他の場所に記憶される可能性もある。
ステップ3.決済サーバが、その決済サーバが見つけるスマートモバイル電話番号及び無作為に選択された識別子をコールセンターを通じて対応するユーザを呼び出すためにコールセンターに提供し、識別子に対応する音声確認情報をユーザに対して再生する。決済サーバは、コールセンターによって提供されるウェブサービスインターフェースを通じてコールセンターに識別子及びスマートモバイル電話番号を提供し、それによって、HTTPレイヤに基づくアウトバウンドコールインターフェースの呼び出しを実施する可能性がある。
ステップ4:コールセンターが、ユーザ側のスマートモバイル電話との音声通話接続を確立する(つまり、通話リンクを確立する)ために、決済サーバによって提供されたスマートモバイル電話番号に基づいて通話操作を実行する。音声通話接続が正常に確立された後、コールセンターは、決済サーバによって提供された識別子に従って対応する音声確認情報(例えば、オーディオファイル)を再生し、例えば、コールセンターは、識別子に従ってローカルに記憶されたオーディオファイルから識別子に対応するオーディオファイルを選択し、そして、音声通話接続が正常に確立された後、オーディオファイルを再生する。
ステップ5.スマートモバイル電話のワイヤレス決済クライアントが、ユーザが呼び出され、発呼者がワイヤレス決済クライアントに記憶されたホワイトリストに属することを監視するとき、自動リスニングを実行し、コールセンターによって再生される音声確認情報を記録するために自動記録操作を実行する。
ステップ6.ワイヤレス決済クライアントが、この通話が終了すると、そのワイヤレス決済クライアントが記録する記録情報及び決済サーバによって提供された識別子を、HTTPに基づく音声確認メッセージによって自動的にアップロードする。
ステップ7.決済サーバが、音声マッチング操作を実行するように音声マッチングサーバに要求するために、音声マッチングサーバに受信された記録情報及び識別子を共に提供する。また、音声マッチングサーバは、すべての音声確認情報を記憶する。コールセンターの音声確認情報のすべては、音声マッチングサーバに記憶されたすべての音声確認情報と同一であるべきであり、例えば、音声マッチングサーバの音声確認情報を更新するとき、音声マッチングサーバは、コールセンターのすべての音声確認情報を同期して更新すべきである。音声マッチングサーバは、受信された識別子に従ってすべての音声確認情報の中の音声確認情報の一部を決定し、記録情報と音声確認情報の一部との間の音声マッチングを1つずつ実行し、マッチングされた音声確認情報又は音声確認情報の識別子(例えば、オーディオファイル名)を決済サーバに提供する。決済サーバは、音声確認情報が前に決定された音声確認情報と一致していると判定するか、又は音声マッチングサーバから送信された識別子が前に決定された音声確認情報の識別子と同一であると判定するときに、この音声確認が成功したと決定し、そうでないとき、この音声確認が失敗したと決定する。決済サーバは、音声確認の結果に基づいてその後の決済フローを決める可能性がある。
この決済プロセスが終了した後、ワイヤレス決済クライアントは、ユーザの着信をもはや監視すべきでなく、例えば、ワイヤレス決済クライアントは、電話通話ステータス監視サービスなどを閉じる。
実施形態3:音声確認システム
本実施形態の音声確認システムの主な構造が、図3に示される。
図3の音声確認システムは、主に、制御モジュール311、通話モジュール312、音声確認モジュール313、音声確認要求モジュール321、及び監視記録モジュール322を含み、制御モジュール311、通話モジュール312、及び音声確認モジュール313が、ネットワーク側に設けられる一方、音声確認要求モジュール321及び監視記録モジュール322は、ユーザ側に設けられる。
本実施形態における制御モジュール311、通話モジュール312、及び音声確認モジュール313は、ネットワーク側の同じデバイスに組み込まれるか、又はネットワーク側の2つ若しくは3つの相互に独立したデバイスに別々に配される可能性がある。
本実施形態における音声確認要求モジュール321及び監視記録モジュール322は、ユーザ側の同じユーザ機器内に設けられる可能性があり、例えば、両方ともユーザの同じスマートモバイル電話に配され、音声確認要求モジュール321並びに監視及び記録モジュール322は、2つの相互に独立したユーザ機器内に設けられる可能性もあり、例えば、音声確認要求モジュール321が、PCマシン又はタブレットコンピュータ内に設けられる一方、監視及び記録モジュール322は、スマートモバイル電話内に設けられる。
以降、音声確認システムに含まれるそれぞれのモジュールが、以下で詳細に説明される。
音声確認要求モジュール321は、主に、ネットワーク側に音声確認要求を送信するように適合される。
特に、確認を必要とする応用シナリオでは、音声確認要求モジュール321が、ネットワーク側に音声確認要求を送信するためにトリガされ、例えば、ユーザ側のウェブサイトにログオンする手順の間に、音声確認要求モジュール321が、ネットワーク側に音声確認要求を送信するためにトリガされ、別の例として、ユーザ側でネットワーク決済を実行する手順の間に、音声確認要求モジュール321が、ネットワーク側に音声確認要求を送信するためにトリガされる。
音声確認要求モジュール321によってネットワーク側に送信される音声確認要求は、通常、HTTPに基づく音声確認要求であり、音声確認要求は、通常、ユーザを一意に特徴付け得るユーザ識別子、例えば、ユーザのログオンアカウント又はユーザの決済アカウント情報などを運ぶ。
制御モジュール311は、主に、ユーザ側からの音声確認要求に基づいてユーザ音声通信番号を取得し、音声確認要求に対応する音声確認情報を決定するように適合される。
特に、制御モジュール311は、ユーザによって予約された複数のユーザ音声通信番号を予め記憶する。これらのユーザ音声通信番号は、通信番号の組を形成する。制御モジュール311は、予め記憶された通信番号の組から音声確認要求に対応するユーザ音声通信番号を取得し得る。特定の例として、制御モジュール311は、ユーザ音声通信番号とユーザ識別子(例えば、ユーザのログオンアカウント又はユーザの決済アカウント情報など。以降、説明はユーザの決済アカウント情報を例として用いて行われる)との間の対応関係を予め記憶し、複数の対応関係は、通信番号の組を形成する。ユーザ側から音声確認要求を受信するとき、制御モジュール311は、まず、音声確認要求で運ばれる情報からユーザの決済アカウント情報を取得する可能性があり、それから、制御モジュール311は、ユーザの決済アカウント情報に対応するユーザ音声通信番号を取得するためにユーザアカウント決済情報を用いて組内の対応関係に従ってマッチング及び検索を実行する。本実施形態は、制御モジュール311によって、音声確認要求に従ってユーザ音声通信番号を取得する特定の実施形態の方法に限定されない。
制御モジュール311によって取得されるユーザ音声通信番号は、主として、ネットワーク側とユーザ側との間の音声通話接続を確立するためのものである。制御モジュール311によって取得されるユーザ音声通信番号は、ユーザのモバイル電話番号である可能性がある。
1つの応用シナリオでは、制御モジュール311によって取得されるユーザ音声通信番号に対応するユーザ機器は、音声確認要求モジュール321が置かれるユーザ機器である。別の応用シナリオでは、制御モジュール311によって取得されるユーザ音声通信番号に対応するユーザ機器は、音声確認要求モジュール321が置かれるユーザ機器でない。2つの応用シナリオの特定の例は、上の実施形態1において説明されており、本明細書において繰り返されない。
本実施形態において、特定の期間(例えば、数時間又は数十時間又は数日)内に異なる音声確認要求に関して制御モジュール311によって決定される音声確認情報は、通常、反復的でない。言い換えると、制御モジュール311は、特定の期間内に異なる音声確認要求が異なる音声確認情報に対応すべきであることを保証すべきである。
制御モジュール311によって、音声確認要求に対応する音声確認情報を決定する特定の例が、下で与えられ、ネットワーク側は、複数のオーディオファイルを予め記憶し、複数のオーディオファイルの特徴は、互いに大きく異なる。すべてのオーディオファイルは、オーディオファイルセットを形成する可能性がある。音声確認要求を受信するとき、制御モジュール311は、オーディオファイルセットからオーディオファイルを無作為に選択し、無作為に選択されたオーディオファイルを音声確認要求に対応する音声確認情報として使用する。
制御モジュール311によって、音声確認要求に対応する音声確認情報を決定する別の特定の例が、下で与えられ、制御モジュール311は、音声確認要求を受信した後、オーディオファイルを無作為に生じさせ、無作為に生じさせられたオーディオファイルを音声確認要求に対応する音声確認情報として使用する。制御モジュール311によってオーディオファイルを無作為に生じさせる方法は、予め記憶されたオーディオファイルからオーディオ情報の小さなセグメントを無作為に取り込み、それによって、新しいオーディオファイルを生じさせることである可能性があり、その新しいオーディオファイルは単に、無作為に生じさせられたオーディオファイルである。制御モジュール311によってオーディオファイルを無作為に生じさせる方法は、2又は3以上の予め記憶されたオーディオファイルを新しいオーディオファイルへと無作為に合成することである可能性もあり、その新しいオーディオファイルは単に、無作為に生じさせられたオーディオファイルである。
本実施形態は、制御モジュール311が音声確認要求に対応する音声確認情報を決定するための特定の実施形態の方法、オーディオファイルの特定のフォーマット、又は制御モジュール311がオーディオファイルを無作為に生じさせるための特定の実施形態の方法を限定しない。
本実施形態の音声確認情報は、音楽音声確認情報を再生するため、又は数及び/若しくはアルファベット及び/若しくは語及び/若しくは漢字の形態の音声確認情報を再生するために使用される可能性がある。加えて、音声確認情報を再生する時間の長さは、通常、非常に短く、例えば、おおむね1〜5秒である。本実施形態は、音声確認情報によって再生される特定の内容又は音声確認情報を再生する時間の長さを限定しない。
本実施形態において、すべての音声確認情報は、対応する一意識別子を有し、つまり、1つの音声確認情報が、1つの識別子を用いて一意に決定され得る。識別子は、音声確認情報の識別子と呼ばれる可能性がある。音声確認情報に対応する識別子は、特に、オーディオファイルのファイル名、若しくはオーディオファイルの記憶パス及びファイル名の組合せ、又はオーディオファイルのインデックス値、又は無作為生成アルゴリズムを用いて無作為に生じさせられた識別子である可能性がある。本実施形態は、音声確認情報の識別子の特定の表現形態に限定されない。
本実施形態の音声確認情報に対応する識別子は、確認プロセス(例えば、決済確認プロセス)のために使用される可能性があり、音声マッチングアルゴリズムにおいて識別子を追加することによって、音声確認の結果の正確さが、さらに保証される可能性がある。
一実施形態においては、音声確認要求に対応する音声確認情報を決定する間に、制御モジュール311は、例えば、オーディオファイルのファイル名又はインデックス値を音声確認情報として取得し、別の例として、オーディオファイルの記憶パス及びファイル名を音声確認情報として取得するなど、音声確認情報に対応する識別子をやはり取得する可能性があり、それから、制御モジュール311は、音声確認情報に対応する識別子をユーザ側に提供する可能性がある。通常の状況においては、制御モジュール311は、決定された音声確認情報に対応する識別子を音声確認要求モジュール321に提供し得る。音声確認要求モジュール321は、制御モジュール311から送信された音声確認情報に対応する識別子を監視記録モジュール322に提供すべきであり、音声確認要求モジュール321及び監視記録モジュール322が同じユーザ機器に設けられない場合、音声確認要求モジュール321は、Wi−Fi又はBluetoothなどのワイヤレス送信方法によって監視記録モジュール322に音声確認情報に対応する識別子を提供する可能性があり、音声確認要求モジュール321は、監視記録モジュール322が2次元コードをスキャンすることによって音声確認情報に対応する識別子を取得し得るように2次元コードを表示する可能性もあり、もちろん、音声確認要求モジュール321は、制御モジュール311から送信された音声確認情報に対応する識別子を監視記録モジュール322に提供するためにその他の都合の良い送信方法を採用する可能性もあり、加えて、音声確認要求モジュール321は、監視記録モジュール322がその後の記録から得られた記録情報に関する受信者を知り得るように、識別子を送信するとき、監視記録モジュール322に音声確認要求に関する受信者情報も提供する可能性がある。本実施形態は、音声確認要求モジュール321がネットワーク側から送信された音声確認情報に対応する識別子を監視記録モジュール322にどのようにして提供するかに関して特定の実施形態の方法を限定しない。
実際の応用シナリオでは、本実施形態の制御モジュール311が音声確認情報に対応する識別子をユーザ側に提供する可能性があるが、それは、本実施形態の制御モジュール311が音声確認情報に対応する識別子をユーザ側に提供しなければならないことを意味せず、つまり、制御モジュール311が音声確認情報に対応する識別子をユーザ側に提供しないとき、本実施形態の確認手順がやはり完全に実施され得ることに特に留意されたい。
通話モジュール312は、主に、制御モジュール311によって取得されたユーザ音声通信番号に従って対応するユーザへの通話を開始し、コールスルーの場合、決定された音声確認情報をユーザに対して再生するように適合される。
特に、通話モジュール312は、ユーザ音声通信番号に従って通話操作を実行することによってネットワーク側とユーザ側との間の音声通話接続(すなわち、音声リンク)を確立する。通話モジュール312は、既存の通話方法を使用してユーザ側との音声通話接続を確立する可能性があり、例えば、通話モジュール312は、IPネットワークがPSTNに接続されるとき、IVR技術を用いてユーザ側との音声通話接続を確立する。
ユーザ側で音声通話接続を正常に確立する(例えば、ユーザが着信に答える)場合、通話モジュール312は、音声通話接続に基づいてユーザに対して上で決定された音声確認情報を再生する。本実施形態は、通話モジュール312によって対応するユーザへの通話を開始し、通話モジュール312によって音声通話接続を通じてユーザに対して音声確認情報を再生する特定の実施形態の方法を限定しない。
通話モジュール312は、ユーザに対して音声確認情報を正常に再生するために通話反復機能を提供し、例えば、音声通話接続がユーザの現在の通話のために正常に確立されないか、音声通話接続がユーザの現在の通話のために正常に確立されたが、音声確認情報が正常に再生されない場合、通話モジュール312は、ユーザのために通話機能を再実行すべきである。
通話モジュール312によって通話を繰り返す特定の例は、通話モジュール312がユーザ音声通信番号の加入位置を決定することができない場合、通話モジュール312が、ユーザ音声通信番号を調整する(例えば、現在の通話に対応する特定の失敗理由に基づいてユーザ音声通信番号をどのようにして調整すべきかを決める)可能性があり、調整後にユーザを呼び出す操作を再び実行し、例えば、通話モジュール312が、ユーザ音声通信番号の前に0をダイヤルし、それから、ユーザを再び呼び出し、別の例として、通話モジュール312が、ユーザ音声通信番号の前に加えられた0を削除し、それから、ユーザを再び呼び出すことである。
通話モジュール312によって通話を繰り返す別の特定の例は、現在の通話のために通話モジュール312によって使用される発呼者の番号に異常が起こる(例えば、発呼者の番号がPSTNによって遮られる)場合、通話モジュール312が、その他の発呼者の番号を用いてユーザを呼び出す操作を再び実行する可能性があることである。言い換えると、複数の発呼者の番号が、通話モジュール312において与えられ、通話モジュール312が発呼者の番号に由来する原因でユーザ側との音声通話接続を正常に確立することができない場合、通話モジュール312は、発呼者の番号を変更し、新しい発呼者の番号を用いてユーザ側との音声通話接続を確立しようと再び試みるべきである。
通話モジュール312によって通話を繰り返すさらなる特定の例は、ユーザ側との音声通話接続が現在の通話のために正常に確立されたが、音声確認情報が接続の中断のような原因で正常に再生されない場合、通話モジュール312が、音声確認情報を正常に再生することができるようにユーザを呼び出す操作を再び実行する可能性があることである。
監視記録モジュール322は、主に、ユーザへの通話を監視し、音声確認要求に関してネットワーク側によって再生される音声認証情報を取得するために、ユーザが呼び出されることを監視するときに、自動リスニング及び記録操作を実行するように適合され、通話が終了すると、監視記録モジュール322は、音声確認モジュール313が記録情報に従って音声確認を実行し得るように、記録から得られた記録情報をネットワーク側に送信する。
特に、監視記録モジュール322は、音声確認要求モジュール321が音声確認要求を送信した後、通話監視ステータスになる可能性があり、例えば、監視記録モジュール322は、確認サービスを開始した後、通話監視ステータスになり、着信が監視されるとき、監視記録モジュール322は、リスニング操作を自動的に実行し、記録サービスなどを呼び出すことによって音声通話接続で再生されたオーディオ信号を記録し、現在の通話が終了される(例えば、電話が切られる)と、監視記録モジュール322は、記録情報を含む音声確認メッセージをネットワーク側(例えば、制御モジュール311)に自動的に送信し、例えば、監視記録モジュール322は、HTTPによって制御モジュール311に記録情報を送信し、制御モジュール311は、音声確認モジュール313が音声確認メッセージに関して音声確認操作を実行し得るように、記録情報を音声確認モジュール313に提供する。
その他の通話(確認と関係がない通話)に対して自動リスニング及び記録操作を実行することを防止するために、監視記録モジュール322は、通話監視ホワイトリストを予め記憶し、監視記録モジュール322は、監視される通話の発呼側が予め記憶された通話ホワイトリスト内の発呼側であるときに自動リスニング及び自動記録操作を実行するだけである可能性があり、そうでないとき、監視記録モジュール322は、自動リスニング及び自動記録操作を実行しない。
監視記録モジュール322は、音声確認情報に対応する識別子を受信するとき、記録情報を受信された識別子と共に制御モジュール311に送信する可能性があり、例えば、監視記録モジュール322は、記録情報及び識別子を含むHTTPに基づく音声確認メッセージを制御モジュール311に送信する。
上の例について続けると、音声確認要求モジュール321が置かれるユーザ機器が監視記録モジュールが置かれるユーザ機器ではないとき、監視記録モジュール322は、音声確認要求モジュール321から送信された音声確認情報に対応する識別子、及び音声確認要求に関する受信者情報を受信した後、識別子及び音声確認要求に関する受信者情報をバッファリングし、制御モジュール311に記録情報を送信すると、受信者情報に基づいて制御モジュール311に識別子及び記録情報を一緒に送信する。
音声確認モジュール313は、主に、ユーザ側からの音声確認情報及び記録情報に従って音声確認の結果を決定するように適合される。
特に、音声確認モジュール313は、音声マッチング操作の正確さを高めるために、その音声確認モジュール313が受信する記録情報(例えば、制御モジュール311から送信された記録情報)を前処理した後、音声マッチング操作を実行する可能性がある。ここで、前処理は、雑音低減処理及び正規化処理を指す。
音声確認モジュール313によって確認結果を決定する特定の例は、音声確認モジュール313が、受信された記録情報とローカルに記憶されたそれぞれの音声確認情報との間でそれぞれ音声マッチングを実行し、記録情報に一致する音声確認情報が制御モジュール311によって前に決定された音声確認情報であるとき、今回の音声確認が成功したと決定し、そうでないとき、今回の音声確認が失敗したと決定されることである。
音声確認モジュール313によって確認結果を決定する別の特定の例は、音声確認モジュール313が、受信された記録情報と制御モジュール311によって前に決定された音声確認情報との間で音声マッチングを実行し、音声マッチングの結果がそれらの情報が一致するということであるとき、音声確認モジュール313が、今回の音声確認が成功したと決定し、一方、音声マッチングの結果がそれらの情報が一致しないということであるとき、音声確認モジュール313が、今回の音声確認が失敗したと決定することである。
音声確認モジュール313が記録情報を受信するだけでなく、ユーザ側から送信された音声確認情報に対応する識別子も受信する場合、音声確認モジュール313によって確認結果を決定する特定の例は、音声確認モジュール313が、ローカルに記憶されたすべての音声確認情報から音声確認情報の一部を選び出し、受信された記録情報と音声確認情報の一部との間でそれぞれ音声マッチングを実行し、記録情報とマッチングされた音声確認情報が制御モジュール311によって前に決定された音声確認情報であるとき、音声確認モジュール313が、今回の音声確認が成功したと決定し、そうでないとき、音声確認モジュール313が、今回の音声確認が失敗したと決定することである。
音声確認モジュール313は、識別子及び記録情報を用いて音声確認を実行するためにその他の方法を採用する可能性もあり、例えば、ユーザから送信された識別子が前に決定された識別子と一致し、記録情報も前に決定された音声確認情報と一致すると決定する場合、音声確認モジュール313は、今回の音声確認が成功したと決定し、そうでないとき、音声確認モジュール313は、今回の音声確認が失敗したと決定する。
実施形態の音声確認情報に対応する識別子が音声確認を決定する過程で補助情報として働く可能性があり、例えば、それが音声マッチングの回数を減らすか、又は音声確認を決定するための条件として働く可能性があることが、上の説明から分かる。
音声確認モジュール313の音声マッチングプロセスは、記録情報内の特徴を抽出することと、抽出された特徴を音声確認の特徴と比較することとを含む可能性があり、本実施形態におけるそれぞれの音声確認情報の特徴が、予め抽出され、音声確認モジュール313でローカルに記憶される可能性がある。音声確認モジュール313の音声マッチングプロセスは、記録情報に対して音声認識を実行することと、記録情報の音声認識の結果を音声確認情報の音声認識の結果と比較することとをさらに含む可能性があり、本実施形態におけるそれぞれの音声確認情報の音声認識の結果は、予め実行され、ネットワーク側に記憶された音声認識である可能性がある。もちろん、音声確認モジュール313は、音声マッチングを実行するためにその他の音声マッチングアルゴリズムを使用する可能性もある。本実施形態は、音声確認モジュール313によって実行される音声マッチングの特定の実施形態の方法を限定しない。
音声確認が成功したとき、ネットワーク側(例えば、制御モジュール311)は、その後の処理手順(例えば、その後の決済処理又はその後のユーザログオン手順など)に進み得る。加えて、この決済手順が(成功か若しくは失敗かにかかわらず)完了されるか又はログオン手順が(ログオン失敗か若しくはログオン成功かにかかわらず)完了されるとき、監視記録モジュール322は、ユーザの通話をもはや監視しない可能性があり、例えば、監視記録モジュール322は、現在開始されている監視サービスを閉じる。
実施形態4:音声確認装置
音声確認装置の主な構造が、図4に示される。
図4の音声確認装置は、制御モジュール311、通話モジュール312、及び音声確認モジュール313を含み、これらのモジュールは、ネットワーク側に設けられる。制御モジュール311、通話モジュール312、及び音声確認モジュール313は、ネットワーク側の同じデバイスに組み込まれるか、又はネットワーク側の2つ若しくは3つの相互に独立したデバイスに別々に配される可能性がある。
制御モジュール311は、主に、ユーザ側からの音声確認要求に従ってユーザ音声通信番号を取得し、音声確認要求に対応する音声確認情報を決定するように適合される。
通話モジュール312は、主に、制御モジュール311によって取得されたユーザ音声通信番号に従って対応するユーザへの通話を開始し、コールスルーの場合、音声確認情報をユーザに対して再生するように適合される。
音声確認モジュール313は、主に、制御モジュール311によって決定された音声確認情報及びユーザ側からの記録情報に従って音声確認の結果を決定するように適合される。
制御モジュール311、通話モジュール312、及び音声確認モジュール313によって実行される特定の操作は、上の実施形態2及び実施形態3において説明されており、実施形態2に関して、制御モジュール311は、決済サーバに設けられる可能性があり、通話モジュール312は、コールセンターに設けられる可能性があり、一方、音声確認モジュール313は、音声マッチングサーバ及び決済サーバに設けられる可能性があり(つまり、音声確認モジュール313の音声マッチングの部分が音声マッチングサーバによって実行され、一方、決済サーバが音声マッチングの結果に応じて音声確認の結果の決定の部分を実行する)、これは、繰り返して説明されない。
実施形態5 音声確認装置
本実施形態の音声確認モジュールの主な構造が、図5に示される。
図5の音声確認モジュールは、音声確認要求モジュール及び監視記録モジュール322を含み、これらのモジュールは、ユーザ側に設けられる。
本実施形態における音声確認要求モジュール321及び監視記録モジュール322は、ユーザ側の同じユーザ機器内に設けられる可能性があり、例えば、1つのスマートモバイル電話に配され、音声確認要求モジュール321及び監視記録モジュール322は、2つの相互に独立したデバイス内にそれぞれ設けられる可能性もあり、例えば、音声確認要求モジュール321が、PC又はタブレットコンピュータ内に設けられる一方、監視記録モジュール322は、スマートモバイル電話内に設けられる。
音声確認要求モジュール321は、主に、ネットワーク側に音声確認要求を送信するように適合される。
監視記録モジュール322は、主に、ネットワーク側からユーザへの通話を監視し、ユーザが呼び出されることを監視するとき、音声確認要求に応答してネットワーク側によって再生された音声確認情報を取得するために自動ピックアップ及び記録操作を実行するように適合され、通話が終了すると、監視記録モジュール322は、ネットワーク側が記録情報に従って音声確認を実行し得るように、記録から得られた記録情報をネットワーク側に送信する。
音声確認要求モジュール321及び監視記録モジュール322によって実行される特定の操作は、実施形態2及び実施形態3において説明されており、音声確認要求モジュール321及び監視記録モジュール322の特定の例は、実施形態2のワイヤレス決済クライアントであり、これは、本明細書において繰り返して説明されない。
本開示はソフトウェア又はソフトウェア及びハードウェアの組合せで実装される可能性があり、例えば、専用集積回路(ASIC)、多目的コンピュータ、又は任意のその他の同様のハードウェアデバイスによって実装される可能性があることに留意されたい。一実施形態において、本開示のソフトウェアプログラムは、上記ステップ又は機能を実施するためにプロセッサによって実行される可能性がある。同様に、(関連するデータ構造を含む)本開示のソフトウェアプログラムは、コンピュータ可読記録媒体、例えば、RAMメモリ、磁気若しくは光ドライバ、又はフロッピーディスク、及び同様のデバイスに記憶され得る。加えて、本開示の機能の一部のステップは、ハードウェア、例えば、さまざまな機能又はステップを実行するためにプロセッサと協力する回路によって実施される可能性がある。
本開示が上の例示的な実施形態の詳細に限定されず、本開示の精神又は基本的特徴から逸脱することなくその他の形態で実施され得ることは、当業者に明らかである。したがって、実施形態は必ず例示的と考えられるべきであり、限定的であると考えられるべきでなく、本開示の範囲は上の説明ではなく添付の請求項によって限定される。したがって、請求項の等価な要素の意味及び範囲に入るように意図されるすべての変更は、本開示に包含されるべきである。請求項の参照符号は、関連する請求項を限定すると考えられるべきでない。加えて、用語(「含む(comprise)/含んでいる(comprising)/含む(include)/含んでいる(including)」)は、その他のユニット又はステップを除外せず、単数は、複数を除外しないことは明らかである。装置の請求項に記載の複数のユニット又は手段は、ソフトウェア又はハードウェアによって単一のユニット又は手段によって実装される可能性もある。第1の及び第2のなどの用語は、名前を示すために使用され、いかなる特定の順番も示さない。
例示的な実施形態が上で特に示され、説明されたが、当業者は、請求項の精神及び範囲を逸脱することなく、それらの例示的な実施形態の形態及び詳細がある程度変わり得ることを理解するであろう。本明細書において、求められる保護は、添付の請求項において定義される。それぞれの実施形態のこれらの及びその他の態様は、以下の付番された項で規定される。
1.
音声確認の方法であって、
ネットワーク側で、ユーザ側からの音声確認要求に従ってユーザ音声通信番号を取得し、音声確認要求に対応する音声確認情報を決定するステップと、
ネットワーク側で、ユーザ音声通信番号に従って対応するユーザへの通話を開始し、コールスルーの場合、決定された音声確認情報をユーザに対して再生するステップと、
ユーザ側で、ユーザが呼び出されることを監視するとき、自動リスニング及び記録操作を実行し、通話が終了すると、記録から得られた記録情報をネットワーク側に送信するステップと、
ネットワーク側で、音声確認情報及び記録情報に従って確認結果を決定するステップとを含む、前記方法。
2.
音声確認要求に対応する音声確認情報を決定するステップが、
複数の予め設定されたオーディオファイルからオーディオファイルを無作為に選択し、無作為に選択されたオーディオファイルを音声確認要求に対応する音声確認情報として使用するステップ、又は
音声確認要求に関するオーディオファイルを無作為に生じさせ、無作為に生じさせられたオーディオファイルを音声確認要求に対応する音声確認情報として使用するステップをさらに含む、項1に記載の方法。
3.
音声確認要求に対応する音声確認情報を決定するステップが、
音声確認情報の識別を取得し、識別子をユーザ側に提供するステップをさらに含み、
記録から得られた記録情報をネットワーク側に送信するステップが、
記録から得られた記録情報及び識別子を一緒にネットワーク側に送信するステップを含む、項1に記載の方法。
4.
音声確認情報及び記録情報に従って音声確認の結果を決定するステップが、
受信された識別子に従って複数の音声確認情報を選択し、記録情報と選択された複数の音声確認情報との間でそれぞれ音声マッチングを実行するステップと、
記録情報に一致する音声確認情報が音声確認要求に対応する音声確認情報であると決定した場合、音声確認が成功したと決定し、そうでない場合、音声確認が失敗したと決定するステップとを含む、項3に記載の方法。
5.
ユーザが呼び出されることを監視するとき、自動リスニング及び記録操作を実行するステップが、
ユーザが呼び出され、発呼側がホワイトリスト内の発呼側に属することを監視するとき、自動リスニング及び記録操作を実行するステップを含む、項1〜4のいずれかに記載の方法。
6.
音声確認の方法であって、
音声確認要求をネットワーク側に送信するステップと、
ネットワーク側からユーザへの通話を監視し、ユーザが呼び出されることを監視する場合、音声確認要求に応答してネットワークによって実行される音声確認情報を取得するために自動リスニング及び記録操作を実行するステップと、
通話が終了すると、ネットワーク側が記録情報に従って音声確認を実行するように、記録から得られた記録情報をネットワーク側に送信するステップとを含む、前記方法。
7.
ネットワーク側から送信された音声確認情報の識別子を受信するステップをさらに含み、
記録から得られた記録情報をネットワーク側に送信するステップが、
記録から得られた記録情報及び識別子を一緒にネットワーク側に送信するステップを含み、
識別子が、記録情報と共に音声確認を実行するためのものである、項6に記載の方法。
8.
ユーザが呼び出されることを監視する場合、自動リスニング及び記録操作を実行するステップが、
ユーザが呼び出され、発呼側がホワイトリスト内の発呼側に属することを監視するとき、自動リスニング及び記録操作を実行するステップを含む、項6又は7に記載の方法。
9.
音声確認の方法であって、
ユーザ側からの音声確認要求に従ってユーザ音声通信番号を取得し、音声確認要求に対応する音声確認情報を決定するステップと、
ユーザ音声通信番号に従って対応するユーザへの通話を開始し、コールスルーの場合、音声確認情報をユーザに対して再生するステップと、
音声確認情報及びユーザ側から受信された記録情報に従って音声確認の結果を決定するステップであって、記録情報が、ユーザ側で、ユーザが呼び出されることを監視するとき、自動リスニング及び記録操作を実行することから得られた情報を指す、ステップとを含む、前記方法。
10.
音声確認要求に対応する音声確認情報を決定するステップが、
複数の予め設定されたオーディオファイルからオーディオファイルを無作為に選択し、無作為に選択されたオーディオファイルを音声確認要求に対応する音声確認情報として使用するステップ、又は
音声確認要求に関するオーディオファイルを無作為に生じさせ、無作為に生じさせられたオーディオファイルを音声確認要求に対応する音声確認情報として使用するステップを含む、項9に記載の方法。
11.
音声確認要求に対応する音声確認情報を決定するステップが、
音声確認情報の識別子を取得し、識別子をユーザ側に提供するステップをさらに含み、
記録から得られた記録情報をネットワーク側に送信するステップが、
記録から得られた記録情報及び識別子を一緒にネットワーク側に送信するステップを含む、項9又は10に記載の方法。
12.
音声確認情報及び記録情報に従って音声確認の結果を決定するステップが、
受信された識別子に従って複数の音声確認情報を選択し、記録情報と選択された複数の音声確認情報との間でそれぞれ音声マッチングを実行するステップと、
記録情報に一致する音声確認情報が音声確認要求に対応する音声確認情報であると決定した場合、音声確認が成功したと決定し、そうでない場合、音声確認が失敗したと決定するステップとを含む、項11に記載の方法。
13.
ユーザ側に提供される音声確認のための装置であって、
ネットワーク側に音声確認要求を送信するように適合された音声確認要求モジュールと、
ネットワーク側からユーザへの通話を監視し、ユーザが呼び出されることを監視する場合、音声確認要求に応答してネットワーク側によって再生された音声確認情報を取得するために、自動リスニング及び記録操作を実行し、通話が終了すると、ネットワーク側が記録情報に従って音声確認を実行するように、記録から得られた記録情報をネットワーク側に送信するように適合された監視記録モジュールとを含む、前記装置。
14.
音声確認要求モジュールが、
ネットワーク側から送信された音声確認情報の識別子を受信するようにさらに適合され、
監視記録モジュールが、
記録から得られた記録情報及び識別子を共にネットワーク側に送信するように特に適合され、
識別子が、記録情報と共に音声確認を実行するためのものである、項13に記載の装置。
15.
監視記録モジュールが、
ユーザが呼び出され、発呼側がホワイトリスト内の発呼側に属することを監視するとき、自動リスニング及び記録操作を実行するように特に適合される、項13又は14に記載の装置。
16.
ネットワーク側に提供される音声確認のための装置であって、
ユーザ側からの音声確認要求に従ってユーザ音声通信番号を取得し、音声確認要求に対応する音声確認情報を決定するように適合された制御モジュールと、
ユーザ音声通信番号に従って対応するユーザへの通話を開始し、コールスルーの場合、音声確認情報をユーザに対して再生するように適合された通話モジュールと、
音声確認情報及びユーザ側から受信された記録情報に従って音声確認の結果を決定するように適合された音声確認モジュールであって、記録情報が、ユーザ側で、ユーザが呼び出されることを監視するとき、自動リスニング及び記録操作を実行することから得られた情報を指す、音声確認モジュールとを含む、前記装置。
17.
制御モジュールが、
複数の予め設定されたオーディオファイルからオーディオファイルを無作為に選択し、無作為に選択されたオーディオファイルを音声確認要求に対応する音声確認情報として使用するか、又は
音声確認要求に関するオーディオファイルを無作為に生じさせ、無作為に生じさせられたオーディオファイルを音声確認要求に対応する音声確認情報として使用するように特に適合される、項16に記載の装置。
18.
制御モジュールが、
音声確認情報の識別子を取得し、識別子をユーザ側に提供するようにさらに適合され、
制御モジュールが、ユーザ側から記録情報及び識別子を受信するように特に適合される、項16又は17に記載の装置。
19.
音声確認モジュールが、
受信された識別子に従って複数の音声確認情報を選択し、記録情報と選択された複数の音声確認情報との間でそれぞれ音声マッチングを実行し、
記録情報に一致する音声確認情報が音声確認要求に対応する音声確認情報であると決定した場合、音声確認が成功したと決定し、そうでない場合、音声確認が失敗したと決定するように特に適合される、項18に記載の方法。
20.
音声確認のシステムであって、
項13〜15のいずれかに記載の装置及び項16〜19のいずれかに記載の装置を含む、前記システム。
関連出願の相互参照
本出願は、2015年6月30日に出願した「Method of voice verification, Apparatus, And System」と題した中国特許出願第201510378018.X号の優先権を主張するものであり、この特許出願の内容は、参照によって本明細書に組み込まれる。
本発明は、確認技術に関し、より詳細には、音声確認の方法、音声確認装置、及び音声確認システムに関する。
ユーザの財産の喪失及びユーザ情報の漏洩を防止するためのユーザアカウントのセキュリティ又はユーザ情報のセキュリティを守るために、確認が、ネットワーク決済及びユーザのログオンのようなプロセスに広く適用されてきた。
既存の確認プロセスは、通常、(マルチメディアメッセージングサービス(MMS,Multimedia Messaging Service)メッセージを含む)ショートメッセージングサービス(SMS,Short Messaging Service)メッセージに基づいて実装される。特定の実施形態のプロセスは、概して、ユーザ機器から確認要求を受信した後、サーバ(例えば、決済サーバ又はログオンサーバ)によって、ユーザによって予約されたモバイル電話番号を検索し、確認コードが数字又はアルファベット又は数字及びアルファベットの組合せである可能性がある、確認要求に関する確認コードを生じさせること、サーバによって、ユーザによって予約されたモバイル電話番号に従ってSMSサーバを介してユーザに確認コードを含むSMSメッセージを送信すること、SMSを受信した後にユーザによって、対応するページの入力ボックスにSMSの確認コードを入力すること、ユーザ機器から確認コードを受信した後にサーバによって、前に生じさせられた確認コード及び受信された確認コードに従って確認を行うことを含む。確認結果は、主として、サーバがその後の手順(例えば、その後のログオン手順又は決済手順など)を決めるためのものである。
本発明を生み出す過程で、発明者らは、既存の確認方法がネットワーク攻撃及び確認要求の偽造を含む違法行為によるユーザアカウント及びユーザ情報に対するセキュリティの問題をある程度防止することができるが、不便さ、不確実さ、及び単一の確認手段のような問題に対処するための改善をまだ必要とすることを発見している。特に、SMSメッセージが記憶及び転送メカニズム(storage and forwarding mechanism)を介して送信されるので、SMSサーバは、SMSメッセージを送信するときに受信者のステータス(例えば、受信者が電源がオンであるかどうか又は信号のカバーエリア内にあるかどうか)を知らず、したがって、受信者がSMSメッセージを受信する時間が予測できず、このことは、確認プロセスに不確実さを加え、通常の状況においては、SMSをユーザに送信するのに約5〜10秒を要し、ユーザは確認コードが受信されるまで待つ必要があり、さらに、既存の確認方法は、ユーザが受信された確認コードを手動で入力することを必要とするので不便であり、確認コードの手動入力は、確認プロセス中に人為的な瑕疵を持ち込み、確認プロセスの利便性をさらに損なう可能性がある。
本発明の目的は、音声確認のための方法、装置、及びシステムを提供することである。
本発明の一態様によれば、音声確認の方法であって、ネットワーク側で、ユーザ側からの音声確認要求に従ってユーザ音声通信番号を取得し、音声確認要求に対応する音声確認情報を決定するステップと、ネットワーク側で、ユーザ音声通信番号に従って対応するユーザへの通話を開始し、コールスルーの場合、決定された音声確認情報をユーザに対して再生するステップと、ユーザ側で、ユーザが呼び出されることを監視するとき、自動リスニング及び記録操作を実行し、通話が終了すると、記録から得られた記録情報をネットワーク側に送信するステップと、ネットワーク側で、音声確認情報及び記録情報に従って確認結果を決定するステップとを含む、前記方法が提供される。
本発明の別の態様によれば、音声確認の方法であって、音声確認要求をネットワーク側に送信するステップと、ネットワーク側からユーザへの通話を監視し、ユーザが呼び出されることを監視する場合、音声確認要求に応答してネットワークによって実行される音声確認情報を取得するために自動リスニング及び記録操作を実行するステップと、通話が終了すると、ネットワーク側が記録情報に従って音声確認を実行するように、記録から得られた記録情報をネットワーク側に送信するステップとを含む、前記方法が提供される。
本発明の別の態様によれば、音声確認の方法であって、ユーザ側からの音声確認要求に従ってユーザ音声通信番号を取得し、音声確認要求に対応する音声確認情報を決定するステップと、ユーザ音声通信番号に従って対応するユーザへの通話を開始し、コールスルーの場合、音声確認情報をユーザに対して再生するステップと、音声確認情報及びユーザ側から受信された記録情報に従って音声確認の結果を決定するステップであって、記録情報が、ユーザ側で、ユーザが呼び出されることを監視するとき、自動リスニング及び記録操作を実行することから得られた情報を指す、ステップとを含む、前記方法が提供される。
本発明の態様によれば、ユーザ側に提供される音声確認のための装置であって、ネットワーク側に音声確認要求を送信するように適合された音声確認要求モジュールと、ネットワーク側からユーザへの通話を監視し、ユーザが呼び出されることを監視する場合、音声確認要求に応答してネットワーク側によって再生された音声確認情報を取得するために、自動的なリスニング及び記録操作を実行し、通話が終了すると、ネットワーク側が記録情報に従って音声確認を実行するように、記録から得られた記録情報をネットワーク側に送信するように適合された監視記録モジュールとを含む、前記装置提供される。
本発明の別の態様によれば、ネットワーク側に提供される音声確認のための装置であって、ユーザ側からの音声確認要求に従ってユーザ音声通信番号を取得し、音声確認要求に対応する音声確認情報を決定するように適合された制御モジュールと、ユーザ音声通信番号に従って対応するユーザへの通話を開始し、コールスルーの場合、音声確認情報をユーザに対して再生するように適合された通話モジュールと、音声確認情報及びユーザ側から受信された記録情報に従って音声確認の結果を決定するように適合された音声確認モジュールであって、記録情報が、ユーザ側で、ユーザが呼び出されることを監視するとき、自動的なリスニング及び記録操作を実行することから得られた情報を指す、音声確認モジュールとを含む、前記装置が提供される。
本発明のさらなる態様によれば、ユーザ側に設けられた音声確認のための上述の装置及びネットワーク側に設けられた音声確認のための装置を含む、音声確認システムがさらに提供される。
従来技術と比較して、本発明は、以下の利点、すなわち、ユーザ側からの音声確認要求に応答してユーザへの通話を開始し、ユーザに対して音声確認情報を再生することによって、ネットワーク側がユーザ側のステータスと音声確認情報がユーザ側に対して正常に再生されたかどうかとをはっきりと知り得るという利点を有し、本発明は、ネットワーク側がユーザのステータスを知ることができないことによって引き起こされる確認プロセスのある程度の不確実さを避ける。ユーザ側に監視、自動リスニング、自動音声記録、及びネットワークワークへの記録情報の自動送信などの操作を実行させることによって、本発明の実施形態によれば、ネットワーク側がその後の音声確認操作を速やかで円滑に実行し得るように、確認を必要とする情報(すなわち、記録情報)がネットワーク側に、手動操作を導入することなく自動的に送り返される可能性があり、それは、確認コードの手動入力、ユーザが確認を必要とする情報の受信を待たなければならないこと、及び確認プロセスに人為的な過失を招くことなどによって引き起こされる確認プロセスの不便さのような問題を防止する。したがって、本発明によって提供される技術的な解決策は、確認の利便性を高め、不確実さを減らし、確認の実施形態の方法を充実させることが分かる。
添付の図面を参照して非限定的な実施形態の詳細な説明を読むことによって、本発明のその他の特徴、目的、及び利点がさらに明らかになるであろう。
本発明の第1の実施形態による音声確認の方法の流れ図である。 本発明の第2の実施形態による音声確認の方法の流れ図である。 本発明の第3の実施形態による音声確認システムの概略図である。 本発明の第4の実施形態による音声確認装置の概略図である。 本発明の第5の実施形態による音声確認装置の概略図である。
図面において、同じ又は同様の参照番号は、同じ又は同様の構成要素を表す。
例示的な実施形態をより詳細に検討する前に、一部の例示的な実施形態が流れ図の形態で処理又は方法として説明されることが言及されるべきである。流れ図はそれぞれの操作を順次処理されるものとして示すが、流れ図中の多くの操作は、平行して、同時に、又は一斉に実施される可能性がある。加えて、さまざまな操作が、順序を変えられ得る。操作が完了されるとき、処理は終了される可能性がある。しかし、添付の図面に含まれないさらなるステップが含まれる可能性がある。処理は、方法、機能、仕様、サブルーチン、サブプログラムなどに対応する可能性がある。
文脈の中で言及される「サーバ」は、論理的サーバ又はエンティティサーバ(entity server)を含む可能性があり、エンティティサーバは、「ネットワークデバイス」とも呼ばれる可能性があり、「ネットワークデバイス」とはすなわち、ネットワーク側に設けられ、所定のプログラム又は命令を実行することによって数値計算及び/又は論理計算のような所定の処理手順を実行し得るインテリジェントな電子デバイスである。ネットワークデバイスは、プロセッサ及びメモリを含む可能性があり、プロセッサは、所定の処理手順を実行するための予め記憶されたプログラム命令を実行し、所定の処理手順は、ASIC、FPGA、及びDSPなどのハードウェアによって実行されるか、又は命令及びハードウェアの組合せによって実行される可能性もある。
エンティティサーバは、小型のタブレットデバイス又は大型のタブレットデバイスである可能性がある。サーバは単なる例であり、本発明に適用可能であるならば、その他の既存の又は将来登場するであろうネットワークデバイスも本発明の保護範囲に含まれるべきであり、参照により本明細書に組み込まれることに留意する必要がある。
下で検討される方法(その一部は流れ図によって示される)は、概して、ハードウェア、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語、又はこれらの任意の組合せによって実装される可能性がある。それらの方法がソフトウェア、ファームウェア、ミドルウェア、又はマイクロコードを用いて実装されるとき、必要なタスクを実行するためのプログラムコード又はコードセグメントは、機械又はコンピュータ可読媒体(例えば、ストレージ媒体)に記憶される可能性がある。(1又は2以上の)プロセッサが、必要なタスクを実施する可能性がある。
本明細書において開示される特定の構造及び機能の詳細は、本発明の例示的な実施形態を説明することを目的とした見本であるに過ぎない。むしろ、本発明は、多くの代替的な実施形態によって特に実装され得る。したがって、本発明は本明細書に示される実施形態にのみ限定されると理解されるべきでない。
しかし、「第1の」及び「第2の」のような用語がそれぞれのユニットを説明するために本明細書において使用される可能性があるが、これらのユニットはこれらの用語によって限定されるべきでないことを理解されたい。これらの用語の使用は、ユニットを区別するためのものであるに過ぎない。例えば、例示的な実施形態の範囲を逸脱することなく、第1のユニットが第2のユニットと呼ばれる可能性があり、同様に、第2のユニットが第1のユニットと呼ばれる可能性がある。本明細書において使用される用語「及び/又は」は、列挙された1又は2以上の関連する項目の任意の及びすべての組合せを含む。
1つのユニットがさらなるユニットに「接続される」又は「結合される」とき、そのユニットはさらなるユニットに直接接続されるか若しくは結合される可能性があり、又は中間ユニットが存在する可能性がある。対照的に、ユニットがさらなるユニットに「直接接続される」又は「直接結合される」とき、中間ユニットは存在しない。ユニットの間の関係を説明するためのその他の用語(例えば、「〜の間に配される」対「〜の間に直接配される」、「隣接する」対「直に隣接する」など)は、同様にして解釈されるべきである。
本明細書において使用される用語は、好ましい実施形態を説明するためのものに過ぎず、例示的な実施形態を限定するように意図されていない。別途示されない限り、本明細書において使用される単数形「1つの(a)」又は「1つの(one)」は、複数形も含むように意図される。本明細書において使用される用語「含む(comprise)」及び/又は「含む(include)」は、記載された特徴、整数(integer)、ステップ、操作、ユニット、及び/又は構成要素の存在を規定するが、1若しくは2以上のその他の特徴、整数、ステップ、操作、ユニット、構成要素、及び/又はこれらの組合せの存在又は追加を除外しないことも理解されたい。
一部の代替的な実施形態においては、記載された機能/アクションが図面において示されるものとは異なる順序で行われる可能性があることにも留意されたい。例えば、含まれる機能/アクションに応じて、2つの連続的に示された図が、実質的に同時に又はときには逆の順序で実行される可能性がある。
以降で、本発明が、図面に関連してさらに詳細に説明される。
実施形態1:音声確認の方法
図1は、本実施形態の音声確認の方法の流れ図を示し、図1に示される方法は、主として、ステップS100、ステップS110、ステップS120、及びステップS130を含む。以降、図1のそれぞれのステップが示される。
S100:ネットワーク側で、ユーザ側からの音声確認要求に従ってユーザ音声通信番号(user voice communication number)を取得し、音声確認要求に対応する音声確認情報を決定する。
特に、ネットワーク側は、ユーザによって予約された複数のユーザ音声通信番号を予め記憶する。これらのユーザ音声通信番号は、通信番号の組を形成する。ネットワーク側は、通信番号の予め記憶された組から音声確認要求に対応するユーザ音声通信番号を取得し得る。特定の例において、ネットワーク側の通信番号の組は、ユーザ音声通信番号とユーザ識別子(例えば、ユーザのログオンアカウント又はユーザの決済アカウント情報など。以降、説明はユーザの決済アカウント情報を例として用いて行われる)との間の複数の対応関係を含む。ネットワーク側は、ユーザ側から音声確認要求を受信するとき、まず、音声確認要求で運ばれる情報からユーザの決済アカウント情報を取得する可能性があり、それから、ネットワーク側は、ユーザの決済アカウント情報に対応するユーザ音声通信番号を取得するためにユーザアカウント決済情報を用いて組からマッチング及び検索を実行する。本実施形態は、ネットワーク側で音声確認要求に従ってユーザ音声通信番号を取得する特定の実施形態に限定されない。
本実施形態において取得されるユーザ音声通信番号は、主として、ネットワーク側とユーザ側との間の音声通話接続を確立するためのものである。本実施形態におけるユーザ音声通信番号は、ユーザのモバイル電話番号である可能性がある。
1つの応用シナリオでは、本実施形態において、ユーザ音声通信番号に対応するユーザデバイス及び音声確認要求を送信するユーザ機器は、同じユーザ機器であり、例えば、ユーザは、そのユーザのスマートモバイル電話(又は電話機能を有するタブレットコンピュータ)を用いて決済操作又はログオン操作などを実行し、単に、スマートモバイル電話(又は電話機能を有するタブレットコンピュータ)の番号(すなわち、ユーザのモバイル電話番号)が、ユーザ識別子(例えば、ユーザのログオンアカウント又はユーザの決済アカウント情報など)に対応するユーザ音声通信番号である。
別の応用シナリオでは、本実施形態において、ユーザ音声通信番号に対応するユーザ機器は、音声確認要求を送信するユーザ機器と異なり、例えば、ユーザが、そのユーザのスマートフォン(又は電話機能を有するタブレットコンピュータ)を用いて決済操作又はログオン操作などを実行する一方、ネットワーク側に記憶されたユーザ識別子情報に対応するユーザ音声通信番号は、ユーザのスマートフォンの番号であり、別の例においては、ユーザが、スマートフォンを用いて決済操作を実行する一方、スマートフォンの番号(すなわち、ユーザのモバイル電話番号)は、ユーザ識別子情報(例えば、ユーザのログオンアカウント又はユーザの決済アカウント情報)に対応するユーザ音声通信番号ではなく、つまり、ユーザ識別子情報に対応するユーザ音声通信番号は、決済操作又はログオン操作を実行するためにユーザによって使用されるスマートモバイル電話番号の番号と同一ではない。
本実施形態において、特定の期間(例えば、数時間又は数十時間又は数日)内に異なる音声確認要求に関してネットワーク側で決定される音声確認情報は、通常、反復的でない。言い換えると、本発明のネットワーク側は、特定の期間内に異なる音声確認要求が異なる音声確認情報に対応すべきであることを保証すべきである。
本実施形態のネットワーク側によって、音声確認要求に対応する音声確認情報を決定する特定の例が、下で与えられ、ネットワーク側は、複数のオーディオファイル(音声ファイルとも呼ばれる可能性がある)を予め記憶し、複数のオーディオファイルの特性は、大きく異なり、すべてのオーディオファイルが、オーディオファイルセットを形成する可能性があり、音声確認要求を受信するとき、ネットワーク側は、オーディオファイルセットからオーディオファイルを無作為に選択し、無作為に選択されたオーディオファイルを音声確認要求に対応する音声確認情報として使用する。
本実施形態のネットワーク側によって、音声確認要求に対応する音声確認情報を決定する別の特定の例が、下で与えられ、ネットワーク側は、音声確認要求を受信した後、オーディオファイルを無作為に生じさせ、無作為に生じさせられたオーディオファイルを音声確認要求に対応する音声確認情報として使用する。ネットワーク側でオーディオファイルを無作為に生じさせる方法は、予め記憶されたオーディオファイルからオーディオ情報の小さなセグメントを無作為に取り込み、それによって、新しいオーディオファイルを生じさせることである可能性があり、その新しいオーディオファイルは単に、無作為に生じさせられたオーディオファイルである。ネットワーク側でオーディオファイルを無作為に生じさせる方法は、2又は3以上の予め記憶されたオーディオファイルを新しいオーディオファイルへと無作為に合成することである可能性もあり、その新しいオーディオファイルは単に、無作為に生じさせられたオーディオファイルである。
本実施形態は、ネットワーク側が音声確認要求に対応する音声確認情報を決定するための特定の実施形態の方法を、特定のフォーマットのオーディオファイル、又はネットワーク側がオーディオファイルを無作為に生じさせるための特定の実施形態の方法などに限定しない。
本実施形態の音声確認情報は、音楽音声確認情報(musical voice verification information)を再生するため、又は数及び/若しくはアルファベット及び/若しくは語及び/若しくは漢字の形態の音声確認情報を再生するために使用される可能性があり、加えて、音声確認情報を再生する継続時間は、通常、非常に短く、例えば、おおむね1〜5秒などである。本実施形態は、音声確認情報によって再生される特定の内容又は音声確認情報を再生する時間の長さを限定しない。
本実施形態において、すべての音声確認情報は、対応する一意識別子を有し、つまり、1つの音声確認情報が、1つの識別子を用いて一意に決定され得る。識別子は、音声確認情報の識別子と呼ばれる可能性がある。音声確認情報に対応する識別子は、特に、オーディオファイルのファイル名、若しくはオーディオファイルの記憶パス及びファイル名の組合せ、又はオーディオファイルのインデックス値、又は無作為生成アルゴリズムを用いて無作為に生じさせられた識別子である可能性がある。本実施形態は、音声確認情報の識別子の特定の表現形態に限定されない。
本実施形態の音声確認情報に対応する識別子は、確認プロセス(例えば、決済確認プロセス)のために使用される可能性があり、音声マッチングアルゴリズムにおいて識別子を追加することによって、音声確認の結果の正確さが、さらに保証される可能性がある。
一実施形態においては、音声確認要求に対応する音声確認情報を決定する間に、ネットワーク側は、例えば、オーディオファイルのファイル名又はインデックス値を音声確認情報として取得し、別の例として、オーディオファイルの記憶パス及びファイル名を音声確認情報として取得するなど、音声確認情報に対応する識別子をやはり取得する可能性があり、それから、ネットワーク側は、音声確認情報に対応する識別子をユーザ側に提供する可能性がある。通常の状況においては、ネットワーク側は、決定された音声確認情報に対応する識別子を、ユーザ側の音声確認要求を送信するユーザ機器に提供し得る。音声確認要求を送信するユーザ機器がユーザ音声通信番号に対応するユーザ機器でない場合、音声確認要求を送信するユーザ機器は、ネットワーク側から送信された音声確認情報に対応する識別子をユーザ音声通信番号に対応するユーザ機器に提供する可能性があり、例えば、音声確認要求を送信するユーザ機器は、WiFi又はBluetoothなどのワイヤレス送信方法によって、音声確認情報に対応する識別子を、ユーザ音声通信番号に対応するユーザ機器に提供し、別の例として、音声確認要求を送信するユーザ機器は、ユーザ音声通信番号に対応するユーザ機器が2次元コードをスキャンすることによって音声確認情報に対応する識別子を取得し得るように2次元コードを表示し、もちろん、音声確認要求を送信するユーザ機器は、ネットワーク側から送信された音声確認情報に対応する識別子をユーザ音声通信番号に対応するユーザ機器に提供するためにその他の都合の良い送信方法を採用する可能性もあり、加えて、音声確認要求を送信するユーザ機器は、ユーザ音声通信番号に対応するユーザ機器がその後の記録から得られる記録情報の受信者を知り得るように、識別子を送信するとき、音声確認要求に関する受信者情報もユーザ音声通信番号に対応するユーザ機器に提供する可能性がある。本実施形態は、音声確認要求を送信するユーザ機器がネットワーク側から送信された音声確認情報に対応する識別子をユーザ音声通信番号に対応するユーザ機器にどのようにして提供するかに関して特定の実施形態の方法を限定しない。
実際の応用シナリオでは、本実施形態のネットワーク側が音声確認情報に対応する識別子をユーザ側に提供する可能性があるが、それは、本実施形態のネットワーク側が音声確認情報に対応する識別子をユーザ側に提供しなければならないことを意味せず、つまり、ネットワーク側が音声確認情報に対応する識別子をユーザ側に提供しないとき、本実施形態の確認手順がやはり実施され得ることに特に留意されたい。
S110:ネットワーク側で、ユーザ音声通信番号に従って対応するユーザへの通話を開始し、コールスルー(call through)の場合、決定された音声確認情報をユーザに対して再生する。
特に、本実施形態のネットワーク側は、ユーザ側との音声通話接続(すなわち、音声リンク)を確立するためにユーザ音声通信番号に従って対応する通話操作を実行する可能性がある。本実施形態のネットワーク側は、既存の通話方法を使用してユーザ側との音声通話接続を確立する可能性があり、例えば、ネットワーク側は、公衆交換電話網(PSTN,Public Switched Telephone Network)によってインターネットプロトコル(IP,Internet Protocol)ネットワークに接続し、又はネットワーク側は、自動音声応答(IVR,Interactive Voice Response)技術を用いてユーザ側との音声通話接続を確立する。ユーザ側との音声通話接続を正常に確立する(例えば、ユーザが着信に答える)とき、ネットワーク側は、音声通話接続に基づいてユーザに対して上で決定された音声確認情報を再生する。本実施形態は、ネットワーク側によって対応するユーザへの通話を開始し、ネットワーク側によって音声通話接続を通じてユーザに対して音声確認情報を再生する特定の実施形態の方法を限定しない。
本実施形態のネットワーク側は、ユーザに対して音声確認情報を正常に再生することができるように通話反復機能(call repeating function)を提供し、例えば、音声通話接続がユーザの現在の通話のために正常に確立されない場合、又は音声通話接続がユーザの現在の通話のために正常に確立されたが、音声確認情報が正常に再生されない場合、ネットワーク側は、ユーザのために通話機能を再び実行するべきである。
ネットワーク側で通話を繰り返す特定の例は、ネットワーク側がユーザ音声通信番号の加入位置(subscription location)を決定することができない場合、ネットワーク側が、ユーザ音声通信番号に対して調整を実行し(例えば、現在の通話に対応する特定の失敗理由に基づいてユーザ音声通信番号をどのようにして調整すべきかを決め)、調整後にユーザを呼び出す操作を再実行する可能性があり、例えば、ネットワーク側が、ユーザ音声通信番号の前に0をダイヤルし、ユーザを再び呼び出し、別の例として、ネットワーク側が、ユーザ音声通信番号の前に加えられた0を削除し、ユーザを再び呼び出すことである。
ネットワーク側で通話を繰り返す別の特定の例は、現在の通話によって使用される発呼者の番号に異常が起こる(例えば、発呼者の番号がPSTNによって遮られるなど)場合、ネットワーク側が、その他の発呼者の番号を用いてユーザを呼び出す操作を再び実行する可能性があることである。言い換えると、複数の発呼者の番号が、ネットワーク側において与えられ、ネットワーク側が発呼者の番号に由来する原因でユーザ側との音声通話接続を正常に確立することができない場合、ネットワーク側は、発呼者の番号を変更し、新しい発呼者の番号を用いてユーザ側との音声通話接続を確立しようと再び試みるべきである。
ネットワーク側で通話を繰り返すさらなる特定の例は、ネットワーク側が現在の通話のためにユーザ側との音声通話接続を正常に確立したが、接続の中断のような理由で音声確認情報を正常に再生することができないとき、ネットワーク側が、音声確認情報を正常に再生することができるようにユーザを呼び出す操作を再び実行する可能性があることである。
S120.ユーザ側で、ユーザが呼び出されることを監視するとき、自動リスニング及び記録操作を実行し、通話が終了すると、記録から得られた記録情報をネットワーク側に送信する。
特に、ユーザ側は、音声確認要求を送信した後、通話監視ステータスになる可能性があり、例えば、ユーザ側は、確認サービスを開始した後、通話監視ステータスになり、着信があることを監視するとき、ユーザ側は、リスニング操作を自動的に実行し、記録サービスなどを呼び出すことによって音声通話接続で再生されたオーディオ信号を記録し、通話が終了する(例えば、電話が切られる)と、ユーザ側は、ネットワーク側が音声確認メッセージに関する音声確認操作を実行し得るように、記録情報を含む音声確認メッセージをネットワーク側に自動的に送信し、例えば、ネットワーク側は、ハイパーテキスト転送プロトコル(HTTP,HyperText Transfer Protocol)によってネットワーク側に記録情報を送信する。
その他の通話(確認と関係がない通話)に対して自動リスニング及び記録操作を実行することを防止するために、本実施形態のユーザ側は、通話監視ホワイトリストを予め記憶し、ユーザ側は、監視される通話の発呼側が予め記憶された通話ホワイトリスト内の発呼側に属するときに自動リスニング及び自動記録操作を実行するだけであり、そうでないとき、ユーザ側は、自動リスニング及び自動記録操作を実行しない。
ユーザ側は、ネットワーク側から送信された音声確認情報に対応する識別子を受信する場合、記録情報を受信された識別子と共にネットワーク側に送信する可能性があり、例えば、ユーザ側は、記録情報及び識別子を含むHTTPに基づく音声確認メッセージをネットワーク側に送信する。
上の例について続けると、音声確認要求を送信するユーザ機器がユーザ音声通信番号に対応するユーザ機器ではないとき、ユーザ音声通信番号に対応するユーザ機器は、音声確認要求及び音声確認要求に関する受信者情報を送信するユーザ機器から送信された音声確認情報に対応する識別子を受信した後、音声確認要求内の識別子及び受信者情報をバッファリングし、記録情報をネットワーク側に送信するときに、受信者情報に基づいてネットワーク側に識別子及び記録情報を共に送信する。
S130.ネットワーク側で、音声確認情報及び記録情報に従って確認結果を決定する。
特に、ネットワーク側は、それによって音声マッチング操作の正確さを高めるために受信された記録された情報を前処理した後、音声マッチングの操作を実行する可能性がある。ここで、前処理は、雑音低減処理及び正規化(normalization)処理を指す。
本実施形態において確認結果を決定する特定の例は、ネットワーク側が、受信された記録情報とネットワーク側に記憶されたそれぞれの音声確認情報との間でそれぞれ音声マッチングを実行し、記録情報に一致する音声確認情報がネットワーク側によって前に決定された音声確認情報であるとき、今回の音声確認が成功したと決定し、そうでないとき、今回の音声確認が失敗したと決定されることである。
本実施形態において確認結果を決定する別の特定の例は、ネットワーク側が、受信された記録情報とネットワーク側によって前に決定された音声確認情報との間で音声マッチングを実行し、音声マッチングの結果がそれらの情報が一致するということであるとき、今回の音声確認が成功したと決定し、一方、音声マッチングの結果がそれらの情報が一致しないということであるとき、今回の音声確認が失敗したと決定することである。
ネットワーク側が記録情報を受信するだけでなく、ユーザ側から送信された音声確認情報に対応する識別子も受信する場合、本実施形態において確認結果を決定する特定の例は、ネットワークが、受信された識別子に従ってネットワーク側に記憶されたすべての音声確認情報から音声確認情報の一部を選び出し、受信された記録情報と音声確認情報の一部との間でそれぞれ音声マッチングを実行し、記録情報に一致する音声確認情報がネットワーク側によって前に決定された音声確認情報であるとき、今回の音声確認が成功したと決定し、そうでないとき、今回の音声確認が失敗したと決定することである。
ネットワーク側は、識別子及び記録情報を用いて音声確認を実行するためにその他の方法を採用する可能性もあり、例えば、ユーザから送信された識別子が前に決定された識別子と一致し、記録情報も前に決定された音声確認情報と一致すると決定する場合、今回の音声確認が成功したと決定し、そうでないとき、今回の音声確認が失敗したと決定する。
実施形態の音声確認情報に対応する識別子が音声確認を決定する過程で補助情報として働く可能性があり、例えば、それが音声マッチングの回数を減らすか、又は音声確認を決定するための条件として働く可能性があることが、上の説明から分かる。
本実施形態の音声マッチングプロセスは、記録情報内の特徴を抽出することと、抽出された特徴を音声確認の特徴と比較することとを含む可能性があり、本実施形態におけるそれぞれの音声確認情報の特徴が、予め抽出され、ネットワーク側に記憶される可能性がある。本実施形態の音声マッチングプロセスは、記録情報に対して音声認識を実行することと、記録情報に対する音声認識の結果を音声確認情報に対する音声認識の結果と比較することとをさらに含む可能性があり、本実施形態におけるそれぞれの音声確認情報の音声認識の結果は、予め実行され、ネットワーク側に記憶された音声認識である可能性がある。もちろん、本実施形態は、音声マッチングを実行するためにその他の音声マッチングアルゴリズムを使用する可能性もある。本実施形態は、音声マッチングの特定の実施形態の方法を限定しない。
音声確認が成功したとき、ネットワーク側は、その後の処理手順(例えば、その後の決済手順又はその後のユーザログオン手順など)に進み得る。加えて、この決済手順が(成功か若しくは失敗かにかかわらず)完了されるか又はログオン手順が(ログオン失敗か若しくはログオン成功かにかかわらず)完了されるとき、ユーザ側は、ユーザの通話をもはや監視しない可能性があり、例えば、ユーザ側は、現在開始されている監視サービスなどを閉じる。
実施形態2:音声確認の方法
本実施形態は、スマートモバイル電話を用いてユーザによってネットワーク決済を実行する例を取りあげ、図2を参照して本実施形態の音声確認の方法を示す。本実施形態においては、ユーザによって使用されるスマートモバイル電話の番号が、ネットワーク側のユーザによって予約されたユーザの決済アカウント情報に対応するユーザ音声通信番号である。
図2において、スマートモバイル電話は、ユーザ側に属する。ワイヤレス決済クライアントが、スマートモバイル電話内に提供される。決済サーバ、コールセンター、及び音声マッチングサーバは、ネットワーク側に属する。
本実施形態におけるワイヤレス決済クライアントは、特に、スマートモバイル電話のモバイル決済ソフトウェア開発キット(SDK,Software Development Kit)又はAPP製品の形態である可能性があり、本実施形態における決済サーバ、コールセンター、及び音声マッチングサーバは、ネットワークデバイス(例えば、サーバ)の同じセットに集中的に設けられる可能性があり、又は異なるネットワークデバイスの2つ若しくは3つのセットに別々に配される可能性がある。本実施形態は、ワイヤレス決済クライアント、決済サーバ、コールセンター、及び音声マッチングサーバの特定の表現形態に限定されない。
ステップ1:ネットワーク決済プロセスの間に、ワイヤレス決済クライアントが、音声確認要求を開始し、そのワイヤレス決済クライアントが置かれるスマートモバイル電話の着信を監視し始め、例えば、ワイヤレス決済クライアントは、通話ステータス監視サービスを開始することによって着信を監視する。
ステップ2.ワイヤレス決済クライアントから音声確認要求を受信するとき、決済サーバが、音声確認要求で運ばれた情報(例えば、ユーザの決済アカウント情報)に従ってその決済サーバのローカルに記憶された情報(例えば、ユーザの決済アカウント情報とスマートモバイル電話番号との間の対応関係の組)から音声確認要求に対応するスマートモバイル電話番号を検索し、決済サーバは、その決済サーバが予め記憶するオーディオファイルの識別子の組から識別子を無作為に選択し、識別子をワイヤレス決済クライアントに提供する。
本実施形態におけるすべてのオーディオファイルは、決済サーバに記憶されるか又はコールセンターに記憶される可能性がある。もちろん、すべてのオーディオファイルは、決済サーバ及びコールセンターとは独立したその他の場所に記憶される可能性もある。
ステップ3.決済サーバが、その決済サーバが見つけるスマートモバイル電話番号及び無作為に選択された識別子をコールセンターを通じて対応するユーザを呼び出すためにコールセンターに提供し、識別子に対応する音声確認情報をユーザに対して再生する。決済サーバは、コールセンターによって提供されるウェブサービスインターフェースを通じてコールセンターに識別子及びスマートモバイル電話番号を提供し、それによって、HTTPレイヤに基づくアウトバウンドコールインターフェースの呼び出しを実施する可能性がある。
ステップ4:コールセンターが、ユーザ側のスマートモバイル電話との音声通話接続を確立する(つまり、通話リンクを確立する)ために、決済サーバによって提供されたスマートモバイル電話番号に基づいて通話操作を実行する。音声通話接続が正常に確立された後、コールセンターは、決済サーバによって提供された識別子に従って対応する音声確認情報(例えば、オーディオファイル)を再生し、例えば、コールセンターは、識別子に従ってローカルに記憶されたオーディオファイルから識別子に対応するオーディオファイルを選択し、そして、音声通話接続が正常に確立された後、オーディオファイルを再生する。
ステップ5.スマートモバイル電話のワイヤレス決済クライアントが、ユーザが呼び出され、発呼者がワイヤレス決済クライアントに記憶されたホワイトリストに属することを監視するとき、自動リスニングを実行し、コールセンターによって再生される音声確認情報を記録するために自動記録操作を実行する。
ステップ6.ワイヤレス決済クライアントが、この通話が終了すると、そのワイヤレス決済クライアントが記録する記録情報及び決済サーバによって提供された識別子を、HTTPに基づく音声確認メッセージによって自動的にアップロードする。
ステップ7.決済サーバが、音声マッチング操作を実行するように音声マッチングサーバに要求するために、音声マッチングサーバに受信された記録情報及び識別子を共に提供する。また、音声マッチングサーバは、すべての音声確認情報を記憶する。コールセンターの音声確認情報のすべては、音声マッチングサーバに記憶されたすべての音声確認情報と同一であるべきであり、例えば、音声マッチングサーバの音声確認情報を更新するとき、音声マッチングサーバは、コールセンターのすべての音声確認情報を同期して更新すべきである。音声マッチングサーバは、受信された識別子に従ってすべての音声確認情報の中の音声確認情報の一部を決定し、記録情報と音声確認情報の一部との間の音声マッチングを1つずつ実行し、マッチングされた音声確認情報又は音声確認情報の識別子(例えば、オーディオファイル名)を決済サーバに提供する。決済サーバは、音声確認情報が前に決定された音声確認情報と一致していると判定するか、又は音声マッチングサーバから送信された識別子が前に決定された音声確認情報の識別子と同一であると判定するときに、この音声確認が成功したと決定し、そうでないとき、この音声確認が失敗したと決定する。決済サーバは、音声確認の結果に基づいてその後の決済フローを決める可能性がある。
この決済プロセスが終了した後、ワイヤレス決済クライアントは、ユーザの着信をもはや監視すべきでなく、例えば、ワイヤレス決済クライアントは、電話通話ステータス監視サービスなどを閉じる。
実施形態3:音声確認システム
本実施形態の音声確認システムの主な構造が、図3に示される。
図3の音声確認システムは、主に、制御モジュール311、通話モジュール312、音声確認モジュール313、音声確認要求モジュール321、及び監視記録モジュール322を含み、制御モジュール311、通話モジュール312、及び音声確認モジュール313が、ネットワーク側に設けられる一方、音声確認要求モジュール321及び監視記録モジュール322は、ユーザ側に設けられる。
本実施形態における制御モジュール311、通話モジュール312、及び音声確認モジュール313は、ネットワーク側の同じデバイスに組み込まれるか、又はネットワーク側の2つ若しくは3つの相互に独立したデバイスに別々に配される可能性がある。
本実施形態における音声確認要求モジュール321及び監視記録モジュール322は、ユーザ側の同じユーザ機器内に設けられる可能性があり、例えば、両方ともユーザの同じスマートモバイル電話に配され、音声確認要求モジュール321並びに監視及び記録モジュール322は、2つの相互に独立したユーザ機器内に設けられる可能性もあり、例えば、音声確認要求モジュール321が、PCマシン又はタブレットコンピュータ内に設けられる一方、監視及び記録モジュール322は、スマートモバイル電話内に設けられる。
以降、音声確認システムに含まれるそれぞれのモジュールが、以下で詳細に説明される。
音声確認要求モジュール321は、主に、ネットワーク側に音声確認要求を送信するように適合される。
特に、確認を必要とする応用シナリオでは、音声確認要求モジュール321が、ネットワーク側に音声確認要求を送信するためにトリガされ、例えば、ユーザ側のウェブサイトにログオンする手順の間に、音声確認要求モジュール321が、ネットワーク側に音声確認要求を送信するためにトリガされ、別の例として、ユーザ側でネットワーク決済を実行する手順の間に、音声確認要求モジュール321が、ネットワーク側に音声確認要求を送信するためにトリガされる。
音声確認要求モジュール321によってネットワーク側に送信される音声確認要求は、通常、HTTPに基づく音声確認要求であり、音声確認要求は、通常、ユーザを一意に特徴付け得るユーザ識別子、例えば、ユーザのログオンアカウント又はユーザの決済アカウント情報などを運ぶ。
制御モジュール311は、主に、ユーザ側からの音声確認要求に基づいてユーザ音声通信番号を取得し、音声確認要求に対応する音声確認情報を決定するように適合される。
特に、制御モジュール311は、ユーザによって予約された複数のユーザ音声通信番号を予め記憶する。これらのユーザ音声通信番号は、通信番号の組を形成する。制御モジュール311は、予め記憶された通信番号の組から音声確認要求に対応するユーザ音声通信番号を取得し得る。特定の例として、制御モジュール311は、ユーザ音声通信番号とユーザ識別子(例えば、ユーザのログオンアカウント又はユーザの決済アカウント情報など。以降、説明はユーザの決済アカウント情報を例として用いて行われる)との間の対応関係を予め記憶し、複数の対応関係は、通信番号の組を形成する。ユーザ側から音声確認要求を受信するとき、制御モジュール311は、まず、音声確認要求で運ばれる情報からユーザの決済アカウント情報を取得する可能性があり、それから、制御モジュール311は、ユーザの決済アカウント情報に対応するユーザ音声通信番号を取得するためにユーザアカウント決済情報を用いて組内の対応関係に従ってマッチング及び検索を実行する。本実施形態は、制御モジュール311によって、音声確認要求に従ってユーザ音声通信番号を取得する特定の実施形態の方法に限定されない。
制御モジュール311によって取得されるユーザ音声通信番号は、主として、ネットワーク側とユーザ側との間の音声通話接続を確立するためのものである。制御モジュール311によって取得されるユーザ音声通信番号は、ユーザのモバイル電話番号である可能性がある。
1つの応用シナリオでは、制御モジュール311によって取得されるユーザ音声通信番号に対応するユーザ機器は、音声確認要求モジュール321が置かれるユーザ機器である。別の応用シナリオでは、制御モジュール311によって取得されるユーザ音声通信番号に対応するユーザ機器は、音声確認要求モジュール321が置かれるユーザ機器でない。2つの応用シナリオの特定の例は、上の実施形態1において説明されており、本明細書において繰り返されない。
本実施形態において、特定の期間(例えば、数時間又は数十時間又は数日)内に異なる音声確認要求に関して制御モジュール311によって決定される音声確認情報は、通常、反復的でない。言い換えると、制御モジュール311は、特定の期間内に異なる音声確認要求が異なる音声確認情報に対応すべきであることを保証すべきである。
制御モジュール311によって、音声確認要求に対応する音声確認情報を決定する特定の例が、下で与えられ、ネットワーク側は、複数のオーディオファイルを予め記憶し、複数のオーディオファイルの特徴は、互いに大きく異なる。すべてのオーディオファイルは、オーディオファイルセットを形成する可能性がある。音声確認要求を受信するとき、制御モジュール311は、オーディオファイルセットからオーディオファイルを無作為に選択し、無作為に選択されたオーディオファイルを音声確認要求に対応する音声確認情報として使用する。
制御モジュール311によって、音声確認要求に対応する音声確認情報を決定する別の特定の例が、下で与えられ、制御モジュール311は、音声確認要求を受信した後、オーディオファイルを無作為に生じさせ、無作為に生じさせられたオーディオファイルを音声確認要求に対応する音声確認情報として使用する。制御モジュール311によってオーディオファイルを無作為に生じさせる方法は、予め記憶されたオーディオファイルからオーディオ情報の小さなセグメントを無作為に取り込み、それによって、新しいオーディオファイルを生じさせることである可能性があり、その新しいオーディオファイルは単に、無作為に生じさせられたオーディオファイルである。制御モジュール311によってオーディオファイルを無作為に生じさせる方法は、2又は3以上の予め記憶されたオーディオファイルを新しいオーディオファイルへと無作為に合成することである可能性もあり、その新しいオーディオファイルは単に、無作為に生じさせられたオーディオファイルである。
本実施形態は、制御モジュール311が音声確認要求に対応する音声確認情報を決定するための特定の実施形態の方法、オーディオファイルの特定のフォーマット、又は制御モジュール311がオーディオファイルを無作為に生じさせるための特定の実施形態の方法を限定しない。
本実施形態の音声確認情報は、音楽音声確認情報を再生するため、又は数及び/若しくはアルファベット及び/若しくは語及び/若しくは漢字の形態の音声確認情報を再生するために使用される可能性がある。加えて、音声確認情報を再生する時間の長さは、通常、非常に短く、例えば、おおむね1〜5秒である。本実施形態は、音声確認情報によって再生される特定の内容又は音声確認情報を再生する時間の長さを限定しない。
本実施形態において、すべての音声確認情報は、対応する一意識別子を有し、つまり、1つの音声確認情報が、1つの識別子を用いて一意に決定され得る。識別子は、音声確認情報の識別子と呼ばれる可能性がある。音声確認情報に対応する識別子は、特に、オーディオファイルのファイル名、若しくはオーディオファイルの記憶パス及びファイル名の組合せ、又はオーディオファイルのインデックス値、又は無作為生成アルゴリズムを用いて無作為に生じさせられた識別子である可能性がある。本実施形態は、音声確認情報の識別子の特定の表現形態に限定されない。
本実施形態の音声確認情報に対応する識別子は、確認プロセス(例えば、決済確認プロセス)のために使用される可能性があり、音声マッチングアルゴリズムにおいて識別子を追加することによって、音声確認の結果の正確さが、さらに保証される可能性がある。
一実施形態においては、音声確認要求に対応する音声確認情報を決定する間に、制御モジュール311は、例えば、オーディオファイルのファイル名又はインデックス値を音声確認情報として取得し、別の例として、オーディオファイルの記憶パス及びファイル名を音声確認情報として取得するなど、音声確認情報に対応する識別子をやはり取得する可能性があり、それから、制御モジュール311は、音声確認情報に対応する識別子をユーザ側に提供する可能性がある。通常の状況においては、制御モジュール311は、決定された音声確認情報に対応する識別子を音声確認要求モジュール321に提供し得る。音声確認要求モジュール321は、制御モジュール311から送信された音声確認情報に対応する識別子を監視記録モジュール322に提供すべきであり、音声確認要求モジュール321及び監視記録モジュール322が同じユーザ機器に設けられない場合、音声確認要求モジュール321は、Wi−Fi又はBluetoothなどのワイヤレス送信方法によって監視記録モジュール322に音声確認情報に対応する識別子を提供する可能性があり、音声確認要求モジュール321は、監視記録モジュール322が2次元コードをスキャンすることによって音声確認情報に対応する識別子を取得し得るように2次元コードを表示する可能性もあり、もちろん、音声確認要求モジュール321は、制御モジュール311から送信された音声確認情報に対応する識別子を監視記録モジュール322に提供するためにその他の都合の良い送信方法を採用する可能性もあり、加えて、音声確認要求モジュール321は、監視記録モジュール322がその後の記録から得られた記録情報に関する受信者を知り得るように、識別子を送信するとき、監視記録モジュール322に音声確認要求に関する受信者情報も提供する可能性がある。本実施形態は、音声確認要求モジュール321がネットワーク側から送信された音声確認情報に対応する識別子を監視記録モジュール322にどのようにして提供するかに関して特定の実施形態の方法を限定しない。
実際の応用シナリオでは、本実施形態の制御モジュール311が音声確認情報に対応する識別子をユーザ側に提供する可能性があるが、それは、本実施形態の制御モジュール311が音声確認情報に対応する識別子をユーザ側に提供しなければならないことを意味せず、つまり、制御モジュール311が音声確認情報に対応する識別子をユーザ側に提供しないとき、本実施形態の確認手順がやはり完全に実施され得ることに特に留意されたい。
通話モジュール312は、主に、制御モジュール311によって取得されたユーザ音声通信番号に従って対応するユーザへの通話を開始し、コールスルーの場合、決定された音声確認情報をユーザに対して再生するように適合される。
特に、通話モジュール312は、ユーザ音声通信番号に従って通話操作を実行することによってネットワーク側とユーザ側との間の音声通話接続(すなわち、音声リンク)を確立する。通話モジュール312は、既存の通話方法を使用してユーザ側との音声通話接続を確立する可能性があり、例えば、通話モジュール312は、IPネットワークがPSTNに接続されるとき、IVR技術を用いてユーザ側との音声通話接続を確立する。
ユーザ側で音声通話接続を正常に確立する(例えば、ユーザが着信に答える)場合、通話モジュール312は、音声通話接続に基づいてユーザに対して上で決定された音声確認情報を再生する。本実施形態は、通話モジュール312によって対応するユーザへの通話を開始し、通話モジュール312によって音声通話接続を通じてユーザに対して音声確認情報を再生する特定の実施形態の方法を限定しない。
通話モジュール312は、ユーザに対して音声確認情報を正常に再生するために通話反復機能を提供し、例えば、音声通話接続がユーザの現在の通話のために正常に確立されないか、音声通話接続がユーザの現在の通話のために正常に確立されたが、音声確認情報が正常に再生されない場合、通話モジュール312は、ユーザのために通話機能を再実行すべきである。
通話モジュール312によって通話を繰り返す特定の例は、通話モジュール312がユーザ音声通信番号の加入位置を決定することができない場合、通話モジュール312が、ユーザ音声通信番号を調整する(例えば、現在の通話に対応する特定の失敗理由に基づいてユーザ音声通信番号をどのようにして調整すべきかを決める)可能性があり、調整後にユーザを呼び出す操作を再び実行し、例えば、通話モジュール312が、ユーザ音声通信番号の前に0をダイヤルし、それから、ユーザを再び呼び出し、別の例として、通話モジュール312が、ユーザ音声通信番号の前に加えられた0を削除し、それから、ユーザを再び呼び出すことである。
通話モジュール312によって通話を繰り返す別の特定の例は、現在の通話のために通話モジュール312によって使用される発呼者の番号に異常が起こる(例えば、発呼者の番号がPSTNによって遮られる)場合、通話モジュール312が、その他の発呼者の番号を用いてユーザを呼び出す操作を再び実行する可能性があることである。言い換えると、複数の発呼者の番号が、通話モジュール312において与えられ、通話モジュール312が発呼者の番号に由来する原因でユーザ側との音声通話接続を正常に確立することができない場合、通話モジュール312は、発呼者の番号を変更し、新しい発呼者の番号を用いてユーザ側との音声通話接続を確立しようと再び試みるべきである。
通話モジュール312によって通話を繰り返すさらなる特定の例は、ユーザ側との音声通話接続が現在の通話のために正常に確立されたが、音声確認情報が接続の中断のような原因で正常に再生されない場合、通話モジュール312が、音声確認情報を正常に再生することができるようにユーザを呼び出す操作を再び実行する可能性があることである。
監視記録モジュール322は、主に、ユーザへの通話を監視し、音声確認要求に関してネットワーク側によって再生される音声認証情報を取得するために、ユーザが呼び出されることを監視するときに、自動リスニング及び記録操作を実行するように適合され、通話が終了すると、監視記録モジュール322は、音声確認モジュール313が記録情報に従って音声確認を実行し得るように、記録から得られた記録情報をネットワーク側に送信する。
特に、監視記録モジュール322は、音声確認要求モジュール321が音声確認要求を送信した後、通話監視ステータスになる可能性があり、例えば、監視記録モジュール322は、確認サービスを開始した後、通話監視ステータスになり、着信が監視されるとき、監視記録モジュール322は、リスニング操作を自動的に実行し、記録サービスなどを呼び出すことによって音声通話接続で再生されたオーディオ信号を記録し、現在の通話が終了される(例えば、電話が切られる)と、監視記録モジュール322は、記録情報を含む音声確認メッセージをネットワーク側(例えば、制御モジュール311)に自動的に送信し、例えば、監視記録モジュール322は、HTTPによって制御モジュール311に記録情報を送信し、制御モジュール311は、音声確認モジュール313が音声確認メッセージに関して音声確認操作を実行し得るように、記録情報を音声確認モジュール313に提供する。
その他の通話(確認と関係がない通話)に対して自動リスニング及び記録操作を実行することを防止するために、監視記録モジュール322は、通話監視ホワイトリストを予め記憶し、監視記録モジュール322は、監視される通話の発呼側が予め記憶された通話ホワイトリスト内の発呼側であるときに自動リスニング及び自動記録操作を実行するだけである可能性があり、そうでないとき、監視記録モジュール322は、自動リスニング及び自動記録操作を実行しない。
監視記録モジュール322は、音声確認情報に対応する識別子を受信するとき、記録情報を受信された識別子と共に制御モジュール311に送信する可能性があり、例えば、監視記録モジュール322は、記録情報及び識別子を含むHTTPに基づく音声確認メッセージを制御モジュール311に送信する。
上の例について続けると、音声確認要求モジュール321が置かれるユーザ機器が監視記録モジュールが置かれるユーザ機器ではないとき、監視記録モジュール322は、音声確認要求モジュール321から送信された音声確認情報に対応する識別子、及び音声確認要求に関する受信者情報を受信した後、識別子及び音声確認要求に関する受信者情報をバッファリングし、制御モジュール311に記録情報を送信すると、受信者情報に基づいて制御モジュール311に識別子及び記録情報を一緒に送信する。
音声確認モジュール313は、主に、ユーザ側からの音声確認情報及び記録情報に従って音声確認の結果を決定するように適合される。
特に、音声確認モジュール313は、音声マッチング操作の正確さを高めるために、その音声確認モジュール313が受信する記録情報(例えば、制御モジュール311から送信された記録情報)を前処理した後、音声マッチング操作を実行する可能性がある。ここで、前処理は、雑音低減処理及び正規化処理を指す。
音声確認モジュール313によって確認結果を決定する特定の例は、音声確認モジュール313が、受信された記録情報とローカルに記憶されたそれぞれの音声確認情報との間でそれぞれ音声マッチングを実行し、記録情報に一致する音声確認情報が制御モジュール311によって前に決定された音声確認情報であるとき、今回の音声確認が成功したと決定し、そうでないとき、今回の音声確認が失敗したと決定されることである。
音声確認モジュール313によって確認結果を決定する別の特定の例は、音声確認モジュール313が、受信された記録情報と制御モジュール311によって前に決定された音声確認情報との間で音声マッチングを実行し、音声マッチングの結果がそれらの情報が一致するということであるとき、音声確認モジュール313が、今回の音声確認が成功したと決定し、一方、音声マッチングの結果がそれらの情報が一致しないということであるとき、音声確認モジュール313が、今回の音声確認が失敗したと決定することである。
音声確認モジュール313が記録情報を受信するだけでなく、ユーザ側から送信された音声確認情報に対応する識別子も受信する場合、音声確認モジュール313によって確認結果を決定する特定の例は、音声確認モジュール313が、ローカルに記憶されたすべての音声確認情報から音声確認情報の一部を選び出し、受信された記録情報と音声確認情報の一部との間でそれぞれ音声マッチングを実行し、記録情報とマッチングされた音声確認情報が制御モジュール311によって前に決定された音声確認情報であるとき、音声確認モジュール313が、今回の音声確認が成功したと決定し、そうでないとき、音声確認モジュール313が、今回の音声確認が失敗したと決定することである。
音声確認モジュール313は、識別子及び記録情報を用いて音声確認を実行するためにその他の方法を採用する可能性もあり、例えば、ユーザから送信された識別子が前に決定された識別子と一致し、記録情報も前に決定された音声確認情報と一致すると決定する場合、音声確認モジュール313は、今回の音声確認が成功したと決定し、そうでないとき、音声確認モジュール313は、今回の音声確認が失敗したと決定する。
実施形態の音声確認情報に対応する識別子が音声確認を決定する過程で補助情報として働く可能性があり、例えば、それが音声マッチングの回数を減らすか、又は音声確認を決定するための条件として働く可能性があることが、上の説明から分かる。
音声確認モジュール313の音声マッチングプロセスは、記録情報内の特徴を抽出することと、抽出された特徴を音声確認の特徴と比較することとを含む可能性があり、本実施形態におけるそれぞれの音声確認情報の特徴が、予め抽出され、音声確認モジュール313でローカルに記憶される可能性がある。音声確認モジュール313の音声マッチングプロセスは、記録情報に対して音声認識を実行することと、記録情報の音声認識の結果を音声確認情報の音声認識の結果と比較することとをさらに含む可能性があり、本実施形態におけるそれぞれの音声確認情報の音声認識の結果は、予め実行され、ネットワーク側に記憶された音声認識である可能性がある。もちろん、音声確認モジュール313は、音声マッチングを実行するためにその他の音声マッチングアルゴリズムを使用する可能性もある。本実施形態は、音声確認モジュール313によって実行される音声マッチングの特定の実施形態の方法を限定しない。
音声確認が成功したとき、ネットワーク側(例えば、制御モジュール311)は、その後の処理手順(例えば、その後の決済処理又はその後のユーザログオン手順など)に進み得る。加えて、この決済手順が(成功か若しくは失敗かにかかわらず)完了されるか又はログオン手順が(ログオン失敗か若しくはログオン成功かにかかわらず)完了されるとき、監視記録モジュール322は、ユーザの通話をもはや監視しない可能性があり、例えば、監視記録モジュール322は、現在開始されている監視サービスを閉じる。
実施形態4:音声確認装置
音声確認装置の主な構造が、図4に示される。
図4の音声確認装置は、制御モジュール311、通話モジュール312、及び音声確認モジュール313を含み、これらのモジュールは、ネットワーク側に設けられる。制御モジュール311、通話モジュール312、及び音声確認モジュール313は、ネットワーク側の同じデバイスに組み込まれるか、又はネットワーク側の2つ若しくは3つの相互に独立したデバイスに別々に配される可能性がある。
制御モジュール311は、主に、ユーザ側からの音声確認要求に従ってユーザ音声通信番号を取得し、音声確認要求に対応する音声確認情報を決定するように適合される。
通話モジュール312は、主に、制御モジュール311によって取得されたユーザ音声通信番号に従って対応するユーザへの通話を開始し、コールスルーの場合、音声確認情報をユーザに対して再生するように適合される。
音声確認モジュール313は、主に、制御モジュール311によって決定された音声確認情報及びユーザ側からの記録情報に従って音声確認の結果を決定するように適合される。
制御モジュール311、通話モジュール312、及び音声確認モジュール313によって実行される特定の操作は、上の実施形態2及び実施形態3において説明されており、実施形態2に関して、制御モジュール311は、決済サーバに設けられる可能性があり、通話モジュール312は、コールセンターに設けられる可能性があり、一方、音声確認モジュール313は、音声マッチングサーバ及び決済サーバに設けられる可能性があり(つまり、音声確認モジュール313の音声マッチングの部分が音声マッチングサーバによって実行され、一方、決済サーバが音声マッチングの結果に応じて音声確認の結果の決定の部分を実行する)、これは、繰り返して説明されない。
実施形態5 音声確認装置
本実施形態の音声確認モジュールの主な構造が、図5に示される。
図5の音声確認モジュールは、音声確認要求モジュール及び監視記録モジュール322を含み、これらのモジュールは、ユーザ側に設けられる。
本実施形態における音声確認要求モジュール321及び監視記録モジュール322は、ユーザ側の同じユーザ機器内に設けられる可能性があり、例えば、1つのスマートモバイル電話に配され、音声確認要求モジュール321及び監視記録モジュール322は、2つの相互に独立したデバイス内にそれぞれ設けられる可能性もあり、例えば、音声確認要求モジュール321が、PC又はタブレットコンピュータ内に設けられる一方、監視記録モジュール322は、スマートモバイル電話内に設けられる。
音声確認要求モジュール321は、主に、ネットワーク側に音声確認要求を送信するように適合される。
監視記録モジュール322は、主に、ネットワーク側からユーザへの通話を監視し、ユーザが呼び出されることを監視するとき、音声確認要求に応答してネットワーク側によって再生された音声確認情報を取得するために自動ピックアップ及び記録操作を実行するように適合され、通話が終了すると、監視記録モジュール322は、ネットワーク側が記録情報に従って音声確認を実行し得るように、記録から得られた記録情報をネットワーク側に送信する。
音声確認要求モジュール321及び監視記録モジュール322によって実行される特定の操作は、実施形態2及び実施形態3において説明されており、音声確認要求モジュール321及び監視記録モジュール322の特定の例は、実施形態2のワイヤレス決済クライアントであり、これは、本明細書において繰り返して説明されない。
本開示はソフトウェア又はソフトウェア及びハードウェアの組合せで実装される可能性があり、例えば、専用集積回路(ASIC)、多目的コンピュータ、又は任意のその他の同様のハードウェアデバイスによって実装される可能性があることに留意されたい。一実施形態において、本開示のソフトウェアプログラムは、上記ステップ又は機能を実施するためにプロセッサによって実行される可能性がある。同様に、(関連するデータ構造を含む)本開示のソフトウェアプログラムは、コンピュータ可読記録媒体、例えば、RAMメモリ、磁気若しくは光ドライバ、又はフロッピーディスク、及び同様のデバイスに記憶され得る。加えて、本開示の機能の一部のステップは、ハードウェア、例えば、さまざまな機能又はステップを実行するためにプロセッサと協力する回路によって実施される可能性がある。
本開示が上の例示的な実施形態の詳細に限定されず、本開示の精神又は基本的特徴から逸脱することなくその他の形態で実施され得ることは、当業者に明らかである。したがって、実施形態は必ず例示的と考えられるべきであり、限定的であると考えられるべきでなく、本開示の範囲は上の説明ではなく添付の請求項によって限定される。したがって、請求項の等価な要素の意味及び範囲に入るように意図されるすべての変更は、本開示に包含されるべきである。請求項の参照符号は、関連する請求項を限定すると考えられるべきでない。加えて、用語(「含む(comprise)/含んでいる(comprising)/含む(include)/含んでいる(including)」)は、その他のユニット又はステップを除外せず、単数は、複数を除外しないことは明らかである。装置の請求項に記載の複数のユニット又は手段は、ソフトウェア又はハードウェアによって単一のユニット又は手段によって実装される可能性もある。第1の及び第2のなどの用語は、名前を示すために使用され、いかなる特定の順番も示さない。
例示的な実施形態が上で特に示され、説明されたが、当業者は、請求項の精神及び範囲を逸脱することなく、それらの例示的な実施形態の形態及び詳細がある程度変わり得ることを理解するであろう。本明細書において、求められる保護は、添付の請求項において定義される。それぞれの実施形態のこれらの及びその他の態様は、以下の付番された項で規定される。
1.
音声確認の方法であって、
ネットワーク側で、ユーザ側からの音声確認要求に従ってユーザ音声通信番号を取得し、音声確認要求に対応する音声確認情報を決定するステップと、
ネットワーク側で、ユーザ音声通信番号に従って対応するユーザへの通話を開始し、コールスルーの場合、決定された音声確認情報をユーザに対して再生するステップと、
ユーザ側で、ユーザが呼び出されることを監視するとき、自動リスニング及び記録操作を実行し、通話が終了すると、記録から得られた記録情報をネットワーク側に送信するステップと、
ネットワーク側で、音声確認情報及び記録情報に従って確認結果を決定するステップとを含む、前記方法。
2.
音声確認要求に対応する音声確認情報を決定するステップが、
複数の予め設定されたオーディオファイルからオーディオファイルを無作為に選択し、無作為に選択されたオーディオファイルを音声確認要求に対応する音声確認情報として使用するステップ、又は
音声確認要求に関するオーディオファイルを無作為に生じさせ、無作為に生じさせられたオーディオファイルを音声確認要求に対応する音声確認情報として使用するステップをさらに含む、項1に記載の方法。
3.
音声確認要求に対応する音声確認情報を決定するステップが、
音声確認情報の識別を取得し、識別子をユーザ側に提供するステップをさらに含み、
記録から得られた記録情報をネットワーク側に送信するステップが、
記録から得られた記録情報及び識別子を一緒にネットワーク側に送信するステップを含む、項1に記載の方法。
4.
音声確認情報及び記録情報に従って音声確認の結果を決定するステップが、
受信された識別子に従って複数の音声確認情報を選択し、記録情報と選択された複数の音声確認情報との間でそれぞれ音声マッチングを実行するステップと、
記録情報に一致する音声確認情報が音声確認要求に対応する音声確認情報であると決定した場合、音声確認が成功したと決定し、そうでない場合、音声確認が失敗したと決定するステップとを含む、項3に記載の方法。
5.
ユーザが呼び出されることを監視するとき、自動リスニング及び記録操作を実行するステップが、
ユーザが呼び出され、発呼側がホワイトリスト内の発呼側に属することを監視するとき、自動リスニング及び記録操作を実行するステップを含む、項1〜4のいずれかに記載の方法。
6.
音声確認の方法であって、
音声確認要求をネットワーク側に送信するステップと、
ネットワーク側からユーザへの通話を監視し、ユーザが呼び出されることを監視する場合、音声確認要求に応答してネットワークによって実行される音声確認情報を取得するために自動リスニング及び記録操作を実行するステップと、
通話が終了すると、ネットワーク側が記録情報に従って音声確認を実行するように、記録から得られた記録情報をネットワーク側に送信するステップとを含む、前記方法。
7.
ネットワーク側から送信された音声確認情報の識別子を受信するステップをさらに含み、
記録から得られた記録情報をネットワーク側に送信するステップが、
記録から得られた記録情報及び識別子を一緒にネットワーク側に送信するステップを含み、
識別子が、記録情報と共に音声確認を実行するためのものである、項6に記載の方法。
8.
ユーザが呼び出されることを監視する場合、自動リスニング及び記録操作を実行するステップが、
ユーザが呼び出され、発呼側がホワイトリスト内の発呼側に属することを監視するとき、自動リスニング及び記録操作を実行するステップを含む、項6又は7に記載の方法。
9.
音声確認の方法であって、
ユーザ側からの音声確認要求に従ってユーザ音声通信番号を取得し、音声確認要求に対応する音声確認情報を決定するステップと、
ユーザ音声通信番号に従って対応するユーザへの通話を開始し、コールスルーの場合、音声確認情報をユーザに対して再生するステップと、
音声確認情報及びユーザ側から受信された記録情報に従って音声確認の結果を決定するステップであって、記録情報が、ユーザ側で、ユーザが呼び出されることを監視するとき、自動リスニング及び記録操作を実行することから得られた情報を指す、ステップとを含む、前記方法。
10.
音声確認要求に対応する音声確認情報を決定するステップが、
複数の予め設定されたオーディオファイルからオーディオファイルを無作為に選択し、無作為に選択されたオーディオファイルを音声確認要求に対応する音声確認情報として使用するステップ、又は
音声確認要求に関するオーディオファイルを無作為に生じさせ、無作為に生じさせられたオーディオファイルを音声確認要求に対応する音声確認情報として使用するステップを含む、項9に記載の方法。
11.
音声確認要求に対応する音声確認情報を決定するステップが、
音声確認情報の識別子を取得し、識別子をユーザ側に提供するステップをさらに含み、
記録から得られた記録情報をネットワーク側に送信するステップが、
記録から得られた記録情報及び識別子を一緒にネットワーク側に送信するステップを含む、項9又は10に記載の方法。
12.
音声確認情報及び記録情報に従って音声確認の結果を決定するステップが、
受信された識別子に従って複数の音声確認情報を選択し、記録情報と選択された複数の音声確認情報との間でそれぞれ音声マッチングを実行するステップと、
記録情報に一致する音声確認情報が音声確認要求に対応する音声確認情報であると決定した場合、音声確認が成功したと決定し、そうでない場合、音声確認が失敗したと決定するステップとを含む、項11に記載の方法。
13.
ユーザ側に提供される音声確認のための装置であって、
ネットワーク側に音声確認要求を送信するように適合された音声確認要求モジュールと、
ネットワーク側からユーザへの通話を監視し、ユーザが呼び出されることを監視する場合、音声確認要求に応答してネットワーク側によって再生された音声確認情報を取得するために、自動リスニング及び記録操作を実行し、通話が終了すると、ネットワーク側が記録情報に従って音声確認を実行するように、記録から得られた記録情報をネットワーク側に送信するように適合された監視記録モジュールとを含む、前記装置。
14.
音声確認要求モジュールが、
ネットワーク側から送信された音声確認情報の識別子を受信するようにさらに適合され、
監視記録モジュールが、
記録から得られた記録情報及び識別子を共にネットワーク側に送信するように特に適合され、
識別子が、記録情報と共に音声確認を実行するためのものである、項13に記載の装置。
15.
監視記録モジュールが、
ユーザが呼び出され、発呼側がホワイトリスト内の発呼側に属することを監視するとき、自動リスニング及び記録操作を実行するように特に適合される、項13又は14に記載の装置。
16.
ネットワーク側に提供される音声確認のための装置であって、
ユーザ側からの音声確認要求に従ってユーザ音声通信番号を取得し、音声確認要求に対応する音声確認情報を決定するように適合された制御モジュールと、
ユーザ音声通信番号に従って対応するユーザへの通話を開始し、コールスルーの場合、音声確認情報をユーザに対して再生するように適合された通話モジュールと、
音声確認情報及びユーザ側から受信された記録情報に従って音声確認の結果を決定するように適合された音声確認モジュールであって、記録情報が、ユーザ側で、ユーザが呼び出されることを監視するとき、自動リスニング及び記録操作を実行することから得られた情報を指す、音声確認モジュールとを含む、前記装置。
17.
制御モジュールが、
複数の予め設定されたオーディオファイルからオーディオファイルを無作為に選択し、無作為に選択されたオーディオファイルを音声確認要求に対応する音声確認情報として使用するか、又は
音声確認要求に関するオーディオファイルを無作為に生じさせ、無作為に生じさせられたオーディオファイルを音声確認要求に対応する音声確認情報として使用するように特に適合される、項16に記載の装置。
18.
制御モジュールが、
音声確認情報の識別子を取得し、識別子をユーザ側に提供するようにさらに適合され、
制御モジュールが、ユーザ側から記録情報及び識別子を受信するように特に適合される、項16又は17に記載の装置。
19.
音声確認モジュールが、
受信された識別子に従って複数の音声確認情報を選択し、記録情報と選択された複数の音声確認情報との間でそれぞれ音声マッチングを実行し、
記録情報に一致する音声確認情報が音声確認要求に対応する音声確認情報であると決定した場合、音声確認が成功したと決定し、そうでない場合、音声確認が失敗したと決定するように特に適合される、項18に記載の装置
20.
音声確認のシステムであって、
項13〜15のいずれかに記載の装置及び項16〜19のいずれかに記載の装置を含む、前記システム。

Claims (23)

  1. 音声確認の方法であって、
    ネットワーク側で、ユーザ側からの音声確認要求に従ってユーザ音声通信番号を取得し、前記音声確認要求に対応する音声確認情報を決定するステップと、
    前記ネットワーク側で、前記ユーザ音声通信番号に従って対応するユーザへの通話を開始し、コールスルーの場合、決定された音声確認情報を前記ユーザに対して再生するステップと、
    前記ユーザ側で、前記ユーザが呼び出されることを監視するとき、自動リスニング及び記録操作を実行し、前記通話が終了すると、記録から得られた記録情報を前記ネットワーク側に送信するステップと、
    前記ネットワーク側で、前記音声確認情報及び前記記録情報に従って確認結果を決定するステップとを含む、前記方法。
  2. 音声確認要求に対応する音声確認情報を決定するステップが、
    複数の予め設定されたオーディオファイルからオーディオファイルを無作為に選択し、無作為に選択されたオーディオファイルを前記音声確認要求に対応する音声確認情報として使用するステップ、又は
    前記音声確認要求に関するオーディオファイルを無作為に生じさせ、無作為に生じさせられたオーディオファイルを前記音声確認要求に対応する前記音声確認情報として使用するステップをさらに含む、請求項1に記載の方法。
  3. 音声確認要求に対応する音声確認情報を決定するステップが、
    前記音声確認情報の識別を取得し、識別子をユーザ側に提供するステップをさらに含み、
    記録から得られた記録情報をネットワーク側に送信するステップが、
    記録から得られた前記記録情報及び前記識別子を一緒に前記ネットワーク側に送信するステップを含む、請求項1に記載の方法。
  4. 音声確認情報及び記録情報に従って音声確認の結果を決定するステップが、
    受信された識別子に従って複数の音声確認情報を選択し、前記記録情報と選択された複数の音声確認情報との間でそれぞれ音声マッチングを実行するステップと、
    前記記録情報に一致する音声確認情報が音声確認要求に対応する音声確認情報であると決定した場合、音声確認が成功したと決定し、そうでない場合、前記音声確認が失敗したと決定するステップとを含む、請求項3に記載の方法。
  5. ユーザが呼び出されることを監視するとき、自動リスニング及び記録操作を実行するステップが、
    前記ユーザが呼び出され、発呼側がホワイトリスト内の発呼側に属することを監視するとき、自動リスニング及び記録操作を実行するステップを含む、請求項1〜4のいずれかに記載の方法。
  6. 音声確認の方法であって、
    音声確認要求をネットワーク側に送信するステップと、
    前記ネットワーク側からユーザへの通話を監視し、前記ユーザが呼び出されることを監視する場合、前記音声確認要求に応答してネットワークによって実行される音声確認情報を取得するために自動リスニング及び記録操作を実行するステップと、
    前記通話が終了すると、前記ネットワーク側が記録情報に従って音声確認を実行するように、記録から得られた前記記録情報を前記ネットワーク側に送信するステップとを含む、前記方法。
  7. ネットワーク側から送信された音声確認情報の識別子を受信するステップをさらに含み、
    記録から得られた記録情報を前記ネットワーク側に送信するステップが、
    前記記録から得られた前記記録情報及び前記識別子を一緒に前記ネットワーク側に送信するステップを含み、
    前記識別子が、前記記録情報と共に音声確認を実行するためのものである、請求項6に記載の方法。
  8. ユーザが呼び出されることを監視する場合、自動リスニング及び記録操作を実行するステップが、
    前記ユーザが呼び出され、発呼側がホワイトリスト内の発呼側に属することを監視するとき、自動リスニング及び記録操作を実行するステップを含む、請求項6又は7に記載の方法。
  9. 音声確認の方法であって、
    ユーザ側からの音声確認要求に従ってユーザ音声通信番号を取得し、前記音声確認要求に対応する音声確認情報を決定するステップと、
    前記ユーザ音声通信番号に従って対応するユーザへの通話を開始し、コールスルーの場合、前記音声確認情報を前記ユーザに対して再生するステップと、
    前記音声確認情報及び前記ユーザ側から受信された記録情報に従って音声確認の結果を決定するステップであって、前記記録情報が、前記ユーザ側で、前記ユーザが呼び出されることを監視するとき、自動リスニング及び記録操作を実行することから得られた情報を指す、ステップとを含む、前記方法。
  10. 音声確認要求に対応する音声確認情報を決定するステップが、
    複数の予め設定されたオーディオファイルからオーディオファイルを無作為に選択し、無作為に選択されたオーディオファイルを前記音声確認要求に対応する音声確認情報として使用するステップ、又は
    前記音声確認要求に関するオーディオファイルを無作為に生じさせ、無作為に生じさせられたオーディオファイルを前記音声確認要求に対応する前記音声確認情報として使用するステップを含む、請求項9に記載の方法。
  11. 音声確認要求に対応する音声確認情報を決定するステップが、
    前記音声確認情報の識別子を取得し、前記識別子をユーザ側に提供するステップをさらに含み、
    記録から得られた記録情報をネットワーク側に送信するステップが、
    記録から得られた前記記録情報及び前記識別子を一緒に前記ネットワーク側に送信するステップを含む、請求項9又は10に記載の方法。
  12. 音声確認情報及び記録情報に従って音声確認の結果を決定するステップが、
    受信された識別子に従って複数の音声確認情報を選択し、前記記録情報と選択された複数の音声確認情報との間でそれぞれ音声マッチングを実行するステップと、
    前記記録情報に一致する音声確認情報が音声確認要求に対応する音声確認情報であると決定した場合、音声確認が成功したと決定し、そうでない場合、前記音声確認が失敗したと決定するステップとを含む、請求項11に記載の方法。
  13. ユーザ側に提供される音声確認のための装置であって、
    ネットワーク側に音声確認要求を送信するように適合された音声確認要求モジュールと、
    前記ネットワーク側からユーザへの通話を監視し、前記ユーザが呼び出されることを監視する場合、前記音声確認要求に応答して前記ネットワーク側によって再生された音声確認情報を取得するために、自動リスニング及び記録操作を実行し、前記通話が終了すると、前記ネットワーク側が記録情報に従って音声確認を実行するように、記録から得られた前記記録情報を前記ネットワーク側に送信するように適合された監視記録モジュールとを含む、前記装置。
  14. 音声確認要求モジュールが、
    ネットワーク側から送信された音声確認情報の識別子を受信するようにさらに適合され、
    監視記録モジュールが、
    記録から得られた記録情報及び前記識別子を共に前記ネットワーク側に送信するように特に適合され、
    前記識別子が、前記記録情報と共に音声確認を実行するためのものである、請求項13に記載の装置。
  15. 監視記録モジュールが、
    ユーザが呼び出され、発呼側がホワイトリスト内の発呼側に属することを監視するとき、自動リスニング及び記録操作を実行するように特に適合される、請求項13又は14に記載の装置。
  16. ネットワーク側に提供される音声確認のための装置であって、
    ユーザ側からの音声確認要求に従ってユーザ音声通信番号を取得し、前記音声確認要求に対応する音声確認情報を決定するように適合された制御モジュールと、
    前記ユーザ音声通信番号に従って対応するユーザへの通話を開始し、コールスルーの場合、前記音声確認情報を前記ユーザに対して再生するように適合された通話モジュールと、
    前記音声確認情報及び前記ユーザ側から受信された記録情報に従って音声確認の結果を決定するように適合された音声確認モジュールであって、前記記録情報が、前記ユーザ側で、前記ユーザが呼び出されることを監視するとき、自動リスニング及び記録操作を実行することから得られた情報を指す、音声確認モジュールとを含む、前記装置。
  17. 制御モジュールが、
    複数の予め設定されたオーディオファイルからオーディオファイルを無作為に選択し、無作為に選択されたオーディオファイルを音声確認要求に対応する音声確認情報として使用するか、又は
    前記音声確認要求に関するオーディオファイルを無作為に生じさせ、無作為に生じさせられたオーディオファイルを前記音声確認要求に対応する前記音声確認情報として使用するように特に適合される、請求項16に記載の装置。
  18. 制御モジュールが、
    音声確認情報の識別子を取得し、前記識別子をユーザ側に提供するようにさらに適合され、
    前記制御モジュールが、前記ユーザ側から記録情報及び前記識別子を受信するように特に適合される、請求項16又は17に記載の装置。
  19. 音声確認モジュールが、
    受信された識別子に従って複数の音声確認情報を選択し、記録情報と選択された複数の音声確認情報との間でそれぞれ音声マッチングを実行し、
    前記記録情報に一致する音声確認情報が音声確認要求に対応する音声確認情報であると決定した場合、音声確認が成功したと決定し、そうでない場合、前記音声確認が失敗したと決定するように特に適合される、請求項18に記載の方法。
  20. 音声確認のシステムであって、
    請求項13〜15のいずれかに記載の装置及び請求項16〜19のいずれかに記載の装置を含む、前記システム。
  21. 実行されるときに請求項1〜12のいずれかに記載の方法を実行させるコンピュータコードを記憶するコンピュータ可読媒体。
  22. コンピュータデバイスによって実行されるときに請求項1〜12のいずれかに記載の方法を実行させるコンピュータプログラム製品。
  23. メモリ及びプロセッサを含み、前記メモリがコンピュータコードを記憶し、前記プロセッサが前記コンピュータコードを実行することによって請求項1〜12のいずれかに記載の方法を実行するように構成されるコンピュータデバイス。
JP2016559912A 2015-06-30 2015-11-16 音声検証のための方法、装置、及びシステム Active JP6470306B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201510378018.X 2015-06-30
CN201510378018.XA CN105119877B (zh) 2015-06-30 2015-06-30 语音验证方法、装置以及系统
PCT/CN2015/094648 WO2017000476A1 (zh) 2015-06-30 2015-11-16 语音验证方法、装置以及系统

Publications (3)

Publication Number Publication Date
JP2017529711A true JP2017529711A (ja) 2017-10-05
JP2017529711A5 JP2017529711A5 (ja) 2018-07-19
JP6470306B2 JP6470306B2 (ja) 2019-02-13

Family

ID=54667770

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016559912A Active JP6470306B2 (ja) 2015-06-30 2015-11-16 音声検証のための方法、装置、及びシステム

Country Status (6)

Country Link
US (1) US10423958B2 (ja)
EP (1) EP3136677A4 (ja)
JP (1) JP6470306B2 (ja)
KR (1) KR101881058B1 (ja)
CN (1) CN105119877B (ja)
WO (1) WO2017000476A1 (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105469788A (zh) * 2015-12-09 2016-04-06 百度在线网络技术(北京)有限公司 语音信息验证方法及装置
CN107330696A (zh) * 2016-04-29 2017-11-07 宇龙计算机通信科技(深圳)有限公司 一种运用语音识别技术的支付方法、装置、终端及系统
CN106330882B (zh) * 2016-08-18 2019-12-27 广州凰腾通信科技有限公司 安全验证方法及安全验证装置
CN107104979B (zh) * 2017-05-25 2020-01-14 杭州东信北邮信息技术有限公司 一种语音回拨验证业务的实现方法和系统
CN107342087A (zh) * 2017-06-19 2017-11-10 广州市讯飞樽鸿信息技术有限公司 一种语音验证方法及系统
KR20190046063A (ko) * 2017-10-25 2019-05-07 현대자동차주식회사 사용자 인증 시스템, 사용자 인증 방법 및 서버
DK3477927T3 (da) * 2017-10-31 2021-06-21 Telia Co Ab Håndtering af opkaldsforbindelsesforsøg
US11216801B2 (en) * 2017-11-01 2022-01-04 Mastercard International Incorporated Voice controlled systems and methods for onboarding users and exchanging data
US11012555B2 (en) * 2017-11-20 2021-05-18 International Business Machines Corporation Non-verbal sensitive data authentication
CN109862033A (zh) * 2019-03-14 2019-06-07 浙江糖链科技有限公司 一种利用异构网络实现实时信息确认的方法
US11765260B2 (en) * 2019-06-10 2023-09-19 Nec Corporation Communication terminal, information processing device, information processing system, information processing method, and program
EP4085358A1 (en) * 2019-12-30 2022-11-09 Telecom Italia SpA Method for authenticating a user, and artificial intelligence system operating according to said method
TWI803788B (zh) * 2020-11-12 2023-06-01 中華電信股份有限公司 防止機器盜撥國際電話之方法及系統
CN112802475A (zh) * 2020-12-30 2021-05-14 厦门市美亚柏科信息股份有限公司 基于语音识别的应用自动登录方法及计算机可读存储介质
CN112888082A (zh) * 2021-01-27 2021-06-01 上海华客信息科技有限公司 基于二维码的语音通话方法、系统、设备及存储介质
CN113055536B (zh) * 2021-03-22 2022-07-19 中国工商银行股份有限公司 验证电话客服身份及电话客服的方法、装置、设备及介质
CN114822592B (zh) * 2022-06-27 2022-09-09 山东登远信息科技有限公司 一种基于语音识别的变电站信号验收方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005149232A (ja) * 2003-11-17 2005-06-09 Matsushita Electric Ind Co Ltd 認証用データ提供方法、ユーザ認証方法、認証用データ提供装置、ユーザ認証装置並びに携帯通信端末
JP2006017936A (ja) * 2004-06-30 2006-01-19 Sharp Corp 通話装置,中継処理装置,通信認証システム,通話装置の制御方法,通話装置の制御プログラム,および通話装置の制御プログラムを記録した記録媒体
JP2008234398A (ja) * 2007-03-22 2008-10-02 Oki Electric Ind Co Ltd 音声認証システム及び認証局サーバ
WO2015043338A1 (en) * 2013-09-27 2015-04-02 Tencent Technology (Shenzhen) Company Limited Identify verifying method, account acquiring method, mobile terminal, and storage medium

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7280970B2 (en) * 1999-10-04 2007-10-09 Beepcard Ltd. Sonic/ultrasonic authentication device
US7130800B1 (en) * 2001-09-20 2006-10-31 West Corporation Third party verification system
US6601762B2 (en) * 2001-06-15 2003-08-05 Koninklijke Philips Electronics N.V. Point-of-sale (POS) voice authentication transaction system
US20030037004A1 (en) * 2001-08-14 2003-02-20 Chuck Buffum Dialog-based voiceprint security for business transactions
KR20040035647A (ko) * 2004-04-06 2004-04-29 (주)예스테크놀로지 화자인증 기술을 이용한 네트워크 기반의 전자금융거래 사용자 인증서비스 제공 방법 및 이를 수행하는 장치
US8311190B2 (en) * 2008-12-23 2012-11-13 International Business Machines Corporation Performing human client verification over a voice interface
CN101997849A (zh) * 2009-08-18 2011-03-30 阿里巴巴集团控股有限公司 一种互联网用户身份验证的方法、装置及系统
CN101662365A (zh) * 2009-09-18 2010-03-03 浙江大学 一种中文语音验证码的生成方法
CN103020820A (zh) * 2011-09-20 2013-04-03 深圳市财付通科技有限公司 一种交易支付方法和系统
CN103903622A (zh) * 2012-12-28 2014-07-02 腾讯科技(深圳)有限公司 一种语音验证方法、装置及系统
CN103944861A (zh) * 2013-01-20 2014-07-23 上海博路信息技术有限公司 一种语音验证系统
US10366391B2 (en) * 2013-08-06 2019-07-30 Visa International Services Association Variable authentication process and system
US10192219B2 (en) * 2014-01-09 2019-01-29 Capital One Services, Llc Voice recognition to authenticate a mobile payment

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005149232A (ja) * 2003-11-17 2005-06-09 Matsushita Electric Ind Co Ltd 認証用データ提供方法、ユーザ認証方法、認証用データ提供装置、ユーザ認証装置並びに携帯通信端末
JP2006017936A (ja) * 2004-06-30 2006-01-19 Sharp Corp 通話装置,中継処理装置,通信認証システム,通話装置の制御方法,通話装置の制御プログラム,および通話装置の制御プログラムを記録した記録媒体
JP2008234398A (ja) * 2007-03-22 2008-10-02 Oki Electric Ind Co Ltd 音声認証システム及び認証局サーバ
WO2015043338A1 (en) * 2013-09-27 2015-04-02 Tencent Technology (Shenzhen) Company Limited Identify verifying method, account acquiring method, mobile terminal, and storage medium

Also Published As

Publication number Publication date
US20180114225A1 (en) 2018-04-26
KR20170012873A (ko) 2017-02-03
US10423958B2 (en) 2019-09-24
WO2017000476A1 (zh) 2017-01-05
CN105119877B (zh) 2018-11-13
EP3136677A4 (en) 2017-07-19
KR101881058B1 (ko) 2018-08-17
CN105119877A (zh) 2015-12-02
EP3136677A1 (en) 2017-03-01
JP6470306B2 (ja) 2019-02-13

Similar Documents

Publication Publication Date Title
JP2017529711A (ja) 音声確認のための方法、装置、及びシステム
JP2017529711A5 (ja)
Karapanos et al. {Sound-Proof}: Usable {Two-Factor} authentication based on ambient sound
US10674009B1 (en) Validating automatic number identification data
US8358759B2 (en) Biometric identification in communication
TW201719475A (zh) 身分驗證方法、系統、業務伺服器和驗證伺服器
US20140344169A1 (en) Call transfers for web-delivered calls
US20100227605A1 (en) Control Of A Remote Mobile Device
JP2017526995A (ja) デュアルチャネル識別認証
US9197646B2 (en) Verifying source of email
JP6625815B2 (ja) ユーザ認証
US9813905B2 (en) DTMF token for automated out-of-band authentication
WO2017101297A1 (zh) 一种视频留言方法、装置、终端及服务器
US9094825B2 (en) Method and apparatus for providing service based on voice session authentication
US9020121B1 (en) Method and apparatus for sharing data between devices
US20210144247A1 (en) Identity verification method and apparatus and electronic device
WO2014086222A1 (zh) 设置视频通话参数、和发送能力参数的方法及装置
US10244107B1 (en) Systems and methods for causing display of a reputation indicator associated with a called party
WO2018166367A1 (zh) 一种实时对话中的实时提醒方法、装置、存储介质及电子装置
WO2011150885A2 (zh) 语音留言的管理方法和装置
CN105323270B (zh) 网络信息推送方法和系统
KR101718368B1 (ko) 생체 인식을 통한 보안 통신 시스템 및 방법
JP6434099B1 (ja) 端末認証システム、端末認証方法、利用者端末及び利用者端末用プログラム
WO2014187217A1 (zh) 语音留言的实现方法、语音留言服务器
CN104135579B (zh) 一种基于ivr的手机语音留言功能的实现方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171204

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20180228

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20180228

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20180307

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20180307

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180404

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20180427

A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20180601

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180828

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180912

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20180912

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181127

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181219

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190117

R150 Certificate of patent or registration of utility model

Ref document number: 6470306

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250