JP5728456B2 - 通信端末 - Google Patents

通信端末 Download PDF

Info

Publication number
JP5728456B2
JP5728456B2 JP2012232714A JP2012232714A JP5728456B2 JP 5728456 B2 JP5728456 B2 JP 5728456B2 JP 2012232714 A JP2012232714 A JP 2012232714A JP 2012232714 A JP2012232714 A JP 2012232714A JP 5728456 B2 JP5728456 B2 JP 5728456B2
Authority
JP
Japan
Prior art keywords
voiceprint
communication terminal
voice
speaker
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012232714A
Other languages
English (en)
Other versions
JP2014086796A (ja
Inventor
土屋 仁
仁 土屋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SoftBank Corp
Original Assignee
SoftBank Mobile Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SoftBank Mobile Corp filed Critical SoftBank Mobile Corp
Priority to JP2012232714A priority Critical patent/JP5728456B2/ja
Publication of JP2014086796A publication Critical patent/JP2014086796A/ja
Application granted granted Critical
Publication of JP5728456B2 publication Critical patent/JP5728456B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)

Description

本発明は、2以上の通信端末により同時に通話可能な電話会議システムに接続可能な通信端末に関するものである。
従来、電話回線を介して1度に3台以上の電話での同時通話を可能にし、あたかも会議室に集まって会議しているかのように、多くの人と同時に会話できる電話会議システムが知られている。この電話会議システムを用いることにより、社員の出張に伴う交通費などの移動コストや移動時間を削減することができる。
また、特許文献1には、IP網上に配置された通信サーバに対して複数の通信端末から接続し、当該複数の通信端末同士での通信を通じて仮想的な会議室を形成する電話会議システムが開示されている。この特許文献1の電話会議システムでは、通信端末は、音声による通話を行う音声通話部と、通信サーバ上の会議室において参照される資料データに関するユーザ操作を行うデータ操作部とを備えている。また、通信サーバは、複数の通信端末との間で通信を確立させ、会議室を形成する接続制御部と、接続制御部により通信が確立された通信端末との間で、データ操作部におけるユーザ操作に応じて、資料データに関するデータ通信を行うデータ制御部とを備えている。特許文献1の電話会議システムによれば、IP網に接続された通信端末によって電話会議を行う際に、会議に用いる資料データを共有し、会議の進行に合わせて資料を即時に参照することができるようになっている。
しかしながら、上記従来の電話会議システムでは、受信した音声から発言者が誰であるかを識別することは難しいため、聞き手側で発言者の識別に手間取って、電話会議の進行が妨げられるおそれがある。また、特許文献1の電話会議システムでは、通信端末の電話番号でユーザ認証を行っているため、会議参加予定の通信端末として電話番号が登録された通信端末を不正に入手した第三者は、当該電話会議に参加できてしまう。電話会議は、テレビ会議と異なり、参加者の実際の顔画像が表示されない場合が多いので、第三者が通信端末のユーザになりすまして電話会議に参加しても、他の参加者に気付かれず、企業情報が漏洩するおそれもある。実際の参加者の顔画像を他の通信端末で表示することも考えられるが、顔画像のデータを送受信するために通信容量が増えて、通信コストがアップしてしまう。なお、このような課題は、ハンズフリーの通信端末を含む2台以上の通信端末を用いて3人以上のユーザが参加している電話会議システムでも同様に発生し得るものである。
本発明は以上の問題点に鑑みなされたものであり、その目的は、低コスト化を図りつつ、電話会議システムで発言している発言者の識別や認証が可能になる通信端末を提供することである。
上記目的を達成するために、請求項1の発明は、2以上の通信端末により同時に通話可能な電話会議システムに接続可能な通信端末であって、通信網を介して電話会議システムに接続して他の通信端末の利用者と通話するための通話手段と、既知の人物の声紋を記憶する記憶手段と、前記電話会議システムで発言している発言者の音声の声紋を取得する声紋取得手段と、前記声紋取得手段で取得された声紋と前記記憶手段に記憶されている声紋とを照合する声紋照合手段と、前記声紋照合手段による声紋照合の結果を出力する出力手段と、を備えたことを特徴とするものである。
この通信端末によれば、2以上の通信端末が同時に通話する電話会議システムに参加したとき、その電話会議システムで発言している発言者の音声の声紋を取得し、その取得した声紋と、記憶手段にあらかじめ記憶されている声紋とを照合し、その照合結果が出力される。これにより、発言者の顔画像データなどを受信することなく発言者を識別したり認証したりすることができる。また、声紋の取得及び照合を通信端末で行うことにより、通信網側に専用の声紋照合サーバ等の声紋処理装置を設ける場合に比べ、声紋処理装置の導入や維持管理のためのコスト上昇を抑制することができる。よって、低コスト化を図りつつ、電話会議システムで発言している発言者の識別や認証が可能になる。
前記通信端末において、前記声紋照合手段による声紋照合の結果に基づいて電話会議システムへの参加者か否かを判断する判断手段を更に備えてもよい。この通信端末によれば、声紋照合の結果に基づいて電話会議システムへの参加者による発言か否かを認識できるので、所定の参加者以外の第三者のなりすましによる電話会議システムへの不正な参加を防ぐことができる。
また、前記通信端末において、前記声紋照合手段による声紋照合の結果に基づいて前記発言者を識別する発言者識別手段を、更に備え、前記出力手段は、前記発言者識別手段で識別された発言者の識別情報を出力してもよい。この通信端末によれば、声紋照合の結果に基づいて発言者を特定するので、発言者が使用している通信端末の電話番号が電話帳に登録されていない場合であっても、発言者の特定が可能となる。また、特定された人物の名前又は名称などの識別情報が出力されるので、通信端末の利用者は発言者が誰であるかを認識することができる。
また、前記通信端末において、前記声紋取得手段は、前記電話会議システムで当該通信端末の利用者が発言しているときに該利用者の音声の声紋を取得し、
前記声紋照合手段による声紋照合の結果に基づいて前記利用者を識別する利用者識別手段と、
前記利用者識別手段で識別された前記利用者の識別情報を、前記電話会議システムの他の参加者の通信端末に送信する送信手段とを、更に備えてもよい。この通信端末によれば、通信端末の利用者の識別情報が、電話会議システムの他の参加者の通信端末に送信されるので、他の参加者の通信端末において発信者が誰であるかを認識させることができる。特に、通信端末を用いて電話会議システムに参加する可能性がある利用者が複数の場合に、その複数の利用者のうち誰が当該通信端末を使って電話会議に参加して通話しているかを、他の参加者に知らせることができる。
また、前記通信端末において、既知の人物の声紋を取得して前記記憶手段に記憶させる声紋登録手段を、更に備えてもよい。この通信端末によれば、発言者の声紋と照合される既知の人物の声紋を記憶手段に追加して蓄積することができるので、声紋照合で一致する確率や声紋照合の精度を向上させることができる。
また、前記通信端末において、前記発言者の音声を認識する音声認識手段を、更に備え、前記発言者識別手段は、前記声紋照合手段による声紋照合の結果と前記音声認識手段による音声認識の結果とに基づいて前記発言者を識別してもよい。この通信端末によれば、声紋照合の結果に加えて音声認識の結果に基づいて発言者を識別するので、発言者の識別の精度が向上する。また、声紋照合に失敗した場合であっても、音声認識の結果を用いて発言者を識別することができるので、発言者を識別できる確率が向上する。
また、前記通信端末において、前記音声認識手段は、前記音声認識の結果に基づいて得られた文字列から前記発言者の識別情報を抽出し、前記発言者識別手段は、前記音声認識手段で抽出された前記識別情報に基づいて、前記発言者を識別してもよい。発言者の音声の音声認識の結果に基づいて得られた文字に含まれる人物の名前など識別情報は、その発言者の名前などの識別情報である確率が高い。この通信端末によれば、前記音声認識の結果に基づいて得られた文字列から抽出した発言者の識別情報に基づいて、その発言者を識別することにより、発言者の識別が容易になる。
また、前記通信端末において、前記記憶手段は、既知の人物の発言で特徴的に使用される所定のキーワードを記憶し、前記発言者識別手段は、前記音声認識の結果に基づいて得られた文字列と前記キーワードとを照合して前記発言者を識別してもよい。この通信端末によれば、既知の人物の発言で特徴的に使用される名前、会社の名称、パスワードなどの所定のキーワードと、音声認識の結果に基づいて得られた文字列とを照合する。この照合結果に基づいて、発言者を識別することにより、発言者の識別をより容易且つ確実に行うことができる。
本発明によれば、低コスト化を図りつつ、電話会議システムで発言している発言者の識別や認証が可能になる通信端末を提供することができる。
本発明の実施形態に係る携帯電話機が接続可能な電話会議システムの一例を示す概略構成図。 招集元端末のハードウェア構成の一例を示すブロック図。 招集元端末に声紋情報を登録する手順を示すフローチャート。 電話会議システムの動作例の一例を説明するためのフローチャート。 招集元端末の表示部の表示内容の一例を示す正面図。 招集先端末が途中から電話会議に参加する場合の手順の一例を説明するためのフローチャート。
以下、図面を参照して本発明の実施形態について説明する。
図1は、本発明の実施形態に係る通信端末が接続可能な電話会議システムの一例を示す概略構成図である。図1に示す電話会議システムは、移動体通信網30を介して複数の通信端末が接続され、当該複数の通信端末同士で通信を行って、仮想的な会議室を形成するシステムである。この電話会議システムは、電話会議の招集者である招集元ユーザaの通信端末(以下、「招集元端末」という。)10aや電話会議に参加する招集先ユーザb〜dの通信端末(以下、「招集先端末」という。)20b〜dを用いて通信するための基地局301等を含む移動体通信網30と、固定電話機50e,fを用いて通信するための公衆電話通信網40とを備えている。また、本実施形態の電話会議システムは、図示しない交換機、専用線、ルータ、ファイヤーウォール等を備えている。
本実施形態の電話会議システムにおいて、電話会議システムに接続して通話可能な通信端末には、招集元端末10aや招集先端末20b〜dとして用いることができる携帯電話機やスマートフォンなどの移動通信端末、固定電話機50e、電話会議専用の音声入出力装置としての電話会議専用デバイス50f、移動通信モジュールを有するノートパソコン等のコンピュータ装置などが含まれる。固定電話機50e及び電話会議専用デバイス50fにはそれぞれ、図1中の一点鎖線で示すように、画像を表示するための液晶、CRTなどからなるディスプレイ装置やテレビ放送受信装置などの表示装置51e,51fを接続してもよい。
電話会議専用デバイス50fは、音声入力手段としてのマイク及び音声出力手段としてのスピーカを備え、アナログやデジタルの公衆電話通信網31に接続することができる。電話会議専用デバイス50fとしては、例えば、市販の装置(ポリコムジャパン株式会社製の「Sound Station2」、パナソニック株式会社製のIP音声会議ホン「KX−NT700N」、エヌ・ティ・ティ・アドバンステクノロジ株式会社製の音声会議用マイク・スピーカー「RealTalk R7」、「R−Talk 800EX」、「R−Talk 800PC」等)を用いることができる。また、電話会議専用デバイス50fとしては、電話会議の音声入出力機能及び通信機能のほか、声紋照合や声紋データの記憶の機能を有するように設計製造された装置を用いてもよい。
また、招集元端末10a及び招集先端末20b〜dはそれぞれ、移動体通信網30の基地局301を介して通信を行うことができる。また、固定電話機50e及び電話会議専用デバイス50fは公衆電話通信網31を介して通信を行うことができる。招集元端末10a、招集先端末20b〜dと固定電話機50eと電話会議専用デバイス50fとは、移動体通信網30及び公衆電話通信網31を介して、互いに通信することができる。
また、本実施形態において、招集元端末10a、招集先端末20d、固定電話機50e及び電話会議専用デバイス50fはそれぞれ、非接触状態で通話可能なハンズフリー機能を有し、複数人が同時に利用できるようになっている。図1の例では、招集元端末10aを用いて2人のユーザ(ユーザa及びユーザa’)が電話会議システムに参加し、招集先端末20dを用いて3人のユーザ(ユーザd、ユーザd’及びユーザd’’)が電話会議システムに参加している。また、固定電話機50eを用いて2人のユーザ(ユーザe及びユーザe’)が電話会議システムに参加し、電話会議専用デバイス50fを用いて2人のユーザ(ユーザf及びユーザf’)が電話会議システムに参加している。なお、招集元端末や招集先端末は固定電話機であってもよい。
また、本実施形態において、招集元端末10aは、招集先端末20b〜d、固定電話機50e及び電話会議専用デバイス50fの利用者が電話会議システムで発言しているときに、その招集先端末20b〜d等から受信した音声の波形データの周波数成分を分析して発言者の声紋を取得し、その発言者の声紋とあらかじめ記憶された既知の人物の声紋と照合し、その声紋照合の結果に基づいて、発言者の名前等の識別情報を確認することができる。また、招集元端末10aは、招集先端末20b〜d等を電話会議システムで参加させるための発呼に対する応答時及び通話時に、招集先端末20b〜d等から受信した音声の波形データの周波数成分を分析して通話相手の声紋を取得し、その通話相手の声紋とあらかじめ記憶された既知の人物の声紋と照合し、その声紋照合の結果に基づいて、通話相手の名前等の識別情報を確認することができる。
ここで、「声紋」とは、音声の各周波数成分の時間的変化を視覚的に表示したものである。例えば、声紋としては、音声を周波数分析して得られたソナグラフの濃淡を地図の等高線のように紋様化したものや、音声を周波数分析によって縞模様の図表に表したものが挙げられる。この声紋は、音声を発した人物の特徴があらわれ、指紋と同様に各人固有のパターンを示すので、人物の特定、本人確認、各種認証などに用いることができる。
図2は、招集元端末10aのハードウェア構成の一例を示すブロック図である。なお、招集先端末20b〜dについても招集元端末10aと同様に構成することができる。
図2において、招集元端末10aは、制御部111と記憶部112と無線通信部113と音声処理部115と画像処理部118と操作部120と時計部121と声紋照合部122を備えている。制御部111には、記憶部112と無線通信部113と音声処理部115と画像処理部118と操作部120と時計部121と声紋照合部122とが接続されている。また、制御部111には、音声処理部115を介して音入力手段としてのマイク116及び出力手段としてのスピーカ117が接続され、画像処理部118を介して表示部119が接続されている。
制御部111は、例えばCPU、メモリ、システムバス等で構成され、所定の制御プログラムやアプリケーションプログラムを実行することにより、記憶部112や無線通信部113等の各部との間でデータの送受信を行ったり、各部を制御したりする。時計部221は、制御部11などで用いるクロック信号を出力したり、正確な日時・時刻情報を生成したりすることができる。
記憶部112は、例えばRAMやROMなどの半導体メモリや磁気記憶媒体などで構成され、制御部111で実行する制御プログラムや各種データを記憶することができる。また、記憶部112は、音声処理部115で取得された発言者や通話相手の音声の波形データやその波形データを分析して得られた声紋のデータを記憶する記憶手段としても機能する。また、記憶部112は、発言者や通話相手の音声の声紋と照合される既知の人物の声紋のデータを記憶する記憶手段としても機能する。
無線通信部113は、制御部111で制御され、アンテナ114を介して、所定の通信方式により移動体通信網30の基地局301との間で無線通信を行うものである。この無線通信により、他の携帯電話機等の通信端末との間で音声電話通信(通話)を行ったり、電話会議システムに参加したり、電子メールの送受信を行ったりすることができる。
音声処理部115は、マイク116から入力された送話音声信号を所定方式で符号化して制御部111に送る。更に、音声処理部115は、各種のデジタル音データを復号化するオーディオデコーダの機能も有している。例えば、音声処理部115は、無線通信部113で受信した受話音声信号を復号化してスピーカ117から出力する。音声処理部115は、無線通信部113で受信した発言者や通話相手の音声の声紋を取得する声紋取得手段としても機能する。音声処理部115は、例えば、CPU、メモリ、A−D変換器、D−A変換器等で構成し、所定のプログラムを実行することにより、発言者や通話相手の音声信号の波形データに対して各種処理や周波数分析等を行って当該発言者等の音声の声紋を取得する声紋取得処理を行うことができる。また、音声処理部115は、上記音声信号(波形データ)の各種処理や声紋取得処理などを行う特定用途に用いるように設計された半導体集積回路(ASIC)などで構成してもよい。なお、無線通信部113で受信した発言者や通話相手の音声の声紋を取得する声紋取得手段としての機能は、後述の声紋照合部122に持たせてもよい。
画像処理部118は、制御部111の制御の下、各種画像や、上記声紋のデータ、後述の声紋照合の結果などの各種情報を液晶ディスプレイ(LCD)等からなる表示部119に表示させる処理を行う。
表示部119やスピーカ117は、声紋照合の結果、通話相手(発信者)の識別や認証の結果などを出力する出力手段として用いることもできる。
操作部120は、表示部119に表示されるデータ入力キー(テンキー、*キー、#キー)、通話開始キー、終話キー、スクロールキー、多機能キー等をタッチして、電話の発信や着信の操作のほか、表示部119に表示される情報のスクロールや選択等に用いる。操作部120は、筐体の所定領域に配置されるキーを用いずに、表示部119に組み込まれたタッチパネルなどを用いて構成してもよい。
既知の人物の声紋を取得して記憶部112に記憶させる声紋登録手段は、例えば、音声処理部115、表示部119、操作部120等を用いて構成される。また、通信網を介して電話会議システムに接続して他の通信端末の利用者と通話するための通話手段は、前述の制御部111、無線通信部113、音声処理部115、マイク116、スピーカ117等を用いて構成される。
声紋照合部122は、招集先端末20b〜dから受信した発言者や通話相手の音声の声紋と記憶部112に予め記憶されている既知の人物の声紋とを照合する声紋照合手段として機能する。この声紋の照合により、発言者や通話相手である発信側の人物の識別や特定や各種認証を行うことができる。声紋照合部122は、例えば、CPUやメモリ等で構成し、所定のプログラムを実行することにより、上記声紋の照合処理などを行うことができる。また、声紋照合部122は、上記声紋の照合などを行う特定用途に用いるように設計された半導体集積回路(ASIC)などで構成してもよい。また、声紋照合部122は、図中一点鎖線で示すように、記憶部112との間で音声のデータや声紋のデータを送受信するように構成してもよい。
なお、声紋照合部122は、前述の無線通信部113で受信した通話信号から音声の声紋を取得する声紋取得手段としての機能も有するように構成してもよい。また、声紋照合部122は、声紋照合の結果に基づいて通話信号に含まれる音声に対応する人物すなわち発言者や通話の発信者を特定する人物特定手段や、通話信号に含まれる音声を認識する音声認識手段としての機能も有するように構成してもよい。
ここで、「音声の認識」とは、その音声の信号を分析することにより、その音声で話している内容を所定の言語からなる文字データ(テキストデータ)として取り出す処理である。
招集元端末10a及び招集先端末20b〜d等の通信端末の利用者が電話会議システムに参加しているとき、招集元端末10aは、他の招集先端末20b〜dから受信した発言者の音声データの声紋を分析して取得し、あらかじめ記憶された招集先ユーザb,c,d,d’,d’’,e,e’,f,f’の声紋と照合を行い、その声紋照合の結果に基づいて、発言者が誰であるかを認識することができる。
また、招集元端末10aは、招集先端末20b〜dが電話会議システムに参加する際に、それぞれの招集先端末20b〜dから受信した音声データの声紋を分析して取得し、あらかじめ記憶された招集先ユーザb,c,d,d’,d’’,e,e’,f,f’の声紋と照合を行い、その声紋照合の結果に基づいて、招集先端末20b〜dの電話会議への参加の可否を判断する。この電話会議への参加の可否の判断する判断手段としての機能を、制御部111に有するように構成してもよい。
上述したように、声紋照合に基づいてユーザの本人確認を行い、招集先端末20b〜dとその端末のユーザb,c,d,d’,d’’,e,e’,f,f’とが一致しなければ電話会議へ参加できないため、第三者のなりすましによる電話会議への不正な参加を防ぐことができる。このため、招集元端末10aにはあらかじめ既知の人物、例えば招集先ユーザb,c,d,d’,d’’,e,e’,f,f’の声紋を登録しておく必要があり、その登録手順は次のように行う。
図3は、招集元端末10aに音声を直接入力して声紋を登録する手順を示すフローチャートである。ここで、招集元端末10aを操作する操作者と声紋が登録される声紋登録対象者とは、同一人物でもよいし、別人であってもよい。なお、図3の例では、操作者及び声紋登録対象者が同一人物(以下「登録者」という。)である場合について説明する。
図3に示すように、招集元端末10aに声紋を登録するには、まず、登録者が招集元端末10aを操作し、表示部119に表示される音声登録モードを選択する(ステップ101)。そして、登録者は自分の氏名を入力し、自分が通常使用する携帯電話機等の通信端末を持っていれば併せてその電話番号を入力する(ステップ102)。これにより、録音のスタンバイ状態となり、表示部119に表示された録音開始を選択することにより、録音が開始する(ステップ103)。
次に、登録者は、予め決められた所定の単語や文章(例えば、自分の氏名、所定のパスワード、仮想の会話文章、有名な物語の一節など)を、例えば所定時間(例えば20秒)以内にマイク116に向かってはっきりと発音する(ステップ104)。このとき、周囲の雑音を拾わないように、静かな室内で録音することが望ましい。また、物語の有名な一節を朗読して音声を入力する場合は、登録者が対面する招集元端末10aの画面に、その物語の本の朗読する一節に対応した画像(例えば、桃太郎の絵本の画像)を表示してもよい。
録音された音声は、音声処理部115により、必要に応じて雑音等を除去する前処理が行われた後、その音声の波形データが周波数分析される。そして、その分析によって得られた声紋のデータが、声紋の照合に用いることができるデータか否かがチェックされる(ステップ105)。
ここで、上記得られた声紋のデータが声紋照合に用いることができるデータであると判断された場合(ステップ106でYes)には、上記別途入力された氏名や電話番号に紐付けて記憶部112に記憶され、正常に音声登録が完了したことが表示され、音声登録処理は終了する(ステップ107)。
一方、上記得られた声紋のデータが声紋照合に用いることができないデータであると判断された場合(ステップ106でNo)には、登録処理に失敗した旨が表示され、録音された音声のデータが消去され、再び録音処理を繰り返す(ステップ108)。
なお、上記ステップ102における氏名等の入力は、ステップ107で声紋のデータを記憶部112に記憶するときに入力してもよい。
また、上記ステップ103,104における音声の録音は、登録者が招集元端末10aに直接発音して録音する方法に限らず、招集元端末10aの通話相手と通話中に受信した通話相手の音声を、声紋登録対象者の音声として録音してもよい。例えば、電話帳に登録された通話相手との通話中にユーザ操作で録音を開始し、分析された声紋のデータを電話帳と紐付けて自動的に保存するようにしてもよい。この場合には、氏名等の入力操作をしなくてもよく、操作性を向上させることができる。また、電話帳の登録データに基づいて、あらかじめ声紋登録対象者を設定しておき、その声紋登録対象者との通話中に自動で録音を開始し、分析された声紋のデータを電話帳と紐付けて自動的に保存するようにしてもよい。また、通話相手が登録した留守番電話を再生しているときの音声を、声紋登録対象者の音声として分析し、その分析された声紋のデータを電話帳と紐付けて自動的に保存するようにしてもよい。
また、招集元端末10aを操作する操作者と声紋登録対象者とが別人物であり、操作者のそばに声紋登録対象者がいる場合は、操作者が招集元端末10aを操作して声紋登録対象者の音声を録音するようにしてもよい。
また、上記図3の手順で招集元端末10aに音声の声紋が登録される声紋登録対象者は、例えば、招集元端末10aの通常の使用者(所有者)が通話する可能性がある同じ会社の社員や取引先の会社の社員等の既知の人物である。
図4は、本実施形態に係る招集元端末10aの一動作例を示すフローチャートである。なお、図4の例では、招集元ユーザaからの操作に応じて電話会議が開始される場合の例について説明するが、他のユーザb,c,d,d’,d’’のいずれもが招集元ユーザとなることができ、これら他のユーザb,c,d,d’,d’’からの操作に応じて電話会議を開始することもできる。また、公衆電話通信網40に接続された固定電話機50e及び電話会議専用デバイス50fのユーザe,e’,f,f’のいずれもが招集元ユーザあるいは招集先ユーザとなることができ、これらユーザe,e’,f,f’が電話会議に参加することができるとともに、自らの操作に応じて電話会議を開始することもできる。
図4において、招集元ユーザaが招集元端末10aにおいて、招集先端末20bの電話番号を用いて発呼操作を行うことにより、招集元端末10aから招集先端末20bに対して発呼がなされ、呼制御により招集元端末10aと招集先端末20bとの間の呼接続がなされる(ステップ201)。
上記呼接続で招集先端末20bからの応答が無ければ、招集先ユーザbが不在もしくは電話会議に参加する意思が無いものとして招集先端末20bとの間の呼接続を切断し、他の招集先ユーザがあるか否かを判断する(ステップ202でNo,ステップ209)。一方、招集先端末20bから応答があれば、招集元端末10aと招集先端末20bとの間の通話が開始される(ステップ203)。
そして、通話開始時に、自動音声案内又は招集元ユーザaの音声案内により、招集先ユーザbに例えば自分の氏名を発声してもらう。招集先端末20bから受信した招集先ユーザbの音声は、招集元端末10aの無線通信部113、制御部111を介して音声処理部115に送られ、スピーカ117から出力されるとともに、音声処理部115で周波数分析され、声紋が得られる(ステップ204)。
次に、音声処理部115で得た声紋のデータは、制御部111を介して声紋照合部122に送信され、声紋情報記憶部123に記憶されている招集先ユーザbの声紋のデータと照合される(ステップ205)。例えば、声紋照合部122は、電話番号を用いて声紋情報記憶部123を検索することにより、電話番号と紐付けられて記憶されている声紋データを抽出し、抽出された声紋データが上記音声信号の分析で得られた招集先ユーザbの声紋データと一致するか否かをチェック(照合)する。照合の対象となる記憶部112に記憶されている声紋データは、前記図3を用いて説明したように、招集元端末10aで直接音声登録した者や通話中に音声登録した者など、主に招集先ユーザaの同じ会社の社員や取引先の会社の社員等の既知の人物の声紋である。
上記声紋照合で声紋情報が互いに一致すれば(ステップ206でYes)、電話会議への参加が許可され、その旨が招集先端末20bに通知される(ステップ207)。これに対して、声紋が一致しない場合には、招集先端末20bの通話者が招集先ユーザbではなく、他の第三者であるので、電話会議への参加が拒否され、その旨が招集先端末20bに通知される(ステップ206でNo,S208)。
次に、他の招集先ユーザの有無を判断し、他の招集先ユーザが居る場合(ステップ209でYes)には、発呼番号を他の招集先端末、例えば招集先端末20cの電話番号に切り替える(ステップ210)。そして、ステップ201からステップ210までの手順を、他に参加する招集先端末が無くなるまで繰り返す。なお、全ての招集先端末への発呼を同時に行い、声紋照合による参加の可否を同時に判断するように構成してもよく、この場合には、電話会議の開始までの時間を短縮することができる。
以下、一例として、招集先端末b,cが電話会議に参加し、招集先端末dは発呼に応じず電話会議に参加しなかったものとして説明する。
招集先端末b〜dの全てに参加を促すための発呼及び声紋照合などを行ったら、電話会議への参加が許可された招集先端末b,cに、現在電話会議に参加している全ての端末の情報を送信する(ステップ211)。これにより、招集先端末b,cでは、電話会議に参加する招集先端末を互いに把握することができる。このとき同時に、招集元端末10aは、招集先端末b,cに、他のユーザの声紋情報も併せて送信する。具体的には、招集先端末bに招集元ユーザa及び招集先ユーザcの声紋情報を送信し、招集先端末cに招集元ユーザa及び招集先ユーザbの声紋情報を送信する。ここで、個人情報保護のため、声紋情報は送信せずに、電話会議に参加している通信端末のユーザの氏名データのみを送信するように構成してもよい。
そして、全ての参加端末間で同時通話を行うことにより電話会議を開始する(ステップ212)。電話会議中は、参加者全ての通信端末において、互いに他のユーザの声紋照合を行うことができ、電話会議で発言している発言者をリアルタイムで確認することができる(ステップ213)。発言者の確認は、例えば、図5の招集元端末10aの正面図に示すように、表示部119に表示した他の各ユーザの似顔絵の背景色(図中のハッチング部分)を切り替えて、目視で確認できるようにする。なお、ユーザは端末を耳にあてていると通話中に表示部119を見ることができないので、通話の無音部分にスピーカ117から「ハツゲンシャ コウノタロウ」といった副音声を出力してもよい。なお、招集先端末b,cが、他のユーザの声紋情報を取得していない場合には、音声が発信された端末を特定することにより発言者の氏名を認識することができる。
そして、電話会議を終了するときは、招集元端末10aが招集先端末20b,cとの接続を切断する(ステップ214でYes)。あるいは、招集先端末20b,cがそれぞれ招集元端末10aとの接続を切断して電話会議を終了してもよい。
次に、招集先端末が途中から電話会議に参加する動作の一例について説明する。
図6は、招集先端末が途中から電話会議に参加する場合の手順の一例を説明するためのフローチャートである。前述した図4のステップ202で、招集先端末10aからの発呼に何らかの理由、例えば招集先ユーザd〜d’’が接客中であったり、急に別の会議に参加中であったりしたことなどの理由で、招集先端末20dの招集先ユーザdが応答できなかった場合には、招集先端末20d側から、途中で電話会議に参加することが可能である。
図6において、まず、招集先端末20dの招集先ユーザd〜d’’のいずれかは、招集元端末10aの電話番号を用いて招集端末10aへ発呼する操作を行う(ステップ301)。すると、招集元端末10aには招集先端末20dから発呼中である旨の画面表示又は発呼音が出力され、招集元ユーザaが発呼に応答すると、電話会議が一時中断され、その旨が他の招集先端末20b,cに送信される(ステップ302でYes,ステップ303)。そして、招集元端末10aと招集先端末20dとの間で通話が開始される(ステップ304)。一方、電話会議が既に終了している等の理由で、招集元端末10aからの応答がない場合には、電話会議への参加はできず、そのまま終了となる(ステップ302でNo)。
招集元端末10aと招集先端末20dとの間で通話が開始されると、招集元端末10aは、自動音声案内又は招集元ユーザaの音声案内により、招集先ユーザdに例えば自分の氏名を発声してもらう。招集先端末20dから受信した招集先ユーザdの音声は、招集元端末10aの無線通信部113、制御部111を介して音声処理部115に送られ、スピーカ117から出力されるとともに、音声処理部115で周波数分析され、声紋が得られる(ステップ305)。次に、音声処理部115で得た声紋情報は、制御部111を介して声紋照合部122に送信され、ここで声紋情報記憶部123に記憶されている招集先ユーザdの声紋情報と照合する(ステップ306)。例えば、声紋照合部122は、電話番号を用いて声紋情報記憶部123を検索することにより、電話番号と紐付けられて記憶されている声紋データを抽出し、抽出された声紋データが上記音声信号の分析で得られた招集先ユーザdの声紋データと一致するか否かをチェック(照合)する。照合の対象となる記憶部112に記憶されている声紋データは、前記図3を用いて説明したように、招集元端末10aで直接音声登録した者や通話中に音声登録した者など、主に招集先ユーザaの同じ会社の社員や取引先の会社の社員等の既知の人物の声紋である。以上の声紋データの照合は、招集先端末20dの他のユーザd’,d’’についても実行される。
上記声紋照合で声紋情報が互いに一致すれば、電話会議への参加が許可され、その旨が招集先端末20dに通知される(ステップ307でYes,ステップ308)。そして、招集先端末20dが途中から電話会議に加わる旨と、招集先ユーザd〜d’’の声紋情報等とが他の招集先端末20b,cに通知され、電話会議が再開される(ステップ309,ステップ310)。
これに対して、上記ステップ307で声紋が一致しない場合には、招集先端末20dの通話者が招集先ユーザd〜d’’ではなく、他の第三者であるので、電話会議への参加が拒否され、その旨が招集先端末20dに通知される(ステップ311)。その後、招集先端末20dは参加することなく電話会議が再開される(ステップ310)。
なお、上述した声紋照合に加えて、音声認証を行ってもよい。この場合には、前記図3を用いて説明した声紋情報を登録する際に、例えば登録者が発声した所定のキーワードとしての「パスワード」を音声処理部115でテキストデータに変換し、記憶部112に格納しておく。そして、招集先端末10aからの発呼に対する着信時の最初に「あなたのパスワードを発音してください」という音声を招集元端末10aから送信し、招集先ユーザb,c,d、d’、d’に発声してもらう。そのパスワードの音声を受信した招集元端末10aで、音声処理部115で受信したパスワードの音声信号をテキストデータに変換し、記憶部112に格納されたパスワードと比較する。パスワードが一致すれば招集先ユーザb,c,d、d’、d’を認識することができる。また、声紋照合はパスワードの音声信号に基づいて行ってもよい。このように、声紋照合に加えて音声認証を行うことにより、招集先ユーザの本人確認をより確実に行うことができ、なりすましによる第三者が不正に電話会議に参加することをより確実に防ぐことができる。
以上説明したように本実施形態によれば、2以上の通信端末が同時に通話する電話会議システムに参加したとき、その電話会議システムで発言している発言者の音声の声紋を取得し、その取得した声紋と、記憶手段にあらかじめ記憶されている声紋とを照合し、その照合結果が出力される。これにより、発言者の顔画像データなどを受信することなく発言者を識別したり認証したりすることができる。また、声紋の取得及び照合を招集元端末10a等の通信端末で行うことにより、移動体通信網30側に専用の声紋照合サーバ等の声紋処理装置を設ける場合に比べ、声紋処理装置の導入や維持管理のためのコスト上昇を抑制することができる。よって、低コスト化を図りつつ、電話会議システムで発言している発言者の識別や認証が可能になる。また、第三者のなりすましによる電話会議への不正な参加を防ぐことができる。
なお、上記実施形態では、電話会議に参加する可能性があるユーザなどの複数の声紋登録対象者の声紋照合用の声紋データを、電話帳を有する招集元端末10aに登録して蓄積する場合について説明したが、招集元端末10aに蓄積した声紋データを対応するユーザ情報とともに他の通信端末である招集先端末20b〜20d、固定電話機50e及び電話会議専用デバイス50fに提供してもよい。この声紋データ及びユーザ情報の提供は、次のように行うことができる。例えば、提供元の通信端末である招集元端末10aと、提供先の通信端末である招集先端末20b〜20d、固定電話機50e及び電話会議専用デバイス50fとに、ADK(Android Open Accessory Development Kit)等のプラットフォームを組み込んでおく。そして、提供元の通信端末と提供先の通信端末とを、有線ケーブル(例えば、USBケーブル)や近距離無線通信方式(例えば、Wi−FiやBluetooth(登録商標))で接続する。この状態で、提供元の通信端末から提供先の通信端末に声紋データ及びユーザ情報を送信して提供することができる。この場合、電話会議の参加者の声紋照合や声紋認証は、声紋照合用の声紋データを蓄積した提供元の通信端末である招集元端末10aで行うことができるとともに、提供先の通信端末である招集先端末20b〜20d、固定電話機50e及び電話会議専用デバイス50fでも行うことができるようになる。そして、各通信端末で実行した声紋照合(声紋認証)は、その通信端末の表示手段に表示することができる。例えば、招集先端末20b〜20dでは、他の通信端末からの音声の受信信号を分析して得られた声紋データと、招集元端末10aから提供された声紋データとを照合する。そして、その声紋照合(発言者のユーザ情報)や声紋認証(参加許否の情報)の結果を、その招集先端末の表示部119に表示することができる。また、固定電話機50e及び電話会議専用デバイス50fでは、他の通信端末からの音声の受信信号を分析して得られた声紋データと、招集元端末10aから提供された声紋データとを照合する。そして、その声紋照合(発言者のユーザ情報)や声紋認証(参加許否の情報)の結果を、固定電話機50eや電話会議専用デバイス50fに接続された表示装置51e及び51fに表示することができる。
10a 招集元端末
20b〜d 招集先端末
30 移動体通信網
40 公衆電話通信網
50e 固定電話機
51e 表示装置
50f 電話会議専用デバイス
51f 表示装置
111 制御部
112 記憶部
113 無線通信部
114 アンテナ
115 音声処理部
116 マイク
117 スピーカ
118 画像処理部
119 表示部
120 操作部
121 時計部
122 声紋照合部
123 声紋情報記憶部
301 基地局
a,a’ 招集元ユーザ
b,c,d、d’、d’’ 招集先ユーザ
e,e’,f,f’ ユーザ
特開2011−199522号公報

Claims (8)

  1. 以上の通信端末により同時に通話可能な電話会議システムに接続可能な通信端末であって、
    通信網を介して電話会議システムに接続して他の通信端末の利用者と通話するための通話手段と、
    既知の人物の声紋を記憶する記憶手段と、
    前記電話会議システムで発言している発言者の音声の声紋を取得する声紋取得手段と、
    前記声紋取得手段で取得された声紋と前記記憶手段に記憶されている声紋とを照合する声紋照合手段と、
    前記声紋照合手段による声紋照合の結果を出力する出力手段と、
    前記電話会議システムに参加する利用者の招集先の通信端末に発呼し、該招集先の通信端末に、声紋照合に用いる所定の音声を促す音声案内を送信する手段と、
    前記招集先の通信端末から受信した招集先の利用者の声紋と前記既知の人物の声紋とを比較し、両者の声紋が一致した場合、該電話会議システムの参加者の声紋情報及び端末情報を該招集先の通信端末に送信する手段と、
    を備えたことを特徴とする通信端末。
  2. 請求項の通信端末において、
    前記声紋照合手段による声紋照合の結果に基づいて電話会議システムへの参加者か否かを判断する判断手段を、更に備えたことを特徴とする通信端末。
  3. 請求項の通信端末において、
    前記声紋照合手段による声紋照合の結果に基づいて前記発言者を識別する発言者識別手段を、更に備え、
    前記出力手段は、前記発言者識別手段で識別された発言者の識別情報を出力することを特徴とする通信端末
  4. 求項1乃至のいずれかの通信端末において、
    前記声紋取得手段は、前記電話会議システムで当該通信端末の利用者が発言しているときに該利用者の音声の声紋を取得し、
    前記声紋照合手段による声紋照合の結果に基づいて前記利用者を識別する利用者識別手段と、
    前記利用者識別手段で識別された前記利用者の識別情報を、前記電話会議システムの他の参加者の通信端末に送信する送信手段とを、更に備えたことを特徴とする通信端末。
  5. 請求項1乃至のいずれかの通信端末において、
    既知の人物の声紋を取得して前記記憶手段に記憶させる声紋登録手段を、更に備えたことを特徴とする通信端末。
  6. 請求項3の通信端末において、
    前記発言者の音声を認識する音声認識手段を、更に備え、
    前記発言者識別手段は、前記声紋照合手段による声紋照合の結果と前記音声認識手段による音声認識の結果とに基づいて前記発言者を識別することを特徴とする通信端末。
  7. 請求項の通信端末において、
    前記音声認識手段は、前記音声認識の結果に基づいて得られた文字列から前記発言者の識別情報を抽出し、
    前記発言者識別手段は、前記音声認識手段で抽出された前記識別情報に基づいて、前記発言者を識別することを特徴とする通信端末。
  8. 請求項の通信端末において、
    前記記憶手段は、既知の人物の発言で特徴的に使用される所定のキーワードを記憶し、
    前記発言者識別手段は、前記音声認識の結果に基づいて得られた文字列と前記キーワードとを照合して前記発言者を識別することを特徴とする通信端末。
JP2012232714A 2012-10-22 2012-10-22 通信端末 Active JP5728456B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012232714A JP5728456B2 (ja) 2012-10-22 2012-10-22 通信端末

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012232714A JP5728456B2 (ja) 2012-10-22 2012-10-22 通信端末

Publications (2)

Publication Number Publication Date
JP2014086796A JP2014086796A (ja) 2014-05-12
JP5728456B2 true JP5728456B2 (ja) 2015-06-03

Family

ID=50789508

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012232714A Active JP5728456B2 (ja) 2012-10-22 2012-10-22 通信端末

Country Status (1)

Country Link
JP (1) JP5728456B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6859807B2 (ja) * 2017-03-31 2021-04-14 日本電気株式会社 情報処理装置、情報処理方法および情報処理プログラム
WO2019156209A1 (ja) * 2018-02-08 2019-08-15 日本電気株式会社 電話制御システム、電話制御方法、およびプログラム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63212252A (ja) * 1987-02-27 1988-09-05 Matsushita Electric Ind Co Ltd 発呼者識別装置
JPH06189033A (ja) * 1992-12-18 1994-07-08 Ricoh Co Ltd テレライティング装置
JP3070497B2 (ja) * 1996-11-15 2000-07-31 日本電気株式会社 テレビ会議システム
JPH10215331A (ja) * 1997-01-30 1998-08-11 Toshiba Corp 音声会議システムとその情報端末装置
JP2002271498A (ja) * 2001-03-13 2002-09-20 Nippon Telegr & Teleph Corp <Ntt> 遠隔会議システム
JP2007129411A (ja) * 2005-11-02 2007-05-24 Yamaha Corp 通信端末
JP2010198536A (ja) * 2009-02-27 2010-09-09 Brother Ind Ltd ユーザ認証装置、会議システム、ユーザ認証方法およびユーザ認証プログラム

Also Published As

Publication number Publication date
JP2014086796A (ja) 2014-05-12

Similar Documents

Publication Publication Date Title
US10182148B2 (en) Method and system for filtering undesirable incoming telephone calls
CN100488215C (zh) 具电话防扰功能的通讯装置、服务器及其方法
US8515025B1 (en) Conference call voice-to-name matching
US7305078B2 (en) Speaker identification during telephone conferencing
CN103856624B (zh) 识别身份的方法和移动终端
KR20230136707A (ko) 공유된 음성 작동 디바이스상의 호출 핸들링
US8391445B2 (en) Caller identification using voice recognition
JP2010109619A (ja) 認証装置、認証方法、及びプログラム
JP2010109618A (ja) 認証装置、認証方法、及びプログラム
US20020107049A1 (en) Audible caller identification for mobile communication device
JP2007241130A (ja) 声紋認識を利用するシステムと装置
EP1511277A1 (en) Method for answering an incoming event with a phone device, and adapted phone device
JP5728456B2 (ja) 通信端末
JP2014072701A (ja) 通信端末
JP6480229B2 (ja) 中継装置
JP5010131B2 (ja) 認証方法、認証システム、認証サーバ、通話端末、及び認証プログラム
JP2007124102A (ja) Webサービス提供システム
US7899498B2 (en) Method and system for recognition of incoming calls to a voicemail system
JP2012078384A (ja) 声紋による話者特定機能を有する電話装置
WO2021117472A1 (ja) 電話交換装置、電話端末、電話交換システム、電話交換装置の制御方法及び制御プログラム
WO2020171040A1 (ja) 声認証装置、声認証方法、及び、記録媒体
JP2008124597A (ja) 音声会議システム
KR101384943B1 (ko) 전화번호 등록 방법 및 이동통신 단말기
JP5143062B2 (ja) 悪意の第三者からの不当呼を判定する方法及び電話自動応対装置
JP5443572B1 (ja) 通信端末

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140214

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140410

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140905

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141007

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150313

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150406

R150 Certificate of patent or registration of utility model

Ref document number: 5728456

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350