JP2016053600A - 通話装置、声紋データの判定結果通知方法およびプログラム - Google Patents

通話装置、声紋データの判定結果通知方法およびプログラム Download PDF

Info

Publication number
JP2016053600A
JP2016053600A JP2014178438A JP2014178438A JP2016053600A JP 2016053600 A JP2016053600 A JP 2016053600A JP 2014178438 A JP2014178438 A JP 2014178438A JP 2014178438 A JP2014178438 A JP 2014178438A JP 2016053600 A JP2016053600 A JP 2016053600A
Authority
JP
Japan
Prior art keywords
voice
acquired
telephone number
determination result
voiceprint
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014178438A
Other languages
English (en)
Other versions
JP6407634B2 (ja
Inventor
グルチヤン ラミン
Ghurchian Ramin
グルチヤン ラミン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Technology Corp
Original Assignee
KDDI Technology Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Technology Corp filed Critical KDDI Technology Corp
Priority to JP2014178438A priority Critical patent/JP6407634B2/ja
Publication of JP2016053600A publication Critical patent/JP2016053600A/ja
Application granted granted Critical
Publication of JP6407634B2 publication Critical patent/JP6407634B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Telephone Function (AREA)

Abstract

【課題】声紋認証のための声紋データを通話中の受話音声からリアルタイムに、しかも通話相手の音声を意識させることなく取得し、声紋から本人であるか他人であるかを判断するために個別に設けられた判定閾値を自動的に更新しながら、判定結果をユーザに通知する。【解決手段】受話音声を取得し、発話側の電話番号を取得し、取得した受話音声から声紋データを抽出する。ここで、取得した電話番号が電話帳にある場合に取得した電話番号と抽出した声紋データとを対応付けて格納する。そして、登録された声紋データと取得した受話音声から抽出した声紋データとの類似度を示すスコアを算出し、算出したスコアと予め個別に定められた閾値とを比較して、取得した受話音声から抽出した声紋データの真偽を判定し、判定部の判定結果が偽である場合に、その判定結果を通知する。さらに、判定結果が真である度ごとに、固別の閾値を更新する。【選択図】図2

Description

本発明は、声紋認証のための声紋データを通話中の受話音声からリアルタイムに、しかも通話相手の音声を意識させることなく取得し、声紋から本人であるか他人であるかを判断するために個別に設けられた判定閾値を自動的に更新しながら、判定結果をユーザに通知する通話装置、声紋データの判定結果通知方法およびプログラムに関する。
近年、本人になりすました「オレオレ詐欺」電話、売り込み電話又はいたずら電話のような迷惑電話が社会問題となっている。このような悪意を持つ第三者による迷惑電話の対策として、声紋を用いて発信者の認証を行うシステムが開示されている。
例えば、電話機に対応させて声紋データを記憶した声紋登録データベースと、第1の電話機からの発呼により確立された、当該第1の電話機と第2の電話機との間の呼接続の電話網における経路を検出する経路検出手段と、前記第1の電話機から前記第2の電話機に送信される音声データを、前記経路検出手段により検出された経路から取得する音声取得手段と、前記声紋登録データベースに記憶された、前記第2の電話機に対応した声紋データを参照して、当該声紋データの声紋と前記音声取得手段により取得された音声データの声紋との照合を行う声紋照合手段と、を備え、電話網を介して受信者へ送られる発信者の音声から声紋データを取得し、取得した声紋データと声紋データベースに記憶された声紋データとの照合結果を受信者へ送付する技術が開示されている(例えば、特許文献1参照)。
また、照合用声紋データが格納された声紋格納手段と、通信相手の音声を取得する音声取得手段と、前記音声取得手段で取得された音声から声紋データを抽出し、前記照合用声紋データと照合する声紋照合手段と、前記声紋照合手段の照合結果を通知する結果通知手段とを備え、声紋データの登録操作が容易に行える技術も開示されている(例えば、特許文献2参照。)。
特開2006−38955号公報 特開2013−164472号公報
しかしながら、特許文献1に記載の技術では、声紋データの登録は、Webなどを通じてシステムにアクセスし、ユーザ認証をクリアした後、登録を希望する相手に電話して相手の声紋データをシステムに記憶させることによって行われるため、操作が煩わしいという問題があった。
また、特許文献2に記載の技術では、文言上、操作の煩わしさは解消できるものの、どのような条件で声紋を取得するのか、どのような形式で登録を行なうのか、判定基準をどのように定めるのか、どのようなタイミングで声紋の認証結果を通知するのか等の具体的な提示がなく、どのようにして技術を具現化するのかが不明であり、実用性に欠けるという問題があった。
さらに、従来、お客様サポートセンター(コールセンター)や金融機関などでは、電話を通じて顧客から事前に設定済みのパスワードを聞き取り、声紋を認証することが行なわれていたが、このやり方では、声紋の一致を調べるため、顧客に「電話番号」や「口座番号」などを覚えやすい固定のパスフレーズを事前に設定してもらう必要があり、サービス性が悪いという問題があった。また、顧客の声紋を登録するためには、コールセンターなどのオペレータによる操作が必要となり、コストがかかるという問題があった。
また、上記いずれの技術においても、登録済のすべての声紋データに対して、一律で、しかも固定した判定閾値が用いられていたため、本人であるか他人であるかの判定の確度が十分であるとは言えなかったという問題があった。
さらに、上記いずれの技術においても、声紋認証の結果を通話中に通知したり、通話中の通知に気づかない場合に、終話時にも通知するような機能がなく、せっかく、声紋認証を行い、通話者の語る素性に偽りがあることを検出しても、実効性に乏しいという問題があった。
そこで、本発明は、上述の課題に鑑みてなされたものであり、声紋認証のための声紋データを通話中の受話音声からリアルタイムに、しかも通話相手の音声を意識させることなく取得し、声紋から本人であるか他人であるかを判断するために個別に設けられた判定閾値を自動的に更新しながら、判定結果をユーザに通知する通話装置、声紋データの判定結果通知方法およびプログラムを提供することを目的とする。
(1)本発明は、電話帳と、受話音声を取得する音声取得手段と、発話側の電話番号を取得する電話番号取得手段と、該取得した受話音声から声紋データを抽出する抽出手段と、前記取得した電話番号が前記電話帳にある場合に前記取得した電話番号と前記抽出手段により抽出した声紋データとを対応付けて格納する格納手段と、少なくとも、登録された声紋データと前記取得した受話音声から抽出した声紋データとの類似度を示すスコアを算出するスコア算出手段と、該算出したスコアと予め個別に定められた閾値とを比較して、前記取得した受話音声から抽出した声紋データの真偽を判定する判定手段と、前記判定手段の判定結果が偽である場合に、その判定結果を通知する通知手段と、該判定結果が真である度ごとに、固別の前記閾値を更新する更新手段と、を備えたことを特徴とする通話装置を提案している。
(2)本発明は、(1)の通話装置について、バイブレータを備え、前記通知手段は、通話中に、バイブレータを駆動して通知を行なうことを特徴とする通話装置を提案している。
(3)本発明は、(1)または(2)の通話装置について、予め定められた音声を再生する音声再生手段を備え、前記通知手段は、通話中に、警告音声を再生して通知を行なうことを特徴とする通話装置を提案している。
(4)本発明は、(1)から(3)の通話装置について、情報を表示する表示手段を備え、前記通知手段は、終話時に、判定結果を前記表示手段に表示することを特徴とする通話装置を提案している。
(5)本発明は、電話帳と音声取得手段と電話番号取得手段と抽出手段と格納手段とスコア算出手段と判定手段と通知手段と更新手段とを備えた通話装置における声紋データの判定結果通知方法であって、前記音声取得手段が、受話音声を取得する第1のステップと、前記電話番号取得手段が、発話側の電話番号を取得する第2のステップと、前記抽出手段が、前記取得した受話音声から声紋データを抽出する第3のステップと、前記格納手段が、前記取得した電話番号が前記電話帳にある場合に前記取得した電話番号と前記抽出した声紋データとを対応付けて格納する第4のステップと、前記スコア算出手段が、登録された声紋データの特徴量と前記取得した受話音声から抽出した声紋データの特徴量との類似度を示すスコアを算出する第5のステップと、前記判定手段が、該算出したスコアと予め個別に定められた閾値とを比較して、前記取得した受話音声から抽出した声紋データの真偽を判定する第6のステップと、前記通知手段が、前記判定手段の判定結果が偽である場合に、その判定結果を通知する第7のステップと、前記更新手段が、該判定結果が真である度ごとに、固別の前記閾値を更新する第8のステップと、を備えたことを特徴とする声紋データの判定結果通知方法を提案している。
(6)本発明は、電話帳と音声取得手段と電話番号取得手段と抽出手段と格納手段とスコア算出手段と判定手段と通知手段と更新手段とを備えた通話装置における声紋データの判定結果通知方法をコンピュータに実行させるためのプログラムであって、前記音声取得手段が、受話音声を取得する第1のステップと、前記電話番号取得手段が、発話側の電話番号を取得する第2のステップと、前記抽出手段が、前記取得した受話音声から声紋データを抽出する第3のステップと、前記格納手段が、前記取得した電話番号が前記電話帳にある場合に前記取得した電話番号と前記抽出した声紋データとを対応付けて格納する第4のステップと、前記スコア算出手段が、登録された声紋データの特徴量と前記取得した受話音声から抽出した声紋データの特徴量との類似度を示すスコアを算出する第5のステップと、前記判定手段が、該算出したスコアと予め個別に定められた閾値とを比較して、前記取得した受話音声から抽出した声紋データの真偽を判定する第6のステップと、前記通知手段が、前記判定手段の判定結果が偽である場合に、その判定結果を通知する第7のステップと、前記更新手段が、該判定結果が真である度ごとに、固別の前記閾値を更新する第8のステップと、をコンピュータに実行させるためのプログラムを提案している。
本発明によれば、通話相手の声紋データを自動的に登録し、本人であるか他人であるかの判断閾値がユーザが意識することなく自動的に更新されることから、頻繁に電話する知人などからの声紋認証の精度が高くなり、さらに、声紋認証結果を通話中あるいは終話時に明確に通知することから、例えば、「オレオレ詐欺」による利用者の不利益を防止することが期待できるという効果がある。
本発明の実施形態に係る通話装置の構成を示す図である。 本発明の実施形態に係る通話装置の処理を示す図である。 本発明の実施形態に係るバッファ最大値と時間との関係を示す図である。 本発明の実施形態に係る発声時間と無音時間との関係を示す図である。 本発明の実施形態に係る声紋登録時のデータ構成を示す図である。 本発明の実施形態に係る電話帳に登録済の電番発着信時の声紋の登録処理を示す図である。 本発明の実施形態に係る通話相手の音声収録処理を示す図である。 本発明の実施形態に係る電話帳に未登録の電番発着信時の声紋の登録処理を示す図である。 本発明の適応的閾値方式を示す図である。 本発明の実施形態に係る閾値更新の処理を示す図である。 本発明の実施形態に係る新たな閾値の算出の具体例を示す図である。 本発明の実施形態に係る声紋認証結果の通知処理を示した図である。 本発明の実施形態に係る声紋認証結果の通知処理を示した図である。
以下、本発明の実施形態について、図面を用いて、詳細に説明する。
なお、本実施形態における構成要素は適宜、既存の構成要素等との置き換えが可能であり、また、他の既存の構成要素との組合せを含む様々なバリエーションが可能である。したがって、本実施形態の記載をもって、特許請求の範囲に記載された発明の内容を限定するものではない。
<実施形態>
以下、図1から図13を用いて、本発明の実施形態に係る通話装置について説明する。
<通話装置の構成>
本実施形態に係る通話装置100は、図1に示すように、音声取得部110と、電話番号取得部120と、抽出部130と、特徴量抽出部140と、スコア算出部150と、判定部160と、通知部161と、閾値格納部170と、閾値更新部180と、制御部190と、電話帳200と、格納部210とから構成されている。
音声取得部110は、発話者からの受話音声を取得する。電話番号取得部120は、発話側の電話番号を取得する。この取得した電話番号を電話帳200に登録されている電話番号と照合することにより、発話番号が電話帳に登録された番号か否かを判断することができる。なお、この判断は、制御部190において処理される。
抽出部130は、音声取得部110が取得した受話音声から声紋データを抽出する。音声取得部110において取得される人の声は様々な周波数の音波の集まりで構成されている。抽出部130では、音声取得部110から取得した受話音声を時間、周波数、強度というパラメータでグラフ化することにより声紋を抽出する。ここで、抽出される声紋は、指紋のように人それぞれ異なった特徴的なパターンを描くという特徴を有する。なお、本明細書において、「声紋」、「声紋データ」、「声紋照合」、「声紋登録」という場合の「声紋」は、上記にて、説明をしたものを示し、「音声」という場合には、「様々な周波数の音波の集まりで構成された人の声」をさす。
スコア算出部150は、登録された声紋データと取得した受話音声から抽出した声紋データとの類似度を示すスコアを算出する。
判定部160は、算出したスコアと予め個別に定められた閾値とを比較して、取得した受話音声から抽出した声紋データの真偽を判定する。通知部161は、判定部160の判定結果が偽である場合に、その判定結果を通知する。なお、通知部161は、図示しないバイブレータ、音声再生部、表示部等を備え、通話中に、バイブレータを駆動し、あるいは、警告音声を再生して通知を行なう。また、終話時には、判定結果を表示部に表示して通知を行なう。
閾値格納部170は、登録された声紋データごとの閾値を格納する。なお、閾値の初期値は、制御部190が、特徴量に応じて決定し、特徴量が大きい場合には、閾値の初期値を高くするように決定する。
閾値更新部180は、判定結果が真である度ごとに、固別の閾値を更新する。具体的には、スコアSと予め定められた誤差マージンΔとから数1により本人認証係数PASSを求め、求めた本人認証係数PASSと真であると判定された回数H、更新前の閾値TH1とから、数2により、更新後の閾値TH2を求めて更新する。
また、閾値の最小値THMINが本人認証係数PASSよりも大きいときに、前記本人認証係数PASSに替えて、閾値の最小値THMINを数3のように適用して、更新後の閾値TH2を求めて更新する。
制御部190は、ROM(Read Only Memory)に記録された制御プログラムにしたがって、通話装置全体の制御を行う。例えば、制御部190は、図4、図5に示すように、発声時間を検出し、その積算時間から、発声時間が声紋照合に十分な時間であるか否かを判定する。また、発声時間が声紋照合に十分な時間であり、取得した電話番号が電話帳に登録されている場合に、ユーザからの登録要求を受けて、電話番号と声紋データとを対応付けて格納する。また、発声時間が声紋照合に十分な時間ではなく、取得した電話番号が電話帳に登録されている場合に、ユーザからの要求を受けて、声紋データを蓄積して保存する。また、閾値の初期値を特徴量に応じて決定し、特徴量が大きい場合には、閾値の初期値を高くするように決定する。
格納部210は、電話番号取得部120が取得した電話番号が電話帳200に登録された電話番号である場合に、この電話番号と抽出部130により抽出した声紋データとを対応付けて格納する。
<通話装置の処理>
図2を用いて、本実施形態に係る通話装置の処理について説明する。
まず、音声取得部110が、受話音声を取得し(ステップS110)、電話番号取得部120が、発話側の電話番号を取得して(ステップS120)、抽出部130が、取得した受話音声から声紋データを抽出する(ステップS130)。
格納部210は、取得した電話番号が電話帳200にある場合に取得した電話番号と抽出した声紋データとを対応付けて格納する(ステップS140)。スコア算出部150は、登録された声紋データと前記取得した受話音声から抽出した声紋データとの類似度を示すスコアを算出する(ステップS150)。
そして、判定部160が、算出したスコアと予め個別に定められた閾値とを比較して、取得した受話音声から抽出した声紋データの真偽を判定し(ステップS160)、通知部161が、判定部160の判定結果が偽である場合に、その判定結果を通知する(ステップS170)。そして、閾値更新部180が、判定結果が真である度ごとに、固別の閾値を更新する(ステップS180)。
<声紋登録の具体例>
図3から図8を用いて、声紋データの登録について具体的に説明する。
<電話帳に登録済みの電番発着信時の声紋登録の処理>
図3から図6を用いて、本実施形態に係る電話帳に登録済みの電番発着信時の声紋登録の処理について説明する。
図6に示すように、電話帳に登録済の電話番号から音声着信及びその電話番号へ音声発信した場合、以下の手順により通話相手の声紋を登録する。
着信があると、自動的に受話音声の収録を開始する。そして、図4、図5に示すように、無音ギャップを除いた通話相手の発声時間を定期的に観測する(ステップS201)。このとき、有効な発声時間の収録ができたか否かを判断し(ステップS202)、有効な発声時間の収録ができた場合(ステップS202の「YES」)には、前回蓄積した音声を削除する(ステップS203)。
次に、声紋の登録を行うか否かのメッセージを示す選択画面を表示して(ステップS204)、ユーザが「登録する」を選択した場合には、図6に示すように、収録した受話音声から声紋ファイルを生成し、電話帳の電話番号とを紐つけて登録する(ステップS205)。一方で、ユーザが「登録しない」を選択した場合には、収録した受話音声を破棄する(ステップS206)。
また、ステップS202で、有効な発声時間の収録ができなかった場合(ステップS202の「NO」)には、終話しているかどうかを確認し(ステップS209)、終話していない場合(ステップS209の「NO」)には、ステップS201に戻る。
一方で、終話していると判断した場合(ステップS209の「YES」)には、声紋の蓄積を行うか否かのメッセージを示す選択画面を表示して(ステップS210)、ユーザが「蓄積しない」を選択した場合には、収録した受話音声を破棄する(ステップS211)。
また、ユーザが「蓄積する」を選択した場合には、収録した受話音声を蓄積保存する(ステップS212)。そして、収録した受話音声をデータベースに保存し、蓄積された受話音声の収録時間が有効な収録時間である場合(ステップS207の「YES」)には、ステップS204に進む。一方で、蓄積された受話音声の収録時間が有効な収録時間でない場合(ステップS207の「NO」)には、特別な処理を行わない(ステップS208)。
<通話音声の収録処理>
図7を用いて、本実施形態に係る通話音声の収録処理について説明する。
通話が開始されると(ステップS301)、受話音声収録を開始し、発声時間を計測する(ステップS302)。次に、有効な発声時間の計測を開始する(ステップS303)。
具体的には、チェックタイマを開始し(ステップS304)、タイマが満了したか否かを判断する(ステップS305)。タイマが満了していない場合(ステップS305の「NO」)には、元に戻り、タイマが満了した場合(ステップS305の「YES」)には、次に、発声時間を計算して(ステップS306)、発声時間が60秒よりも長いか否かを判断する(ステップS307)。
そして、発声時間が60秒よりも短い場合(ステップS307の「NO」)には、ステップS304に戻り、発声時間が60秒よりも長い場合(ステップS307の「YES」)には、受話音声の収録を終了する。
<電話帳に未登録の電番発着信時の声紋登録の処理>
図8を用いて、本実施形態に係る電話帳に未登録の電番発着信時の声紋登録の処理について説明する。
着信があると、自動的に受話音声の収録を開始する。そして、無音ギャップを除いた通話相手の発声時間を定期的に観測する(ステップS201)。このとき、有効な発声時間の収録ができたか否かを判断し(ステップS202)、有効な発声時間の収録ができた場合(ステップS202の「YES」)には、声紋の登録を行うか否かのメッセージを示す選択画面を表示して(ステップS401)、ユーザが「登録する」を選択した場合には、収録した受話音声から声紋ファイルを生成する(ステップS402)。一方で、ユーザが「登録しない」を選択した場合には、収録した受話音声を破棄する(ステップS403)。
また、ステップS202で、有効な発声時間の収録ができなかった場合(ステップS202の「NO」)には、終話しているかどうかを確認し(ステップS209)、終話していない場合(ステップS209の「NO」)には、ステップS201に戻る。
一方で、終話していると判断した場合(ステップS209の「YES」)には、声紋登録に必要な十分な音声が収集できなかった旨のメッセージを示す選択画面を表示して(ステップS404)、ユーザが「OK」を選択した場合には、収録した受話音声を破棄する(ステップS405)。
以上、説明したように、通話中に通話相手の声紋を自動的に登録することができるため、ユーザに煩雑な操作を行なわせる必要がない。
本発明は、声紋から本人であるか他人であるかを判断するために個別に設けられた判定閾値を自動的に更新する。従来は、図9の左図に示すように、登録済のすべての声紋データに対して、一律で、しかも固定した判定閾値が用いられていた。そのため、本人であるか他人であるかの判定の確度が十分であるとは言えなかった。本発明では、図9の右図に示すように、声紋ごとに個別に閾値を設けるとともに、新たに取得した声紋データが登録済の声紋データと一致した場合に、その登録済の声紋データの閾値を更新するものである。これにより、頻繁に電話する知人などからの声紋認証の精度が高くなり、例えば、「オレオレ詐欺」による利用者の不利益を防止することが期待できるという効果がある。
<閾値更新の処理>
図10、11を用いて、本実施形態に係る閾値の更新処理について説明する。
着信があると、自動的に受話音声の収録を開始する。そして、図3、図4に示すように、無音ギャップを除いた通話相手の発声時間を定期的に観測する(ステップS201)。このとき、有効な発声時間の収録ができたか否かを判断し(ステップS202)、有効な発声時間の収録ができた場合(ステップS202の「YES」)には、取得した声紋データが登録済みの声紋データのどれかにヒットしたかを検出する(ステップS501)。
ステップS501で、取得した声紋データが登録済みの声紋データのいずれにもヒットしなかった場合(ステップS501の「No」)には、バイブレータを2秒間動作させ、音声でユーザに警告を報知する(ステップS503)。そして、取得した声紋データの登録を行なうか否かを表示して(ステップS507)、ユーザが「登録する」を選択した場合には、新規の声紋データとして登録を行い(ステップS508)、「登録しない」を選択した場合には、取得した声紋データおよび受話音声を破棄する(ステップS509)。
一方で、ステップS501において、取得した声紋データが登録済みの声紋データのいずれかにヒットした場合(ステップS501の「Yes」)には、通話中には、特に、処理を行なわず(ステップS502)、画面に「先程の声は、登録済みの声紋と一致しました。電話帳の声紋を更新しますか」とのメッセージを表示し(ステップS504)、ユーザが「更新する」を選択した場合には、声紋ファイルと判定基準(閾値)とを更新し(ステップS505)、ユーザが「更新しない」を選択した場合には、取得した声紋データおよび受話音声を破棄する(ステップS506)。
また、ステップS202に戻って、有効な発声時間の収録ができなかった場合(ステップS202の「NO」)には、終話状態か否かを判断し(ステップS209)、終話状態でない場合(ステップS209の「NO」)には、ステップS201に戻る。
一方で、終話状態である場合(ステップS209の「YES」)には、画面に「声紋認証に十分な音声が収録できませんでした」とのメッセージを表示し(ステップS510)、取得した声紋データおよび受話音声を破棄する(ステップS511)。
以下、図11を用いて、図10のステップS505における判定基準(閾値)の更新処理について説明する。
今、Bさんの登録済み声紋データファイルを「File2」、誤差マージン(Δ)を5、更新前閾値(TH1)を55、閾値の最小値(THMIN)を50、更新前のヒット数(H)を4、スコアを85、本人認証係数(PASS)を80とする。このとき、更新後閾値(TH2)は、数4のようになる。
したがって、数4に、上記のパラメータ値を代入すると、更新後閾値(TH2)は、60となる。また、更新後ヒット数は、(更新前ヒット数+1)=5となる。よって、「File2」の声紋データファイルの中味が更新されるとともに、判定基準閾値が55→60に、ヒット数が4→5に更新される。なお、閾値の最小値(THMIN)が本人認証係数(PASS)よりも大きい場合には、下記の数5によって、更新後閾値が算出される。
以上、説明したように、本人であるか他人であるかの判断閾値がユーザが意識することなく自動的に更新されることから、頻繁に電話する知人などからの声紋認証の精度が高くなり、例えば、「オレオレ詐欺」による利用者の不利益を防止することが期待できる。
<通知処理>
図12、図13を用いて、本実施形態に係る通知処理について説明する。
着信があると、自動的に受話音声の収録を開始する。そして、図3、図4に示すように、無音ギャップを除いた通話相手の発声時間を定期的に観測する(ステップS201)。このとき、有効な発声時間の収録ができたか否かを判断し(ステップS202)、有効な発声時間の収録ができた場合(ステップS202の「YES」)には、電話帳に登録された既知の電話番号に対応付けられた声紋データにヒットしたかを検出する(ステップS601)。
ステップS601で、電話帳に登録された既知の電話番号に対応付けられた声紋データにヒットしなかった場合(ステップS601の「No」)には、バイブレータを2秒間動作させ、音声でユーザに警告を報知する(ステップS503)。そして、「先程の声は登録済みの声紋と一致しませんでした。新規登録をしますか」とのメッセージを表示し(ステップS602)、ユーザが「OK」を選択した場合には、取得した声紋データおよび受話音声を破棄する(ステップS603)。
一方で、ステップS601において、取得した声紋データが電話帳に登録された既知の電話番号に対応付けられた声紋データにヒットした場合(ステップS601の「Yes」)には、通話中には、特に、処理を行なわず(ステップS502)、画面に「先程の声は、登録済みの声紋と一致しました。電話帳の声紋を更新しますか」とのメッセージを表示し(ステップS604)、ユーザが「更新する」を選択した場合には、声紋ファイルと判定基準(閾値)とを更新し(ステップS605)、ユーザが「更新しない」を選択した場合には、取得した声紋データおよび受話音声を破棄する(ステップS606)。
また、ステップS202に戻って、有効な発声時間の収録ができなかった場合(ステップS202の「NO」)には、終話状態か否かを判断し(ステップS209)、終話状態でない場合(ステップS209の「NO」)には、ステップS201に戻る。
一方で、終話状態である場合(ステップS209の「YES」)には、画面に「声紋認証に十分な音声が収録できませんでした」とのメッセージを表示し(ステップS607)、取得した声紋データおよび受話音声を破棄する(ステップS608)。
また、図13に示すように、着信があると、自動的に受話音声の収録を開始する。そして、図3、図4に示すように、無音ギャップを除いた通話相手の発声時間を定期的に観測する(ステップS201)。このとき、有効な発声時間の収録ができたか否かを判断し(ステップS202)、有効な発声時間の収録ができた場合(ステップS202の「YES」)には、登録済みの声紋データのいずれかにヒットしたかを検出する(ステップS501)。
ステップS501で、登録済みの声紋データのいずれかにヒットしなかった場合(ステップS501の「No」)には、バイブレータを2秒間動作させ、音声でユーザに警告を報知する(ステップS503)。そして、「先程の声は登録済みの声紋と一致しませんでした。新規登録をしますか」とのメッセージを表示し(ステップS602)、ユーザが「登録しない」を選択した場合には、取得した声紋データおよび受話音声を破棄し(ステップS603)、ユーザが「登録する」を選択した場合には、新規の声紋データとして登録する(ステップS609)。
一方で、ステップS501において、取得した声紋データが登録済みの声紋データのいずれかにヒットした場合(ステップS501の「Yes」)には、通話中には、特に、処理を行なわず(ステップS502)、画面に「先程の声は、登録済みの声紋と一致しました。電話帳の声紋を更新しますか」とのメッセージを表示し(ステップS604)、ユーザが「更新する」を選択した場合には、声紋ファイルと判定基準(閾値)とを更新し(ステップS605)、ユーザが「更新しない」を選択した場合には、取得した声紋データおよび受話音声を破棄する(ステップS606)。
また、ステップS202に戻って、有効な発声時間の収録ができなかった場合(ステップS202の「NO」)には、終話状態か否かを判断し(ステップS209)、終話状態でない場合(ステップS209の「NO」)には、ステップS201に戻る。
一方で、終話状態である場合(ステップS209の「YES」)には、画面に「声紋認証に十分な音声が収録できませんでした」とのメッセージを表示し(ステップS607)、取得した声紋データおよび受話音声を破棄する(ステップS608)。
なお、通話装置の処理をコンピュータシステムが読み取り可能な記録媒体に記録し、この記録媒体に記録されたプログラムを通話装置に読み込ませ、実行することによって本発明の通話装置を実現することができる。ここでいうコンピュータシステムとは、OSや周辺装置等のハードウェアを含む。
また、「コンピュータシステム」は、WWW(World Wide Web)システムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
また、上記プログラムは、前述した機能の一部を実現するためのものであってもよい。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組合せで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
以上、この発明の実施形態につき、図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。例えば、サーバを設け、通話装置の機能のうち、電話番号取得部120、抽出部130、特徴量抽出部140、スコア算出部150、判定部160等の機能をサーバで実現するシステムとしてもよい。
また、本発明のプログラムを読み込ませることにより、携帯電話やスマートフォンは、もちろんのこと、電話線で接続された固定電話においても、本発明を実現することができる。
また、本実施形態においては、登録された声紋データと取得した声紋データとの類似度からスコアを算出する例について説明したが、声紋データの中から、所定のワードに対応する特徴部分を抽出し、抽出した登録された声紋データの特徴部分と取得した受話音声から抽出した声紋データの特徴部分との類似度を示すスコアを算出するようにしてもよい。つまり、例えば、「オレ」という所定のワードに対応する声紋データを抽出し、スコアを算出することによって、より確度の高い判定を行なうことができる。なお、特徴部分は、短時間ごとに切り出された音声信号から抽出される特徴ベクトルの時系列であり、特徴部分抽出後、得られた特徴部分列に対して認識処理(解探索)が行われる。
100;通話装置
110;音声取得部
120;電話番号取得部
130;抽出部
140;特徴量抽出部
150;スコア算出部
160;判定部
161;通知部
170;閾値格納部
180;閾値更新部
190;制御部
200;電話帳
210;格納部

Claims (6)

  1. 電話帳と、
    受話音声を取得する音声取得手段と、
    発話側の電話番号を取得する電話番号取得手段と、
    該取得した受話音声から声紋データを抽出する抽出手段と、
    前記取得した電話番号が前記電話帳にある場合に前記取得した電話番号と前記抽出手段により抽出した声紋データとを対応付けて格納する格納手段と、
    少なくとも、登録された声紋データと前記取得した受話音声から抽出した声紋データとの類似度を示すスコアを算出するスコア算出手段と、
    該算出したスコアと予め個別に定められた閾値とを比較して、前記取得した受話音声から抽出した声紋データの真偽を判定する判定手段と、
    前記判定手段の判定結果が偽である場合に、その判定結果を通知する通知手段と、
    該判定結果が真である度ごとに、固別の前記閾値を更新する更新手段と、
    を備えたことを特徴とする通話装置。
  2. バイブレータを備え、
    前記通知手段は、通話中に、バイブレータを駆動して通知を行なうことを特徴とする請求項1に記載の通話装置。
  3. 予め定められた音声を再生する音声再生手段を備え、
    前記通知手段は、通話中に、警告音声を再生して通知を行なうことを特徴とする請求項1または請求項2に記載の通話装置。
  4. 情報を表示する表示手段を備え、
    前記通知手段は、終話時に、判定結果を前記表示手段に表示することを特徴とする請求項1から請求項3のいずれかに記載の通話装置。
  5. 電話帳と音声取得手段と電話番号取得手段と抽出手段と格納手段とスコア算出手段と判定手段と通知手段と更新手段とを備えた通話装置における声紋データの判定結果通知方法であって、
    前記音声取得手段が、受話音声を取得する第1のステップと、
    前記電話番号取得手段が、発話側の電話番号を取得する第2のステップと、
    前記抽出手段が、前記取得した受話音声から声紋データを抽出する第3のステップと、
    前記格納手段が、前記取得した電話番号が前記電話帳にある場合に前記取得した電話番号と前記抽出した声紋データとを対応付けて格納する第4のステップと、
    前記スコア算出手段が、登録された声紋データと前記取得した受話音声から抽出した声紋データとの類似度を示すスコアを算出する第5のステップと、
    前記判定手段が、該算出したスコアと予め個別に定められた閾値とを比較して、前記取得した受話音声から抽出した声紋データの真偽を判定する第6のステップと、
    前記通知手段が、前記判定手段の判定結果が偽である場合に、その判定結果を通知する第7のステップと、
    前記更新手段が、該判定結果が真である度ごとに、固別の前記閾値を更新する第8のステップと、
    を備えたことを特徴とする声紋データの判定結果通知方法。
  6. 電話帳と音声取得手段と電話番号取得手段と抽出手段と格納手段とスコア算出手段と判定手段と通知手段と更新手段とを備えた通話装置における声紋データの判定結果通知方法をコンピュータに実行させるためのプログラムであって、
    前記音声取得手段が、受話音声を取得する第1のステップと、
    前記電話番号取得手段が、発話側の電話番号を取得する第2のステップと、
    前記抽出手段が、前記取得した受話音声から声紋データを抽出する第3のステップと、
    前記格納手段が、前記取得した電話番号が前記電話帳にある場合に前記取得した電話番号と前記抽出した声紋データとを対応付けて格納する第4のステップと、
    前記スコア算出手段が、登録された声紋データの特徴量と前記取得した受話音声から抽出した声紋データの特徴量との類似度を示すスコアを算出する第5のステップと、
    前記判定手段が、該算出したスコアと予め個別に定められた閾値とを比較して、前記取得した受話音声から抽出した声紋データの真偽を判定する第6のステップと、
    前記通知手段が、前記判定手段の判定結果が偽である場合に、その判定結果を通知する第7のステップと、
    前記更新手段が、該判定結果が真である度ごとに、固別の前記閾値を更新する第8のステップと、
    をコンピュータに実行させるためのプログラム。
JP2014178438A 2014-09-02 2014-09-02 通話装置、声紋データの判定結果通知方法およびプログラム Expired - Fee Related JP6407634B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014178438A JP6407634B2 (ja) 2014-09-02 2014-09-02 通話装置、声紋データの判定結果通知方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014178438A JP6407634B2 (ja) 2014-09-02 2014-09-02 通話装置、声紋データの判定結果通知方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2016053600A true JP2016053600A (ja) 2016-04-14
JP6407634B2 JP6407634B2 (ja) 2018-10-17

Family

ID=55745227

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014178438A Expired - Fee Related JP6407634B2 (ja) 2014-09-02 2014-09-02 通話装置、声紋データの判定結果通知方法およびプログラム

Country Status (1)

Country Link
JP (1) JP6407634B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019091419A (ja) * 2017-11-16 2019-06-13 バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド 情報出力方法および装置
JP2020048056A (ja) * 2018-09-19 2020-03-26 Necプラットフォームズ株式会社 通話制御装置、通話制御プログラム、及び通話制御方法
KR20200109995A (ko) * 2019-03-15 2020-09-23 현대자동차주식회사 피싱 분석 장치 및 그 방법
JP2021128210A (ja) * 2020-02-12 2021-09-02 株式会社北陸テクノソリューションズ 発信者検索システム
WO2021176559A1 (ja) * 2020-03-03 2021-09-10 日本電信電話株式会社 特殊詐欺対策装置、特殊詐欺対策方法および特殊詐欺対策プログラム
WO2023100905A1 (ja) * 2021-12-03 2023-06-08 パナソニックIpマネジメント株式会社 認証装置および認証方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0876790A (ja) * 1994-06-28 1996-03-22 Omron Corp 話者識別装置
JPH09198086A (ja) * 1996-01-16 1997-07-31 Nippon Telegr & Teleph Corp <Ntt> 話者認識用しきい値設定方法及びこの方法を用いた話者認識装置
JPH11184491A (ja) * 1997-12-18 1999-07-09 Ricoh Co Ltd 音声認識装置
JP2000298497A (ja) * 1999-04-14 2000-10-24 Oki Electric Ind Co Ltd 本人認証装置
JP2006038955A (ja) * 2004-07-22 2006-02-09 Docomo Engineering Tohoku Inc 声紋認識システム
JP2007033898A (ja) * 2005-07-27 2007-02-08 Toshiba Corp 話者照合装置
JP2007052496A (ja) * 2005-08-15 2007-03-01 Advanced Media Inc ユーザ認証システム及びユーザ認証方法
JP2007258954A (ja) * 2006-03-22 2007-10-04 Fujitsu Ltd 成りすまし電話防止システム、認証装置および認証装置用プログラム
JP2008064928A (ja) * 2006-09-06 2008-03-21 Yamaha Corp 生体認証装置、生体認証方法およびプログラム
JP2013117876A (ja) * 2011-12-02 2013-06-13 Sogo Keibi Hosho Co Ltd 顔認証データベース管理方法、顔認証データベース管理装置及び顔認証データベース管理プログラム

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0876790A (ja) * 1994-06-28 1996-03-22 Omron Corp 話者識別装置
JPH09198086A (ja) * 1996-01-16 1997-07-31 Nippon Telegr & Teleph Corp <Ntt> 話者認識用しきい値設定方法及びこの方法を用いた話者認識装置
JPH11184491A (ja) * 1997-12-18 1999-07-09 Ricoh Co Ltd 音声認識装置
JP2000298497A (ja) * 1999-04-14 2000-10-24 Oki Electric Ind Co Ltd 本人認証装置
JP2006038955A (ja) * 2004-07-22 2006-02-09 Docomo Engineering Tohoku Inc 声紋認識システム
JP2007033898A (ja) * 2005-07-27 2007-02-08 Toshiba Corp 話者照合装置
JP2007052496A (ja) * 2005-08-15 2007-03-01 Advanced Media Inc ユーザ認証システム及びユーザ認証方法
JP2007258954A (ja) * 2006-03-22 2007-10-04 Fujitsu Ltd 成りすまし電話防止システム、認証装置および認証装置用プログラム
JP2008064928A (ja) * 2006-09-06 2008-03-21 Yamaha Corp 生体認証装置、生体認証方法およびプログラム
JP2013117876A (ja) * 2011-12-02 2013-06-13 Sogo Keibi Hosho Co Ltd 顔認証データベース管理方法、顔認証データベース管理装置及び顔認証データベース管理プログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
松井知子: "音声による個人認証−話者認識技術の研究動向−", 日本音響学会誌, vol. 63巻,12号, JPN6018022987, 1 December 2007 (2007-12-01), pages 738 - 743, ISSN: 0003822477 *
松井知子他: "話者照合におけるモデルとしきい値の更新法", 電子情報通信学会論文誌, vol. 81, no. 2, JPN6018022986, 25 February 1998 (1998-02-25), pages 268 - 276, ISSN: 0003822476 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019091419A (ja) * 2017-11-16 2019-06-13 バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド 情報出力方法および装置
JP2020048056A (ja) * 2018-09-19 2020-03-26 Necプラットフォームズ株式会社 通話制御装置、通話制御プログラム、及び通話制御方法
KR20200109995A (ko) * 2019-03-15 2020-09-23 현대자동차주식회사 피싱 분석 장치 및 그 방법
KR102606456B1 (ko) * 2019-03-15 2023-11-29 현대자동차주식회사 피싱 분석 장치 및 그 방법
JP2021128210A (ja) * 2020-02-12 2021-09-02 株式会社北陸テクノソリューションズ 発信者検索システム
WO2021176559A1 (ja) * 2020-03-03 2021-09-10 日本電信電話株式会社 特殊詐欺対策装置、特殊詐欺対策方法および特殊詐欺対策プログラム
JPWO2021176559A1 (ja) * 2020-03-03 2021-09-10
JP7406163B2 (ja) 2020-03-03 2023-12-27 日本電信電話株式会社 特殊詐欺対策装置、特殊詐欺対策方法および特殊詐欺対策プログラム
WO2023100905A1 (ja) * 2021-12-03 2023-06-08 パナソニックIpマネジメント株式会社 認証装置および認証方法

Also Published As

Publication number Publication date
JP6407634B2 (ja) 2018-10-17

Similar Documents

Publication Publication Date Title
JP6407634B2 (ja) 通話装置、声紋データの判定結果通知方法およびプログラム
US11210461B2 (en) Real-time privacy filter
KR102366307B1 (ko) 협력형 전화 평판 시스템
US20170134574A1 (en) Method and system for filtering undesirable incoming telephone calls
JP6370172B2 (ja) 通話装置、声紋登録方法およびプログラム
US20100119046A1 (en) Caller identification using voice recognition
KR20160011120A (ko) 스마트폰 통화 중 실시간 보이스피싱 주의안내 어플리케이션 서비스 제공 시스템 및 그 방법
JP2010273130A (ja) 詐欺進行度判定装置、辞書生成装置、詐欺進行度判定方法及び辞書生成方法
JP6407633B2 (ja) 通話装置、声紋データの判定基準更新方法およびプログラム
JP6296159B2 (ja) 発信者特定装置、発信者特定方法、および発信者特定プログラムを格納する記録媒体
CN108924330A (zh) 信息处理方法、装置及电子设备
JP6757095B1 (ja) 情報処理システム、情報処理方法、情報処理プログラムを記憶した記憶媒体
KR101033870B1 (ko) 스팸 전화 처리 방법 및 장치
US11962719B2 (en) Real time verification of caller identification (ID)
JP2014072701A (ja) 通信端末
JP6023434B2 (ja) 通信装置及び認証方法
JP5262967B2 (ja) 携帯端末、認証方法およびプログラム
JP7406163B2 (ja) 特殊詐欺対策装置、特殊詐欺対策方法および特殊詐欺対策プログラム
JP2012050034A (ja) 情報サーバ装置および情報サービス方法
JP2014158177A (ja) 発信者情報提供システム、着信者端末、発信者情報提供方法及び通知方法
JP6772832B2 (ja) 犯罪判定装置、中継システム、電話システム、犯罪判定方法及びプログラム
JP4230982B2 (ja) 通話補助装置、通話補助方法、通話補助プログラムおよび通話補助システム
WO2023112300A1 (ja) 情報処理装置、情報処理システム、情報処理方法及び非一時的なコンピュータ可読媒体
US12010260B2 (en) Detecting synthetic sounds in call audio
JP6625808B2 (ja) 通信処理システム、通信処理方法、通信処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170817

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180611

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180626

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180823

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180911

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180919

R150 Certificate of patent or registration of utility model

Ref document number: 6407634

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees