WO2015194148A1

WO2015194148A1 - 発信者特定装置、発信者特定方法、および発信者特定プログラムを格納する記録媒体

Info

Publication number: WO2015194148A1
Application number: PCT/JP2015/002957
Authority: WO
Inventors: 智基村上
Original assignee: 日本電気株式会社
Priority date: 2014-06-17
Filing date: 2015-06-12
Publication date: 2015-12-23
Also published as: US9860373B2; JP6296159B2; US20170126885A1; JPWO2015194148A1

Abstract

　詐欺師からの発信とそうでない人からの発信とをより高精度に峻別するために、発信者特定装置は、着信者の近親者の音声特徴情報である第１音声特徴情報が登録されるホワイトリストと、詐欺師の音声特徴情報である第２音声特徴情報が登録されるブラックリストとを記憶する記憶手段と、発信の音声データを取得し、音声データの音声特徴情報である第３音声特徴情報を求め、第３音声特徴情報が第１音声特徴情報および第２音声特徴情報と一致するか否かを判定し、第３音声特徴情報が第１音声特徴情報および第２音声特徴情報のいずれとも一致しない場合、第３音声特徴情報の中に複数の人物の音声特徴情報が含まれるか否かを判定し、第３音声特徴情報の中に複数の人物の音声特徴情報が含まれる場合、発信は前記詐欺師からの発信の可能性が高いとの第１判定結果を得る音声特徴分析手段と、を備える。

Description

発信者特定装置、発信者特定方法、および発信者特定プログラムを格納する記録媒体

　本発明は、発信者を特定する発信者特定装置、発信者特定方法、および発信者特定プログラムを格納する記録媒体に関する。

　近年、親族になすりまして金品を騙し取ろうとする詐欺（所謂、振り込め詐欺、オレオレ詐欺、母さん助けて詐欺等）が増加している。そこで、このような詐欺を未然に防ぐための様々な対策が提案されている。

　特許文献１には、詐欺師の音声特徴（声紋等）を詐欺師音声データベースに予め登録しておき、受信した通話音声データの音声特徴が上記データベースに登録された音声特徴と一致する場合に上記通話は詐欺師からの通話であると判定する技術が記載されている。また、特許文献２には、近親者の個人性特徴量を記憶部に予め登録しておき、発信者の個人性特徴量が記憶部に登録された個人性特徴量と一致するか否かを判定し、一致しないと判定した場合に、その旨を着信者（たとえば、一人暮らしのお年寄り）へ報知する技術が記載されている。

特開２００８－２１００８５号公報（ページＮｏ．１１、１２）特開２００５－３４１３８３号公報（ページＮｏ．７、８）

　特許文献１の判定方法の場合、詐欺師音声データベースに該当しない通話は全て正常な通話と判定される。しかしながら、たとえば新規の詐欺師のように、詐欺師音声データベースと一致しない通話の中にも実は詐欺師からの通話が含まれている可能性がある。

　一方、特許文献２のように、近親者の個人性特徴量と一致しない個人性特徴量を有する発信を全て詐欺師からの発信と判断する方法の場合、詐欺師から通話は完全にブロックされる。しかしながら、特許文献２の場合、近親者登録はしていないが詐欺師ではない人（たとえば、本人に初めて電話をかける会社の同僚）までも詐欺師と判断されてしまう虞がある。

　すなわち、上述したような単純な二者択一的な判定方法の場合、検出すべき詐欺師からの発信を見過ごしてしまったり、あるいは、詐欺師でない人まで詐欺師と判断してしまったりするなどの問題が発生する。

　本発明は、上記課題を解決するためになされたものであり、詐欺師からの発信とそうでない人からの発信とをより高精度に峻別することが可能な発信者特定装置、発信者特定方法、および発信者特定プログラムを格納する記録媒体を提供することを目的とする。

　本発明の発信者特定装置は、着信者の近親者の音声特徴情報である第１音声特徴情報が登録されるホワイトリストと、詐欺師の音声特徴情報である第２音声特徴情報が登録されるブラックリストとを記憶する記憶手段と、発信の音声データを取得し、前記音声データの音声特徴情報である第３音声特徴情報を求め、前記第３音声特徴情報が前記第１音声特徴情報および前記第２音声特徴情報と一致するか否かを判定し、前記第３音声特徴情報が前記第１音声特徴情報および前記第２音声特徴情報のいずれとも一致しない場合、前記第３音声特徴情報の中に複数の人物の音声特徴情報が含まれるか否かを判定し、前記第３音声特徴情報の中に複数の人物の音声特徴情報が含まれる場合、前記発信は前記詐欺師からの発信の可能性が高いとの第１判定結果を得る音声特徴分析手段と、を備える。

　本発明の発信者特定方法は、着信者の近親者の音声特徴情報である第１音声特徴情報が登録されるホワイトリストと、詐欺師の音声特徴情報である第２音声特徴情報が登録されるブラックリストとを記憶手段に記憶し、発信の音声データを取得し、前記音声データの音声特徴情報である第３音声特徴情報を求め、前記第３音声特徴情報が前記第１音声特徴情報および前記第２音声特徴情報と一致するか否かを判定し、前記第３音声特徴情報が前記第１音声特徴情報および前記第２音声特徴情報のいずれとも一致しない場合、前記第３音声特徴情報の中に複数の人物の音声特徴情報が含まれるか否かを判定し、前記第３音声特徴情報の中に複数の人物の音声特徴情報が含まれる場合、前記発信は前記詐欺師からの発信の可能性が高いとの第１判定結果を得ることを特徴とする。

　本発明の発信者特定プログラムを格納する記録媒体は、着信者の近親者の音声特徴情報である第１音声特徴情報が登録されるホワイトリストと、詐欺師の音声特徴情報である第２音声特徴情報が登録されるブラックリストとを記憶手段に記憶する処理と、発信の音声データを取得し、前記音声データの音声特徴情報である第３音声特徴情報を求め、前記第３音声特徴情報が前記第１音声特徴情報および前記第２音声特徴情報と一致するか否かを判定する処理と、前記第３音声特徴情報が前記第１音声特徴情報および前記第２音声特徴情報のいずれとも一致しない場合、前記第３音声特徴情報の中に複数の人物の音声特徴情報が含まれるか否かを判定する処理と、前記第３音声特徴情報の中に複数の人物の音声特徴情報が含まれる場合、前記発信は前記詐欺師からの発信の可能性が高いとの第１判定結果を得る処理と、を発信者特定装置のコンピュータに実行させることを特徴とする。

　本発明によれば、詐欺師からの発信とそうでない人からの発信とをより高精度に峻別することが可能となる。

本発明の第１の実施形態に係る通話システムの構成例を示すブロック図である。発信者特定サーバの構成例を示すブロック図である。発信者特定サーバの動作例を示すフローチャートである。本発明の第２の実施形態に係る通話システムの構成例を示すブロック図である。

　［第１の実施形態］
　（構成の説明）
　図１は、本発明の第１の実施形態に係る通話システム１０の構成例を示すブロック図である。通話システム１０は、発信側装置１００と、着信側装置２００と、関係連絡先装置３００と、発信者特定サーバ４００（発信者特定装置）と、を備える。

　発信側装置１００と着信側装置２００と関係連絡先装置３００とは電話網２０を介して接続される。また、電話網２０と発信者特定サーバ４００と着信側装置２００と関係連絡先装置３００とは、所定のデータ通信網３０（例えばインターネット）で接続される。

　発信側装置１００は、発信者によって操作される電話機（図１において不図示）を少なくとも備える。

　着信側装置２００は、電話機２１０と情報端末２２０とを備える。電話機２１０は、着信者によって操作される電話機である。情報端末２２０は、データ通信網３０に接続された装置（たとえば、発信者特定サーバ４００）と通信するための端末（たとえば、パーソナルコンピュータ）である。情報端末２２０は、データ通信網３０に接続された装置と通信する機能と、所定情報を視覚表示あるいは音声表示する表示機能とを少なくとも備える。情報端末２２０は、たとえば、発信者特定サーバ４００から、後述する「発信種別」を受け取り、画面に表示する。

　関係連絡先装置３００は、データ通信網３０を介して少なくとも発信者特定サーバ４００と通信可能である。ここで、関係連絡先とは、たとえば、着信者の家族、電話サービスを提供する事業者が運営するサービスセンター、警察等である。

　図２は、発信者特定サーバ４００の構成例を示すブロック図である。発信者特定サーバ４００は、記憶部４１０（記憶手段）と、音声特徴分析部４２０（音声特徴分析手段）とを備える。なお、本実施形態では、音声特徴が「声紋」である場合を例に挙げて説明する。当然のことながら、音声特徴は声紋のみに限定されるものではない。

　記憶部４１０は、ホワイトリスト４３０とブラックリスト４４０とを記憶する。ホワイトリスト４３０には、着信者の近親者（たとえば、家族や友人）の音声特徴情報（たとえば、声紋情報）が予め登録されている。ブラックリスト４４０には、詐欺等の犯罪者、あるいは犯罪が疑われる人の声紋情報が予め登録されている。

　音声特徴分析部４２０は、データ通信網３０を経由して電話網２０から、発信者の音声データを取得する。音声特徴分析部４２０は、取得した音声データから声紋情報を抽出する。音声特徴分析部４２０は、抽出した声紋情報を分析（具体的には、各リストに登録された声紋との一致判定、および一つの音声データの中に複数の人の声紋があるか否かの判定）する。なお、音声特徴分析部４２０は、抽出した声紋情報を分析するタイミングについては、特に限定されない。例えば、所定の間隔（例えば、５秒間隔）で照合をかけ、話者が識別できるかを判定し、判定できなければ再度、照合をかけるようにすると良い。また、通話の終了時に通話中に抽出した声紋情報をまとめて分析しても良い。音声特徴分析部４２０は、後述するように、分析結果（発信種別）に基づいた適切な処理を実行する。

　（動作の説明）
　図３は、発信者特定サーバ４００の動作例を示すフローチャートである。

　音声特徴分析部４２０は、データ通信網３０を経由して電話網２０から発信者の音声データを取得する（ステップＳ１）。音声特徴分析部４２０は、取得した音声データから声紋情報を抽出する（ステップＳ２）。音声特徴分析部４２０は、抽出された声紋情報がホワイトリスト４３０に登録されている声紋情報と一致するか否かを判定する（ステップＳ３）。

　ホワイトリスト４３０に登録されている声紋情報と一致する場合（ステップＳ３においてＹｅｓ）、音声特徴分析部４２０は、当該発信の種別を「発信種別Ａ／第２判定結果」（明らかに近親者からの発信）に分類する（ステップＳ４）。

　ホワイトリスト４３０に登録されている声紋情報と一致しない場合（ステップＳ３においてＮｏ）、音声特徴分析部４２０は、抽出された声紋情報がブラックリスト４４０に登録されている声紋情報と一致するか否かを判定する（ステップＳ５）。

　ブラックリスト４４０に登録されている声紋情報と一致する場合（ステップＳ５においてＹｅｓ）、音声特徴分析部４２０は、当該発信の種別を、「発信種別Ｂ／第３判定結果」（明らかに詐欺師からの発信）に分類する（ステップＳ６）。

　ブラックリスト４４０に登録されている声紋情報と一致しない場合（ステップＳ５においてＮＯ）、音声特徴分析部４２０は、抽出された声紋情報に複数の人の声紋が含まれるか否かを判定する（ステップＳ７）。

　複数の人の声紋が含まれる場合（ステップＳ７においてＹｅｓ）、音声特徴分析部４２０は、当該発信の種別を、「発信種別Ｃ／第１判定結果」（詐欺師からの発信の可能性が高い発信）に分類する（ステップＳ８）。

　複数の人の声紋が含まれない場合（ステップＳ７においてＮｏ）、音声特徴分析部４２０は、当該発信の種別を、「発信種別Ｄ／第４判定結果」（詐欺師からの発信の可能性が低い発信）に分類する（ステップＳ９）。

　詐欺の中には事前にシナリオを作成して誰がどのタイミングで何を話すかを周到に決めている場合がある。すなわち、ある１つの発信の中に複数の人間が登場する場合、その発信は詐欺グループからの発信である蓋然性が高い。しかしながら、それらの人間の全てがブラックリストに登録されていない場合、単にブラックリストに該当するか否かで発信を判定する方法では、そのような発信は詐欺師からの発信とは判定されない。

　そこで、第１の実施形態では、近親者および詐欺師のいずれにも分類されない発信について、複数の声紋情報が存在するか否か（すなわち、複数の人が登場するか否か）を判定することにより、発信種別をより詳細に分類している。具体的には、上記発信種別Ａ～Ｄの４種類に分類している。

　音声特徴分析部４２０は、当該発信についての発信種別（発信種別Ａ～Ｄのいずれか）を、データ通信網３０を介して、情報端末２２０へ送信する（ステップＳ１０）。情報端末２２０は、受信した発信種別を画面表示する。

　音声特徴分析部４２０は、当該発信についての発信種別が発信種別Ｂ（明らかに詐欺師からの発信）または発信種別Ｃ（詐欺師からの発信の可能性が高い発信）であるか否かを判定する（ステップＳ１１）。発信種別が発信種別Ｂまたは発信種別Ｃでない場合（ステップＳ１１においてＮｏ）、本フローは終了する。

　発信種別が発信種別Ｂまたは発信種別Ｃである場合（ステップＳ１１においてＹｅｓ）、音声特徴分析部４２０は、関係連絡先装置３００に対して「警告」を送信する（ステップＳ１２）。

　警告の送信方法例としては、たとえば、メール、電話、スマートフォンのアプリへのプッシュ通知などを挙げることができる。また、警告は、全送信先（着信者の家族、電話サービスを提供する事業者が運営するサービスセンター、警察等）に対して一斉送信されてもよく、あるいは、１以上の特定の送信先のみに送信されてもよい。たとえば、とりあえず、サービスセンターのみに警告を送信することができる。この場合、サービスセンターは、必要に応じて着信者、着信者の家族、警察などと連絡を取り合い、詐欺を未然に防ぐための適切な処置を施す。

　（効果の説明）
　以上説明した第１の実施形態では、近親者および詐欺師のいずれにも分類されない発信について、複数の声紋情報が存在するか否か（すなわち、複数の人が登場するか否か）を判定することにより、発信種別をより詳細に分類している。具体的には、上記発信種別Ａ～Ｄの４種類に分類している。

　すなわち、ブラックリストのみ、あるいはホワイトリストのみと比較するだけの単純な二者択一的な判定方法と比較して、本実施形態の場合、検出すべき詐欺師からの発信を見過ごしてしまったり、詐欺師でない人まで詐欺師と判断してしまったりする問題は発生し難くなる。

　要するに本実施形態によれば、詐欺師からの発信とそうでない人からの発信とをより高精度に峻別することが可能となる。

　なお、発信種別が発信種別Ｂまたは発信種別Ｃである場合、音声特徴分析部４２０は、情報端末２２０に対して、取るべき行動（たとえば、家族に相談する、家族以外の別の人に相談する、警察に相談する、コールセンターに報告する等）を送信してもよい。

　なお、上記各連絡先への相談や報告に関し、Ｃｌｉｃｋ　ｔｏ　ｄｉａｌの仕組みを用いて、情報端末２２０から簡単に相談の電話ができるようにすることもできる。また、Ｃｌｉｃｋ　ｔｏ　ｄｉａｌの代わりに、メールやスマートフォンのアプリへのプッシュ通知、コールセンターのウェブサーバに接続して相談をするなどの様々な方法を採用することもできる。なお、Ｃｌｉｃｋ　ｔｏ　ｄｉａｌとは、Webページ上などに表示されたアイコンやリンクをクリックすることで、相手に自動的に電話をするサービスである。

　［第２の実施形態］
　図４は、本発明の第２の実施形態に係る通話システム５００の構成例を示すブロック図である。通話システム５００の通話システム１０（図１）に対する差異は、電話機２１０と情報端末２２０とが接続されている点にある。電話機２１０は、発信者の音声データを、情報端末２２０経由で発信者特定サーバ４００へ送信する。これにより、電話網２０から音声データを発信者特定サーバ４００へ転送する必要は無くなる。電話網２０の設定を変更する場合、電話サービスを提供する通信事業者の協力要請が必要であるなど大変な手間を要する。しかしながら、本実施形態のように構成することにより、より簡便に発信種別特定サービスを提供することが可能となる。

　なお、第２の実施形態は、第１の実施形態と同様の効果を奏することは説明するまでもない。

　また、以上説明した各実施形態の全部又は一部の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより各部の処理を行ってもよい。

　「コンピュータシステム」の例としては、例えば、ＣＰＵ（Central Processing Unit）を挙げることができる。

　「コンピュータ読み取り可能な記録媒体」は、例えば、非一時的な記憶装置である。非一時的な記憶装置の例としては、例えば、光磁気ディスク、ＲＯＭ（Read Only Memory）、不揮発性半導体メモリ等の可搬媒体、コンピュータシステムに内蔵されるハードディスクを挙げることができる。また、「コンピュータ読み取り可能な記録媒体」は、一時的な記憶装置であってもよい。一時的な記憶装置の例としては、例えば、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線、あるいは、コンピュータシステム内部の揮発性メモリを挙げることができる。

　また、上記プログラムは、前述した機能の一部を実現するためのものであってもよく、更に前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよい。

　以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。

　この出願は、２０１４年６月１７日に出願された日本出願特願２０１４－１２４４４６を基礎とする優先権を主張し、その開示の全てをここに取り込む。

　１０　　通話システム
　２０　　電話網
　３０　　データ通信網
　１００　　発信側装置
　２００　　着信側装置
　３００　　関係連絡先装置
　４００　　発信者特定サーバ
　４１０　　記憶部
　４２０　　音声特徴分析部
　４３０　　ホワイトリスト
　４４０　　ブラックリスト
　５００　　通話システム

Claims

　着信者の近親者の音声特徴情報である第１音声特徴情報が登録されるホワイトリストと、詐欺師の音声特徴情報である第２音声特徴情報が登録されるブラックリストとを記憶する記憶手段と、
　発信の音声データを取得し、前記音声データの音声特徴情報である第３音声特徴情報を求め、前記第３音声特徴情報が前記第１音声特徴情報および前記第２音声特徴情報と一致するか否かを判定し、前記第３音声特徴情報が前記第１音声特徴情報および前記第２音声特徴情報のいずれとも一致しない場合、前記第３音声特徴情報の中に複数の人物の音声特徴情報が含まれるか否かを判定し、前記第３音声特徴情報の中に複数の人物の音声特徴情報が含まれる場合、前記発信は前記詐欺師からの発信の可能性が高いとの第１判定結果を得る音声特徴分析手段と、
　を備えることを特徴とする発信者特定装置。
　前記第３音声特徴情報が前記第１音声特徴情報と一致する場合、前記音声特徴分析手段は、前記発信は明らかに前記近親者からの発信であるとの第２判定結果を得ることを特徴とする請求項１記載の発信者特定装置。
　前記第３音声特徴情報が前記第２音声特徴情報と一致する場合、前記音声特徴分析手段は、前記発信は明らかに前記詐欺師からの発信であるとの第３判定結果を得ることを特徴とする請求項２記載の発信者特定装置。
　前記第３音声特徴情報が前記第１音声特徴情報および第２音声特徴情報のいずれとも一致せず、且つ前記第３音声特徴情報の中に複数の人物の音声特徴情報が含まれない場合、前記音声特徴分析手段は、前記発信は詐欺師からの発信の可能性が低いとの第４判定結果を得ることを特徴とする請求項３記載の発信者特定装置。
　前記音声特徴分析手段は、前記発信についての判定結果が前記第１判定結果または前記３判定結果であるか否かを判定し、前記判定結果が前記第１判定結果または前記第３判定結果である場合、前記発信者特定装置と所定の通信網を介して接続され、関係連絡先によって操作される関係連絡先装置に対して、前記発信が前記詐欺師からの発信であることを警告するための警告情報を送信することを特徴とする請求項４記載の発信者特定装置。
　前記関係連絡先は、前記着信者の家族、電話サービスを提供する事業者が運営するサービスセンター、および警察の少なくとも１つであることを特徴とする請求項５記載の発信者特定装置。
　前記判定結果が前記第１判定結果または前記第３判定結果である場合、前記音声特徴分析手段は、前記発信者特定装置と所定の通信網を介して接続される着信側装置に対して、前記着信者が取るべき行動が示される行動情報を送信することを特徴とする請求項５または６記載の発信者特定装置。
　前記音声特徴分析手段は、前記音声データを前記着信側装置から受信することを特徴とする請求項７記載の発信者特定装置。
　着信者の近親者の音声特徴情報である第１音声特徴情報が登録されるホワイトリストと、詐欺師の音声特徴情報である第２音声特徴情報が登録されるブラックリストとを記憶手段に記憶し、
　発信の音声データを取得し、前記音声データの音声特徴情報である第３音声特徴情報を求め、前記第３音声特徴情報が前記第１音声特徴情報および前記第２音声特徴情報と一致するか否かを判定し、
　前記第３音声特徴情報が前記第１音声特徴情報および前記第２音声特徴情報のいずれとも一致しない場合、前記第３音声特徴情報の中に複数の人物の音声特徴情報が含まれるか否かを判定し、
　前記第３音声特徴情報の中に複数の人物の音声特徴情報が含まれる場合、前記発信は前記詐欺師からの発信の可能性が高いとの第１判定結果を得る、
　ことを特徴とする発信者特定方法。
　着信者の近親者の音声特徴情報である第１音声特徴情報が登録されるホワイトリストと、詐欺師の音声特徴情報である第２音声特徴情報が登録されるブラックリストとを記憶手段に記憶する処理と、
　発信の音声データを取得し、前記音声データの音声特徴情報である第３音声特徴情報を求め、前記第３音声特徴情報が前記第１音声特徴情報および前記第２音声特徴情報と一致するか否かを判定する処理と、
　前記第３音声特徴情報が前記第１音声特徴情報および前記第２音声特徴情報のいずれとも一致しない場合、前記第３音声特徴情報の中に複数の人物の音声特徴情報が含まれるか否かを判定する処理と、
　前記第３音声特徴情報の中に複数の人物の音声特徴情報が含まれる場合、前記発信は前記詐欺師からの発信の可能性が高いとの第１判定結果を得る処理と、
　を発信者特定装置のコンピュータに実行させるための発信者特定プログラムを格納する記録媒体。