JP2010273130A - 詐欺進行度判定装置、辞書生成装置、詐欺進行度判定方法及び辞書生成方法 - Google Patents
詐欺進行度判定装置、辞書生成装置、詐欺進行度判定方法及び辞書生成方法 Download PDFInfo
- Publication number
- JP2010273130A JP2010273130A JP2009123455A JP2009123455A JP2010273130A JP 2010273130 A JP2010273130 A JP 2010273130A JP 2009123455 A JP2009123455 A JP 2009123455A JP 2009123455 A JP2009123455 A JP 2009123455A JP 2010273130 A JP2010273130 A JP 2010273130A
- Authority
- JP
- Japan
- Prior art keywords
- call
- fraud
- probability
- dictionary
- arrival probability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Telephone Function (AREA)
- Telephonic Communication Services (AREA)
Abstract
【課題】複数の通話で行われる詐欺の進行度を判定する。
【解決手段】詐欺進行度判定装置は、通信装置を用いた通話の内容の特徴に基づいて、その通話が、詐欺を構成する複数の過程のうちのそれぞれに属する確率である個別確率を導出し、その通話が行われた時点において、詐欺を構成する複数の過程のそれぞれに到達している確率である到達確率を導出する。このとき、詐欺進行度判定装置は、第一の通話が行われたときよりも前に前記通信装置を用いて行われた第二の通話に対して導出された到達確率が保持されている場合には、第二の通話に対する到達確率と、第一の通話に対する個別確率とを用いて、第一の通話に対する到達確率を導出し、保持されている到達確率を更新する。そして、詐欺進行度判定装置は、導出された到達確率に基づいて判定した詐欺進行度に応じた情報を出力する。
【選択図】図8
【解決手段】詐欺進行度判定装置は、通信装置を用いた通話の内容の特徴に基づいて、その通話が、詐欺を構成する複数の過程のうちのそれぞれに属する確率である個別確率を導出し、その通話が行われた時点において、詐欺を構成する複数の過程のそれぞれに到達している確率である到達確率を導出する。このとき、詐欺進行度判定装置は、第一の通話が行われたときよりも前に前記通信装置を用いて行われた第二の通話に対して導出された到達確率が保持されている場合には、第二の通話に対する到達確率と、第一の通話に対する個別確率とを用いて、第一の通話に対する到達確率を導出し、保持されている到達確率を更新する。そして、詐欺進行度判定装置は、導出された到達確率に基づいて判定した詐欺進行度に応じた情報を出力する。
【選択図】図8
Description
本発明は、詐欺の進行度を判定するための技術に関する。
近年、主に身内のトラブルを装って高齢者を電話越しに騙し、犯人の口座に金銭を振り込ませる、振り込め詐欺等と呼ばれる詐欺が横行し、問題となっている。これらの詐欺では、電話越しで十分な情報が得られないことを利用して、人を熟慮的な思考ができないパニック状態に陥れることで騙す。
このような詐欺に対応するための技術は、詐欺を検知して特定の対策を施すというものがほとんどである。例えば、特許文献1では、通話に含まれる詐欺に関するキーワードに応じて、信頼のおける第三者に通知することで、第三者に詐欺か否か判断してもらう方法が開示されている。また、特許文献2では、通話内容に含まれる詐欺に関するキーワードに応じて、警告メッセージや警告メールを発する方法が開示されている。また、特許文献3では、加害者の音声や口座情報をデータベースとして蓄積することで、通話内容がそれら加害者側情報と一致した際に、詐欺として検知し、適切な対策をとる方法が開示されている。
このような詐欺に対応するための技術は、詐欺を検知して特定の対策を施すというものがほとんどである。例えば、特許文献1では、通話に含まれる詐欺に関するキーワードに応じて、信頼のおける第三者に通知することで、第三者に詐欺か否か判断してもらう方法が開示されている。また、特許文献2では、通話内容に含まれる詐欺に関するキーワードに応じて、警告メッセージや警告メールを発する方法が開示されている。また、特許文献3では、加害者の音声や口座情報をデータベースとして蓄積することで、通話内容がそれら加害者側情報と一致した際に、詐欺として検知し、適切な対策をとる方法が開示されている。
ところで、非特許文献1には、近年の振り込め詐欺は、架空のトラブルに巻き込まれた身内を1人の犯人が装った単純な手口から、複数の犯人がその架空のトラブルに関連する警察官、弁護士、トラブルの相手等の役割を演じ、より現実感の高い演技を行うことで被害者を騙そうとする、劇団型へ変化してきていることが記載されている。これら劇団型の詐欺は、交通事故、会社のトラブル、痴漢等の、現実的に発生しそうなトラブルを装うため、つい騙されてしまう被害者も多く、また、被害者に対して、複数の犯人が複数回の通話を行うことによって、トラブルの状況や対策等を逐一伝えていくことにより、より現実感が増し、騙されやすくなるという特徴がある。
内閣府・国民生活政策ホームページ内(その他の公表資料)「消費者の意思決定行動に係わる経済実験の実施及び分析調査」/URL(http://www5.cao.go.jp/seikatsu/index-2.html)
このような詐欺を考えた場合、一度の通話で完結するような従来の振り込め詐欺とは異なり、複数の犯人によって行われる一連の通話を総合的に観測しなければ、詐欺であるか否かの判定は難しい。一方で、詐欺の最終段階に至るまでの一連の通話を全て観測してからその判断をしていたのでは、被害者が騙されてしまって金銭の振込み行為を止められなくなる等、手遅れとなる可能性もある。
そこで、本発明の目的は、複数の通話で行われる詐欺の進行度を判定することにある。
そこで、本発明の目的は、複数の通話で行われる詐欺の進行度を判定することにある。
上述した課題を解決するため、本発明に係る詐欺進行度判定装置は、通信装置を用いた通話を解析して当該通話の特徴を特定する通話解析手段と、前記通話解析手段によって特定された前記通話の特徴に基づいて、当該通話が、詐欺を構成する複数の過程のそれぞれに属する確率である個別確率を導出する個別確率導出手段と、前記個別確率導出手段により導出された前記個別確率に基づき、前記通話が行われた時点において、詐欺を構成する複数の過程のそれぞれに到達している確率である到達確率を導出する到達確率導出手段と、前記到達確率導出手段により導出された前記到達確率を保持する到達確率保持手段と、前記到達確率導出手段により導出された前記到達確率に基づいて、詐欺が進行している度合いである詐欺進行度を判定し、判定した当該詐欺進行度に応じた情報を出力する詐欺進行度出力手段とを具備し、前記到達確率導出手段は、第一の通話が行われたときよりも前に前記通信装置を用いて行われた第二の通話に対して導出された前記到達確率が、前記到達確率保持手段により保持されている場合には、保持されている前記第二の通話に対する到達確率と、前記第一の通話に対して前記個別確率導出手段により導出された前記個別確率とを用いて、当該第一の通話に対する前記到達確率を導出し、導出した当該到達確率で、前記到達確率保持手段により保持されている前記到達確率を更新することを特徴とする。
好ましくは、詐欺を構成する各過程に相当する通話である詐欺通話の特徴を表す第一の辞書と、前記通信装置を用いた詐欺ではない通話である非詐欺通話の特徴を表す第二の辞書とを記憶する第一の記憶手段を具備し、前記個別確率導出手段は、前記第一の記憶手段に記憶された前記第一の辞書及び前記第二の辞書によって表される特徴と、前記通話解析手段によって特定された特徴とを照合し、その照合結果に応じた前記個別確率を導出するとよい。
また、好ましくは、前記第一の辞書は、前記詐欺通話から抽出された複数の単語を含み、前記第二の辞書は、前記非詐欺通話から抽出された複数の単語を含み、前記通話解析手段は、前記通話に含まれる単語を当該通話の特徴として特定するとよい。
また、好ましくは、同一の前記通信装置を用いた時系列の1又は複数回の通話を解析して当該1又は複数回の通話の全てに含まれる特徴を特定し、当該特徴を表す第三の辞書を記憶する第二の記憶手段を具備し、前記到達確率導出手段は、通信端末を用いた通話に対して前記通話解析手段により特定された当該通話の特徴と、当該通信端末において当該通話の前に行われた1又は複数回の通話についての前記第三の辞書が表す特徴とが重複している割合を加味して、前記到達確率を導出するとよい。
また、好ましくは、前記第三の辞書は、前記1又は複数回の通話に含まれる単語を、当該通話の特徴として記憶するとよい。
また、上述の態様において、前記到達確率導出手段は、詐欺を構成する複数の過程のうち最初の過程に到達している前記到達確率として前記到達確率導出部により導出された値が閾値以下であった場合には、当該最初の過程以外の過程に到達している到達確率を導出しないことが望ましい。
また、好ましくは、詐欺進行度出力手段は、前記通信端末を用いた通話に対して前記到達確率導出手段により導出された到達確率に、当該通信端末を用いて行われた、詐欺を構成する過程に相当する全通話の期間を加味して、前記詐欺進行度を判定するとよい。
また、好ましくは、詐欺を構成する複数の過程のそれぞれについて分類された、詐欺に関する通話である詐欺通話から、当該過程毎に当該詐欺通話の特徴を抽出し、当該特徴を表す第一の辞書を生成する第一辞書生成手段と、通信端末を用いた通話の話者毎に分類された、当該話者による、詐欺でない通話である非詐欺通話から、当該非詐欺通話の特徴を抽出し、当該特徴を表す第二の辞書を生成する第二辞書生成手段と、を具備するとよい。
また、好ましくは、前記第一の辞書は、前記詐欺通話から抽出された複数の単語を含み、前記第二の辞書は、前記非詐欺通話から抽出された複数の単語を含むとよい。
また、本発明に係る詐欺進行度判定方法は、詐欺の進行度を判定する詐欺進行度判定装置が行う詐欺進行度判定方法であって、通信装置を用いた通話を解析して当該通話の内容の特徴を特定する通話解析ステップと、前記通話解析ステップにおいて特定された特徴に基づいて、前記通話が、詐欺を構成する複数の過程のうちのそれぞれに属する確率である個別確率を導出する個別確率導出ステップと、前記個別確率導出ステップにおいて導出された前記個別確率に基づき、前記通話が行われた時点において、詐欺を構成する複数の過程のそれぞれに到達している確率である到達確率を導出する到達確率導出ステップと、前記到達確率導出ステップにおいて導出された前記到達確率を保持する到達確率保持ステップと、前記到達確率導出ステップにおいて導出された前記到達確率に基づいて、詐欺が進行している度合いである詐欺進行度を判定し、判定した当該詐欺進行度に応じた情報を出力する詐欺進行度出力ステップとを具備し、前記到達確率導出ステップにおいて、第一の通話が行われたときよりも前に前記通信装置を用いて行われた第二の通話に対して導出された前記到達確率が、前記到達確率保持ステップにより保持されている場合には、保持されている前記第二の通話に対する到達確率と、前記第一の通話に対して前記個別確率導出ステップにより導出された前記個別確率とを用いて、当該第一の通話に対する前記到達確率を導出し、導出した当該到達確率で、前記到達確率保持ステップにより保持されている前記到達確率を更新することを特徴とする。
好ましくは、詐欺を構成する複数の過程のそれぞれについて分類された、詐欺に関する通話である詐欺通話から、当該過程毎に当該詐欺通話の特徴を抽出し、当該特徴を表す第一の辞書を生成する第一辞書生成ステップと、通信端末を用いた通話の話者毎に分類された、当該話者による、詐欺でない通話である非詐欺通話から、当該非詐欺通話の特徴を抽出し、当該特徴を表す第二の辞書を生成する第二辞書生成ステップと、を具備するとよい。
本発明によれば、複数の通話で行われる詐欺の進行度を判定することができる。
以下、本発明を実施するための形態について説明する。
1.第一実施形態
1−1.構成
1−1−1.全体構成
図1は、本発明の第一実施形態である詐欺進行度判定システム9の全体構成を示す図である。同図に示すように、携帯電話機2は、携帯通信網であるネットワーク3から通話サービスやデータ通信サービスの提供を受ける通信装置である。このネットワーク3には、コンピュータによって構成された辞書生成装置1が接続されている。この辞書生成装置1は、詐欺進行度判定装置として機能する携帯電話機2において詐欺の進行度を判定するときに用いる辞書を生成し、携帯電話機2に配信する装置である。
1.第一実施形態
1−1.構成
1−1−1.全体構成
図1は、本発明の第一実施形態である詐欺進行度判定システム9の全体構成を示す図である。同図に示すように、携帯電話機2は、携帯通信網であるネットワーク3から通話サービスやデータ通信サービスの提供を受ける通信装置である。このネットワーク3には、コンピュータによって構成された辞書生成装置1が接続されている。この辞書生成装置1は、詐欺進行度判定装置として機能する携帯電話機2において詐欺の進行度を判定するときに用いる辞書を生成し、携帯電話機2に配信する装置である。
1−1−2.辞書生成装置の構成
図2は、辞書生成装置1のハードウェア構成を例示するブロック図である。CPU11は、ROM12に記憶されているブートローダや記憶部14に記憶されているコンピュータプログラムを読み出して実行することにより辞書生成装置1の各部を制御する。ROM12は半導体素子等で構成された読み出し専用の不揮発性記憶装置である。このROM12には、記憶部14に記憶されている基本OS(Operating System)をRAM(Random Access Memory)13にロードするためのブートローダやBIOS(Basic Input/Output System)等が記憶されている。RAM13はCPU11がプログラムを実行する際のワークエリアとして利用される。記憶部14はハードディスクドライブ等の大容量の記憶手段であり、CPU11に読み込まれるプログラムや、後述する複数の音声ファイル等を記憶する。通信部15は、ネットワーク3に接続されており、このネットワーク3を介して携帯電話機2と通信を行う通信手段である。さらに、辞書生成装置1には、メンテナンスや各種の操作を行うための、図示しない操作部および表示部等を有する。
図2は、辞書生成装置1のハードウェア構成を例示するブロック図である。CPU11は、ROM12に記憶されているブートローダや記憶部14に記憶されているコンピュータプログラムを読み出して実行することにより辞書生成装置1の各部を制御する。ROM12は半導体素子等で構成された読み出し専用の不揮発性記憶装置である。このROM12には、記憶部14に記憶されている基本OS(Operating System)をRAM(Random Access Memory)13にロードするためのブートローダやBIOS(Basic Input/Output System)等が記憶されている。RAM13はCPU11がプログラムを実行する際のワークエリアとして利用される。記憶部14はハードディスクドライブ等の大容量の記憶手段であり、CPU11に読み込まれるプログラムや、後述する複数の音声ファイル等を記憶する。通信部15は、ネットワーク3に接続されており、このネットワーク3を介して携帯電話機2と通信を行う通信手段である。さらに、辞書生成装置1には、メンテナンスや各種の操作を行うための、図示しない操作部および表示部等を有する。
図3は、辞書生成装置1の記憶部14に予め記憶されている複数の音声ファイルを説明する概念図である。記憶部14の詐欺通話群記憶領域140には、詐欺を行っているときの各々の通話(以下、詐欺通話)を録音して生成された音声ファイルが、その詐欺のステージ毎に記憶されている。ここで、1つの「通話」とは、ネットワーク3を介した或る通信回線が確立してから切断されるまでの、その通信回線を介した会話をいう。また、「詐欺のステージ」とは、詐欺が開始されてから終了するまでにおける、詐欺の過程のことである。
ここで、詐欺のステージについて詳細に説明する。非特許文献1によると、人が意思決定を行う際には、主に以下の4つのステージにより意志を決定することが知られている。
(ステージ1) 前提の理解
(ステージ2) 情報の探索
(ステージ3) 情報の評価
(ステージ4) 結論の導出
(ステージ1) 前提の理解
(ステージ2) 情報の探索
(ステージ3) 情報の評価
(ステージ4) 結論の導出
通常は、このような意思決定は、熟慮的処理(十分な情報と時間に基づいて意思決定を行う処理)と自動的処理(情報や時間が不足している場合に、過去の経験や感情的な要因等を元に直感的に意思決定を行う処理)をバランス良く行うことによってなされる。
ところが、振り込め詐欺における犯人は、「ステージ1:前提の理解」では偽の状況を理解させ、「ステージ2:情報の探索」では不安や恐怖を喚起させ、「ステージ3:情報の評価」では譲歩や解決策の提示を行い、「ステージ4:結論の導出」では解決策の具体化や実行への誘導を行う。これにより、被害者は、従来行われる正常な通話における意思決定とは明らかに異なり、自動的処理に偏った意思決定を行ってしまうと考えられている。
ところが、振り込め詐欺における犯人は、「ステージ1:前提の理解」では偽の状況を理解させ、「ステージ2:情報の探索」では不安や恐怖を喚起させ、「ステージ3:情報の評価」では譲歩や解決策の提示を行い、「ステージ4:結論の導出」では解決策の具体化や実行への誘導を行う。これにより、被害者は、従来行われる正常な通話における意思決定とは明らかに異なり、自動的処理に偏った意思決定を行ってしまうと考えられている。
例えば、劇団型詐欺における、これら4つのステージで行われる話題の一例を図9に示す。この例では、「ステージ1:前提の理解」において、警察官になりすました犯人Aが被害者の息子が事故をおこしたという偽の情報を与え、「ステージ2:情報の探索」において、犯人Aとは異なる各犯人B,Cが、弁護士や被疑者の息子になりすまし、「帝王切開」とか「即日裁判」等の単語を利用したり、犯人Cが泣き声になったりする等の演出を行うことで、被害者を追い詰めて冷静な判断を不可能とする。「ステージ3:情報の評価」では、追い詰められた被害者へ示談や保釈金といった解決策の提示や譲歩を行うことで被害者を振込み行動へと誘導し、「ステージ4:結論の導出」では、被害者に、金銭の振り込み等の実際の行動を指示する。上記の通り、複数回に亘る一連の通話によって、被害者を徐々に自動的処理に追い込んでいく。
通常の通話において、受信者が熟慮的処理と自動的処理のバランスをとって意思決定を行っているのであれば、通話の途中で受信者が詐欺に気付くため、詐欺は進行しない。しかし、上記のように、ステージ1からステージ4まで段階的に構成された一連の通話によって、受信者が徐々に意思決定のバランスを失っていくと、詐欺が進行しやすくなる。そして、詐欺のステージが進めば進むほど、被害者が自動的処理に追い込まれていくため、詐欺が成功してしまう可能性も高まると言える。
図3の説明に戻る。詐欺通話群記憶領域140は、ステージ1〜4にそれぞれ関連付けられた詐欺通話群記憶領域140−1〜4の4つの記憶領域に区分けされており、これらの詐欺通話群記憶領域140−j(jは1〜4の整数)には、各ステージjに該当する詐欺通話の音声ファイルが複数格納されている。これら複数の音声ファイルは例えば、実際に起きた詐欺の通話や、それらの詐欺を参考にして役者が演じた通話等を録音した音声ファイルであり、警察や被害者、又は脳科学や神経科学といった知見を有する科学者により、それぞれ該当する詐欺のステージに分類されている。
記憶部14の非詐欺通話群記憶領域141には、詐欺ではない通話(以下、非詐欺通話という)を示す複数の音声ファイルが、その通話の話者毎に記憶されている。ここでいう、通話の話者とは、携帯電話機2の利用者のことであり、これらの音声ファイルは、例えば、以下のようにして記憶部14の非詐欺通話群記憶領域141に記憶される。
各携帯電話機2は自機において行われた通話を録音する機能を有している。各携帯電話機2の利用者は、操作部27を操作して、録音した音声ファイルのうち、例えば通話相手が知人であることが確実なときに録音した音声ファイル等のように、非詐欺通話の音声ファイルであると確実に認められるものを指定し、指定したその音声ファイルを携帯電話機2の電話番号とともに、ネットワーク3を介して辞書生成装置1に送信する。辞書生成装置1の記憶部14の非詐欺通話群記憶領域141は、予め携帯電話機2の電話番号142(142a,142b,142c…)毎に区分けされている。辞書生成装置1のCPU11は、携帯電話機2から受信した音声ファイルを、これとともに受け取った電話番号142a,142b,142c…に対応する非詐欺通話群記憶領域141−a,141−b,141−c…に記憶する。この場合、話者を識別する情報は各話者が有する携帯電話機2の電話番号142である。
各携帯電話機2は自機において行われた通話を録音する機能を有している。各携帯電話機2の利用者は、操作部27を操作して、録音した音声ファイルのうち、例えば通話相手が知人であることが確実なときに録音した音声ファイル等のように、非詐欺通話の音声ファイルであると確実に認められるものを指定し、指定したその音声ファイルを携帯電話機2の電話番号とともに、ネットワーク3を介して辞書生成装置1に送信する。辞書生成装置1の記憶部14の非詐欺通話群記憶領域141は、予め携帯電話機2の電話番号142(142a,142b,142c…)毎に区分けされている。辞書生成装置1のCPU11は、携帯電話機2から受信した音声ファイルを、これとともに受け取った電話番号142a,142b,142c…に対応する非詐欺通話群記憶領域141−a,141−b,141−c…に記憶する。この場合、話者を識別する情報は各話者が有する携帯電話機2の電話番号142である。
なお、携帯電話機2の利用者による非詐欺通話の音声ファイルであるか否かの判断については信頼できない場合もあるため、通話が詐欺通話であるか非詐欺通話であるかについて、利用者が判断を行わないようにしてもよい。すなわち、通話の音声ファイルを全て辞書生成装置1に収集し、科学者等が、収集した音声ファイルを精査して、これらのうち非詐欺通話の音声ファイルのみを知見に基づいて特定し、辞書生成装置1を操作して、非詐欺通話群記憶領域141に記憶させるようにしてもよい。また、携帯電話機2が通話を録音するのではなく、ネットワーク3を構成する交換局や基地局がネットワーク3を介した通話を録音してもよいし、ネットワーク3に音声録音専用のサーバ装置を設け、このサーバ装置がネットワーク3を介して通話を録音してもよい。
図4は、辞書生成装置1における第一辞書240の生成に関する機能的構成を示す図である。第一辞書240とは、各ステージの詐欺通話で出現する単語と、その単語がそのステージの詐欺通話群に出現する回数を対応付けて記憶した辞書である。CPU11がプログラムを実行することで実現される第一辞書生成部111は、記憶部14の詐欺通話群記憶領域140から、音声ファイルをステージ毎に読み出し、そのステージに対応する第一辞書240をそれぞれRAM13上に生成する。具体的には、第一辞書生成部111は、詐欺通話群記憶領域140−jからステージjの音声ファイルを読み出し、この音声ファイルに対して隠れマルコフモデル等による音声認識を行うことで、この音声ファイルから、通話の内容を表す文字データを生成する。さらに、第一辞書生成部111は、形態素解析や構文解析等を行うことで、生成した文字データを単語毎に分解する。そして、第一辞書生成部111は、これらの単語が、詐欺通話群記憶領域140−jからそのステージについて読み出した全ての音声ファイルに出現する回数を計数し、計数した出現回数をその単語と対応付け、これらを第一辞書240−jとして記憶する。すなわち、第一辞書生成部111を実現するCPU11は、詐欺を構成する複数の過程のそれぞれについて分類された、詐欺に関する通話である詐欺通話から、当該過程毎に当該詐欺通話の特徴を抽出し、当該特徴を表す第一の辞書を生成する第一辞書生成手段として機能する。また、ここでは、この第一辞書240は、詐欺通話から抽出された複数の単語を含む。
図5は、ステージj(jは1〜4の整数)の第一辞書240−jを例示する図である。この第一辞書240−jには、この第一辞書240−jを生成する際に解析された音声ファイルの数、すなわち解析されたステージjの詐欺通話の数を示す解析通話数njが記述されている。また、この第一辞書240−jには、解析されたステージjの詐欺通話の音声ファイルに出現する単語W1j,W2j,…,Whj,…が、各単語の出現回数X1j,X2j,…,Xhj,…と対応付けて記述されている。
このようにして、第一辞書生成部111によりRAM13上に生成された4つの第一辞書240−1〜4は、通信部15からネットワーク3を介して、複数の携帯電話機2にそれぞれ送信され、各携帯電話機2の記憶部24にそれぞれ記憶される。
このようにして、第一辞書生成部111によりRAM13上に生成された4つの第一辞書240−1〜4は、通信部15からネットワーク3を介して、複数の携帯電話機2にそれぞれ送信され、各携帯電話機2の記憶部24にそれぞれ記憶される。
図6は、辞書生成装置1における第二辞書241の生成に関する機能的構成を示す図である。第二辞書241とは、各話者の非詐欺通話で出現する単語を、その単語がその話者の非詐欺通話群に出現する回数と対応付けて記憶した辞書である。CPU11がプログラムを実行することで実現される第二辞書生成部112は、記憶部14の非詐欺通話群記憶領域141から、各話者の音声ファイルを読み出し、第一辞書生成部111と同様に、読み出した音声ファイルから各話者に対応する第二辞書241を生成する。すなわち、第二辞書生成部112を実現するCPU11は、通信端末を用いた通話の話者毎に分類された、当該話者による、詐欺でない通話である非詐欺通話から、当該非詐欺通話の特徴を抽出し、当該特徴を表す第二の辞書を生成する第二辞書生成手段として機能する。また、ここでは、この第二辞書241は、非詐欺通話から抽出された複数の単語を含む。
例えば、第二辞書生成部112は、電話番号142aに対応する非詐欺通話群記憶領域141−aから、音声ファイルを読み出して解析し、RAM13上に電話番号142aに対応付けて第二辞書241−aを生成する。RAM13上に生成された第二辞書241−aは、通信部15からネットワーク3を介して、電話番号142aに対応する携帯電話機2aに送信され、その携帯電話機2aの記憶部24aに記憶される。このようにして、第二辞書生成部112により生成された第二辞書241は、これに対応付けられた電話番号に対応する携帯電話機2にそれぞれ送信され、各携帯電話機2の記憶部24に記憶される。第二辞書241は、第一辞書240が詐欺のステージ毎に生成されているのに対し、第二辞書は解析した音声ファイルを録音した携帯電話機2の電話番号毎に生成されている点が異なっている。
1−1−3.携帯電話機の構成
図7は、携帯電話機2のハードウェア構成を例示するブロック図である。CPU21、ROM22、及びRAM23は、そのスペックや記憶・実行されるプログラム以外に関しては、前述したCPU11、ROM12、及びRAM13と共通する構成であるため、説明を省略する。記憶部24はEEPROM(Electrically Erasable Programmable Read Only Memory)等の読み出し及び書き込みが可能な記憶手段であり、CPU21に読み込まれるプログラムのほか、辞書生成装置1から送信されてきた第一辞書240及び第二辞書241を記憶している。すなわち、記憶部24は、詐欺を構成する各過程に相当する通話である詐欺通話の特徴を表す第一の辞書と、前記通信装置を用いた詐欺ではない通話である非詐欺通話の特徴を表す第二の辞書とを記憶する第一の記憶手段の一例である。通信部25は、アンテナを備え、ネットワーク3とのデータ通信を無線で行う。表示部26は、液晶ディスプレイや液晶駆動回路を備え、CPU21から供給される表示データに応じた画像を表示領域に表示する。操作部27は、複数のキー(操作子)を備え、ユーザの操作に応じた操作信号をCPU21に供給する。音声変換部28は、マイク281による収音に応じた音声信号をA/D変換してCPU21に供給したり、CPU21から供給される音声データをD/A変換してスピーカ282から音として出力させたりする。
図7は、携帯電話機2のハードウェア構成を例示するブロック図である。CPU21、ROM22、及びRAM23は、そのスペックや記憶・実行されるプログラム以外に関しては、前述したCPU11、ROM12、及びRAM13と共通する構成であるため、説明を省略する。記憶部24はEEPROM(Electrically Erasable Programmable Read Only Memory)等の読み出し及び書き込みが可能な記憶手段であり、CPU21に読み込まれるプログラムのほか、辞書生成装置1から送信されてきた第一辞書240及び第二辞書241を記憶している。すなわち、記憶部24は、詐欺を構成する各過程に相当する通話である詐欺通話の特徴を表す第一の辞書と、前記通信装置を用いた詐欺ではない通話である非詐欺通話の特徴を表す第二の辞書とを記憶する第一の記憶手段の一例である。通信部25は、アンテナを備え、ネットワーク3とのデータ通信を無線で行う。表示部26は、液晶ディスプレイや液晶駆動回路を備え、CPU21から供給される表示データに応じた画像を表示領域に表示する。操作部27は、複数のキー(操作子)を備え、ユーザの操作に応じた操作信号をCPU21に供給する。音声変換部28は、マイク281による収音に応じた音声信号をA/D変換してCPU21に供給したり、CPU21から供給される音声データをD/A変換してスピーカ282から音として出力させたりする。
図8は、携帯電話機2の機能的構成を示す図である。図に示す各構成は、CPU21がプログラムを実行することで実現される。この携帯電話機2は、一連の通話によって行われる詐欺について、各通話が入力されるたびに、当該通話を含む一連の通話による詐欺の進行度を導出し、その進行度を表す詐欺進行度情報を出力する。
1−2.動作
1−2−1.定義
携帯電話機2による詐欺進行度判定の動作を説明する。この説明において各用語を以下の通り定義する。
詐欺のステージ(詐欺の過程):j
一連の通話におけるi番目の通話:Ci
通話Ciに含まれる単語:wik(k=1,2,…,K)
単語wikがステージjの通話に出現する単語出現係数:φikj
単語wikが非詐欺通話に出現する単語出現係数:φik0
単語wikが出現した通話Ciがステージjの詐欺通話である確率:pij(wik)
通話Ciがステージjの詐欺通話である個別確率:pij(j=1,2,…,J)
第一辞書240−jにおいて単語wikに対応付けて記述されている出現回数:xikj
第二辞書241において単語wikに対応付けて記述されている出現回数:xik0
第一辞書240−jの総通話数:nj
第二辞書241の総通話数:n0
1−2−1.定義
携帯電話機2による詐欺進行度判定の動作を説明する。この説明において各用語を以下の通り定義する。
詐欺のステージ(詐欺の過程):j
一連の通話におけるi番目の通話:Ci
通話Ciに含まれる単語:wik(k=1,2,…,K)
単語wikがステージjの通話に出現する単語出現係数:φikj
単語wikが非詐欺通話に出現する単語出現係数:φik0
単語wikが出現した通話Ciがステージjの詐欺通話である確率:pij(wik)
通話Ciがステージjの詐欺通話である個別確率:pij(j=1,2,…,J)
第一辞書240−jにおいて単語wikに対応付けて記述されている出現回数:xikj
第二辞書241において単語wikに対応付けて記述されている出現回数:xik0
第一辞書240−jの総通話数:nj
第二辞書241の総通話数:n0
1−2−2.通話解析部及び個別確率導出部の動作
(1)単語出現係数の導出
通話の音声は音声変換部28によってA/D変換されて音声データに変換され、変換された音声データは、1つの通話毎に1つの音声ファイルにまとめられて、通話解析部211に送られる。通話解析部211は、この音声ファイルを記憶部24に記憶するとともに、この音声ファイルに対して音声認識、形態素解析及び構文解析を行って、通話の音声に含まれる単語を抽出する。これにより、通話解析部211は、通話Ciに含まれる単語wik(k=1,2,…,K)を抽出することになる。すなわち、通話解析部211を実現するCPU21は、通信装置を用いた通話を解析して当該通話の特徴を特定する通話解析手段として機能する。なお、ここでは、通話解析部211は、通話に含まれる単語を当該通話の特徴として特定する。
(1)単語出現係数の導出
通話の音声は音声変換部28によってA/D変換されて音声データに変換され、変換された音声データは、1つの通話毎に1つの音声ファイルにまとめられて、通話解析部211に送られる。通話解析部211は、この音声ファイルを記憶部24に記憶するとともに、この音声ファイルに対して音声認識、形態素解析及び構文解析を行って、通話の音声に含まれる単語を抽出する。これにより、通話解析部211は、通話Ciに含まれる単語wik(k=1,2,…,K)を抽出することになる。すなわち、通話解析部211を実現するCPU21は、通信装置を用いた通話を解析して当該通話の特徴を特定する通話解析手段として機能する。なお、ここでは、通話解析部211は、通話に含まれる単語を当該通話の特徴として特定する。
次に、個別確率導出部212は、記憶部24に記憶された第一辞書240及び第二辞書241を参照し、通話解析部211によって抽出された単語毎に、その単語がステージ1〜4の詐欺通話及び非詐欺通話に出現する出現回数に応じた係数を、単語出現係数として算出する。具体的には、個別確率導出部212は、抽出された単語wik毎に、各ステージにおける単語出現係数φikjを以下の式(1)に従って算出する。なお、単語wikが第一辞書240−jに出現した回数xikjは、第一辞書240−jにおいて単語wikに対応付けられている「出現回数」のことであり、単語wikが第二辞書241に出現した回数xik0は、第二辞書241において単語wikに対応付けられている「出現回数」のことである。
jは1〜4の整数であると説明したが、ここでは、例外的にjを0〜4の整数として取り扱う。そしてj≠0のときの単語出現係数φikjは、単語wikがステージjの詐欺通話に出現する出現回数に応じた係数であり、j=0のときの単語出現係数φikjは、単語wikが非詐欺通話に出現する出現回数に応じた係数である。αjは単語出現係数φikjを導出するに際してj毎に任意の重みを与える重み係数であり、例えば、α0=2、αj=1(jは1〜4の整数)と設定されている。この設定においては、第二辞書241に出現した回数を第一辞書240に出現した回数の2倍の重みをつけることとなり、詐欺通話を非詐欺通話であると誤検出することに比べて、非詐欺通話を詐欺通話であると誤検出し難くなるように、調整される。なお、式(1)に従って算出される単語出現係数φikjが1を超える場合には、単語出現係数φikjは1とする。また、以下の式(2)を満たさない場合には、個別確率導出部212は、この単語出現係数φikjを算出せずに、単語毎の個別確率を、予め定めた定数と見做す。
ここでLとは、単語が辞書に出現する回数に関する閾値であり、例えば5である。L=5、α0=2、αj=1(jは1〜4の整数)とした場合、単語wikが第一辞書240−jに出現した回数と、第二辞書241に出現した回数を2倍した数との和が5に満たない単語は、計算から外すこととなる。これにより、辞書を生成する際に用いた通話のうち、極めて稀にしか使用されないような特殊な単語による特徴が排除される。
(2)単語毎の個別確率の導出
次に、個別確率導出部212は、単語出現係数φikjに基づいて、単語wikが出現した通話Ciがステージj(jは1〜4の整数)の通話である確率、すなわち「単語毎の個別確率」pij(wik)を、以下の式(3)に従って、導出する。
次に、個別確率導出部212は、単語出現係数φikjに基づいて、単語wikが出現した通話Ciがステージj(jは1〜4の整数)の通話である確率、すなわち「単語毎の個別確率」pij(wik)を、以下の式(3)に従って、導出する。
つまり、ステージjに係る単語毎の個別確率は、その単語wikがステージjの詐欺通話に出現する回数により定まる単語出現係数φikjを、その単語出現係数φikjと、その単語wikが非詐欺通話に出現する回数により定まる単語出現係数φik0との和で除算した値である。ただし、導出した値が閾値LHよりも大きいとき、ステージjに係る単語毎の個別確率は、LHであり、導出した値が閾値LLよりも小さいとき、ステージjに係る単語毎の個別確率は、LLである。閾値LH及び閾値LLにより、個別確率の上限と下限が定まる。ここでは、閾値LHは0.99であり、閾値LLは0.01である。
なお、これらの閾値は、njやn0により定まる関数で求められてもよい。辞書の標本となった総通話数が多くなる程、個別確率の精度が高まるため、閾値を1や0の極限値に、より近づけることができるというように、標本数と精度・閾値には相関があるからである。また、これらの閾値は定めなくてもよい。この場合、上述した式(3)における2番目の式、すなわち、ステージjに係る単語毎の個別確率を(φikj/φikj+φik0)としてもよい。
また、上述の式(2)により、計算から外すこととされた場合には、単語毎の個別確率はRa=0.4という予め定められた定数に設定される。このRaは0から1の間の実数であればどのように設定されてもよい。
また、上述の式(2)により、計算から外すこととされた場合には、単語毎の個別確率はRa=0.4という予め定められた定数に設定される。このRaは0から1の間の実数であればどのように設定されてもよい。
例えば「弁償」という単語が、ステージ1の詐欺通話に係る単語出現係数が0.92であり、非詐欺通話に係る単語出現係数が0.33であるとする。このとき「弁償」が出現した通話が、ステージ1の詐欺通話である個別確率は(0.92/(0.92+0.33))=0.736である。すなわち、或る単語について、或るステージの詐欺通話に係る単語出現係数が高いと、その単語が出現する通話がそのステージの詐欺通話である個別確率も高くなるし、或る単語について、非詐欺通話に係る単語出現係数が高いと、その単語が出現する通話がそのステージの詐欺通話である個別確率は低くなる。
(3)通話毎の個別確率の導出
次に、個別確率導出部212は、通話から抽出された全ての単語について導出された単語毎の個別確率を結合して、その通話がステージ1〜4の詐欺通話である確率(通話毎の個別確率pij)を導出する。すなわち、個別確率導出部212を実現するCPU21は、通話解析手段によって特定された通話の特徴に基づいて、当該通話が、詐欺を構成する複数の過程のそれぞれに属する確率である個別確率を導出する個別確率導出手段として機能する。また、このCPU21は、記憶部24に記憶された第一辞書240及び第二辞書241によって表される特徴と、通話解析部211によって特定された通話の特徴とを照合し、その照合結果に応じた前記個別確率を導出する個別確率導出手段として機能する。具体的には、通話Ciがステージjの詐欺通話である個別確率pijを導出する場合、個別確率導出部212は、この通話毎の個別確率pijに関し、通話Ciに含まれていた全単語wik(k=1〜K)についての単語毎の個別確率pij(wik)を利用し、次の式(4)に従って導出する。
次に、個別確率導出部212は、通話から抽出された全ての単語について導出された単語毎の個別確率を結合して、その通話がステージ1〜4の詐欺通話である確率(通話毎の個別確率pij)を導出する。すなわち、個別確率導出部212を実現するCPU21は、通話解析手段によって特定された通話の特徴に基づいて、当該通話が、詐欺を構成する複数の過程のそれぞれに属する確率である個別確率を導出する個別確率導出手段として機能する。また、このCPU21は、記憶部24に記憶された第一辞書240及び第二辞書241によって表される特徴と、通話解析部211によって特定された通話の特徴とを照合し、その照合結果に応じた前記個別確率を導出する個別確率導出手段として機能する。具体的には、通話Ciがステージjの詐欺通話である個別確率pijを導出する場合、個別確率導出部212は、この通話毎の個別確率pijに関し、通話Ciに含まれていた全単語wik(k=1〜K)についての単語毎の個別確率pij(wik)を利用し、次の式(4)に従って導出する。
つまり、単語毎の個別確率pij(wik)は、各単語wikが通話Ciにそれぞれ出現した場合における、その通話Ciがステージjの詐欺通話に該当する確率であるのに対し、通話毎の個別確率pijは、各単語wikの全てが通話Ciに出現した場合における、その通話Ciがステージjの詐欺通話に該当する確率である。
1−2−3.到達確率導出部の動作
到達確率導出部213は、入力された通話について個別確率導出部212により導出された個別確率と、その通話までに入力された通話によって到達した詐欺の到達確率とに基づいて、その通話を含む一連の通話により到達した詐欺の到達確率を導出する。すなわち、到達確率導出部213を実現するCPU21は、個別確率導出手段により導出された個別確率に基づき、通話が行われた時点において、詐欺を構成する複数の過程のそれぞれに到達している確率である到達確率を導出する到達確率導出手段として機能する。ここで導出された到達確率は、到達確率保持部215により記憶部24に保持され、次の通話の際に到達確率導出部213が到達確率を導出するときに、処理の対象となった通話までに入力された通話によって到達した詐欺の到達確率として用いられる。
到達確率導出部213は、入力された通話について個別確率導出部212により導出された個別確率と、その通話までに入力された通話によって到達した詐欺の到達確率とに基づいて、その通話を含む一連の通話により到達した詐欺の到達確率を導出する。すなわち、到達確率導出部213を実現するCPU21は、個別確率導出手段により導出された個別確率に基づき、通話が行われた時点において、詐欺を構成する複数の過程のそれぞれに到達している確率である到達確率を導出する到達確率導出手段として機能する。ここで導出された到達確率は、到達確率保持部215により記憶部24に保持され、次の通話の際に到達確率導出部213が到達確率を導出するときに、処理の対象となった通話までに入力された通話によって到達した詐欺の到達確率として用いられる。
通話毎の個別確率pijが導出されると、到達確率導出部213は、i番目に入力された通話Ciにより詐欺がステージjまで到達した確率を表す到達確率Pijを導出する。この到達確率Pijは、前回の(i−1)番目までの通話Ci-1により到達したステージと、今回のi番目の通話Ciにより進行するステージとの間に飛躍がないことを条件として導出される。1回目(i=1)の通話C1においては、前回の通話がないため、前回までの通話により到達したステージはない。したがって、到達確率P1jは、P11=p11,P12=p11×p12,…P1j=p11×p12×p13…×p1jで導出される。すなわち、到達確率P1jは、次式(5)にしたがって導出される。
2回目以上(i≧2)の通話Ciにおいては、到達確率Pijは、1回前の到達確率P(i-1)jと、i回目の通話毎の個別確率pijとによって導出される。
すなわち、ステージjに到達した到達確率Pijは、前回の通話Ci-1までにステージjに到達した到達確率Paと、今回の通話Ciのみによってステージ1からステージjに到達した到達確率Pb、および前回の通話Ci-1までにステージs(s<j)に到達し、今回の通話Ciによりステージ(s+1)からステージjに到達した到達確率Pcの合計である。これを一般化すると、次式(6)で表現される。
すなわち、ステージjに到達した到達確率Pijは、前回の通話Ci-1までにステージjに到達した到達確率Paと、今回の通話Ciのみによってステージ1からステージjに到達した到達確率Pb、および前回の通話Ci-1までにステージs(s<j)に到達し、今回の通話Ciによりステージ(s+1)からステージjに到達した到達確率Pcの合計である。これを一般化すると、次式(6)で表現される。
式(6)の右辺は、第1項が到達確率Pa、第2項が到達確率Pb、第3項が到達確率Pcを表している。ただし、j=1のときは、到達確率Pc=0である。
到達確率導出部213は、i番目に入力された通話Ciと詐欺のステージjに対応する到達確率Pijを導出した後、通話の通し番号であるiを記憶部24に記憶する。そして、到達確率導出部213は、別の通話の開始を検知するとiの値をインクリメント、すなわち、1増加させる。つまり、到達確率導出部213は、i番目に入力された通話Ci(第一の通話)が行われたときよりも前に通信装置を用いて行われた(i−1)番目までの通話Ci-1(第二の通話)に対して導出された到達確率P(i-1)jが、記憶部24により保持されている場合には、保持されている通話Ci-1に対する到達確率P(i-1)jと、通話Ciに対して個別確率導出部212により導出された個別確率pijとを用いて、通話Ciに対する到達確率Pijを導出し、導出した到達確率Pijで、記憶部24に保持されている到達確率P(i-1)jを更新する。
到達確率導出部213は、i番目に入力された通話Ciと詐欺のステージjに対応する到達確率Pijを導出した後、通話の通し番号であるiを記憶部24に記憶する。そして、到達確率導出部213は、別の通話の開始を検知するとiの値をインクリメント、すなわち、1増加させる。つまり、到達確率導出部213は、i番目に入力された通話Ci(第一の通話)が行われたときよりも前に通信装置を用いて行われた(i−1)番目までの通話Ci-1(第二の通話)に対して導出された到達確率P(i-1)jが、記憶部24により保持されている場合には、保持されている通話Ci-1に対する到達確率P(i-1)jと、通話Ciに対して個別確率導出部212により導出された個別確率pijとを用いて、通話Ciに対する到達確率Pijを導出し、導出した到達確率Pijで、記憶部24に保持されている到達確率P(i-1)jを更新する。
1−2−4.詐欺進行度出力部の動作
詐欺進行度出力部214は、到達確率導出部213が導出した到達確率Pijに応じた内容の詐欺進行度情報を出力する。すなわち、詐欺進行度出力部214を実現するCPU21は、到達確率導出手段により導出された到達確率に基づいて、詐欺が進行している度合いである詐欺進行度を判定し、判定した当該詐欺進行度に応じた情報を出力する詐欺進行度出力手段として機能する。
記憶部24には、予め閾値が記憶されている。詐欺進行度出力部214は、到達確率導出部213が導出した到達確率Pijから情報エントロピーSijを導出し、情報エントロピーSijと、記憶部24に記憶された閾値とを比較して、情報エントロピーSijが閾値を超えている場合に、通話Ciにより詐欺のステージjに到達したと判断する。ここで、情報エントロピーSijとは、到達確率Pijに対して次式(7)で求まる値のことである。
詐欺進行度出力部214は、到達確率導出部213が導出した到達確率Pijに応じた内容の詐欺進行度情報を出力する。すなわち、詐欺進行度出力部214を実現するCPU21は、到達確率導出手段により導出された到達確率に基づいて、詐欺が進行している度合いである詐欺進行度を判定し、判定した当該詐欺進行度に応じた情報を出力する詐欺進行度出力手段として機能する。
記憶部24には、予め閾値が記憶されている。詐欺進行度出力部214は、到達確率導出部213が導出した到達確率Pijから情報エントロピーSijを導出し、情報エントロピーSijと、記憶部24に記憶された閾値とを比較して、情報エントロピーSijが閾値を超えている場合に、通話Ciにより詐欺のステージjに到達したと判断する。ここで、情報エントロピーSijとは、到達確率Pijに対して次式(7)で求まる値のことである。
記憶部24には、詐欺のステージ毎に、そのステージが進行するに従って目立つ表示となるように設定された注意や警告等の画像を表すデータが記憶されている。詐欺進行度出力部214は、到達した詐欺のステージのうち、最大のものに対応するデータを記憶部24から読み出し、そのデータに応じた画像を表示部26に表示させる。
到達確率Pijをそのまま進行度として利用すると、ステージが進めば進むほど確率の積算により得られる数値が小さくなるため、各ステージに共通した閾値を設定しづらいが、このように到達確率Pijから情報エントロピーSijを導出し、進行度として利用することで、共通した閾値を設定することが容易になる。例えば閾値を0.1、詐欺のステージを最大4として、入力された通話Ciによって導出された到達確率が、Pi1=0.5、Pi2=0.2、Pi3=0.1、Pi4=0.01であったとする。この場合、対数の底を10とした情報エントロピーは、小数点以下2桁で丸めると、
ステージ1の進行度:Si1=−(Pi1)log10(Pi1)=0.15
ステージ2の進行度:Si2=−(Pi2)log10(Pi2)=0.14
ステージ3の進行度:Si3=−(Pi3)log10(Pi3)=0.1
ステージ4の進行度:Si4=−(Pi4)log10(Pi4)=0.02
となる。従って、詐欺進行度出力部214は、ステージ3まで進んでいると判断して、ステージ3に応じた表示を行う。なお、詐欺進行度出力部214は、表示部26による表示に加えて又は代えて、音声変換部28のスピーカ282に、詐欺の進行度合に応じた警告音等を、詐欺進行度情報として出力するようにしてもよい。また、詐欺進行度出力部214は、詐欺進行度情報の出力として、強制的に通話を切断したり、その通話の発信番号からの初呼に対する着信を拒否するように携帯電話機2の設定を変更したり、予め記憶されたアドレスへ警告を示す電子メールを送信したり、詐欺発生を示すための予め定められた信号を警察へ通知したりしてもよい。
ステージ1の進行度:Si1=−(Pi1)log10(Pi1)=0.15
ステージ2の進行度:Si2=−(Pi2)log10(Pi2)=0.14
ステージ3の進行度:Si3=−(Pi3)log10(Pi3)=0.1
ステージ4の進行度:Si4=−(Pi4)log10(Pi4)=0.02
となる。従って、詐欺進行度出力部214は、ステージ3まで進んでいると判断して、ステージ3に応じた表示を行う。なお、詐欺進行度出力部214は、表示部26による表示に加えて又は代えて、音声変換部28のスピーカ282に、詐欺の進行度合に応じた警告音等を、詐欺進行度情報として出力するようにしてもよい。また、詐欺進行度出力部214は、詐欺進行度情報の出力として、強制的に通話を切断したり、その通話の発信番号からの初呼に対する着信を拒否するように携帯電話機2の設定を変更したり、予め記憶されたアドレスへ警告を示す電子メールを送信したり、詐欺発生を示すための予め定められた信号を警察へ通知したりしてもよい。
1−2−5.到達確率保持部の動作
到達確率保持部215は、到達確率導出部213が導出した到達確率Pijを記憶する手段であり、記憶部24によって実現される。すなわち、到達確率保持部215を実現する記憶部24は、到達確率導出手段により導出された到達確率を保持する到達確率保持手段として機能する。
到達確率保持部215は、到達確率導出部213が導出した到達確率Pijを記憶する手段であり、記憶部24によって実現される。すなわち、到達確率保持部215を実現する記憶部24は、到達確率導出手段により導出された到達確率を保持する到達確率保持手段として機能する。
上述した第一実施形態によれば、例えば、詐欺がそれほど進行していない段階では、通話ログを取得するだけとし、詐欺が進行していけば、第三者への通知、通話の遮断等、徐々に対策を重くしていく等の処理を行うことができる。こうすることで、詐欺の進行度が低く、話者が自力で対処可能な状態の場合や、そもそも詐欺と類似しているだけの別の通話であった場合には、話者へ煩わしさを感じさせない軽めの対処が可能となる。また、詐欺の進行度が高く話者が騙されている可能性が高い場合や、明らかに詐欺と思われる通話がなされている場合には、相応に強めの対処を行うことが可能となる。すなわち、通話の利便性の確保と、詐欺の抑止とを両立することができる。
2.第二実施形態
次に、本発明の第二実施形態である詐欺進行度判定システムについて説明する。以下、第一実施形態と共通する点については説明を省略し、携帯電話機2の機能に係る相違点について主に説明する。
次に、本発明の第二実施形態である詐欺進行度判定システムについて説明する。以下、第一実施形態と共通する点については説明を省略し、携帯電話機2の機能に係る相違点について主に説明する。
図10は、第二実施形態に係る携帯電話機2の機能的構成を示す図である。同図に示すように、携帯電話機2は、第三辞書242を生成する第三辞書生成部216を備える。この第三辞書生成部216は、CPU21がプログラムを実行することによって実現される。ここでいう第三辞書242とは、携帯電話機2を用いた時系列の最新の通話を除く一連の通話、つまり、最新の通話の前に行われた1又は複数回の一連の通話から抽出された、その全ての通話の特徴を表している。この特徴とは、例えば通話がなされているときの話題である。到達確率導出部213は、このような第三辞書242を利用して、携帯電話機2を用いた新しい通話に対して特定されたその通話の特徴と、その携帯電話機2においてその新しい通話の前に行われた1又は複数回の通話についての第三の辞書が表す特徴とが重複している割合を加味して、到達確率を導出する。具体的な加味の仕方としては、例えば、通話が第三辞書242で定義されるような特徴を多く含む場合には、到達確率を導出する際に、個別確率の影響を強く反映させ、そうでない場合には弱く反映させるというものが考えられる。これは以下の理由による。
劇団型の詐欺において、数時間に渡って複数回の通話が行われる際を想定すると、詐欺に係る一連の通話だけではなく、詐欺とは関係ない通常の通話が混ざる可能性もある。新たに入力された通話が、もし現在進行中の詐欺と関係ない通話であれば、その通話による個別確率は、到達確率へ反映されるべきではない。そのために、現在進行中の詐欺通話の特徴を、第三辞書242として表し、新たに入力された通話がこの特徴を有するかどうかによって、その通話がその詐欺に関係したものであるかを判定する。
通話が入力された場合に、到達確率がどのように導出されるかについて説明する。第一実施形態と同様に、i番目の通話が入力されると、通話の音声は音声変換部28によって1つの音声ファイルにまとめられて、通話解析部211に送られる。通話解析部211は、音声変換部28から送られた音声ファイルから、単語を抽出する。第三辞書生成部216は、通話解析部211が抽出した単語を、一旦、記憶部24に記憶する。そして、第三辞書生成部216は、1番目から(i−1)番目までの通話について記憶部24に記憶させた単語と、記憶部24に記憶されている第二辞書241を用いて、第三辞書242を生成し、記憶部24に記憶する。この第三辞書242は、1番目の通話である通話C1から(i−1)番目の通話である通話Ci-1までの一連の通話の全てから抽出される特徴であり、具体的には、通話C1から通話Ci-1までに含まれる単語群から特定される、通話における話題である。すなわち、第三辞書242が記憶される記憶部24は、同一の通信装置を用いた時系列の1又は複数回の通話を解析して当該1又は複数回の通話の全てに含まれる特徴を特定し、当該特徴を表す第三の辞書を記憶する第二の記憶手段として機能する。
二つの文書間での話題の類似性を測る方法の一つとして、両文書の特徴ベクトルを導出し、そのコサイン相関値をとることで類似度とする方法がある。例えば、通話C1から通話Ci-1で構成される一連の通話を一つの文書とした場合に、話者の一般的な通話の特徴を表す辞書として、第二辞書241を利用すれば、TF(Term Frequency)−IDF (Inverse Document Frequency)解析により、一連の通話の特徴語列Ui(ui1、ui2、…、uim、…、uiM)に対応する重み付き特徴語列Vi(vi1、vi2、…、vim、…、viM)が求まる。なお、特徴語uimとは、第二辞書241への出現頻度と比較して、一連の通話に頻出する単語のことであり、重み付き特徴語vimは、その出現頻度により各特徴語に重み付けを行ったものである。端的に言うと、被比較文書が、これらM個の特徴語列を含めば、それだけ話題が近いことになり、大きな重みを持つ特徴語を含めば含むほど、さらに話題が近いこととなる。なお、ここで抽出されたM個の特徴語列は、一連の通話中に存在する全ての単語より、重み付けの大きいものから順に抽出されたものである。第三辞書242は、例えば上記の特徴語列Viで表されるものとする。
そして、到達確率導出部213は、第三辞書242で特徴付けられる話題が、i番目の通話である通話Ciの話題とどの程度類似しているかによって、対応する個別確率pijが到達確率Pijに与える影響を決定する。より具体的には、到達確率導出部213は、被比較文書である通話Ciからクエリー列Qi(qi1、qi2、…、qim、…、qiM)を導出する。Qiの各要素は、通話Ciが特徴語uimを含んだ場合は1、uimを含まない場合は0である。従って、通話Ciが第三辞書242で表される特徴をどれだけ有するかを表す類似度をaiとして、両者のベクトルのコサイン相関値で表すと、類似度aiは下記の式(8)で求まる。
到達確率導出部213は、導出された類似度aiを利用して到達確率Pijへ、重み付けを行う。例えば、上述した式(6)に類似度aiを利用した以下の式(9)のように重み付けを行う。これにより、類似度aiが小さいほど、到達確率Pijの影響が小さくなり、相対的に第二の到達確率がそのまま第一の到達確率として反映されることとなる。
上述した第二実施形態によれば、携帯電話機2は、第三辞書242を参照して、新たに入力された通話が現在進行中の詐欺通話の特徴を有するかどうかを評価することができる。そして、その通話が現在進行中の詐欺と関係ない通話である可能性が高い場合には、その通話による個別確率が、到達確率へ反映され難くなるように、調整することができる。
3.第三実施形態
次に、本発明の第三実施形態である詐欺進行度判定システムについて説明する。以下、第一実施形態と共通する点については説明を省略し、携帯電話機2の機能に係る相違点について主に説明する。
次に、本発明の第三実施形態である詐欺進行度判定システムについて説明する。以下、第一実施形態と共通する点については説明を省略し、携帯電話機2の機能に係る相違点について主に説明する。
ステージ1への到達確率Pi1が極めて低い場合には、一連の通話によって詐欺は発生していないか、すでに終了している可能性が高い。なぜなら、最初のステージへの到達確率が低い場合、その後のステージへの到達確率も同様に低くなるため、後のステージへ進行している確率はさらに低くなり、結果として詐欺である可能性が低くなる、という理由による。この点に着目し、第三実施形態では次のような構成を採る。
図11は、第三実施形態に係る携帯電話機2の機能的構成を示す図である。同図に示すように、携帯電話機2は、CPU21がプログラムを実行することによって実現される初期化処理判定部217を備える。初期化処理判定部217は、通話Ciについて、最初のステージ1への到達確率Pi1が閾値よりも小さい場合に、詐欺進行度出力部214に初期化識別子を送る。詐欺進行度出力部214は、到達確率導出部213により導出された到達確率Pijに、受け取った初期化識別子を付与する。これにより、例えば、最初のステージへ到達している確率が極めて低い場合には、進行中の詐欺はないものと見做し、その旨を出力する。
また、初期化処理判定部217は、通話Ciに対応する詐欺の最初のステージ、すなわちステージ1への到達確率Pi1が閾値よりも小さい場合に、到達確率導出部213に初期化識別子を送る。到達確率導出部213は、初期化識別子を受け取ると、ステージ1への到達確率Pi1以外の到達確率の導出を中止し、(i−1)番目の通話Ci-1の際に導出された到達確率P(i-1)jが、到達確率Pi1に代入される。すなわち、到達確率導出部213は、詐欺を構成する複数の過程のうち最初の過程に到達している到達確率として導出された値が閾値以下であった場合には、当該最初の過程以外の過程に到達している到達確率を導出しない到達確率導出部として機能する。
例えば、ステージ1への到達確率Pi1の閾値を0.1と定めた場合には、到達確率導出部213により導出されたステージ1への到達確率Pi1が0.1よりも小さいと、詐欺進行度出力部214は初期化識別子を出力する。具体的には、CPU21により表示部26に、例えば「詐欺が進行している可能性はありません」というような、現在の通話により進行する詐欺がないことを示す文字列が表示される。これにより話者は、一連の通話による詐欺は終了している、あるいは開始されていないと判断し、無駄な対策を施さなくて済む。また、到達確率導出部213は到達確率の導出を中止するため、携帯電話機2における計算負荷が抑制される。なお、上記の例においてi=1の場合は、そもそも詐欺が発生していないと見做される。
上述した第三実施形態によれば、詐欺が開始されていない場合には、計算負荷を抑制するとともに、詐欺を防止するための対策を行わないようにして、利用者が感じる煩わしさを抑えることができる。
4.第四実施形態
次に、本発明の第四実施形態である詐欺進行度判定システムについて説明する。以下、第一実施形態と共通する点については説明を省略し、携帯電話機2の機能に係る相違点について主に説明する。
次に、本発明の第四実施形態である詐欺進行度判定システムについて説明する。以下、第一実施形態と共通する点については説明を省略し、携帯電話機2の機能に係る相違点について主に説明する。
図12は、第四実施形態に係る携帯電話機2の機能的構成を示す図である。同図に示すように、携帯電話機2は、CPU21がプログラムを実行することによって実現される傾向付与部218を備える。傾向付与部218は、詐欺の傾向により、傾向付与情報を生成する。この傾向付与情報は、詐欺進行度出力部214が到達確率から詐欺進行度情報を生成する際に、詐欺の傾向に応じて、その詐欺進行度情報に特定の傾向を付与されるものである。
付与する傾向の一例として、詐欺開始からの時間を考慮した例を以下に示す。一般に、振り込め詐欺は、人を自動的処理に陥れることで騙すことを特徴としているため、被害者側に多くの時間を与えすぎると、被害者が騙されていることに気付くことが可能である。また、実際には起きていないトラブルを基にして騙すため、時間が経つことで、被害者とその家族との連絡がとれて、被害者が詐欺に気付くことが可能である。上記を考えると、実際に行われた振り込め詐欺は、ある一定の時間内に収まっている可能性が高い。逆に、開始から一定の時間が経過したにも係わらず、ステージが進行していない一連の通話は、詐欺ではないか既に被害者が詐欺であることに気付いている可能性が高い。そこで、振り込め詐欺として見做されている一連の通話が開始してからの時間に応じて、詐欺進行度情報に対し、時間が経てば経つほど、詐欺進行度情報が小さくなるような傾向を付与する。
このような傾向の導出方法の一例を示す。
辞書生成装置1の詐欺通話群記憶領域140−1〜4のそれぞれに記憶されている過去の詐欺通話の音声ファイルには、その詐欺通話の開始時刻および終了時刻と、前後の詐欺通話の音声ファイルを特定する情報とが、それぞれ記述されている。例えば、詐欺通話群記憶領域140−1に記憶されている詐欺通話C001は、開始時刻が2009年5月4日の「18時35分」で、終了時刻が同日の「18時47分」であり、次のステージ2の詐欺通話は、詐欺通話群記憶領域140−2に記憶されている詐欺通話C002であり、さらに、詐欺通話C002は、開始時刻が同日の「18時52分」でと終了時刻が同日の「19時01分」であるような場合、詐欺通話の前後関係を辿ることで、4つのステージで一つの詐欺を構成する各詐欺通話が、詐欺の開始時刻からどれくらいの時間が経過した時刻に開始/終了したかがわかる。
辞書生成装置1の詐欺通話群記憶領域140−1〜4のそれぞれに記憶されている過去の詐欺通話の音声ファイルには、その詐欺通話の開始時刻および終了時刻と、前後の詐欺通話の音声ファイルを特定する情報とが、それぞれ記述されている。例えば、詐欺通話群記憶領域140−1に記憶されている詐欺通話C001は、開始時刻が2009年5月4日の「18時35分」で、終了時刻が同日の「18時47分」であり、次のステージ2の詐欺通話は、詐欺通話群記憶領域140−2に記憶されている詐欺通話C002であり、さらに、詐欺通話C002は、開始時刻が同日の「18時52分」でと終了時刻が同日の「19時01分」であるような場合、詐欺通話の前後関係を辿ることで、4つのステージで一つの詐欺を構成する各詐欺通話が、詐欺の開始時刻からどれくらいの時間が経過した時刻に開始/終了したかがわかる。
また、携帯電話機2において、到達確率導出部213が、i番目に入力された通話Ciに対して、詐欺のステージjに対応する到達確率Pijを導出すると、詐欺進行度出力部214は、通話Ciがステージjの詐欺通話と仮定した場合にステージ1の詐欺通話に相当する通話が開始された時点から、通話Ciが終了するまでの経過時間tを算出する。この経過時間tは、通話Ciが終了するまでに携帯電話機2を用いて行われた詐欺を構成するステージに相当する全通話の期間である。
ここで、上記4つの詐欺通話で構成される詐欺の標本総数Xに対し、開始からの経過時間tの時点で持続している詐欺の数をf(t)とする。この場合、時間t以上続く詐欺の割合をB(t)とすると、B(t)=f(t)/Xとなる。詐欺の経過時間が、過去と同様の傾向があるとすると、現在評価中の一連の通話について、これが詐欺である確率についても、B(t)と見做しても良い。そこで、到達確率PijにB(t)を乗じることで詐欺進行度情報とする。すなわち、詐欺進行度出力部214を実現するCPU21は、通信端末を用いた通話に対して到達確率導出部213により導出された到達確率に、当該通信端末を用いて行われた詐欺を構成する過程に相当する全通話の期間を加味して、詐欺進行度を判定する詐欺進行度出力手段として機能する。この場合、到達確率Pijに乗じる「Bj(t)」が、詐欺進行度出力部214が到達確率から詐欺進行度情報を生成する際に、詐欺の傾向に応じて、その詐欺進行度情報に付与される傾向付与情報である。
上述した第四実施形態によれば、過去の履歴に基づいて、現在評価中の一連の通話について、その開始からの経過時間が長くなる程、到達確率Pijが小さくなるような傾向を付与することが可能となる。
5.変形例
以上が実施形態の説明であるが、この実施形態の内容は以下のように変形し得る。また、以下の変形例を組み合わせてもよい。
以上が実施形態の説明であるが、この実施形態の内容は以下のように変形し得る。また、以下の変形例を組み合わせてもよい。
(1)上述した実施形態において、「通話」とは、或る通信回線が確立してから切断されるまでの、その通信回線を介した会話である、としていたが、携帯電話機2の利用者に対して通信回線を介して話しかける人物を特定し、その特定した人物毎にその会話を分割して、分割されたそれぞれの会話を「通話」として処理してもよい。例えば、上記の人物を声の特徴によって特定する場合、携帯電話機2のCPU21は、会話を録音した音声ファイルから声紋を抽出し、抽出した声紋を文章毎に比較する。そして、比較の結果、その声紋が切替ったことを検知すると、携帯電話機2のCPU21は、それまでの会話とそれ以降の会話を別の「通話」として処理してもよい。
詐欺のステージが進行したことを示す特徴には、そこで語られる話題の変化のほかに、登場人物の変化が挙げられる。そして、同じ通信回線を介した会話であっても、複数の犯人が同じ通話口にいて、電話を受け渡すことで会話の相手が切替ることがあり、このようなときには、詐欺のステージが進行する場合が多い。上述のように、抽出した声紋の変化を検知することで、携帯電話機2のCPU21は、詐欺のステージをより正確に判定することができる。
(2)上述した実施形態において、個別確率導出部212は、通話から抽出された全ての単語について導出された単語毎の個別確率を結合し、その通話がステージ1〜4の詐欺通話である確率を導出していたが、個別確率導出部212が結合する単語毎の個別確率は、通話から抽出された全ての単語について導出されたものでなくてもよい。例えば、個別確率導出部212は、予め定められた個数の単語について導出された単語毎の個別確率を結合して通話毎の個別確率を導出してもよい。また、個別確率導出部212は、単語毎の個別確率によって定まる値と、予め定められた閾値とを比較し、比較結果に応じて、結合する単語毎の個別確率を選択してもよい。この場合、単語毎の個別確率によって定まる値とは、例えば、単語毎の個別確率と0.5との差の絶対値等である。
例えば、個別確率導出部212は、抽出された全ての単語のうち、特徴的な単語を予め定められた個数として15個だけ特定する。そして、個別確率導出部212は、それらの単語毎の個別確率を結合して、その通話がステージ1〜4の詐欺通話である確率を導出してもよい。なお、個別確率導出部212は、具体的には、全てのステージの詐欺通話毎に、全ての単語について「単語毎の個別確率と0.5との差の絶対値」を算出し、この値の大きい単語から順に15個を「特徴的な単語」として特定する。また、詐欺のステージは4つに限られず、3以下であっても、5以上であってもよい。
(3)上述した実施形態において、単語wikが出現した通話Ciがステージjの通話である確率を示す「単語毎の個別確率」pij(wik)を導出するに際し、個別確率導出部212は、その単語wikがステージjの詐欺通話に出現する回数により定まる単語出現係数φikjを、その単語出現係数φikjと、その単語wikが非詐欺通話に出現する回数により定まる単語出現係数φik0との和で除算した値として導出していたが、これに限られない。例えば、個別確率導出部212は、単語毎の個別確率を、次の式(10)に従って導出してもよい。
上述の式(10)は、単語wikがステージjの詐欺通話に出現する回数により定まる単語出現係数φikjを、その単語wikが詐欺通話に出現する回数により定まる単語出現係数の総和(Jはステージの総数)と、その単語wikが非詐欺通話に出現する回数により定まる単語出現係数φik0との和で除算した値として、単語毎の個別確率pij(wik)を導出することを示している。つまり、ステージj以外の詐欺通話に係る単語出現係数は、ステージjに係る単語毎の個別確率を低下させる要素になる。したがって、この式(10)においては、或る単語について、非詐欺通話に係る単語出現係数が高い場合に、その単語が出現する通話がそのステージの詐欺通話である個別確率は低くなるだけでなく、ステージj以外の詐欺通話に係る単語出現係数が高い場合にも、個別確率は低くなる。これにより、通話が詐欺の各ステージのいずれであるかがより明確に判定される。
なお、通話によっては、複数のステージを進行するものも存在する場合がある。このような通話について、上述した単語毎の個別確率の導出方法を採用すると、その通話によって進行するステージのそれぞれの特徴が、互いに個別確率を低下させる可能性がある。
そこで、1つのステージの詐欺通話に係る「単語毎の個別確率」と、複数のステージを含む詐欺通話に係る「単語毎の個別確率」とをそれぞれ別に算出してもよい。
そこで、1つのステージの詐欺通話に係る「単語毎の個別確率」と、複数のステージを含む詐欺通話に係る「単語毎の個別確率」とをそれぞれ別に算出してもよい。
例えば、単語wikが出現した通話Ciがステージxからステージyまで進行する通話である確率を示す「単語毎の個別確率」を、pi{x,y}(wik)とする。個別確率導出部212は、この単語毎の個別確率pi{x,y}(wik)を、次の式(11)に従って導出する。
上述の式(11)は、単語wikがステージxからステージyまでの詐欺通話に出現する回数によりそれぞれ定まる単語出現係数の総和を、その単語wikが詐欺通話に出現する回数により定まる単語出現係数の総和(Jはステージの総数)と、その単語wikが非詐欺通話に出現する回数により定まる単語出現係数φik0との和で除算した値として、単語毎の個別確率pi{x,y}(wik)を導出することを示している。つまり、ステージxからステージyまでの詐欺通話以外の詐欺通話に係る単語出現係数は、ステージxからステージyまでの詐欺通話に係る単語毎の個別確率を低下させる要素になる。
このような開始ステージxと終了ステージyの組み合わせの数は、異なるステージの総数であるJから2つの異なるステージx、yを選択する組み合わせに等しいから、重複を持たない組み合わせの計算により、JC2=(J!)/(2!・(J−2)!)で算出される。例えば、J=4では、4C2と=4!/(2!・2!)=6である。これは、開始ステージxと終了ステージyの組み合わせを{x,y}と表記すると{1,4}、{1,3}、{1,2}、{2,4}、{2,3}、{3,4}の6通りであることを示している。
個別確率導出部212は、これら全ての組み合わせについて単語毎の個別確率pi{x,y}(wik)を導出してもよいが、これらのうちの一部についてのみ導出してもよい。例えば、1つの通話によって、閾値以上のステージが進行することが考え難い場合には、個別確率導出部212は、この閾値未満のステージが進行する通話についてのみ、単語毎の個別確率pi{x,y}(wik)を導出するようにすればよい。
(4)上述した実施形態において、到達確率Pijは、上述した式(6)又は式(9)により導出されたが、一回の通話で進行するステージの数に応じて重み係数を乗じるようにしてもよい。例えば、到達確率Pijは、次式(12)に従って導出されてもよい。
ここで、bjは、今回の通話Ciのみによってステージ1からステージjに到達した到達確率Pbに対して、そのステージ数(=j)に応じて予め定められた定数や、jによって定まる関数である。また、dsは、前回の通話Ci-1までにステージs(s<j)に到達し、今回の通話Ciによりステージ(s+1)からステージjに到達した到達確率Pcに対して、そのsに応じて予め定められた定数や、sによって定まる関数である。
これにより、1つの通話によって、閾値以上のステージが進行することが起こり難い場合に、この起こり難さを到達確率に反映することができる。
これにより、1つの通話によって、閾値以上のステージが進行することが起こり難い場合に、この起こり難さを到達確率に反映することができる。
(5)上述した実施形態において、辞書生成装置1の第一辞書生成部111及び第二辞書生成部112は、各ステージjに該当する詐欺通話や非詐欺通話の音声ファイルから出現する単語を抽出して、その単語の出現回数と対応付けて第一辞書または第二辞書として記憶していたが、第一辞書及び第二辞書に記憶する情報はこれに限られない。例えば、同じ単語であっても実際に発音されたときのトーンや速度等の「発音の特徴」が異なっている場合がある。そこで、音声ファイルから抽出した単語毎にスペクトログラムを生成し、このスペクトログラムを予め定めた閾値や、予め定めたスペクトログラムと比較して、単語を複数の発音類型毎に分類してもよい。なお、スペクトログラムを解析することにより、泣き声や怒号等、単語以外の声の調子も発音の特徴として特定して、この発音の特徴を第一辞書ないし第二辞書に記憶する情報としてもよい。
(6)また、上述した第二実施形態において、第三辞書生成部216は、一連の通話の音声ファイルから単語を抽出することにより、これらの通話がなされているときの話題をその特徴として、第三辞書242に記憶するが、一連の詐欺通話の特徴は、抽出された単語に限られず、上述したように発音の特徴によるものであってもよい。
(7)また、第四実施形態において、付与する傾向の一例として、詐欺開始からの時間を考慮した例を挙げたが、付与する傾向はこれに限られない。例えば、上述したように発音の特徴に応じて、予め定められた傾向を付与してもよい。
(8)第四実施形態の詐欺進行度情報は、詐欺のステージ毎に決定してもよい。この場合、詐欺のステージ毎の標本総数Xjに対して、そのステージの詐欺通話が持続している数をfj(t)とする。そして、現在評価中の一連の通話について、これがステージjの詐欺通話である確率をBj(t)=fj(t)/Xjとして算出し、到達確率PijにBj(t)を乗じることで詐欺進行度情報とすればよい。これにより、過去の履歴と比べて、詐欺のステージの進行が異なっている程、到達確率Pijが小さくなるような傾向を付与することが可能となる。
(9)辞書生成装置1のCPU11や、携帯電話機2のCPU21によって実行される各プログラムは、磁気テープや磁気ディスク等の磁気記録媒体、光ディスク等の光記録媒体、光磁気記録媒体、半導体メモリ等の、コンピュータ装置が読み取り可能な記録媒体に記憶された状態で提供し得る。また、このプログラムを、インターネットのようなネットワーク経由でダウンロードさせることも可能である。なお、このような制御を行う制御手段としてはCPU以外にも種々の装置を適用することができ、例えば、専用のプロセッサ等を用いてもよい。
(10)また、通話解析部211、個別確率導出部212、到達確率導出部213、詐欺進行度出力部214、及び到達確率保持部215の各機能は、携帯電話機2に備えられていなくてもよい。例えば、インターネット等のネットワーク3に接続された専用のサーバである詐欺進行度判定装置によって、これらの機能の全部又は一部を実行させ、携帯電話機2と情報の遣り取りを行うことで、携帯電話機2の表示部26に警告等を表示するようにしてもよい。またこの詐欺進行度判定装置は、辞書生成装置1が兼ねてもよい。
1…辞書生成装置、11…CPU、12…ROM、13…RAM、14…記憶部、15…通信部、111…第一辞書生成部、112…第二辞書生成部、140…詐欺通話群記憶領域、141…非詐欺通話群記憶領域、142…電話番号、2…携帯電話機、21…CPU、22…ROM、23…RAM、24…記憶部、25…通信部、26…表示部、27…操作部、28…音声変換部、211…通話解析部、212…個別確率導出部、213…到達確率導出部、214…詐欺進行度出力部、215…到達確率保持部、216…第三辞書生成部、217…初期化処理判定部、218…傾向付与部、240…第一辞書、241…第二辞書、242…第三辞書、281…マイク、282…スピーカ、3…ネットワーク、9…詐欺進行度判定システム。
Claims (11)
- 通信装置を用いた通話を解析して当該通話の特徴を特定する通話解析手段と、
前記通話解析手段によって特定された前記通話の特徴に基づいて、当該通話が、詐欺を構成する複数の過程のそれぞれに属する確率である個別確率を導出する個別確率導出手段と、
前記個別確率導出手段により導出された前記個別確率に基づき、前記通話が行われた時点において、詐欺を構成する複数の過程のそれぞれに到達している確率である到達確率を導出する到達確率導出手段と、
前記到達確率導出手段により導出された前記到達確率を保持する到達確率保持手段と、
前記到達確率導出手段により導出された前記到達確率に基づいて、詐欺が進行している度合いである詐欺進行度を判定し、判定した当該詐欺進行度に応じた情報を出力する詐欺進行度出力手段とを具備し、
前記到達確率導出手段は、
第一の通話が行われたときよりも前に前記通信装置を用いて行われた第二の通話に対して導出された前記到達確率が、前記到達確率保持手段により保持されている場合には、
保持されている前記第二の通話に対する到達確率と、前記第一の通話に対して前記個別確率導出手段により導出された前記個別確率とを用いて、当該第一の通話に対する前記到達確率を導出し、導出した当該到達確率で、前記到達確率保持手段により保持されている前記到達確率を更新する
ことを特徴とする詐欺進行度判定装置。 - 詐欺を構成する各過程に相当する通話である詐欺通話の特徴を表す第一の辞書と、前記通信装置を用いた詐欺ではない通話である非詐欺通話の特徴を表す第二の辞書とを記憶する第一の記憶手段を具備し、
前記個別確率導出手段は、前記第一の記憶手段に記憶された前記第一の辞書及び前記第二の辞書によって表される特徴と、前記通話解析手段によって特定された特徴とを照合し、その照合結果に応じた前記個別確率を導出する
ことを特徴とする請求項1に記載の詐欺進行度判定装置。 - 前記第一の辞書は、前記詐欺通話から抽出された複数の単語を含み、
前記第二の辞書は、前記非詐欺通話から抽出された複数の単語を含み、
前記通話解析手段は、前記通話に含まれる単語を当該通話の特徴として特定する
ことを特徴とする請求項2に記載の詐欺進行度判定装置。 - 同一の前記通信装置を用いた時系列の1又は複数回の通話を解析して当該1又は複数回の通話の全てに含まれる特徴を特定し、当該特徴を表す第三の辞書を記憶する第二の記憶手段を具備し、
前記到達確率導出手段は、通信端末を用いた通話に対して前記通話解析手段により特定された当該通話の特徴と、当該通信端末において当該通話の前に行われた1又は複数回の通話についての前記第三の辞書が表す特徴とが重複している割合を加味して、前記到達確率を導出する
ことを特徴とする請求項1〜3のいずれか1に記載の詐欺進行度判定装置。 - 前記第三の辞書は、前記1又は複数回の通話に含まれる単語群から特定される、通話における話題を当該通話の特徴として記憶する
ことを特徴とする請求項4に記載の詐欺進行度判定装置。 - 前記到達確率導出手段は、
詐欺を構成する複数の過程のうち最初の過程に到達している前記到達確率として前記到達確率導出部により導出された値が閾値以下であった場合には、当該最初の過程以外の過程に到達している到達確率を導出しない
ことを特徴とする請求項1〜5のいずれか1に記載の詐欺進行度判定装置。 - 詐欺進行度出力手段は、前記通信端末を用いた通話に対して前記到達確率導出手段により導出された到達確率に、当該通信端末を用いて行われた詐欺を構成する過程に相当する全通話の期間を加味して、前記詐欺進行度を判定する
ことを特徴とする請求項1〜6のいずれか1に記載の詐欺進行度判定装置。 - 請求項2記載の詐欺進行度判定装置において用いられる第一の辞書及び第二の辞書を生成する辞書生成装置であって、
詐欺を構成する複数の過程のそれぞれについて分類された、詐欺に関する通話である詐欺通話から、当該過程毎に当該詐欺通話の特徴を抽出し、当該特徴を表す第一の辞書を生成する第一辞書生成手段と、
通信端末を用いた通話の話者毎に分類された、当該話者による、詐欺でない通話である非詐欺通話から、当該非詐欺通話の特徴を抽出し、当該特徴を表す第二の辞書を生成する第二辞書生成手段と、
を具備することを特徴とする辞書生成装置。 - 前記第一の辞書は、前記詐欺通話から抽出された複数の単語を含み、
前記第二の辞書は、前記非詐欺通話から抽出された複数の単語を含む
ことを特徴とする請求項8に記載の辞書生成装置。 - 詐欺の進行度を判定する詐欺進行度判定装置が行う詐欺進行度判定方法であって、
通信装置を用いた通話を解析して当該通話の内容の特徴を特定する通話解析ステップと、
前記通話解析ステップにおいて特定された特徴に基づいて、前記通話が、詐欺を構成する複数の過程のうちのそれぞれに属する確率である個別確率を導出する個別確率導出ステップと、
前記個別確率導出ステップにおいて導出された前記個別確率に基づき、前記通話が行われた時点において、詐欺を構成する複数の過程のそれぞれに到達している確率である到達確率を導出する到達確率導出ステップと、
前記到達確率導出ステップにおいて導出された前記到達確率を保持する到達確率保持ステップと、
前記到達確率導出ステップにおいて導出された前記到達確率に基づいて、詐欺が進行している度合いである詐欺進行度を判定し、判定した当該詐欺進行度に応じた情報を出力する詐欺進行度出力ステップとを具備し、
前記到達確率導出ステップにおいて、
第一の通話が行われたときよりも前に前記通信装置を用いて行われた第二の通話に対して導出された前記到達確率が、前記到達確率保持ステップにより保持されている場合には、
保持されている前記第二の通話に対する到達確率と、前記第一の通話に対して前記個別確率導出ステップにより導出された前記個別確率とを用いて、当該第一の通話に対する前記到達確率を導出し、導出した当該到達確率で、前記到達確率保持ステップにより保持されている前記到達確率を更新する
ことを特徴とする詐欺進行度判定方法。 - 請求項2記載の詐欺進行度判定装置において用いられる第一の辞書及び第二の辞書を生成する辞書生成方法であって、
詐欺を構成する複数の過程のそれぞれについて分類された、詐欺に関する通話である詐欺通話から、当該過程毎に当該詐欺通話の特徴を抽出し、当該特徴を表す第一の辞書を生成する第一辞書生成ステップと、
通信端末を用いた通話の話者毎に分類された、当該話者による、詐欺でない通話である非詐欺通話から、当該非詐欺通話の特徴を抽出し、当該特徴を表す第二の辞書を生成する第二辞書生成ステップと、
を具備することを特徴とする辞書生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009123455A JP2010273130A (ja) | 2009-05-21 | 2009-05-21 | 詐欺進行度判定装置、辞書生成装置、詐欺進行度判定方法及び辞書生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009123455A JP2010273130A (ja) | 2009-05-21 | 2009-05-21 | 詐欺進行度判定装置、辞書生成装置、詐欺進行度判定方法及び辞書生成方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010273130A true JP2010273130A (ja) | 2010-12-02 |
Family
ID=43420805
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009123455A Pending JP2010273130A (ja) | 2009-05-21 | 2009-05-21 | 詐欺進行度判定装置、辞書生成装置、詐欺進行度判定方法及び辞書生成方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010273130A (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012156664A (ja) * | 2011-01-25 | 2012-08-16 | Megatrend Co Ltd | 電話機用振込め詐欺防止装置 |
JP2012159596A (ja) * | 2011-01-31 | 2012-08-23 | Internatl Business Mach Corp <Ibm> | 情報処理装置、情報処理方法、情報処理システム、およびプログラム |
JP2015154475A (ja) * | 2014-02-19 | 2015-08-24 | 岩崎通信機株式会社 | 振り込め詐欺防止システム |
WO2015194148A1 (ja) * | 2014-06-17 | 2015-12-23 | 日本電気株式会社 | 発信者特定装置、発信者特定方法、および発信者特定プログラムを格納する記録媒体 |
JP2016178507A (ja) * | 2015-03-20 | 2016-10-06 | Kddi株式会社 | 詐欺被害警告装置、及びプログラム |
JP2020036231A (ja) * | 2018-08-30 | 2020-03-05 | 株式会社Mgcテクノロジー | サーバ装置、制御プログラム、及び制御方法 |
WO2022107242A1 (ja) * | 2020-11-18 | 2022-05-27 | 日本電信電話株式会社 | 処理装置、処理方法およびプログラム |
-
2009
- 2009-05-21 JP JP2009123455A patent/JP2010273130A/ja active Pending
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012156664A (ja) * | 2011-01-25 | 2012-08-16 | Megatrend Co Ltd | 電話機用振込め詐欺防止装置 |
JP2012159596A (ja) * | 2011-01-31 | 2012-08-23 | Internatl Business Mach Corp <Ibm> | 情報処理装置、情報処理方法、情報処理システム、およびプログラム |
JP2015154475A (ja) * | 2014-02-19 | 2015-08-24 | 岩崎通信機株式会社 | 振り込め詐欺防止システム |
WO2015194148A1 (ja) * | 2014-06-17 | 2015-12-23 | 日本電気株式会社 | 発信者特定装置、発信者特定方法、および発信者特定プログラムを格納する記録媒体 |
JPWO2015194148A1 (ja) * | 2014-06-17 | 2017-04-20 | 日本電気株式会社 | 発信者特定装置、発信者特定方法、および発信者特定プログラムを格納する記録媒体 |
US9860373B2 (en) | 2014-06-17 | 2018-01-02 | Nec Corporation | Caller identification apparatus, caller identification method, and recording medium on which caller identification program has been stored |
JP2016178507A (ja) * | 2015-03-20 | 2016-10-06 | Kddi株式会社 | 詐欺被害警告装置、及びプログラム |
JP2020036231A (ja) * | 2018-08-30 | 2020-03-05 | 株式会社Mgcテクノロジー | サーバ装置、制御プログラム、及び制御方法 |
WO2022107242A1 (ja) * | 2020-11-18 | 2022-05-27 | 日本電信電話株式会社 | 処理装置、処理方法およびプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10810510B2 (en) | Conversation and context aware fraud and abuse prevention agent | |
CN107395352B (zh) | 基于声纹的身份识别方法及装置 | |
US10142461B2 (en) | Multi-party conversation analyzer and logger | |
US8886663B2 (en) | Multi-party conversation analyzer and logger | |
US8145562B2 (en) | Apparatus and method for fraud prevention | |
JP2010273130A (ja) | 詐欺進行度判定装置、辞書生成装置、詐欺進行度判定方法及び辞書生成方法 | |
US20130177141A1 (en) | System and Method for Tracking Persons of Interest Via Voiceprint | |
CN110177182B (zh) | 敏感数据处理方法、装置、计算机设备及存储介质 | |
KR101795593B1 (ko) | 전화상담원 보호 장치 및 그 방법 | |
CN108010513B (zh) | 语音处理方法及设备 | |
CN110070875B (zh) | 一种基于语音关键词检测和声纹的反电信诈骗方法 | |
WO2021184837A1 (zh) | 诈骗电话的识别方法、装置、存储介质及终端 | |
JP6213476B2 (ja) | 不満会話判定装置及び不満会話判定方法 | |
CN107492153A (zh) | 考勤系统、方法、考勤服务器及考勤终端 | |
CN113191787A (zh) | 电信数据的处理方法、装置电子设备及存储介质 | |
WO2021051504A1 (zh) | 异常通话对象的判断方法、装置、计算机设备和存储介质 | |
CN113744742B (zh) | 对话场景下的角色识别方法、装置和系统 | |
JP2007266944A (ja) | 電話端末装置および発信者検証方法 | |
GB2584827A (en) | Multilayer set of neural networks | |
CN107291508A (zh) | 一种事项记录方法、相关设备及计算机可读存储介质 | |
CN107154996B (zh) | 来电拦截方法、装置、存储介质及终端 | |
JP6772832B2 (ja) | 犯罪判定装置、中継システム、電話システム、犯罪判定方法及びプログラム | |
WO2022107241A1 (ja) | 処理装置、処理方法およびプログラム | |
WO2022107242A1 (ja) | 処理装置、処理方法およびプログラム | |
CN109379499A (zh) | 一种语音呼叫方法及装置 |