WO2015194148A1 - 発信者特定装置、発信者特定方法、および発信者特定プログラムを格納する記録媒体 - Google Patents

発信者特定装置、発信者特定方法、および発信者特定プログラムを格納する記録媒体 Download PDF

Info

Publication number
WO2015194148A1
WO2015194148A1 PCT/JP2015/002957 JP2015002957W WO2015194148A1 WO 2015194148 A1 WO2015194148 A1 WO 2015194148A1 JP 2015002957 W JP2015002957 W JP 2015002957W WO 2015194148 A1 WO2015194148 A1 WO 2015194148A1
Authority
WO
WIPO (PCT)
Prior art keywords
voice feature
feature information
voice
caller identification
call
Prior art date
Application number
PCT/JP2015/002957
Other languages
English (en)
French (fr)
Inventor
智基 村上
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Priority to JP2016529035A priority Critical patent/JP6296159B2/ja
Priority to US15/319,237 priority patent/US9860373B2/en
Publication of WO2015194148A1 publication Critical patent/WO2015194148A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/42025Calling or Called party identification service
    • H04M3/42034Calling party identification service
    • H04M3/42059Making use of the calling party identifier
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/02Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/06Decision making techniques; Pattern matching strategies
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M11/00Telephonic communication systems specially adapted for combination with other electrical systems
    • H04M11/04Telephonic communication systems specially adapted for combination with other electrical systems with alarm systems, e.g. fire, police or burglar alarm systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/42221Conversation recording systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/18Comparators
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
    • H04M2201/405Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition involving speaker-dependent recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/60Aspects of automatic or semi-automatic exchanges related to security aspects in telephonic communication systems
    • H04M2203/6027Fraud preventions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/60Aspects of automatic or semi-automatic exchanges related to security aspects in telephonic communication systems
    • H04M2203/6045Identity confirmation

Definitions

  • the present invention relates to a caller identification device that identifies a caller, a caller identification method, and a recording medium that stores a caller identification program.
  • Patent Document 1 a voice feature (voice print or the like) of a fraudster is registered in advance in a fraudster voice database, and the voice feature of the received call voice data matches the voice feature registered in the database.
  • a technique for determining that a call is a call from a fraudster is described.
  • the personality feature amount of a close relative is registered in advance in the storage unit, and whether or not the individuality feature amount of the sender matches the personality feature amount registered in the storage unit is determined.
  • a technique is described in which when a determination is made and it is determined that they do not match, a notification to that effect (for example, an elderly person living alone) is given.
  • JP 2008-210085 A (Page Nos. 11 and 12) Japanese Patent Laying-Open No. 2005-341383 (Page Nos. 7 and 8)
  • Patent Document 2 in the case of a method in which all outgoing calls having personality feature amounts that do not match the personality feature amount of the close relative are determined to be outgoing calls from the fraudster, the call is completely blocked by the fraudster. .
  • Patent Document 2 there is a possibility that even a person who has not registered a close relative but is not a fraudster (for example, a colleague of a company who calls the person for the first time) may be judged as a fraudster.
  • the present invention has been made in order to solve the above-described problem, and is capable of discriminating between a call from a fraudster and a call from a person who is not so with higher accuracy and a caller specifying method. And a recording medium for storing a caller identification program.
  • a white list in which the first voice feature information that is the voice feature information of the close relative of the recipient is registered and the second voice feature information that is the voice feature information of the fraudster is registered.
  • the first with high nature Comprising a speech feature analyzing means for obtaining a judgment result.
  • the white list in which the first voice feature information that is the voice feature information of the relative of the recipient is registered and the second voice feature information that is the voice feature information of the fraudster are registered.
  • a black list is stored in a storage means, outgoing voice data is obtained, third voice feature information that is voice feature information of the voice data is obtained, and the third voice feature information is the first voice feature information and the voice information. It is determined whether or not the second voice feature information matches, and when the third voice feature information does not match either the first voice feature information or the second voice feature information, If the voice feature information of a plurality of persons is included in the third voice feature information, the call can be sent from the fraudster.
  • the first with high nature Characterized in that to obtain a constant result.
  • the recording medium for storing the caller identification program of the present invention includes a white list in which first voice feature information that is voice feature information of a callee's close relative is registered, and a second voice feature that is voice feature information of a fraudster.
  • a process for determining whether or not voice feature information of a plurality of persons is included in the third voice feature information; and when voice feature information of a plurality of persons is included in the third voice feature information, Above Shin is characterized by causing a computer to execute a caller identifying device and a first judgment result obtaining processed with a high probability of originating from the fraudsters.
  • FIG. 1 is a block diagram illustrating a configuration example of a call system 10 according to the first embodiment of the present invention.
  • the call system 10 includes a transmission side device 100, a reception side device 200, a related contact device 300, and a caller identification server 400 (caller identification device).
  • the originating device 100, the terminating device 200, and the related contact device 300 are connected via the telephone network 20.
  • the telephone network 20, the caller identification server 400, the receiving device 200, and the related contact device 300 are connected by a predetermined data communication network 30 (for example, the Internet).
  • the transmission side device 100 includes at least a telephone (not shown in FIG. 1) operated by the caller.
  • the incoming side device 200 includes a telephone 210 and an information terminal 220.
  • the telephone 210 is a telephone operated by a callee.
  • the information terminal 220 is a terminal (for example, a personal computer) for communicating with a device (for example, the caller identification server 400) connected to the data communication network 30.
  • the information terminal 220 includes at least a function of communicating with a device connected to the data communication network 30 and a display function of displaying predetermined information visually or by voice. For example, the information terminal 220 receives a “call type” described later from the caller identification server 400 and displays it on the screen.
  • the related contact device 300 can communicate with at least the caller identification server 400 via the data communication network 30.
  • the related contact information is, for example, the family of the recipient, a service center operated by a business providing a telephone service, the police, and the like.
  • FIG. 2 is a block diagram illustrating a configuration example of the caller identification server 400.
  • the caller identification server 400 includes a storage unit 410 (storage unit) and a voice feature analysis unit 420 (voice feature analysis unit).
  • a case where the voice feature is “voice print” will be described as an example.
  • the voice features are not limited to voiceprints.
  • the storage unit 410 stores a white list 430 and a black list 440.
  • voice feature information for example, voiceprint information
  • a close relative for example, a family member or a friend
  • voiceprint information of criminals is registered in advance.
  • the voice feature analysis unit 420 acquires the caller's voice data from the telephone network 20 via the data communication network 30.
  • the voice feature analysis unit 420 extracts voiceprint information from the acquired voice data.
  • the voice feature analysis unit 420 analyzes the extracted voiceprint information (specifically, whether or not there is a plurality of human voiceprints in one voice data and whether or not there is a match with a voiceprint registered in each list) judge.
  • the voice feature analysis unit 420 is not particularly limited in timing for analyzing the extracted voiceprint information. For example, it is preferable to perform collation at a predetermined interval (for example, every 5 seconds) to determine whether or not the speaker can be identified.
  • voiceprint information extracted during a call at the end of the call may be collectively analyzed.
  • the voice feature analysis unit 420 executes appropriate processing based on the analysis result (transmission type), as will be described later.
  • FIG. 3 is a flowchart showing an operation example of the caller identification server 400.
  • the voice feature analysis unit 420 acquires the caller's voice data from the telephone network 20 via the data communication network 30 (step S1).
  • the voice feature analysis unit 420 extracts voiceprint information from the acquired voice data (step S2).
  • the voice feature analysis unit 420 determines whether or not the extracted voice print information matches the voice print information registered in the white list 430 (step S3).
  • the voice feature analysis unit 420 sets the type of transmission to “transmission type A / second determination result” (obviously from the relatives. (Sending)) (step S4).
  • the voice feature analysis unit 420 determines whether or not the extracted voice print information matches the voice print information registered in the black list 440. Is determined (step S5).
  • the voice feature analysis unit 420 sets the type of transmission as “transmission type B / third determination result” (obviously from a fraudster. (Step S6).
  • the voice feature analysis unit 420 determines whether or not the extracted voice print information includes voice prints of a plurality of people (step). S7).
  • the voice feature analysis unit 420 sets the type of transmission as “transmission type C / first determination result” (the possibility of transmission from a fraudster is high). (Sending)) (step S8).
  • the voice feature analysis unit 420 sets the type of the transmission as “transmission type D / fourth determination result” (the possibility of transmission from a fraudster). (Low transmission)) (step S9).
  • Some scams have created scenarios in advance and have carefully decided who speaks at what timing. That is, when a plurality of people appear in a single transmission, the transmission is highly likely to be a transmission from a fraud group. However, when all of those persons are not registered in the black list, such a transmission is not determined to be a transmission from a fraudster by the method of determining a transmission based on whether or not it falls under the black list.
  • the type of transmission is classified in more detail. Specifically, it is classified into the above four types of transmission types A to D.
  • the voice feature analysis unit 420 transmits the transmission type (any of transmission types A to D) for the transmission to the information terminal 220 via the data communication network 30 (step S10).
  • the information terminal 220 displays the received call type on the screen.
  • the voice feature analysis unit 420 determines whether or not the transmission type for the transmission is a transmission type B (obviously a transmission from a fraudster) or a transmission type C (a transmission with a high possibility of transmission from a fraudster). (Step S11). If the transmission type is not transmission type B or transmission type C (No in step S11), this flow ends.
  • the voice feature analysis unit 420 transmits “warning” to the related contact device 300 (Step S12).
  • alert sending methods include, for example, emails, telephone calls, push notifications to smartphone apps, and the like.
  • the warning may be sent simultaneously to all destinations (family of the recipients, service centers operated by operators providing telephone services, police, etc.), or only one or more specific destinations May be sent to.
  • a warning can be sent only to the service center for the time being.
  • the service center communicates with the recipient, the recipient's family, the police, etc. as necessary, and takes appropriate measures to prevent fraud.
  • the type of transmission is classified in more detail. Specifically, it is classified into the above four types of transmission types A to D.
  • the voice feature analysis unit 420 consults the information terminal 220 with an action to be taken (for example, a consultation with a family member or another person other than the family member). , Consult the police, report to the call center, etc.).
  • FIG. 4 is a block diagram illustrating a configuration example of a call system 500 according to the second embodiment of the present invention.
  • the difference between the call system 500 and the call system 10 (FIG. 1) is that the telephone 210 and the information terminal 220 are connected.
  • the telephone 210 transmits the caller's voice data to the caller identification server 400 via the information terminal 220. This eliminates the need to transfer voice data from the telephone network 20 to the caller identification server 400.
  • Changing the setting of the telephone network 20 requires a lot of trouble, such as a request for cooperation from a telecommunications carrier that provides telephone services.
  • a program for realizing all or a part of the functions of the respective embodiments described above is recorded on a computer-readable recording medium, and the program recorded on the recording medium is read into a computer system and executed. The processing of each unit may be performed as necessary.
  • An example of a “computer system” is a CPU (Central Processing Unit).
  • Computer-readable recording medium is, for example, a non-transitory storage device.
  • non-temporary storage devices include a magneto-optical disk, a ROM (Read Only Memory), a portable medium such as a nonvolatile semiconductor memory, and a hard disk built in a computer system.
  • the “computer-readable recording medium” may be a temporary storage device.
  • a temporary storage device for example, a communication line in the case of transmitting a program via a network such as the Internet or a communication line such as a telephone line, or a volatile memory inside a computer system can be cited.
  • the program may be for realizing a part of the above-described functions, and may be capable of realizing the above-described functions in combination with a program already recorded in the computer system. .

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Telephonic Communication Services (AREA)
  • Alarm Systems (AREA)

Abstract

 詐欺師からの発信とそうでない人からの発信とをより高精度に峻別するために、発信者特定装置は、着信者の近親者の音声特徴情報である第1音声特徴情報が登録されるホワイトリストと、詐欺師の音声特徴情報である第2音声特徴情報が登録されるブラックリストとを記憶する記憶手段と、発信の音声データを取得し、音声データの音声特徴情報である第3音声特徴情報を求め、第3音声特徴情報が第1音声特徴情報および第2音声特徴情報と一致するか否かを判定し、第3音声特徴情報が第1音声特徴情報および第2音声特徴情報のいずれとも一致しない場合、第3音声特徴情報の中に複数の人物の音声特徴情報が含まれるか否かを判定し、第3音声特徴情報の中に複数の人物の音声特徴情報が含まれる場合、発信は前記詐欺師からの発信の可能性が高いとの第1判定結果を得る音声特徴分析手段と、を備える。

Description

発信者特定装置、発信者特定方法、および発信者特定プログラムを格納する記録媒体
 本発明は、発信者を特定する発信者特定装置、発信者特定方法、および発信者特定プログラムを格納する記録媒体に関する。
 近年、親族になすりまして金品を騙し取ろうとする詐欺(所謂、振り込め詐欺、オレオレ詐欺、母さん助けて詐欺等)が増加している。そこで、このような詐欺を未然に防ぐための様々な対策が提案されている。
 特許文献1には、詐欺師の音声特徴(声紋等)を詐欺師音声データベースに予め登録しておき、受信した通話音声データの音声特徴が上記データベースに登録された音声特徴と一致する場合に上記通話は詐欺師からの通話であると判定する技術が記載されている。また、特許文献2には、近親者の個人性特徴量を記憶部に予め登録しておき、発信者の個人性特徴量が記憶部に登録された個人性特徴量と一致するか否かを判定し、一致しないと判定した場合に、その旨を着信者(たとえば、一人暮らしのお年寄り)へ報知する技術が記載されている。
特開2008-210085号公報(ページNo.11、12) 特開2005-341383号公報(ページNo.7、8)
 特許文献1の判定方法の場合、詐欺師音声データベースに該当しない通話は全て正常な通話と判定される。しかしながら、たとえば新規の詐欺師のように、詐欺師音声データベースと一致しない通話の中にも実は詐欺師からの通話が含まれている可能性がある。
 一方、特許文献2のように、近親者の個人性特徴量と一致しない個人性特徴量を有する発信を全て詐欺師からの発信と判断する方法の場合、詐欺師から通話は完全にブロックされる。しかしながら、特許文献2の場合、近親者登録はしていないが詐欺師ではない人(たとえば、本人に初めて電話をかける会社の同僚)までも詐欺師と判断されてしまう虞がある。
 すなわち、上述したような単純な二者択一的な判定方法の場合、検出すべき詐欺師からの発信を見過ごしてしまったり、あるいは、詐欺師でない人まで詐欺師と判断してしまったりするなどの問題が発生する。
 本発明は、上記課題を解決するためになされたものであり、詐欺師からの発信とそうでない人からの発信とをより高精度に峻別することが可能な発信者特定装置、発信者特定方法、および発信者特定プログラムを格納する記録媒体を提供することを目的とする。
 本発明の発信者特定装置は、着信者の近親者の音声特徴情報である第1音声特徴情報が登録されるホワイトリストと、詐欺師の音声特徴情報である第2音声特徴情報が登録されるブラックリストとを記憶する記憶手段と、発信の音声データを取得し、前記音声データの音声特徴情報である第3音声特徴情報を求め、前記第3音声特徴情報が前記第1音声特徴情報および前記第2音声特徴情報と一致するか否かを判定し、前記第3音声特徴情報が前記第1音声特徴情報および前記第2音声特徴情報のいずれとも一致しない場合、前記第3音声特徴情報の中に複数の人物の音声特徴情報が含まれるか否かを判定し、前記第3音声特徴情報の中に複数の人物の音声特徴情報が含まれる場合、前記発信は前記詐欺師からの発信の可能性が高いとの第1判定結果を得る音声特徴分析手段と、を備える。
 本発明の発信者特定方法は、着信者の近親者の音声特徴情報である第1音声特徴情報が登録されるホワイトリストと、詐欺師の音声特徴情報である第2音声特徴情報が登録されるブラックリストとを記憶手段に記憶し、発信の音声データを取得し、前記音声データの音声特徴情報である第3音声特徴情報を求め、前記第3音声特徴情報が前記第1音声特徴情報および前記第2音声特徴情報と一致するか否かを判定し、前記第3音声特徴情報が前記第1音声特徴情報および前記第2音声特徴情報のいずれとも一致しない場合、前記第3音声特徴情報の中に複数の人物の音声特徴情報が含まれるか否かを判定し、前記第3音声特徴情報の中に複数の人物の音声特徴情報が含まれる場合、前記発信は前記詐欺師からの発信の可能性が高いとの第1判定結果を得ることを特徴とする。
 本発明の発信者特定プログラムを格納する記録媒体は、着信者の近親者の音声特徴情報である第1音声特徴情報が登録されるホワイトリストと、詐欺師の音声特徴情報である第2音声特徴情報が登録されるブラックリストとを記憶手段に記憶する処理と、発信の音声データを取得し、前記音声データの音声特徴情報である第3音声特徴情報を求め、前記第3音声特徴情報が前記第1音声特徴情報および前記第2音声特徴情報と一致するか否かを判定する処理と、前記第3音声特徴情報が前記第1音声特徴情報および前記第2音声特徴情報のいずれとも一致しない場合、前記第3音声特徴情報の中に複数の人物の音声特徴情報が含まれるか否かを判定する処理と、前記第3音声特徴情報の中に複数の人物の音声特徴情報が含まれる場合、前記発信は前記詐欺師からの発信の可能性が高いとの第1判定結果を得る処理と、を発信者特定装置のコンピュータに実行させることを特徴とする。
 本発明によれば、詐欺師からの発信とそうでない人からの発信とをより高精度に峻別することが可能となる。
本発明の第1の実施形態に係る通話システムの構成例を示すブロック図である。 発信者特定サーバの構成例を示すブロック図である。 発信者特定サーバの動作例を示すフローチャートである。 本発明の第2の実施形態に係る通話システムの構成例を示すブロック図である。
 [第1の実施形態]
 (構成の説明)
 図1は、本発明の第1の実施形態に係る通話システム10の構成例を示すブロック図である。通話システム10は、発信側装置100と、着信側装置200と、関係連絡先装置300と、発信者特定サーバ400(発信者特定装置)と、を備える。
 発信側装置100と着信側装置200と関係連絡先装置300とは電話網20を介して接続される。また、電話網20と発信者特定サーバ400と着信側装置200と関係連絡先装置300とは、所定のデータ通信網30(例えばインターネット)で接続される。
 発信側装置100は、発信者によって操作される電話機(図1において不図示)を少なくとも備える。
 着信側装置200は、電話機210と情報端末220とを備える。電話機210は、着信者によって操作される電話機である。情報端末220は、データ通信網30に接続された装置(たとえば、発信者特定サーバ400)と通信するための端末(たとえば、パーソナルコンピュータ)である。情報端末220は、データ通信網30に接続された装置と通信する機能と、所定情報を視覚表示あるいは音声表示する表示機能とを少なくとも備える。情報端末220は、たとえば、発信者特定サーバ400から、後述する「発信種別」を受け取り、画面に表示する。
 関係連絡先装置300は、データ通信網30を介して少なくとも発信者特定サーバ400と通信可能である。ここで、関係連絡先とは、たとえば、着信者の家族、電話サービスを提供する事業者が運営するサービスセンター、警察等である。
 図2は、発信者特定サーバ400の構成例を示すブロック図である。発信者特定サーバ400は、記憶部410(記憶手段)と、音声特徴分析部420(音声特徴分析手段)とを備える。なお、本実施形態では、音声特徴が「声紋」である場合を例に挙げて説明する。当然のことながら、音声特徴は声紋のみに限定されるものではない。
 記憶部410は、ホワイトリスト430とブラックリスト440とを記憶する。ホワイトリスト430には、着信者の近親者(たとえば、家族や友人)の音声特徴情報(たとえば、声紋情報)が予め登録されている。ブラックリスト440には、詐欺等の犯罪者、あるいは犯罪が疑われる人の声紋情報が予め登録されている。
 音声特徴分析部420は、データ通信網30を経由して電話網20から、発信者の音声データを取得する。音声特徴分析部420は、取得した音声データから声紋情報を抽出する。音声特徴分析部420は、抽出した声紋情報を分析(具体的には、各リストに登録された声紋との一致判定、および一つの音声データの中に複数の人の声紋があるか否かの判定)する。なお、音声特徴分析部420は、抽出した声紋情報を分析するタイミングについては、特に限定されない。例えば、所定の間隔(例えば、5秒間隔)で照合をかけ、話者が識別できるかを判定し、判定できなければ再度、照合をかけるようにすると良い。また、通話の終了時に通話中に抽出した声紋情報をまとめて分析しても良い。音声特徴分析部420は、後述するように、分析結果(発信種別)に基づいた適切な処理を実行する。
 (動作の説明)
 図3は、発信者特定サーバ400の動作例を示すフローチャートである。
 音声特徴分析部420は、データ通信網30を経由して電話網20から発信者の音声データを取得する(ステップS1)。音声特徴分析部420は、取得した音声データから声紋情報を抽出する(ステップS2)。音声特徴分析部420は、抽出された声紋情報がホワイトリスト430に登録されている声紋情報と一致するか否かを判定する(ステップS3)。
 ホワイトリスト430に登録されている声紋情報と一致する場合(ステップS3においてYes)、音声特徴分析部420は、当該発信の種別を「発信種別A/第2判定結果」(明らかに近親者からの発信)に分類する(ステップS4)。
 ホワイトリスト430に登録されている声紋情報と一致しない場合(ステップS3においてNo)、音声特徴分析部420は、抽出された声紋情報がブラックリスト440に登録されている声紋情報と一致するか否かを判定する(ステップS5)。
 ブラックリスト440に登録されている声紋情報と一致する場合(ステップS5においてYes)、音声特徴分析部420は、当該発信の種別を、「発信種別B/第3判定結果」(明らかに詐欺師からの発信)に分類する(ステップS6)。
 ブラックリスト440に登録されている声紋情報と一致しない場合(ステップS5においてNO)、音声特徴分析部420は、抽出された声紋情報に複数の人の声紋が含まれるか否かを判定する(ステップS7)。
 複数の人の声紋が含まれる場合(ステップS7においてYes)、音声特徴分析部420は、当該発信の種別を、「発信種別C/第1判定結果」(詐欺師からの発信の可能性が高い発信)に分類する(ステップS8)。
 複数の人の声紋が含まれない場合(ステップS7においてNo)、音声特徴分析部420は、当該発信の種別を、「発信種別D/第4判定結果」(詐欺師からの発信の可能性が低い発信)に分類する(ステップS9)。
 詐欺の中には事前にシナリオを作成して誰がどのタイミングで何を話すかを周到に決めている場合がある。すなわち、ある1つの発信の中に複数の人間が登場する場合、その発信は詐欺グループからの発信である蓋然性が高い。しかしながら、それらの人間の全てがブラックリストに登録されていない場合、単にブラックリストに該当するか否かで発信を判定する方法では、そのような発信は詐欺師からの発信とは判定されない。
 そこで、第1の実施形態では、近親者および詐欺師のいずれにも分類されない発信について、複数の声紋情報が存在するか否か(すなわち、複数の人が登場するか否か)を判定することにより、発信種別をより詳細に分類している。具体的には、上記発信種別A~Dの4種類に分類している。
 音声特徴分析部420は、当該発信についての発信種別(発信種別A~Dのいずれか)を、データ通信網30を介して、情報端末220へ送信する(ステップS10)。情報端末220は、受信した発信種別を画面表示する。
 音声特徴分析部420は、当該発信についての発信種別が発信種別B(明らかに詐欺師からの発信)または発信種別C(詐欺師からの発信の可能性が高い発信)であるか否かを判定する(ステップS11)。発信種別が発信種別Bまたは発信種別Cでない場合(ステップS11においてNo)、本フローは終了する。
 発信種別が発信種別Bまたは発信種別Cである場合(ステップS11においてYes)、音声特徴分析部420は、関係連絡先装置300に対して「警告」を送信する(ステップS12)。
 警告の送信方法例としては、たとえば、メール、電話、スマートフォンのアプリへのプッシュ通知などを挙げることができる。また、警告は、全送信先(着信者の家族、電話サービスを提供する事業者が運営するサービスセンター、警察等)に対して一斉送信されてもよく、あるいは、1以上の特定の送信先のみに送信されてもよい。たとえば、とりあえず、サービスセンターのみに警告を送信することができる。この場合、サービスセンターは、必要に応じて着信者、着信者の家族、警察などと連絡を取り合い、詐欺を未然に防ぐための適切な処置を施す。
 (効果の説明)
 以上説明した第1の実施形態では、近親者および詐欺師のいずれにも分類されない発信について、複数の声紋情報が存在するか否か(すなわち、複数の人が登場するか否か)を判定することにより、発信種別をより詳細に分類している。具体的には、上記発信種別A~Dの4種類に分類している。
 すなわち、ブラックリストのみ、あるいはホワイトリストのみと比較するだけの単純な二者択一的な判定方法と比較して、本実施形態の場合、検出すべき詐欺師からの発信を見過ごしてしまったり、詐欺師でない人まで詐欺師と判断してしまったりする問題は発生し難くなる。
 要するに本実施形態によれば、詐欺師からの発信とそうでない人からの発信とをより高精度に峻別することが可能となる。
 なお、発信種別が発信種別Bまたは発信種別Cである場合、音声特徴分析部420は、情報端末220に対して、取るべき行動(たとえば、家族に相談する、家族以外の別の人に相談する、警察に相談する、コールセンターに報告する等)を送信してもよい。
 なお、上記各連絡先への相談や報告に関し、Click to dialの仕組みを用いて、情報端末220から簡単に相談の電話ができるようにすることもできる。また、Click to dialの代わりに、メールやスマートフォンのアプリへのプッシュ通知、コールセンターのウェブサーバに接続して相談をするなどの様々な方法を採用することもできる。なお、Click to dialとは、Webページ上などに表示されたアイコンやリンクをクリックすることで、相手に自動的に電話をするサービスである。
 [第2の実施形態]
 図4は、本発明の第2の実施形態に係る通話システム500の構成例を示すブロック図である。通話システム500の通話システム10(図1)に対する差異は、電話機210と情報端末220とが接続されている点にある。電話機210は、発信者の音声データを、情報端末220経由で発信者特定サーバ400へ送信する。これにより、電話網20から音声データを発信者特定サーバ400へ転送する必要は無くなる。電話網20の設定を変更する場合、電話サービスを提供する通信事業者の協力要請が必要であるなど大変な手間を要する。しかしながら、本実施形態のように構成することにより、より簡便に発信種別特定サービスを提供することが可能となる。
 なお、第2の実施形態は、第1の実施形態と同様の効果を奏することは説明するまでもない。
 また、以上説明した各実施形態の全部又は一部の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより各部の処理を行ってもよい。
 「コンピュータシステム」の例としては、例えば、CPU(Central Processing Unit)を挙げることができる。
 「コンピュータ読み取り可能な記録媒体」は、例えば、非一時的な記憶装置である。非一時的な記憶装置の例としては、例えば、光磁気ディスク、ROM(Read Only Memory)、不揮発性半導体メモリ等の可搬媒体、コンピュータシステムに内蔵されるハードディスクを挙げることができる。また、「コンピュータ読み取り可能な記録媒体」は、一時的な記憶装置であってもよい。一時的な記憶装置の例としては、例えば、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線、あるいは、コンピュータシステム内部の揮発性メモリを挙げることができる。
 また、上記プログラムは、前述した機能の一部を実現するためのものであってもよく、更に前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよい。
 以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
 この出願は、2014年6月17日に出願された日本出願特願2014-124446を基礎とする優先権を主張し、その開示の全てをここに取り込む。
 10  通話システム
 20  電話網
 30  データ通信網
 100  発信側装置
 200  着信側装置
 300  関係連絡先装置
 400  発信者特定サーバ
 410  記憶部
 420  音声特徴分析部
 430  ホワイトリスト
 440  ブラックリスト
 500  通話システム

Claims (10)

  1.  着信者の近親者の音声特徴情報である第1音声特徴情報が登録されるホワイトリストと、詐欺師の音声特徴情報である第2音声特徴情報が登録されるブラックリストとを記憶する記憶手段と、
     発信の音声データを取得し、前記音声データの音声特徴情報である第3音声特徴情報を求め、前記第3音声特徴情報が前記第1音声特徴情報および前記第2音声特徴情報と一致するか否かを判定し、前記第3音声特徴情報が前記第1音声特徴情報および前記第2音声特徴情報のいずれとも一致しない場合、前記第3音声特徴情報の中に複数の人物の音声特徴情報が含まれるか否かを判定し、前記第3音声特徴情報の中に複数の人物の音声特徴情報が含まれる場合、前記発信は前記詐欺師からの発信の可能性が高いとの第1判定結果を得る音声特徴分析手段と、
     を備えることを特徴とする発信者特定装置。
  2.  前記第3音声特徴情報が前記第1音声特徴情報と一致する場合、前記音声特徴分析手段は、前記発信は明らかに前記近親者からの発信であるとの第2判定結果を得ることを特徴とする請求項1記載の発信者特定装置。
  3.  前記第3音声特徴情報が前記第2音声特徴情報と一致する場合、前記音声特徴分析手段は、前記発信は明らかに前記詐欺師からの発信であるとの第3判定結果を得ることを特徴とする請求項2記載の発信者特定装置。
  4.  前記第3音声特徴情報が前記第1音声特徴情報および第2音声特徴情報のいずれとも一致せず、且つ前記第3音声特徴情報の中に複数の人物の音声特徴情報が含まれない場合、前記音声特徴分析手段は、前記発信は詐欺師からの発信の可能性が低いとの第4判定結果を得ることを特徴とする請求項3記載の発信者特定装置。
  5.  前記音声特徴分析手段は、前記発信についての判定結果が前記第1判定結果または前記3判定結果であるか否かを判定し、前記判定結果が前記第1判定結果または前記第3判定結果である場合、前記発信者特定装置と所定の通信網を介して接続され、関係連絡先によって操作される関係連絡先装置に対して、前記発信が前記詐欺師からの発信であることを警告するための警告情報を送信することを特徴とする請求項4記載の発信者特定装置。
  6.  前記関係連絡先は、前記着信者の家族、電話サービスを提供する事業者が運営するサービスセンター、および警察の少なくとも1つであることを特徴とする請求項5記載の発信者特定装置。
  7.  前記判定結果が前記第1判定結果または前記第3判定結果である場合、前記音声特徴分析手段は、前記発信者特定装置と所定の通信網を介して接続される着信側装置に対して、前記着信者が取るべき行動が示される行動情報を送信することを特徴とする請求項5または6記載の発信者特定装置。
  8.  前記音声特徴分析手段は、前記音声データを前記着信側装置から受信することを特徴とする請求項7記載の発信者特定装置。
  9.  着信者の近親者の音声特徴情報である第1音声特徴情報が登録されるホワイトリストと、詐欺師の音声特徴情報である第2音声特徴情報が登録されるブラックリストとを記憶手段に記憶し、
     発信の音声データを取得し、前記音声データの音声特徴情報である第3音声特徴情報を求め、前記第3音声特徴情報が前記第1音声特徴情報および前記第2音声特徴情報と一致するか否かを判定し、
     前記第3音声特徴情報が前記第1音声特徴情報および前記第2音声特徴情報のいずれとも一致しない場合、前記第3音声特徴情報の中に複数の人物の音声特徴情報が含まれるか否かを判定し、
     前記第3音声特徴情報の中に複数の人物の音声特徴情報が含まれる場合、前記発信は前記詐欺師からの発信の可能性が高いとの第1判定結果を得る、
     ことを特徴とする発信者特定方法。
  10.  着信者の近親者の音声特徴情報である第1音声特徴情報が登録されるホワイトリストと、詐欺師の音声特徴情報である第2音声特徴情報が登録されるブラックリストとを記憶手段に記憶する処理と、
     発信の音声データを取得し、前記音声データの音声特徴情報である第3音声特徴情報を求め、前記第3音声特徴情報が前記第1音声特徴情報および前記第2音声特徴情報と一致するか否かを判定する処理と、
     前記第3音声特徴情報が前記第1音声特徴情報および前記第2音声特徴情報のいずれとも一致しない場合、前記第3音声特徴情報の中に複数の人物の音声特徴情報が含まれるか否かを判定する処理と、
     前記第3音声特徴情報の中に複数の人物の音声特徴情報が含まれる場合、前記発信は前記詐欺師からの発信の可能性が高いとの第1判定結果を得る処理と、
     を発信者特定装置のコンピュータに実行させるための発信者特定プログラムを格納する記録媒体。
PCT/JP2015/002957 2014-06-17 2015-06-12 発信者特定装置、発信者特定方法、および発信者特定プログラムを格納する記録媒体 WO2015194148A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2016529035A JP6296159B2 (ja) 2014-06-17 2015-06-12 発信者特定装置、発信者特定方法、および発信者特定プログラムを格納する記録媒体
US15/319,237 US9860373B2 (en) 2014-06-17 2015-06-12 Caller identification apparatus, caller identification method, and recording medium on which caller identification program has been stored

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2014-124446 2014-06-17
JP2014124446 2014-06-17

Publications (1)

Publication Number Publication Date
WO2015194148A1 true WO2015194148A1 (ja) 2015-12-23

Family

ID=54935155

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2015/002957 WO2015194148A1 (ja) 2014-06-17 2015-06-12 発信者特定装置、発信者特定方法、および発信者特定プログラムを格納する記録媒体

Country Status (3)

Country Link
US (1) US9860373B2 (ja)
JP (1) JP6296159B2 (ja)
WO (1) WO2015194148A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020188322A (ja) * 2019-05-10 2020-11-19 東芝情報システム株式会社 電話システム

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9986079B1 (en) * 2016-11-04 2018-05-29 Republic Wireless, Inc. Virtual telephony assistant
CN110248322B (zh) * 2019-06-28 2021-10-22 国家计算机网络与信息安全管理中心 一种基于诈骗短信的诈骗团伙识别系统及识别方法
CN112565525A (zh) * 2019-09-26 2021-03-26 中国电信股份有限公司 反诈骗预警方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010273130A (ja) * 2009-05-21 2010-12-02 Ntt Docomo Inc 詐欺進行度判定装置、辞書生成装置、詐欺進行度判定方法及び辞書生成方法
JP2011023903A (ja) * 2009-07-15 2011-02-03 Fujitsu Ltd 通信端末の異常検出装置及び通信端末の異常検出方法
JP2012050034A (ja) * 2010-08-30 2012-03-08 Ntt Data Corp 情報サーバ装置および情報サービス方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63232563A (ja) 1987-03-19 1988-09-28 Nec Corp 音声認識電話方式
US7721109B1 (en) * 2000-07-28 2010-05-18 Verizon Business Global Llc Secure transaction card using biometrical validation
US7299177B2 (en) * 2003-05-30 2007-11-20 American Express Travel Related Services Company, Inc. Speaker recognition in a multi-speaker environment and comparison of several voice prints to many
JP4157077B2 (ja) 2004-05-28 2008-09-24 東芝テック株式会社 電話機
US8510215B2 (en) 2005-04-21 2013-08-13 Victrio, Inc. Method and system for enrolling a voiceprint in a fraudster database
JP2008210085A (ja) 2007-02-26 2008-09-11 Nec Corp 振り込め詐欺防止システム,通話内容判定サーバ,振り込め詐欺防止方法およびプログラム
JP5287490B2 (ja) 2009-05-14 2013-09-11 日本電気株式会社 発信者認証方法、発信者認証装置、発信者認証システム及び発信者認証プログラム
JP2012134647A (ja) * 2010-12-20 2012-07-12 Hitachi Ltd 呼接続制御装置、電話端末及び電話網
JP2013005205A (ja) 2011-06-16 2013-01-07 Ntt Docomo Inc 悪質電話防止装置、悪質電話防止システム
US9620123B2 (en) * 2013-05-02 2017-04-11 Nice Ltd. Seamless authentication and enrollment
US9721571B2 (en) * 2015-06-14 2017-08-01 Nice Ltd. System and method for voice print generation

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010273130A (ja) * 2009-05-21 2010-12-02 Ntt Docomo Inc 詐欺進行度判定装置、辞書生成装置、詐欺進行度判定方法及び辞書生成方法
JP2011023903A (ja) * 2009-07-15 2011-02-03 Fujitsu Ltd 通信端末の異常検出装置及び通信端末の異常検出方法
JP2012050034A (ja) * 2010-08-30 2012-03-08 Ntt Data Corp 情報サーバ装置および情報サービス方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020188322A (ja) * 2019-05-10 2020-11-19 東芝情報システム株式会社 電話システム

Also Published As

Publication number Publication date
US9860373B2 (en) 2018-01-02
JP6296159B2 (ja) 2018-03-20
US20170126885A1 (en) 2017-05-04
JPWO2015194148A1 (ja) 2017-04-20

Similar Documents

Publication Publication Date Title
US11032417B2 (en) Collaborative phone reputation system
US10721352B2 (en) Methods and systems for inbound and outbound call control
US9819797B2 (en) Methods and systems for inbound call control
JP5351787B2 (ja) 通信処理システム及びプログラム
US7895154B2 (en) Communication reputation
US10230837B2 (en) Methods and systems for inbound and outbound call control
JP6296159B2 (ja) 発信者特定装置、発信者特定方法、および発信者特定プログラムを格納する記録媒体
JP2013005205A (ja) 悪質電話防止装置、悪質電話防止システム
KR20160100833A (ko) 보이스 피싱 위험도 단계별 경보 시스템 및 방법
JP2007228384A (ja) 不審通話判別プログラム
US20150215449A1 (en) Incoming call management device, management server, telephone terminal, controller, communication system, incoming call control method and program
KR101731545B1 (ko) 통화 중 보이스 피싱 위험 경보 시스템 및 방법
CN118786660A (zh) 呼叫者标识(id)的实时验证
JP2017046182A (ja) 通知装置および通知方法
US20230095897A1 (en) Special fraud countermeasure apparatus, special fraud countermeasure method, and special fraud countermeasure program
JP2020205485A (ja) 電話システムおよびサーバ装置
JP7308109B2 (ja) 通信装置
KR101593444B1 (ko) 수신자 리스트에 따른 예상 수신 결과 제공 방법
RU2453066C2 (ru) Способ персонального вызова пользователя телефонной сети связи (варианты)
CN115250471A (zh) 一种通话处理方法、装置、设备及计算机存储介质
JP2014220817A (ja) サーバ及びサーバに用いられる通信挙動識別方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 15809615

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2016529035

Country of ref document: JP

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 15319237

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 15809615

Country of ref document: EP

Kind code of ref document: A1