KR20170006288A - Apparatus and method for analyzing voice phishing pattern based on probability - Google Patents
Apparatus and method for analyzing voice phishing pattern based on probability Download PDFInfo
- Publication number
- KR20170006288A KR20170006288A KR1020160086162A KR20160086162A KR20170006288A KR 20170006288 A KR20170006288 A KR 20170006288A KR 1020160086162 A KR1020160086162 A KR 1020160086162A KR 20160086162 A KR20160086162 A KR 20160086162A KR 20170006288 A KR20170006288 A KR 20170006288A
- Authority
- KR
- South Korea
- Prior art keywords
- voice phishing
- pattern
- keyword
- voice
- probability
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/50—Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
-
- G06F17/277—
-
- G06F17/30964—
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/14—Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
- H04L63/1441—Countermeasures against malicious traffic
- H04L63/1483—Countermeasures against malicious traffic service impersonation, e.g. phishing, pharming or web spoofing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M7/00—Arrangements for interconnection between switching centres
- H04M7/006—Networks other than PSTN/ISDN providing telephone service, e.g. Voice over Internet Protocol (VoIP), including next generation networks with a packet-switched transport layer
- H04M7/0078—Security; Fraud detection; Fraud prevention
Abstract
Description
본 발명은 보이스 피싱 패턴 분석 장치 및 방법에 관한 것으로서, 보다 상세하게는 보이스 피싱 여부를 확률에 기초하여 보다 정확하고 효율적으로 분석할 수 있는 보이스 피싱 패턴 분석 장치 및 방법에 관한 것이다.BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an apparatus and method for analyzing a voice phishing pattern, and more particularly, to an apparatus and method for analyzing a voice phishing pattern capable of analyzing a voice phishing pattern more accurately and efficiently based on probability.
"보이스 피싱(Voice Phishing)"은 전화를 통해 관련 기관을 사칭해서 개인 정보를 빼내거나 송금을 유도하는 사기 수법을 말한다. 보이스 피싱이 사회 문제화되고 알려짐에 따라 사람들도 어느 정도 보이스 피싱의 위험성을 인식하고는 있으나 보이스 피싱 수법도 교묘하게 진화하고 있어서 최근에도 계속적으로 피해 사례가 보고되고 있는 실정이다."Voice Phishing" refers to a fraudulent method of impersonating a relevant organization via telephone and extracting personal information or inducing remittance. As voice phishing becomes a social issue and people are aware of the danger of voice phishing to some degree, voice phishing techniques are also evolving, and recent cases have been reported.
보이스 피싱을 방지하기 위한 종래의 기술로서는, 통신 사업자 망에 보이스 피싱에 사용된 전화 번호를 저장해 두고 통화를 원천적으로 차단하거나 착신 단말로 알려주는 서비스가 알려져 있으나, 이는 사용자의 평가에 뒷받침한 대용량 데이터베이스의 구축이 선행되어야 하는 경우가 대부분이며, 이러한 경우 초기 데이터 확보에 많은 시간과 노력이 소요된다. 또한 이러한 정보들은 전화를 받기 전 수신화면에서만 확인이 가능하고, 전화를 수신한 이후 즉 통화 중일 때에는 보이스 피싱 위험에 노출된 상태임을 사용자에게 제공할 수 없다는 한계가 있다.As a conventional technique for preventing voice phishing, there is known a service in which a telephone number used for voice phishing is stored in a communication service provider network and the call is originally blocked or informed to a called terminal. However, In this case, it takes much time and effort to acquire initial data. In addition, such information can only be confirmed on the receiving screen before receiving the call, and there is a limit to that the user can not be provided with the risk of voice phishing after receiving the call, that is, during communication.
또한, 보이스 피싱 수법이 진화됨에 따라 새로운 보이스 피싱 수법이 등장하는데 사용자가 모든 보이스 피싱 사례에 대한 대처방법을 미리 숙지하기 어렵고, 순간적인 방심에 의해 피해가 발생하기 때문에, 통화 도중에 실시간으로 보이스 피싱 여부를 제공할 수 없다는 한계점도 있다.In addition, as the voice phishing method evolves, a new voice phishing method appears. It is difficult for the user to know how to cope with all the voice phishing cases beforehand, and the damage occurs due to the momentary vigilance. It is not possible to provide such a limit.
또한, 사용자의 단말기에 보이스 피싱 의심 전화 번호를 저장하도록 하는 방법도 제안되었으나 이 또한 마찬가지의 문제점이 있다. 더욱이, 실제 착신자에게 필요한 전화가 스팸으로 표기되어 전화의 수신이 자동차단 되거나, 정확한 정보를 제공하지 못하는 경우도 발생한다는 문제점도 있다.Also, a method of storing a voice phishing suspicious phone number in a user terminal has been proposed, but the same problem also exists. Furthermore, there is also a problem that a telephone necessary for an actual called party is marked as spam, so that the reception of the telephone is cut off, or accurate information can not be provided.
또한, 종래의 기술에서는, 보이스 피싱 여부를 구체적으로 판단할 수 있는 알고리듬이 제시되지 않고 있어서 보이스 피싱 여부를 통화 내용에 기초하여 실시간으로 판단할 수 있는 장치를 구현할 수 없다는 한계점이 있다.In addition, the conventional art does not provide an algorithm that can specifically determine whether or not voice phishing is performed. Therefore, there is a limitation in that it is not possible to implement a device capable of determining whether or not voice phishing is performed in real time based on the contents of a call.
본 발명은 상기한 바와 같은 한계점을 해결하기 위한 것으로서, 통화 도중 보이스 피싱 여부를 실시간으로 확인하여 보이스 피싱의 피해를 사전에 방지할 수 있는 장치 및 방법을 제공하는 것을 목적으로 한다.SUMMARY OF THE INVENTION The present invention has been made to solve the above problems and it is an object of the present invention to provide an apparatus and method for preventing voice phishing from occurring in real time by verifying whether voice phishing is occurring during a call.
또한, 본 발명은 수학적 확률 이론에 기초하여 보이스 피싱 여부를 판별함으로써 보이스 피싱 감지 확률을 높일 수 있으며 보이스 피싱 패턴을 데이터베이스화함으로써 보다 정확하고 효율적인 보이스 피싱 분석 장치 및 방법을 제공하는 것을 또 다른 목적으로 한다.It is another object of the present invention to provide a more accurate and efficient voice phishing analysis apparatus and method by determining the presence or absence of voice phishing based on the mathematical probability theory and increasing the probability of detecting voice phishing, do.
또한, 본 발명은 통화 내용의 키워드와 보이스 피싱과의 연관 관계 를 고려하여 보이스 피싱을 판별할 수 있도록 하는 장치 및 방법을 제공하는 것을 또 다른 목적으로 한다.It is another object of the present invention to provide an apparatus and method for distinguishing voice phishing by taking into consideration the relationship between a keyword of a call content and voice phishing.
또한, 본 발명은 보이스 피싱에서 출현하는 키워드들의 순서, 연속성과 함께 조건부 확률의 개념을 이용하여 보이스 피싱을 판별함으로써 보이스 피싱 진단의 정확도를 높일 수 있는 장치 및 방법을 제공하는 것을 또 다른 목적으로 한다.It is another object of the present invention to provide an apparatus and method for increasing the accuracy of voice phishing diagnosis by discriminating voice phishing using the concept of conditional probability together with the order and continuity of keywords appearing in voice phishing .
상기한 바와 같은 과제를 해결하기 위하여 본 발명은, 확률에 기반한 보이스 피싱 패턴 분석 장치로서, 외부의 요청 장치로부터 텍스트 데이터를 수신하여 키워드 분석부로 전달하고, 보이스 피싱 패턴 감지부로부터 전달되는 보이스 피싱 패턴 정보 및 보이스 피싱 확률값을 수신하여 요청 장치로 전달하는 통신부; 보이스 피싱 패턴 데이터베이스에 저장된 키워드 집합 리스트를 참조하여 상기 통신부로부터 수신한 텍스트 데이터에 상응하는 보이스 피싱 패턴의 식별자를 판별하고 및 텍스트 데이터에 상응하는 키워드를 보이스 피싱 확률 분석부로 전달하는 키워드 분석부; 상기 키워드 분석부로부터 수신한 보이스 피싱 패턴의 식별자와 키워드에 기초하여 보이스 피싱 확률값을 계산하는 보이스 피싱 확률 분석부; 보이스 피싱 확률 분석부로부터 상기 보이스 피싱 패턴 식별자 및 보이스 피싱 확률값을 수신하여 이들에 기초하여 보이스 피싱 패턴을 결정하고, 결정된 보이스 피싱 패턴에 대한 보이스 피싱 패턴 정보와 보이스 피싱 확률값을 통신부로 전달하는 보이스 피싱 패턴 감지부; 및 보이스 피싱 패턴에 대한 키워드 집합 리스트를 저장하는 보이스 피싱 패턴 데이터베이스를 포함하는 보이스 피싱 패턴 분석 장치를 제공한다.According to another aspect of the present invention, there is provided an apparatus for analyzing a voice phishing pattern based on probability, comprising: a text analyzing unit that receives text data from an external requesting apparatus and transmits the text data to a keyword analyzing unit, A communication unit for receiving the information and the voice phishing probability value and transmitting the received information to the requesting apparatus; A keyword analyzer for identifying an identifier of a voice phishing pattern corresponding to the text data received from the communication unit by referring to a keyword set list stored in the voice phishing pattern database and transmitting the keyword corresponding to the text data to the voice phishing probability analyzer; A voice phishing probability analyzing unit for calculating a voice phishing probability value based on the identifier of the voice phishing pattern received from the keyword analyzing unit and the keyword; A voice phishing pattern identifier and a voice phishing probability value from the voice phishing probability analyzer to determine a voice phishing pattern based on the voice phishing pattern identifier and the voice phishing probability value, and voice phishing pattern information and voice phishing probability value for the determined voice phishing pattern, A pattern detection unit; And a voice phishing pattern database storing a keyword set list for the voice phishing pattern.
여기에서, 상기 키워드 집합 리스트는, 각각의 보이스 피싱 패턴에 대하여 적어도 하나 이상의 키워드 집합과, 보이스 피싱 패턴에 대한 식별자 및 각 보이스 피싱 패턴에 대해 키워드 집합의 전체 갯수를 구비할 수 있다.Here, the keyword set list may include at least one or more keyword sets for each voice phishing pattern, an identifier for the voice phishing pattern, and the total number of keyword sets for each voice phishing pattern.
또한, 상기 키워드 분석부는, 보이스 피싱 패턴 데이터베이스의 키워드 집합 리스트를 참조하여 수신되는 텍스트 데이터가 포함되어 있는 키워드 집합에 상응하는 보이스 피싱 패턴의 식별자와 수신된 텍스트 데이터에 상응하는 키워드를 보이스 피싱 확률 분석부로 전달하도록 구성할 수 있다.The keyword analyzing unit may refer to a keyword set list of a voice phishing pattern database to identify a voice phishing pattern identifier corresponding to a set of keywords including received text data and a keyword corresponding to the received text data, To-be-transmitted.
또한, 상기 보이스 피싱 확률 분석부는,Also, the voice phishing probability analyzing unit may include:
(여기서, n은 보이스 피싱 패턴의 총 키워드 집합의 갯수, r은 현재까지 키워드 분석부(20)로부터 키워드가 전송된 횟수)의 수식에 의하여 보이스 피싱 확률값(P)을 계산할 수 있다. (Where n is the number of total keyword sets of the voice phishing pattern, r is the number of times the keyword has been transmitted from the keyword analyzing unit 20).
또한, 상기 보이스 피싱 확률 분석부는 키워드 분석부로부터 키워드의 전달이 시작되면 r=1로 하고, 텍스트 데이터의 분석이 완료될 때까지 키워드가 전달될 때마다 r을 1만큼씩 증가시킬 수 있다.Also, the voice phishing probability analyzer may increase r by 1 every time a keyword is delivered until the analysis of the text data is completed, with r = 1 when the keyword is transmitted from the keyword analyzing unit.
또한, 상기 보이스 피싱 확률 분석부는, 보이스 피싱 패턴의 식별자가 복수개인 경우 각각의 보이스 피싱 패턴에 대해 상기 수식을 이용하여 각각의 보이스 피싱 패턴 확률값(P)를 계산할 수 있다.In addition, the voice phishing probability analyzing unit may calculate each voice phishing pattern probability value P for each voice phishing pattern using the above formula when there are a plurality of identifiers of the voice phishing patterns.
또한, 상기 키워드 집합 리스트는, 각각의 키워드 집합에 대해 미리 설정된 가중치를 더 구비할 수 있다.The keyword set list may further include a predetermined weight for each keyword set.
또한, 상기 보이스 피싱 확률 분석부는,Also, the voice phishing probability analyzing unit may include:
(여기서, n은 보이스 피싱 패턴의 총 키워드 집합의 갯수, r은 현재까지 키워드 분석부(20)로부터 키워드가 전송된 횟수, w는 현재까지 검출된 키워드들의 가중치들의 합인 누적 가중치)의 수식에 의하여 보이스 피싱 확률값(P)을 계산하도록 할 수도 있다.(Where n is the number of total keyword sets of the voice phishing pattern, r is the number of times the keyword has been transmitted from the
본 발명의 다른 측면에 의하면, 상기한 바와 같은 보이스 피싱 패턴 장치에서 수행되는 보이스 피싱 패턴 분석 방법에 있어서, 통신부가 외부의 요청 장치로부터 텍스트 데이터를 수신하여 키워드 분석부로 전달하는 제1 단계; 키워드 분석부가 보이스 피싱 패턴 데이터베이스에 저장된 키워드 집합 리스트를 참조하여 상기 수신한 텍스트 데이터에 상응하는 보이스 피싱 패턴의 식별자를 판별하고 및 텍스트 데이터에 상응하는 키워드를 보이스 피싱 확률 분석부로 전달하는 제2 단계; 보이스 피싱 확률 분석부가 상기 수신한 보이스 피싱 패턴의 식별자와 키워드에 기초하여 보이스 피싱 여부에 대한 확률값을 계산하는 제3 단계; 보이스 피싱 패턴 감지부가 상기 보이스 피싱 확률 분석부로부터 상기 보이스 피싱 패턴 식별자 및 보이스 피싱 패턴 확률값을 수신하고, 이들에 기초하여 보이스 피싱 패턴을 결정하고, 결정된 보이스 피싱 패턴에 대한 보이스 피싱 패턴 정보와 보이스 피싱 확률값을 통신부로 전달하는 제4 단계; 통신부가 상기 보이스 피싱 패턴 감지부로부터 수신한 보이스 피싱 패턴 정보 및 보이스 피싱 확률값을 요청 장치로 전달하는 제5 단계를 포함하는 보이스 피싱 패턴 분석 방법을 제공한다.According to another aspect of the present invention, there is provided a method of analyzing a voice phishing pattern performed in a voice phishing pattern apparatus as described above, the method comprising: a first step of receiving a text data from an external request apparatus and transmitting the received text data to a keyword analyzing unit; A second step of discriminating an identifier of a voice phishing pattern corresponding to the received text data by referring to a keyword set list stored in a voice phishing pattern database and delivering a keyword corresponding to the text data to a voice phishing probability analyzing unit; A third step of calculating a probability value for voice phishing based on the identifier and the keyword of the received voice phishing pattern; The voice phishing pattern detection unit receives the voice phishing pattern identifier and the voice phishing pattern probability value from the voice phishing probability analyzing unit, determines a voice phishing pattern based on the voice phishing pattern identifier and the voice phishing pattern probability value, A fourth step of transmitting a probability value to a communication unit; And a fifth step of transmitting the voice phishing pattern information and the voice phishing probability value received from the voice phishing pattern sensing unit to the requesting unit.
본 발명의 또 다른 측면에 의하면, 확률에 기반한 보이스 피싱 패턴 분석 장치로서, 외부의 요청 장치로부터 텍스트 데이터를 수신하여 키워드 분석부로 전달하고, 보이스 피싱 패턴 감지부로부터 전달되는 보이스 피싱 패턴 정보 및 보이스 피싱 확률값을 수신하여 요청 장치로 전달하는 통신부; 보이스 피싱 패턴 데이터베이스에 저장된 키워드 집합 리스트를 참조하여 상기 통신부로부터 수신한 텍스트 데이터에 상응하는 키워드 및 상기 키워드에 대한 피싱 지수를 보이스 피싱 확률 분석부로 전달하는 키워드 분석부; 상기 키워드 분석부로부터 수신한 키워드 및 피싱 지수에 기초하여 보이스 피싱 확률값을 계산하는 보이스 피싱 확률 분석부; 보이스 피싱 확률 분석부로부터 키워드 및 보이스 피싱 확률값을 수신하여 이들에 기초하여 보이스 피싱 패턴을 결정하고, 결정된 보이스 피싱 패턴에 대한 보이스 피싱 패턴 정보와 보이스 피싱 확률값을 통신부로 전달하는 보이스 피싱 패턴 감지부; 및 보이스 피싱 패턴에 대한 키워드 집합 리스트를 저장하는 보이스 피싱 패턴 데이터베이스를 포함하는 보이스 피싱 패턴 분석 장치를 제공한다.According to another aspect of the present invention, there is provided an apparatus for analyzing a voice phishing pattern based on probability, comprising: a text analyzing unit for receiving text data from an external requesting apparatus and transmitting the text data to a keyword analyzing unit; A communication unit for receiving the probability value and delivering it to the requesting device; A keyword analyzer for referring to a keyword set list stored in a voice phishing pattern database and transmitting a keyword corresponding to text data received from the communication unit and a phishing index for the keyword to a voice phishing probability analyzer; A voice phishing probability analyzing unit for calculating a voice phishing probability value based on the keyword and the phishing index received from the keyword analyzing unit; A voice phishing pattern detection unit for receiving a keyword and a voice phishing probability value from the voice phishing probability analysis unit, determining a voice phishing pattern based thereon, and transmitting voice phishing pattern information and a voice phishing probability value for the determined voice phishing pattern to a communication unit; And a voice phishing pattern database storing a keyword set list for the voice phishing pattern.
여기에서, 상기 피싱 지수는 각각의 키워드에 대한 보이스 피싱의 연관 관계를 확률값으로 나타낸 것이다.Here, the phishing index is a probability value indicating the association of voice phishing for each keyword.
또한, 상기 보이스 피싱 확률 분석부는,Also, the voice phishing probability analyzing unit may include:
(여기에서, A~N은 키워드들의 피싱 지수임)의 수식에 의하여 보이스 피싱 확률값(P)을 계산할 수 있다.(Where A to N are the phishing indices of the keywords), the voice phishing probability value P can be calculated.
또한, 상기 보이스 피싱 패턴 감지부는, 키워드의 출현 순서, 연속성, 횟수 및 확률값 중 적어도 하나 이상에 기초하여 보이스 피싱 패턴 또는 보이스 피싱 여부를 결정할 수 있다.In addition, the voice phishing pattern detecting unit may determine whether a voice phishing pattern or voice phishing is based on at least one of a sequence of occurrence, continuity, a number of times, and a probability value of a keyword.
본 발명의 또 다른 측면에 의하면, 상기한 바와 같은 보이스 피싱 패턴 분석 장치에서 수행되는 보이스 피싱 패턴 분석 방법으로서, 통신부가 외부의 요청 장치로부터 텍스트 데이터를 수신하여 키워드 분석부로 전달하는 제1 단계; 키워드 분석부가 보이스 피싱 패턴 데이터베이스에 저장된 키워드 집합 리스트를 참조하여 상기 통신부로부터 수신한 텍스트 데이터에 상응하는 키워드 및 상기 키워드에 대한 피싱 지수를 보이스 피싱 확률 분석부로 전달하는 제2 단계; 보이스 피싱 확률 분석부가 상기 키워드 분석부로부터 수신한 키워드 및 피싱 지수에 기초하여 보이스 피싱 확률값을 계산하는 제3 단계; 보이스 피싱 패턴 감지부가 보이스 피싱 확률 분석부로부터 키워드 및 보이스 피싱 확률값을 수신하여 이들에 기초하여 보이스 피싱 패턴을 결정하고, 결정된 보이스 피싱 패턴에 대한 보이스 피싱 패턴 정보와 보이스 피싱 확률값을 통신부로 전달하는 제4 단계; 및 통신부가 보이스 피싱 패턴 감지부로부터 전달되는 보이스 피싱 패턴 정보 및 보이스 피싱 확률값을 수신하여 요청 장치로 전달하는 제5 단계를 포함하는 보이스 피싱 패턴 분석 방법을 제공한다.According to another aspect of the present invention, there is provided a method for analyzing a voice phishing pattern performed in an apparatus for analyzing a voice phishing pattern, comprising: a first step of receiving a text data from an external request apparatus and transmitting the received text data to a keyword analyzing unit; A second step of referring to the keyword aggregation list stored in the voice phishing pattern database and transmitting the keyword corresponding to the text data received from the communication unit and the phishing index for the keyword to the voice phishing probability analyzer; A third step of calculating a voice phishing probability value based on the keyword and the phishing index received from the keyword analyzing unit; A voice phishing pattern detection unit receives a keyword and a voice phishing probability value from the voice phishing probability analysis unit, determines a voice phishing pattern based on the keyword, and transmits voice phishing pattern information and a voice phishing probability value for the determined voice phishing pattern to a
본 발명에 의하면, 통화 도중 보이스 피싱 여부를 실시간으로 확인하여 보이스 피싱의 피해를 사전에 방지할 수 있는 장치 및 방법을 제공할 수 있다.According to the present invention, it is possible to provide an apparatus and method for preventing voice phishing damage in advance by confirming whether voice phishing is performed in real time during a call.
또한, 본 발명은 수학적 확률 이론에 기초하여 보이스 피싱 여부를 판별함으로써 보이스 피싱 감지 확률을 높일 수 있으며 보이스 피싱 패턴을 데이터베이스화함으로써 보다 정확하고 효율적인 보이스 피싱 분석 장치 및 방법을 제공할 수 있다.In addition, the present invention can increase the probability of voice phishing detection by discriminating whether or not voice phishing is performed based on mathematical probability theory, and can provide a more accurate and efficient voice phishing analysis apparatus and method by converting a voice phishing pattern into a database.
또한, 본 발명은 통화 내용의 키워드와 보이스 피싱과의 연관 관계 를 고려하여 보이스 피싱을 판별할 수 있도록 하는 장치 및 방법을 제공할 수 있다.In addition, the present invention can provide an apparatus and method for discriminating voice phishing by taking into account the relationship between keywords of a call content and voice phishing.
또한, 본 발명은 보이스 피싱에서 출현하는 키워드들의 순서, 연속성과 함께 조건부 확률의 개념을 이용하여 보이스 피싱을 판별함으로써 보이스 피싱 진단의 정확도를 높일 수 있는 장치 및 방법을 제공할 수 있다.In addition, the present invention can provide an apparatus and method for increasing the accuracy of voice phishing diagnosis by discriminating voice phishing using the concept of conditional probability together with the order and continuity of keywords appearing in voice phishing.
또한, 본 발명은 보이스 피싱 분야 뿐 아니라 스팸 전화, 광고 등의 분야에도 적용하여, 통화 내용의 패턴을 분석할 수 있는 효과가 있다.In addition, the present invention is applicable not only to the field of voice phishing but also to the field of spam phone, advertisement, and the like, and has an effect of analyzing patterns of conversation contents.
도 1은 본 발명에 의한 확률에 기반한 보이스 피싱 패턴 분석 장치(100)의 일실시예를 나타낸 도면이다.
도 2는 보이스 피싱 패턴 데이터베이스(50)에 저장되는 키워드 집합 리스트를 설명하기 위한 도면이다.
도 3은 도 1 내지 도 2를 참조하여 설명한 분석 장치(100)에 의해 수행되는 확률에 기반한 보이스 피싱 패턴 분석 방법의 일실시예를 나타낸 흐름도이다.
도 4는 키워드 집합 리스트의 다른 예를 나타낸 것으로서, 본 발명의 다른 실시예를 설명하기 위한 도면이다.
도 5는 보이스 피싱 패턴 데이터베이스(50)의 또 다른 일예를 나타낸 것으로서, 본 발명에 의한 또 다른 실시예를 설명하기 위한 도면이다.
도 6은 본 발명에 의한 보이스 피싱 패턴 분석 방법의 또 다른 실시예를 나타낸 흐름도이다.1 is a diagram illustrating an embodiment of an
FIG. 2 is a diagram for explaining a keyword set list stored in the voice
FIG. 3 is a flowchart illustrating an embodiment of a method for analyzing a voice phishing pattern based on a probability performed by the analyzing
FIG. 4 shows another example of the keyword set list, and is a diagram for explaining another embodiment of the present invention.
5 is a view for explaining another embodiment of the voice
6 is a flowchart illustrating a method of analyzing a voice phishing pattern according to another embodiment of the present invention.
이하, 첨부 도면을 참조하여 본 발명에 의한 실시예를 상세하게 설명하기로 한다.Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings.
도 1은 본 발명에 의한 확률에 기반한 보이스 피싱 패턴 분석 장치(100)의 일실시예를 나타낸 도면이다.1 is a diagram illustrating an embodiment of an
도 1을 참조하면, 확률에 기반한 보이스 피싱 패턴 분석 장치(100, 이하 간단히 "분석 장치(100)"라 한다), 통신부(10), 키워드 분석부(20), 보이스 피싱 확률 분석부(30), 보이스 피싱 패턴 감지부(40) 및 보이스 피싱 패턴 데이터베이스(50)를 구비한다.1, a probability phonetic phonetic pattern analyzer 100 (hereinafter simply referred to as "
통신부(10)는 외부의 요청 장치(200)로부터 텍스트 데이터를 수신하여 키워드 분석부(20)로 전달하고, 보이스 피싱 패턴 감지부(50)로부터 전달되는 보이스 피싱 패턴 정보 및 보이스 피싱 확률값을 수신하여 요청 장치(200)로 전달하는 기능을 수행한다.The
여기에서, 요청 장치(200)는 텍스트 데이터를 분석 장치(100)로 전송하는데 음성 인식 기능에 의해 통화 내용으로부터 텍스트 데이터를 생성할 수 있는 기능을 갖는 이동 통신 단말기일 수 있다. 이 경우 이동 통신 단말기는 본 발명에 의한 보이스 피싱 패턴 분석 장치(100)와 연동하여 통화 수행시 자동으로 구동되어 통화 음성 신호로부터 음성 인식을 수행하는 기능과 보이스 피싱 패턴 분석 장치(100)와 데이터를 송수신할 수 있는 기능을 응용 프로그램(application)의 형태로 구비하는 스마트폰인 것이 바람직하다.Here, the
키워드 분석부(20)는 보이스 피싱 패턴 데이터베이스(50)에 저장되어 있는 키워드 집합 리스트를 참조하여 통신부(10)로부터 수신한 텍스트 데이터에 상응하는 보이스 피싱 패턴의 식별자를 판별하고 및 텍스트 데이터에 상응하는 키워드를 보이스 피싱 확률 분석부(20)로 전달한다.The
보이스 피싱 패턴 데이터베이스(50)는 보이스 피싱 패턴에 대한 키워드 집합 리스트를 저장하는 수단이다.The voice
도 2는 보이스 피싱 패턴 데이터베이스(50)에 저장되는 키워드 집합 리스트를 설명하기 위한 도면이다.FIG. 2 is a diagram for explaining a keyword set list stored in the voice
도 2를 참조하면, 키워드 집합 리스트는, 각각의 보이스 피싱 패턴에 대하여 적어도 하나 이상의 키워드 집합으로 구성되며, 각 보이스 피싱 패턴은 식별자(ID)가 부여된다. 또한, 각 보이스 피싱 패턴에 대해 키워드 집합의 전체 갯수가 미리 계산되어 저장되어 있다.Referring to FIG. 2, the keyword set list includes at least one set of keywords for each voice phishing pattern, and an identifier (ID) is assigned to each voice phishing pattern. In addition, the total number of keyword sets for each voice phishing pattern is calculated and stored in advance.
보이스 피싱 패턴에 대한 각각의 키워드 집합은 서로 연관성이 있는 키워드들로 구성되며, 각 키워드는 해당 보이스 피싱 패턴에 전형적으로 나타나는 키워드들을 미리 구분하여 놓은 것이다.Each keyword set for the voice phishing pattern is made up of keywords that are correlated with each other, and each keyword is a pre-classified keyword that typically appears in the corresponding voice phishing pattern.
한편, 각각의 키워드 집합은 유사 키워드들을 포함하는데 유사 키워드는 철자가 다르지만 발음상의 차이로 유사한 것으로 판단될 수 있는 키워드들을 의미한다.On the other hand, each keyword set includes similar keywords, and the similar keywords indicate keywords that are different in spelling but can be judged to be similar due to difference in pronunciation.
예컨대, "검찰청, 서울지검, 검찰"은 검찰청 사칭형에서 전형적으로 나타나는 키워드들로서 검찰청 사칭형 보이스 피싱 패턴의 키워드 집합 1을 구성한다. 또한, "명의도용, 계좌"와 같은 키워드는 검찰청 사칭형 보이스 피싱 패턴의 키워드 집합 4를 구성한다. 도 2에서 "검찰청 사칭형" 보이스 피싱 패턴의 키워드 집합은 총 4개이다.For example, the "Prosecutors' Office, Seoul Prosecutors' Office, Prosecutors" constitute a keyword set 1 of the prosecution office's false-voice phishing patterns as typical keywords in the prosecution offices' Also, a keyword such as "impersonation, account" constitutes a keyword set 4 of the false-voice phishing pattern of the prosecution office. In Fig. 2, the total number of keyword sets of the "prosecuting attorney-type" voice phishing pattern is four.
키워드 분석부(20)는 도 2와 같은 보이스 피싱 패턴 데이터베이스(50)의 키워드 집합 리스트를 참조하여 수신되는 텍스트 데이터가 어떤 보이스 피싱 패턴의 어떤 키워드 집합에 포함되어 있는지를 판별한다. 수신된 텍스트 데이터가 특정 보이스 피싱 패턴의 특정 키워드 집합에 포함된 경우 해당 보이스 피싱 패턴의 식별자와 판별된 키워드를 보이스 피싱 확률 분석부(30)로 전달한다.The
여기에서, 수신된 텍스트 데이터는 복수개의 보이스 피싱 패턴의 키워드 집합에 포함될 수 있는데, 이는 특정 키워드가 복수개의 보이스 피싱 패턴의 키워드 집합들에 공통적으로 나타날 수 있기 때문이다. 이러한 경우, 보이스 피싱 확률 분석부(30)는 복수개의 보이스 피싱 패턴의 식별자를 모두 보이스 피싱 확률 분석부(30)로 전달한다.Here, the received text data may be included in a set of keywords of a plurality of voice phishing patterns, because a specific keyword may appear commonly in a plurality of sets of keyword phishing patterns. In this case, the voice
예컨대, 수신된 텍스트 데이터가 "명의도용"인 경우, 이는 도 2에서 검찰청 사칭형의 키워드 집합 4에 포함되어 있고, 또한 우체국 사칭형의 키워드 집합 3에도 포함되어 있으므로, 키워드 분석부(30)는 검찰청 사칭형의 식별자인 AA와 우체국 사칭형의 식별자인 BB를 모두 보이스 피싱 확률 분석부(30)로 전달한다.For example, when the received text data is "impersonation ", it is included in the keyword set 4 of the false office of the Attorney's Office in FIG. 2 and is also included in the post-office
보이스 피싱 확률 분석부(30)는, 상기 키워드 분석부(20)로부터 수신한 보이스 피싱 패턴의 식별자와 키워드에 기초하여 보이스 피싱 확률값을 계산하는 기능을 담당한다. The voice phishing
보이스 피싱 확률 분석부(30)는 키워드 분석부(20)로부터 전달되는 보이스 피싱 패턴 식별자와 키워드를 우선 저장하고, 현재까지 키워드 분석부(20)로부터 키워드가 전송된 횟수(r)를 확인한다. 그리고, 보이스 피싱 패턴 데이터베이스(50)를 참조하여 보이스 피싱 패턴의 키워드 집합 개수(n)을 확인한다. 여기서, r은 현재까지 검출된 키워드 집합의 갯수와 같은 의미이며, 보이스 피싱 확률 분석부(30)는 키워드 분석부(20)로부터 키워드의 전달이 시작되면 r=1로 하고, 텍스트 데이터의 분석이 완료될 때까지 키워드를 수신할 때마다 r값을 1만큼씩 증가시킨다.The voice phishing
그리고, 이를 이용하여 다음과 같은 수식을 사용하여 보이스 피싱 확률값(P)를 계산한다.Then, using this, a voice phishing probability value P is calculated using the following equation.
상기 수학식 1은 중복 순열을 이용하여 확률값을 계산하는 것을 의미한다.Equation (1) means that probability values are calculated using redundant permutation.
예컨대, 도 2의 검찰청 사칭형의 총 키워드 집합의 갯수는 4(=n)이고, 처음으로 "검찰청"이라는 키워드가 키워드 분석부(20)로부터 전달된 경우 r, 상기 수식에 해당 숫자를 대입하면, 보이스 피싱 확률값(P)는 18.75%이다.For example, when the number of the total keyword sets of the prosecution offices in FIG. 2 is 4 (= n), the keyword "Prosecutor's Office" is transmitted from the
이 후, 연속하여 키워드 분석부(20)로부터 "검찰청"이라는 키워드가 속한 키워드 집합 이외의 다른 키워드 집합에 속하는 키워드가 2개째 판별되면(r=2) 상기 수식에 의하면 보이스 피싱 확률값(P)은 43.75%가 되고 추가로 3개째의 키워드가 판별되면(r=3) 보이스 피싱 확률값(P)은 90.63%가 된다.Thereafter, if the second keyword is discriminated from the keyword analyzing unit 20 (r = 2), the voice phishing probability value P is calculated according to the above formula 43.75%, and the further third keyword is determined (r = 3), the probability of voice phishing (P) becomes 90.63%.
만약, 키워드 분석부(20)로부터 전달받은 보이스 피싱 패턴의 식별자가 복수개인 경우 보이스 피싱 확률 분석부(30)는 각각의 보이스 피싱 패턴에 대해 상기 수식을 이용하여 각각의 보이스 피싱 확률값(P)를 계산한다.If there are a plurality of identifiers of the voice phishing patterns transmitted from the
보이스 피싱 확률 분석부(30)는 보이스 피싱 확률값(P)이 계산되면 계산된 확률값과 보이스 피싱 패턴 식별자를 보이스 피싱 패턴 감지부(40)로 전달한다.The voice
보이스 피싱 패턴 감지부(40)는 보이스 피싱 확률 분석부(30)로부터 수신한 보이스 피싱 패턴 식별자 및 보이스 피싱 확률값에 기초하여 보이스 피싱 패턴을 결정하고, 결정된 보이스 피싱 패턴에 대한 보이스 피싱 패턴 정보와 보이스 피싱 확률값을 통신부(10)로 전달한다.The voice phishing
보이스 피싱 패턴 감지부(40)는 하나의 보이스 피싱 패턴 식별자 및 확률값이 수신되면 이를 그대로 통신부(10)로 전달하고, 복수개의 보이스 피싱 패턴 식별자 및 확률값이 수신되면 수신된 확률값 중 가장 높은 값에 상응하는 보이스 피싱 패턴 식별자와 확률값을 통신부(10)로 전달한다.When a voice phishing pattern identifier and a probability value are received, the voice
도 3은 도 1 내지 도 2를 참조하여 설명한 분석 장치(100)에 의해 수행되는 확률에 기반한 보이스 피싱 패턴 분석 방법의 일실시예를 나타낸 흐름도이다.FIG. 3 is a flowchart illustrating an embodiment of a method of analyzing a voice phishing pattern based on the probability performed by the analyzing
도 3을 참조하면, 우선, 요청 장치(200)가 분석 장치(100)의 통신부(10)로 텍스트 데이터를 전송한다(S100). 이 텍스트 데이터는 하나씩 전송될 수도 있고 복수개의 텍스트 데이터의 집합이 한꺼번에 전송될 수도 있다.Referring to FIG. 3, the requesting
통신부(10)는 외부의 요청 장치(200)로부터 텍스트 데이터를 수신하면 이를 키워드 분석부(20)로 전달한다(S110).When the
키워드 분석부(20)는 텍스트 데이터를 수신하면, 보이스 피싱 패턴 데이터베이스(50)에 저장된 키워드 집합 리스트를 참조하여 상기 통신부(20)로부터 수신한 텍스트 데이터에 상응하는 보이스 피싱 패턴의 식별자를 판별하고 및 텍스트 데이터에 상응하는 키워드를 보이스 피싱 확률 분석부(30)로 전달한다(S120,S130).When receiving the text data, the
보이스 피싱 확률 분석부(30)는, 식별자와 키워드를 수신하면 전술한 바와 같은 방법에 의하여 보이스 피싱 확률값(P)를 계산한다(S140).When the voice phishing
확률값(P)이 계산되면, 보이스 피싱 확률 분석부(30)는, 보이스 피싱 패턴 식별자와 확률값을 보이스 피싱 패턴 감지부(40)로 전송한다(S150).When the probability value P is calculated, the voice phishing
보이스 피싱 패턴 감지부(40)는, 보이스 피싱 확률 분석부(30)로부터 보이스 피싱 패턴 식별자 및 보이스 피싱 확률값을 수신하면, 전술한 바와 같은 방식으로, 보이스 피싱 패턴 식별자 및 확률값에 기초하여 보이스 피싱 패턴을 결정하고(S160), 결정된 보이스 피싱 패턴에 대한 보이스 피싱 패턴 정보와 보이스 피싱 확률값을 통신부(10)로 전달한다(S170).Upon receiving the voice phishing pattern identifier and the voice phishing probability value from the voice phishing
통신부(10)는 수신한 보이스 피싱 패턴 정보와 확률값을 요청 장치(200)로 전달한다(S180).The
도 4는 키워드 집합 리스트의 다른 예를 나타낸 것으로서, 본 발명의 다른 실시예를 설명하기 위한 도면이다.FIG. 4 shows another example of the keyword set list, and is a diagram for explaining another embodiment of the present invention.
도 4는 도 2의 키워드 집합 리스트와 기본적으로 동일하지만, 각 키워드 집합에 가중치가 미리 설정되어 있다는 점에서 상이하다.Fig. 4 is basically the same as the keyword set list of Fig. 2, but differs in that a weight value is preset in each keyword set.
이 가중치는 각각의 키워드 집합에 대해 중요도를 고려하여 설정해 둔 것인데, 이는 키워드 집합들의 중요도를 반영하여 보이스 피싱 패턴 확률값을 계산하기 위한 것이다.This weight is set in consideration of importance for each keyword set. This is for calculating a probability value of a voice phishing pattern to reflect the importance of the keyword sets.
이러한 가중치를 고려하여 보이스 피싱 확률 분석부(30)는 다음과 같은 수식을 이용하여 보이스 피싱 확률값을 계산할 수 있다.In consideration of this weight, the voice
여기에서 r과 n은 앞서 설명한 실시예에서와 동일하다. 즉, r은 현재까지 키워드 분석부(20)로부터 키워드가 전송된 횟수(r)이고, n은 보이스 피싱 패턴의 키워드 집합 개수(n)이다.Here, r and n are the same as in the above-described embodiment. That is, r is the number (r) of times the keyword has been transmitted from the
한편, w는 누적 가중치를 나타내는데, 누적 가중치라 함은, 키워드가 전송될 때 해당 키워드가 속한 키워드 집합에 대해 부여되어 있는 각각의 가중치를 누적하여 더한 값을 의미한다.Meanwhile, w denotes a cumulative weight. The cumulative weight means a value obtained by accumulating each weight added to a set of keywords to which the keyword belongs when the keyword is transmitted.
예컨대, 검찰청 사칭 패턴의 총 키워드 집합 갯수가 4이고, 처음으로 1개의 키워드가 검출되고 이 때의 가중치가 10%이면 상기 수학식 2에 의하여 확률값은 7.5%가 되고, 2번째 키워드가 검출되고 가중치가 20%라고 하면 누적 가중치는 30%가 된다. 그리고 이 때의 확률값은 26.25%가 된다. 다음으로 3번째 키워드가 검출되고 가중치가 30%라 하면 누적 가중치는 60%가 되고 확률값은 54.37%가 된다. 4번째로 키워드가 검출되고 가중치가 40%라고 하면 누적 가중치는 100%가 되고 이 때의 확률값은 90.63%가 된다.For example, if the total number of keyword aggregations of the prosecutor's office impersonation pattern is 4 and one keyword is detected for the first time and the weight at this time is 10%, the probability value is 7.5% according to Equation 2, Is 20%, the cumulative weight is 30%. And the probability value at this time is 26.25%. Next, if the third keyword is detected and the weight is 30%, the cumulative weight is 60% and the probability value is 54.37%. If the fourth keyword is detected and the weight is 40%, the cumulative weight becomes 100%, and the probability value at this time becomes 90.63%.
도 5는 보이스 피싱 패턴 데이터베이스(50)의 또 다른 일예를 나타낸 것으로서, 본 발명에 의한 또 다른 실시예를 설명하기 위한 도면이다.5 is a view for explaining another embodiment of the voice
도 5는 보이스 피싱 패턴 데이터베이스(50)에 저장된 키워드 집합 리스트의 다른 예로서, 보이스 피싱에 사용되는 키워드들과 각 키워드들에 대한 피싱 지수의 형태로 구비된다.FIG. 5 shows another example of the keyword set list stored in the voice
여기에서, 피싱 지수라 함은, 해당 키워드가 나타났을 때 보이스 피싱에 해당할 확률값을 의미한다. 즉, 해당 키워드와 보이스 피싱의 연관 관계를 확률값으로 나타낸 것이다. 피싱 지수는 대량의 보이스 피싱 사례를 분석하여 보이스 피싱 사례에서 해당 키워드가 존재하는 확률을 통계적으로 미리 계산해 둘 수 있다.Here, the phrase " phishing index " means a probability value corresponding to voice phishing when the keyword appears. That is, the correlation between the keyword and voice phishing is represented by a probability value. The phishing index can analyze a large number of voice phishing cases and statistically calculate the probability that the keyword exists in a voice phishing case.
이러한 키워드 집합 리스트를 이용하는 경우, 분석 장치(100)의 동작을 도 6을 참조하여 설명한다.The operation of the
도 6은 본 발명에 의한 보이스 피싱 패턴 분석 방법의 또 다른 실시예를 나타낸 흐름도이다.6 is a flowchart illustrating a method of analyzing a voice phishing pattern according to another embodiment of the present invention.
도 6을 참조하면, 도 3에서 설명한 바와 마찬가지 방식으로 키워드 분석부(20)는 텍스트 데이터를 수신한다(S100,S110).Referring to FIG. 6, the
키워드 분석부(20)는 보이스 피싱 패턴 데이터베이스(50)를 참조하여 통신부(10)로부터 수신한 텍스트 데이터가 키워드 집합 리스트에 존재하는지를 확인한다(S220).The
키워드 집합 리스트에 텍스트 데이터가 존재하는 경우, 키워드 분석부(20)는 해당 키워드 및 피싱 지수를 보이스 피싱 확률 분석부(30)로 전달한다(S230)If there is text data in the keyword set list, the
보이스 피싱 확률 분석부(30)는 수신한 키워드 및 피싱 지수를 이용하여 다음과 같은 수식에 의해 보이스 피싱 확률값을 계산한다(S240).The voice phishing
여기에서, A~N은 현재까지 나타난 키워드들의 피싱 지수를 의미한다.Here, A to N denote the phishing indexes of the keywords displayed so far.
상기 수학식은 복수개의 키워드들이 나타났을 때를 조건으로 하는 조건부 확률을 의미하는 것으로서, 해당 키워드들이 존재할 때를 조건으로 하는 조건부 확률에 의해 보이스 피싱 확률값을 계산한다는 것을 의미한다.The above expression means a conditional probability that a condition is satisfied when a plurality of keywords are present and means that a voice phishing probability value is calculated by a conditional probability that the condition exists when the corresponding keywords exist.
앞서 설명한 실시예와 마찬가지로 보이스 피싱 확률 분석부(30)는 키워드 분석부(20)로부터 텍스트 데이터가 더 이상 수신되지 않을 때까지, 텍스트 데이터가 수신될 때마다 상기 수학식 3에 의하여 계속 확률값을 계산한다. 이를 위하여 보이스 피싱 확률 분석부(30)는 이전에 수신된 키워드들을 저장하고 있으며 새로 키워드가 수신될 때마다 다시 상기 수학식 3에 의한 누적 확률값을 계산한다.As in the above-described embodiment, the voice phishing
보이스 피싱 확률값이 최종적으로 계산되면, 보이스 피싱 확률 분석부(30)는 키워드와 계산된 확률값을 보이스 피싱 패턴 감지부(40)로 전달한다(S250).When the voice phishing probability value is finally calculated, the voice phishing
보이스 피싱 패턴 감지부(40)는 수신한 키워드와 확률값에 기초하여 보이스 피싱 패턴을 결정한다(S260).The voice phishing
여기에서, 보이스 피싱 패턴은, 키워드의 출현 순서, 연속성, 횟수 및 확률값을 종합적으로 고려하여 결정될 수 있다.Here, the voice phishing pattern can be determined by comprehensively considering the appearance order, continuity, number of times, and probability value of the keyword.
예컨대, 특정 키워드들이 동일한 순서로 나타나는 경우 보이스 피싱일 확률이 높은 것으로 알려져 있다면 이를 반영하여 특정 키워드들이 동일한 순서로 출현했을 때 가중치를 부여할 수 있다.For example, if certain keywords appear in the same order, if the probability of voice phishing is known to be high, the weighting can be given when certain keywords appear in the same order.
또한, 키워드가 나타난 총 횟수에 대해서도 가중치를 부여할 수 있다.In addition, a weight can be given to the total number of times the keyword is displayed.
또한, 상기 수학식 3에 의해 계산된 확률값에 대해서도 가중치를 부여할 수 있다.In addition, weights can also be given to the probability values calculated by Equation (3).
이와 같이 보이스 피싱 패턴 감지부(40)는 복수개의 조건을 종합적으로 고려하여 최종적으로 보이스 피싱 패턴(또는 보이스 피싱 여부)을 결정할 수 있다.In this way, the voice phishing
보이스 피싱 패턴 감지부(40)는 보이스 피싱 패턴(또는 보이스 피싱 여부)이 결정되면, 결정된 패턴에 대한 보이스 피싱 패턴 정보(또는 보이스 피싱 여부 정보)와 보이스 피싱 확률값을 통신부(10)로 전달하고(S170), 통신부(10)는 수신된 정보들을 요청 장치(200)로 전달한다(S180).When the voice phishing pattern (or voice phishing) is determined, the voice phishing
이상에서, 본 발명에 의한 바람직한 실시예를 참조하여 본 발명을 설명하였으나 본 발명은 상기 실시예에 한정되는 것이 아님은 물론이다.While the present invention has been particularly shown and described with reference to exemplary embodiments thereof, it is to be understood that the invention is not limited to the disclosed exemplary embodiments.
예컨대, 보이스 피싱 확률 분석부(30)에서 보이스 피싱 확률값을 계산하는 방법으로서 설명한 상기 수학식 1 내지 수학식 3의 방법은 서로 조합하여 사용할 수 있다.For example, the methods of Equations (1) to (3) described as methods for calculating the probability of voice phishing in the voice
또한, 상기 실시예에서 요청 장치(200)는 음성 인식 기능을 구비한 이동 통신 단말기인 것으로 설명하였으나, 음성 인식을 수행하는 별도의 음성 인식 서버일 수도 있다. 이 경우, 이동 통신 단말기가 음성 신호를 음성 인식 서버로 전달하고 음성 인식 서버가 음성 인식을 수행하여 텍스트 데이터를 본 발명에 의한 보이스 피싱 패턴 분석 장치(100)로 전송할 수 있다.Also, in the above embodiment, the
또한, 본 발명은 보이스 피싱이 아닌 각종 광고, 스팸 전화 등에 적용될 수 있는데 예컨대 광고나 스팸 전화에 사용되는 키워드들을 미리 데이터베이스화해 두고 이를 이용하여 키워드를 분석함으로써 광고나 스팸 전화에 대한 정보를 사용자에게 제공할 수 있다.In addition, the present invention can be applied to various advertisements, spam phones, etc., rather than voice phishing. For example, keywords used in advertisements or spam telephones are databaseized in advance, and keywords are analyzed using the databases to provide information about advertisements or spam phones to users can do.
100...보이스 피싱 패턴 분석 장치
10...통신부
20...키워드 분석부
30...보이스 피싱 확률 분석부
40...보이스 피싱 패턴 감지부
50...보이스 피싱 패턴 데이터베이스
200...요청 장치100 ... Voice phishing pattern analyzer
10 ... communication unit
20 ... keyword analysis unit
30 ... Voice Phishing Probability Analysis Unit
40 ... voice phishing pattern detection unit
50 ... Voice phishing pattern database
200 ... request device
Claims (14)
외부의 요청 장치로부터 텍스트 데이터를 수신하여 키워드 분석부로 전달하고, 보이스 피싱 패턴 감지부로부터 전달되는 보이스 피싱 패턴 정보 및 보이스 피싱 확률값을 수신하여 요청 장치로 전달하는 통신부;
보이스 피싱 패턴 데이터베이스에 저장된 키워드 집합 리스트를 참조하여 상기 통신부로부터 수신한 텍스트 데이터에 상응하는 보이스 피싱 패턴의 식별자를 판별하고 및 텍스트 데이터에 상응하는 키워드를 보이스 피싱 확률 분석부로 전달하는 키워드 분석부;
상기 키워드 분석부로부터 수신한 보이스 피싱 패턴의 식별자와 키워드에 기초하여 보이스 피싱 확률값을 계산하는 보이스 피싱 확률 분석부;
보이스 피싱 확률 분석부로부터 상기 보이스 피싱 패턴 식별자 및 보이스 피싱 확률값을 수신하여 이들에 기초하여 보이스 피싱 패턴을 결정하고, 결정된 보이스 피싱 패턴에 대한 보이스 피싱 패턴 정보와 보이스 피싱 확률값을 통신부로 전달하는 보이스 피싱 패턴 감지부; 및
보이스 피싱 패턴에 대한 키워드 집합 리스트를 저장하는 보이스 피싱 패턴 데이터베이스
를 포함하는 보이스 피싱 패턴 분석 장치.
As a probability phonetic pattern analyzing apparatus,
A communication unit for receiving text data from an external requesting device and delivering the text data to the keyword analyzing unit, receiving the voice phishing pattern information and the voice phishing probability value transmitted from the voice phishing pattern detecting unit, and transmitting the received voice phishing pattern information and voice phishing probability value to the requesting device;
A keyword analyzer for identifying an identifier of a voice phishing pattern corresponding to the text data received from the communication unit by referring to a keyword set list stored in the voice phishing pattern database and transmitting the keyword corresponding to the text data to the voice phishing probability analyzer;
A voice phishing probability analyzing unit for calculating a voice phishing probability value based on the identifier of the voice phishing pattern received from the keyword analyzing unit and the keyword;
A voice phishing pattern identifier and a voice phishing probability value from the voice phishing probability analyzer to determine a voice phishing pattern based on the voice phishing pattern identifier and the voice phishing probability value, and voice phishing pattern information and voice phishing probability value for the determined voice phishing pattern, A pattern detection unit; And
A voice phishing pattern database storing a keyword set list of voice phishing patterns
Wherein the voice phishing pattern analyzer comprises:
상기 키워드 집합 리스트는, 각각의 보이스 피싱 패턴에 대하여 적어도 하나 이상의 키워드 집합과, 보이스 피싱 패턴에 대한 식별자 및 각 보이스 피싱 패턴에 대해 키워드 집합의 전체 갯수를 구비하는 것을 특징으로 하는 보이스 피싱 패턴 분석 장치.
The method according to claim 1,
Wherein the keyword set list includes at least one or more keyword sets for each voice phishing pattern, an identifier for the voice phishing pattern, and a total number of keywords for each voice phishing pattern.
상기 키워드 분석부는, 보이스 피싱 패턴 데이터베이스의 키워드 집합 리스트를 참조하여 수신되는 텍스트 데이터가 포함되어 있는 키워드 집합에 상응하는 보이스 피싱 패턴의 식별자와 수신된 텍스트 데이터에 상응하는 키워드를 보이스 피싱 확률 분석부로 전달하는 것을 특징으로 하는 보이스 피싱 패턴 분석 장치.
3. The method of claim 2,
The keyword analyzing unit refers to the keyword set list of the voice phishing pattern database and transmits an identifier of a voice phishing pattern corresponding to a set of keywords including received text data and a keyword corresponding to the received text data to a voice phishing probability analyzing unit Wherein the voice phishing pattern analyzing apparatus comprises:
상기 보이스 피싱 확률 분석부는,
(여기서, n은 보이스 피싱 패턴의 총 키워드 집합의 갯수, r은 현재까지 키워드 분석부(20)로부터 키워드가 전송된 횟수)
의 수식에 의하여 보이스 피싱 확률값(P)을 계산하는 것을 특징으로 하는 보이스 피싱 패턴 분석 장치.
The method according to claim 1,
Wherein the voice phishing probability analyzing unit comprises:
(Where n is the number of total keyword sets of the voice phishing pattern, and r is the number of times the keyword has been transmitted from the keyword analyzing unit 20)
Wherein the voice phishing probability value (P) is calculated by the following equation.
상기 보이스 피싱 확률 분석부는 키워드 분석부로부터 키워드의 전달이 시작되면 r=1로 하고, 텍스트 데이터의 분석이 완료될 때까지 키워드가 전달될 때마다 r을 1만큼씩 증가시키는 것을 특징으로 하는 보이스 피싱 패턴 분석 장치.
5. The method of claim 4,
Wherein the voice phishing probability analyzer increases r by 1 every time a keyword is delivered until the analysis of the text data is completed by setting r = 1 when the transmission of the keyword is started from the keyword analyzing unit, Pattern analyzer.
상기 보이스 피싱 확률 분석부는, 보이스 피싱 패턴의 식별자가 복수개인 경우 각각의 보이스 피싱 패턴에 대해 상기 수식을 이용하여 각각의 보이스 피싱 패턴 확률값(P)를 계산하는 것을 특징으로 하는 보이스 피싱 패턴 분석 장치.
6. The method of claim 5,
Wherein the voice phishing probability analyzing unit calculates each voice phishing pattern probability value (P) for each voice phishing pattern using a plurality of identifiers of the voice phishing pattern using the formula.
상기 키워드 집합 리스트는, 각각의 키워드 집합에 대해 미리 설정된 가중치를 더 구비하는 것을 특징으로 하는 보이스 피싱 패턴 분석 장치.
3. The method of claim 2,
Wherein the keyword set list further includes a predetermined weight for each keyword set.
상기 보이스 피싱 확률 분석부는,
(여기서, n은 보이스 피싱 패턴의 총 키워드 집합의 갯수, r은 현재까지 키워드 분석부(20)로부터 키워드가 전송된 횟수, w는 현재까지 검출된 키워드들의 가중치들의 합인 누적 가중치)
의 수식에 의하여 보이스 피싱 확률값(P)을 계산하는 것을 특징으로 하는 보이스 피싱 패턴 분석 장치.
8. The method of claim 7,
Wherein the voice phishing probability analyzing unit comprises:
(Where n is the number of the total keyword sets of the voice phishing pattern, r is the number of times the keyword has been transmitted from the keyword analyzing unit 20, and w is a cumulative weight which is the sum of the weights of the keywords detected so far)
Wherein the voice phishing probability value (P) is calculated by the following equation.
통신부가 외부의 요청 장치로부터 텍스트 데이터를 수신하여 키워드 분석부로 전달하는 제1 단계;
키워드 분석부가 보이스 피싱 패턴 데이터베이스에 저장된 키워드 집합 리스트를 참조하여 상기 수신한 텍스트 데이터에 상응하는 보이스 피싱 패턴의 식별자를 판별하고 및 텍스트 데이터에 상응하는 키워드를 보이스 피싱 확률 분석부로 전달하는 제2 단계;
보이스 피싱 확률 분석부가 상기 수신한 보이스 피싱 패턴의 식별자와 키워드에 기초하여 보이스 피싱 여부에 대한 확률값을 계산하는 제3 단계;
보이스 피싱 패턴 감지부가 상기 보이스 피싱 확률 분석부로부터 상기 보이스 피싱 패턴 식별자 및 보이스 피싱 패턴 확률값을 수신하고, 이들에 기초하여 보이스 피싱 패턴을 결정하고, 결정된 보이스 피싱 패턴에 대한 보이스 피싱 패턴 정보와 보이스 피싱 확률값을 통신부로 전달하는 제4 단계;
통신부가 상기 보이스 피싱 패턴 감지부로부터 수신한 보이스 피싱 패턴 정보 및 보이스 피싱 확률값을 요청 장치로 전달하는 제5 단계
를 포함하는 보이스 피싱 패턴 분석 방법.
9. A method for analyzing a voice phishing pattern performed in an apparatus according to any one of claims 1 to 8,
A first step in which the communication unit receives text data from an external request apparatus and transfers the text data to the keyword analysis unit;
A second step of discriminating an identifier of a voice phishing pattern corresponding to the received text data by referring to a keyword set list stored in a voice phishing pattern database and delivering a keyword corresponding to the text data to a voice phishing probability analyzing unit;
A third step of calculating a probability value for voice phishing based on the identifier and the keyword of the received voice phishing pattern;
The voice phishing pattern detecting unit receives the voice phishing pattern identifier and the voice phishing pattern probability value from the voice phishing probability analyzing unit, determines a voice phishing pattern based on the voice phishing pattern identifier and the voice phishing pattern probability value, A fourth step of transmitting a probability value to a communication unit;
A fifth step of communicating the voice phishing pattern information and the voice phishing probability value received from the voice phishing pattern detector to the requesting device
And analyzing the voice phishing pattern.
외부의 요청 장치로부터 텍스트 데이터를 수신하여 키워드 분석부로 전달하고, 보이스 피싱 패턴 감지부로부터 전달되는 보이스 피싱 패턴 정보 및 보이스 피싱 확률값을 수신하여 요청 장치로 전달하는 통신부;
보이스 피싱 패턴 데이터베이스에 저장된 키워드 집합 리스트를 참조하여 상기 통신부로부터 수신한 텍스트 데이터에 상응하는 키워드 및 상기 키워드에 대한 피싱 지수를 보이스 피싱 확률 분석부로 전달하는 키워드 분석부;
상기 키워드 분석부로부터 수신한 키워드 및 피싱 지수에 기초하여 보이스 피싱 확률값을 계산하는 보이스 피싱 확률 분석부;
보이스 피싱 확률 분석부로부터 키워드 및 보이스 피싱 확률값을 수신하여 이들에 기초하여 보이스 피싱 패턴을 결정하고, 결정된 보이스 피싱 패턴에 대한 보이스 피싱 패턴 정보와 보이스 피싱 확률값을 통신부로 전달하는 보이스 피싱 패턴 감지부; 및
보이스 피싱 패턴에 대한 키워드 집합 리스트를 저장하는 보이스 피싱 패턴 데이터베이스
를 포함하는 보이스 피싱 패턴 분석 장치.
As a probability phonetic pattern analyzing apparatus,
A communication unit for receiving text data from an external requesting device and delivering the text data to the keyword analyzing unit, receiving the voice phishing pattern information and the voice phishing probability value transmitted from the voice phishing pattern detecting unit, and transmitting the received voice phishing pattern information and voice phishing probability value to the requesting device;
A keyword analyzing unit for referring to a keyword set list stored in a voice phishing pattern database and transmitting a keyword corresponding to text data received from the communication unit and a phishing index for the keyword to a voice phishing probability analyzing unit;
A voice phishing probability analyzing unit for calculating a voice phishing probability value based on the keyword and the phishing index received from the keyword analyzing unit;
A voice phishing pattern detection unit for receiving a keyword and a voice phishing probability value from the voice phishing probability analysis unit, determining a voice phishing pattern based thereon, and transmitting voice phishing pattern information and a voice phishing probability value for the determined voice phishing pattern to a communication unit; And
A voice phishing pattern database storing a keyword set list of voice phishing patterns
Wherein the voice phishing pattern analyzer comprises:
상기 피싱 지수는 각각의 키워드에 대한 보이스 피싱의 연관 관계를 확률값으로 나타낸 것을 특징으로 하는 보이스 피싱 패턴 분석 장치.
11. The method of claim 10,
Wherein the phishing index indicates a correlation of voice phishing for each keyword as a probability value.
상기 보이스 피싱 확률 분석부는,
(여기에서, A~N은 키워드들의 피싱 지수임)
의 수식에 의하여 보이스 피싱 확률값(P)을 계산하는 것을 특징으로 하는 보이스 피싱 패턴 분석 장치.
12. The method of claim 11,
Wherein the voice phishing probability analyzing unit comprises:
(Where A to N are phishing indices of keywords)
Wherein the voice phishing probability value (P) is calculated by the following equation.
상기 보이스 피싱 패턴 감지부는, 키워드의 출현 순서, 연속성, 횟수 및 확률값 중 적어도 하나 이상에 기초하여 보이스 피싱 패턴 또는 보이스 피싱 여부를 결정하는 것을 특징으로 하는 보이스 피싱 패턴 분석 장치.
13. The method of claim 12,
Wherein the voice phishing pattern detecting unit determines a voice phishing pattern or voice phishing based on at least one of a sequence of occurrence of a keyword, continuity, a number of times, and a probability value.
통신부가 외부의 요청 장치로부터 텍스트 데이터를 수신하여 키워드 분석부로 전달하는 제1 단계;
키워드 분석부가 보이스 피싱 패턴 데이터베이스에 저장된 키워드 집합 리스트를 참조하여 상기 통신부로부터 수신한 텍스트 데이터에 상응하는 키워드 및 상기 키워드에 대한 피싱 지수를 보이스 피싱 확률 분석부로 전달하는 제2 단계;
보이스 피싱 확률 분석부가 상기 키워드 분석부로부터 수신한 키워드 및 피싱 지수에 기초하여 보이스 피싱 확률값을 계산하는 제3 단계;
보이스 피싱 패턴 감지부가 보이스 피싱 확률 분석부로부터 키워드 및 보이스 피싱 확률값을 수신하여 이들에 기초하여 보이스 피싱 패턴을 결정하고, 결정된 보이스 피싱 패턴에 대한 보이스 피싱 패턴 정보와 보이스 피싱 확률값을 통신부로 전달하는 제4 단계; 및
통신부가 보이스 피싱 패턴 감지부로부터 전달되는 보이스 피싱 패턴 정보 및 보이스 피싱 확률값을 수신하여 요청 장치로 전달하는 제5 단계
를 포함하는 보이스 피싱 패턴 분석 방법.A method for analyzing a voice phishing pattern performed in an apparatus for analyzing a voice phishing pattern according to any one of claims 10 to 13,
A first step in which the communication unit receives text data from an external request device and transfers the text data to the keyword analysis unit;
A second step of referring to the keyword aggregation list stored in the voice phishing pattern database and transmitting the keyword corresponding to the text data received from the communication unit and the phishing index for the keyword to the voice phishing probability analyzer;
A third step of calculating a voice phishing probability value based on the keyword and the phishing index received from the keyword analyzing unit;
A voice phishing pattern detection unit receives a keyword and a voice phishing probability value from the voice phishing probability analysis unit, determines a voice phishing pattern based on the keyword and the voice phishing probability value, and transmits voice phishing pattern information and a voice phishing probability value for the determined voice phishing pattern to a communication unit Step 4; And
A fifth step of receiving the voice phishing pattern information and the voice phishing probability value transmitted from the voice phishing pattern detecting unit by the communication unit and transmitting the received information to the requesting device
And analyzing the voice phishing pattern.
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020150096563 | 2015-07-07 | ||
KR20150096563 | 2015-07-07 | ||
KR20150096564 | 2015-07-07 | ||
KR1020150096564 | 2015-07-07 | ||
KR1020150099683 | 2015-07-14 | ||
KR20150099683 | 2015-07-14 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20170006288A true KR20170006288A (en) | 2017-01-17 |
KR101792204B1 KR101792204B1 (en) | 2017-10-31 |
Family
ID=57990469
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020160086162A KR101792204B1 (en) | 2015-07-07 | 2016-07-07 | Apparatus and method for analyzing voice phishing pattern based on probability |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101792204B1 (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210069899A (en) * | 2019-12-04 | 2021-06-14 | 주식회사 핑거 | System for detecting voice phishing |
KR102392950B1 (en) * | 2022-03-04 | 2022-04-29 | 한양대학교 산학협력단 | Voice phishing/smishing detection method |
EP4156665A1 (en) * | 2021-09-22 | 2023-03-29 | Deutsche Telekom AG | Techniques to enable protection against voice phishing of a telephone call |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006324715A (en) * | 2005-05-17 | 2006-11-30 | Aruze Corp | Calling device |
JP2011023903A (en) * | 2009-07-15 | 2011-02-03 | Fujitsu Ltd | Abnormality detector of communication terminal, and abnormality detection method of communication terminal |
-
2016
- 2016-07-07 KR KR1020160086162A patent/KR101792204B1/en active IP Right Grant
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210069899A (en) * | 2019-12-04 | 2021-06-14 | 주식회사 핑거 | System for detecting voice phishing |
EP4156665A1 (en) * | 2021-09-22 | 2023-03-29 | Deutsche Telekom AG | Techniques to enable protection against voice phishing of a telephone call |
KR102392950B1 (en) * | 2022-03-04 | 2022-04-29 | 한양대학교 산학협력단 | Voice phishing/smishing detection method |
Also Published As
Publication number | Publication date |
---|---|
KR101792204B1 (en) | 2017-10-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107566358B (en) | Risk early warning prompting method, device, medium and equipment | |
CN107872772B (en) | Method and device for detecting fraud short messages | |
KR102355973B1 (en) | Apparatus and method for detecting smishing message | |
CN102368853B (en) | Communication event processing method and system thereof | |
CN106713579B (en) | Telephone number identification method and device | |
CN110839216B (en) | Method and device for identifying communication information fraud | |
KR101795593B1 (en) | Device and method for protecting phone counselor | |
CN109345417B (en) | Online assessment method and terminal equipment for business personnel based on identity authentication | |
CN103440458B (en) | A kind of method of heuristic static identification Android system malicious code | |
CN109802915B (en) | Telecommunication fraud detection processing method and device | |
KR101792204B1 (en) | Apparatus and method for analyzing voice phishing pattern based on probability | |
CN109993044B (en) | Telecommunications fraud identification system, method, apparatus, electronic device, and storage medium | |
KR101695968B1 (en) | Method for evaluating importance of received messages and dispalying list of received messages in a mobile terminal | |
CN105827787B (en) | number marking method and device | |
CN105933876A (en) | Counterfeit short message identification method, mobile phone terminal, server, and system | |
CN105391860A (en) | Method and apparatus for processing communication request | |
KR20160100833A (en) | System and method for providing voice phishing warning service according to dangerrousness level | |
CN106127463A (en) | One is transferred accounts control method and terminal unit | |
CN108804501B (en) | Method and device for detecting effective information | |
KR20170077381A (en) | System and method for prevent voice phishing using speech recognition | |
JPWO2015194148A1 (en) | Caller identification device, caller identification method, and recording medium for storing caller identification program | |
KR101731545B1 (en) | System and method for providing voice phishing warning service during call | |
KR101033870B1 (en) | Method and device for processing spam call | |
KR102392950B1 (en) | Voice phishing/smishing detection method | |
KR101792203B1 (en) | Apparatus and method for determining voice phishing using distance between voice phishing keyword |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |