KR102606456B1 - 피싱 분석 장치 및 그 방법 - Google Patents

피싱 분석 장치 및 그 방법 Download PDF

Info

Publication number
KR102606456B1
KR102606456B1 KR1020190029941A KR20190029941A KR102606456B1 KR 102606456 B1 KR102606456 B1 KR 102606456B1 KR 1020190029941 A KR1020190029941 A KR 1020190029941A KR 20190029941 A KR20190029941 A KR 20190029941A KR 102606456 B1 KR102606456 B1 KR 102606456B1
Authority
KR
South Korea
Prior art keywords
database
phishing
conversation
voice
caller
Prior art date
Application number
KR1020190029941A
Other languages
English (en)
Other versions
KR20200109995A (ko
Inventor
김선아
박영민
이정엄
Original Assignee
현대자동차주식회사
기아 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 현대자동차주식회사, 기아 주식회사 filed Critical 현대자동차주식회사
Priority to KR1020190029941A priority Critical patent/KR102606456B1/ko
Publication of KR20200109995A publication Critical patent/KR20200109995A/ko
Application granted granted Critical
Publication of KR102606456B1 publication Critical patent/KR102606456B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/22Arrangements for supervision, monitoring or testing
    • H04M3/2281Call monitoring, e.g. for law enforcement purposes; Call tracing; Detection or prevention of malicious calls

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Technology Law (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)

Abstract

지인을 사칭한 피싱을 정확히 검출하여 착신자에게 경고 메시지를 제공하기 위한 피싱 분석 장치 및 그 방법을 제공한다.
이를 위해, 일 실시예에 따른 피싱 분석 장치는, 발신 단말기 및 착신 단말기와 통신하는 통신부; 코퍼스(Corpus) 데이터베이스, 말투 데이터베이스 및 상기 착신 단말기의 연락처 데이터베이스를 저장하는 저장부; 및 데이터를 처리하는 프로세서를 포함하는 제어부;를 포함하고, 상기 제어부는, 상기 발신 단말기로부터 통화 호가 전송되면, 상기 연락처 데이터베이스로부터 상기 발신 단말기의 전화번호에 대응하는 이름을 추출하고, 상기 코퍼스 데이터베이스를 이용하여 상기 발신 단말기로부터 전송되는 발신자의 음성 데이터에 포함된 대화 의도를 판단하고, 상기 발신자의 음성 데이터를 상기 말투 데이터베이스와 비교하여 상기 추출한 이름에 대응하는 말투와 상기 발신자의 말투 간 유사도를 산출하고, 상기 말투 간 유사도에 기초하여 상기 추출한 이름과 상기 발신자의 동일성을 판단하고, 상기 대화 의도 및 상기 추출한 이름과 발신자의 동일성에 기초하여 경고 메시지를 생성하고, 상기 경고 메시지를 상기 착신 단말기로 전송한다.

Description

피싱 분석 장치 및 그 방법{A PHISING ANALYSIS APPARATUS AND METHOD THEREOF}
본 발명은 지인을 사칭한 피싱을 검출할 수 있는 피싱 분석 장치 및 그 방법에 관한 것이다.
피싱(Phishing)은 타인의 개인정보를 이용해 사기를 친다는 의미이다. 보이스 피싱은 음성 통화(voice)를 통해 피싱을 한다는 뜻이다. '전기통신금융사기'는 피싱, 파밍, 스미싱 등을 통칭하는, 대한민국 법령에 명시된 용어로 '전기통신금융사기 피해금 환급에 관한 특별법' 등의 관련 법률이 있다.
이러한 피싱을 방지하기 위해 다양한 기술들이 제공되고 있다. 일반적인 보이스 피싱 판단 기술은 보이스 피싱에 사용된 전화번호를 원천적으로 차단하거나 '검찰', '은행' 등과 같은 보이스 피싱과 관련된 키워드를 검출함으로써 보이스 피싱 여부를 판단하고 있다.
그러나 이러한 종래 기술은 보이스 피싱에 사용된 전화번호가 아닌 경우 피싱을 방지할 수 없고, 지인을 사칭한 피싱에 대해서는 정확한 판단을 하지 못하는 문제점이 있다.
본 발명은 지인을 사칭한 피싱을 정확히 검출하여 착신자에게 경고 메시지를 제공할 수 있는 피싱 분석 장치 및 그 방법을 제공한다.
일 실시예에 따른 피싱 분석 장치는, 발신 단말기 및 착신 단말기와 통신하는 통신부; 코퍼스(Corpus) 데이터베이스, 말투 데이터베이스 및 상기 착신 단말기의 연락처 데이터베이스를 저장하는 저장부; 및 데이터를 처리하는 프로세서를 포함하는 제어부;를 포함하고, 상기 제어부는, 상기 발신 단말기로부터 통화 호가 전송되면, 상기 연락처 데이터베이스로부터 상기 발신 단말기의 전화번호에 대응하는 이름을 추출하고, 상기 코퍼스 데이터베이스를 이용하여 상기 발신 단말기로부터 전송되는 발신자의 음성 데이터에 포함된 대화 의도를 판단하고, 상기 발신자의 음성 데이터를 상기 말투 데이터베이스와 비교하여 상기 추출한 이름에 대응하는 말투와 상기 발신자의 말투 간 유사도를 산출하고, 상기 말투 간 유사도에 기초하여 상기 추출한 이름과 상기 발신자의 동일성을 판단하고, 상기 대화 의도 및 상기 추출한 이름과 발신자의 동일성에 기초하여 경고 메시지를 생성하고, 상기 경고 메시지를 상기 착신 단말기로 전송할 수 있다.
상기 제어부는 상기 대화 의도가 피싱 의도이고, 상기 추출한 이름과 상기 발신자가 동일하지 않은 것으로 판단되는 경우, 상기 경고 메시지를 생성할 수 있다.
상기 제어부는 상기 발신자의 음성 데이터를 텍스트 데이터로 변환하고, 상기 코퍼스 데이터베이스를 이용하여 피싱 의도 값을 산출하고, 상기 피싱 의도 값이 미리 정해진 값 이상인 경우, 상기 변환된 텍스트 데이터에 포함된 대화 의도가 피싱 의도인 것으로 판단할 수 있다.
상기 저장부는 상기 연락처 데이터베이스에 포함된 복수의 이름 각각에 대응하는 어휘의미패턴을 포함하는 어휘의미패턴 데이터베이스를 더 저장하고, 상기 제어부는 상기 발신 단말기의 전화번호가 상기 연락처 데이터베이스에 등록되어 있지 않은 경우, 상기 발신자의 음성 데이터를 텍스트 데이터로 변환하고, 상기 어휘의미패턴 데이터베이스를 이용하여 상기 변환된 텍스트 데이터에서 상기 이름을 추출할 수 있다.
상기 저장부는 상기 연락처 데이터베이스에 포함된 복수의 이름 각각에 대응하는 음성 데이터를 포함하는 음성 데이터베이스를 더 저장하고, 상기 제어부는 상기 발신자의 음성 데이터를 상기 음성 데이터베이스와 비교하여 상기 추출한 이름에 대응하는 음성과 상기 발신자의 음성 간 유사도를 산출하고, 상기 말투 간 유사도 및 상기 음성 간 유사도에 기초하여 상기 추출한 이름과 상기 발신자의 동일성을 판단할 수 있다.
상기 제어부는 발화 속도, 톤, 발음 및 액센트에 기초하여 상기 음성 간 유사도를 산출할 수 있다.
상기 제어부는 상기 대화 의도가 피싱 의도가 아닌 경우, 상기 발신자의 음성 데이터를 상기 음성 데이터베이스에 업데이트 할 수 있다.
상기 제어부는 상기 연락처 데이터베이스에 포함된 복수의 이름 각각과 관련된 대화 이력 데이터를 이용하여 상기 복수의 이름 별 말투 데이터를 포함하는 상기 말투 데이터베이스를 구축할 수 있다.
상기 대화 이력 데이터는 상기 착신 단말기에 저장된 문자 메시지의 내용 및 메신저 어플리케이션을 통한 대화 내용을 포함할 수 있다.
다른 실시예에 따른 피싱 분석 장치는, 발신 단말기 및 착신 단말기와 통신하는 통신부; 코퍼스 데이터베이스, 말투 데이터베이스 및 상기 착신 단말기의 연락처 데이터베이스를 저장하는 저장부; 및 데이터를 처리하는 프로세서를 포함하는 제어부;를 포함하고, 상기 제어부는, 상기 발신 단말기로부터 문자 메시지가 전송되면, 상기 연락처 데이터베이스로부터 상기 발신 단말기의 전화번호에 대응하는 이름을 추출하고, 상기 코퍼스 데이터베이스를 이용하여 상기 발신 단말기로부터 전송되는 발신자의 문자 메시지에 포함된 대화 의도를 판단하고, 상기 문자 메시지를 상기 말투 데이터베이스와 비교하여 상기 추출한 이름에 대응하는 말투와 상기 문자 메시지의 말투 간 유사도를 산출하고, 상기 말투 간 유사도에 기초하여 상기 추출한 이름과 상기 발신자의 동일성을 판단하고, 상기 대화 의도 및 상기 추출한 이름과 발신자의 동일성에 기초하여 경고 메시지를 생성하고, 상기 경고 메시지를 상기 착신 단말기로 전송할 수 있다.
상기 제어부는 상기 대화 의도가 피싱 의도이고, 상기 추출한 이름과 상기 발신자가 동일하지 않은 것으로 판단되는 경우, 상기 경고 메시지를 생성할 수 있다.
상기 저장부는 상기 연락처 데이터베이스에 포함된 복수의 이름 각각에 대응하는 어휘의미패턴을 포함하는 어휘의미패턴 데이터베이스를 더 저장하고, 상기 제어부는 상기 발신 단말기의 전화번호가 상기 연락처 데이터베이스에 등록되어 있지 않은 경우, 상기 어휘의미패턴 데이터베이스를 이용하여 상기 문자 메시지에서 상기 이름을 추출할 수 있다.
상기 제어부는 상기 말투 간 유사도가 미리 정해진 유사도 값 이상인 경우, 상기 추출한 이름과 상기 발신자가 동일한 것으로 판단할 수 있다.
상기 제어부는 상기 연락처 데이터베이스에 포함된 복수의 이름 각각과 관련된 대화 이력 데이터를 이용하여 상기 복수의 이름 별 말투 데이터를 포함하는 상기 말투 데이터베이스를 구축할 수 있다.
상기 대화 이력 데이터는 상기 착신 단말기에 저장된 문자 메시지의 내용 및 메신저 어플리케이션을 통한 대화 내용을 포함할 수 있다.
일 실시예 따른 통신부, 저장부 및 제어부를 포함하는 피싱 분석 장치에 의한 피싱 분석 방법에 있어서, 피싱 분석 방법은, 발신 단말기로부터 통화 호가 전송되면, 착신 단말기의 연락처 데이터베이스로부터 상기 발신 단말기의 전화번호에 대응하는 이름을 추출하는 단계; 상기 저장부의 코퍼스 데이터베이스를 이용하여 상기 발신 단말기로부터 전송되는 발신자의 음성 데이터에 포함된 대화 의도를 판단하는 단계; 상기 발신자의 음성 데이터를 상기 저장부의 말투 데이터베이스와 비교하여 상기 추출한 이름에 대응하는 말투와 상기 발신자의 말투 간 유사도를 산출하는 단계; 상기 말투 간 유사도에 기초하여 상기 추출한 이름과 상기 발신자의 동일성을 판단하는 단계; 상기 대화 의도 및 상기 추출한 이름과 발신자의 동일성에 기초하여 경고 메시지를 생성하는 단계; 및 상기 경고 메시지를 상기 착신 단말기로 전송하는 단계;를 포함한다.
상기 경고 메시지를 생성하는 단계는 상기 대화 의도가 피싱 의도이고, 상기 추출한 이름과 상기 발신자가 동일하지 않은 것으로 판단되는 경우, 상기 경고 메시지를 생성하는 단계;를 포함할 수 있다.
상기 대화 의도를 판단하는 단계는 상기 발신자의 음성 데이터를 텍스트 데이터로 변환하고, 상기 코퍼스 데이터베이스를 이용하여 피싱 의도 값을 산출하는 단계; 및 상기 피싱 의도 값이 미리 정해진 값 이상인 경우, 상기 변환된 텍스트 데이터에 포함된 대화 의도가 피싱 의도인 것으로 판단하는 단계;를 포함할 수 있다.
상기 저장부는 상기 연락처 데이터베이스에 포함된 복수의 이름 각각에 대응하는 어휘의미패턴을 포함하는 어휘의미패턴 데이터베이스를 더 저장하고, 상기 이름을 추출하는 단계는 상기 발신 단말기의 전화번호가 상기 연락처 데이터베이스에 등록되어 있지 않은 경우, 상기 발신자의 음성 데이터를 텍스트 데이터로 변환하는 단계; 및 상기 어휘의미패턴 데이터베이스를 이용하여 상기 변환된 텍스트 데이터에서 상기 이름을 추출하는 단계;를 포함할 수 있다.
상기 저장부는 상기 연락처 데이터베이스에 포함된 복수의 이름 각각에 대응하는 음성 데이터를 포함하는 음성 데이터베이스를 더 저장하고, 일 실시예에 따른 피싱 분석 방법은, 상기 발신자의 음성 데이터를 상기 음성 데이터베이스와 비교하여 상기 추출한 이름에 대응하는 음성과 상기 발신자의 음성 간 유사도를 산출하는 단계;를 더 포함하고, 상기 발신자의 동일성을 판단하는 단계는 상기 말투 간 유사도 및 상기 음성 간 유사도에 기초하여 상기 추출한 이름과 상기 발신자의 동일성을 판단하는 단계;를 포함할 수 있다.
상기 음성 간 유사도를 산출하는 단계는 발화 속도, 톤, 발음 및 액센트에 기초하여 상기 음성 간 유사도를 산출하는 단계;를 포함할 수 있다.
일 실시예에 따른 피싱 분석 방법은, 상기 대화 의도가 피싱 의도가 아닌 경우, 상기 발신자의 음성 데이터를 상기 음성 데이터베이스에 업데이트 하는 단계;를 더 포함할 수 있다.
일 실시예에 따른 피싱 분석 방법은, 상기 연락처 데이터베이스에 포함된 복수의 이름 각각과 관련된 대화 이력 데이터를 이용하여 상기 복수의 이름 별 말투 데이터를 포함하는 상기 말투 데이터베이스를 구축하는 단계;를 더 포함할 수 있다.
상기 대화 이력 데이터는 상기 착신 단말기에 저장된 문자 메시지의 내용 및 메신저 어플리케이션을 통한 대화 내용을 포함할 수 있다.
다른 실시예에 따른 통신부, 저장부 및 제어부를 포함하는 피싱 분석 장치에 의한 피싱 분석 방법에 있어서, 피싱 분석 방법은, 발신 단말기로부터 문자 메시지가 전송되면, 착신 단말기의 연락처 데이터베이스로부터 상기 발신 단말기의 전화번호에 대응하는 이름을 추출하는 단계; 상기 저장부의 코퍼스 데이터베이스를 이용하여 상기 발신 단말기로부터 전송되는 발신자의 문자 메시지에 포함된 대화 의도를 판단하는 단계; 상기 발신자의 문자 메시지를 상기 저장부의 말투 데이터베이스와 비교하여 상기 추출한 이름에 대응하는 말투와 상기 문자 메시지의 말투 간 유사도를 산출하는 단계; 상기 말투 간 유사도에 기초하여 상기 추출한 이름과 상기 발신자의 동일성을 판단하는 단계; 상기 대화 의도 및 상기 추출한 이름과 발신자의 동일성에 기초하여 경고 메시지를 생성하는 단계; 및 상기 경고 메시지를 상기 착신 단말기로 전송하는 단계;를 포함할 수 있다.
상기 경고 메시지를 생성하는 단계는 상기 대화 의도가 피싱 의도이고, 상기 추출한 이름과 상기 발신자가 동일하지 않은 것으로 판단되는 경우, 상기 경고 메시지를 생성하는 단계;를 포함할 수 있다.
상기 저장부는 상기 연락처 데이터베이스에 포함된 복수의 이름 각각에 대응하는 어휘의미패턴을 포함하는 어휘의미패턴 데이터베이스를 더 저장하고, 상기 이름을 추출하는 단계는 상기 발신 단말기의 전화번호가 상기 연락처 데이터베이스에 등록되어 있지 않은 경우, 상기 어휘의미패턴 데이터베이스를 이용하여 상기 문자 메시지에서 상기 이름을 추출하는 단계;를 포함할 수 있다.
상기 발신자의 동일성을 판단하는 단계는 상기 말투 간 유사도가 미리 정해진 유사도 값 이상인 경우, 상기 추출한 이름과 상기 발신자가 동일한 것으로 판단하는 단계;를 포함할 수 있다.
다른 실시예에 따른 피싱 분석 방법은, 상기 연락처 데이터베이스에 포함된 복수의 이름 각각과 관련된 대화 이력 데이터를 이용하여 상기 복수의 이름 별 말투 데이터를 포함하는 상기 말투 데이터베이스를 구축하는 단계;를 더 포함할 수 있다.
상기 대화 이력 데이터는 상기 착신 단말기에 저장된 문자 메시지의 내용 및 메신저 어플리케이션을 통한 대화 내용을 포함할 수 있다.
일 실시예에 따른 피싱 분석 장치 및 그 방법은, 지인을 사칭한 피싱을 정확히 검출하여 착신자에게 경고 메시지를 제공할 수 있다. 따라서 전기통신금융사기에 의한 피해를 예방할 수 있다.
또한, 일 실시예에 따른 피싱 분석 장치 및 그 방법은, 딥러닝 알고리즘을 적용하여 지인을 사칭한 피싱인지 여부를 보다 정확하게 검출할 수 있다.
도 1은 일 실시예에 따른 피싱 분석 장치를 포함하는 피싱 분석 시스템을 나타내는 도면이다.
도 2는 일 실시예에 따른 피싱 분석 장치의 구성을 도시한다.
도 3은 일 실시예에 따른 착신 단말기의 구성을 도시한다.
도 4는 일 실시예에 따른 피싱 분석 장치의 제어부를 구체적으로 도시한다.
도 5는 일 실시예에 따른 피싱 분석 장치의 저장부에 저장되는 데이터베이스들을 도시한다.
도 6은 일 실시예에 따른 피싱 분석 방법을 설명하는 순서도이다.
도 7은 다른 실시예에 따른 피싱 분석 방법을 설명하는 순서도이다.
명세서 전체에 걸쳐 동일 참조 부호는 동일 구성요소를 지칭한다. 본 명세서가 실시예들의 모든 요소들을 설명하는 것은 아니며, 본 발명이 속하는 기술분야에서 일반적인 내용 또는 실시예들 간에 중복되는 내용은 생략한다.
명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 직접적으로 연결되어 있는 경우뿐 아니라, 간접적으로 연결되어 있는 경우를 포함하고, 간접적인 연결은 무선 통신망을 통해 연결되는 것을 포함한다.
또한, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.
단수의 표현은 문맥상 명백하게 예외가 있지 않는 한, 복수의 표현을 포함한다.
또한, "~부", "~기", "~블록", "~부재", "~모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미할 수 있다. 예를 들어, 상기 용어들은 FPGA(Field-Programmable Gate Array) / ASIC(Application Specific Integrated Circuit) 등 적어도 하나의 하드웨어, 메모리에 저장된 적어도 하나의 소프트웨어 또는 프로세서에 의하여 처리되는 적어도 하나의 프로세스를 의미할 수 있다.
각 단계들에 붙여지는 부호는 각 단계들을 식별하기 위해 사용되는 것으로 이들 부호는 각 단계들 상호 간의 순서를 나타내는 것이 아니며, 각 단계들은 문맥상 명백하게 특정 순서를 기재하지 않는 이상 명기된 순서와 다르게 실시될 수 있다.
이하에서는 첨부된 도면을 참조하여 피싱 분석 장치 및 그 방법에 관한 실시예를 상세하게 설명하도록 한다.
도 1은 일 실시예에 따른 피싱 분석 시스템을 나타내는 도면이다.
도 1을 참조하면, 일 실시예에 따른 피싱 분석 시스템(1)은, 피싱 분석 장치(10), 발신 단말기(20) 및 착신 단말기(30)를 포함할 수 있다.
피싱 분석 장치(10)는, 네트워크(40)를 통하여 발신 단말기(20) 및 착신 단말기(30)와 통신할 수 있다. 피싱 분석 장치(10)는 무선 통신 또는 유선 통신을 통하여 네트워크(40)에 연결될 수 있다. 발신 단말기(20) 및 착신 단말기(30) 또한 무선 통신 또는 유선 통신을 통하여 네트워크(40)에 연결될 수 있다.
무선 통신은, 5G(5th Generation), LTE, LTE-A(LTE Advance), CDMA(Code Division Multiple Access), WCDMA(Wideband CDMA), UMTS(Universal Mobile Telecommunications System), WiBro(wireless broadband), 또는 GSM(Global System for Mobile communications) 등을 사용하는 셀룰러 통신을 포함할 수 있다.
또한, 무선 통신은 WiFi(wireless fidelity), 블루투스, 블루투스 저전력(BLE), 지그비(zigbee), NFC(Near Field Communication), 자력 시큐어 트랜스미션(magnetic secure transmission), 라디오 프리퀀시(RF), 또는 보디 에어리어 네트워크(BAN) 등을 포함할 수 있다.
또한, 무선 통신은 GNSS를 포함할 수 있다. GNSS는, GPS(Global Positioning System), Glonass(global navigation satellite system), beidou navigation satellite system(이하 "Beidou") 또는 galileo, the european global satellite-based navigation system일 수 있다.
유선 통신은, USB(Universal Serial Bus), HDMI(High Definition Multimedia Interface), RS-232(Recommended Standard-232), 전력선 통신, 또는 POTS(Plain Old Telephone Service) 등을 포함할 수 있다.
네트워크(40)는 텔레커뮤니케이션 네트워크, 컴퓨터 네트워크(예: LAN 또는 WAN), 인터넷 또는 텔레폰 네트워크 등을 포함할 수 있다.
피싱 분석 장치(10)는 서버에 해당하는 장치일 수 있다. 피싱 분석 장치(10)는 발신 단말기(20)와 착신 단말기(30) 간에 통신 채널을 연결하는 호 처리 서버를 포함할 수 있고, 데이터를 처리하는 데이터 처리 서버를 포함할 수 있다. 피싱 분석 장치(10)는 피싱 분석 서버로 정의될 수도 있다.
피싱 분석 장치(10)는 발신 단말기(20)로부터 전송되는 음성 데이터 또는 문자 메시지를 분석하여 착신 단말기(30)를 소유한 사람의 지인을 사칭하는 피싱인지 판단할 수 있고, 피싱이 검출될 경우 경고 메시지를 생성하여 착신 단말기(30)에 전송할 수 있다.
발신 단말기(20) 및/또는 착신 단말기(30)는 사용자가 보유하는 휴대 단말기 또는 고정 단말기를 포함할 수 있다. 휴대 단말기는 휴대가 용이하게 이동 가능한 전자기기로서, 화상전화기, 휴대폰, 스마트 폰(smart phone), WCDMA(Wideband Code Division Multiple Access) 단말기, UMTS(Universal Mobile Telecommunication Service) 단말기, PDA(Personal Digital Assistant), PMP(Portable Multimedia Player), DMB(Digital Multimedia Broadcasting) 단말기, E-Book, 휴대용 컴퓨터(Notebook, Tablet 등) 또는 디지털 카메라(Digital Camera) 등을 포함할 수 있다. 고정 단말기는 특정 위치에 고정되어 사용될 수 있는 전자기기로서, 데스크 탑(desktop) 개인용 컴퓨터, 스마트 TV 등을 포함할 수 있다.
한편, 피싱 분석 장치(10) 및/또는 착신 단말기(30)는 차량(미도시)에 마련될 수 있다.
도 2는 일 실시예에 따른 피싱 분석 장치(10)의 구성을 도시한다.
도 2를 참조하면, 피싱 분석 장치(10)는 통신부(110), 제어부(120) 및 저장부(130)를 포함할 수 있다.
통신부(110)는 제어부(120)의 제어에 따라 발신 단말기(20) 및 착신 단말기(30)와 통신을 수행할 수 있다. 통신부(110)는 상술한 다양한 통신 방식이 적용 가능한 통신 모듈 또는 통신 회로일 수 있다.
제어부(120)는 피싱 분석 장치(10)의 작동과 관련된 프로그램이 저장된 적어도 하나의 메모리 및/또는 프로그램을 실행시키는 적어도 하나의 프로세서를 포함할 수 있다. 메모리 및/또는 프로세서가 복수인 경우에, 이들이 하나의 칩에 집적되는 것도 가능하고, 물리적으로 분리된 위치에 마련되는 것도 가능하다. 제어부(120)는 통신부(110) 및 저장부(130)의 작동을 제어할 수 있다.
저장부(130)는 데이터 및/또는 정보를 저장하는 메모리에 해당할 수 있다. 저장부(130)는 각종 데이터 및/또는 정보를 저장하기 위해 캐쉬, ROM(Read Only Memory), PROM(Programmable ROM), EPROM(Erasable Programmable ROM), EEPROM(Electrically Erasable Programmable ROM) 및 플래쉬 메모리(Flash memory)와 같은 비휘발성 메모리 소자 또는 RAM(Random Access Memory)과 같은 휘발성 메모리 소자 또는 하드디스크 드라이브(Hard Disk Drive, HDD), CD-ROM과 같은 저장 매체로 구현될 수 있다.
도 3은 일 실시예에 따른 착신 단말기의 구성을 도시한다.
도 3을 참조하면, 착신 단말기(30)는 통신부(31), 저장부(32), 입력부(33), 출력부(34) 및 제어부(35)를 포함할 수 있다.
통신부(31)는 상술한 피싱 분석 장치(10)의 통신부(110)와 같은 역할을 수행할 수 있다. 통신부(31)는 다양한 통신 방식이 적용 가능한 통신 모듈 또는 통신 회로일 수 있다.
저장부(32)는 데이터 및/또는 정보를 저장하는 메모리에 해당할 수 있다. 저장부(32)는 피싱 분석 장치(10)의 저장부(130)와 동일하게 각종 저장 매체로 구현될 수 있다.
입력부(33)는 사용자로부터 각종 정보를 입력 받기 위한 장치일 수 있다. 예를 들면, 입력부(33)는 마이크, 버튼, 터치 패드 등을 포함할 수 있다. 착신 단말기(30)가 스마트폰일 경우, 입력부(33)는 터치 스크린 패널(Touch Screen Panel: TSP)로 구현될 수도 있다.
출력부(34)는 디스플레이 및/또는 스피커를 포함할 수 있다. 디스플레이 및/또는 스피커는 사용자의 발화에 대한 응답, 사용자에 대한 질의 또는 사용자에게 제공할 정보 뿐만 아니라 사용자에 대한 의사 확인, 통화 상대방의 발화에 대한 응답를 시각적 또는 청각적으로 출력할 수 있다. 또한, 출력부(34)는 피싱에 대한 경고 메시지를 출력할 수 있다.
제어부(35)는 통신부(31), 저장부(32), 입력부(33) 및 출력부(34)를 제어할 수 있다. 제어부(35)는 착신 단말기(30)의 작동과 관련된 프로그램이 저장된 적어도 하나의 메모리 및/또는 프로그램을 실행시키는 적어도 하나의 프로세서를 포함할 수 있다.
한편, 도시하지는 않았으나, 발신 단말기(20)도 착신 단말기(30)와 동일한 구성을 포함할 수 있다.
피싱 분석 장치(10)에 의해 수행되는 피싱 분석 방법은 소프트웨어로 구현될 수 있다. 피싱 분석 방법이 소프트웨어로 구현되는 경우, 소프트웨어가 착신 단말기(30)에 설치될 수 있고, 착신 단말기(30)에 의해 피싱 분석이 수행될 수도 있다.
도 4는 일 실시예에 따른 피싱 분석 장치의 제어부를 구체적으로 도시한다. 도 5는 일 실시예에 따른 피싱 분석 장치의 저장부에 저장되는 데이터베이스들을 도시한다.
도 4를 참조하면, 피싱 분석 장치(10)의 제어부(120)는 신상 확인 모듈(121), 의도 판단 모듈(122), 음성 매칭 모듈(123), 말투 매칭 모듈(124) 및 경고 메시지 생성 모듈(125)를 포함할 수 있다. 각 모듈은 특정 기능을 수행하고, 소프트웨어 또는 하드웨어로 구현될 수 있다.
도 5를 참조하면, 저장부(130)는 연락처 데이터베이스(Database, DB)(131), 코퍼스 데이터베이스(132) 및 말투 데이터베이스(135)를 포함할 수 있다. 또한, 저장부(130)는 어휘의미패턴 데이터베이스(133) 및 음성 데이터베이스(134)를 더 포함할 수 있다. 각각의 데이터베이스는 제어부(120)의 제어에 따라 업데이트 될 수 있다.
연락처 데이터베이스(131)는 착신 단말기(30)에 저장된 전화번호 및 이름 정보를 저장한 것을 의미한다.
코퍼스(Corpus) 데이터베이스(132)는 말뭉치 데이터베이스를 의미하는 것으로서, 말뭉치는 구조를 이루고 있는 텍스트의 집합을 의미한다. 즉, 코퍼스 데이터베이스(132)는 실제 사람들이 발화한 말이나 작성한 글을 모아놓은 방대한 데이터베이스를 말한다. 코퍼스 데이터베이스(132)에는 텍스트가 내용 또는 의도 별로 분류되어 저장될 수 있다. 즉, 코퍼스 데이터베이스(132)는 피싱 의도를 갖는 말뭉치를 구별하여 저장할 수 있다.
어휘의미패턴 데이터베이스(133)는 연락처 데이터베이스(131)에 포함된 복수의 이름 각각에 대응하는 어휘의미패턴(LSP: Lexico-semantic-pattern)을 포함한다. 어휘의미패턴 데이터베이스(133)는 이름을 말하는 다양한 문장들을 어휘의미패턴으로 저장한다.
어휘의미패턴(LSP: Lexico-semantic-pattern)은, 텍스트에 포함된 어휘, 형태소, 품사 등의 정보와 구문 구조를 컴퓨터 장치가 인식 가능한 규칙으로 변환한 것을 말한다. 컴퓨터 장치는 이러한 어휘의미패턴을 이용하여 자연어를 처리할 수 있다.
예를 들면, '김연아입니다.' 또는 '연아입니다.'라는 문장을 어휘의미패턴으로 나타내면, '<person>+어미'와 같이 될 수 있다.
제어부(120)는 어휘의미패턴에 변수를 할당하여 어휘의미패턴을 재구성할 수 있고, 변수가 할당된 어휘의미패턴을 추출하여 특정 어휘나 표현을 추출할 수 있다. 예를 들면, 제어부(120)는 <person>에 변수를 할당하여 <&person>으로 재구성하고 이를 추출할 수 있다. 따라서 제어부(120)는 발신자의 음성 데이터 또는 문자 메시지로부터 이름을 추출할 수 있다.
음성 데이터베이스(134)는 연락처 데이터베이스(131)에 포함된 복수의 이름 각각에 대응하는 음성 데이터를 포함한다. 예를 들면, 연락처 데이터베이스(131)에 저장된 '김연아'의 음성 데이터가 저장될 수 있다. 음성 데이터는 발화 속도, 톤, 발음 및 액센트를 포함할 수 있다. 사람은 개개인마다 고유의 음성 특성(발화 속도, 톤, 발음 및 액센트)을 가지고 있으므로, 이러한 음성 데이터를 이용하여 연락처에 있는 이름과 발신자가 동일인인지 판단할 수 있다.
일 실시예에 있어서, 피싱 분석 방법이 어플리케이션으로 구현되는 경우, 피싱 분석 장치(10) 또는 착신 단말기(30)는, 착신 단말기(30)에 피싱 분석 어플리케이션이 설치되는 시점부터 음성 데이터베이스(134)를 구축할 수 있다. 즉, 피싱 분석 장치(10) 또는 착신 단말기(30)는, 착신 단말기(30)에 피싱 분석 어플리케이션이 설치된 이후 발생하는 통화를 기록하고, 음성 데이터베이스(134)를 구축할 수 있다.
한편, 음성 데이터베이스(134)는 발신자의 대화 의도가 피싱 의도가 아닌 경우 업데이트 될 수 있다. 즉, 제어부(120)는 피싱 의도가 포함되지 않은 발신자의 음성 데이터를 음성 데이터베이스(134)에 업데이트 할 수 있다.
말투 데이터베이스(135)는 연락처 데이터베이스(131)에 포함된 복수의 이름 각각에 대응하는 말투 데이터를 포함한다. 사람은 개개인마다 자주 사용하는 어휘가 다르고, 그에 따라 사람마다 말투가 다르게 된다. 동일한 의미를 나타내는 표현일지라도 사람마다 사용하는 어휘가 다를 수 있다. 즉, 말투 데이터베이스(135)는 연락처 데이터베이스(131)에 포함된 복수의 이름 별 말투 데이터를 포함할 수 있다.
말투 데이터베이스(135)는 연락처 데이터베이스(131)에 포함된 복수의 이름 각각과 관련된 대화 이력 데이터를 이용하여 구축될 수 있다. 대화 이력 데이터는 착신 단말기(30)에 저장된 문자 메시지의 내용 및 메신저 어플리케이션을 통한 대화 내용을 포함할 수 있다.
다시 말해, 제어부(120)는 착신 단말기(30)에 저장되어 있는 대화 이력 데이터를 이용하여 말투 데이터베이스(135)를 생성할 수 있다. 또한, 제어부(120)는 착신 단말기(30)에 새로 저장된 문자 메시지의 내용 및/또는 메신저 어플리케이션의 대화 내용을 분석하여 말투 데이터베이스(135)를 업데이트 할 수 있다.
한편, 문자 메시지는 메신저 어플리케이션을 통해 송수신되는 텍스트 메시지를 포함하는 것으로 정의될 수 있다. 각각의 데이터베이스는 매트릭스 또는 테이블 형태로 구현될 수 있다.
다시 도 4를 참조하면, 신상 확인 모듈(121)은 발신 단말기(10)로부터 통화 호가 전송되면, 연락처 데이터베이스(131)로부터 발신 단말기(10)의 전화번호에 대응하는 이름을 추출할 수 있다. 또한, 신상 확인 모듈(121)은 발신 단말기(10)로부터 문자 메시지가 전송되면, 연락처 데이터베이스(131)로부터 발신 단말기(10)의 전화번호에 대응하는 이름을 추출할 수 있다.
한편, 신상 확인 모듈(121)은 발신 단말기(10)의 전화번호가 연락처 데이터베이스(131)에 등록되어 있지 않은 경우, 발신자의 음성 데이터를 텍스트 데이터로 변환하고, 어휘의미패턴 데이터베이스(133)를 이용하여 변환된 텍스트 데이터에서 이름을 추출할 수 있다. 또한, 신상 확인 모듈(131)은 어휘의미패턴 데이터베이스(133)를 이용하여 문자 메시지에서 이름을 추출할 수 있다.
지인 사칭 피싱의 경우, 연락처 데이터베이스(131)에 등록되어 있지 않은 전화번호를 이용하면서 자신이 지인에 해당한다고 말할 수 있다. 제어부(120)는 음성 데이터 또는 문자 메시지로부터 이름을 추출하여 연락처 데이터베이스(131)에 존재하는 이름인지 확인할 수 있다.
한편, 신상 확인 모듈(121)은 딥러닝 알고리즘을 이용하여 이름을 발화하는 다양한 문장을 학습할 수 있고, 학습을 통해 이름을 보다 정확하게 추출할 수 있다.
이후, 발신자가 추출한 이름의 지인과 동일한 인물인지 판단하는 과정이 필요하다. 이름과 발신자의 동일성은 음성 매칭 모듈(123) 및 말투 매칭 모듈(124) 중 적어도 하나에 의해 수행될 수 있다.
의도 판단 모듈(122)는 코퍼스 데이터베이스(132)를 이용하여 발신 단말기(10)로부터 전송되는 발신자의 음성 데이터에 포함된 대화 의도를 판단할 수 있다. 의도 판단 모듈(122)는 코퍼스 데이터베이스(132)를 이용하여 발신 단말기(10)로부터 전송되는 발신자의 문자 메시지에 포함된 대화 의도를 판단할 수 있다.
상술한 바와 같이, 코퍼스 데이터베이스(132)는 피싱 의도를 갖는 말뭉치를 포함하고 있다. 의도 판단 모듈(122)은 발신자의 음성 데이터를 텍스트 데이터로 변환하고, 코퍼스 데이터베이스(132)를 참조하여 변환된 텍스트 데이터에 포함된 대화 의도가 피싱 의도인지 판단할 수 있다.
예를 들면, 발신자의 음성 데이터에 '돈' 및/또는 '금융'과 관련된 내용이 포함되어 있을 경우, 피싱 의도가 있는 것으로 판단될 수 있다. 그러나 지인들 간 대화 내용에도 '돈' 및/또는 '금융'과 관련된 내용이 포함될 수 있으므로, 피싱 의도가 있는 것으로 판단되는 경우 발신자가 지인과 동일 인물인지 확인할 필요가 있다.
의도 판단 모듈(122)은 피싱 의도 값을 산출할 수 있다. 의도 판단 모듈(122)은 피싱 의도 값을 TRUE 또는 FALSE로 산출할 수 있다. 피싱 의도 값이 TRUE인 경우, 대화 의도가 피싱 의도인 것으로 판단될 수 있다. 또한, 피싱 의도 값이 FALSE인 경우, 대화 의도가 피싱 의도가 아닌 일반 대화 의도인 것으로 판단될 수 있다.
의도 판단 모듈(122)은 피싱 의도 값을 수치로 산출할 수도 있다. 예를 들면, 의도 판단 모듈(122)은 피싱 의도 값을 확률 값으로 산출할 수 있다. 의도 판단 모듈(122)은 피싱 의도 값이 미리 정해진 값 이상인 경우, 대화 의도가 피싱 의도인 것으로 판단할 수 있다.
의도 판단 모듈(122)은 딥러닝 알고리즘을 이용하여 피싱 의도를 갖는 다양한 텍스트를 학습할 수 있고, 학습을 통해 보다 정확하게 피싱 의도를 검출할 수 있다.
음성 매칭 모듈(123)은 발신자의 음성 데이터를 음성 데이터베이스(134)와 비교하여 추출한 이름에 대응하는 음성과 발신자의 음성 간 유사도를 산출할 수 있다.
상술한 바와 같이, 음성 데이터베이스(134)는 연락처 데이터베이스(131)에 포함된 복수의 이름 각각에 대응하는 음성 데이터를 포함한다. 음성 매칭 모듈(123)은 복수의 이름 각각에 대응하는 지인들의 고유한 음성 특성(발화 속도, 톤, 발음 및 액센트)과 발신자의 음성 데이터에 포함된 발신자의 음성 특성을 비교하고, 추출한 이름과 발신자의 동일성을 판단할 수 있다.
음성 매칭 모듈(123)은 음성 간 유사도를 TRUE 또는 FALSE로 산출할 수 있다. 음성 간 유사도가 TRUE인 경우, 추출한 이름과 발신자는 동일인인 것으로 판단될 수 있다. 또한, 음성 간 유사도가 FALSE인 경우, 추출한 이름과 발신자는 동일인이 아닌 것으로 판단될 수 있다.
음성 매칭 모듈(123)은 음성 간 유사도를 수치로 산출할 수도 있다. 예를 들면, 음성 매칭 모듈(123)은 음성 간 유사도를 확률 값으로 산출할 수 있다. 음성 매칭 모듈(123)은 음성 간 유사도가 미리 정해진 값 이상인 경우, 추출한 이름과 발신자는 동일인인 것으로 판단할 수 있다.
음성 매칭 모듈(123)은 딥러닝 알고리즘을 이용하여 음성 데이터를 학습할 수 있고, 학습을 통해 보다 정확하게 동일 또는 유사한 음성을 검출할 수 있다.
딥러닝 알고리즘은 합성곱 신경망(Convolutional Neural Network, CNN), 순환 신경망(Recurrent Neural Network, RNN) 등을 포함할 수 있다. 이러한 딥러닝 알고리즘은 널리 알려진 기술이므로 자세한 설명을 생략한다.
말투 매칭 모듈(124)은 발신자의 음성 데이터를 말투 데이터베이스(135)와 비교하여 추출한 이름에 대응하는 말투와 발신자의 말투 간 유사도를 산출할 수 있다. 말투 매칭 모듈(124)은 의도 판단 모듈(122)에 의해 음성 데이터가 변환된 텍스트 데이터를 말투 데이터베이스(135)와 비교하고, 말투 간 유사도를 산출할 수 있다.
또한, 말투 매칭 모듈(124)은 발신자의 문자 메시지를 말투 데이터베이스(135)와 비교하고, 말투 간 유사도를 산출할 수 있다.
상술한 바와 같이, 말투 데이터베이스(135)는 연락처 데이터베이스(131)에 포함된 복수의 이름 각각에 대응하는 말투 데이터를 포함한다. 말투 매칭 모듈(124)은 복수의 이름 각각에 대응하는 지인들의 고유한 말투와 발신자의 말투를 비교하고, 추출한 이름과 발신자 간의 동일성을 판단할 수 있다.
말투 매칭 모듈(124)은 말투 간 유사도를 TRUE 또는 FALSE로 산출할 수 있다. 말투 간 유사도가 TRUE인 경우, 추출한 이름과 발신자는 동일인인 것으로 판단될 수 있다. 또한, 말투 간 유사도가 FALSE인 경우, 추출한 이름과 발신자는 동일인이 아닌 것으로 판단될 수 있다.
말투 매칭 모듈(124)은 말투 간 유사도를 수치로 산출할 수도 있다. 예를 들면, 말투 매칭 모듈(124)은 말투 간 유사도를 확률 값으로 산출할 수 있다. 말투 매칭 모듈(124)은 말투 간 유사도가 미리 정해진 값 이상인 경우, 추출한 이름과 발신자는 동일인인 것으로 판단할 수 있다.
말투 매칭 모듈(124)은 딥러닝 알고리즘을 이용하여 말투 데이터를 학습할 수 있고, 학습을 통해 보다 정확하게 동일 또는 유사한 말투를 검출할 수 있다.
경고 메시지 생성 모듈(125)은 대화 의도 및 추출한 이름과 발신자의 동일성에 기초하여 경고 메시지를 생성할 수 있다. 또한, 경고 메시지 생성 모듈(125)은 생성한 경고 메시지를 착신 단말기(30)로 전송할 수 있다.
경고 메시지 생성 모듈(125)은, 대화 의도가 피싱 의도이고, 추출한 이름과 발신자가 동일하지 않은 것으로 판단되는 경우, 경고 메시지를 생성할 수 있다.
경고 메시지 생성 모듈(125)은, 말투 간 유사도 및 음성 간 유사도 중 적어도 하나가 미리 정해진 유사도 값 미만인 경우, 경고 메시지를 생성할 수 있다.
경고 메시지 생성 모듈(125)은, 문자, 이미지, 음성 및 진동 중 적어도 하나를 포함하는 경고 메시지를 생성할 수 있다.
도 6은 일 실시예에 따른 피싱 분석 방법을 설명하는 순서도이다.
도 6을 참조하면, 피싱 분석 장치(10)의 통신부(110)는 발신 단말기(10)로부터 발신된 통화 호를 수신할 수 있다(501). 이후, 피싱 분석 장치(10)의 제어부(120)는 발신 단말기(10)의 전화번호가 연락처 데이터베이스(131)에 등록된 전화번호인지 판단한다(502).
제어부(120)는, 발신 단말기(10)의 전화번호가 연락처 데이터베이스(131)에 등록된 전화번호인 경우, 연락처 데이터베이스(131)로부터 발신 단말기(10)의 전화번호에 대응하는 이름을 추출한다(503). 이후 제어부(120)는, 발신자의 음성 데이터를 텍스트 데이터로 변환한다(504).
한편, 제어부(120)는, 발신 단말기(10)의 전화번호가 연락처 데이터베이스(131)에 등록되어 있지 않은 경우, 발신자의 음성 데이터를 텍스트 데이터로 변환하고, 어휘의미패턴 데이터베이스(133)를 이용하여 변환된 텍스트 데이터에서 이름을 추출한다(505).
제어부(120)는, 코퍼스 데이터베이스(132)를 참조하여 변환된 텍스트 데이터에 포함된 대화 의도가 피싱 의도인지 판단할 수 있다. 제어부(120)는, 피싱 의도 값을 산출할 수 있다(506).
제어부(120)는, 피싱 의도 값을 기초로 대화 의도가 피싱 의도인 것으로 판단되면, 발신자의 음성 데이터를 음성 데이터베이스(134)와 비교하여 추출한 이름에 대응하는 음성과 발신자의 음성 간 유사도를 산출한다(508).
제어부(120)는, 발신자의 음성 데이터가 변환된 텍스트 데이터를 말투 데이터베이스(135)와 비교하여 추출한 이름에 대응하는 말투와 발신자의 말투 간 유사도를 산출한다(509).
제어부(120)는, 말투 간 유사도 및 음성 간 유사도에 기초하여 추출한 이름과 발신자의 동일성을 판단한다(510, 511). 제어부(120)는, 추출한 이름과 발신자가 동일인이 아닌 것으로 판단되는 경우, 경고 메시지를 생성한다(512).
도 7은 다른 실시예에 따른 피싱 분석 방법을 설명하는 순서도이다.
도 7을 참조하면, 피싱 분석 장치(10)의 통신부(110)는 발신 단말기(10)로부터 발신된 문자 메시지를 수신할 수 있다(601). 이후, 피싱 분석 장치(10)의 제어부(120)는 발신 단말기(10)의 전화번호가 연락처 데이터베이스(131)에 등록된 전화번호인지 판단한다(602).
제어부(120)는, 발신 단말기(10)의 전화번호가 연락처 데이터베이스(131)에 등록된 전화번호인 경우, 연락처 데이터베이스(131)로부터 발신 단말기(10)의 전화번호에 대응하는 이름을 추출한다(603).
한편, 제어부(120)는, 발신 단말기(10)의 전화번호가 연락처 데이터베이스(131)에 등록되어 있지 않은 경우, 어휘의미패턴 데이터베이스(133)를 이용하여 문자 메시지에서 이름을 추출한다(604).
제어부(120)는, 코퍼스 데이터베이스(132)를 참조하여 문자 메시지에 포함된 대화 의도가 피싱 의도인지 판단한다. 제어부(120)는, 피싱 의도 값을 산출할 수 있다(605, 606).
제어부(120)는, 피싱 의도 값을 기초로 대화 의도가 피싱 의도인 것으로 판단되면, 발신자의 문자 메시지를 말투 데이터베이스(135)와 비교하고, 추출한 이름에 대응하는 말투와 발신자의 말투 간 유사도를 산출한다(607).
제어부(120)는, 말투 간 유사도에 기초하여 추출한 이름과 발신자의 동일성을 판단한다(608, 609). 제어부(120)는, 딥러닝 알고리즘을 이용하여 추출한 이름과 발신자의 동일성을 판단할 수 있다.
제어부(120)는, 추출한 이름과 발신자가 동일인이 아닌 것으로 판단되는 경우, 경고 메시지를 생성한다(610).
이와 같이, 일 실시예에 따른 피싱 분석 장치 및 그 방법은, 지인을 사칭한 피싱을 정확히 검출하여 착신자에게 경고 메시지를 제공할 수 있다. 따라서 전기통신금융사기에 의한 피해를 예방할 수 있다.
또한, 일 실시예에 따른 피싱 분석 장치 및 그 방법은, 딥러닝 알고리즘을 적용하여 지인을 사칭한 피싱인지 여부를 보다 정확하게 검출할 수 있다.
한편, 개시된 실시예들은 컴퓨터에 의해 실행 가능한 프로그램 및/또는 명령어를 저장하는 기록매체의 형태로 구현될 수 있다. 명령어는 프로그램 코드의 형태로 저장될 수 있으며, 프로세서에 의해 실행되었을 때, 프로그램 모듈을 생성하여 개시된 실시예들의 동작을 수행할 수 있다. 기록매체는 컴퓨터로 읽을 수 있는 기록매체로 구현될 수 있다.
컴퓨터가 읽을 수 있는 기록매체로는 컴퓨터에 의하여 해독될 수 있는 명령어가 저장된 모든 종류의 기록 매체를 포함한다. 예를 들어, ROM(Read Only Memory), RAM(Random Access Memory), 자기 테이프, 자기 디스크, 플래쉬 메모리, 광 데이터 저장장치 등이 있을 수 있다.
이상에서와 같이 첨부된 도면을 참조하여 개시된 실시예들을 설명하였다. 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고도, 개시된 실시예들과 다른 형태로 본 발명이 실시될 수 있음을 이해할 것이다. 개시된 실시예들은 예시적인 것이며, 한정적으로 해석되어서는 안 된다.
1: 피싱 분석 시스템
10: 피싱 분석 장치
20: 발신 단말기
30: 착신 단말기
40: 네트워크

Claims (30)

  1. 발신 단말기 및 착신 단말기와 통신하는 통신부;
    코퍼스(Corpus) 데이터베이스, 말투 데이터베이스 및 상기 착신 단말기의 연락처 데이터베이스를 저장하는 저장부; 및
    데이터를 처리하는 프로세서를 포함하는 제어부;를 포함하고,
    상기 저장부는
    상기 연락처 데이터베이스에 포함된 복수의 이름 각각에 대응하는 어휘의미패턴을 포함하는 어휘의미패턴 데이터베이스와,
    상기 연락처 데이터베이스에 포함된 복수의 이름 각각에 대응하는 음성 데이터를 포함하는 음성 데이터베이스를 더 저장하고,
    상기 제어부는,
    상기 발신 단말기로부터 통화 호가 전송되면, 상기 연락처 데이터베이스로부터 상기 발신 단말기의 전화번호에 대응하는 이름을 추출하되, 상기 발신 단말기의 전화번호가 상기 연락처 데이터베이스에 등록되어 있지 않은 경우, 발신자의 음성 데이터를 텍스트 데이터로 변환하고, 상기 어휘의미패턴 데이터베이스를 이용하여 상기 변환된 텍스트 데이터에서 상기 이름을 추출하고,
    코퍼스 데이터베이스를 이용하여 상기 발신 단말기로부터 전송되는 발신자의 음성 데이터에 포함된 대화 의도를 판단하되, 상기 코퍼스 데이터베이스를 이용하여 피싱 의도 값을 산출하고, 상기 피싱 의도 값이 미리 정해진 값 이상인 경우, 상기 변환된 텍스트 데이터에 포함된 대화 의도가 피싱 의도인 것으로 판단하고,
    상기 대화 의도가 피싱 의도인 것으로 판단된 경우, 상기 발신자의 음성 데이터를 상기 음성 데이터베이스와 비교하여 상기 추출한 이름에 대응하는 음성과 상기 발신자의 음성 간 유사도를 산출하고,
    상기 변환된 텍스트 데이터를 상기 말투 데이터베이스와 비교하여 상기 추출한 이름에 대응하는 말투와 상기 발신자의 말투 간 유사도를 산출하고,
    상기 말투 간 유사도 및 상기 음성 간 유사도에 기초하여 상기 추출한 이름과 상기 발신자의 동일성을 판단하는 피싱 분석 장치.
  2. 제1항에 있어서,
    상기 제어부는
    상기 대화 의도가 피싱 의도이고, 상기 추출한 이름과 상기 발신자가 동일하지 않은 것으로 판단되는 경우, 경고 메시지를 생성하는 피싱 분석 장치.
  3. 삭제
  4. 삭제
  5. 삭제
  6. 제1항에 있어서,
    상기 제어부는
    발화 속도, 톤, 발음 및 액센트에 기초하여 상기 음성 간 유사도를 산출하는 피싱 분석 장치.
  7. 제1항에 있어서,
    상기 제어부는
    상기 대화 의도가 피싱 의도가 아닌 경우, 상기 발신자의 음성 데이터를 상기 음성 데이터베이스에 업데이트 하는 피싱 분석 장치.
  8. 제1항에 있어서,
    상기 제어부는
    상기 연락처 데이터베이스에 포함된 복수의 이름 각각과 관련된 대화 이력 데이터를 이용하여 복수의 이름 별 말투 데이터를 포함하는 상기 말투 데이터베이스를 구축하는 피싱 분석 장치.
  9. 제8항에 있어서,
    상기 대화 이력 데이터는
    상기 착신 단말기에 저장된 문자 메시지의 내용 및 메신저 어플리케이션을 통한 대화 내용을 포함하는 피싱 분석 장치.
  10. 삭제
  11. 삭제
  12. 삭제
  13. 삭제
  14. 삭제
  15. 삭제
  16. 통신부, 저장부 및 제어부를 포함하는 피싱 분석 장치에 의한 피싱 분석 방법에 있어서,
    발신 단말기로부터 통화 호가 전송되면, 착신 단말기의 연락처 데이터베이스로부터 상기 발신 단말기의 전화번호에 대응하는 이름을 추출하되, 상기 발신 단말기의 전화번호가 상기 연락처 데이터베이스에 등록되어 있지 않은 경우, 발신자의 음성 데이터를 텍스트 데이터로 변환하고, 상기 저장부의 어휘의미패턴 데이터베이스를 이용하여 상기 변환된 텍스트 데이터에서 상기 이름을 추출하는 단계;
    상기 저장부의 코퍼스 데이터베이스를 이용하여 상기 발신 단말기로부터 전송되는 발신자의 음성 데이터에 포함된 대화 의도를 판단하되, 상기 코퍼스 데이터베이스를 이용하여 피싱 의도 값을 산출하고, 상기 피싱 의도 값이 미리 정해진 값 이상인 경우, 상기 변환된 텍스트 데이터에 포함된 대화 의도가 피싱 의도인 것으로 판단하고, 상기 대화 의도가 피싱 의도인 것으로 판단된 경우, 상기 발신자의 음성 데이터를 음성 데이터베이스와 비교하여 상기 추출한 이름에 대응하는 음성과 상기 발신자의 음성 간 유사도를 산출하는 단계;
    상기 변환된 텍스트 데이터를 상기 저장부의 말투 데이터베이스와 비교하여 상기 추출한 이름에 대응하는 말투와 상기 발신자의 말투 간 유사도를 산출하는 단계;
    상기 말투 간 유사도 및 상기 음성 간 유사도에 기초하여 상기 추출한 이름과 상기 발신자의 동일성을 판단하는 단계;
    상기 대화 의도 및 상기 추출한 이름과 발신자의 동일성에 기초하여 경고 메시지를 생성하는 단계; 및
    상기 경고 메시지를 상기 착신 단말기로 전송하는 단계;를 포함하는 피싱 분석 방법.
  17. 삭제
  18. 삭제
  19. 삭제
  20. 삭제
  21. 제16항에 있어서,
    발화 속도, 톤, 발음 및 액센트에 기초하여 상기 음성 간 유사도를 산출하는 단계;를 더 포함하는 피싱 분석 방법.
  22. 제16항에 있어서,
    상기 대화 의도가 피싱 의도가 아닌 경우, 상기 발신자의 음성 데이터를 상기 음성 데이터베이스에 업데이트 하는 단계;를 더 포함하는 피싱 분석 방법.
  23. 제16항에 있어서,
    상기 연락처 데이터베이스에 포함된 복수의 이름 각각과 관련된 대화 이력 데이터를 이용하여 복수의 이름 별 말투 데이터를 포함하는 상기 말투 데이터베이스를 구축하는 단계;를 더 포함하는 피싱 분석 방법.
  24. 제23항에 있어서,
    상기 대화 이력 데이터는
    상기 착신 단말기에 저장된 문자 메시지의 내용 및 메신저 어플리케이션을 통한 대화 내용을 포함하는 피싱 분석 방법.
  25. 삭제
  26. 삭제
  27. 삭제
  28. 삭제
  29. 삭제
  30. 삭제
KR1020190029941A 2019-03-15 2019-03-15 피싱 분석 장치 및 그 방법 KR102606456B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190029941A KR102606456B1 (ko) 2019-03-15 2019-03-15 피싱 분석 장치 및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190029941A KR102606456B1 (ko) 2019-03-15 2019-03-15 피싱 분석 장치 및 그 방법

Publications (2)

Publication Number Publication Date
KR20200109995A KR20200109995A (ko) 2020-09-23
KR102606456B1 true KR102606456B1 (ko) 2023-11-29

Family

ID=72708141

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190029941A KR102606456B1 (ko) 2019-03-15 2019-03-15 피싱 분석 장치 및 그 방법

Country Status (1)

Country Link
KR (1) KR102606456B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102531661B1 (ko) * 2021-11-29 2023-05-10 전주호 내용 기반 차단을 이용한 피싱 위험 경고 서비스 제공 시스템

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101306074B1 (ko) * 2012-09-19 2013-09-12 강철구 피싱방지방법 및 피싱방지시스템
JP2016053600A (ja) * 2014-09-02 2016-04-14 株式会社Kddiテクノロジー 通話装置、声紋データの判定結果通知方法およびプログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101977087B1 (ko) * 2012-12-24 2019-05-10 엘지전자 주식회사 자동응대 기능을 갖는 이동 단말기 및 그의 자동응대 방법
KR20170006287A (ko) * 2015-07-07 2017-01-17 (주)티아이스퀘어 보이스 피싱 정보 관리 시스템 및 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101306074B1 (ko) * 2012-09-19 2013-09-12 강철구 피싱방지방법 및 피싱방지시스템
JP2016053600A (ja) * 2014-09-02 2016-04-14 株式会社Kddiテクノロジー 通話装置、声紋データの判定結果通知方法およびプログラム

Also Published As

Publication number Publication date
KR20200109995A (ko) 2020-09-23

Similar Documents

Publication Publication Date Title
CN111696535B (zh) 基于语音交互的信息核实方法、装置、设备和计算机存储介质
KR101991473B1 (ko) 개인정보 보호 트레이닝 코퍼스 선택
CN108831439B (zh) 语音识别方法、装置、设备和系统
US8676577B2 (en) Use of metadata to post process speech recognition output
US9626969B2 (en) Systems and methods for improving the accuracy of a transcription using auxiliary data such as personal data
US8498872B2 (en) Filtering transcriptions of utterances
CN111428010B (zh) 人机智能问答的方法和装置
US20150287408A1 (en) Systems and methods for supporting hearing impaired users
US11854553B2 (en) Cybersecurity for sensitive-information utterances in interactive voice sessions
CN112530408A (zh) 用于识别语音的方法、装置、电子设备和介质
US9860355B2 (en) Call context metadata
CN107301866A (zh) 信息输入方法
US20150255067A1 (en) Filtering transcriptions of utterances using received information to correct transcription errors
KR102248843B1 (ko) 피호출자의 전자 디바이스에서 연락처 정보를 업데이트하는 방법 및 전자 디바이스
US9613141B2 (en) Real-time audio dictionary updating system
US11900927B2 (en) Cybersecurity for sensitive-information utterances in interactive voice sessions using risk profiles
US11689484B2 (en) Dynamic configuration and population of digital interfaces during programmatically established chatbot sessions
US11721324B2 (en) Providing high quality speech recognition
CN117882365A (zh) 确定和视觉显示呼叫的口头菜单
CN112989046A (zh) 实时话术预判方法、装置、计算机设备和存储介质
US7428491B2 (en) Method and system for obtaining personal aliases through voice recognition
US10824520B2 (en) Restoring automated assistant sessions
US9747891B1 (en) Name pronunciation recommendation
KR102606456B1 (ko) 피싱 분석 장치 및 그 방법
CN112712793A (zh) 语音交互下基于预训练模型的asr纠错方法及相关设备

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right