KR20160016201A - 개인정보 자동 검색 시스템, 방법 및 컴퓨터프로그램 - Google Patents

개인정보 자동 검색 시스템, 방법 및 컴퓨터프로그램 Download PDF

Info

Publication number
KR20160016201A
KR20160016201A KR1020140099832A KR20140099832A KR20160016201A KR 20160016201 A KR20160016201 A KR 20160016201A KR 1020140099832 A KR1020140099832 A KR 1020140099832A KR 20140099832 A KR20140099832 A KR 20140099832A KR 20160016201 A KR20160016201 A KR 20160016201A
Authority
KR
South Korea
Prior art keywords
file
image
image file
information
personal information
Prior art date
Application number
KR1020140099832A
Other languages
English (en)
Other versions
KR101667784B1 (ko
Inventor
조정현
신택균
신동채
Original Assignee
조정현
주식회사 사람과세상
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 조정현, 주식회사 사람과세상 filed Critical 조정현
Priority to KR1020140099832A priority Critical patent/KR101667784B1/ko
Publication of KR20160016201A publication Critical patent/KR20160016201A/ko
Application granted granted Critical
Publication of KR101667784B1 publication Critical patent/KR101667784B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/435Filtering based on additional data, e.g. user or group profiles

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 개인정보 자동 검색 시스템에 관한 것으로서, 적어도 하나의 전자장치로부터 인증 확인 요청 정보를 수신 받아 응답 신호로서 생성된 인증 결과 정보를 상기 적어도 하나의 전자장치로 전송하고, 상기 적어도 하나의 전자 장치로부터 삭제 결과 정보를 수신 받는 서버; 및 상기 서버로부터 수신된 상기 인증 결과 정보에 인증 성공 정보가 포함된 경우, 구비된 저장부에 존재하는 파일들로부터 검색 결과 파일 리스트를 생성하고, 상기 검색 결과 파일 리스트에 포함된 파일들로부터 선별 결과 이미지 리스트 또는 선별 결과 문서 리스트를 생성하며, 상기 선별 결과 이미지 리스트에 포함된 파일들로부터 분석 결과 계약서/신청서 리스트 또는 분석 결과 이미지 리스트를 생성하고, 상기 선별 결과 문서 리스트에 포함된 파일들로부터 분석 결과 문서 리스트를 생성하며, 상기 분석 결과 계약서/신청서 리스트, 상기 분석 결과 이미지 리스트 및 상기 분석 결과 문서 리스트에 포함된 파일들을 중 삭제된 파일들의 정보를 나타내는 상기 삭제 결과 정보를 생성하여 구비된 통신부를 통해 상기 서버로 전송하도록 제어하는 제어부; 를 포함하는 상기 적어도 하나의 전자장치를 포함할 수 있다.

Description

개인정보 자동 검색 시스템, 방법 및 컴퓨터프로그램{SYSTEM, METHOD AND COMPUTER PROGRAM FOR LICENCE AUTO DETECTION}
본 발명의 실시예는 개인정보 자동 검색 시스템에 관한 것으로서, 보다 상세하게는, 전자 장치에서 개인정보를 포함하는 복수 개의 파일들 중 개인정보를 포함하는 파일들을 자동으로 검색 및 관리하기 위한 개인정보 자동 검색 시스템 관한 것이다.
오늘날 인터넷의 광범위한 보급은 이제 유선을 넘어 무선 이동통신 기술로의 급속한 발전을 가져오게 되었고, 실생활에 있어서도 스마트폰, PDA(Personal digital Assistant), 핸드헬드(Hand-Held) 컴퓨터 등의 휴대용 단말을 통한 인터넷상에서의 정보 검색이 시간과 장소에 구애받지 않고 가능하게 되었다. 예컨대, 무선 휴대 전화기를 다루는 통신 판매사들은 고객 유치와 관리를 위해서 고객 신분증을 포함하는 이미지 파일, 계약을 위한 고객의 정보가 포함된 계약서 이미지 파일, 무선 휴대 전화기의 변경을 위한 관련 정보를 포함하는 신청서 이미지 파일, 고객의 개인정보인 전화번호를 포함하는 문서 파일 및 주민등록 번호를 포함한 문서 파일들을 관리한다. 개인정보를 포함하는 파일들은 복수 개의 통신 판매사들의 업무용 전자장치에 저장 및 관리된다.
한편, 대한민국에서는 2014년 08월부터 개정된 개인정보보호법에 따라 주민등록 번호와 같은 개인정보를 포함하는 어떤 문서나 이미지들을 모든 공공기관과 민간 사업자가 수집하는 것을 금지하고 있다. 따라서 통신 판매사들은 업무용 전자장치 등에 고객의 개인정보를 포함하는 파일을 보관하면 안 된다. 통신 판매사들이 법령 근거 없이 개인정보를 포함하는 파일을 보관할 경우, 해당 통신 판매사들에게는 불이익이 가해진다.
하지만 개인정보의 수집 및 보관을 금지하여도 통신 판매사들이 업무용으로 사용되는 각각의 전자장치에서 고객의 개인정보가 포함된 모든 파일을 찾는 것은 어려운 실정이다. 개인정보보호법을 준수하기 위해선 통신 판매사들은 업무용으로 사용되는 각각의 전자장치에서 모든 파일들을 대상으로 개인정보를 포함하고 있는지 확인하고, 개인정보를 포함하는 해당 파일을 전자장치의 저장부로부터 삭제해야 한다. 통신 판매사들의 업무 특성 상 매일 추가되는 고객의 정보로 인해 고객의 개인정보가 포함된 파일들은 개수는 계속 증가되기 때문에 통신 판매사들은 고객의 개인정보를 포함하는 파일의 관리에 어려움이 있다.
KR 1002417450000 B1
본 발명의 실시예는 전자장치에 저장된 파일들 중 개인정보를 포함하는 파일들을 자동으로 검색하고, 검색된 파일을 개인정보를 포함하는 이미지 파일 또는 개인정보를 포함하는 문서 파일로 분류한 후 사용자의 사용자 입력에 따라 해당 파일을 삭제할 수 있는 개인정보 자동 검색 시스템, 방법 및 컴퓨터 판독 가능한 기록 매체를 제공한다.
또한, 본 발명의 실시예는 서버와 유무선 네트워크 망으로 연결된 적어도 하나의 전자장치에서 개인정보를 포함하는 파일들을 처리하고, 처리된 결과 정보를 서버로 보고하며, 서버는 유무선 네트워크 망으로 연결된 적어도 하나의 전자장치에서의 개인정보를 포함한 파일 관리 상황을 모니터링 할 수 있는 개인정보 자동 검색 시스템, 방법 및 컴퓨터 판독 가능한 기록 매체를 제공한다.
본 발명의 실시예에 따른 개인정보 자동 검색 시스템은, 구비된 저장부에 존재하는 파일들 중 선택된 파일을 저장부에 미리 저장된 확장자 설정 정보와 비교를 통해 이미지 파일 또는 문서 파일로 분류하고, 상기 이미지 파일로부터 추정 이미지 파일로 판단된 상기 이미지 파일을 대상으로 분류 영상처리 방법을 통해 계약서/신청서 이미지 파일 또는 신분증 이미지 파일로 판단하며, 상기 문서 파일을 대상으로 상기 저장부에 미리 저장된 정규식을 통해 개인정보를 포함하는 개인정보 문서 파일인지를 판단하고, 상기 계약서/신청서 이미지 파일, 상기 신분증 이미지 파일 및 상기 개인정보 문서 파일 중 적어도 하나를 구비된 입력부를 통해 수신된 사용자 입력 신호에 따라 상기 저장부에서 삭제 또는 개인 정보 검색 대상에서 제외되도록 제어하는 제어부;를 포함하는 적어도 하나의 전자장치를 포함할 수 있다.
상기 개인정보 자동 검색 시스템은, 상기 적어도 하나의 전자장치로부터 인증 확인 요청 정보를 수신 받아 응답 신호로서 생성된 인증 결과 정보를 상기 적어도 하나의 전자장치로 전송하고, 상기 적어도 하나의 전자장치에서 생성된, 삭제 처리된 상기 적어도 하나의 파일의 정보를 포함하는 삭제 결과 정보를 수신 받는 서버;를 더 포함할 수 있다.
상기 제어부는, 상기 이미지 파일을 대상으로 추정 영상처리 방법을 통해 개인정보를 포함하고 있다고 추정되는 상기 추정 이미지 파일인지를 판단할 수 있다.
상기 추정 영상처리 방법은, 상기 이미지 파일의 이미지를 그레이 영상으로 변환하는 방법; 변환된 상기 그레이 영상으로부터 히스토그램 추출하는 방법; 및 추출된 상기 히스토그램으로부터 흰색 분포도를 산출하는 방법;을 포함할 수 있다.
상기 추정 이미지 파일은, 상기 제어부가 산출된 상기 흰색 분포 값이 상기 저장부에 미리 저장된 히스토그램 임계치 값 이상인지 판단하고, 상기 판단 결과, 산출된 상기 흰색 분포 값이 사익 히스토그램 임계치 값 이상인 경우, 상기 이미지 파일을 상기 추정 이미지 파일로 판단할 수 있다.
상기 분류 영상처리 방법은, 상기 추정 이미지 파일의 이미지 내에 관심 영역을 설정하는 방법, 상기 관심 영역에 SURF 알고리즘을 통해 특징점을 추출하는 방법 및 추출된 상기 특징점의 개수를 산출하는 방법을 포함하는 계약서/신청서 이미지 파일 영상처리 방법; 및 상기 추정 이미지 파일의 이미지를 대상으로 에지 검출 알고리즘을 통해 에지 영역들을 추출하는 방법, 추출된 상기 에지 영역들을 대상으로 픽셀 그룹핑하여 사각형의 관심 영역을 형성하는 방법 및 형성된 상기 사각형의 관심 영역이 상기 이미지의 전체 크기에서 차지하는 비율을 산출하는 방법을 포함하는 신분증 이미지 파일 영상처리 방법;을 포함할 수 있다.
상기 계약서/신청서 이미지 파일은, 상기 제어부가 산출된 상기 특징점의 개수가 상기 저장부에 미리 저장된 특징점 임계치 개수 이상인지 판단하고, 상기 판단 결과, 산출된 상기 특징점의 개수가 상기 특징점 임계치 개수 이상인 경우, 상기 추정 이미지 파일을 계약서/신청서 이미지 파일로 판단할 수 있다.
상기 신분증 이미지 파일은, 상기 제어부가 산출된 상기 비율이 상기 저장부에 미리 저장된 비율 임계값 이하인가 판단하고, 상기 판단 결과, 상기 비율이 상기 비율 임계값 이하인 경우, 상기 추정 이미지 파일을 상기 신분증 이미지 파일로 판단할 수 있다.
상기 개인정보 문서 파일은, 상기 제어부가 상기 문서 파일에 상기 정규식을 반영하고, 상기 정규식이 반영된 상태의 문서 파일과 상기 저장부에 미리 저장된 정규식의 패턴 간 일치하는 정보가 있는지 판단하며, 상기 판단 결과, 상기 정규식이 반영된 상태의 문서 파일과 상기 정규식의 패턴 간 일치하는 정보가 있는 경우, 상기 문서 파일을 상기 개인정보 문서 파일로 판단할 수 있다.
본 발명의 실시예에 따른 개인정보 자동 검색 방법은, 구비된 저장부에 존재하는 파일들 중 선택된 파일을 저장부에 미리 저장된 확장자 설정 정보와 비교를 통해 이미지 파일 또는 문서 파일로 분류하는 단계; 상기 이미지 파일로부터 추정 이미지 파일로 판단된 상기 이미지 파일을 대상으로 분류 영상처리 방법을 통해 계약서/신청서 이미지 파일 또는 신분증 이미지 파일로 판단하는 단계; 상기 문서 파일을 대상으로 상기 저장부에 미리 저장된 정규식을 통해 개인정보를 포함하는 개인정보 문서 파일인지를 판단하는 단계; 및 상기 계약서/신청서 이미지 파일, 상기 신분증 이미지 파일 및 상기 개인정보 문서 파일 중 적어도 하나를 구비된 입력부를 통해 수신된 사용자 입력 신호에 따라 상기 저장부에서 삭제 또는 개인 정보 검색 대상에서 제외하는 단계;를 포함할 수 있다.
상기 개인정보 자동 검색 방법은, 계약서/신청서 이미지 파일 또는 신분증 이미지 파일로 판단하는 단계이전에, 상기 이미지 파일을 대상으로 추정 영상처리 방법을 통해 개인정보를 포함하고 있다고 추정되는 상기 추정 이미지 파일인지 판단하는 단계;를 더 포함할 수 있다.
상기 추정 이미지 파일인지 판단하는 단계는, 상기 이미지 파일의 이미지를 그레이 영상으로 변환하는 단계; 변환된 상기 그레이 영상으로부터 히스토그램 추출하는 단계; 추출된 상기 히스토그램으로부터 흰색 분포도를 산출하는 단계; 및 산출된 상기 흰색 분포 값이 상기 저장부에 미리 저장된 히스토그램 임계치 값 이상인지 판단하고, 상기 판단 결과, 산출된 상기 흰색 분포 값이 상기 히스토그램 임계치 값 이상인 경우, 상기 이미지 파일을 상기 추정 이미지 파일로 판단하는 단계;를 더 포함할 수 있다.
상기 계약서/신청서 이미지 파일 또는 신분증 이미지 파일로 판단하는 단계는, 상기 추정 이미지 파일의 이미지 내에 관심 영역을 설정하는 단계; 상기 관심 영역에 SURF 알고리즘을 통해 특징점을 추출하는 단계; 추출된 상기 특징점의 개수를 산출하는 단계; 및 산출된 상기 특징점의 개수가 상기 저장부에 미리 저장된 특징점 임계치 개수 이상인지 판단하고, 상기 판단 결과, 산출된 상기 특징점의 개수가 상기 특징점 임계치 개수 이상인 경우, 상기 추정 이미지 파일을 상기 계약서/신청서 이미지 파일로 판단하는 단계;를 더 포함할 수 있다.
상기 계약서/신청서 이미지 파일 또는 신분증 이미지 파일로 판단하는 단계는, 상기 추정 이미지 파일의 이미지를 대상으로 에지 검출 알고리즘을 통해 에지 영역들을 추출하는 단계; 추출된 상기 에지 영역들을 대상으로 픽셀 그룹핑하여 사각형의 관심 영역을 형성하는 단계; 형성된 상기 사각형의 관심 영역이 상기 이미지의 전체 크기에서 차지하는 비율을 산출하는 단계; 및 산출된 상기 비율이 상기 저장부에 미리 저장된 비율 임계값 이하인가 판단하고, 상기 판단 결과, 상기 비율이 상기 비율 임계값 이하인 경우, 상기 추정 이미지 파일을 상기 신분증 이미지 파일로 판단하는 단계;를 더 포함할 수 있다.
상기 개인정보 문서 파일인지를 판단하는 단계는, 상기 문서 파일에 상기 정규식을 반영하는 단계; 및 상기 정규식이 반영된 상태의 문서 파일과 상기 저장부에 미리 저장된 정규식의 패턴 간 일치하는 정보가 있는지 판단하고, 상기 판단 결과, 상기 정규식이 반영된 상태의 문서 파일과 상기 정규식의 패턴 간 일치하는 정보가 있는 경우, 상기 문서 파일을 상기 개인정보 문서 파일로 판단하는 단계;를 더 포함할 수 있다.
한편, 상기 개인정보 자동 검색 방법에 대한 정보는 컴퓨터로 읽을 수 있는 기록 매체에 저장될 수 있다. 이러한 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있도록 프로그램 및 데이터가 저장되는 모든 종류의 기록매체를 포함한다. 그 예로는, 롬(ROM: Read Only Memory), 램(RAM: Random Access Memory), CD(Compact Disk), DVD(Digital Video Disk)―ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장장치, 임베디드 멀티미디어 카드(eMMC), HDD(Hard Disk Drive), Micro SD Card, USB Memory 등이 있으며, 또한, 케리어 웨이브(예를 들면, 인터넷을 통한 전송)의 형태로 구현되는 것도 포함된다. 또한, 이러한 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산 방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.
본 발명의 실시예에 따르면, 전자장치에 저장되어 있는 파일들 중 개인정보를 포함하는 파일을 자동으로 추출할 수 있는 개인정보 자동 검색 시스템, 방법 및 컴퓨터프로그램을 제공할 수 있다.
또한, 본 발명의 실시예에 따르면, 각 전자장치에서는 개인정보를 포함하는 파일의 관리를 용이하게 할 수 있으며, 서버에서는 각 전자장치로부터 개인정보를 포함하는 파일들의 관리에 대한 결과 정보를 수신 받아, 각 전자 장치의 개인정보 관리 상황을 모니터링할 수 있는 개인정보 자동 검색 시스템, 방법 및 컴퓨터프로그램을 제공할 수 있다.
또한, 본 발명의 실시예에 따르면, 전자장치에서 개인정보가 포함된 파일을 자동으로 검색하고, 사용자가 용이하게 해당 파일의 관리가 수행할 수 있어서, 개인 신상 정보에 대한 높은 보안성을 확보할 수 있는 개인정보 자동 검색 시스템, 방법 및 컴퓨터프로그램을 제공할 수 있다.
도 1은 본 발명의 실시예에 따른 개인정보 자동 검색 시스템을 나타내는 도면.
도 2는 본 발명의 실시예에 따른 전자장치의 세부 구조를 나타내는 도면.
도 3은 본 발명의 실시예에 따른 서버의 세부 구조를 나타내는 도면.
도 4는 본 발명의 실시예에 따른 개인정보 자동 검색 시스템의 전체 처리 절차를 나타내는 도면.
도 5는 본 발명의 실시예에 따른 개인정보 자동 검색 시스템의 검색 처리 절차를 나타내는 도면.
도 6는 본 발명의 실시예에 따른 개인정보 자동 검색 시스템의 선별 처리 절차를 나타내는 도면.
도 7은 본 발명의 실시예에 따른 개인정보 자동 검색 시스템의 계약서/ 신청서 이미지 파일 분석 처리 절차를 나타내는 도면.
도 8은 본 발명의 실시예에 따른 개인정보 자동 검색 시스템의 개인정보 신분증 이미지 파일 분석 처리 절차를 나타내는 도면.
도 9는 본 발명의 실시예에 따른 개인정보 자동 검색 시스템의 개인정보 문서 파일 분석 처리 절차를 나타내는 도면.
도 10은 본 발명의 실시예에 따른 개인정보 자동 검색 시스템의 삭제 결과 정보 처리 절차를 나타내는 도면.
도 11은 본 발명의 다른 실시예에 따른 개인정보 자동 검색 시스템의 전체 처리 절차를 나타내는 도면.
후술하는 본 발명에 대한 상세한 설명은, 본 발명이 실시될 수 있는 특정 실시예를 예시로서 도시하는 첨부 도면을 참조한다. 이들 실시예는 당업자가 본 발명을 실시할 수 있기에 충분하도록 상세히 설명된다. 본 발명의 다양한 실시예는 서로 다르지만 상호 배타적일 필요는 없음이 이해되어야 한다. 예를 들어, 여기에 기재되어 있는 특정 형상, 구조 및 특성은 일 실시예에 관련하여 본 발명의 사상 및 범위를 벗어나지 않으면서 다른 실시예로 구현될 수 있다. 또한, 각각의 개시된 실시 예 내의 개별 구성요소의 위치 또는 배치는 본 발명의 사상 및 범위를 벗어나지 않으면서 변경될 수 있음이 이해되어야 한다. 따라서 후술하는 상세한 설명은 한정적인 의미로서 취하려는 것이 아니며, 본 발명의 범위는 적절하게 설명된다면 그 청구항들이 주장하는 것과 균등한 모든 범위와 더불어 첨부된 청구항에 의해서만 한정된다. 도면에서 유사한 참조부호는 여러 측면에 걸쳐서 동일하거나 유사한 기능을 지칭한다.
제1, 제2 등과 같이 서수를 포함하는 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되지는 않는다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.
한편, 본 발명에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 또한, 본 발명에서 "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 발명에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않아야 한다.
명세서 전체에서 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있음을 의미한다. 또한, 명세서에 기재된 "…….부", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다.
본 발명의 실시예에 따른 저장부는 컴퓨터 시스템에 의하여 읽혀질 수 있도록 프로그램 및 데이터가 저장되는 모든 종류의 기록매체를 포함한다. 그 예로는, 롬(ROM: Read Only Memory), 램(RAM: Random Access Memory), CD(Compact Disk), DVD(Digital Video Disk)―ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장장치, 임베디드 멀티미디어 카드(eMMC), HDD(Hard Disk Drive), Micro SD Card 및 USB Memory 중 적어도 하나를 포함할 수 있다. 또한, 본 발명의 실시예에 따른 저장부는 케리어 웨이브(예를 들면, 인터넷을 통한 송신)의 형태로 구현되는 것도 포함할 수 있다.
본 발명의 실시예에 따른 표시부는 방전광 디스플레이(ELD), 진공 형광 디스플레이(VFD), 발광 다이오드 디스플레이(LED), 음극선관(CRT), 액정 디스플레이 (LCD), 박막 트랜지스터 액정 디스플레이(TFT LCD), 플라스마 디스플레이 패널 (PDP), 표면 얼터네이트 라이팅(ALiS), 디지털 광원 처리(DLP), 실리콘 액정 (LCoS), 유기 발광 다이오드(OLED), 표면 전도형 전자 방출 소자 디스플레이(SED), 전계 방출 디스플레이(FED), 레이저 TV(양자 점 레이저, 액정 레이저), 광유전성 액체 디스플레이(FLD), 간섭계 변조기 디스플레이(iMoD), 두꺼운 필름 유전체 전기 (TDEL), 양자 점 디스플레이(QD-LED), 텔레스코픽 픽셀 디스플레이(TPD), 유기 발광 트랜지스터(OLET) 및 레이저 형광 디스플레이(LPD) 중 적어도 하나를 포함할 수 있다.
본 발명의 실시예에 따른 전자 장치는 표시부를 구비하는 임의의 전자 장치일 수 있다. 예를 들어, 전자 장치는 스마트폰, 휴대폰, 노트북 컴퓨터, 랩탑 컴퓨터, 태블릿(Tablet) 컴퓨터, PMP(Personal Media Player) 및 PDA(Personal Digital Assistants) 중 적어도 하나를 포함할 수 있다. 또한, 본 발명의 실시예에 따른 전자 장치는 플렉서블 장치 또는 플렉서블 디스플레이 장치일 수 있다.
이하, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명을 용이하게 실시할 수 있도록 하기 위하여, 본 발명의 바람직한 실시예들에 관하여 첨부된 도면을 참조하여 상세히 설명하기로 한다.
도 1은 본 발명의 실시예에 따른 개인정보 자동 검색 시스템을 나타내는 도면이다. 도 1을 참조하면, 본 발명의 실시예에 따른 개인정보 자동 검색 시스템(400)은 적어도 하나의 전자장치(100) 및 서버(200)를 포함할 수 있다.
적어도 하나의 전자장치(100)는 유무선 네트워크 망(300)을 통해 서버(200)와 서로 연결되어 데이터를 송수신할 수 있다.
유무선 네트워크 망(300)은 유선 및 무선 등과 같은 그 통신 양태를 가리지 않고 구성될 수 있으며, 단거리 통신망(PAN; Personal Area Network), 근거리 통신망(LAN; Local Area Network), 도시권 통신망(MAN; Metropolitan Area Network), 광역 통신망(WAN; Wide Area Network) 등 다양한 통신망으로 구성될 수 있다. 또한, 유무선 네트워크 망(300)은 공지의 월드와이드웹(WWW; World Wide Web)을 이용할 수도 있다.
적어도 하나의 전자장치(100)는 표시부(미도시) 및 입력부(미도시)를 포함하는 전자장치로서, 랩탑 컴퓨터(100a), 노트북 컴퓨터(100b) 및 스마트폰(100n)처럼 유무선 네트워크(300)를 통해 서버(200)와 연결되어 데이터 송수신이 가능한 전자장치를 포함할 수 있다.
서버(200)는 구비된 저장부(미도시)에 개인정보 자동 검색 과정을 수행할 수 있도록 허가된 적어도 하나의 전자장치(100)의 등록 정보를 미리 저장할 수 있다.
적어도 하나의 전자장치(100)는 개인 정보 자동 검색 과정을 수행하기 이전에 서버(200)에 자신의 등록 정보를 전송하여 미리 등록할 수 있다.
그 후, 적어도 하나의 전자장치(100)와 서버(200)는 유무선 네트워크망(300)을 통해 서로 연결된 상태에서 다음과 같은 인증 과정을 수행할 수 있다.
전자장치(100)는 인증 확인 요청 정보를 생성하고, 생성된 인증 확인 요청 정보를 서버(200)로 전송할 수 있다. 인증 확인 요청 정보는 전자장치(100)에 구비된 저장부(미도시)에 미리 저장된 등록 정보를 포함하여 생성할 수 있다. 예를 들어, 전자 장치(100)는 저장부(미도시)에 미리 저장된 식별 정보 및 MAC 주소 정보를 포함하는 인증 확인 요청 정보를 생성하고, 생성된 인증 확인 요청 정보를 서버(200)로 전송할 수 있다.
서버(200)는 유무선 네트워크 망(300)으로 연결된 적어도 하나의 전자장치(100)로부터 인증 확인 요청 정보를 수신 받을 수 있다. 인증 확인 요청 정보를 수신 받은 서버(200)는 응답 신호로서 인증 결과 정보를 생성하고, 인증 확인 요청 정보를 전송한 해당 전자장치(100)에 생성된 인증 결과 정보를 전송할 수 있다. 예를 들어, 서버(200)는 유무선 네트워크 망(300)으로 연결된 적어도 하나의 전자장치(100)로부터 식별 정보 및 MAC 주소 정보를 포함하는 인증 확인 요청 정보를 수신 받을 수 있다. 서버(200)는 수신된 인증 확인 요청 정보에 포함된 식별 정보 및 MAC 주소 정보를 각각 추출할 수 있다. 서버(200)는 추출된 식별 정보 및 추출된 MAC 주소 정보를 서버(200)에 구비된 저장부(미도시)에 미리 저장된 등록 정보에 포함된 등록된 식별 정보 및 등록된 MAC 주소 정보와의 일치여부를 판단할 수 있다. 서버(200)는 일치여부의 판단 결과에 따라 인증 성공 또는 인증 실패를 나타내는 인증 결과 정보를 생성하고, 인증 확인 요청 정보를 전송한 해당 전자장치(100)에 생성된 인증 결과 정보를 전송할 수 있다.
인증 성공을 나타내는 인증 결과 정보를 수신한 전자장치(100)는 개인 정보 자동 검색 과정을 수행 할 수 있다. 개인 정보 자동 검색 과정은 인증 과정, 검색 과정, 선별 과정, 분석 과정 및 처리 과정을 포함할 수 있다. 전자장치(100)는 검색 과정, 선별 과정 및 분석 과정을 통해 저장부(미도시)에 저장된 파일들 중 개인 정보를 포함하는 문서 파일, 개인정보를 포함하는 계약서/신청서 이미지 및 신분증 이미지 등을 포함하는 이미지 파일을 자동으로 검색하고, 각 파일 종류에 따라 리스트를 생성하고, 사용자가 인지할 수 있도록 생성된 리스트를 표시할 수 있다.
그 후, 전자장치(100)는 입력부(미도시)를 통해 입력되는 사용자의 입력 신호에 따라 개인정보를 포함하는 파일들 중 선택된 적어도 하나의 파일을 삭제하여 처리할 수 있다.
또한, 전자장치(100)는 입력부(미도시)를 통해 입력되는 사용자의 입력 신호에 따라 개인정보를 포함하는 파일들 중 선택된 적어도 하나의 파일을 개인정보 자동 검색 시스템의 검색 대상에서 예외 파일로 처리할 수 있다.
또한, 전자장치(100)는 개인정보를 포함하는 각 파일의 처리 결과를 나타내는 삭제 결과 정보를 생성하고, 생성된 삭제 결과 정보를 서버(200)로 전송할 수 있다. 예를 들어, 삭제 결과 정보는 삭제된 개인 신분증이 포함된 이미지 파일의 개수 정보, 삭제된 개인 정보가 포함된 계약서/신청서 파일의 개수 정보 및 삭제된 개인 정보가 포함된 문서 파일의 개수 정보 등을 포함할 수 있다.
도 2는 본 발명의 실시예에 따른 전자장치의 세부 구조를 나타내는 도면이다. 도 2를 참조하면, 본 발명의 실시예에 따른 전자장치(100)는 통신부(110), 입력부(120), 저장부(130), 표시부(140) 및 제어부(150)를 포함할 수 있다.
통신부(110)는 제어부(150)의 제어에 따라 유무선 네트워크망(300)을 통해 서버(200)와 연결되어 데이터를 송수신할 수 있다. 예컨대, 통신부(110)는 유선랜 모듈(미도시) 및 무선랜 모듈(미도시) 중 적어도 하나를 포함할 수 있다. 유선랜 모듈(미도시)은 미국전기전자학회(IEEE)의 유선랜 규격(IEEE 802.xx)을 지원할 수 있다. 무선랜 모듈(미도시)은 미국전기전자학회(IEEE)의 무선랜 규격(IEEE 802.11x)을 지원할 수 있다. 무선랜 모듈(미도시)은 제어부(150)의 제어에 따라 무선 액세스 포인트(AP; Access Point)가 설치된 장소에서 인터넷 망에 접속하여 서버(200)와 서로 연결될 수 있다.
입력부(120)는 제어부(150)의 제어에 따라 사용자 입력 신호를 수신할 수 있다. 입력부(120)는 마우스, 트랙볼, 조이스틱 및 커서 방향키들 중 적어도 하나를 포함할 수 있다. 입력부(120)는 표시부(140) 상의 커서의 움직임을 제어할 수 있는 커서 컨트롤(cursor control) 기능을 제공할 수 있다.
저장부(130)는 개인정보가 포함된 복수 개의 파일들이 저장할 수 있다.
또한, 저장부(130)는 확장자 설정 정보를 미리 저장할 수 있다. 확장자 설정 정보는 문서 파일을 나타내는 확장자 정보(doc, docx, hwp, txt, xls, xlsx, ppt, pptx, pdf, psd 등) 및 이미지 파일을 나타내는 확장자 정보(jpg, jpge, png, bmp, gif, tif 등)을 포함할 수 있다.
또한, 저장부(130)는 제어부(150)의 제어에 따라 서버(200)와의 인증 과정에 사용되는 전자장치(100)의 등록 정보를 미리 저장할 수 있다. 등록 정보는 서버(200)로부터 전자장치(100)가 할당 받은 고유한 식별 정보를 포함할 수 있다. 식별 정보는 서버(미도시)가 서버(미도시)와 유무선 네트워크 망(미도시)을 통해 연결된 복수 개의 전자장치들(미도시) 중 특정 전자장치(미도시)를 식별 가능하도록 할당된 정보를 나타내는 정보이다. 예를 들어, 식별 정보는 서버(미도시)로부터 할당된 판매점 코드(P-CODE)를 포함할 수 있다.
또한, 등록 정보는 고유한 식별 정보를 기본으로 포함하며, 추가로 전자장치(100)의 MAC(media access control address) 주소 정보, 전자장치(100)의 닉네임 정보, 전자장치(100)가 위치한 사업장의 상호명 정보, 전자 장치(100)의 이동 통신 번호 정보 및 적어도 하나의 전자장치(100)가 위치한 사업장의 연락처 정보 중 적어도 하나를 포함할 수 있다.
표시부(140)는 제어부(150)의 제어에 따라 개인 정보 자동 검색 과정(인증 과정, 검색 과정, 선별 과정, 분석 과정 및 처리 과정)의 각 과정을 진행 상황 및 처리 결과를 사용자가 인지할 수 있도록 텍스트, 아이콘 및 도형 중 적어도 하나로 표시할 수 있다.
제어부(150)는 통신부(110), 입력부(120), 저장부(130) 및 표시부(140)의 동작을 제어할 수 있다.
또한, 제어부(150)는 인증 모듈(151), 검색 모듈(152), 선별 모듈(153), 분석 모듈(154) 및 처리 모듈(155)을 포함할 수 있다.
인증 모듈(151)은 전자장치(100)가 통신부(110)를 통해 서버(미도시)와 연결되면, 다음과 같은 인증 과정을 수행할 수 있다.
인증 모듈(151)은 저장부(130)에 미리 저장된 등록 정보를 포함하는 인증 확인 요청 정보를 생성할 수 있다. 예를 들어, 전자 장치(100)는 저장부(미도시)에 미리 저장된 식별 정보 및 MAC 주소 정보를 포함하는 인증 확인 요청 정보를 생성할 수 있다.
그 후, 인증 모듈(151)은 생성된 인증 확인 요청 정보를 통신부(110)를 통해 서버(미도시)로 전송할 수 있다.
그 후, 인증 모듈(151)은 서버(미도시)로부터 전송한 인증 확인 요청 정보의 응답 신호인 인증 결과 정보를 통신부(110)를 통해 수신 받을 수 있다. 인증 결과 정보는 인증 성공 또는 인증 실패를 나타내는 정보이다.
그 후, 인증 모듈(151)은 인증 결과 정보가 인증 성공을 나타내는 정보일 경우, 검색 모듈(151)로 수신된 인증 결과 정보를 전달할 수 있다.
검색 모듈(152)은 인증 모듈(151)로부터 인증 성공을 나타내는 인증 결과 정보가 전달되면, 검색 과정을 수행할 수 있다. 검색 과정은 전자장치(100)의 저장부(130)에 존재하는 파일들의 각 파일 확장자(filename extension)와 저장부(130)에 미리 저장된 확장자 설정 정보를 서로 비교하여 개인정보를 포함하는 파일 종류별 리스트를 각각 생성할 수 있다. 검색 모듈(152)은 다음과 같은 검색 과정을 수행할 수 있다.
검색 모듈(152)은 전자장치(100)의 저장부(130)에 존재하는 폴더들 중 적어도 하나의 폴더의 선택을 나타내는 사용자 입력 신호를 입력부(120)를 통해 수신할 수 있다. 사용자 입력 신호에 의해 선택된 폴더는 개인 정보 자동 검색의 대상 폴더가 된다.
그 후, 검색 모듈(152)은 선택된 폴더에 존재하는 파일 확장자가 저장부(130)에 미리 저장된 확장자 설정 정보와 일치하는지 판단할 수 있다. 예를 들어, 검색 모듈(152)은 선택된 폴더에 존재하는 복수 개의 파일들을 이름 순서, 파일 크기 순서, 파일 확장자 형식 종류 등으로 먼저 정렬하고, 정렬된 각 파일의 확장자가 확장자 설정 정보에 포함된 파일 확장자들 중 적어도 하나와 일치하는지를 판단할 수 있다. 해당 파일 확장자가 확장자 설정 정보에 포함된 파일 확장자들 중 적어도 하나와 일치하지 않는 경우, 검색 모듈(152)은 해당 파일을 개인 정보 검색 대상에서 제외하고, 폴더 내에 존재하는 모든 파일들의 파일 확장자들이 확장자 설정 정보와 비교되지 않았을 경우, 검색 모듈(152)은 확장자 설정 정보와 비교되지 않은, 폴더 내에 존재하는 적어도 하나의 파일을 대상으로 미리 저장된 확장자 설정 정보와 일치하는지 판단하는 과정을 재수행할 수 있다. 파일을 개인정보 자동 검색 대상에서 제외한다는 의미는 해당 파일을 저장부(130)에서 삭제한다는 것을 의미하지 않는다.
한편, 해당 파일 확장자가 확장자 설정 정보에 포함된 파일 확장자들 중 적어도 하나와 일치하는 경우, 검색 모듈(152)은 해당 파일 확장자의 파일을 임시 검색 파일 리스트에 추가할 수 있다. 임시 검색 파일 리스트는 해당 파일의 파일 확장자가 확장자 설정 정보에 포함된 파일 확장자들 중 적어도 하나와 일치하는 경우, 검색 모듈(152)이 자동으로 생성할 수 있다.
그 후, 검색 모듈(152)은 임시 검색 파일 리스트에 추가된 해당 파일을 개인 정보 검색 대상에서 제외할 수 있다.
그 후, 검색 모듈(152)은 폴더 내에 존재하는 모든 파일들의 파일 확장자들이 확장자 설정 정보와 비교되었는지 판단할 수 있다. 모든 파일들의 파일 확장자들이 확장자 설정 정보와 비교되지 않았을 경우, 검색 모듈(152)은 확장자 설정 정보와 비교되지 않은, 폴더 내에 적어도 하나의 파일을 대상으로 미리 저장된 확장자 설정 정보와 일치하는지 판단하는 과정을 재수행할 수 있다.
반면, 모든 파일들의 파일 확장자들이 확장자 설정 정보와 비교되었을 경우, 검색 모듈(152)은 임시 검색 파일 리스트로부터 검색 결과 파일 리스트를 생성하고, 생성된 검색 결과 파일 리스트를 선별 모듈(153)로 전달할 수 있다.
선별 모듈(153)은 검색 결과 파일 리스트의 파일들을 대상으로 확장자 설정 정보와 비교를 통해 이미지 확장자를 갖는 파일과 문서 확장자를 갖는 파일들로 선별할 수 있다. 예를 들어, 선별 모듈(153)은 검색 결과 파일 리스트의 파일들 중 선택된 파일의 파일 확장자가 저장부(130)에 미리 저장된 확장자 설정 정보 중 이미지 파일을 나타내는 확장자 정보에 포함된 파일 확장자들 중 어느 하나와 일치하는지를 판단하여 이미지 파일과 문서 파일을 선별할 수 있다.
또한, 선별 모듈(153)은 일차 선별된 이미지 파일을 대상으로 영상 처리 방법을 통해 개인정보 자동 검색 대상의 이미지 파일로 이차 선별할 수 있다. 선별 모듈(153)이 수행하는 영상 처리 방법은 그레이 영상 변환 방법, 히스토그램 추출 방법 및 흰색 분포 값 산출 방법을 포함할 수 있다. 선별 모듈(153)은 개인정보가 포함된 이미지는 흰색 배경이 이미지의 많은 부분을 차지하기 때문에 영상 처리 방법을 통해 검색 결과 파일 리스트의 파일들 중 개인정보를 포함하는 이미지 파일을 필터링할 수 있다. 그레이 영상 변환 방법, 히스토그램 추출 방법, 히스토그램으로부터 흰색 분포 값 산출 방법은 공지된 영상 처리 방법이므로 자세한 설명은 생략하기로 한다.
또한, 선별 모듈(153)이 수행하는 선별 과정은 개인정보 자동 검색을 수행하는데 있어서, 하기 설명될 분석 모듈(154)의 분석 속도를 향상시키며 전자장치(100)의 리소스를 줄일 수 있다. 선별 모듈(153)은 다음과 같은 선별 과정을 수행할 수 있다.
선별 모듈(153)은 검색 모듈(152)로부터 전달 받은 검색 결과 파일 리스트에 포함된 파일들을 대상으로 선별 대상 파일을 선택할 수 있다.
그 후, 선별 모듈(153)은 선택된 파일이 이미지 파일인지 판단할 수 있다. 선택된 파일이 이미지 파일인 경우, 선별 모듈(153)은 해당 파일의 이미지를 그레이 영상으로 변환할 수 있다.
그 후, 선별 모듈(153)은 변환된 그레이 영상을 대상으로 히스토그램을 추출하며 흰색 분포 값을 산출할 수 있다.
그 후, 선별 모듈(153)은 산출된 흰색 분포 값이 저장부(130)에 미리 저장된 히스토그램 임계치 값 이상인지를 판단할 수 있다. 산출된 흰색 분포 값이 히스토그램 임계치 값 이상인 경우, 선별 모듈(153)은 해당 이미지 파일을 임시 선별 이미지 리스트에 추가할 수 있다. 임시 선별 이미지 리스트는 해당 이미지 파일로부터 산출된 흰색 분포 값이 히스토그램 임계치 값 이상인 경우, 선별 모듈(153)이 자동으로 생성할 수 있다.
그 후, 선별 모듈(153)은 해당 이미지 파일을 검색 결과 리스트에서 제외할 수 있다.
그 후, 선별 모듈(153)은 검색 결과 리스트 내에 포함된 모든 파일들이 선별되었는지 판단할 수 있다. 검색 결과 리스트 내에 포함된 모든 파일들이 선별되지 않았을 경우, 선별 모듈(153)은 선별되지 않은, 검색 결과 리스트 내에 포함된 적어도 하나의 파일을 선별 대상으로 선택하고, 선택된 파일이 이미지 파일인지 판단하는 과정을 재수행할 수 있다. 검색 결과 리스트 내에 포함된 모든 파일들이 선별된 경우, 선별 모듈(153)은 임시 선별 이미지 리스트로부터 선별 결과 이미지 리스트를 생성하고, 생성된 선별 결과 이미지 리스트를 분석 모듈(154)로 전달할 수 있다.
한편, 선택된 파일이 이미지 파일이 아닌 경우, 선별 모듈(153)은 해당 파일을 임시 선별 문서 리스트에 추가할 수 있다. 임시 선별 문서 리스트는 해당 파일의 파일 확장자가 문서 파일을 나타내는 확장자 정보에 포함된 파일 확장자들 중 적어도 하나와 일치하는 경우, 선별 모듈(153)이 자동으로 생성할 수 있다.
그 후, 선별 모듈(153)은 해당 파일을 검색 결과 리스트에서 제외할 수 있다.
그 후, 선별 모듈(153)은 검색 결과 리스트 내에 포함된 모든 파일들이 선별되었는지 판단할 수 있다. 검색 결과 리스트 내에 포함된 모든 파일들이 선별되지 않았을 경우, 선별 모듈(153)은 선별되지 않은, 검색 결과 리스트 내에 포함된 적어도 하나의 파일을 선별 대상으로 선택하고, 선택된 파일이 이미지 파일인지 판단하는 과정을 재수행할 수 있다. 검색 결과 리스트 내에 포함된 모든 파일들이 선별된 경우, 선별 모듈(153)은 임시 선별 문서 리스트로부터 선별 결과 문서 리스트를 생성하고, 생성된 선별 결과 문서 리스트를 분석 모듈(154)로 전달할 수 있다.
분석 모듈(154)은 선별 모듈(153)로부터 선별 결과 이미지 리스트를 전달 받고, 전달 받은 선별 결과 이미지 리스트에 포함된 각각의 이미지 파일 내에 실제 개인 정보가 포함되었는지 확인할 수 있다. 예를 들어, 분석 모듈(154)은 선별 결과 이미지 리스트에 포함된 이미지 파일들을 계약서/신청서 이미지 파일 또는 신분증이 포함된 이미지 파일로 분류할 수 있다. 분석 모듈(154)은 선별 결과 이미지 리스트를 대상으로 다음과 같은 분석 과정을 수행할 수 있다.
분석 모듈(154)은 선별 모듈(153)로부터 전달 받은 선별 결과 이미지 리스트에 포함된 이미지 파일들을 대상으로 분석 대상 이미지 파일을 선택할 수 있다.
그 후, 분석 모듈(154)은 선택된 이미지 파일의 이미지 내에 관심 영역(RoI; Region of Interesting)을 설정할 수 있다. 예를 들어, 개인정보가 포함된 계약서/신청서 파일의 이미지 내에 상단 부분 또는 하단 부분에는 계약서/신청서 서식을 나타내는 다양한 텍스트들을 포함하고 있다. 따라서 분석 모듈(154)은 해당 이미지 파일이 계약서/신청서 파일인지 확인하기 위해 선택된 이미지 파일의 이미지 내에 상단 부분 또는 하단 부분을 관심 영역으로 설정할 수 있다.
그 후, 분석 모듈(154)은 선택된 이미지 파일 내에 설정된 관심 영역에 SURF(Speeded Up Robust Features) 알고리즘을 적용하여 관심 영역 내에 텍스트들을 대상으로 특징점을 추출하며, 추출된 특징점의 개수를 산출할 수 있다. 예를 들어, 분석 모듈(154)은 SURF 알고리즘을 통해 이미지 파일 내에 설정된 관심 영역에 포함된 텍스트들을 대상으로 특징점(각 텍스트의 굴곡 부분의 방향성 등)을 추출할 수 있다. 일반적인 계약서/신청서의 상단 부분 또는 하단 부분에는 정해진 서식에 따라 정해진 텍스트들이 포함되어있다. 따라서 분석 모듈(154)은 이미지 파일 내에 설정된 관심 영역에 포함된 텍스트들을 대상으로 SURF 알고리즘을 통해 소정 개수의 특징점을 추출하고, 추출된 특징점 개수를 산출할 수 있다.
그 후, 분석 모듈(154)은 선택된 이미지 파일로부터 산출된 특징점의 개수가 저장부(130)에 미리 저장된 특징점 임계치 개수 이상인가 판단할 수 있다. 산출된 특징점의 개수가 특징점 임계치 개수 이상인 경우, 분석 모듈(154)은 선택된 이미지 파일을 개인 정보가 포함된 계약서/신청서 이미지 파일로 판단할 수 있다. 분석 모듈(154)은 해당 이미지 파일을 임시 분석 계약서/신청서 리스트에 추가할 수 있다. 임시 분석 계약서/신청서 리스트는 해당 이미지 파일로부터 산출된 특징점의 개수가 특징점 임계치 개수 이상일 경우, 분석 모듈(154)이 자동으로 생성할 수 있다. 계약서/신청서의 서식별로 상단 또는 하단에 기재된 텍스트들이 서로 다를 수 있다. 따라서 저장부(130)에 미리 저장된 특징점 임계치 개수는 계약서/신청서의 서식별로 고유한 값으로 설정 및 재설정될 수 있다.
그 후, 분석 모듈(154)은 해당 이미지 파일을 선별 결과 이미지 리스트에서 제외할 수 있다.
그 후, 분석 모듈(154)은 선별 결과 이미지 리스트 내에 포함된 모든 이미지 파일들이 분석되었는지 판단할 수 있다. 선별 결과 이미지 리스트 내에 포함된 모든 이미지 파일들이 분석되지 않았을 경우, 분석 모듈(154)은 분석되지 않은, 선별 결과 이미지 리스트 내에 포함된 적어도 하나의 이미지 파일을 분석 대상으로 선택하고, 선택된 이미지 파일이 계약서/신청서 이미지 파일 또는 신분증을 포함하는 이미지 파일인지 판단하는 과정을 재수행할 수 있다. 선별 결과 이미지 리스트 내에 포함된 모든 이미지 파일들이 분석된 경우, 분석 모듈(154)은 임시 분석 계약서/신청서 리스트로부터 분석 결과 계약서/신청서 리스트를 생성하고, 생성된 분석 결과 계약서/신청서 리스트를 처리 모듈(155)로 전달할 수 있다.
한편, 산출된 특징점의 개수가 특징점 임계치 개수 미만인 경우, 분석 모듈(154)은 선택된 이미지 파일을 신분증이 포함된 이미지 파일로 추정할 수 있다. 신분증 이미지를 포함하는 이미지 파일들의 텍스트 정보는 SURF 알고리즘을 통해 특징점이 검출될 만큼의 특징점이 충분하지 않다. 따라서 분석 모듈(154)은 다음과 같은 과정을 수행하여, 해당 이미지 파일에 신분증 이미지가 포함되어 있는지 확인할 수 있다.
분석 모듈(154)은 해당 이미지 파일의 이미지를 대상으로 에지 검출(edge detection)을 수행할 수 있다. 분석 모듈(154)은 에지 검출 알고리즘으로 팽창(dilation) 연산 알고리즘 및 모폴로지(morphology) 기법을 포함할 수 있다. 주민등록증, 운전면허증, 사원증과 같은 신분증 이미지는 일반적으로 카드 형상의 사각형의 형상을 가진다. 따라서 이미지 파일의 이미지 내에 신분증 이미지가 포함되어 있는지 확인하기 위해 분석 모듈(154)은 에지 검출을 통해 이미지 파일의 이미지 내에 신분증 이미지가 존재한다면, 신분증 이미지의 에지 영역들을 검출할 수 있다.
그 후, 분석 모듈(154)은 추출된 에지 영역들을 대상으로 픽셀간 그룹핑을 통해 하나의 사각형 영역을 형성하여 사각형의 관심 영역을 추출할 수 있다. 예를 들어, 분석 모듈(154)은 인접한 픽셀 값들의 유사성을 이용하여 픽셀간 그룹핑을 수행한 후, 픽셀간 그룹핑이 수행된 이미지 내의 특정 영역에서 사각형의 관심 영역을 추출할 수 있다. 일반적인 신분증 이미지는 카드와 같은 사각형의 형상을 가지기 때문에 분석 모듈(154)은 추출된 에지 영역들을 대상으로 픽셀간 그룹핑을 수행하여 사각형 영역을 형성하여 사각형의 관심 영역을 추출할 수 있다.
그 후, 분석 모듈(154)은 해당 이미지 파일의 전체 이미지 크기 대비 추출된 관심 영역의 크기가 차지하는 비율을 산출할 수 있다.
그 후, 분석 모듈(154)은 산출된 관심 영역의 크기가 차지하는 비율이 저장부(130)에 미리 저장된 비율 임계값 이하인가 판단할 수 있다. 산출된 관심 영역의 크기가 차지하는 비율이 비율 임계값 이하인 경우, 분석 모듈(154)은 해당 이미지 파일을 신분증 이미지를 포함하는 이미지 파일로 판단하고, 해당 이미지 파일을 임시 분석 이미지 리스트에 추가할 수 있다. 임시 분석 이미지 리스트는 해당 이미지 파일로부터 산출된 관심 영역의 크기가 차지하는 비율이 비율 임계값 이하인 경우, 분석 모듈(154)이 자동으로 생성할 수 있다. 예를 들어, 신분증이 A4 용지와 같은 일정 크기의 용지에 복사된 후, 신분증이 복사된 용지를 대상으로 스캔 작업을 통해 신분증 이미지를 포함하는 이미지 파일을 생성할 수 있다. 생성된 이미지 파일의 이미지 내에 존재하는 신분증 이미지의 크기는 전체 이미지 크기에 비례하여 일정한 비율을 갖는다. 따라서 저장부(130)에 이미지 파일에서 신분증 이미지가 전체 이미지 크기 대비 차지하는 일정한 비율을 참조하여 설정된 비율 임계값을 미리 저장할 수 있다. 분석 모듈(154)은 산출된 관심 영역의 크기가 차지하는 비율이 비율 임계값 이하인 경우, 해당 이미지 파일을 신분증 이미지를 포함하고 있다고 판단할 수 있다.
그 후, 분석 모듈(154)은 해당 이미지 파일을 선별 결과 이미지 리스트에서 제외하는 과정으로 이동하여 해당 과정을 수행할 수 있다.
한편, 산출된 관심 영역의 크기가 차지하는 비율이 비율 임계값을 초과하는 경우, 분석 모듈(154)은 해당 이미지 파일을 선별 결과 이미지 리스트에서 제외하는 과정으로 이동하여 해당 과정을 수행할 수 있다.
또한, 분석 모듈(154)은 선별 모듈(153)로부터 선별 결과 문서 리스트를 전달 받고, 전달 받은 선별 결과 문서 리스트에 포함된 각각의 문서 파일 내에 실제 개인 정보가 포함되었는지 확인할 수 있다.
분석 모듈(154)은 선별 모듈(153)로부터 전달 받은 선별 결과 문서 리스트에 포함된 문서 파일들을 대상으로 분석 대상 문서 파일을 선택할 수 있다.
그 후, 분석 모듈(154)은 선택된 문서 파일을 대상으로 저장부(130)에 미리 저장된 정규식을 반영할 수 있다. 정규식은 주민등록증의 텍스트 값에 대한 정규식, 전화번호의 텍스트 값에 대한 정규식, 은행 계좌 번호의 텍스트 값에 대한 정규식 및 신용카드의 텍스트 값에 대한 정규식 및 이메일 주소의 텍스트 값에 대한 정규식 중 적어도 하나를 포함할 수 있다. 예를 들어, 주민등록증의 텍스트 값에 대한 정규식은 주민등록번호를 구성하는 번호의 일정한 패턴 정보를 포함할 수 있다. 주민등록번호는 앞에 연월일을 표시하는 6자리 숫자와 뒤에 7자리 숫자로 구성되면 뒤에 7자리 숫자는 1, 2, 3 및 4 중 어느 하나로 구성된다.
그 후, 분석 모듈(154)은 저장부(130)에 미리 저장된 정규식의 패턴과 정규식이 반영된 해당 문서 파일과 일치하는 정보가 있는지 판단할 수 있다. 예를 들어, 분석 모듈(154)은 주민등록증의 텍스트 값에 대한 정규식이 반영된 문서 파일에 포함된 텍스트 값들과 저장부(130)에 미리 저장된 주민등록번호를 나타내는 텍스트 값에 대한 정규식의 패턴과 일치하는지 여부를 판단을 통해 개인정보인 주민등록 번호가 포함되었는지 판단할 수 있다.
미리 저장된 정규식의 패턴과 정규식이 반영된 해당 문서 파일과 일치하는 정보가 있는 경우, 분석 모듈(154)은 해당 문서 파일을 임시 분석 문서 리스트에 추가할 수 있다. 임시 분석 문서 리스트는 미리 저장된 정규식의 패턴과 정규식이 반영된 해당 문서 파일과 일치하는 정보가 있는 경우, 분석 모듈(154)이 자동으로 생성할 수 있다. 그 후, 분석 모듈(154)은 해당 문서 파일을 선별 결과 문서 리스트에서 제외할 수 있다.
반면, 미리 저장된 정규식의 패턴과 정규식이 반영된 해당 문서 파일과 일치하는 정보가 없는 경우, 분석 모듈(154)은 해당 문서 파일을 선별 결과 문서 리스트에서 제외할 수 있다.
그 후, 분석 모듈(154)은 선별 결과 문서 리스트 내에 포함된 모든 문서 파일들이 분석되었는지 판단할 수 있다. 선별 결과 문서 리스트 내에 포함된 모든 문서 파일들이 분석되지 않았을 경우, 분석 모듈(154)은 분석되지 않은, 선별 결과 문서 리스트 내에 포함된 적어도 하나의 문서 파일을 분석 대상으로 선택하고, 선택된 문서 파일이 개인정보를 포함하는 문서 파일인지 판단하는 과정을 재수행할 수 있다. 선별 결과 문서 내에 포함된 모든 문서 파일들이 분석된 경우, 분석 모듈(154)은 임시 분석 문서 리스트로부터 분석 결과 문서 리스트를 생성하고, 생성된 분석 결과 문서 리스트를 처리 모듈(155)로 전달할 수 있다.
처리 모듈(155)은 분석 결과 계약서/신청서 리스트, 분석 결과 이미지 리스트 및 분석 결과 문서 리스트에 포함된 파일들을 중 적어도 하나의 파일을 대상으로 입력부(120)를 통해 수신 받은 사용자 입력 신호에 따라 해당 파일을 저장부(130)로부터 삭제하거나 개인정보 자동 검색 대상 파일 중 제외 파일로 지정할 수 있다.
또한, 처리 모듈(155)은 분석 결과 계약서/신청서 리스트, 분석 결과 이미지 리스트 및 분석 결과 문서 리스트에 포함된 파일들 중 저장부(130)로부터 삭제된 파일들의 정보를 나타내는 삭제 결과 정보를 생성하여 서버(200)로 전송할 있다. 삭제 결과 정보는 삭제된 계약서/신청서 파일들의 개수 정보, 삭제된 이미지 파일들의 개수 정보 및 삭제된 문서 파일들의 개수 정보를 포함할 수 있다. 처리 모듈(155)은 분석 결과 계약서/신청서 리스트, 분석 결과 이미지 리스트 및 분석 결과 문서 리스트를 대상으로 다음과 같은 처리 과정을 수행할 수 있다.
처리 모듈(155)은 분석 모듈(154)로부터 전달 받은 분석 결과 계약서/신청서 리스트에 포함된 계약서/신청서 파일들, 분석 결과 이미지 리스트에 포함된 이미지 파일들 및 분석 결과 문서 리스트에 포함된 문서 파일들을 대상으로 처리 대상 파일을 선택할 수 있다.
그 후, 처리 모듈(155)은 사용자가 인지할 수 있도록, 선택된 파일을 표시부(140)를 통해 표시할 수 있다.
그 후, 처리 모듈(155)은 입력부(120)를 통해 선택된 파일을 삭제를 위한 사용자 입력 신호가 수신되었는지 판단할 수 있다. 선택된 파일을 삭제를 위한 사용자 입력 신호가 수신된 경우, 처리 모듈(155)은 해당 파일을 저장부(130)로부터 삭제할 수 있다. 선택된 파일을 삭제를 위한 사용자 입력 신호가 수신되지 않은 경우, 처리 모듈(155)은 해당 파일을 개인 정보 자동 검색 대상 파일 중 제외 파일로 지정할 수 있다.
그 후, 처리 모듈(155)은 해당 파일을 분석 결과 계약서/신청서 리스트, 분석 결과 이미지 리스트 및 분석 결과 문서 리스트 중 하나의 리스트에서 제외할 수 있다.
그 후, 처리 모듈(155)은 해당 파일의 삭제 정보를 임시 삭제 결과 정보에 추가할 수 있다. 임시 삭제 결과 정보는 분석 결과 계약서/신청서 리스트, 분석 결과 이미지 리스트 및 분석 결과 문서 리스트에 포함된 파일들 중 적어도 하나의 파일이 저장부(130)로부터 삭제된 경우, 처리 모듈(155)이 자동으로 생성할 수 있다.
그 후, 처리 모듈(155)은 분석 결과 계약서/신청서 리스트, 분석 결과 이미지 리스트 및 분석 결과 문서 리스트에 포함된 모든 파일들이 처리되었는지 판단할 수 있다. 모든 파일들이 처리된 경우, 처리 모듈(155)은 임시 삭제 결과 정보로부터 삭제 결과 정보를 생성할 수 있다. 처리 모듈(155)은 생성된 삭제 결과 정보를 통신부(110)를 통해 서버(200)로 전송할 수 있다. 반면, 모든 파일들이 처리되지 않은 경우, 처리 모듈(155)은 처리되지 않은, 분석 결과 계약서/신청서 리스트, 분석 결과 이미지 리스트 및 분석 결과 문서 리스트에 포함된 적어도 하나의 파일을 처리 대상으로 선택하고, 선택된 파일을 표시부(140)를 통해 표시하는 과정으로 이동하여 해당 과정을 수행할 수 있다.
한편, 본 발명의 다른 실시예에 따른 개인정보 자동 검색 시스템(100)은 통신부(110), 입력부(120), 저장부(130), 표시부(140) 및 제어부(150)를 포함할 수 있다. 통신부(110), 입력부(120), 저장부(130) 및 표시부(140)에 대한 상세한 설명은 상기 설명된 봐와 동일하므로 생략하기로 한다.
한편, 본 발명의 다른 실시예에 따른 개인정보 자동 검색 시스템(100)의 제어부(150)는 저장부(130)에 존재하는 파일들을 저장부(130)에 미리 저장된 확장자 설정 정보와 비교를 통해 이미지 파일 또는 문서 파일로 분류하고, 이미지 파일 리스트 또는 문서 파일 리스트를 생성할 수 있다. 예를 들어, 제어부(150)는 저장부(130)에 존재하는 파일들의 각각의 확장자가 저장부에 미리 저장된 확장자 설정 정보와 일치하는지 판단할 수 있다. 상기 판단 결과, 제어부(150)는 저장부(130)에 존재하는 파일들을 이미지 파일 또는 문서 파일로 분류할 수 있다. 제어부(150)는 분류된 이미지 파일을 포함하는 이미지 파일 리스트 또는 분류된 문서 파일을 포함하는 문서 파일 리스트를 생성할 수 있다.
또한, 제어부(150)는 저장부(130)에 존재하는 파일들의 각각의 확장자가 저장부에 미리 저장된 확장자 설정 정보와 일치하는지 판단하기 이전에, 개인정보 자동 검색 과정의 인증 과정으로서, 유무선 네트워크 망(300)을 통해 연결된 서버(200)와 인증 과정을 수행할 수 있다. 전자장치(100)는 서버(200)로부터 인증 성공을 나타내는 정보를 포함하는 인증 결과 정보가 수신된 경우, 상기 저장부(130)에 존재하는 파일들의 각각의 확장자가 저장부에 미리 저장된 확장자 설정 정보와 일치하는지 판단을 수행할 수 있다.
그 후, 제어부(150)는 이미지 파일 리스트에 포함된 이미지 파일들을 대상으로 추정 영상처리 방법을 통해 추정 이미지 파일 리스트를 생성할 수 있다. 추정 이미지 파일은 개인정보를 포함하고 있다고 추정되는 이미지 파일을 의미한다. 추정 영상처리 방법은 이미지 파일 리스트에 포함된 이미지 파일들 중 추정 이미지 파일 존재하는지 판단하기 위한 영상처리 방법이다. 추정 영상처리 방법은 이미지 파일 리스트에 포함된 이미지 파일들을 대상으로 선택된 하나의 이미지 파일의 이미지를 그레이 영상으로 변환하는 방법, 변환된 그레이 영상으로부터 히스토그램 추출하는 방법 및 추출된 히스토그램으로부터 흰색 분포도를 산출하는 방법을 포함할 수 있다. 예를 들어, 제어부(150)는 이미지 파일 리스트에 포함된 이미지 파일들을 대상으로 추정 영상처리 방법을 통해 추정 이미지 파일이 존재하는지 판단하고, 추정 이미지 파일이 존재하는 경우, 추정 이미지 파일을 포함하는 추정 이미지 파일 리스트를 생성할 수 있다.
또한, 제어부(150)가 수행하는 이미지 파일 리스트에 포함된 이미지 파일들을 대상으로 추정 영상처리 방법을 통해 추정 이미지 파일 리스트를 생성하는 과정은 다음과 같은 과정들을 포함할 수 있다. 먼저, 제어부(150)는 이미지 파일 리스트에 포함된 이미지 파일들 중 하나의 이미지 파일을 선택하고, 선택된 이미지 파일의 이미지를 그레이 영상으로 변환할 수 있다.
그 후, 제어부(150)는 변환된 그레이 영상으로부터 히스토그램을 추출 및 추출된 히스토그램으로부터 흰색 분포 값을 산출할 수 있다.
그 후, 제어부(150)는 산출된 흰색 분포 값이 저장부에 미리 저장된 히스토그램 임계치 값 이상인지 판단할 수 있다.
상기 판단 결과, 산출된 흰색 분포 값이 히스토그램 임계치 값 이상인 경우, 제어부(150)는 선택된 이미지 파일을 추정 이미지 파일로 판단하고, 추정 이미지 파일을 포함하는 추정 이미지 파일 리스트를 생성할 수 있다.
한편, 산출된 흰색 분포 값이 히스토그램 임계치 값 미만인 경우, 제어부(150)는 선택된 이미지 파일은 개인정보를 포함하고 있지 않다고 판단하고, 선택된 이미지 파일을 다음 수행되는 과정에서 처리되지 않도록 제외시킬 수 있다.
그 후, 제어부(150)는 추정 이미지 파일 리스트에 포함된 추정 이미지 파일들을 대상으로 분류 영상처리 방법을 통해 계약서/신청서 이미지 파일 또는 신분증 이미지를 포함하는 신분증 이미지 파일로 분류하고, 계약서/신청서 이미지 파일을 포함하는 계약서/신청서 이미지 파일 리스트 또는 신분증 이미지 파일을 포함하는 신분증 이미지 파일 리스트를 생성할 수 있다. 분류 영상처리 방법은 추정 이미지 파일 리스트에 포함된 추정 이미지 파일들 중 계약서/신청서 이미지 파일이 존재하는지 판단하기 위한 계약서/신청서 이미지 파일 영상처리 방법으로서, 추정 이미지 파일의 이미지 내에 관심 영역을 설정하는 방법, 관심 영역에 SURF 알고리즘을 통해 특징점을 추출하는 방법 및 추출된 특징점의 개수를 산출하는 방법을 포함할 수 있다.
또한, 분류 영상처리 방법은 추정 이미지 파일 리스트에 포함된 추정 이미지 파일들 중 신분증 이미지를 포함하는 신분증 이미지가 존재하는지 판단하기 위한 신분증 이미지 파일 영상처리 방법으로서, 추정 이미지 파일의 이미지를 대상으로 에지 검출 알고리즘을 통해 에지 영역들을 추출하는 방법, 추출된 에지 영역들을 대상으로 픽셀 그룹핑하여 사각형의 관심 영역을 형성하는 방법 및 형성된 사각형의 관심 영역이 이미지의 전체 크기에서 차지하는 비율을 산출하는 방법을 포함할 수 있다.
예를 들어, 제어부(150)는 추정 이미지 파일 리스트에 포함된 추정 이미지 파일들 중 실제 개인정보를 포함하고 있는 이미지 파일이 있는지 분류 영상처리 방법을 통해 판단할 수 있다. 제어부(150)는 개인정보를 포함하는 이미지 파일들은 계약서/신청서 이미지 파일 또는 신분증 이미지를 포함하는 이미지 파일로 분류할 수 있다. 제어부(150)는 분류된 계약서/신청서 이미지 파일을 포함하는 계약서/신청서 이미지 파일 리스트를 생성하거나 분류된 신분증 이미지를 포함하는 이미지 파일을 포함하는 신분증 이미지 파일 리스트를 생성할 수 있다.
또한, 제어부(150)가 수행하는 1103 과정은 다음과 같은 과정들을 포함할 수 있다. 제어부(150)는 추정 이미지 파일 리스트에 포함된 추정 이미지 파일들 중 계약서/신청서 이미지 파일을 확인하기 위하여 다음과 같은 과정을 수행할 수 있다. 먼저, 제어부(150)는 추정 이미지 파일 리스트에 포함된 추정 이미지 파일들 중 하나의 추정 이미지 파일을 선택하고, 선택된 추정 이미지 파일의 이미지 내에 상단 부분 또는 하단 부분을 관심 영역으로 설정할 수 있다. 예를 들어, 보통의 계약서/신청서 이미지는 정해진 서식을 가지고 있으며, 상단 부분 또는 하단 부분에 개인정보를 포함하는 영역이 있다. 따라서 관심영역은 추정 이미지 파일의 이미지 내에 산단 부분 또는 하단 부분으로 한정되지 않으며, 사용자의 설정에 따라 선택된 영역이 관심영역으로 설정될 수 있다.
그 후, 제어부(150)는 설정된 관심 영역에 SURF 알고리즘 적용하여 특징점을 추출하고, 추출된 특징점의 개수를 산출할 수 있다.
그 후, 제어부(150)는 추출된 특징점의 개수가 저장부(130)에 미리 저장된 특징점 임계치 개수 이상인지 판단할 수 있다.
상기 판단 결과, 추출된 특징점의 개수가 특징점 임계치 개수 이상인 경우, 제어부(150)는 선택된 추정 이미지 파일을 계약서/신청서 이미지 파일로 판단하고, 판단된 계약서/신청서 이미지 파일을 포함하는 계약서/신청서 이미지 파일 리스트를 생성할 수 있다.
상기 판단 결과, 추출된 특징점의 개수가 특징점 임계치 개수 미만인 경우, 제어부(150)는 선택된 추정 이미지 파일을 계약서/신청서 이미지 파일이 아닌 것으로 판단할 수 있다.
또한, 제어부(150)는 추출된 특징점의 개수가 특징점 임계치 개수 미만인 경우, 선택된 추정 이미지 파일이 신분증 이미지를 포함하고 있는지를 판단하기 위하여 다음과 같은 과정을 추가로 수행할 수 있다. 먼저, 제어부(150)는 선택된 추정 이미지 파일의 이미지를 대상으로 에지 검출 알고리즘을 통해 에지 영역을 추출할 수 있다. 예를 들어, 제어부(150)는 에지 검출 알고리즘을 통해 추정 이미지 파일 내에 에지 영역들을 추출할 수 있다. 추정 이미지 파일 내에 신분증 이미지가 존재한다면, 에지 검출 알고리즘을 통해 신분증의 각 에지 영역이 추출될 수 있다.
그 후, 제어부(150)는 추출된 에지 영역들을 대상으로 픽셀간 그룹핑을 통해 하나의 사각형 영역을 형성하여 사각형의 관심 영역을 추출할 수 있다. 보통의 신분증은 일정 크기를 갖는 사각형의 형상을 가진다. 따라서 제어부(150)는 추출된 에지 영역들을 대상으로 픽셀간 그룹핑을 통해 하나의 사각형 영역인 신분증 이미지일 가능성이 높은 영역을 형성하고, 형성된 사각형의 영역을 관심 영역으로 추출할 수 있다.
그 후, 제어부(150)는 추출된 관심 영역의 크기가 추정 이미지 파일의 이미지 전체 크기에서 차지하는 비율을 산출할 수 있다.
그 후, 제어부(150)는 산출된 관심 영역의 크기가 차지하는 비율이 저장부(130)에 미리 저장된 비율 임계값 이하인가 판단할 수 있다. 비율 임계값은 산출된 관심 영역이 실제 신분증 이미지의 크기인가를 판단하기 위한 기준 값이다.
상기 판단 결과, 산출된 관심 영역의 크기가 차지하는 비율이 비율 임계값 이하인 경우, 제어부(150)는 선택된 추정 이미지 파일이 신분증 이미지를 포함하는 신분증 이미지 파일로 판단하고, 신분증 이미지 파일을 포함하는 신분증 이미지 파일 리스트를 생성할 수 있다.
한편, 관심 영역의 크기가 차지하는 비율이 비율 임계값을 초과하는 경우, 제어부(150)는 선택된 추정 이미지 파일은 신분증 이미지를 포함하고 있지 않다고 판단하고, 선택된 추정 이미지 파일을 다음 수행되는 과정에서 처리되지 않도록 제외시킬 수 있다.
그 후, 제어부(150)는 문서 파일 리스트에 포함된 문서 파일들 대상으로 저장부(130)에 미리 저장된 정규식을 통해 개인정보 문서 파일이 존재하는지 판단하고, 개인정보 문서 파일이 존재하는 경우, 개인정보 문서 파일을 포함하는 개인정보 문서 파일 리스트를 생성할 수 있다. 정규식은 문서 파일 리스트에 포함된 문서 파일들 중 개인정보 문서 파일이 존재하는지 판단하기 위한 알고리즘으로서 일정한 패턴을 가지고 있다. 예를 들어, 제어부(150)는 문서 파일 리스트에 포함된 문서 파일들 중 하나의 문서 파일을 선택하여 저장부(130)에 미리 저장된 정규식을 반영하고, 정규식이 반영된 문서 파일과 저장부(130)에 미리 저장된 정규식의 패턴 간 일치하는 정보가 있는지 판단할 수 있다. 일치하는 정보가 존재하는 경우, 제어부(150)는 선택된 문서 파일을 개인정보를 포함하는 개인정보 문서 파일로 판단할 수 있다.
또한, 제어부(150)가 수행하는 1104 과정은 다음과 같은 과정들을 포함할 수 있다. 먼저, 제어부(150)는 문서 이미지 파일 리스트에 포함된 문서 파일들 중 하나의 문서 파일을 선택하고, 선택된 문서 파일에 저장부(130)에 미리 저장된 정규식을 반영할 수 있다.
그 후, 제어부(150)는 정규식이 반영된 문서 파일과 저장부(130)에 미리 저장된 정규식의 패턴 간 일치하는 정보가 있는지 판단할 수 있다.
상기 판단 결과, 정규식이 반영된 문서 파일과 정규식 패턴 간에 일치하는 정보가 있는 경우, 제어부(150)는 선택된 문서 파일을 개인정보를 포함하는 개인정보 문서 파일로 판단하고, 선택한 문서 파일을 포함하는 개인정보 문서 파일 리스트를 생성할 수 있다.
한편, 정규식이 반영된 문서 파일과 정규식 패턴 간에 일치하는 정보가 없는 경우, 제어부(150)는 선택된 문서 파일은 개인정보를 포함하고 있지 않다고 판단하고, 선택된 문서 파일을 다음 수행되는 과정에서 처리되지 않도록 제외시킬 수 있다.
그 후, 제어부(150)는 계약서/신청서 이미지 파일 리스트, 신분증 이미지 파일 리스트 및 개인정보 문서 파일 리스트에 포함된 파일들 중 적어도 하나의 파일을 구비된 입력부(120)를 통해 수신된 사용자 입력 신호에 따라 저장부(130)에서 삭제 처리 또는 개인 정보 검색 대상에서 제외 처리할 수 있다.
또한, 제어부(150)는 삭제 처리된 적어도 하나의 파일의 정보를 포함하는 삭제 결과 정보를 생성하고, 생성된 삭제 결과 정보를 서버(200)로 전송할 수 있다. 예를 들어, 삭제 처리된 적어도 하나의 파일의 정보로는 삭제 처리된 파일들의 총 개수 정보, 삭제된 파일들 각각의 파일명 정보, 삭제된 파일들 각각의 확장자 정보, 삭제된 파일들 각각의 크기 정보 및 삭제된 파일들 각각의 생성일자 정보 중 적어도 하나의 정보를 포함할 수 있다.
도 3은 본 발명의 실시예에 따른 서버의 세부 구조를 나타내는 도면이다. 도3을 참조하면, 본 발명의 실시예에 따른 서버(200)는 통신부(210), 저장부(220), 표시부(230) 및 제어부(240)를 포함할 수 있다.
통신부(210)는 제어부(240)의 제어에 따라 유무선 네트워크망(300)을 통해 적어도 하나의 전자장치(미도시)와 연결되어 데이터를 송수신할 수 있다. 예컨대, 통신부(210)는 유선랜 모듈(미도시) 및 무선랜 모듈(미도시) 중 적어도 하나를 포함할 수 있다. 유선랜 모듈(미도시)은 미국전기전자학회(IEEE)의 유선랜 규격(IEEE 802.xx)을 지원할 수 있다. 무선랜 모듈(미도시)은 미국전기전자학회(IEEE)의 무선랜 규격(IEEE 802.11x)을 지원할 수 있다. 무선랜 모듈(미도시)은 제어부(150)의 제어에 따라 무선 액세스 포인트(AP; Access Point)가 설치된 장소에서 인터넷 망에 접속하여 적어도 하나의 전자장치(미도시)와 서로 연결될 수 있다.
저장부(220)는 제어부(240)의 제어에 따라 적어도 하나의 전자 장치(미도시)와의 인증 과정에 사용되는 전자장치(미도시)의 등록 정보를 미리 저장할 수 있다.
제어부(240)는 통신부(210), 저장부(220) 및 표시부(230)의 동작을 제어할 수 있다.
또한, 제어부(240)는 인증 모듈(241) 및 관리 모듈(242)을 포함할 수 있다.
인증 모듈(241)은 적어도 하나의 전자장치(미도시)가 통신부(210)를 통해 서버(200)와 연결되면, 다음과 같은 인증 과정을 수행할 수 있다.
인증 모듈(241)은 통신부(210)를 통해 적어도 하나의 전자장치(미도시)로부터 인증 확인 요청 정보를 수신 받을 수 있다.
그 후, 인증 모듈(241)은 수신 받은 인증 확인 요청 정보에 포함된 등록 정보를 추출하고, 추출된 등록 정보가 저장부(220)에 미리 저장된 등록 정보인지를 판단할 수 있다. 수신 받은 인증 확인 요청 정보로부터 추출된 등록 정보가 저장부(220)에 미리 저장된 등록 정보인 경우, 인증 모듈(241)은 인증 성공을 나타내는 정보를 포함하는 인증 결과 정보를 생성하여, 생성된 인증 결과 정보를 인증 확인 요청 정보의 응답 신호로서 인증 확인 요청 정보를 전송한 해당 전자장치(100)로 전송할 수 있다. 반면, 수신 받은 인증 확인 요청 정보로부터 추출된 등록 정보가 저장부(220)에 미리 저장된 등록 정보가 아닌 경우, 인증 모듈(241)은 인증 실패를 나타내는 정보를 포함하는 인증 결과 정보를 생성하여, 생성된 인증 결과 정보를 인증 확인 요청 정보의 응답 신호로서 인증 확인 요청 정보를 전송한 해당 전자장치(100)로 전송할 수 있다.
관리 모듈(242)은 통신부(210)를 통해 적어도 하나의 전자장치(100)로부터 삭제 결과 정보를 수신 받을 수 있다.
또한, 관리 모듈(242)은 수신 받은 삭제 결과 정보를 등록 정보 별로 저장부(220)에 저장할 수 있다.
또한, 관리 모듈(242)은 수신 받은 삭제 결과 정보로부터 삭제된 계약서/신청서 파일들의 개수 정보, 삭제된 이미지 파일들의 개수 정보 및 삭제된 문서 파일들의 개수 정보를 각각 추출하여 사용자가 인지 가능하도록 표시부(230)를 통해 표시할 수 있다.
한편, 상기 개인정보 자동 검색 시스템(400), 전자장치(100) 및 서버(200)의 각각의 구성요소들은 기능 및 논리적으로 분리될 수 있음을 나타나기 위해 별도로 도면에 표시한 것이며, 물리적으로 반드시 별도의 구성요소이거나 별도의 코드로 구현되는 것을 의미하는 것은 아니다.
그리고 본 명세서에서 각 기능부라 함은, 본 발명의 기술적 사상을 수행하기 위한 하드웨어 및 상기 하드웨어를 구동하기 위한 소프트웨어의 기능적, 구조적 결합을 의미할 수 있다. 예컨대, 상기 각 기능부는 소정의 코드와 상기 소정의 코드가 수행되기 위한 하드웨어 리소스의 논리적인 단위를 의미할 수 있으며, 반드시 물리적으로 연결된 코드를 의미하거나, 한 종류의 하드웨어를 의미하는 것은 아님은 본 발명의 기술분야의 평균적 전문가에게는 용이하게 추론될 수 있다.
이하 첨부된 도면을 참조하여 본 발명의 실시예에 따른 개인정보 자동 검색 방법에 대하여 설명하기로 한다.
도 4는 본 발명의 실시예에 따른 개인정보 자동 검색 시스템의 전체 처리 절차를 나타내는 도면이다. 도 4를 참조하면, 본 발명의 실시예에 따른 개인정보 자동 검색 시스템(400)의 전자장치(100)는 저장부(130)에 존재하는 파일들을 대상으로 검색 과정을 수행할 수 있다(S401). 예를 들어, 전자장치(100)는 저장부(130)에 존재하는 파일들의 각 파일 확장자와 저장부(130)에 미리 저장된 확장자 설정 정보를 서로 비교하여 개인정보를 포함하는 검색 결과 파일 리스트를 생성할 수 있다.
또한, 전자장치(100)는 상기 401 과정을 수행하기 이전에, 개인정보 자동 검색 과정의 수행을 위한 유무선 네트워크 망(300)을 통해 연결된 서버(200)와 인증 과정을 수행할 수 있다(S400). 전자장치(100)는 서버(200)로부터 인증 성공을 나타내는 정보를 포함하는 인증 결과 정보가 수신된 경우, 상기 401 과정을 수행할 수 있다.
그 후, 전자장치(100)는 검색 결과 파일 리스트에 포함된 파일들을 대상으로 선별 과정을 수행할 수 있다(S402). 예를 들어, 전자장치(100)는 확장자 설정 정보와 비교를 통해 이미지 확장자를 갖는 파일과 문서 확장자를 갖는 파일들로 일차 선별할 수 있다.
또한, 전자장치(100)는 검색 결과 파일 리스트를 생성하는 상기 401 과정 없이 저장부(130)에 존재하는 파일들을 대상으로 선별 과정을 수행할 수 있다.
또한, 전자장치(100)는 일차 선별된 이미지 파일을 대상으로 영상 처리 방법을 통해 개인정보 자동 검색 대상의 이미지 파일로 이차 선별할 수 있다. 영상 처리 방법은 그레이 영상 변환 방법, 히스토그램 추출 방법 및 흰색 분포 값 산출 방법을 포함할 수 있다. 전자장치(100)는 일차 및 이차 선별 과정을 통해 선별 결과 문서 리스트 또는 선별 결과 이미지 리스트를 생성할 수 있다.
그 후, 전자장치(100)는 선별 결과 이미지 리스트 및 선별 결과 문서 리스트에 포함된 파일들을 대상으로 분석 과정을 수행할 수 있다(S403). 예를 들어, 전자장치(100)는 선별 결과 이미지 리스트에 포함된 이미지 파일들을 대상으로 관심 영역 설정, SURF 알고리즘 적용 및 특징점 추출을 통해 계약서/신청서 이미지 파일을 분석하여, 분석 결과 계약서/신청서 리스트를 생성할 수 있다.
또한, 전자장치(100)는 선별 결과 이미지 리스트에 포함된 이미지 파일들을 대상으로 에지 영역 추출, 픽셀 그룹핑 및 관심 영역 추출을 통해 신분증이 포함된 이미지 파일을 분석하여, 분석 결과 이미지 리스트를 생성할 수 있다.
또한, 전자장치(100)는 선별 결과 문서 리스트에 포함된 문서 파일들을 대상으로 정규식을 적용 및 정규식 패턴 분석을 통해 개인정보가 포함된 문서 파일을 분석하여, 분석 결과 문서 리스트를 생성할 수 있다.
그 후, 전자장치(100)는 분석 결과 계약서/신청서 리스트, 분석 결과 이미지 리스트 및 분석 결과 문서 리스트에 포함된 파일들을 대상으로 처리 과정을 수행할 수 있다(S404). 예를 들어, 전자장치(100)는 분석 결과 계약서/신청서 리스트, 분석 결과 이미지 리스트 및 분석 결과 문서 리스트에 포함된 파일들을 대상으로 수신된 사용자 입력 신호에 따라 삭제 또는 개인 정보 검색 대상에서 제외하는 처리 과정을 통해, 삭제 결과 정보를 생성할 수 있다.
그 후, 전자장치(100)는 생성된 삭제 결과 정보를 서버(200)로 전송할 수 있다(S405).
도 5는 본 발명의 실시예에 따른 개인정보 자동 검색 시스템의 검색 처리 절차를 나타내는 도면이다. 도 5를 참조하면, 본 발명의 실시예에 따른 전자장치(100)의 제어부(150)의 검색 모듈(152)은 저장부(130)에 존재하는 폴더들 중 적어도 하나의 폴더를 선택을 나타내는 사용자 입력 신호를 입력부(120)를 통해 수신할 수 있다(S501). 사용자 입력 신호에 의해 선택된 폴더는 개인 정보 자동 검색의 대상 폴더가 된다.
그 후, 검색 모듈(152)은 선택된 폴더에 존재하는 파일 확장자가 저장부(130)에 미리 저장된 확장자 설정 정보와 일치하는지 판단할 수 있다(S502). 해당 파일 확장자가 확장자 설정 정보에 포함된 파일 확장자들 중 적어도 하나와 일치하는 경우, 검색 모듈(152)은 해당 파일 확장자의 파일을 임시 검색 파일 리스트에 추가할 수 있다(S503). 반면, 해당 파일 확장자가 확장자 설정 정보에 포함된 파일 확장자들 중 적어도 하나와 일치하지 않는 경우, 검색 모듈(152)은 다음 504 과정을 수행할 수 있다.
그 후, 검색 모듈(152)은 해당 파일을 개인 정보 검색 대상에서 제외할 수 있다(S504).
그 후, 검색 모듈(152)은 폴더 내에 존재하는 모든 파일들의 파일 확장자들이 확장자 설정 정보와 비교되었는지 판단할 수 있다(S505). 모든 파일들의 파일 확장자들이 확장자 설정 정보와 비교되었을 경우, 검색 모듈(152)은 임시 검색 파일 리스트로부터 검색 결과 파일 리스트를 생성하고(S506), 생성된 검색 결과 파일 리스트를 선별 모듈(153)로 전달할 수 있다(S507). 반면, 모든 파일들의 파일 확장자들이 확장자 설정 정보와 비교되지 않았을 경우, 검색 모듈(152)은 상기 S502 과정으로 이동하여 해당 과정을 수행할 수 있다.
도 6는 본 발명의 실시예에 따른 개인정보 자동 검색 시스템의 선별 처리 절차를 나타내는 도면이다. 도 6을 참조하면, 본 발명의 실시예에 따른 전자장치(100)의 제어부(150)의 선별 모듈(153)은 검색 모듈(152)로부터 전달 받은 검색 결과 파일 리스트에 포함된 파일들을 대상으로 선별 대상 파일을 선택할 수 있다(S601).
그 후, 선별 모듈(153)은 선택된 파일이 이미지 파일인지 판단할 수 있다(S602). 예를 들어, 선별 모듈(153)은 선택된 파일의 파일 확장자와 저장부(130)에 미리 저장된 확장자 설정 정보를 서로 비교하여 이미지 파일인지 판단할 수 있다. 선택된 파일이 이미지 파일인 경우, 선별 모듈(153)은 다음 603 과정으로 이동하여 해당 과정을 수행할 수 있다. 반면, 선택된 파일이 이미지 파일이 아닌 경우, 선별 모듈(153)은 해당 파일을 임시 선별 문서 리스트에 추가(S607)하고, 다음 608 과정으로 이동하여 해당 과정을 수행할 수 있다.
그 후, 선별 모듈(153)은 해당 파일의 이미지를 그레이 영상으로 변환할 수 있다(S603).
그 후, 선별 모듈(153)은 변환된 그레이 영상을 대상으로 히스토그램을 추출하며 흰색 분포 값을 산출할 수 있다(S604).
그 후, 선별 모듈(153)은 산출된 흰색 분포 값이 저장부(130)에 미리 저장된 히스토그램 임계치 값 이상인지를 판단할 수 있다(S605). 산출된 흰색 분포 값이 히스토그램 임계치 값 이상인 경우, 선별 모듈(153)은 해당 이미지 파일을 임시 선별 이미지 리스트에 추가할 수 있다(S606).
그 후, 선별 모듈(153)은 해당 이미지 파일을 검색 결과 리스트에서 제외할 수 있다(S608).
그 후, 선별 모듈(153)은 검색 결과 리스트 내에 포함된 모든 파일들이 선별되었는지 판단할 수 있다(S609). 검색 결과 리스트 내에 포함된 모든 파일들이 선별된 경우, 선별 모듈(153)은 임시 선별 문서 리스트로부터 선별 결과 문서 리스트를 생성 또는 임시 선별 이미지 리스트로부터 선별 결과 이미지 리스트를 생성하고(S610), 생성된 선별 결과 문서 리스트 또는 생성된 선별 결과 이미지 리스트를 분석 모듈(154)로 전달할 수 있다(S611). 반면, 검색 결과 리스트 내에 포함된 모든 파일들이 선별되지 않았을 경우, 선별 모듈(153)은 상기 602 과정으로 이동하여 해당 과정을 수행할 수 있다.
도 7은 본 발명의 실시예에 따른 개인정보 자동 검색 시스템의 계약서/ 신청서 이미지 파일 분석 처리 절차를 나타내는 도면이다. 도 7을 참조하면, 본 발명의 실시예에 따른 전자장치(100)의 제어부(150)의 분석 모듈(154)은 선별 모듈(153)로부터 전달 받은 선별 결과 이미지 리스트에 포함된 이미지 파일들을 대상으로 분석 대상 이미지 파일을 선택할 수 있다(S701).
그 후, 분석 모듈(154)은 선택된 이미지 파일의 이미지 내에 이미지 내에 관심 영역을 설정할 수 있다(S702).
그 후, 분석 모듈(154)은 선택된 이미지 파일 내에 설정된 관심 영역에 SURF 알고리즘을 적용하여 특징점을 추출 및 추출된 특징점의 개수를 산출할 수 있다(S703).
그 후, 분석 모듈(154)은 선택된 이미지 파일로부터 산출된 특징점의 개수가 저장부(130)에 미리 저장된 특징점 임계치 개수 이상인가 판단할 수 있다(S704). 산출된 특징점의 개수가 특징점 임계치 개수 이상인 경우, 분석 모듈(154)은 해당 이미지 파일을 임시 분석 계약서/신청서 리스트에 추가할 수 있다(S705). 반면, 산출된 특징점의 개수가 특징점 임계치 개수 미만인 경우, 분석 모듈(154)은 하기 도 8을 참조하여 설명될 801 과정으로 이동하여 해당 과정을 수행할 수 있다.
그 후, 분석 모듈(154)은 해당 이미지 파일을 선별 결과 이미지 리스트에서 제외할 수 있다(S706).
그 후, 분석 모듈(154)은 선별 결과 이미지 리스트 내에 포함된 모든 이미지 파일들이 분석되었는지 판단할 수 있다(S707). 선별 결과 이미지 리스트 내에 포함된 모든 이미지 파일들이 분석된 경우, 분석 모듈(154)은 임시 분석 계약서/신청서 리스트로부터 분석 결과 계약서/신청서 리스트를 생성 또는 임시 분석 이미지 리스트로부터 분석 결과 이미지 리스트를 생성하고(S708), 생성된 분석 결과 계약서/신청서 리스트 또는 생성된 분석 결과 이미지 리스트를 처리 모듈(155)로 전달할 수 있다(S709). 반면, 선별 결과 이미지 리스트 내에 포함된 모든 이미지 파일들이 분석되지 않은 경우, 분석 모듈(154)은 상기 702 과정으로 이동하여 해당 과정을 수행할 수 있다.
도 8은 본 발명의 실시예에 따른 개인정보 자동 검색 시스템의 개인정보 신분증 이미지 파일 분석 처리 절차를 나타내는 도면이다. 본 발명의 실시예에 따른 전자장치(100)의 제어부(150)의 분석 모듈(154)은 산출된 특징점의 개수가 특징점 임계치 개수 미만인 경우, 해당 이미지 파일의 이미지를 대상으로 에지 검출을 수행할 수 있다(S801). 분석 모듈(154)은 산출된 특징점의 개수가 특징점 임계치 개수 미만인 경우, 해당 이미지 파일이 신분증 이미지를 포함하는 이미지 파일이라고 추정하고, 해당 이미지 파일이 신분증 이미지를 포함하고 있는지 확인하기 위해 해당 이미지 파일의 이미지를 대상으로 에지 검출을 수행하고, 에지 영역들을 추출할 수 있다.
그 후, 분석 모듈(154)은 추출된 에지 영역들을 대상으로 픽셀간 그룹핑을 통해 하나의 사각형 영역을 형성하여 사각형의 관심 영역을 추출할 수 있다(S802).
그 후, 분석 모듈(154)은 해당 이미지 파일의 전체 이미지 크기 대비 추출된 관심 영역의 크기가 차지하는 비율을 산출할 수 있다(S803).
그 후, 분석 모듈(154)은 산출된 관심 영역의 크기가 차지하는 비율이 저장부(130)에 미리 저장된 비율 임계값 이하인가 판단할 수 있다(S804). 산출된 관심 영역의 크기가 차지하는 비율이 비율 임계값 이하인 경우, 분석 모듈(154)은 해당 이미지 파일을 신분증 이미지를 포함하는 이미지 파일로 판단하고, 분석 모듈(154)은 해당 이미지 파일을 임시 분석 이미지 리스트에 추가하고(S805), 상기 도 7의 706 과정으로 이동하여 해당 과정을 수행할 수 있다.
반면, 산출된 관심 영역의 크기가 차지하는 비율이 비율 임계값을 초과하는 경우, 분석 모듈(154)은 상기 도 7의 706 과정으로 이동하여 해당 과정을 수행할 수 있다.
도 9는 본 발명의 실시예에 따른 개인정보 자동 검색 시스템의 개인정보 문서 파일 분석 처리 절차를 나타내는 도면이다. 본 발명의 실시예에 따른 전자장치(100)의 제어부(150)의 분석 모듈(154)은 선별 모듈(153)로부터 전달 받은 선별 결과 문서 리스트에 포함된 문서 파일들을 대상으로 분석 대상 문서 파일을 선택할 수 있다(S901).
그 후, 분석 모듈(154)은 선택된 문서 파일을 대상으로 저장부(130)에 미리 저장된 정규식을 반영할 수 있다(S902).
그 후, 분석 모듈(154)은 저장부(130)에 미리 저장된 정규식의 패턴과 정규식이 반영된 해당 문서 파일과 일치하는 정보가 있는지 판단할 수 있다(S903). 미리 저장된 정규식의 패턴과 정규식이 반영된 해당 문서 파일과 일치하는 정보가 있는 경우, 분석 모듈(154)은 해당 문서 파일을 임시 분석 문서 리스트에 추가할 수 있다(S904). 반면, 미리 저장된 정규식의 패턴과 정규식이 반영된 해당 문서 파일과 일치하는 정보가 없는 경우, 분석 모듈(154)은 다음 905 과정으로 이동하여 해당 과정을 수행할 수 있다.
그 후, 분석 모듈(154)은 해당 문서 파일을 선별 결과 문서 리스트에서 제외할 수 있다(S905).
그 후, 분석 모듈(154)은 선별 결과 문서 리스트 내에 포함된 모든 문서 파일들이 분석되었는지 판단할 수 있다(S906). 선별 결과 문서 내에 포함된 모든 문서 파일들이 분석된 경우, 분석 모듈(154)은 임시 분석 문서 리스트로부터 분석 결과 문서 리스트를 생성하고(S907), 생성된 분석 결과 문서 리스트를 처리 모듈(155)로 전달할 수 있다(S908). 반면, 선별 결과 문서 내에 포함된 모든 문서 파일들이 분석되지 않은 경우, 분석 모듈(154)은 상기 902 과정으로 이동하여 해당 과정을 수행할 수 있다.
도 10은 본 발명의 실시예에 따른 개인정보 자동 검색 시스템의 삭제 결과 정보 처리 절차를 나타내는 도면이다. 본 발명의 실시예에 따른 전자장치(100)의 제어부(150)의 처리 모듈(155)은 분석 모듈(154)로부터 전달 받은 분석 결과 계약서/신청서 리스트에 포함된 계약서/신청서 파일들, 분석 결과 이미지 리스트에 포함된 이미지 파일들 및 분석 결과 문서 리스트에 포함된 문서 파일들을 대상으로 처리 대상 파일을 선택할 수 있다(S1001).
그 후, 처리 모듈(155)은 사용자가 인지할 수 있도록, 선택된 파일을 표시부(140)를 통해 표시할 수 있다(S1002).
그 후, 처리 모듈(155)은 입력부(120)를 통해 선택된 파일을 삭제를 위한 사용자 입력 신호가 수신되었는지 판단할 수 있다(S1003). 선택된 파일을 삭제를 위한 사용자 입력 신호가 수신된 경우, 처리 모듈(155)은 해당 파일을 저장부(130)로부터 삭제할 수 있다(S1004). 반면, 선택된 파일을 삭제를 위한 사용자 입력 신호가 수신되지 않은 경우, 처리 모듈(155)은 해당 파일을 개인 정보 자동 검색 대상 파일 중 제외 파일로 지정하고(S1010), 다음 1005 과정으로 이동하여 해당 과정을 수행할 수 있다.
그 후, 처리 모듈(155)은 해당 파일을 분석 결과 계약서/신청서 리스트, 분석 결과 이미지 리스트 및 분석 결과 문서 리스트 중 하나의 리스트에서 제외할 수 있다(S1005).
그 후, 처리 모듈(155)은 해당 파일의 삭제 정보를 임시 삭제 결과 정보에 추가할 수 있다(S1006).
그 후, 처리 모듈(155)은 분석 결과 계약서/신청서 리스트, 분석 결과 이미지 리스트 및 분석 결과 문서 리스트에 포함된 모든 파일들이 처리되었는지 판단할 수 있다(S1007). 모든 파일들이 처리된 경우, 처리 모듈(155)은 임시 삭제 결과 정보로부터 삭제 결과 정보를 생성하고(S1008), 처리 모듈(155)은 생성된 삭제 결과 정보를 통신부(110)를 통해 서버(200)로 전송할 수 있다(S1009). 반면, 모든 파일들이 처리되지 않은 경우, 처리 모듈(155)은 상기 1002 과정으로 이동하여 해당 과정을 수행할 수 있다.
도 11은 본 발명의 다른 실시예에 따른 개인정보 자동 검색 시스템의 전체 처리 절차를 나타내는 도면이다. 도 11을 참조하면, 본 발명의 실시예에 따른 개인정보 자동 검색 시스템(400)의 전자장치(100)의 제어부(150)는 구비된 저장부에 존재하는 파일들 중 선택된 파일을 저장부에 미리 저장된 확장자 설정 정보와 비교를 통해 이미지 파일 또는 문서 파일로 분류할 수 있다(S1101).
또한, 제어부(150)는 저장부(130)에 존재하는 파일들을 저장부(130)에 미리 저장된 확장자 설정 정보와 비교를 통해 이미지 파일 또는 문서 파일로 분류하고, 이미지 파일 리스트 또는 문서 파일 리스트를 생성할 수 있다. 예를 들어, 제어부(150)는 저장부(130)에 존재하는 파일들의 각각의 확장자가 저장부에 미리 저장된 확장자 설정 정보와 일치하는지 판단할 수 있다. 상기 판단 결과, 제어부(150)는 저장부(130)에 존재하는 파일들을 이미지 파일 또는 문서 파일로 분류할 수 있다. 제어부(150)는 분류된 이미지 파일을 포함하는 이미지 파일 리스트 또는 분류된 문서 파일을 포함하는 문서 파일 리스트를 생성할 수 있다.
또한, 제어부(150)는 저장부(130)에 존재하는 파일들의 각각의 확장자가 저장부에 미리 저장된 확장자 설정 정보와 일치하는지 판단하기 이전에, 개인정보 자동 검색 과정의 인증 과정으로서, 유무선 네트워크 망(300)을 통해 연결된 서버(200)와 인증 과정을 수행할 수 있다. 전자장치(100)는 서버(200)로부터 인증 성공을 나타내는 정보를 포함하는 인증 결과 정보가 수신된 경우, 상기 1101 과정을 수행할 수 있다.
그 후, 제어부(150)는 이미지 파일을 대상으로 추정 영상처리 방법을 통해 개인정보를 포함하고 있다고 추정되는 추정 이미지 파일인지 판단할 수 있다(S1102).
또한, 제어부(150)는 이미지 파일 리스트에 포함된 이미지 파일들을 대상으로 추정 영상처리 방법을 통해 추정 이미지 파일 리스트를 생성할 수 있다. 추정 이미지 파일은 개인정보를 포함하고 있다고 추정되는 이미지 파일을 의미한다. 추정 영상처리 방법은 이미지 파일 리스트에 포함된 이미지 파일들 중 추정 이미지 파일 존재하는지 판단하기 위한 영상처리 방법이다. 추정 영상처리 방법은 이미지 파일 리스트에 포함된 이미지 파일들을 대상으로 선택된 하나의 이미지 파일의 이미지를 그레이 영상으로 변환하는 방법, 변환된 그레이 영상으로부터 히스토그램 추출하는 방법 및 추출된 히스토그램으로부터 흰색 분포도를 산출하는 방법을 포함할 수 있다. 예를 들어, 제어부(150)는 이미지 파일 리스트에 포함된 이미지 파일들을 대상으로 추정 영상처리 방법을 통해 추정 이미지 파일이 존재하는지 판단하고, 추정 이미지 파일이 존재하는 경우, 추정 이미지 파일을 포함하는 추정 이미지 파일 리스트를 생성할 수 있다.
또한, 제어부(150)가 수행하는 1102 과정은 다음과 같은 과정들을 포함할 수 있다. 먼저, 제어부(150)는 이미지 파일 리스트에 포함된 이미지 파일들 중 하나의 이미지 파일을 선택하고, 선택된 이미지 파일의 이미지를 그레이 영상으로 변환할 수 있다.
그 후, 제어부(150)는 변환된 그레이 영상으로부터 히스토그램을 추출 및 추출된 히스토그램으로부터 흰색 분포 값을 산출할 수 있다.
그 후, 제어부(150)는 산출된 흰색 분포 값이 저장부에 미리 저장된 히스토그램 임계치 값 이상인지 판단할 수 있다.
상기 판단 결과, 산출된 흰색 분포 값이 히스토그램 임계치 값 이상인 경우, 제어부(150)는 선택된 이미지 파일을 추정 이미지 파일로 판단하고, 추정 이미지 파일을 포함하는 추정 이미지 파일 리스트를 생성할 수 있다.
한편, 산출된 흰색 분포 값이 히스토그램 임계치 값 미만인 경우, 제어부(150)는 선택된 이미지 파일은 개인정보를 포함하고 있지 않다고 판단하고, 선택된 이미지 파일을 다음 수행되는 과정에서 처리되지 않도록 제외시킬 수 있다.
그 후, 제어부(150)는 추정 이미지 파일로 판단된 이미지 파일을 대상으로 분류 영상처리 방법을 통해 계약서/신청서 이미지 파일 또는 신분증 이미지 파일로 판단할 수 있다(S1103).
또한, 제어부(150)는 추정 이미지 파일 리스트에 포함된 이미지 파일들을 대상으로 분류 영상처리 방법을 통해 계약서/신청서 이미지 파일 또는 신분증 이미지를 포함하는 신분증 이미지 파일로 분류하고, 계약서/신청서 이미지 파일을 포함하는 계약서/신청서 이미지 파일 리스트 또는 신분증 이미지 파일을 포함하는 신분증 이미지 파일 리스트를 생성할 수 있다. 분류 영상처리 방법은 추정 이미지 파일 리스트에 포함된 추정 이미지 파일들 중 계약서/신청서 이미지 파일이 존재하는지 판단하기 위한 계약서/신청서 이미지 파일 영상처리 방법으로서, 추정 이미지 파일의 이미지 내에 관심 영역 설정 방법 및 설정된 관심 영역에 SURF 알고리즘을 통해 특징점을 추출하는 방법을 포함할 수 있다.
또한, 분류 영상처리 방법은 추정 이미지 파일 리스트에 포함된 추정 이미지 파일들 중 신분증 이미지를 포함하는 신분증 이미지가 존재하는지 판단하기 위한 신분증 이미지 파일 영상처리 방법으로서, 추정 이미지 파일의 이미지를 대상으로 에지 검출 알고리즘을 통해 에지 영역들을 추출하는 방법 및 추출된 에지 영역들을 대상으로 픽셀 그룹핑하는 방법을 포함할 수 있다.
예를 들어, 제어부(150)는 추정 이미지 파일 리스트에 포함된 추정 이미지 파일들 중 실제 개인정보를 포함하고 있는 이미지 파일이 있는지 분류 영상처리 방법을 통해 판단할 수 있다. 제어부(150)는 개인정보를 포함하는 이미지 파일들은 계약서/신청서 이미지 파일 또는 신분증 이미지를 포함하는 이미지 파일로 분류할 수 있다. 제어부(150)는 분류된 계약서/신청서 이미지 파일을 포함하는 계약서/신청서 이미지 파일 리스트를 생성하거나 분류된 신분증 이미지를 포함하는 이미지 파일을 포함하는 신분증 이미지 파일 리스트를 생성할 수 있다.
또한, 제어부(150)가 수행하는 1103 과정은 다음과 같은 과정들을 포함할 수 있다. 제어부(150)는 추정 이미지 파일 리스트에 포함된 추정 이미지 파일들 중 계약서/신청서 이미지 파일을 확인하기 위하여 다음과 같은 과정을 수행할 수 있다. 먼저, 제어부(150)는 추정 이미지 파일 리스트에 포함된 추정 이미지 파일들 중 하나의 추정 이미지 파일을 선택하고, 선택된 추정 이미지 파일의 이미지 내에 상단 부분 또는 하단 부분을 관심 영역으로 설정할 수 있다. 예를 들어, 보통의 계약서/신청서 이미지는 정해진 서식을 가지고 있으며, 상단 부분 또는 하단 부분에 개인정보를 포함하는 영역이 있다. 따라서 관심영역은 추정 이미지 파일의 이미지 내에 산단 부분 또는 하단 부분으로 한정되지 않으며, 사용자의 설정에 따라 선택된 영역이 관심영역으로 설정될 수 있다.
그 후, 제어부(150)는 설정된 관심 영역에 SURF 알고리즘 적용하여 특징점을 추출하고, 추출된 특징점의 개수를 산출할 수 있다.
그 후, 제어부(150)는 추출된 특징점의 개수가 저장부(130)에 미리 저장된 특징점 임계치 개수 이상인지 판단할 수 있다.
상기 판단 결과, 추출된 특징점의 개수가 특징점 임계치 개수 이상인 경우, 제어부(150)는 선택된 추정 이미지 파일을 계약서/신청서 이미지 파일로 판단하고, 판단된 계약서/신청서 이미지 파일을 포함하는 계약서/신청서 이미지 파일 리스트를 생성할 수 있다.
상기 판단 결과, 추출된 특징점의 개수가 특징점 임계치 개수 미만인 경우, 제어부(150)는 선택된 추정 이미지 파일을 계약서/신청서 이미지 파일이 아닌 것으로 판단할 수 있다.
또한, 제어부(150)는 추출된 특징점의 개수가 특징점 임계치 개수 미만인 경우, 선택된 추정 이미지 파일이 신분증 이미지를 포함하고 있는지를 판단하기 위하여 다음과 같은 과정을 추가로 수행할 수 있다. 먼저, 제어부(150)는 선택된 추정 이미지 파일의 이미지를 대상으로 에지 검출 알고리즘을 통해 에지 영역을 추출할 수 있다. 예를 들어, 제어부(150)는 에지 검출 알고리즘을 통해 추정 이미지 파일 내에 에지 영역들을 추출할 수 있다. 추정 이미지 파일 내에 신분증 이미지가 존재한다면, 에지 검출 알고리즘을 통해 신분증의 각 에지 영역이 추출될 수 있다.
그 후, 제어부(150)는 추출된 에지 영역들을 대상으로 픽셀간 그룹핑을 통해 하나의 사각형 영역을 형성하여 사각형의 관심 영역을 추출할 수 있다. 보통의 신분증은 일정 크기를 갖는 사각형의 형상을 가진다. 따라서 제어부(150)는 추출된 에지 영역들을 대상으로 픽셀간 그룹핑을 통해 하나의 사각형 영역인 신분증 이미지일 가능성이 높은 영역을 형성하고, 형성된 사각형의 영역을 관심 영역으로 추출할 수 있다.
그 후, 제어부(150)는 추출된 관심 영역의 크기가 추정 이미지 파일의 이미지 전체 크기에서 차지하는 비율을 산출할 수 있다.
그 후, 제어부(150)는 산출된 관심 영역의 크기가 차지하는 비율이 저장부(130)에 미리 저장된 비율 임계값 이하인가 판단할 수 있다. 비율 임계값은 산출된 관심 영역이 실제 신분증 이미지의 크기인가를 판단하기 위한 기준 값이다.
상기 판단 결과, 산출된 관심 영역의 크기가 차지하는 비율이 비율 임계값 이하인 경우, 제어부(150)는 선택된 추정 이미지 파일이 신분증 이미지를 포함하는 신분증 이미지 파일로 판단하고, 신분증 이미지 파일을 포함하는 신분증 이미지 파일 리스트를 생성할 수 있다.
한편, 관심 영역의 크기가 차지하는 비율이 비율 임계값을 초과하는 경우, 제어부(150)는 선택된 추정 이미지 파일은 신분증 이미지를 포함하고 있지 않다고 판단하고, 선택된 추정 이미지 파일을 다음 수행되는 과정에서 처리되지 않도록 제외시킬 수 있다.
그 후, 제어부(150)는 문서 파일을 대상으로 상기 저장부에 미리 저장된 정규식을 통해 개인정보를 포함하는 개인정보 문서 파일인지를 판단할 수 있다(S1104).
또한, 제어부(150)는 문서 파일 리스트에 포함된 문서 파일들 대상으로 저장부(130)에 미리 저장된 정규식을 통해 개인정보 문서 파일이 존재하는지 판단하고, 개인정보 문서 파일이 존재하는 경우, 개인정보 문서 파일을 포함하는 개인정보 문서 파일 리스트를 생성할 수 있다. 정규식은 문서 파일 리스트에 포함된 문서 파일들 중 개인정보 문서 파일이 존재하는지 판단하기 위한 알고리즘으로서 일정한 패턴을 가지고 있다. 예를 들어, 제어부(150)는 문서 파일 리스트에 포함된 문서 파일들 중 하나의 문서 파일을 선택하여 저장부(130)에 미리 저장된 정규식을 반영하고, 정규식이 반영된 문서 파일과 저장부(130)에 미리 저장된 정규식의 패턴 간 일치하는 정보가 있는지 판단할 수 있다. 일치하는 정보가 존재하는 경우, 제어부(150)는 선택된 문서 파일을 개인정보를 포함하는 개인정보 문서 파일로 판단할 수 있다.
또한, 제어부(150)가 수행하는 1104 과정은 다음과 같은 과정들을 포함할 수 있다. 먼저, 제어부(150)는 문서 이미지 파일 리스트에 포함된 문서 파일들 중 하나의 문서 파일을 선택하고, 선택된 문서 파일에 저장부(130)에 미리 저장된 정규식을 반영할 수 있다.
그 후, 제어부(150)는 정규식이 반영된 문서 파일과 저장부(130)에 미리 저장된 정규식의 패턴 간 일치하는 정보가 있는지 판단할 수 있다.
상기 판단 결과, 정규식이 반영된 문서 파일과 정규식 패턴 간에 일치하는 정보가 있는 경우, 제어부(150)는 선택된 문서 파일을 개인정보를 포함하는 개인정보 문서 파일로 판단하고, 선택한 문서 파일을 포함하는 개인정보 문서 파일 리스트를 생성할 수 있다.
한편, 정규식이 반영된 문서 파일과 정규식 패턴 간에 일치하는 정보가 없는 경우, 제어부(150)는 선택된 문서 파일은 개인정보를 포함하고 있지 않다고 판단하고, 선택된 문서 파일을 다음 수행되는 과정에서 처리되지 않도록 제외시킬 수 있다.
그 후, 제어부(150)는 계약서/신청서 이미지 파일, 상기 신분증 이미지 파일 및 상기 개인정보 문서 파일 중 적어도 하나를 구비된 입력부를 통해 수신된 사용자 입력 신호에 따라 상기 저장부에서 삭제 또는 개인 정보 검색 대상에서 제외할 수 있다(S1105).
또한, 제어부(150)는 계약서/신청서 이미지 파일 리스트, 신분증 이미지 파일 리스트 및 개인정보 문서 파일 리스트에 포함된 파일들 중 적어도 하나의 파일을 구비된 입력부(120)를 통해 수신된 사용자 입력 신호에 따라 저장부(130)에서 삭제 처리 또는 개인 정보 검색 대상에서 제외 처리할 수 있다.
또한, 제어부(150)는 삭제 처리된 파일들의 개수, 파일명 등의 정보를 포함하는 삭제 결과 정보를 생성하고, 생성된 삭제 결과 정보를 서버(200)로 전송할 수 있다.
한편, 상술한 본 발명의 실시예에 따른 방법들은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
또한, 본 발명의 실시예들은 하드웨어, 소프트웨어 또는 하드웨어 및 소프트웨어의 조합의 형태로 실현 가능하다는 것을 알 수 있을 것이다. 이러한 임의의 소프트웨어는 예를 들어, 삭제 가능 또는 재기록 가능 여부와 상관없이, ROM 등의 저장 장치와 같은 휘발성 또는 비휘발성 저장 장치, 또는 예를 들어, RAM, 메모리 칩, 장치 또는 집적 회로와 같은 메모리, 또는 예를 들어 CD, DVD, 자기 디스크 또는 자기 테이프 등과 같은 광학 또는 자기적으로 기록 가능함과 동시에 기계(예를 들어, 컴퓨터)로 읽을 수 있는 저장 매체에 저장될 수 있다. 휴대 단말 내에 포함될 수 있는 저장부는 본 발명의 실시예들을 구현하는 지시들을 포함하는 프로그램 또는 프로그램들을 저장하기에 적합한 기계로 읽을 수 있는 저장 매체의 한 예임을 알 수 있을 것이다. 따라서 본 발명은 본 명세서의 임의의 청구항에 기재된 장치 또는 방법을 구현하기 위한 코드를 포함하는 프로그램 및 이러한 프로그램을 저장하는 기계로 읽을 수 있는 저장 매체를 포함한다. 또한, 이러한 프로그램은 유선 또는 무선 연결을 통해 전달되는 통신 신호와 같은 임의의 매체를 통해 전자적으로 이송될 수 있고, 본 발명은 이와 균등한 것을 적절하게 포함한다.
상술한 본 발명의 설명에서는 구체적인 실시예에 관해 설명하였으나, 여러 가지 변형이 본 발명의 범위에서 벗어나지 않고 실시할 수 있다. 따라서 본 발명의 범위는 설명된 실시예에 의하여 정할 것이 아니고 특허청구범위와 특허청구범위의 균등한 것에 의해 정해져야 한다.
100 : 전자장치
110 : 통신부
120 : 입력부
130 : 저장부
140 : 표시부
150 : 제어부
200 : 서버
210 : 통신부
220 : 저장부
230 : 표시부
240 : 제어부
300 : 유무선 네트워크 망

Claims (16)

  1. 구비된 저장부에 존재하는 파일들 중 선택된 파일을 저장부에 미리 저장된 확장자 설정 정보와 비교를 통해 이미지 파일 또는 문서 파일로 분류하고, 상기 이미지 파일로부터 추정 이미지 파일로 판단된 상기 이미지 파일을 대상으로 분류 영상처리 방법을 통해 계약서/신청서 이미지 파일 또는 신분증 이미지 파일로 판단하며, 상기 문서 파일을 대상으로 상기 저장부에 미리 저장된 정규식을 통해 개인정보를 포함하는 개인정보 문서 파일인지를 판단하고, 상기 계약서/신청서 이미지 파일, 상기 신분증 이미지 파일 및 상기 개인정보 문서 파일 중 적어도 하나를 구비된 입력부를 통해 수신된 사용자 입력 신호에 따라 상기 저장부에서 삭제 또는 개인 정보 검색 대상에서 제외되도록 제어하는 제어부; 를 포함하는 적어도 하나의 전자장치
    를 포함하는 개인정보 자동 검색 시스템.
  2. 제 1항에 있어서, 상기 개인정보 자동 검색 시스템은,
    상기 적어도 하나의 전자장치로부터 인증 확인 요청 정보를 수신 받아 응답 신호로서 생성된 인증 결과 정보를 상기 적어도 하나의 전자장치로 전송하고, 상기 적어도 하나의 전자장치에서 생성된, 삭제 처리된 상기 적어도 하나의 파일의 정보를 포함하는 삭제 결과 정보를 수신 받는 서버;
    를 더 포함하는 개인정보 자동 검색 시스템.
  3. 제 1항에 있어서, 상기 제어부는,
    상기 이미지 파일을 대상으로 추정 영상처리 방법을 통해 개인정보를 포함하고 있다고 추정되는 상기 추정 이미지 파일인지를 판단하는 개인정보 자동 검색 시스템.
  4. 제 3항에 있어서, 상기 추정 영상처리 방법은,
    상기 이미지 파일의 이미지를 그레이 영상으로 변환하는 방법;
    변환된 상기 그레이 영상으로부터 히스토그램 추출하는 방법; 및
    추출된 상기 히스토그램으로부터 흰색 분포도를 산출하는 방법;
    을 포함하는 개인정보 자동 검색 시스템.
  5. 제 4항에 있어서, 상기 추정 이미지 파일은,
    상기 제어부가 산출된 상기 흰색 분포 값이 상기 저장부에 미리 저장된 히스토그램 임계치 값 이상인지 판단하고, 상기 판단 결과, 산출된 상기 흰색 분포 값이 사익 히스토그램 임계치 값 이상인 경우, 상기 이미지 파일을 상기 추정 이미지 파일로 판단하는 개인정보 자동 검색 시스템.
  6. 제 5항에 있어서, 상기 분류 영상처리 방법은,
    상기 추정 이미지 파일의 이미지 내에 관심 영역을 설정하는 방법, 상기 관심 영역에 SURF 알고리즘을 통해 특징점을 추출하는 방법 및 추출된 상기 특징점의 개수를 산출하는 방법을 포함하는 계약서/신청서 이미지 파일 영상처리 방법; 및
    상기 추정 이미지 파일의 이미지를 대상으로 에지 검출 알고리즘을 통해 에지 영역들을 추출하는 방법, 추출된 상기 에지 영역들을 대상으로 픽셀 그룹핑하여 사각형의 관심 영역을 형성하는 방법 및 형성된 상기 사각형의 관심 영역이 상기 이미지의 전체 크기에서 차지하는 비율을 산출하는 방법을 포함하는 신분증 이미지 파일 영상처리 방법;
    을 포함하는 개인정보 자동 검색 시스템.
  7. 제 6항에 있어서, 상기 계약서/신청서 이미지 파일은,
    상기 제어부가 산출된 상기 특징점의 개수가 상기 저장부에 미리 저장된 특징점 임계치 개수 이상인지 판단하고, 상기 판단 결과, 산출된 상기 특징점의 개수가 상기 특징점 임계치 개수 이상인 경우, 상기 추정 이미지 파일을 계약서/신청서 이미지 파일로 판단하는 개인정보 자동 검색 시스템.
  8. 제 6항에 있어서, 상기 신분증 이미지 파일은,
    상기 제어부가 산출된 상기 비율이 상기 저장부에 미리 저장된 비율 임계값 이하인가 판단하고, 상기 판단 결과, 상기 비율이 상기 비율 임계값 이하인 경우, 상기 추정 이미지 파일을 상기 신분증 이미지 파일로 판단하는 개인정보 자동 검색 시스템.
  9. 제 1항에 있어서, 상기 개인정보 문서 파일은,
    상기 제어부가 상기 문서 파일에 상기 정규식을 반영하고, 상기 정규식이 반영된 상태의 문서 파일과 상기 저장부에 미리 저장된 정규식의 패턴 간 일치하는 정보가 있는지 판단하며, 상기 판단 결과, 상기 정규식이 반영된 상태의 문서 파일과 상기 정규식의 패턴 간 일치하는 정보가 있는 경우, 상기 문서 파일을 상기 개인정보 문서 파일로 판단하는 개인정보 자동 검색 시스템.
  10. 구비된 저장부에 존재하는 파일들 중 선택된 파일을 저장부에 미리 저장된 확장자 설정 정보와 비교를 통해 이미지 파일 또는 문서 파일로 분류하는 단계;
    상기 이미지 파일로부터 추정 이미지 파일로 판단된 상기 이미지 파일을 대상으로 분류 영상처리 방법을 통해 계약서/신청서 이미지 파일 또는 신분증 이미지 파일로 판단하는 단계;
    상기 문서 파일을 대상으로 상기 저장부에 미리 저장된 정규식을 통해 개인정보를 포함하는 개인정보 문서 파일인지를 판단하는 단계; 및
    상기 계약서/신청서 이미지 파일, 상기 신분증 이미지 파일 및 상기 개인정보 문서 파일 중 적어도 하나를 구비된 입력부를 통해 수신된 사용자 입력 신호에 따라 상기 저장부에서 삭제 또는 개인 정보 검색 대상에서 제외하는 단계;
    를 포함하는 개인정보 자동 검색 방법.
  11. 제 10항에 있어서, 상기 개인정보 자동 검색 방법은,
    계약서/신청서 이미지 파일 또는 신분증 이미지 파일로 판단하는 단계이전에,
    상기 이미지 파일을 대상으로 추정 영상처리 방법을 통해 개인정보를 포함하고 있다고 추정되는 상기 추정 이미지 파일인지 판단하는 단계;
    를 더 포함하는 개인정보 자동 검색 방법.
  12. 제 11항에 있어서, 상기 추정 이미지 파일인지 판단하는 단계는,
    상기 이미지 파일의 이미지를 그레이 영상으로 변환하는 단계;
    변환된 상기 그레이 영상으로부터 히스토그램 추출하는 단계;
    추출된 상기 히스토그램으로부터 흰색 분포도를 산출하는 단계; 및
    산출된 상기 흰색 분포 값이 상기 저장부에 미리 저장된 히스토그램 임계치 값 이상인지 판단하고, 상기 판단 결과, 산출된 상기 흰색 분포 값이 상기 히스토그램 임계치 값 이상인 경우, 상기 이미지 파일을 상기 추정 이미지 파일로 판단하는 단계;
    를 더 포함하는 개인정보 자동 검색 방법.
  13. 제 10항에 있어서, 상기 계약서/신청서 이미지 파일 또는 신분증 이미지 파일로 판단하는 단계는,
    상기 추정 이미지 파일의 이미지 내에 관심 영역을 설정하는 단계;
    상기 관심 영역에 SURF 알고리즘을 통해 특징점을 추출하는 단계;
    추출된 상기 특징점의 개수를 산출하는 단계; 및
    산출된 상기 특징점의 개수가 상기 저장부에 미리 저장된 특징점 임계치 개수 이상인지 판단하고, 상기 판단 결과, 산출된 상기 특징점의 개수가 상기 특징점 임계치 개수 이상인 경우, 상기 추정 이미지 파일을 상기 계약서/신청서 이미지 파일로 판단하는 단계;
    를 더 포함하는 개인정보 자동 검색 방법.
  14. 제 10항에 있어서, 상기 계약서/신청서 이미지 파일 또는 신분증 이미지 파일로 판단하는 단계는,
    상기 추정 이미지 파일의 이미지를 대상으로 에지 검출 알고리즘을 통해 에지 영역들을 추출하는 단계;
    추출된 상기 에지 영역들을 대상으로 픽셀 그룹핑하여 사각형의 관심 영역을 형성하는 단계;
    형성된 상기 사각형의 관심 영역이 상기 이미지의 전체 크기에서 차지하는 비율을 산출하는 단계; 및
    산출된 상기 비율이 상기 저장부에 미리 저장된 비율 임계값 이하인가 판단하고, 상기 판단 결과, 상기 비율이 상기 비율 임계값 이하인 경우, 상기 추정 이미지 파일을 상기 신분증 이미지 파일로 판단하는 단계;
    를 더 포함하는 개인정보 자동 검색 방법.
  15. 제 10항에 있어서, 상기 개인정보 문서 파일인지를 판단하는 단계는,
    상기 문서 파일에 상기 정규식을 반영하는 단계; 및
    상기 정규식이 반영된 상태의 문서 파일과 상기 저장부에 미리 저장된 정규식의 패턴 간 일치하는 정보가 있는지 판단하고, 상기 판단 결과, 상기 정규식이 반영된 상태의 문서 파일과 상기 정규식의 패턴 간 일치하는 정보가 있는 경우, 상기 문서 파일을 상기 개인정보 문서 파일로 판단하는 단계;
    를 더 포함하는 개인정보 자동 검색 방법.
  16. 하드웨어와 결합되어 청구항 제 10항 내지 제 15항 중 어느 한 항에 기재된 방법의 단계들을 실행시키기 위하여 컴퓨터 판독 가능한 기록매체에 저장된 컴퓨터프로그램.
KR1020140099832A 2014-08-04 2014-08-04 개인정보 자동 검색 시스템, 방법 및 컴퓨터프로그램 KR101667784B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020140099832A KR101667784B1 (ko) 2014-08-04 2014-08-04 개인정보 자동 검색 시스템, 방법 및 컴퓨터프로그램

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140099832A KR101667784B1 (ko) 2014-08-04 2014-08-04 개인정보 자동 검색 시스템, 방법 및 컴퓨터프로그램

Publications (2)

Publication Number Publication Date
KR20160016201A true KR20160016201A (ko) 2016-02-15
KR101667784B1 KR101667784B1 (ko) 2016-10-19

Family

ID=55356985

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140099832A KR101667784B1 (ko) 2014-08-04 2014-08-04 개인정보 자동 검색 시스템, 방법 및 컴퓨터프로그램

Country Status (1)

Country Link
KR (1) KR101667784B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101721063B1 (ko) 2016-12-02 2017-03-29 충남대학교산학협력단 이미지 파일에 포함된 개인정보 검색 방법 및 그 방법을 구현하는 프로그램을 기록한 기록매체
WO2021112361A1 (ko) * 2019-12-02 2021-06-10 삼성전자주식회사 전자 장치 및 그 제어 방법

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100241745B1 (ko) 1997-08-18 2000-02-01 윤종용 개인정보 통합 관리방법
JP2006209649A (ja) * 2005-01-31 2006-08-10 Nec Corp 機密文書検索システム、機密文書検索方法、および機密文書検索プログラム
JP2007299093A (ja) * 2006-04-28 2007-11-15 Hitachi Software Eng Co Ltd 文書管理システム
KR101054107B1 (ko) * 2011-03-25 2011-08-03 한국인터넷진흥원 이미지 특성정보를 이용한 개인정보 노출 검색 시스템
KR101389459B1 (ko) * 2012-07-31 2014-04-25 주식회사 마크애니 개인 정보 유출 방지를 위한 파일 생성 방법 및 장치, 및 클라이언트 장치에서의 개인 정보 보호를 지원하기 위한 방법 및 서버 장치

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100241745B1 (ko) 1997-08-18 2000-02-01 윤종용 개인정보 통합 관리방법
JP2006209649A (ja) * 2005-01-31 2006-08-10 Nec Corp 機密文書検索システム、機密文書検索方法、および機密文書検索プログラム
JP2007299093A (ja) * 2006-04-28 2007-11-15 Hitachi Software Eng Co Ltd 文書管理システム
KR101054107B1 (ko) * 2011-03-25 2011-08-03 한국인터넷진흥원 이미지 특성정보를 이용한 개인정보 노출 검색 시스템
KR101389459B1 (ko) * 2012-07-31 2014-04-25 주식회사 마크애니 개인 정보 유출 방지를 위한 파일 생성 방법 및 장치, 및 클라이언트 장치에서의 개인 정보 보호를 지원하기 위한 방법 및 서버 장치

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101721063B1 (ko) 2016-12-02 2017-03-29 충남대학교산학협력단 이미지 파일에 포함된 개인정보 검색 방법 및 그 방법을 구현하는 프로그램을 기록한 기록매체
WO2021112361A1 (ko) * 2019-12-02 2021-06-10 삼성전자주식회사 전자 장치 및 그 제어 방법

Also Published As

Publication number Publication date
KR101667784B1 (ko) 2016-10-19

Similar Documents

Publication Publication Date Title
AU2020319589B2 (en) Region proposal networks for automated bounding box detection and text segmentation
US10223345B2 (en) Interactively predicting fields in a form
US8837830B2 (en) Finding text in natural scenes
US20200097713A1 (en) Method and System for Accurately Detecting, Extracting and Representing Redacted Text Blocks in a Document
AU2020321911B2 (en) Region proposal networks for automated bounding box detection and text segmentation
CN107077570A (zh) 用于检测通过数据分发通道发送敏感信息的尝试的系统和方法
US20140293069A1 (en) Real-time image classification and automated image content curation
JP2018530094A (ja) セグメントブロックベース手書き署名認証システム及び方法
Küçükkülahlı et al. Histogram-based automatic segmentation of images
KR20230057646A (ko) 멀티-레벨 전이 영역 기반의 도메인 적응형 객체 검출 장치 및 방법
CN101533400A (zh) 相关文档呈现系统和相关文档呈现方法
KR101667784B1 (ko) 개인정보 자동 검색 시스템, 방법 및 컴퓨터프로그램
US20160292502A1 (en) Identifying updated content in images
JP6565661B2 (ja) 画像処理システム、画像類似判定方法および画像類似判定プログラム
CN114140649A (zh) 票据分类方法、票据分类装置、电子设备和存储介质
Vidhyalakshmi et al. Text detection in natural images with hybrid stroke feature transform and high performance deep Convnet computing
JP5625246B2 (ja) 画像検索装置及び画像検索方法
JP7312646B2 (ja) 情報処理装置、文書識別方法、及び情報処理システム
CN112507912A (zh) 一种识别违规图片的方法及装置
CN114730499A (zh) 图像识别方法及装置、训练方法、电子设备和存储介质
KR20150130253A (ko) 정보 유출 방지를 위한 이미지 적응적 비정형 개인 정보 추출 방법 및 이를 수행하는 장치
KR102546195B1 (ko) 수집 환경 기반 학습 데이터 분류 방법 및 이를 실행하기 위하여 기록매체에 기록된 컴퓨터 프로그램
KR102531917B1 (ko) 경계선 이식을 통한 어노테이션 방법 및 이를 실행하기 위하여 기록매체에 기록된 컴퓨터 프로그램
KR102546198B1 (ko) 물리적 요인 기반 학습 데이터 분류 방법 및 이를 실행하기 위하여 기록매체에 기록된 컴퓨터 프로그램
KR102546193B1 (ko) 컬러 정보를 이용한 학습 데이터 분류 방법 및 이를 실행하기 위하여 기록매체에 기록된 컴퓨터 프로그램

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant