KR101456599B1 - 전략물자 판정 시스템 및 그 방법 - Google Patents
전략물자 판정 시스템 및 그 방법 Download PDFInfo
- Publication number
- KR101456599B1 KR101456599B1 KR1020130051461A KR20130051461A KR101456599B1 KR 101456599 B1 KR101456599 B1 KR 101456599B1 KR 1020130051461 A KR1020130051461 A KR 1020130051461A KR 20130051461 A KR20130051461 A KR 20130051461A KR 101456599 B1 KR101456599 B1 KR 101456599B1
- Authority
- KR
- South Korea
- Prior art keywords
- keyword
- strategic
- determination
- similar document
- database
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
- G06Q10/083—Shipping
- G06Q10/0831—Overseas transactions
Landscapes
- Business, Economics & Management (AREA)
- Economics (AREA)
- Engineering & Computer Science (AREA)
- Marketing (AREA)
- Quality & Reliability (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Human Resources & Organizations (AREA)
- Accounting & Taxation (AREA)
- Operations Research (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
전략물자에 해당하는지에 대한 판정이 완료된 판정물자에 대한 정보가 저장되어 있는 제 1 데이터 베이스, 상기 판정물자에 대한 정보로부터 추출된 키워드가 저장되어 있는 제 2 데이터 베이스, 전략물자에 해당하는지에 대한 판정을 받고자 하는 신청물자에 대한 정보를 입력하는 입력부, 상기 입력부에 입력된 정보로부터 키워드를 추출하는 키워드 추출부, 상기 추출된 키워드를 이용하여 상기 제 2 데이터 베이스로부터 유사 키워드를 검색하는 검색부 및 상기 검색된 유사 키워드를 이용하여 상기 제 1 데이터 베이스로부터 유사문서를 추출하는 유사문서 추출부를 포함하는 전략물자 판정 시스템을 제공한다.
Description
본 발명은 전략물자 판정 시스템 및 그 방법에 관한 것으로서, 보다 상세하게는 전략물자인지 판정이 완료된 물자에 대한 정보를 이용하여 신청물자가 전략물자에 해당하는지 여부를 판정하는 시스템 및 그 방법에 관한 것이다.
전략물자(Strategic items)란 재래식 무기 및 대량 파괴 무기와 이들의 운반수단인 미사일의 제조, 개발, 사용 및 보관 등에 이용 가능한 물품, 소프트웨어 및 기술을 말한다. 이러한 전략물자는 국제평화와 국가안보에 위해를 가할 수 있기 때문에 수출입에 일정한 제한을 두고 있다.
전략물자를 수입 또는 수출하고자 하는 개인 또는 업체는 수입 또는 수출 전에 반드시 관련 허가기관으로부터 수출 허가를 받아야 하며, 전략물자가 아니더라도 전략물자로 전용될 위험이 있을 경우에도 관련기관의 허가를 받아야 수출이 가능하다.
우리나라의 경우에는 대외무역법 및 다자간 국제 수출 통제 체제의 원칙에 따라 산업통상자원부장관이 전략물자 수출입 고시 별표 2 및 3에서 전략물자를 명시하여 각 전략물자 별로 허가기관을 정하여 수출입통제를 이행하고 있다.
상기 전략물자 수출입 고시에는 전략물자에 해당되는 품목명 및 그 품목명을 가진 품목이 전략물자에 해당되기 위해 가져야 할 성능, 사양 등의 기술적인 특성기준이 명시되어 있다.
그러나, 상기 전략물자 수출입 고시에 명시되어 있는 전략물자에 관한 내용의 분량은 매우 방대하며, 특히 기술 수출건의 경우 명확한 통제 기준이 없기 때문에 특정한 개인 또는 기업이 자신이 취급하는 물품 또는 기술이 상기 전략물자 수출입고시에 명시된 전략물자에 해당하는지 여부를 파악하는 것이 쉽지 않다.
이에 특정한 개인 또는 기업이 자신이 취급하는 물품 또는 기술이 전략물자에 해당하는지 여부에 의문이 있는 경우 해당 허가기관에 전략물자인지 여부를 의뢰하면, 상기 해당 허가 기관에서는 상기 신청한 신청물자에 대한 정보를 해당분야 전문가로 구성된 전략물자 기술자문단에게 검토 의뢰하고, 상기 기술자문단은 상기 신청물자가 전략물자인지 여부를 판정하게 되는데, 상기 기술자문단의 주관적인 판단에 의존할 수밖에 없고, 상기 기술자문단을 구성하는 전문가가 변경되는 경우 일관되고 정확한 판정 결과를 기대하기 어려운 문제가 있다.
이에 본 발명에서는 전략물자에 해당하는지 여부에 대해서 판정하는 해당 허가기관으로 하여금 일관되고 정확한 판정을 내릴 수 있도록 하는 전략물자 판정 시스템 및 그 방법을 제공하고자 한다.
전략물자에 해당하는지에 대한 판정이 완료된 판정물자에 대한 정보가 저장되어 있는 제 1 데이터 베이스, 상기 판정물자에 대한 정보로부터 추출된 키워드가 저장되어 있는 제 2 데이터 베이스, 전략물자에 해당하는지에 대한 판정을 받고자 하는 신청물자에 대한 정보를 입력하는 입력부, 상기 입력부에 입력된 정보로부터 키워드를 추출하는 키워드 추출부, 상기 추출된 키워드를 이용하여 상기 제 2 데이터 베이스로부터 유사 키워드를 검색하는 검색부 및 상기 검색된 유사 키워드를 이용하여 상기 제 1 데이터 베이스로부터 유사문서를 추출하는 유사문서 추출부를 포함하는 전략물자 판정 시스템을 제공한다.
상기 전략물자 판정 시스템은 상기 유사문서 추출부로부터 추출된 유사문서를 저장하기 위한 유사문서 저장부를 더 포함할 수 있다.
상기 전략물자 판정 시스템은 상기 유사문서 저장부에 저장된 유사문서를 디스플레이하기 위한 디스플레이부를 더 포함할 수 있다.
상기 전략물자 판정 시스템은 상기 유사문서 저장부에 저장된 유사문서를 이용하여 상기 신청물자가 전략물자에 해당하는지 여부를 판정하는 판정부를 더 포함할 수 있다.
상기 키워드 추출부에서는 핵물질과 관련된 키워드, 우라늄 농축시설과 관련된 키워드 및 핵무기 기폭장치와 관련된 키워드 중 적어도 하나를 포함하는 키워드를 추출할 수 있다.
상기 핵물질과 관련된 키워드는 핵원료성 물질, 핵분열성 물질, 중수소, 중수, 붕소 및 원자로급 흑연 중 적어도 하나를 포함할 수 있다.
상기 우라늄 농축시설과 관련된 키워드는 초전도체, 솔레노이드 전자석, 직류 전력공급기, 불소, 불소 생산용 전해조 및 동위원소 분리기 중 적어도 하나를 포함할 수 있다.
상기 핵무기 기폭장치와 관련된 키워드는 펄스 가속기, 펄스 전자 가속기, 펄스 발생기, 고속 펄스 발생기, 전기 펄스 발생기, 폭발 뇌관, 점화세트, 중성자 발생 시스템 및 폭발물 중 적어도 하나를 포함할 수 있다.
전략물자에 해당하는지에 대한 판정을 받고자 하는 신청물자에 대한 정보를 입력하는 입력단계, 상기 입력된 신청물자에 대한 정보로부터 키워드를 추출하는 키워드 추출단계, 상기 추출된 키워드를 이용하여 제 2 데이터 베이스로부터 유사 키워드를 검색하는 검색단계, 상기 검색된 유사 키워드를 이용하여 제 1 데이터 베이스로부터 유사문서를 추출하는 유사문서 추출단계, 상기 추출된 유사문서를 이용하여 상기 신청물자가 전략물자에 해당하는지 여부를 판단하는 판정단계를 포함하는 전략물자 판정방법을 제공한다.
상기 입력단계에서는 신청물자에 대한 HS번호, 통제번호, 계통명, 품목명, 모델명, 제조자명 및 수출국명 등의 정보를 입력하는 단계를 포함할 수 있다.
상기 판정단계에서 판정이 완료된 신청물자에 대한 정보를 상기 제 1 데이터 베이스에 저장하는 저장단계를 더 포함할 수 있다.
본 발명에 따른 전략물자 판정 시스템 및 그 방법을 통하여 신청물자가 전략물자에 해당하는지 여부에 대해서 일관되고 정확한 판정을 내릴 수 있다.
도 1은 본 발명의 일례에 따른 전략물자 판정 시스템을 나타낸 블록도이다.
도 2는 본 발명의 일례에 따른 전략물자 판정 방법을 나타낸 순서도이다.
도 2는 본 발명의 일례에 따른 전략물자 판정 방법을 나타낸 순서도이다.
이하, 본 발명의 일례에 따른 전략물자 판정 시스템 및 그 방법에 대하여 첨부된 도면들을 참조하여 상세하게 설명하도록 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지는 않는다.
제 1, 제 2 및 제 3 등의 용어는 다양한 구성 요소들을 설명하는데 사용될 수 있지만, 이러한 구성 요소들은 상기 용어들에 의해 한정되는 것은 아니다. 상기 용어들은 하나의 구성 요소를 다른 구성 요소로부터 구별하는 목적으로 사용된다. 예를 들어, 본 발명의 권리 범위로부터 벗어나지 않고, 제 1 구성 요소가 제 2 또는 제 3 구성 요소 등으로 명명될 수 있으며, 유사하게 제 2 또는 제 3 구성 요소도 교호적으로 명명될 수 있다.
본 명세서에서, '신청물자'는 특정한 개인 또는 업체가 수출 허가 기관에 전략물자에 해당하는지 여부에 대한 판정을 신청하고자 하는 물자를 말하며, '신청문서'는 상기 신청물자에 대한 정보가 데이터 파일 또는 PDF와 같이 디지털 파일 형태로 구비된 것을 말한다.
또한, 본 명세서에서 '판정물자'는 상기 수출 허가 기관에서 이미 전략물자에 해당하는지에 대한 판정이 완료된 물자를 말하며, '판정문서'는 상기 판정물자에 대한 정보가 데이터 파일 또는 PDF와 같이 디지털 파일 형태로 구비된 것을 말한다. 따라서, 상기 판정물자에는 전략물자라고 판정된 물자 및 전략물자가 아니라고 판정된 물자를 모두 포함할 수 있다.
또한, 본 명세서에서 '유사문서'는 상기 판정문서 가운데 상기 신청문서에 포함된 키워드와 동일하거나 유사한 유사 키워드를 포함하고 있는 문서를 말한다.
또한, 본 명세서에서 '신청자'란 수출하고자 하는 물품이 전략물자인지 여부에 대해서 허가기관에 판정을 요구하는 특정한 개인 또는 기업을 말한다.
또한, 본 명세서에서 '심사자'란 해당 수출 허가 기관에서 상기 신청물자가 전략물자에 해당하는지 여부를 실질적으로 판정하는 전문가 개인 또는 그룹을 말한다.
도 1은 본 발명의 일례에 따른 전략물자 판정 시스템을 나타내는 블록도이다.
도 1을 참조하면, 본 발명의 일례에 따른 전략물자 판정 시스템은 전략물자에 해당하는지에 대한 판정이 완료된 판정문서가 저장되어 있는 제 1 데이터 베이스(110), 상기 제 1 데이터 베이스(110)로부터 추출된 키워드가 저장되어 있는 제 2 데이터 베이스(120), 전략물자에 해당하는지에 대한 판정을 받고자 하는 신청물자에 대한 정보를 입력하는 입력부(130), 상기 입력부(130)에 입력된 신청물자에 대한 정보에서 키워드를 추출하는 키워드 추출부(140), 상기 추출된 키워드를 이용하여 상기 제 2 데이터 베이스(120)로부터 유사 키워드를 검색하는 검색부(150) 및 상기 검색된 유사 키워드를 이용하여 상기 제 1 데이터 베이스(110)로부터 유사문서를 추출하는 유사문서 추출부(160)를 포함할 수 있다.
또한, 본 발명의 일례에 따른 전략물자 판정 시스템은 상기 유사문서 추출부(160)에 의해 상기 제 1 데이터 베이스(110)로부터 추출된 유사문서를 저장할 수 있는 유사문서 저장부(170)를 더 포함할 수 있다. 또한, 도 1에는 도시되지 않았지만, 본 발명의 일례에 따른 전략물자 판정 시스템은 상기 유사문서 저장부(170)에 저장된 유사문서를 심사자에게 디스플레이하기 위한 디스플레이부를 더 포함할 수 있다.
또한, 본 발명의 일례에 따른 전략물자 판정 시스템은 상기 유사문서 저장부(170)에 저장된 유사문서를 이용하여 상기 신청문서가 전략물자에 해당하는지 여부를 판정하는 판정부(180)를 더 포함할 수 있다.
상기 제 1 데이터 베이스(110)에는 전략물자에 해당하는지에 대한 판정이 완료된 판정물자에 대한 정보가 저장되어 있다. 상기 제 1 데이터 베이스(110)에 디지털 파일 형태로 저장된 판정물자에 대한 정보를 판정문서라 한다.
상기 판정문서에는 상기 판정물자에 관한 HS번호, 통제번호, 계통명, 품목명, 모델명, 제조자명 및 수출국명 등과 같은 상세정보와 상기 판정물자가 전략물자에 해당하는지 여부에 대한 판정결과 정보가 포함되어 있다.
상기 HS번호는 수출/수입의 대상이 되는 모든 물품에 부여되는 품목 분류 번호이다. 상기 통제번호는 상기 HS번호에 따른 전략물자 통제 기준을 나타내는 참조번호이다. 상기 판정결과 정보는 전략물자에 해당한다고 판정된 것일 수도 있고, 전략물자가 아니라고 판정된 것일 수도 있다.
즉, 상기 제 1 데이터 베이스(110)에 저장되어 있는 판정문서는 이미 전략물자에 해당하는지 여부에 대한 판정이 완료되어 전략물자 해당여부가 확실한 문서이다.
상기 제 2 데이터 베이스(120)에는 상기 제 1 데이터 베이스(110)에 저장된 판정문서로부터 추출된 키워드가 저장되어 있다. 상기 제 1 데이터 베이스(110)에 저장되어 있는 판정문서는 데이터 파일 또는 PDF 파일과 같은 비정형적 데이터이기 때문에, 이러한 비정형적 데이터에 대하여 자연 언어 처리(Natural Language Processing) 기술과 문서 처리 기술을 적용하여 키워드를 추출하는 텍스트 마이닝 기법을 사용할 수 있다.
상기 입력부(130)는 전략물자에 해당하는지에 대한 판정을 받고자 하는 신청물자에 대한 정보를 입력하는 곳이다. 상기 입력부(130)를 통하여 입력된 신청물자에 대한 정보는 디지털 파일 형태로 저장될 수 있으며, 이를 신청문서라 한다.
상기 입력부(130)에는 상기 신청물자에 관한 신청자 정보, HS번호, 계통명, 품목명, 모델명, 규격(성능), 용도, 제조자명 및 수출국명 등과 같은 정보를 입력할 수 있다.
이러한 신청물자에 관한 정보는 항목별로 입력할 수 있으며, 다수의 문자가 결합된 문장 형태로도 입력할 수 있다. 또한, 상기 입력부(130)에는 상기 신청물자의 기술적 특성을 파악할 수 있는 브로슈어 또는 매뉴얼 등을 첨부파일의 형태로 입력할 수도 있다.
상기 입력부(130)는 특정 하드웨어의 입력 장치만을 의미하는 것이 아님은 물론이며, 상기 제 1 데이터 베이스(110) 및 상기 제 2 데이터 베이스(120)등과 유선 또는 무선으로 연결된 사용자 단말, 즉 개인용 컴퓨터(PC), 노트북, PDA, 휴대폰, 스마트폰 등이 해당될 수 있다.
상기 키워드 추출부(140)는 상기 입력부(130)에 입력된 신청문서로부터 키워드를 추출하는 곳이다. 상기 키워드 추출부(140)에서 추출되는 키워드는 전략물자와 관련된 키워드이다. 예를 들어, 상기 전략물자와 관련된 키워드로는 상기 수출입고시 별표 2 및 3에 명시되어 있는 키워드일 수 있다.
그 중에서 원자력 수출 통제를 위한 키워드로는, 상기 수출입 고시 별표 2의 제 10 부에 명시된 원자력 전용품목(핵물질, 핵관련 설비 및 장비) 및 상기 수출입 고시 별표 2의 제 1 부 내지 제 9 부에 명시된 이중용도품목 등이 있다.
보다 구체적으로, 상기 키워드 추출부(140)에서는 핵물질과 관련된 키워드, 우라늄 농축시설과 관련된 키워드 및 핵무기 기폭장치와 관련된 키워드 중 적어도 하나를 포함하는 키워드를 추출할 수 있다.
상기 핵물질과 관련된 키워드로는 핵원료성 물질, 핵분열성 물질, 중수소, 중수, 붕소 및 원자로급 흑연 등이 있다. 상기 핵원료성 물질은 중성자를 흡수하여 핵분열성 물질로 변환되는 물질로써 이러한 핵원료성 물질에는 Th-232, U-234, U-238 및 Pu-240 등이 있다. 상기 핵분열성 물질은 중성자를 흡수했을 때 핵분열성 반응을 일으킴으로서 상기 중성자의 수를 증가시키는 물질로써 이러한 핵분열성 물질에는 U-233, U-235, Pu-239, Pu-241 등이 있다. 상기 원자로급 흑연이란 원자로에서 사용되는 고순도 및 고밀도의 흑연을 말하며, 이러한 원자로급 흑연에는 IG-11, IG-110 및 IG-430 등이 있다.
상기 우라늄 농축시설과 관련된 키워드로는 초전도체, 솔레노이드 전자석, 직류 전력공급기, 불소, 불소 생산용 전해조 및 동위원소 분리기 등이 있다.
상기 핵무기 기폭장치와 관련된 키워드로는 펄스 가속기, 펄스 전자 가속기, 펄스 발생기, 고속 펄스 발생기, 전기 펄스 발생기, 폭발 뇌관, 점화세트, 중성자 발생 시스템 및 폭발물 등이 있다.
상기 검색부(150)는 상기 추출된 키워드를 이용하여 상기 제 2 데이터 베이스(120)로부터 동일하거나 유사한 유사 키워드를 검색하는 곳이다. 상기 제 2 데이터 베이스(120)에 저장되어 있는 키워드 정보는 정형화된 데이터로 볼 수 있기 때문에 SQL검색과 같이 일반적인 데이터 마이닝 기법을 이용하여 검색할 수 있다.
상기 유사문서 추출부(160)는 상기 제 1 데이터 베이스(110)에 저장된 판정문서 가운데 상기 검색부(150)에서 검색된 유사 키워드를 포함하는 유사문서를 추출하는 곳이다. 상기 유사문서 추출부(160)는 상기 유사 키워드를 포함하는 정도에 따라 빈도수가 높은 순서대로 유사문서를 추출할 수 있다.
또한, 상기 유사문서 추출부(160)는 TF-IDF(Term Frequency-Inverse Document Frequency) 가중치로 만들어진 Vector Space Model 및 상기 키워드 추출부(140)에서 추출한 신청문서의 키워드 및 빈도수를 활용하여 코사인 유사도(Cosine Similarity)를 계산하여, 상기 신청문서와 유사한 유사문서 후보군을 제시할 수도 있다.
상기 유사문서 추출부(160)에 의해 상기 제 1 데이터 베이스(110)로부터 추출된 유사문서는 유사문서 저장부(170)에 영구 또는 일시적으로 저장될 수 있다. 상기 유사문서 저장부(170)에 저장된 적어도 하나 이상의 유사문서는 별도의 디스플레이부를 통하여 심사자에게 제공될 수 있다.
상기 판정부(180)는 상기 유사문서 저장부(170)에 저장된 적어도 하나 이상의 유사문서를 이용하여 상기 입력부(130)에 입력된 신청물자가 전략물자인지 여부를 판정할 수 있다.
상기 판정부(180)에서는 상기 유사문서를 이용하여 상기 신청물자가 전략물자인지 여부를 예측하여 심사자로 하여금 판정의 일관성 및 정확성을 제고할 수 있도록 예측결과를 제공해 줄 수 있다. 상기 예측결과는 전략물자에 해당하는지 여부에 대한 판단은 물론 전략물자에 해당할 가능성에 관한 예측일 수도 있다.
상기 판정부(180)에서는 SVM(Support Vector Machine) 알고리즘, KNN(K-nearest neighbor) 알고리즘 및 퍼지 알고리즘 등과 같은 이진 분류(Binary Classification) 알고리즘을 이용하여 판정할 수 있다. 상기 알고리즘은 각각 독립하여 이용될 수 있으며, 서로 복합적으로도 이용될 수 있다. 또한, 상기 알고리즘은 예시적인 것으로 일반적으로 이용되는 예측 알고리즘의 경우 상기 판정부(180)에서 사용될 수 있다.
상기 SVM(Support Vector Machine) 알고리즘은 상기 유사문서에서 추출한 키워드 및 빈도수를 이용한 가중치와 상기 신청문서에서 추출한 키워드 및 빈도수를 이용한 가중치를 서로 연산하여 상기 신청문서가 전략물자인지 여부를 예측하는 알고리즘이다.
상기 KNN(K-nearest neighbor) 알고리즘은 상기 유사문서와 신청문서 사이의 문서 유사도를 이용하여 군집화하는 기법을 이용하여 예측하는 알고리즘이다.
상기 퍼지 알고리즘은 상기 신청문서가 전략물자에 해당하는지 여부를 해당 또는 비해당으로 구분하는 것이 아니라, 해당 또는 비해당에 대한 소속도를 이용하는 기법이다.
상기 판정부(180)에 의해 판정이 완료된 심사문서는 상기 제 1 데이터 베이스(110)에 저장될 수 있다.
도 2는 본 발명의 일례에 따른 전략물자 판정 방법을 나타낸 순서도이다.
본 발명의 일례에 따른 전략물자 판정 방법은 신청자가 전략물자에 해당하는지에 대한 판정을 받고자 하는 신청물자에 대한 정보를 입력하는 입력단계(S100), 상기 입력된 신청물자에 대한 정보로부터 키워드를 추출하는 키워드 추출단계(S200), 상기 추출된 키워드를 이용하여 상기 제 2 데이터 베이스로부터 유사 키워드를 검색하는 검색단계(S300), 상기 검색된 유사 키워드를 이용하여 상기 제 1 데이터 베이스로부터 유사문서를 추출하는 유사문서 추출단계(S400), 상기 추출된 유사문서를 이용하여 상기 신청물자가 전략물자에 해당하는지 여부를 판단하는 판정단계(S500)를 포함할 수 있다.
상기 입력단계(S100)에서 신청자는 상기 신청물자에 대한 HS번호, 통제번호, 계통명, 품목명, 모델명, 제조자명 및 수출국명 등과 같은 정보를 입력할 수 있다.
상기 신청물자에 대한 정보는 항목별로 입력할 수 있으며, 다수의 문자가 결합된 문장 형태 또는 첨부파일 형태로도 입력할 수 있다.
상기 키워드 추출단계(S200)에서는 상기 신청문서 데이터 파일을 읽어 들여 접사 등의 부수적 단어를 제거하고, 어근을 분리하여 키워드를 추출할 수 있다. 상기 키워드는 빈도수 또는 전략물자와 관련된 위험도 및 중요도에 따라 가중치를 부가하여 추출할 수 있다.
상기 검색단계(S300)에서는 상기 키워드 추출단계(S200)에서 추출된 키워드를 이용하여, 상기 판정문서에서 키워드를 추출한 제 2 데이터 베이스에서 검색할 수 있다. 상기 제 2 데이터 베이스에 저장된 데이터는 정형화된 데이터로 볼 수 있기 때문에 SQL검색과 같이 일반적인 데이터 마이닝 기법을 이용하여 검색할 수 있다.
상기 유사문서 추출단계(S400)에서는 상기 검색단계(S300)에서 검색된 유사 키워드를 이용하여 상기 제 1 데이터 베이스로부터 상기 유사 키워드를 포함하는 유사문서를 추출한다.
상기 제 1 데이터 베이스로부터 유사문서를 추출하는 방법으로는 TF-IDF(Term Frequency-Inverse Document Frequency), Vector Space Model 및 코사인 유사도(cosine Similarity) 계산 등의 기법을 이용할 수 있다.
상기 판정단계(S500)에서는 상기 추출된 유사문서를 이용하여 상기 신청물자가 전략물자에 해당하는지 여부를 판정한다.
상기 판정단계(S500)에서는 SVM(Support Vector Machine) 알고리즘, KNN(K-nearest neighbor) 알고리즘 및 퍼지 알고리즘 등과 같은 이진 분류(Binary Classification) 알고리즘을 이용하여 판정할 수 있다. 상기 알고리즘은 각각 독립하여 이용될 수 있으며, 서로 복합적으로도 이용될 수 있다
상기 판정단계(S500)에서 판정이 완료된 신청물자에 대한 정보는 상기 제 1 데이터 베이스에 저장될 수 있다.
이상, 첨부된 도면을 참조하여 본 발명의 일례들을 설명하였지만, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명의 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 일례들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다.
110 : 제 1 데이터 베이스 120 : 제 2 데이터 베이스
130 : 입력부 140 : 키워드 추출부
150 : 검색부 160 : 유사문서 추출부
170 : 유사문서 저장부 180 : 판정부
130 : 입력부 140 : 키워드 추출부
150 : 검색부 160 : 유사문서 추출부
170 : 유사문서 저장부 180 : 판정부
Claims (11)
- 전략물자에 해당하는지에 대한 판정이 완료된 판정물자에 대한 정보가 저장되어 있는 제 1 데이터 베이스;
상기 판정물자에 대한 정보로부터 추출된 키워드가 저장되어 있는 제 2 데이터 베이스;
전략물자에 해당하는지에 대한 판정을 받고자 하는 신청물자에 대한 정보를 신청자가 입력하는 입력부;
상기 입력부에 입력된 정보로부터 키워드를 추출하는 키워드 추출부;
상기 추출된 키워드를 이용하여 상기 제 2 데이터 베이스로부터 유사 키워드를 검색하는 검색부;
상기 검색된 유사 키워드를 이용하여 상기 제 1 데이터 베이스로부터 유사문서를 추출하는 유사문서 추출부;
상기 유사문서 추출부로부터 추출된 유사문서를 저장하기 위한 유사문서 저장부; 및
상기 유사문서 저장부에 저장된 유사문서를 이용하여 상기 신청물자가 전략물자에 해당하는지 여부를 판정하는 판정부;를 포함하는 전략물자 판정 시스템. - 삭제
- 제 1 항에 있어서, 상기 유사문서 저장부에 저장된 유사문서를 디스플레이하기 위한 디스플레이부를 더 포함하는 것을 특징으로 하는 전략물자 판정 시스템.
- 삭제
- 제 1 항에 있어서, 상기 키워드 추출부에서는 핵물질과 관련된 키워드, 우라늄 농축시설과 관련된 키워드 및 핵무기 기폭장치와 관련된 키워드 중 적어도 하나를 포함하는 키워드를 추출하는 것을 특징으로 하는 전략물자 판정 시스템.
- 제 5 항에 있어서, 상기 핵물질과 관련된 키워드는 핵원료성 물질, 핵분열성 물질, 중수소, 중수, 붕소 및 원자로급 흑연 중 적어도 하나를 포함하는 키워드인 것을 특징으로 하는 전략물자 판정 시스템.
- 제 5 항에 있어서, 상기 우라늄 농축시설과 관련된 키워드는 초전도체, 솔레노이드 전자석, 직류 전력공급기, 불소, 불소 생산용 전해조 및 동위원소 분리기 중 적어도 하나를 포함하는 키워드인 것을 특징으로 하는 전략물자 판정 시스템.
- 제 5 항에 있어서, 상기 핵무기 기폭장치와 관련된 키워드는 펄스 가속기, 펄스 전자 가속기, 펄스 발생기, 고속 펄스 발생기, 전기 펄스 발생기, 폭발 뇌관, 점화세트, 중성자 발생 시스템 및 폭발물 중 적어도 하나를 포함하는 키워드인 것을 특징으로 하는 전략물자 판정 시스템.
- 신청자가 전략물자에 해당하는지에 대한 판정을 받고자 하는 신청물자에 대한 정보를 입력하는 입력단계;
전략물자 판정 시스템이 상기 입력된 신청물자에 대한 정보로부터 키워드를 추출하는 키워드 추출단계;
상기 추출된 키워드를 이용하여 제 2 데이터 베이스로부터 유사 키워드를 검색하는 검색단계;
상기 검색된 유사 키워드를 이용하여 제 1 데이터 베이스로부터 유사문서를 추출하는 유사문서 추출단계;
상기 추출된 유사문서를 이용하여 상기 신청물자가 전략물자에 해당하는지 여부를 판단하는 판정단계;를 포함하는 전략물자 판정방법. - 제 9 항에 있어서, 상기 입력단계에서는 신청물자에 대한 HS번호, 통제번호, 계통명, 품목명, 모델명, 제조자명 및 수출국명 등의 정보를 입력하는 단계를 포함하는 것을 특징으로 하는 전략물자 판정방법.
- 제 9 항에 있어서, 상기 판정단계에서 판정이 완료된 신청물자에 대한 정보를 상기 제 1 데이터 베이스에 저장하는 저장단계를 더 포함하는 것을 특징으로 하는 전략물자 판정방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020130051461A KR101456599B1 (ko) | 2013-05-07 | 2013-05-07 | 전략물자 판정 시스템 및 그 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020130051461A KR101456599B1 (ko) | 2013-05-07 | 2013-05-07 | 전략물자 판정 시스템 및 그 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR101456599B1 true KR101456599B1 (ko) | 2014-11-03 |
Family
ID=52288425
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020130051461A KR101456599B1 (ko) | 2013-05-07 | 2013-05-07 | 전략물자 판정 시스템 및 그 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101456599B1 (ko) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20000054268A (ko) * | 2000-05-30 | 2000-09-05 | 전상훈 | 문서 자동 요약을 이용한 문서 분류 검색 방법 및 문서분류 검색 시스템 |
KR20020060417A (ko) * | 2001-01-11 | 2002-07-18 | 전종훈 | 사용자별 검색 이력 정보를 이용한 문서 검색 시스템 및문서 검색 방법 |
KR20070102033A (ko) * | 2006-04-13 | 2007-10-18 | 엘지전자 주식회사 | 문서검색 시스템 및 그 방법 |
KR100927553B1 (ko) * | 2007-08-17 | 2009-11-27 | 대한민국(지식경제부장관) | 전략물자 관리 네트워크 및 이를 이용한 전략물자 관리방법 |
-
2013
- 2013-05-07 KR KR1020130051461A patent/KR101456599B1/ko active IP Right Grant
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20000054268A (ko) * | 2000-05-30 | 2000-09-05 | 전상훈 | 문서 자동 요약을 이용한 문서 분류 검색 방법 및 문서분류 검색 시스템 |
KR20020060417A (ko) * | 2001-01-11 | 2002-07-18 | 전종훈 | 사용자별 검색 이력 정보를 이용한 문서 검색 시스템 및문서 검색 방법 |
KR20070102033A (ko) * | 2006-04-13 | 2007-10-18 | 엘지전자 주식회사 | 문서검색 시스템 및 그 방법 |
KR100927553B1 (ko) * | 2007-08-17 | 2009-11-27 | 대한민국(지식경제부장관) | 전략물자 관리 네트워크 및 이를 이용한 전략물자 관리방법 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Cuzzocrea et al. | Big data: a research agenda | |
CN106354708A (zh) | 一种基于用电信息采集系统的客户互动信息搜索引擎系统 | |
CN102541995A (zh) | 对散列序列矩阵的索引和查询 | |
Bleik et al. | Text categorization of biomedical data sets using graph kernels and a controlled vocabulary | |
CN103020213A (zh) | 具有明显类别划分的非结构化电子文档的检索方法和系统 | |
CN101980196A (zh) | 文章比对方法与装置 | |
CN110097278A (zh) | 一种科技资源智能共享融合训练系统和应用系统 | |
KR101620631B1 (ko) | 원자력 관련 유사 기술 문서 검색 시스템 및 그 방법 | |
Wahle et al. | Deterministic binary vectors for efficient automated indexing of medline/pubmed abstracts | |
CN105354182A (zh) | 获取相关数字资源的方法及使用其生成专题的方法及装置 | |
CN106649262A (zh) | 一种社交媒体中企业硬件设施敏感信息防护方法 | |
KR101776578B1 (ko) | 원자력 계통 정보를 활용한 사례기반 전자문서 분류 시스템 및 그 방법 | |
CN113505117A (zh) | 基于数据指标的数据质量评估方法、装置、设备及介质 | |
CN106919565B (zh) | 一种基于MapReduce的文档检索方法及系统 | |
KR101456599B1 (ko) | 전략물자 판정 시스템 및 그 방법 | |
Hatua et al. | On the Feasibility of Using GANs for Claim Verification-Experiments and Analysis. | |
CN108519983A (zh) | 一种基于潜层语义分析的安全的文档相似性计算方法和系统 | |
CN100535893C (zh) | 一种计算机标引和检索的方法 | |
Wang et al. | A new evaluation measure using compression dissimilarity on text summarization | |
KR101456600B1 (ko) | 전략물자 관련 키워드 추출 시스템 및 그 방법 | |
Olegovich Dorodnykh et al. | Using the Semantic Annotation of Web Table Data for Knowledge Base Construction | |
Chiraratanasopha et al. | Improved term weighting factors for keyword extraction in hierarchical category structure and thai text classification | |
Yin et al. | Evaluation of literature frontier based on latent semantic analysis | |
Cooper | Evaluation of information retrieval systems: a simulation and cost approach. | |
Jian | Keyword Extraction From Chinese Text Based On Multidimensional Weighted Features. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20170818 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20190821 Year of fee payment: 6 |