KR20210086560A - 자연어처리를 이용한 건조사양서 및 선박안전법규정 요구사항 비교 분석 시스템 및 방법 - Google Patents

자연어처리를 이용한 건조사양서 및 선박안전법규정 요구사항 비교 분석 시스템 및 방법 Download PDF

Info

Publication number
KR20210086560A
KR20210086560A KR1020200188488A KR20200188488A KR20210086560A KR 20210086560 A KR20210086560 A KR 20210086560A KR 1020200188488 A KR1020200188488 A KR 1020200188488A KR 20200188488 A KR20200188488 A KR 20200188488A KR 20210086560 A KR20210086560 A KR 20210086560A
Authority
KR
South Korea
Prior art keywords
requirements
natural language
ship safety
language processing
ship
Prior art date
Application number
KR1020200188488A
Other languages
English (en)
Other versions
KR102671799B1 (ko
Inventor
최용선
이영관
Original Assignee
인제대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 인제대학교 산학협력단 filed Critical 인제대학교 산학협력단
Publication of KR20210086560A publication Critical patent/KR20210086560A/ko
Application granted granted Critical
Publication of KR102671799B1 publication Critical patent/KR102671799B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/04Manufacturing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Primary Health Care (AREA)
  • Educational Administration (AREA)
  • Operations Research (AREA)
  • Manufacturing & Machinery (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Technology Law (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 건조사양서 및 선박안전 관련 법규정의 주요 요구사항 간의 차이점을 체계적으로 비교 검증하여 선박 건조의 효율성을 제고하기 위한 자연어처리를 이용한 건조사양서 및 선박안전법규정 요구사항 비교 분석 시스템 및 방법에 관한 것으로, 온톨로지 및 내부규칙(Rule Set)을 활용한 자연어처리 기반 정보추출기술을 이용하여 건조사양서에 포함되어 있는 주요 요구사항 등을 추출하는 건조사양서 요구사항 추출 모듈;과 그 결과를 저장하는 건조사양서 요구사항 데이터베이스; 온톨로지 및 내부규칙(Rule Set)을 활용한 자연어처리 기반 정보추출기술을 이용하여 선박안전법규정에 포함되어 있는 주요 요구사항 등을 추출하는 선박안전법규정 요구사항 추출 모듈;과 그 결과를 저장하는 선박안전법 요구사항 데이터베이스; 건조사양서 요구사항 데이터베이스와 선박안전법규정 요구사항 데이터베이스에 포함되어 있는 주요 요구사항과의 차이를 분석하는 요구사항 비교 검증 모듈;을 포함하는 것이다.

Description

자연어처리를 이용한 건조사양서 및 선박안전법규정 요구사항 비교 분석 시스템 및 방법{System and Method for the Comparative Requirements Analysis between Ship Safety Regulations and Building Specifications utilizing Natural Language Processing}
본 발명은 선박 건조 관리에 관한 것으로, 구체적으로 건조사양서 및 선박안전 관련 법규정의 주요 요구사항 간의 차이점을 체계적으로 비교 검증하여 선박 건조의 효율성을 제고하기 위한 자연어처리를 이용한 건조사양서 및 선박안전법규정 요구사항 비교 분석 시스템 및 방법에 관한 것이다.
선박은 건조사양서(Building specifications)에 정의된 사양과 성능 요구사항을 만족하게끔 설계되고 건조되어야 한다. 건조사양서에는 기본 성능, 구조 안전 수준, 선체 재료, 그리고 의장 기자재 성능 등이 명시되어 있으며, 이는 선박의 성능 지표와 또한 구조 부재, 의장 부품 그리고 기자재 선정과도 관련되어 있다.
건조사양서에 포함된 모두 요구사항들은 조기에 파악하여 선박의 설계 및 건조과정에 적절히 반영되도록 체계적으로 관리되어야 한다. 현재는 이를 위해 많은 분량의 건조사양서에 포함되어 있는 수많은 요구사항들을 해당 분야의 전문지식을 가지고 있는 담당자들이 일일이 수작업으로 수행함으로써, 요구사항의 파악에 많은 시간과 노력을 투입하고 있다. 그럼에도 불구하고, 일부 요구사항을 조기에 파악하지 못하는 현상이 자주 발생하고 있으며, 이로 인해 후속 설계 및 건조과정에서의 오류를 유발하여 공기 지연, 생산성 저하, 추가 비용 발생 등으로 건조사의 경쟁력을 저하시키고 선주와의 분쟁의 요인으로도 작용하고 있다.
또한 선박은 건조사양서 외에도 해당 호선에 부합되는 여러가지 선박안전 관련 법규정에서 제시된 구조 및 성능기준 요구사항도 만족하게끔 설계되고 건조되어야 한다. 일반적으로 선박설계/생산/품질관리 분야에는 준수해야 할 다수의 규정과 기준이 있으며, 이에 따라 다양하고 복잡한 요구사항 검증작업을 요구하고 있다.
예를 들어, 선박 안전법(law for safety of vessels, 船舶安全法)은 선박이 안전하게 항해하기 위해 필요한 인적, 물적 능력[堪航能力]을 유지해서 해상에서의 인명 안전을 확보하는 데 필요한 설비를 시설할 것을 의무로 한 법률이다.
요약하자면, 건조 대상 선박과 관련된 선박 안전 관련 제반 법규정과 건조사양서에 포함되어 있는 모든 요구사항들을 파악하고, 이들을 선박의 설계 및 건조과정에서 제대로 반영했는지 여부를 추적 관리하는 것은 선박건조관리에 있어서 매우 중요하며, 선주, 건조사, 감리기관 등 선박 건조과정에 참여하는 모든 기관에 필요한 작업이다.
그러나, 현재 선박 건조 관리방안에는 선박안전 법규정 및 건조사양서의 두 가지 유형의 다량의 문서들로부터 요구사항을 신속하고 정확하게 파악하고 비교 검증하는 기술이 존재하지 않아, 많은 시간과 노력을 투입하여 매우 비효율적으로 진행되고 있다. 특히, 중소조선(협력)업체는 현재 설계뿐만 아니라 생산관리, 품질관리 부분에서 전문인력 등 체계적 설계, 건조 대응 시스템을 갖추지 못해, 선박안전법령체계의 복잡한 설계/건조 기준과 선주 건조사양서 간의 요구사항 차이점에 대한 검증, 그리고 사양서에 누락된 안전기준의 이행에 애로를 겪고 있다.
이로 인해, 설계 및 건조단계에서의 오작(誤作)이 초래되고, 안전기준 불이행과 선주, 감리기관 등의 요구사항에 대한 대응 애로로 인한 분쟁 등을 초래하여, 원가 상승 및 공기지연 등의 경쟁력 저하요인으로 작용하고 있다.
따라서, 이와 같은 문제를 해결하기 위해, 건조 대상 호선과 관련된 선박안전 법규정 및 건조사양서의 주요 요구사항을 각각 신속하고 정확하게 파악하고, 이들 간의 차이점을 체계적으로 비교 검증할 수 있도록 지원하는 기술의 개발이 요구되고 있다.
대한민국 공개특허 제10-2008-0004239호 대한민국 등록특허 제10-1807608호
본 발명은 종래의 선박 건조 관리 기술의 한계점을 극복하여 선박 건조프로세스를 선진화하기 위한 것으로, 건조 대상 선박과 관련된 건조사양서 및 선박안전 법규정의 주요 요구사항들을 신속하고 정확하게 파악한 후 이들 간의 차이점을 체계적으로 비교 검증할 수 있도록 지원함으로써, 선박 건조 과정에서의 체계적 관리를 통한 생산성과 효율성 제고, 불필요한 오작(誤作) 제거를 통한 원가상승 억제, 선주 및 감리기관 등 대외 대응능력 제고 등을 통해 종합적으로 조선소의 경쟁력을 제고하기 위해, 자연어처리기술을 이용하여 건조사양서 및 선박안전 법규정의 다량의 문서들에 포함된 복잡한 요구사항들을 추출하고 이들을 비교 분석하는 시스템 및 방법을 제공하는데 그 목적이 있다.
본 발명의 다른 목적들은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
상기와 같은 목적을 달성하기 위한 본 발명에 따른 자연어처리를 이용한 건조사양서 및 선박안전법규정 요구사항 비교 분석 시스템은 온톨로지 및 내부규칙(Rule Set)을 활용한 자연어처리 기반 정보추출기술을 이용하여 건조사양서에 포함되어 있는 주요 요구사항 등을 추출하는 건조사양서 요구사항 추출 모듈;과 그 결과를 저장하는 건조사양서 요구사항 데이터베이스; 온톨로지 및 내부규칙(Rule Set)을 활용한 자연어처리 기반 정보추출기술을 이용하여 선박안전법규정에 포함되어 있는 주요 요구사항 등을 추출하는 선박안전법규정 요구사항 추출 모듈;과 그 결과를 저장하는 선박안전법규정 요구사항 데이터베이스; 건조사양서 요구사항 데이터베이스와 선박안전법규정 요구사항 데이터베이스에 포함되어 있는 주요 요구사항들 간의 차이를 분석하는 요구사항 비교 검증 모듈;을 제공한다.
상기 건조사양서 요구사항 추출 모듈과 상기 선박안전법규정 요구사항 추출 모듈은 각각 해당 입력 문서 파일들을 대상으로 워드프로세서 소프트웨어에서 제공하는 API를 사용하여 문서파일을 전처리하는 전처리 유닛(preprocessing unit); 공개형 자연어 처리 도구를 컴포넌트 형태로 활용하는 기본적인 자연어 처리(Natural Language Processing, NLP)와 이를 보정하기 위한 확장된 자연어 처리 유닛(Extended NLP unit); 그리고 이를 바탕으로 각 해당 입력 문서파일에 포함되어 있는 주요 의미개체, 단락별 유형, 요구사항 단락의 세부 구성요소를 추출하는 정보추출유닛; 을 포함한다.
상기 전처리 유닛(preprocessing unit)은, 문서에 포함된 이미지 및 표 개체를 제거하는 넌-텍스트 처리부와, 이미지 및 표 개체가 제거된 문서의 텍스트에 대한 구조적 특성을 추출하는 텍스트 처리부를 포함한다.
상기 확장된 자연어 처리 유닛은, 토큰화, 문장 분할, 표제어 추출을 위한 제1 자연어 처리부와, 품사 태깅 및 구문 분석 과정을 위한 제2 자연어 처리부와, 어휘 데이터베이스와 통합한 내부 규칙을 활용하여 자연어 처리과정에서 발생하는 잘못된 POS 태그 및 구문분석 결과를 감지 및 수정하기 위한 제3 자연어 처리부를 포함한다.
상기 정보추출유닛은 상기 의미 개체 식별을 위한 의미 개체 식별부; 상기 절차서 각 단락의 유형을 분류하는 단락 유형 분류부; 및 상기 요구사항 단락의 세부 구성 요소를 식별하는 요구사항 구성 요소 식별부를 포함한다.
그리고 요구사항 비교 검증 모듈은, 건조사양서 및 선박안전법규정 요구사항 비교검증 결과를 사용자가 이해하기 쉬운 형태로 제공하는 주 사용자 인터페이스 제공부; 주 사용자 인터페이스와 동기화 표시(Synchronized Display)되는 건조사양서 워드프로세서 실행부; 및 선박안전법규정문 워드프로세서 실행부; 를 포함한다.
상기 주 사용자 인터페이스는 별개의 기능을 수행하는 서브 인터페이스로 이동하기 위한 리본메뉴부; 선박의 주요 제원을 요약해서 보여주는 주요 제원 표시부; 추출된 주요 의미개체 및 요구사항 세부 구성요소 등에 대하여 사용자 주도의 복합 검색조건을 지정하는 검색요건 지정부; 지정된 검색요건에 해당하는 건조사양서 및 선박안전법규정의 주요 요구사항 들을 필터링하여 나타내는 요구사항 표시부; 등을 포함한다.
본 발명의 다른 특징에 따르면, 자연어처리를 이용한 건조사양서 및 선박안전법규정 요구사항 비교 분석 방법에 있어서, 건조사양서를 입력문서로 하여 건조사양서에 포함된 주요 요구사항을 추출하고 상기 건조사양서 요구사항 데이터베이스에 저장하는 건조사양서 요구사항 추출 및 저장 단계; 선박안전법규정을 입력문서로 하여 선박안전법규정에 포함된 주요 요구사항을 추출하고 상기 선박안전법규정 요구사항 데이터베이스에 저장하는 선박안전법규정 요구사항 추출 및 저장 단계; 상기 건조사양서 요구사항 데이터베이스와 상기 선박안전법규정 요구사항 데이터베이스에 포함되어 있는 주요 요구사항들의 차이를 비교 검증하여 분석하는 요구사항 비교 검증 단계;를 포함하는 건조사양서 및 선박안전 법규정 요구사항 비교 분석 방법을 제공한다.
상기 건조사양서 요구사항 추출 및 저장 단계 및 상기 선박안전법규정 요구사항 추출 및 저장 단계는 상기 각 입력문서에 대한 전처리 과정을 수행하는 제1 단계; 상기 전처리 과정에 따른 텍스트 정보를 분석하기 위해 자연어 처리를 수행하고, 상기 자연어 처리 중 발생한 POS 태그 및 구문분석 오류를 감지하고 수정하는 제2 단계; 상기 제1 단계 및 제2 단계의 결과물을 이용하여 상기 각 입력문서의 각 단락에 대하여 의미 개체 식별, 단락의 유형 분류, 요구사항 단락의 세부 구성 요소 식별을 수행하는 제3 단계; 및 상기 추출된 정보를 상기 각 데이터베이스에 저장하는 제4 단계를 포함한다.
상기 제2 단계는 주요 선박 유형별로 작성된 어휘 데이터 베이스와 내부 규칙을 활용하여 POS 태그 및 구문분석 오류를 감지하고 보정한다.
상기 제3 단계의 상기 의미 개체 식별은, 각 토큰에 포함된 단어가 온톨로지에 포함되어 있는 경우 적용되는 온톨로지 조회방식과, POS 태깅, 구문적 태깅, 및 의미적 태깅을 포함하는 조건식을 만족하는 토큰에 대해 미리 지정된 개념으로 태깅하는 패턴기반의 규칙방식을 조합하여 수행한다.
상기 제3 단계의 단락 유형 분류는, 형태적 측면에서 문장 표현 또는 개조식 표현 등의 단락의 형태와, 내용적 측면에서 Provision Type 및 주요 요구사항그룹/기타 그룹으로 나뉘는 단락 유형을 분류한다.
상기 제3 단계의 요구사항문 구성 요소 식별은, POS 태그, 의미개체 태그, 구문분석 태그를 이용하여, 적용 조건, 선박설계 및 건조과정에서의 작업 분할 구조 (Work Breakdown Structure, WBS)를 기준으로 한 구체적 작업 요소, 해당 작업 요소의 구체적 속성 요소, 속성치를 포함하는 승인 기준 (Acceptance Criteria) 등의 구성요소를 각각 식별한다.
상기 요구사항 비교 검증 단계는 상기 리본메뉴를 통한 별개의 서브 인터페이스로의 이동, 주요 제원 표시부를 통한 선박의 주요 제원정보 요약 제공, 검색요건 지정부를 통한 사용자 주도의 복합 검색조건 지정, 요구사항 표시부를 통한 사용자 지정 검색요건에 해당하는 건조사양서 및 선박안전법규정의 주요 요구사항 들을 필터링한 결과 표시 등을 지원한다.
상기 요구사항 표시부는 건조사양서 및 선박안전법규정의 요구사항 비교결과를 바탕으로, 두 입력문서에 모두 포함되는 경우, 하나의 입력문서에만 포함되는 경우, 선박제원 등에 따르면 관계없는 경우 등으로 구분하여 요구사항 앞쪽에 별색으로 구분하여 나타내고, 또한 표시된 건조사양서 또는 선박안전법규정의 특정 요구사항을 클릭시 상기 대상 워드프로세서 실행부에서 해당 요구사항을 포함하는 페이지로 이동하여 해당 단락을 선택해서 표시하는 동기화 표시를 지원한다.
상기 별개의 서브 인터페이스를 통해서는 건조사양서 및 선박안전법규정으로 부터의 정보추출결과에 대한 다양한 분석결과물을 화면 또는 출력물을 이용하여 살펴볼 수 있도록 지원하며, 이에는 각 의미개체, 단락 유형, 요구사항 구성요소 등에 대한 크로스탭 등의 통계적 분석과 각 입력 문서 파일에 해당 정보항목을 유형별로 별색으로 하이라이트한 결과를 포함한다.
이상에서 설명한 본 발명에 따른 자연어처리를 이용한 건조사양서 및 선박안전법규정 요구사항 비교 분석 시스템 및 방법에 따르면, 건조사양서 및 선박안전법규정에 포함된 주요 요구사항을 각각 추출하고 데이터베이스화 하여 이들 주요 요구사항 간의 차이점을 체계적으로 비교 검증함으로써, 선박 건조관리의 효율성을 높일 수 있다. 그 결과로, 효과적 요구사항 파악 및 충족, 오작/재시공 최소화를 통한 공수 및 공기 절감 등을 통해 안정적 사업관리 측면에서의 선박건조산업의 경쟁력을 제고하는 효과를 얻을 수 있다.
또 본 발명에 따르면, 선박의 상세 설계 및 건조단계에서 만들어 내야 하는 수많은 목적문건별로 각각에 포함되어야 하는 주요 요구사항들을 적시함으로써, 요구사항 추적관리를 용이하게 할 수 있다.
또 본 발명에 따르면, 장비/부품 등의 구매 발주시 각 장비/부품에 필요한 주요 요구사항들을 모두 포함하는 구매발주서 자동발행 등에도 활용할 수 있다.
그리고 본 발명에 따르면, 다수 호선에 대하여 건조사양서 요구사항 데이터베이스를 확장할 경우, 호선간 요구사항들 간의 비교 등을 통하여 유사 신규 호선에 대한 견적을 합리적으로 산출하는 데에도 활용할 수 있다.
도 1은 본 발명에 따른 자연어처리를 이용한 건조사양서 및 선박안전법규정 요구사항 비교 분석 시스템의 개념(활용효과 및 작동원리) 구성도
도 2는 본 발명에 따른 자연어처리를 이용한 건조사양서 및 선박안전법규정 요구사항 비교 분석 시스템의 구성 블록도
도 3은 본 발명에 따른 요구사항 추출 모듈의 상세 구성도
도 4a는 요구사항 비교 검증 모듈의 상세 구성도
도 4b는 주 사용자 인터페이스 제공부의 상세 구성도
도 5는 본 발명에 따른 자연어처리를 이용한 건조사양서 및 선박안전법규정 요구사항 비교 분석 방법을 나타낸 플로우 차트
도 6은 본 발명에 따른 요구사항 추출 상세 과정을 나타낸 플로우 차트
도 7은 요구사항 추출 과정의 일 예를 나타낸 구성도
도 8은 선박안전법규정에 대한 정보추출결과를 조회하는 서브 인터페이스의 한 예로, 주요 법규정 각 편(編)별로 의미유형별 해당 의미개체의 등장 빈도를 나타내는 CrossTab 화면 구성도
도 9는 선박안전법규정에 대한 정보추출 결과에 따라 추출된 각 의미개체를 해당 의미유형 별로 별색으로 하이라이트한 출력물의 일 예
도 10은 건조사양서에 대한 정보추출 결과에 따라 추출된 각 의미개체를 해당 의미유형 별로 별색으로 하이라이트한 출력물의 일 예
도 11은 선박안전법규정에 대한 정보추출결과를 조회하는 서브 인테페이스의 한 예로, 법규정 각 편(編) 및 법규정문의 Provision Type별 빈도를 나타내는 크로스탭 분석결과를 조회하는 화면 구성도.
도 12는 선박안전법규정에 대한 정보추출결과의 한 예로, 각 법규정문 단락별로 해당 Provision Type을 별색으로 하이라이트하여 출력물의 일 예
도 13은 본 발명에 따른 자연어처리기반의 건조사양서 및 선박안전법규정 요구사항 비교 분석 시스템의 요구사항 비교 검증 모듈의 화면 구성도
도 14는 사용자 주 인터페이스 구성도
도 15는 사용자 주 인터페이스에서 사용자가 선택한 건조사양서 요구사항에 대해 건조사양서 워드프로세서 실행부에서 동기화화여 해당 단락을 직접 조회할 수 있도록 지원하는 예시 화면 구성도
도 16은 사용자 주 인터페이스에서 사용자가 선택한 선박안전법규정 요구사항에 대해 선박안전법규정 워드프로세서 실행부에서 동기화화여 해당 단락을 직접 조회할 수 있도록 지원하는 예시 화면 구성도
본 발명의 목적 및 효과, 그리고 그것들을 달성하기 위한 기술적 구성들은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시 예들을 참조하면 명확해질 것이다. 본 발명을 설명함에 있어서 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다.
그리고 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로써 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다.
그러나 본 발명은 이하에서 개시되는 실시 예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있다. 단지 본 실시 예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
본 발명을 설명하기에 앞서, 정보 추출 및 온톨로지 개념에 대해 살펴본다.
정보 추출은 컴퓨터가 인식할 수 있는 문서에 포함되어 있는 수 많은 데이터를 선택적으로 구성하고 결합하는 프로세스이고, 통상 정보를 추출하기 전에 입력된 문서에 포함된 텍스트를 분석하기 위해서는 자연어 처리(Natural Language Processing, NLP) 기술이 사용된다. 그리고 특정 도메인에서의 이와 같은 정보 추출은 보통의 비기술적(非技術的) 텍스트에 적용할 때 보다 훨씬 더 적합한 결과를 기대할 수 있는데, 이는 동음이의어 및 동일 지시어 문제의 저감 및 특정 도메인에서의 전문 용어에 대한 향상된 해석 등에 기반하기 때문이다. 특정 도메인에서의 정보 추출은 종종 도메인 온톨로지와 결합하여 그 성능을 더욱 향상시킨다.
온톨로지는 특정 도메인의 지식을 컴퓨터가 이해할 수 있도록 나타낸 것으로서, 도메인의 주요 개념, 개념과 개념 간의 관계, 그리고 각 개념에 포함되는 고유한 개체들로 구성된다. 온톨로지 학습으로도 알려진 온톨로지 구축은 사용된 기술에 따라 통계, 언어학, 기계 학습, 논리적 추론 및 하이브리드 방법 등 여러 가지 방식으로 접근할 수 있다. 온톨로지를 적용한 예는 여러 산업분야에서 살펴볼 수 있다.
또한, 패턴기반의 내부규칙은 POS 태깅, 구문적 태깅, 및 의미적 태깅을 포함하는 조건식을 만족하는 토큰에 대해 미리 지정된 개념으로 태깅함으로써, 의미 개체 식별에 있어서 제한된 용어만을 인식하는 온톨로지 조회방식의 단점을 극복하고, 단락유형의 식별, 그리고 요구사항 구성요소의 식별에 있어서도 효과적으로 활용된다.
본 발명은 위에서 언급하고 있는 온톨로지 및 내부규칙(Rule Set)을 활용한 자연어처리기반 정보추출기술을 활용하여 건조사양서 및 선박안전법규정에 포함된 주요 요구사항을 추출하고 이들 간의 차이점을 비교 분석 검증하는 방법론을 제안한 것이라 할 수 있고, 이하에서 도면에 도시한 실시 예에 기초하면서 본 발명에 대하여 더욱 상세하게 설명하기로 한다.
본 발명에 따른 자연어처리를 이용한 건조사양서 및 선박안전법규정 요구사항 비교 분석 시스템 및 방법의 특징 및 이점들은 이하에서의 각 실시 예에 대한 상세한 설명을 통해 명백해질 것이다.
도 1은 본 발명에 따른 자연어처리를 이용한 건조사양서 및 선박안전법규정 요구사항 비교 분석 시스템의 개념(활용효과 및 작동원리) 구성도이다.
본 발명은 건조사양서 및 선박안전법규정을 대상으로 각각의 문서파일을 입력대상으로 하여 온톨로지 및 내부규칙(Rule Set)을 활용한 자연어처리기반 정보추출(Information Extraction)과정을 통해 주요 요구사항(Requirements)을 추출하고, 이들 간의 차이점을 비교검증(Comparative Verification)하는 구성을 포함할 수 있다.
도 2는 본 발명에 따른 자연어처리를 이용한 건조사양서 및 선박안전법규정 요구사항 비교 분석 시스템의 구성 블록도이다.
본 발명에 따른 자연어처리를 이용한 건조사양서 및 선박안전법규정 요구사항 비교 분석 시스템은 도 2에서와 같이, 온톨로지 및 내부규칙(Rule Set)을 활용한 자연어처리 기반 정보추출기술을 이용하여 건조사양서에 포함되어 있는 주요 요구사항 등을 추출하는 건조사양서 요구사항 추출 모듈(100)과, 건조사양서 요구사항 추출 모듈(100)의 요구사항 추출 결과를 저장하는 건조사양서 요구사항 데이터베이스(110)와, 온톨로지 및 내부규칙(Rule Set)을 활용한 자연어처리 기반 정보추출기술을 이용하여 선박안전법규정에 포함되어 있는 주요 요구사항 등을 추출하는 선박안전법규정 요구사항 추출 모듈(200)과, 선박안전법규정 요구사항 추출 모듈(200)의 요구사항 추출 결과를 저장하는 선박안전법규정 요구사항 데이터베이스(210)와, 건조사양서 요구사항 데이터베이스(110)와 선박안전법규정 요구사항 데이터베이스(210)에 포함되어 있는 주요 요구사항들 간의 차이를 분석하는 요구사항 비교 검증 모듈(300)을 포함한다.
상기 건조사양서 요구사항 추출 모듈(100)과 상기 선박안전법규정 요구사항 추출 모듈(200)은 각각 해당 입력 문서 파일들을 대상으로 워드프로세서 소프트웨어에서 제공하는 API를 사용하여 문서파일을 전처리하는 전처리 유닛(preprocessing unit)(21)과, 공개형 자연어 처리 도구를 컴포넌트 형태로 활용하는 기본적인 자연어 처리(Natural Language Processing, NLP)와 이를 보정하기 위한 확장된 자연어 처리 유닛(Extended NLP unit)(22)과, 전처리 및 확장된 자연어 처리를 바탕으로 각 해당 입력 문서파일에 포함되어 있는 주요 의미개체, 단락별 유형, 요구사항 단락의 세부 구성요소를 추출하는 정보추출유닛(31)을 포함한다.
건조사양서 요구사항 추출 모듈(100)과 선박안전법규정 요구사항 추출 모듈(200) 각각의 상세 구성을 설명하면 다음과 같다.
도 3은 본 발명에 따른 요구사항 추출 모듈의 상세 구성도이다.
건조사양서 요구사항 추출 모듈(100) 및 선박안전법규정 요구사항 추출 모듈(200)의 전처리 유닛(preprocessing unit)(21)은 문서에 포함된 이미지 및 표 개체를 제거하는 넌-텍스트 처리부(23)와, 이미지 및 표 개체가 제거된 문서의 텍스트에 대한 구조적 특성을 추출하는 텍스트 처리부(24)를 포함한다.
그리고 상기 확장된 자연어 처리 유닛(22)은, 토큰화, 문장 분할, 표제어 추출을 위한 제1 자연어 처리부(25)와, 품사 태깅 및 구문 분석 과정을 위한 제2 자연어 처리부(26)와, 어휘 데이터베이스와 통합한 내부 규칙을 활용하여 자연어 처리과정에서 발생하는 잘못된 POS 태그 및 구문분석 결과를 감지 및 수정하기 위한 제3 자연어 처리부(27)를 포함한다.
여기서, 구문 분석은, 구성요소 기반과, 종속성 기반의 2가지로 분석한다.
그리고 상기 정보 추출 유닛(31)은, 의미 개체 식별을 위한 의미 개체 식별부(32)와, 문서 각 단락의 유형을 분류하는 단락 유형 분류부(33)와, 요구사항문 단락의 세부 구성 요소를 식별하는 요구사항 요소 식별부(34)를 포함한다.
그리고 의미 개체 식별부(32)는, 온톨로지 조회 방식과 내부 규칙 방식을 적용하여 문서 각 단락에 포함된 유의한 의미 개체를 식별한다. 상기 온톨로지 조회 방식에 따른 태깅은, 온톨로지에 포함된 의미 개체와 일치하는 토큰에만 적용된다.
그리고 내부 규칙 방식에 따른 태깅은, POS 태깅, 구문적 태깅, 및 의미적 태깅을 포함하는 조건식을 만족하는 토큰에 대해 미리 지정된 개념으로 태깅한다.
도 4a는 요구사항 비교 검증 모듈의 상세 구성도이다.
요구사항 비교 검증 모듈은 도 4a에서와 같이, 건조사양서 및 선박안전법규정 요구사항 비교검증 결과를 사용자가 이해하기 쉬운 형태로 제공하는 주 사용자 인터페이스 제공부(40)와, 주 사용자 인터페이스와 동기화 표시(Synchronized Display)되는 건조사양서 워드프로세서 실행부(41) 및 선박안전법규정문 워드프로세서 실행부(42)를 포함한다.
도 4b는 주 사용자 인터페이스 제공부의 상세 구성도이다.
상기 주 사용자 인터페이스 제공부(40)는 별개의 기능을 수행하는 서브 인터페이스로 이동하기 위한 리본메뉴부(40a)와, 선박의 주요 제원을 요약해서 보여주는 주요 제원 표시부(40b)와, 추출된 주요 의미개체 및 요구사항 세부 구성요소 등에 대하여 사용자 주도의 복합 검색조건을 지정하는 검색요건 지정부(40c)와, 지정된 검색요건에 해당하는 건조사양서 및 선박안전법규정의 주요 요구사항들을 필터링하여 나타내는 요구사항 표시부(40d)를 포함한다.
본 발명에 따른 자연어처리를 이용한 건조사양서 및 선박안전법규정 요구사항 비교 분석 방법을 구체적으로 설명하면 다음과 같다.
도 5는 본 발명에 따른 자연어처리를 이용한 건조사양서 및 선박안전법규정 요구사항 비교 분석 방법을 나타낸 플로우 차트이다.
본 발명에 따른 자연어처리를 이용한 건조사양서 및 선박안전법규정 요구사항 비교 분석 방법은 건조사양서를 입력문서로 하여 건조사양서에 포함된 주요 요구사항을 추출하고 상기 건조사양서 요구사항 데이터베이스에 저장하는 건조사양서 요구사항 추출 및 저장 단계(S510)와, 선박안전법규정을 입력문서로 하여 선박안전법규정에 포함된 주요 요구사항을 추출하고 상기 선박안전법규정 요구사항 데이터베이스에 저장하는 선박안전법규정 요구사항 추출 및 저장 단계(S520)와, 상기 건조사양서 요구사항 데이터베이스와 상기 선박안전법규정 요구사항 데이터베이스에 포함되어 있는 주요 요구사항들 간의 차이를 비교 검증하여 분석하는 요구사항 비교 검증 단계(S530)를 포함한다.
여기서, 상기 건조사양서 요구사항 추출 및 저장 단계는, 상기 각 입력문서에 대한 전처리 과정을 수행하는 제1 단계(S511)와, 상기 전처리 과정에 따른 텍스트 정보를 분석하기 위해 자연어 처리를 수행하고, 상기 자연어 처리 중 발생한 POS 태그 및 구문분석 오류를 감지하고 수정하는 제2 단계(S512)와, 상기 제1 단계 및 제2 단계의 결과물을 이용하여 상기 각 입력문서의 각 단락에 대하여 의미 개체 식별, 단락의 유형 분류, 요구사항 단락의 세부 구성 요소 식별을 수행하는 제3 단계(S513) 및 상기 추출된 정보를 상기 각 데이터베이스에 저장하는 제4 단계(S514)를 포함한다.
상기 선박안전법규정 요구사항 추출 및 저장 단계는, 상기 각 입력문서에 대한 전처리 과정을 수행하는 제1 단계(S521)와, 상기 전처리 과정에 따른 텍스트 정보를 분석하기 위해 자연어 처리를 수행하고, 상기 자연어 처리 중 발생한 POS 태그 및 구문분석 오류를 감지하고 수정하는 제2 단계(S522)와, 상기 제1 단계 및 제2 단계의 결과물을 이용하여 상기 각 입력문서의 각 단락에 대하여 의미 개체 식별, 단락의 유형 분류, 요구사항 단락의 세부 구성 요소 식별을 수행하는 제3 단계(S523) 및 상기 추출된 정보를 상기 각 데이터베이스에 저장하는 제4 단계(S524)를 포함한다.
여기서, 상기 건조사양서 요구사항 추출 및 저장 단계 그리고 상기 선박안전법규정 요구사항 추출 및 저장 단계에서의 제2 단계는 주요 선박 유형별로 작성된 어휘 데이터 베이스와 내부 규칙을 활용하여 POS 태그 및 구문분석 오류를 감지하고 보정한다.
그리고 상기 제3 단계의 상기 의미 개체 식별은, 각 토큰에 포함된 단어가 온톨로지에 포함되어 있는 경우 적용되는 온톨로지 조회방식과, POS 태깅, 구문적 태깅, 및 의미적 태깅을 포함하는 조건식을 만족하는 토큰에 대해 미리 지정된 개념으로 태깅하는 패턴기반의 규칙방식을 조합하여 수행한다.
그리고 상기 제3 단계의 단락 유형 분류는, 형태적 측면에서 문장 표현 또는 개조식 표현 등의 단락의 형태와, 내용적 측면에서 Provision Type 및 주요 요구사항그룹과 주요 요구사항을 제외한 기타 그룹으로 나뉘는 단락 유형을 분류한다.
그리고 상기 제3 단계의 요구사항문 구성 요소 식별은, 주요 요구사항그룹에 포함되는 각 단락에 대하여 POS 태그, 의미개체 태그, 구문분석 태그를 이용하여, 적용 조건, 선박설계 및 건조과정에서의 작업 분할 구조(Work Breakdown Structure, WBS)를 기준으로 한 구체적 작업 요소, 해당 작업 요소의 구체적 속성 요소, 속성치를 포함하는 승인 기준(Acceptance Criteria) 등의 구성요소를 각각 식별한다.
상기 요구사항 비교 검증 단계는 상기 리본메뉴를 통한 별개의 서브 인터페이스로의 이동, 주요 제원 표시부를 통한 선박의 주요 제원정보 요약 제공, 검색요건 지정부를 통한 사용자 주도의 복합 검색조건 지정, 요구사항 표시부를 통한 사용자 지정 검색요건에 해당하는 건조사양서 및 선박안전법규정의 주요 요구사항 들을 필터링한 결과 표시 등을 지원한다.
상기 요구사항 표시부는 건조사양서 및 선박안전법규정의 요구사항 비교결과를 바탕으로, 두 입력문서에 모두 포함되는 경우, 하나의 입력문서에만 포함되는 경우, 선박제원 등에 따르면 관계없는 경우 등으로 구분하여 요구사항 앞쪽에 별색으로 구분하여 나타내고, 또한 표시된 건조사양서 또는 선박안전법규정의 특정 요구사항을 클릭시 상기 대상 워드프로세서 실행부에서 해당 요구사항을 포함하는 페이지로 이동하여 해당 단락을 선택해서 표시하는 동기화 표시를 지원한다.
상기 별개의 서브 인터페이스를 통해서는 건조사양서 및 선박안전법규정으로 부터의 정보추출결과에 대한 다양한 분석결과물을 화면 또는 출력물을 이용하여 살펴볼 수 있도록 지원하며, 이에는 각 의미개체, 단락 유형, 요구사항 구성요소 등에 대한 크로스탭 등의 통계적 분석과 각 입력 문서 파일에 해당 정보항목을 유형별로 별색으로 하이라이트한 결과를 포함한다.
도 6은 본 발명에 따른 요구사항 추출 상세 과정을 나타낸 플로우 차트이다.
본 발명에 따른 요구사항 추출 상세 과정은 도 6에서와 같이, 문서가 입력되면(S601), 문서에 포함된 이미지 및 표 개체를 제거하고 이미지 및 표 개체가 제거된 문서의 텍스트에 대한 구조적 특성을 추출하는 전처리과정(S602)과, 토큰화, 문장 분할, 표제어 추출을 위한 제1 자연어 처리 과정(S603)과, 품사 태깅 및 구문 분석 과정을 위한 제2 자연어 처리 과정(S604)과, 어휘 데이터베이스와 통합한 내부 규칙을 활용하여 자연어 처리과정에서 발생하는 잘못된 POS 태그 및 구문분석 결과를 감지 및 수정하기 위한 제3 자연어 처리 과정(S605)을 포함하고, 정보 추출 과정(S606)을 수행할 수 있다.
도 7은 요구사항 추출 과정의 일 예를 나타낸 구성도이다.
본 발명은 온톨로지 및 Rule Set을 이용한 정보추출을 위하여, 온톨로지 구축, POS Tagging 및 교정, Rule 기반 Semantic Annotation, Statement Type 구분, 요구사항별 세부 구성요소 추출 과정을 수행할 수 있다.
도메인 온톨로지 및 여러 Annotation Rule Set은 Plug-In 형태로 활용되어, 전혀 다른 도메인에도 쉽게 커스터마이징될 수 있는 특장점을 갖는다.
이와 같은 본 발명에 따른 자연어처리를 이용한 건조사양서 및 선박안전법규정 요구사항 비교 분석 과정을 더 구체적으로 설명하면 다음과 같다.
먼저, 데이터 입력 단계(1)로, "선박안전 관련 국내외 법규정"을 입력한다.
법규정 및 기준문서들은 보통 많은 분량을 갖지만, 기본적으로 개정되기 전에는 기준문서로서 자연어 처리 기술을 이용한 요구사항을 포함한 정보추출과정을 거쳐 DB화하는 작업을 한번만 처리하면 된다.
이때 국내외 법규정문 및 기준문서를 작성하는 기본적인 틀체계에 기반한 정보추출 Rule들이 활용된다.
데이터 입력 단계(2)로, 선주의 "건조사양서"를 입력한다.
건조사양서는 매 호선마다 각각 선주 측에서 제시하는 수백 또는 수천 페이지의 문서이다. 선박의 종류 및 규모에 따라 분량이 차이가 많이 나는데, 주요 목차구성 등은 틀체계가 있지만, 기술방식은 법규정 체계보다는 조금 더 자유스럽게 작성되는 편이다.
이어, 자연어 처리 과정(3)으로, 위 각각을 조선분야 전문용어들을 포함하는 Ontology 및 각각 여러가지 Rule 들을 활용한 자연어처리 기술을 적용하여, (1)(2)의 각 문서의 주요 내용을 발췌하여, 이를 XML 등 Machine-Understandable Form으로 변환시킨다.
법규정 또는 기준문서의 경우에는 FinTech에서 사용하는 Machine Readable Regulation(MRR) 이란 용어를 쓰기도 한다.
(1)(2)문서들의 내용과 기술방식이 조금 상이하기 때문에, (1)을 대상으로 하는 모듈과 (2)를 대상으로 하는 모듈을 따로 구분하여 처리한다.
법규정은 개정되지 않았으면 한번만 처리해 두면 되지만, (2)문서는 매 호선마다 각각 새로 수행한다.
(1)문서를 처리할 때에는 선박의 제원 등 선박의 특징적인 부분과 관련된 법규정 각 조항에 여러가지 Tagging을 붙여서 나중에 대상 특정 호선과의 관련성여부를 쉽게 걸러질 수 있도록 하는 것이다.
(2)문서를 처리할 때에는 이러한 특징적인 부분을 잘 찾아서 관련 특성치들을 잘 파악하는 것이 중요하다.
그리고 법규정 추출 단계(4)로, (3)의 산출물을 이용하여, 건조사양서에 포함된 선박의 주요 제원정보에 기반한 Rule 등을 활용하여 관련 없는 법규정을 배제하고 난 후, (2)의 두 산출물들을 비교하여, 건조사양서에는 포함되어 있지 않은 법규정 등을 추출한다.
표 1은 각 법규정 또는 기준문서에 대한 정보추출 결과를 이용한 분석보고서의 한 예로, 법규정 또는 기준문서의 문장 유형별로 해당되는 법규정 또는 기준문서의 문장의 빈도수 및 Percentage를 나타낸 것이다.
Figure pat00001
본 발명에 따른 정보추출결과에 대해 도메인 전문가의 보다 수월한 검증을 위해, 사용자 화면 및 엑셀 파일, 그리고 하이라이트된 법규정문서 등 다양한 방식으로 산출하는 구성을 포함한다.
도 8은 선박안전법규정에 대한 정보추출결과를 조회하는 서브 인터페이스의 한 예로, 주요 법규정 각 편(編)별로 의미유형별 해당 의미개체의 등장 빈도를 나타내는 CrossTab 화면의 한 예로, 건조사양서 및 선박안전법규정 각 입력문서에 대한 정보추출 결과에 따라 각 의미유형 및 입력문서의 각 편별로 해당 의미개체의 빈도수 및 Percentage를 나타낸 것이다. 화면 좌측에는 의미유형목록을 나타내며, 선택한 의미유형에 해당하는 드릴다운 분석 내용은 화면 오른쪽에 나타내고 있다.
화면 우측 상단에는 화면 좌측에서 선택한 의미유형에 해당하는 각 의미개체에 대해서 입력문서의 각 편별 빈도수를 크로스탭 형태로 나타내고 있다.
또한, 화면 우측 상단에서 특정 의미개체를 선택할 경우, 화면 우측 하단에서 해당 의미개체의 입력문서의 각 편 별 빈도수를 차트화해서 나타낸 결과이다.
도 9는 선박안전법규정에 대한 정보추출 결과에 따라 추출된 각 의미개체를 해당 의미유형 별로 별색으로 하이라이트한 출력물의 일 예를 나타낸 화면이고, 도 10은 건조사양서에 대한 정보추출 결과에 따라 추출된 각 의미개체를 해당 의미유형 별로 별색으로 하이라이트한 출력물의 일 예를 나타낸 화면이다.
도 11은 선박안전법규정에 대한 정보추출결과를 조회하는 서브 인터페이스의 한 예로, 표 1에 나타낸 법규정 각 편(編) 및 법규정문의 Provision Type별 빈도를 나타내는 크로스탭 분석결과를 조회하는 화면 구성도이다.
상단은 법규정의 각 편(각 열) 및 법규정문 유형(각 행)별 크로스탭 빈도수 분석결과를 표형태로 나타낸 것이고, 하단은 특정 법규정문 유형의 하나로 가장 많은 빈도를 차지하는 의무사항에 해당하는 법규정문에 대해서 법규정의 각 편별 빈도수를 차트로 나타낸 것이다.
도 12는 선박안전법규정에 대한 정보추출결과의 한 예로, 선박안전법규정에 포함된 각 단락별로 Provision Type을 별색으로 하이라이트하여 출력한 결과 화면 구성도이다.
본 발명은 이와 같은 주요 Concept별 용어 정보 추출 및 추출된 용어를 해당 Concept별로 별색으로 Highlight하여 제공할 수 있고, 통합 데이터베이스 구축을 하여 모든 추출정보를 저장한다.
주요 요구사항 추출 및 요구사항 간 상이 내용 비교검증에 관하여 구체적으로 설명하면 다음과 같다.
도 13은 본 발명에 따른 자연어처리기반의 선박건조 사양서 및 선박안전법규정 비교 분석 시스템의 요구사항 비교 검증 모듈의 화면 구성도이다.
기본 사용자 인터페이스 화면의 일 예에서는 도 13에서와 같이, 중앙에 주 사용자 화면이 위치하고, 좌측에 건조사양서 워드프로세서 실행부, 우측에 선박안전법규정 워드프로세서 실행부가 위치할 수 있고, 이로 제한되지 않는다.
주 사용자 화면을 주로 하여 건조사양서 워드프로세서 실행부 및 선박안전법규정 워드프로세서 실행부는 동기화 표시되는 특징을 가지며, 주 사용자 화면에서 사용자가 특정 요구사항을 선택시 해당 워드프로세서 실행부에서 해당 단락을 포함하는 페이지로 이동하여 해당 단락을 선택해서 표시한다.
도 14는 주 사용자 인터페이스 구성도이다.
구체적으로, 주 사용자 인터페이스 상세 구조는 화면상단 왼쪽부터 건조사양서에서 자동추출한 선박 제원정보 표시, 건조사양서에서 자동추출한 주요 용어 및 각각의 빈도수, 사용자가 선택한 용어들의 조합인 검색조건 표시, 해당 검색조건과 연관성이 있는 선박안전법규정문의 종류 표시 항목을 포함한다.
그리고 화면하단의 왼쪽에는 상단의 사용자 선택 용어조합을 포함하는 건조사양서의 요구사항 단락 표시, 오른쪽에는 상단의 사용자 선택 용어조합을 포함하는 선박안전법규정의 요구사항 단락 표시 항목이 위치할 수 있고, 배치 위치 및 표시 항목은 이로 제한되지 않는다.
그리고 화면하단 요구사항 표시부에서 요구사항간 비교검증 결과 표시는 다음과 같은 특징을 갖는다.
좌측 그리드에 표시된 건조사양서 요구사항 각각에 대해, 선박안전법규정문의 요구사항과 부합되는 경우에는 초록색으로 표기하고, 선박안전법규정에는 포함되어 있지 않은 경우에는 붉은색으로 표기할 수 있다.
우측 그리드에 표시된 선박안전법규정 요구사항 각각에 대해, 건조사양서에 해당 요구사항에 부합하는 요구사항이 포함되어 있는 경우 초록색으로 표기하고, 건조사양서에 해당 요구사항에 부합하는 요구사항이 포함되어 있지 않은 경우 붉은색으로 표기하며, 대상 호선의 건조사양서 상의 주요 제원정보를 이용하여 관련성이 없는 경우에는 회색으로 표기할 수 있으며, 이로 제한되지 않는다.
도 15는 사용자 주 인터페이스에서 사용자가 선택한 건조사양서 요구사항에 대해 건조사양서 워드프로세서 실행부에서 동기화화여 해당 단락을 직접 조회할 수 있도록 지원하는 예시 화면 구성도이다.
도 16은 사용자 주 인터페이스에서 사용자가 선택한 선박안전법규정 요구사항에 대해 선박안전법규정 워드프로세서 실행부에서 동기화화여 해당 단락을 직접 조회할 수 있도록 지원하는 예시 화면 구성도이다.
도 15 및 도 16과 같은 화면을 통해서 주 사용자 인터페이스의 요구사항 표시부에서 사용자가 더블클릭한 요구사항에 대해서 건조사양서 또는 선박안전법규정에서 해당하는 원문의 동기화된 조회를 지원한다.
이상에서 설명한 본 발명에 따른 자연어처리를 이용한 건조사양서 및 선박안전법규정 요구사항 비교 분석 시스템 및 방법은 건조사양서의 주요 요구사항 및 대상 호선에 적용되는 선박안전법규정 주요 요구사항 간의 차이점을 체계적으로 비교 검증할 수 있도록 지원하기 위한 것으로, 최신 ICT기술(온톨로지, 정보추출, 지능적 처리 기법 등)을 활용하여, 건조사양서 및 선박안전법규정의 주요 요구사항을 자동으로 추출하고, 이들 간의 차이점을 효율적·효과적·체계적으로 비교 검증할 수 있도록 지원하는 기술 및 S/W시스템을 구축하는 것에 관한 것이다.
이상에서의 설명에서와 같이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 본 발명이 구현되어 있음을 이해할 수 있을 것이다.
그러므로 명시된 실시 예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 하고, 본 발명의 범위는 전술한 설명이 아니라 특허청구 범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
100. 건조사양서 요구사항 추출모듈
110. 건조사양서 요구사항 데이터베이스
200. 선박안전법규정 요구사항 추출모듈
210. 선박안전법규정 요구사항 데이터베이스
300. 요구사항 비교 검증모듈

Claims (17)

  1. 온톨로지 및 내부규칙(Rule Set)을 활용한 자연어처리 기반 정보추출기술을 이용하여 건조사양서에 포함되어 있는 주요 요구사항을 추출하는 건조사양서 요구사항 추출 모듈;
    건조사양서 요구사항 추출 모듈의 추출 결과를 저장하는 건조사양서 요구사항 데이터베이스;
    온톨로지 및 내부규칙(Rule Set)을 활용한 자연어처리 기반 정보추출기술을 이용하여 선박안전법규정에 포함되어 있는 주요 요구사항을 추출하는 선박안전법규정 요구사항 추출 모듈;
    선박안전법규정 요구사항 추출 모듈의 추출 결과를 저장하는 선박안전법규정 요구사항 데이터베이스;
    건조사양서 요구사항 데이터베이스와 선박안전법규정 요구사항 데이터베이스에 포함되어 있는 요구사항들 간의 차이를 분석하는 요구사항 비교 검증 모듈;을 포함하는 것을 특징으로 하는 자연어처리를 이용한 건조사양서 및 선박안전법규정 요구사항 비교 분석 시스템.
  2. 제 1 항에 있어서, 상기 건조사양서 요구사항 추출 모듈과 상기 선박안전법규정 요구사항 추출 모듈은 각각,
    해당 입력 문서 파일들을 대상으로 워드프로세서 소프트웨어에서 제공하는 API를 사용하여 문서파일을 전처리하는 전처리 유닛(preprocessing unit)과,
    공개형 자연어 처리 도구를 컴포넌트 형태로 활용하는 기본적인 자연어 처리(Natural Language Processing, NLP)와 이를 보정하기 위한 확장된 자연어 처리 유닛(Extended NLP unit)과,
    전처리 및 확장된 자연어 처리를 바탕으로 하여 각 해당 입력 문서파일에 포함되어 있는 의미개체, 단락별 유형, 요구사항 단락의 세부 구성요소를 추출하는 정보추출유닛을 포함하는 것을 특징으로 하는 자연어처리를 이용한 건조사양서 및 선박안전법규정 요구사항 비교 분석 시스템.
  3. 제 2 항에 있어서, 상기 전처리 유닛(preprocessing unit)은,
    문서에 포함된 이미지 및 표 개체를 제거하는 넌-텍스트 처리부와,
    이미지 및 표 개체가 제거된 문서의 텍스트에 대한 구조적 특성을 추출하는 텍스트 처리부를 포함하는 것을 특징으로 하는 자연어처리를 이용한 건조사양서 및 선박안전법규정 요구사항 비교 분석 시스템.
  4. 제 2 항에 있어서, 상기 확장된 자연어 처리 유닛은,
    토큰화, 문장 분할, 표제어 추출을 위한 제1 자연어 처리부와,
    품사 태깅 및 구문 분석 과정을 위한 제2 자연어 처리부와,
    어휘 데이터베이스와 통합한 내부 규칙을 활용하여 자연어 처리과정에서 발생하는 잘못된 POS 태그 및 구문분석 결과를 감지 및 수정하기 위한 제3 자연어 처리부를 포함하는 것을 특징으로 하는 자연어처리를 이용한 건조사양서 및 선박안전법규정 요구사항 비교 분석 시스템.
  5. 제 2 항에 있어서, 상기 정보추출유닛은,
    의미 개체 식별을 위한 의미 개체 식별부와,
    문서 각 단락의 유형을 분류하는 단락 유형 분류부와,
    상기 요구사항 단락의 세부 구성 요소를 식별하는 요구사항 구성 요소 식별부를 포함하는 것을 특징으로 하는 자연어처리를 이용한 건조사양서 및 선박안전법규정 요구사항 비교 분석 시스템.
  6. 제 1 항에 있어서, 요구사항 비교 검증 모듈은,
    건조사양서 및 선박안전법규정 요구사항 비교검증 결과를 사용자가 이해하기 쉬운 형태로 제공하는 주 사용자 인터페이스 제공부와,
    주 사용자 인터페이스와 동기화 표시(Synchronized Display)되는 건조사양서 워드프로세서 실행부 및 선박안전법규정문 워드프로세서 실행부를 포함하는 것을 특징으로 하는 자연어처리를 이용한 건조사양서 및 선박안전법규정 요구사항 비교 분석 시스템.
  7. 제 6 항에 있어서, 상기 주 사용자 인터페이스 제공부는,
    별개의 기능을 수행하는 서브 인터페이스로 이동하기 위한 리본메뉴부와,
    선박의 주요 제원을 요약해서 보여주는 주요 제원 표시부와,
    추출된 주요 의미개체 및 요구사항 세부 구성요소에 대하여 사용자 주도의 복합 검색조건을 지정하는 검색요건 지정부와,
    지정된 검색요건에 해당하는 건조사양서 및 선박안전법규정의 주요 요구사항 들을 필터링하여 나타내는 요구사항 표시부를 포함하는 것을 특징으로 하는 자연어처리를 이용한 건조사양서 및 선박안전법규정 요구사항 비교 분석 시스템.
  8. 건조사양서를 입력문서로 하여 건조사양서에 포함된 주요 요구사항을 추출하고 건조사양서 요구사항 데이터베이스에 저장하는 건조사양서 요구사항 추출 및 저장 단계;
    선박안전법규정을 입력문서로 하여 선박안전법규정에 포함된 주요 요구사항을 추출하고 선박안전법규정 요구사항 데이터베이스에 저장하는 선박안전법규정 요구사항 추출 및 저장 단계;
    건조사양서 요구사항 데이터베이스와 선박안전법규정 요구사항 데이터베이스에 포함되어 있는 요구사항들의 차이를 비교 검증하여 분석하는 요구사항 비교 검증 단계;를 포함하는 것을 특징으로 하는 자연어처리를 이용한 건조사양서 및 선박안전법규정 요구사항 비교 분석 방법.
  9. 제 8 항에 있어서, 상기 건조사양서 요구사항 추출 및 저장 단계 및 상기 선박안전법규정 요구사항 추출 및 저장 단계는,
    각 입력문서에 대한 전처리 과정을 수행하는 제1 단계와,
    상기 전처리 과정에 따른 텍스트 정보를 분석하기 위해 자연어 처리를 수행하고, 상기 자연어 처리 중 발생한 POS 태그 및 구문분석 오류를 감지하고 수정하는 제2 단계와,
    상기 제1 단계 및 제2 단계의 결과물을 이용하여 상기 각 입력문서의 각 단락에 대하여 의미 개체 식별, 단락의 유형 분류, 요구사항 단락의 세부 구성 요소 식별을 수행하는 제3 단계 및 상기 추출된 정보를 각 데이터베이스에 저장하는 제4 단계를 포함하는 것을 특징으로 하는 자연어처리를 이용한 건조사양서 및 선박안전법규정 요구사항 비교 분석 방법.
  10. 제 9 항에 있어서, 상기 제2 단계는 주요 선박 유형별로 작성된 어휘 데이터 베이스와 내부 규칙을 활용하여 POS 태그 및 구문분석 오류를 감지하고 보정하는 것을 특징으로 하는 자연어처리를 이용한 건조사양서 및 선박안전법규정 요구사항 비교 분석 방법.
  11. 제 9 항에 있어서, 상기 제3 단계의 상기 의미 개체 식별은,
    각 토큰에 포함된 단어가 온톨로지에 포함되어 있는 경우 적용되는 온톨로지 조회방식과, POS 태깅, 구문적 태깅, 및 의미적 태깅을 포함하는 조건식을 만족하는 토큰에 대해 미리 지정된 개념으로 태깅하는 패턴기반의 규칙방식을 조합하여 수행하는 것을 특징으로 하는 자연어처리를 이용한 건조사양서 및 선박안전법규정 요구사항 비교 분석 방법.
  12. 제 9 항에 있어서, 상기 제3 단계의 단락 유형 분류는,
    형태적 측면에서 문장 표현 또는 개조식 표현 등의 단락의 형태와, 내용적 측면에서 Provision Type 및 주요 요구사항그룹과 주요 요구사항을 제외한 기타 그룹으로 나뉘는 단락 유형을 분류하는 것을 특징으로 하는 자연어처리를 이용한 건조사양서 및 선박안전법규정 요구사항 비교 분석 방법.
  13. 제 9 항에 있어서, 상기 제3 단계의 요구사항문 구성 요소 식별은,
    주요 요구사항그룹에 포함되는 각 단락에 대하여 POS 태그, 의미개체 태그, 구문분석 태그를 이용하여, 적용 조건, 선박설계 및 건조과정에서의 작업 분할 구조(Work Breakdown Structure, WBS)를 기준으로 한 구체적 작업 요소, 해당 작업 요소의 구체적 속성 요소, 속성치를 포함하는 승인 기준(Acceptance Criteria)의 구성요소를 각각 식별하는 것을 특징으로 하는 자연어처리를 이용한 건조사양서 및 선박안전법규정 요구사항 비교 분석 방법.
  14. 제 8 항에 있어서, 상기 요구사항 비교 검증 단계는,
    리본메뉴를 통한 별개의 기능을 수행하는 서브 인터페이스로의 이동, 주요 제원 표시부를 통한 선박의 주요 제원정보 요약 제공, 검색요건 지정부를 통한 사용자 주도의 복합 검색조건 지정, 요구사항 표시부를 통한 사용자 지정 검색요건에 해당하는 건조사양서 및 선박안전법규정의 주요 요구사항 들을 필터링한 결과 표시를 지원하는 것을 특징으로 하는 자연어처리를 이용한 건조사양서 및 선박안전법규정 요구사항 비교 분석 방법.
  15. 제 14 항에 있어서, 요구사항 표시부는 주 사용자 인터페이스를 통하여,
    화면의 제 1 영역에 건조사양서에서 자동추출한 선박 제원정보 표시, 건조사양서에서 자동추출한 주요 용어 및 각각의 빈도수, 사용자가 선택한 용어들의 조합인 검색조건 표시, 해당 검색조건과 연관성이 있는 선박안전법규정문의 종류 표시를 하고,
    화면의 제 2 영역에 사용자 선택 용어조합을 포함하는 건조사양서의 요구사항 단락 표시, 사용자 선택 용어조합을 포함하는 선박안전법규정의 요구사항 단락 표시를 하는 것을 특징으로 하는 자연어처리를 이용한 건조사양서 및 선박안전법규정 요구사항 비교 분석 방법.
  16. 제 14 항에 있어서, 상기 요구사항 표시부는 건조사양서 및 선박안전법규정의 요구사항 비교결과를 바탕으로,
    입력문서에 모두 포함되는 경우, 하나의 입력문서에만 포함되는 경우, 선박제원 등에 따르면 관계없는 경우로 구분하여 요구사항 앞쪽에 별색으로 구분하여 나타내고,
    표시된 건조사양서 또는 선박안전법규정의 특정 요구사항을 클릭시 대상 워드프로세서 실행부에서 해당 요구사항을 포함하는 페이지로 이동하여 해당 단락을 선택해서 표시하는 동기화 표시를 지원하는 것을 특징으로 하는 자연어처리를 이용한 건조사양서 및 선박안전법규정 요구사항 비교 분석 방법.
  17. 제 14 항에 있어서, 별개의 기능을 수행하는 서브 인터페이스를 통해서는 건조사양서 및 선박안전법규정으로부터의 정보추출결과에 대한 분석결과물을 화면 또는 출력물을 이용하여 살펴볼 수 있도록 지원하며,
    이에는 주요 각 의미개체, 단락 유형, 요구사항 구성요소에 대한 크로스탭의 통계적 분석과 각 입력 문서 파일에 해당 정보항목을 유형별로 별색으로 하이라이트한 결과를 포함하는 것을 특징으로 하는 자연어처리를 이용한 건조사양서 및 선박안전법규정 요구사항 비교 분석 방법.
KR1020200188488A 2019-12-31 2020-12-30 자연어처리를 이용한 건조사양서 및 선박안전법규정 요구사항 비교 분석 시스템 및 방법 KR102671799B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20190179237 2019-12-31
KR1020190179237 2019-12-31

Publications (2)

Publication Number Publication Date
KR20210086560A true KR20210086560A (ko) 2021-07-08
KR102671799B1 KR102671799B1 (ko) 2024-06-04

Family

ID=76894284

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200188488A KR102671799B1 (ko) 2019-12-31 2020-12-30 자연어처리를 이용한 건조사양서 및 선박안전법규정 요구사항 비교 분석 시스템 및 방법

Country Status (1)

Country Link
KR (1) KR102671799B1 (ko)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114254648A (zh) * 2021-12-14 2022-03-29 北京构力科技有限公司 语义解析方法、电子设备和计算机程序产品
KR102405092B1 (ko) * 2021-10-06 2022-06-07 한화시스템(주) 완성품 개발을 위한 요구사항 가이드 정보 제공 시스템 및 그 방법
KR20230046491A (ko) * 2021-09-30 2023-04-06 대우조선해양 주식회사 딥러닝 언어모델과 자연어 처리기술을 이용한 프로젝트 스펙정보 분석 및 리스크 예측 방법과 시스템, 및 동 방법을 컴퓨터에서 실행하기 위한 컴퓨터 프로그램이 기록된, 컴퓨터 판독 가능한 기록 매체
KR102522881B1 (ko) * 2021-10-29 2023-04-19 인제대학교 산학협력단 자연어처리를 이용한 상세설계 목적문건별 요구사항 추출 시스템 및 방법
KR20230067371A (ko) * 2021-11-09 2023-05-16 대우조선해양 주식회사 사용자 인터페이스 출력 시스템 및 방법, 동 방법을 컴퓨터에서 실행하기 위한 컴퓨터 프로그램이 기록된, 컴퓨터 판독 가능한 기록 매체

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080004239A (ko) 2006-07-05 2008-01-09 Stx조선주식회사 선박건조상의 품질검사계획 관리 시스템 구축 방법
KR101807608B1 (ko) 2016-07-15 2017-12-11 대우조선해양 주식회사 선박의 국제 협약 규제 정책 위반 판독 시스템 및 그 데이터 구조 및 그 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080004239A (ko) 2006-07-05 2008-01-09 Stx조선주식회사 선박건조상의 품질검사계획 관리 시스템 구축 방법
KR101807608B1 (ko) 2016-07-15 2017-12-11 대우조선해양 주식회사 선박의 국제 협약 규제 정책 위반 판독 시스템 및 그 데이터 구조 및 그 방법

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"안전기준 추출·분석을 위한 프로세스 설계연구", 국립재난안전연구원, 2016년 12월, pp.1-199 1부.* *
김승현 등, "건조사양서 요구사항의 추적을 위한 온톨로지 모델과 제품구조 통합 기초 연구", 대한조선학회논문집, 2011년 6월, Vol.48, No. 3, pp.207-214 1부.* *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230046491A (ko) * 2021-09-30 2023-04-06 대우조선해양 주식회사 딥러닝 언어모델과 자연어 처리기술을 이용한 프로젝트 스펙정보 분석 및 리스크 예측 방법과 시스템, 및 동 방법을 컴퓨터에서 실행하기 위한 컴퓨터 프로그램이 기록된, 컴퓨터 판독 가능한 기록 매체
KR102405092B1 (ko) * 2021-10-06 2022-06-07 한화시스템(주) 완성품 개발을 위한 요구사항 가이드 정보 제공 시스템 및 그 방법
KR102522881B1 (ko) * 2021-10-29 2023-04-19 인제대학교 산학협력단 자연어처리를 이용한 상세설계 목적문건별 요구사항 추출 시스템 및 방법
KR20230067371A (ko) * 2021-11-09 2023-05-16 대우조선해양 주식회사 사용자 인터페이스 출력 시스템 및 방법, 동 방법을 컴퓨터에서 실행하기 위한 컴퓨터 프로그램이 기록된, 컴퓨터 판독 가능한 기록 매체
CN114254648A (zh) * 2021-12-14 2022-03-29 北京构力科技有限公司 语义解析方法、电子设备和计算机程序产品

Also Published As

Publication number Publication date
KR102671799B1 (ko) 2024-06-04

Similar Documents

Publication Publication Date Title
KR102671799B1 (ko) 자연어처리를 이용한 건조사양서 및 선박안전법규정 요구사항 비교 분석 시스템 및 방법
US9053180B2 (en) Identifying common data objects representing solutions to a problem in different disciplines
US20120136862A1 (en) System and method for presenting comparisons of electronic documents
US11126789B2 (en) Method to convert a written procedure to structured data, and related systems and methods
US11158118B2 (en) Language model, method and apparatus for interpreting zoning legal text
US7984047B2 (en) System for extracting relevant data from an intellectual property database
US8601367B1 (en) Systems and methods for generating filing documents in a visual presentation context with XBRL barcode authentication
CN111598702A (zh) 一种基于知识图谱的风险投资语义搜索的方法
CA3138556A1 (en) Apparatuses, storage medium and method of querying data based on vertical search
AU2019265874B2 (en) Systems and methods for document deviation detection
US20210065041A1 (en) Analyzing documents using machine learning
US20220358379A1 (en) System, apparatus and method of managing knowledge generated from technical data
US7853595B2 (en) Method and apparatus for creating a tool for generating an index for a document
US20210232615A1 (en) Systems and method for generating a structured report from unstructured data
CN113407678B (zh) 知识图谱构建方法、装置和设备
US20210174013A1 (en) Information processing apparatus and non-transitory computer readable medium storing program
US20240126981A1 (en) Systems and methods for machine-learning-based presentation generation and interpretable organization of presentation library
CN115098657A (zh) 自然语言转换数据库查询语句的方法、设备及介质
Brito et al. A hybrid AI tool to extract key performance indicators from financial reports for benchmarking
CN107797979B (zh) 分析装置和分析方法
US20180314766A1 (en) Data Processing System, Data Processing Method, and Data Structure
US20230376900A1 (en) Financial documents examination methods and systems
JP2007172260A (ja) 文書ルール作成支援装置および文書ルール作成支援方法並びに文書ルール作成支援プログラム
Vaz Delivering better projects on time by ensuring requirements quality upfront
Tekin et al. Harvest–a System for Creating Structured Rate Filing Data from Filing PDFs

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant