KR20220015228A - 조선 분야의 시공성 문서 검색 시스템 및 방법 - Google Patents

조선 분야의 시공성 문서 검색 시스템 및 방법 Download PDF

Info

Publication number
KR20220015228A
KR20220015228A KR1020200095489A KR20200095489A KR20220015228A KR 20220015228 A KR20220015228 A KR 20220015228A KR 1020200095489 A KR1020200095489 A KR 1020200095489A KR 20200095489 A KR20200095489 A KR 20200095489A KR 20220015228 A KR20220015228 A KR 20220015228A
Authority
KR
South Korea
Prior art keywords
constructability
search
information
document
database
Prior art date
Application number
KR1020200095489A
Other languages
English (en)
Inventor
남경화
Original Assignee
삼성중공업 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성중공업 주식회사 filed Critical 삼성중공업 주식회사
Priority to KR1020200095489A priority Critical patent/KR20220015228A/ko
Publication of KR20220015228A publication Critical patent/KR20220015228A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3347Query execution using vector based model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/532Query formulation, e.g. graphical querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/56Information retrieval; Database structures therefor; File system structures therefor of still image data having vectorial format
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

조선 분야의 시공성 문서 검색 시스템 및 방법이 개시된다. 검색 시스템은, 미리 지정된 정보 단위 기준에 따라 데이터베이스에 미리 저장된 각각의 시공성 문서에 상응하는 시공성 구문 정보와 시공성 이미지 정보를 상기 데이터베이스에 저장하는 파싱부; 미리 기계 학습된 벡터화 모델을 이용하여 상기 시공성 구문 정보에 대한 문장 벡터를 생성하고, 상기 시공성 이미지 정보에 대한 피처 백터를 생성하여 상기 데이터베이스에 각각 저장하는 기계 학습부; 및 검색 텍스트 및 검색 이미지 중 하나 이상을 포함하도록 사용자 장치로부터 수신된 검색 요청의 상기 검색 텍스트에 대한 문장 벡터와 제1 유사도 임계값 이상인 문장 벡터를 가지는 시공성 구문 정보를 상기 데이터베이스에서 검색하고, 검색된 시공성 구문 정보에 상응하는 시공성 문서에 관한 검색 결과를 생성하여 상기 사용자 장치에 제공하는 검색부를 포함한다.

Description

조선 분야의 시공성 문서 검색 시스템 및 방법{Constructability document search system and method for shipbuilding}
본 발명은 조선 분야의 시공성 데이터 검색 시스템 및 방법에 관한 것이다.
일반적으로, 선박을 제작하기 위해서는 수주된 선박의 종류별(상선, 특수선등), 크기별(배수량)등에 따라 영업 설계(초기 설계)를 시작함과 아울러 생산 계획에서 대일정 계획을 수립하게 된다. 영업 설계가 수립되면 상세 설계를 함과 아울러 이에 따른 구매 일정을 수립하고, 다시 상기한 구매 일정과 연동하도록 중일정 계획을 수립하게 된다. 상세 설계 및 중일정 계획이 수립되면, 다시 생산에 필요한 생산 설계를 함과 아울러 생산에 필요한 소일정 계획을 부서별, 공종별로 수립함과 아울러 구매 자재가 입고되고, 생산을 실행하게 되는 것이다.
시공성(Constructability)이란 건물이나 구조물 제작을 추진하면서 기획, 설계, 시공, 유지관리에 이르기까지 이론과 시공 경험, 지식을 최적으로 활용하는 것을 의미한다. 이러한 시공성은 발주처에서 요구하는 사항일 뿐 아니라, 원가경쟁력 확보를 위해 필수적으로 적용되어야 한다.
일반적으로 조선업체에서는 통상의 문서 작성 방법으로 각 부서의 담당자가 시공성 문서를 작성하여 관리하도록 하고 있다. 시공성 문서는 예를 들어 현장에서 발생 가능한 문제 사항을 방지하기 위한 문서, 3D 설계 모델의 작성 단계별 리뷰 사항에 관한 문서 등 다양할 수 있다.
그러나, 각 담당자가 작성한 시공성 문서의 문서 포맷이 서로 상이하고, 1회성으로 작성되어 이용되고 폐기되는 것이 대부분이기 때문에, 기존의 실적 공사 경험이 후속하는 실적 공사에 효과적으로 활용되지 못하는 문제점이 있다.
대한민국 공개특허 제10-2013-0089727호
본 발명은 이전에 수행된 실적 공사 과정에서 생성된 시공성 문서가 저장되어 유지되고, 후속하는 실적 공사 과정에서 검색을 통해 다양하게 활용될 수 있도록 함으로써, 각 담당자의 시수 절감 및 생산 원가 절감을 도모할 수 있는 조선 분야의 시공성 문서 검색 시스템 및 방법을 제공하기 위한 것이다.
본 발명의 이외의 목적들은 하기의 설명을 통해 쉽게 이해될 수 있을 것이다.
본 발명의 일 측면에 따르면, 미리 지정된 정보 단위 기준에 따라 데이터베이스에 미리 저장된 각각의 시공성 문서에 상응하는 시공성 구문 정보와 시공성 이미지 정보를 상기 데이터베이스에 저장하는 파싱부; 미리 기계 학습된 벡터화 모델을 이용하여 상기 시공성 구문 정보에 대한 문장 벡터를 생성하고, 상기 시공성 이미지 정보에 대한 피처 백터를 생성하여 상기 데이터베이스에 각각 저장하는 기계 학습부; 및 검색 텍스트 및 검색 이미지 중 하나 이상을 포함하도록 사용자 장치로부터 수신된 검색 요청의 상기 검색 텍스트에 대한 문장 벡터와 제1 유사도 임계값 이상인 문장 벡터를 가지는 시공성 구문 정보를 상기 데이터베이스에서 검색하고, 검색된 시공성 구문 정보에 상응하는 시공성 문서에 관한 검색 결과를 생성하여 상기 사용자 장치에 제공하는 검색부를 포함하되, 상기 검색 텍스트에 대한 문장 벡터는 상기 기계 학습부에서 생성되는, 조선 분야의 시공성 문서 검색 시스템이 제공된다.
상기 검색 요청이 상기 검색 이미지만을 포함하는 경우, 상기 검색부는, 상기 검색 이미지에 대한 피처 벡터와 제2 유사도 임계값 이상인 피처 벡터를 가지는 시공성 이미지 정보를 상기 데이터베이스에서 1차 검색하고, 1차 검색에 따른 시공성 이미지 정보에 상응하는 시공성 문서의 시공성 구문 정보의 문장 벡터와 제3 유사도 임계값 이상인 문장 벡터를 가지는 시공성 구문 정보를 상기 데이터베이스에서 2차 검색하며, 상기 1차 검색과 상기 2차 검색에서 각각 검색된 시공성 이미지 정보 또는 시공성 구문 정보에 상응하는 시공성 문서에 대한 검색 결과를 생성하여 상기 사용자 장치에 제공하되, 상기 제2 유사도 임계값은 상기 제1 유사도 임계값 및 상기 제3 유사도 임계값에 비해 상대적으로 높게 설정될 수 있다.
상기 검색 요청이 상기 검색 이미지를 더 포함하는 경우, 상기 검색부는, 상기 검색 이미지에 대한 피처 벡터와 제4 유사도 임계값 이상인 피처 벡터를 가지는 시공성 이미지 정보를 상기 데이터베이스에서 검색하고, 검색된 시공성 이미지 정보에 상응하는 시공성 문서가 더 포함되도록 상기 검색 결과를 생성할 수 있다.
상기 기계 학습부는 복수의 시공성 구문 정보들을 각 문장 벡터간의 유사성을 이용하여 그룹핑할 수 있다.
본 발명의 다른 측면에 따르면, 조선 분야의 시공성 문서 검색 방법을 수행하도록 하기 위해 컴퓨터-판독 가능 매체에 저장된 컴퓨터 프로그램으로서, 상기 컴퓨터 프로그램은 컴퓨터로 하여금 이하의 단계들을 수행하도록 하며, 상기 단계들은, 미리 지정된 정보 단위 기준에 따라 데이터베이스에 미리 저장된 각각의 시공성 문서에 상응하는 시공성 구문 정보와 시공성 이미지 정보를 상기 데이터베이스에 저장하는 단계; 미리 기계 학습된 벡터화 모델을 이용하여 상기 시공성 구문 정보에 대한 문장 벡터를 생성하고, 상기 시공성 이미지 정보에 대한 피처 백터를 생성하여 상기 데이터베이스에 각각 저장하는 단계; 사용자 장치로부터 검색 이미지만을 포함하는 검색 요청이 제공되면, 상기 검색 이미지에 대한 피처 벡터와 제1 유사도 임계값 이상인 피처 벡터를 가지는 시공성 이미지 정보를 상기 데이터베이스에서 1차 검색하는 단계; 상기 1차 검색에 따른 시공성 이미지 정보에 상응하는 시공성 문서의 시공성 구문 정보의 문장 벡터와 제2 유사도 임계값 이상인 문장 벡터를 가지는 시공성 구문 정보를 상기 데이터베이스에서 2차 검색하는 단계; 및 상기 1차 검색과 상기 2차 검색에서 각각 검색된 시공성 이미지 정보 또는 시공성 구문 정보에 상응하는 시공성 문서에 대한 검색 결과를 생성하여 상기 사용자 장치에 제공하는 단계를 포함하는, 컴퓨터-판독 가능 매체에 저장된 컴퓨터 프로그램이 제공된다.
전술한 것 외의 다른 측면, 특징, 이점이 이하의 도면, 청구범위 및 발명의 상세한 설명으로부터 명확해질 것이다.
본 발명의 실시예에 따르면, 이전에 수행된 실적 공사 과정에서 생성된 시공성 문서가 저장되어 유지되고, 후속하는 실적 공사 과정에서 검색을 통해 다양하게 활용될 수 있도록 함으로써, 각 담당자의 시수 절감 및 생산 원가 절감을 도모할 수 있는 효과가 있다.
도 1은 본 발명의 일 실시예에 따른 조선 분야의 시공성 문서를 검색 및 제공하는 검색 시스템의 블록 구성도.
도 2는 본 발명의 일 실시예에 따른 기계 학습을 예시한 도면.
도 3은 본 발명의 일 실시예에 따른 검색 텍스트를 이용한 시공성 문서 검색 과정을 설명하기 위한 도면.
도 4는 본 발명의 일 실시예에 따른 검색 이미지를 이용한 시공성 문서 검색 과정을 설명하기 위한 도면.
도 5 및 도 6은 본 발명의 일 실시예에 따른 시공성 문서 검색 방법을 나타낸 순서도.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
참고로, 본 명세서에서 사용되는 제1, 제2 등의 기재는 유사도 임계값 등과 같이 동일하게 표현되는 용어들을 각각 구분하기 위한 것일 뿐, 해당 용어들의 의미나 명칭을 불필요하게 한정하기 위한 것은 아니다.
도 1은 본 발명의 일 실시예에 따른 조선 분야의 시공성 문서를 검색 및 제공하는 검색 시스템의 블록 구성도이고, 도 2는 본 발명의 일 실시예에 따른 기계 학습을 예시한 도면이다. 도 3은 본 발명의 일 실시예에 따른 검색 텍스트를 이용한 시공성 문서 검색 과정을 설명하기 위한 도면이고, 도 4는 본 발명의 일 실시예에 따른 검색 이미지를 이용한 시공성 문서 검색 과정을 설명하기 위한 도면이다.
도 1을 참조하면, 검색 시스템(110)는 각 사용자가 데이터베이스(140)에 저장된 시공성 문서를 검색하여 활용할 수 있도록 지원하는 장치로서, 통신부(112), 파싱부(114), 기계 학습부(116), 검색부(118)를 포함할 수 있다.
여기서, 시공성(Constructability) 문서는 선박 등의 제작을 추진하면서 기획, 설계, 시공, 유지관리에 이르기까지 이론과 시공 경험, 지식을 최적으로 활용하기 위해 다양한 주제와 내용에 대해 작성될 수 있다.
예를 들어, 시공성 문서는 현장에서 발생 가능한 문제 사항을 방지하기 위한 문서, 3D 설계 모델의 작성 단계별 리뷰 사항에 관한 문서 등 다양할 수 있으며, 시공성 문서는 텍스트와 이미지 중 하나 이상을 포함하도록 구성될 수 있다.
통신부(112)는 하나 이상의 사용자 장치와 검색 시스템(110)이 통신망을 통해 접속되도록 한다. 사용자 장치는 예를 들어 컴퓨터, 타블렛피씨, 스마트폰 등과 같이 통신 기능을 구비한 전자 장치일 수 있다.
통신부(112)는 임의의 사용자 장치로부터 시공성 문서의 등록 요청이 수신되면, 등록 요청된 시공성 문서를 데이터베이스(140)에 저장할 수 있고, 임의의 사용자 장치로부터 검색 요청이 수신되면 검색부(118)에 의해 검색된 하나 이상의 시공성 문서를 해당 사용자 장치에 제공할 수 있다.
이하, 구체적으로 설명되는 바와 같이, 파싱부(114) 및 기계 학습부(116)는 데이터베이스(140)에 이미 저장된 시공성 문서에 대한 파싱, 문장 벡터화 등 지정된 처리를 수행할 뿐 아니라, 통신부(112)에 신규 수신된 시공성 문서에 대해서도 지정된 처리를 수행할 수 있다. 파싱부(114) 등에 의해 처리된 정보는 검색부(118) 등에서 이용할 수 있도록 데이터베이스(140)에 저장될 수 있다.
파싱부(114)는 데이터베이스(140)에 저장된 시공성 문서의 텍스트를 추출하여, 미리 지정된 정보 단위로 구분 및 리스트화하여 시공성 단위 정보로 데이터베이스(140)에 저장한다.
이때 시공성 단위 정보에 대한 해석 정보(예를 들어. 후술될 문장 벡터, 피처 벡터 등)가 생성되어 데이터베이스(140)에 더 저장될 수도 있다.
정보 단위는 예를 들어 텍스트인 경우에는 개별 문장, 개별 단락, 소제목들로 각각 구분되는 텍스트 영역 등일 수 있고, 이미지인 경우에는 개별 이미지일 수 있다. 리스트화된 각 시공성 단위 정보는 예를 들어 시공성 문서의 이름, 페이지, 챕터 등의 정보에 대응되도록 저장될 수 있다.
이하, 설명의 편의상 텍스트에 대한 시공성 단위 정보는 시공성 구문 정보라 칭하고, 이미지에 대한 시공성 단위 정보는 시공성 이미지 정보라 칭하기로 한다.
파싱부(114)는 파싱한 시공성 구문 정보에서 개념 구조를 분석하고, 시공성 구문 정보로부터 개념 요소 표현의 단어 및 패턴 분석을 이용하여 시공성 문서의 전체, 시공성 구문 정보 등에 상응하는 분과를 인식하도록 구현될 수도 있다. 시공성 문서 등에 상응하도록 인식된 분과는 예를 들어, 설계, 의장, 구조, 전기, 계장 등의 개별 분과일 수도 있고, 개별 분과들에 공통되는 공통 분과일 수도 있다.
또한, 파싱부(114)는 시공성 구문 정보에 대해, 예를 들어 LDA(Latent Dirichlet Allocation) 알고리즘 등을 이용하여 주제가 되는 단어들의 세트(Set)로 구성되는 토픽을 찾고, 토픽에 가장 확률적으로 기여도가 높은 단어를 선택하여 주제어로 채택하도록 구현될 수도 있다.
아울러, 파싱부(114)는 시공성 문서나 시공성 구문 정보에 포함된 문장들의 상관 관계 분석을 통해 상호간의 관계를 파악하고, 그래프 생성 등을 통해 텍스트랭크가 높은 문장을 선택적으로 취해 요약문을 생성하는 문서 요약 프로세스를 더 수행하도록 구현될 수도 있다.
파싱부(114)가 시공성 문서에 포함된 텍스트를 파싱 처리하여 시공성 구문 정보로 구분하고, 주제어를 선택하며, 요약문을 자동 생성하는 구체적인 방법은 당업자에게 자명한 사항이므로 이에 대한 설명은 생략한다.
기계 학습부(116)는 미리 지정된 기계학습 기법을 이용하여 파싱부(114)에 의해 파싱된 시공성 구문 정보의 각 문장을 순서와 의미를 내포하는 벡터의 형태로 표현되도록 벡터화하여 데이터베이스(140)에 미리 저장한다. 기계 학습부(116)는 데이터베이스(140)에 저장된 시공성 구문 정보의 각 문장을 기계학습을 통해 미리 지정된 차원(예를 들어 300차원)의 벡터 공간에 표현되도록 할 수 있다.
또한, 시공성 문서의 검색을 위해 사용자 장치로부터 수신된 검색 요청에 포함된 검색 텍스트에 대한 파싱부(114)의 파싱 처리가 완료되면, 기계 학습부(116)는 검색 텍스트의 각 문장에 대한 문장 벡터화 등을 수행하게 될 것이다.
기계 학습부(116)는 각 문장을 벡터화하기 위해, 예를 들어 개별적인 단어를 특정한 차원이 벡터(즉, 벡터 공간상의 점)로 매핑하는 단어 임베딩 기법(예를 들어, word2vec 임베딩), 문장에 대한 문장 임베딩 기법(예를 들어, sent2vec 임베딩, doc2vec 임베딩 등) 등을 이용할 수 있다.
기계 학습부(116)가 각 시공성 구문 정보의 문장들을 학습하여 유사한 문장들의 가까운 거리를 가지도록 하는 벡터화 모델을 학습하도록 하기 위해, 도 2에 예시된 바와 같이 다수의 문장들간의 유사 여부에 대한 사용자의 판정 정보(도 2의 Similarity)가 포함된 학습용 데이터가 데이터베이스(140)에 미리 저장될 수 있다. 이러한 학습용 데이터가 미리 저장되면, 기계 학습부(116)는 복수의 문장 각각에 대한 문장 벡터를 생성하고, 사용자의 판정 정보에 기초하여 복수의 문장에 대한 벡터화 모델을 학습할 수 있다. 물론, 기계 학습부(116)가 이미지의 벡터화 모델을 학습하기 위한 학습용 데이터도 데이터베이스(140)에 미리 저장될 수 있을 것이다.
또한, 기계 학습부(116)는 파싱부(114)에 의해 파싱된 각 시공성 구문 정보의 각 문장을 문장 벡터화하고, 문장 전체를 벡터 공간 상의 점으로 표현하는 문장 임베딩(Sentence Embedding) 기법을 적용할 수 있다.
그리고, 기계 학습부(116)는 각 문장을 벡터 공간 상의 점으로 옮겼을 때 의미적으로 유사한 문장들이 유사한 지점에 모이게 되는 특징을 이용하여 복수의 그룹들로 그룹핑할 수 있으며, 그룹핑된 문장들에 대해 미리 지정된 기준에 따라 분류 코드를 부여할 수 있다. 여기서, 그룹핑된 각 문장은 파싱부(114)에 의해 파싱된 각 문장에 대응되도록 관리될 수도 있을 것이다.
일 예로, 기계 학습부(116)는 데이터베이스(140)에 저장된 시공성 구문 정보의 문장들의 문장 벡터를 이용하여 대용량의 데이터들이 고차원 벡터로 표현되고, 검색 요청에 포함된 검색 텍스트의 문장 벡터와 가장 유사한 벡터를 고속으로 찾을 수 있도록 그룹핑하여 저장하기 위해 예를 들어 ANN(Approximate Nearest Neighbors) 기법을 적용할 수 있다. 이와 같이 데이터베이스(140)에 저장된 시공성 구문 정보들이 문장 벡터의 유사성을 참조하여 그룹핑되면, 후술되는 검색부(118)가 검색 요청에 상응하는 시공성 문서를 상대적으로 신속하게 검출할 수 있을 것이다.
기계 학습부(116)가 단어 임베딩 기법, 문장 임베딩 기법 등을 이용한 기계학습을 통해 벡터 공간을 설정하고, 문장을 벡터화하고 그룹화하는 구체적인 방법은 당업자에게 자명한 사항이므로 이에 대한 구체적인 설명은 생략한다.
또한, 기계 학습부(116)는 검색 요청에 검색 이미지가 포함된 경우, 검색 이미지와 유사성을 가지는 시공성 이미지 정보에 상응하는 시공성 문서가 검색될 수 있도록, 데이터베이스(140)에 저장된 시공성 문서의 시공성 이미지 정보에 대한 피처 벡터(feature vector)를 추출하도록 더 학습될 수도 있다. 기계 학습부(116)에 의해 추출된 시공성 문서의 이미지에 대한 피처 벡터는 데이터베이스(140)에 저장될 수 있다.
기계 학습부(116)는 특정 부분이 회전되거나, 확대 혹은 축소되거나 찌그러진 경우 등에도 동일한 피처로 인식할 수 있도록 하기 위해 시공성 문서에 포함된 이미지에서 다양한 피처를 추출하도록 학습될 수 있을 것이다.
이외에도, 시공성 문서 혹은 시공성 구문 정보와, 검색 텍스트 혹은 검색 이미지 간의 유사성을 이용하여 신속한 검색이 가능하도록 하는 학습되는 기계 학습부(116)의 구현 방식은 구글의 버트(BERT) 모델 등 다양할 수 있다.
검색부(118)는 임의의 사용자 장치로부터 통신부(112)를 통해 검색 요청이 제공되면, 검색 요청에 대한 해석 정보와 데이터베이스(140)에 저장된 시공성 단위 정보의 해석 정보간의 유사도를 산출하여, 유사도가 높은 시공성 단위 정보에 상응하는 시공성 문서를 데이터베이스(140)에서 추출하여 검색 결과로 해당 사용자 장치에 제공할 수 있다.
검색부(118)는 예를 들어 코사인 유사도(cosine similarity)를 산출하여 검색 요청에 대한 해석 정보와 데이터베이스(140)에 저장된 시공성 단위 정보의 해석 정보간의 유사도를 판별할 수 있다. 코사인 유사도는 시공성 단위 정보와 검색 요청에 대해 각각 생성된 문장 벡터들 또는 피처 벡터들간의 코사인 각도를 이용하여 유사도를 산출하는 것으로, 예를 들어 0부터 1사이의 값으로 산출되도록 미리 설정될 수 있다.
도 3에 예시된 바와 같이, 검색 텍스트를 포함하는 검색 요청인 경우, 검색부(118)는 검색 텍스트에 대한 문장 벡터를 생성하고, 생성된 문장 벡터를 미리 지정된 벡터 공간 내에 위치시킨다.
이어서, 검색부(118)는 해당 문장 벡터가 벡터 공간상에서 위치되는 점을 포함하도록 그룹핑된 그룹 내에서 해당 문장 벡터와 가장 유사한 복수의 문장 벡터를 추출할 수 있고, 추출된 문장 벡터에 상응하는 시공성 구문 정보에 따른 시공성 문서를 검색 결과로 하여 해당 사용자 장치에 제공할 수 있다.
또한, 도 4에 예시된 바와 같이, 검색 이미지만을 포함하는 검색 요청인 경우, 검색부(118)는 검색 이미지에 대한 피처 벡터를 생성하고, 데이터베이스(140)에 이미 저장된 시공성 이미지 정보들의 피처 벡터와의 유사도를 판별하여 미리 지정된 임계값 이상의 유사도를 가지는 시공성 이미지 정보에 상응하는 시공성 문서를 검색한다(도 4의 (a) 내지 (b) 참조).
그러나, 검색 이미지만을 대상으로 피처 매칭 기법에 따른 유사도 판별에 의해 시공성 문서를 검색하는 경우, 검색된 시공성 문서의 수가 부족하거나 부정확할 수 있다.
따라서, 검색 이미지(예를 들어 현장에서 촬영한 사진)만을 포함하는 검색 요청인 경우, 유사 여부 판별에 대한 임계값을 높게 설정한 후, 검색부(118)가 비교적 정확하게 검색된 시공성 문서를 이용한 추가 검색을 통해 검색 결과를 생성하도록 설정될 수 있다.
즉, 검색부(118)는 검색 이미지에 대해 임계값 이상으로 유사한 시공성 문서를 검색하는 가검색을 우선 수행하고(도 4의 (b) 참조), 가검색된 시공성 문서의 시공성 구문 정보에 대한 문장 벡터와 임계값 이상으로 유사한 시공성 문서를 추가적으로 검색하여 생성한 검색 결과를 해당 사용자 장치에 제공하도록 설정될 수 있다(도 4의 (c) 참조).
전술한 과정들에 의해 생성된 검색 결과에는 시공성 문서를 나타내는 검색 항목이 하나 이상 나열될 수 있으며, 이때 유사도가 상대적으로 높은 시공성 문서가 상단에 위치되도록 검색 항목들이 배열될 수 있다. 사용자가 검색 결과에 포함된 검색 항목들 중 임의의 검색 항목을 선택하면, 상응하는 시공성 문서의 내용이 표시부에 표시될 수 있을 것이다.
도 5 및 도 6은 본 발명의 일 실시예에 따른 시공성 문서 검색 방법을 나타낸 순서도이다.
도 5를 참조하면, 단계 510에서 검색 시스템(110)은 데이터베이스(140)에 미리 저장된 시공성 문서를 미리 지정된 정보 단위 기준에 따라 시공성 단위 정보들로 구분하고, 각 시공성 단위 정보에 대한 해석 정보를 생성한다.
예를 들어, 시공성 문서의 텍스트는 개별 문장, 개별 단락 또는 소제목들로 각각 분리되는 텍스트 영역 등인 시공성 구문 정보로 구분되고, 시공성 문서의 개별 이미지는 시공성 이미지 정보로 구분될 수 있다.
문장과 이미지 각각에 대한 벡터를 생성하도록 기계 학습된 벡터화 모델을 이용하여, 시공성 구문 정보의 각 문장은 해석 정보로서 문장 벡터가 생성될 수 있고, 시공성 이미지 정보는 해석 정보로서 피처 벡터가 생성될 수 있다.
단계 520에서, 검색 시스템(110)은 임의의 사용자 장치로부터 시공성 문서의 검색을 위한 검색 요청을 수신한다.
단계 530에서, 검색 시스템(110)은 검색 요청이 검색 이미지만을 포함하는지 여부를 판단한다.
만일 검색 이미지만을 포함하는 검색 요청이 아니라면, 검색 시스템(110)은 단계 540에서 검색 텍스트만을 포함하는 검색 요청인지 여부를 판단한다.
만일 검색 텍스트만을 포함하는 검색 요청이라면, 단계 550에서, 검색 시스템(110)은 검색 요청에 포함된 검색 텍스트에 대한 문장 벡터를 산출하고, 검색 텍스트의 문장 벡터와 제1 유사도 임계값 이상의 유사도를 가지는 문장 벡터에 상응하는 시공성 구문 정보를 데이터베이스(140)에서 추출한다.
이어서, 추출된 시공성 구문 정보에 상응하는 시공성 문서에 대한 검색 결과를 생성하여 해당 사용자 장치로 제공한다.
여기서, 검색 텍스트의 문장 벡터와 시공성 구문 정보의 문장 벡터간의 유사도는 예를 들어 코사인 유사도로 산출될 수 있다.
그러나, 단계 540의 판단 결과로, 만일 검색 요청이 검색 텍스트와 검색 이미지를 모두 포함하는 경우라면, 단계 560에서, 검색 시스템(110)은 검색 텍스트에 대한 문장 벡터를 산출하고, 검색 텍스트의 문장 벡터와 제2 유사도 임계값 이상의 유사도를 가지는 문장 벡터에 상응하는 시공성 구문 정보를 데이터베이스(140)에서 추출한다.
또한, 검색 시스템(110)은 검색 이미지의 피처 벡터와 제3 유사도 임계값 이상의 유사도를 가지는 피처 벡터에 상응하는 시공성 이미지 정보를 피처 벡터에 상응하는 시공성 구문 정보를 데이터베이스(140)에서 추출한다.
이어서, 검색 시스템(110)은 검색 텍스트 및 검색 이미지와 지정된 유사도 임계값을 만족하는 시공성 구문 정보 또는 시공성 이미지 정보에 상응하는 시공성 문서에 대한 검색 결과를 생성하여 해당 사용자 장치로 제공한다.
또한, 전술한 단계 530의 판단 결과로 만일 검색 이미지만을 포함하는 검색 요청이라면, 단계 610에서, 검색 시스템(110)은 검색 요청에 포함된 검색 이미지에 대한 피처 벡터를 산출한다.
이어서, 검색 시스템(110)은 검색 이미지의 피처 벡터와 제4 유사도 임계값 이상의 유사도를 가지는 피처 벡터에 상응하는 시공성 이미지 정보를 데이터베이스(140)에서 추출하고, 추출된 시공성 이미지 정보에 상응하는 시공성 문서를 인식하는 가검색을 수행한다.
이때, 검색 이미지와 최대한 유사한 시공성 이미지 정보가 추출될 수 있도록 제4 유사도 임계값은 제1 내지 제3 유사도 임계값에 비해 상대적으로 높게 설정될 수 있다.
단계 620에서, 검색 시스템(110)은 가검색된 시공성 문서에 상응하도록 데이터베이스(140)에 저장된 문장 벡터와 제5 유사도 임계값 이상의 유사도를 가지는 문장 벡터에 상응하는 시공성 구문 정보를 데이터베이스(140)에서 추출한다. 이어서, 가검색된 시공성 문서와 추출된 시공성 구문 정보에 상응하는 시공성 문서에 대한 검색 결과를 생성하여 해당 사용자 장치로 제공한다.
이와 같이, 본 실시예에 따른 조선 분야의 시공성 문서 검색 시스템 및 방법은 이전에 수행된 실적 공사 과정에서 생성된 시공성 문서가 저장되어 유지되고, 후속하는 실적 공사 과정에서 검색을 통해 다양하게 활용될 수 있도록 하는 특징이 있다.
상술한 시공성 문서 검색 방법은 디지털 처리 장치에 내장된 소프트웨어 프로그램, 어플리케이션 등으로 구현되어 시계열적 순서에 따른 자동화된 절차로 수행될 수도 있음은 당연하다. 상기 프로그램 등을 구성하는 코드들 및 코드 세그먼트들은 당해 분야의 컴퓨터 프로그래머에 의하여 용이하게 추론될 수 있다. 또한, 상기 프로그램은 컴퓨터가 읽을 수 있는 정보저장매체(computer readable media)에 저장되고, 컴퓨터에 의하여 읽혀지고 실행됨으로써 상기 방법을 구현한다.
상기에서는 본 발명의 실시예를 참조하여 설명하였지만, 해당 기술 분야에서 통상의 지식을 가진 자라면 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.
110 : 검색 시스템 112 : 통신부
114 : 파싱부 116 : 기계학습부
118 : 검색부 140 : 데이터베이스

Claims (5)

  1. 미리 지정된 정보 단위 기준에 따라 데이터베이스에 미리 저장된 각각의 시공성 문서에 상응하는 시공성 구문 정보와 시공성 이미지 정보를 상기 데이터베이스에 저장하는 파싱부;
    미리 기계 학습된 벡터화 모델을 이용하여 상기 시공성 구문 정보에 대한 문장 벡터를 생성하고, 상기 시공성 이미지 정보에 대한 피처 백터를 생성하여 상기 데이터베이스에 각각 저장하는 기계 학습부; 및
    검색 텍스트 및 검색 이미지 중 하나 이상을 포함하도록 사용자 장치로부터 수신된 검색 요청의 상기 검색 텍스트에 대한 문장 벡터와 제1 유사도 임계값 이상인 문장 벡터를 가지는 시공성 구문 정보를 상기 데이터베이스에서 검색하고, 검색된 시공성 구문 정보에 상응하는 시공성 문서에 관한 검색 결과를 생성하여 상기 사용자 장치에 제공하는 검색부를 포함하되,
    상기 검색 텍스트에 대한 문장 벡터는 상기 기계 학습부에서 생성되는, 조선 분야의 시공성 문서 검색 시스템.
  2. 제1항에 있어서,
    상기 검색 요청이 상기 검색 이미지만을 포함하는 경우, 상기 검색부는,
    상기 검색 이미지에 대한 피처 벡터와 제2 유사도 임계값 이상인 피처 벡터를 가지는 시공성 이미지 정보를 상기 데이터베이스에서 1차 검색하고, 1차 검색에 따른 시공성 이미지 정보에 상응하는 시공성 문서의 시공성 구문 정보의 문장 벡터와 제3 유사도 임계값 이상인 문장 벡터를 가지는 시공성 구문 정보를 상기 데이터베이스에서 2차 검색하며, 상기 1차 검색과 상기 2차 검색에서 각각 검색된 시공성 이미지 정보 또는 시공성 구문 정보에 상응하는 시공성 문서에 대한 검색 결과를 생성하여 상기 사용자 장치에 제공하되,
    상기 제2 유사도 임계값은 상기 제1 유사도 임계값 및 상기 제3 유사도 임계값에 비해 상대적으로 높게 설정되는, 조선 분야의 시공성 문서 검색 시스템.
  3. 제1항에 있어서,
    상기 검색 요청이 상기 검색 이미지를 더 포함하는 경우, 상기 검색부는,
    상기 검색 이미지에 대한 피처 벡터와 제4 유사도 임계값 이상인 피처 벡터를 가지는 시공성 이미지 정보를 상기 데이터베이스에서 검색하고, 검색된 시공성 이미지 정보에 상응하는 시공성 문서가 더 포함되도록 상기 검색 결과를 생성하는, 조선 분야의 시공성 문서 검색 시스템.
  4. 제1항에 있어서,
    상기 기계 학습부는 복수의 시공성 구문 정보들을 각 문장 벡터간의 유사성을 이용하여 그룹핑하는, 조선 분야의 시공성 문서 검색 시스템.
  5. 조선 분야의 시공성 문서 검색 방법을 수행하도록 하기 위해 컴퓨터-판독 가능 매체에 저장된 컴퓨터 프로그램으로서, 상기 컴퓨터 프로그램은 컴퓨터로 하여금 이하의 단계들을 수행하도록 하며, 상기 단계들은,
    미리 지정된 정보 단위 기준에 따라 데이터베이스에 미리 저장된 각각의 시공성 문서에 상응하는 시공성 구문 정보와 시공성 이미지 정보를 상기 데이터베이스에 저장하는 단계;
    미리 기계 학습된 벡터화 모델을 이용하여 상기 시공성 구문 정보에 대한 문장 벡터를 생성하고, 상기 시공성 이미지 정보에 대한 피처 백터를 생성하여 상기 데이터베이스에 각각 저장하는 단계;
    사용자 장치로부터 검색 이미지만을 포함하는 검색 요청이 제공되면, 상기 검색 이미지에 대한 피처 벡터와 제1 유사도 임계값 이상인 피처 벡터를 가지는 시공성 이미지 정보를 상기 데이터베이스에서 1차 검색하는 단계;
    상기 1차 검색에 따른 시공성 이미지 정보에 상응하는 시공성 문서의 시공성 구문 정보의 문장 벡터와 제2 유사도 임계값 이상인 문장 벡터를 가지는 시공성 구문 정보를 상기 데이터베이스에서 2차 검색하는 단계; 및
    상기 1차 검색과 상기 2차 검색에서 각각 검색된 시공성 이미지 정보 또는 시공성 구문 정보에 상응하는 시공성 문서에 대한 검색 결과를 생성하여 상기 사용자 장치에 제공하는 단계를 포함하는, 컴퓨터-판독 가능 매체에 저장된 컴퓨터 프로그램.
KR1020200095489A 2020-07-30 2020-07-30 조선 분야의 시공성 문서 검색 시스템 및 방법 KR20220015228A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200095489A KR20220015228A (ko) 2020-07-30 2020-07-30 조선 분야의 시공성 문서 검색 시스템 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200095489A KR20220015228A (ko) 2020-07-30 2020-07-30 조선 분야의 시공성 문서 검색 시스템 및 방법

Publications (1)

Publication Number Publication Date
KR20220015228A true KR20220015228A (ko) 2022-02-08

Family

ID=80252378

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200095489A KR20220015228A (ko) 2020-07-30 2020-07-30 조선 분야의 시공성 문서 검색 시스템 및 방법

Country Status (1)

Country Link
KR (1) KR20220015228A (ko)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130089727A (ko) 2011-12-29 2013-08-13 현대중공업 주식회사 선박의 설계정보 통합관리방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130089727A (ko) 2011-12-29 2013-08-13 현대중공업 주식회사 선박의 설계정보 통합관리방법

Similar Documents

Publication Publication Date Title
CN111753060B (zh) 信息检索方法、装置、设备及计算机可读存储介质
CN109635273B (zh) 文本关键词提取方法、装置、设备及存储介质
US20220261427A1 (en) Methods and system for semantic search in large databases
US9218364B1 (en) Monitoring an any-image labeling engine
US9037600B1 (en) Any-image labeling engine
CN112667794A (zh) 一种基于孪生网络bert模型的智能问答匹配方法及系统
CN111767716B (zh) 企业多级行业信息的确定方法、装置及计算机设备
CN112800170A (zh) 问题的匹配方法及装置、问题的回复方法及装置
US11023503B2 (en) Suggesting text in an electronic document
US9483740B1 (en) Automated data classification
CN111190997A (zh) 一种使用神经网络和机器学习排序算法的问答系统实现方法
CN107767273B (zh) 基于社交数据的资产配置方法、电子装置及介质
CN110928961A (zh) 一种多模态实体链接方法、设备及计算机可读存储介质
CN113627797B (zh) 入职员工画像生成方法、装置、计算机设备及存储介质
CN111078835A (zh) 简历评估方法、装置、计算机设备及存储介质
US9516089B1 (en) Identifying and processing a number of features identified in a document to determine a type of the document
CN110795942A (zh) 基于语义识别的关键词确定方法、装置和存储介质
CN104462083A (zh) 用于内容比较的方法、装置和信息处理系统
US11403339B2 (en) Techniques for identifying color profiles for textual queries
JP2016110256A (ja) 情報処理装置及び情報処理プログラム
CN117077679A (zh) 命名实体识别方法和装置
JP6696344B2 (ja) 情報処理装置及びプログラム
KR20220015228A (ko) 조선 분야의 시공성 문서 검색 시스템 및 방법
CN115203445A (zh) 多媒体资源搜索方法、装置、设备及介质
CN111753861B (zh) 主动学习自动图像标注系统及方法