KR102363131B1 - 도식화된 질의 구성 방식을 이용한 전문가시스템에서의 다차원 지식 검색 방법 및 시스템 - Google Patents

도식화된 질의 구성 방식을 이용한 전문가시스템에서의 다차원 지식 검색 방법 및 시스템 Download PDF

Info

Publication number
KR102363131B1
KR102363131B1 KR1020190004445A KR20190004445A KR102363131B1 KR 102363131 B1 KR102363131 B1 KR 102363131B1 KR 1020190004445 A KR1020190004445 A KR 1020190004445A KR 20190004445 A KR20190004445 A KR 20190004445A KR 102363131 B1 KR102363131 B1 KR 102363131B1
Authority
KR
South Korea
Prior art keywords
query
search
blocks
block
input
Prior art date
Application number
KR1020190004445A
Other languages
English (en)
Other versions
KR20190086395A (ko
Inventor
김선중
전민제
Original Assignee
(주)호모미미쿠스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)호모미미쿠스 filed Critical (주)호모미미쿠스
Publication of KR20190086395A publication Critical patent/KR20190086395A/ko
Application granted granted Critical
Publication of KR102363131B1 publication Critical patent/KR102363131B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

도식화된 질의 구성 방식을 이용한 전문가시스템에서의 다차원 지식 검색 방법 및 시스템이 개시된다. 본 발명의 일 실시예에 따른 다차원 지식 검색 시스템은 도식 쿼리 입력부를 포함하는 사용자 단말과, 쿼리 구문 분석부, 검색 문맥 분석부, 검색 요청부를 포함하는 쿼리 분석 시스템과, 유사성 평가부를 포함하는 지식 기반 시스템을 포함하며, 다차원의 지식 기반을 갖추고 있는 전문가시스템에서, 해당 전문가시스템의 사용자가, 자신이 처한 문제 상황에 적합한 질의문을 도식화된 도형들의 조합으로써 쉽게 표현하여 검색창에 시각적으로 입력할 수 있게 한다.

Description

도식화된 질의 구성 방식을 이용한 전문가시스템에서의 다차원 지식 검색 방법 및 시스템{Multi-dimensional knowledge searching method and system for expert systems}
본 발명은 도식화된 질의 구성 방식을 이용한 전문가시스템에서의 다차원 지식 검색 방법 및 시스템에 관한 것이다.
인공지능 및 기계학습 기술의 발달과 더불어 방대한 지식 기반을 갖춘 전문가시스템의 구현 및 상용화의 기대도 높아지고 있다. 일례로 신약개발에 활용할 수 있는 후보 화합물들을 찾아내는 인공지능 기반의 전문가시스템이 미국의 '왓슨' 및 한국의 '스탠다임' 등의 실제 서비스의 형태로 구현되고 있다. 이러한 전문가시스템은 화합물들의 데이터베이스 및 질병-화합물 상호작용 관계 데이터베이스 등의 지식기반 위에서 작동한다. 해당 전문가시스템의 사용자는 알맞은 질의를 '문장' 및 '키워드(타겟 질병)'의 형태로 입력하고, 해당 전문가시스템은 해당 타겟 질병의 해소에 사용할 수 있을법한 후보 화합물(Candidate Compounds)들을 생성 및 검증하여 사용자들에게 제공한다. 검색 단가는, 가장 저렴한 시스템이 타겟 질병 1개 검색 당 USD20,000를 청구할 정도로 상당히 고가이다. 그럼에도 불구하고, 신약 개발에 소모되는 천문학적인 예산을 대폭 줄여줄 수 있는 까닭에 수많은 국내외 제약 회사들이 앞다투어 해당 전문가시스템 들을 이미 도입했거나 도입할 계획에 있다.
전문가시스템은 전문적인 지식기반(Knowledge base) 위에서 작동하는데, 지식기반들은 대체로 다차원의 데이터 구조(Multi-dimensional Data Structure)를 갖추고 있다. 예로 든 신약개발을 위한 후보 화합물 도출의 전문가시스템의 경우, <질병 데이터> - <약효 데이터> - <독성 관계 데이터> - <화합물 데이터> - <생물개체 데이터> - <단백질 데이터> 등 다차원의 데이터 레이어(Layer, 계층)를 가지고 있다. 타겟 질병에 효과가 있을 법한 후보 화합물을 찾아내도록 일방적으로 명령하는 기존의 단일 검색 상황의 경우에는, 이미 검색 규칙(Rule)이 강건하게 조직되어 있으므로, 키워드 형태의 단순한 질의어가 적합할 수 있다. 하지만, 만일 복잡한 고려사항들이 수반되어야 할 경우 등 복수개의 검색 상황에 응대할 수 있는 전문가시스템을 구현하기 위해서는, 예를 들어 '특정 약효를 가지는 효소를 갖추고 있는 생물개체를 탐색하라' 등, 검색 규칙(Rule)들이 문맥에 맞게 새롭게 조합되어야 하는 검색 상황에는, 사용자 입장에서는 해당 문맥을 반영하는 질의문을 문장으로 구성해내기가 어렵고, 또한 쿼리의 구문을 분석해내는 전문가시스템의 입장에서도 문장의 형태로 구성된 질의문이 갖는 중의성을 배제할 수 없기 때문에 검색 결과의 정확성 확보에 어려움을 가질 수 밖에 없다.
한국공개특허 제10-2006-0054977호 (2006.05.23 공개) - 전문가 시스템의 지식 베이스 구축 방법, 이에 적합한장치, 그리고 기록 매체
본 발명은 다차원의 지식 기반을 갖추고 있는 전문가시스템에서, 해당 전문가시스템의 사용자가, 자신이 처한 문제 상황에 적합한 질의문을 도식화된 도형들의 조합으로써 쉽게 표현하여 검색창에 시각적으로 입력할 수 있는 도식화된 질의 구성 방식을 이용한 전문가시스템에서의 다차원 지식 검색 방법 및 시스템을 제공하기 위한 것이다.
본 발명의 이외의 목적들은 하기의 설명을 통해 쉽게 이해될 수 있을 것이다.
본 발명의 일 측면에 따르면, 도식화된 질의 구성 방식을 이용한 전문가시스템에서의 다차원 지식 검색 시스템은 도식 쿼리 입력부를 포함하는 사용자 단말과, 쿼리 구문 분석부, 검색 문맥 분석부, 검색 요청부를 포함하는 쿼리 분석 시스템과, 유사성 평가부를 포함하는 지식 기반 시스템을 포함하며, 다차원의 지식 기반을 갖추고 있는 전문가시스템에서, 해당 전문가시스템의 사용자가, 자신이 처한 문제 상황에 적합한 질의문을 도식화된 도형들의 조합으로써 쉽게 표현하여 검색창에 시각적으로 입력할 수 있게 한다.
본 실시예에서 도식화된 질의 구성 방식을 이용한 전문가시스템에서의 다차원 지식 검색 시스템은, 블록들과 연결선으로 이루어진 도식화된 쿼리를 입력받는 도식 쿼리 입력부와, 상기 도식화된 쿼리에 상응하는 검색 결과를 출력하는 결과 출력부를 포함하는 사용자 단말; 상기 도식화된 쿼리의 문맥을 분석하고, 상기 블록들과 상기 연결선으로부터 상기 블록들 간의 인과관계를 유추하여 검색 쿼리를 생성하고 유사도 평가를 요청하는 쿼리 분석 시스템; 및 생물체 각각에 대해 물리적 관계, 생태학적 관계와 생물학적 관계로 특정된 정보인 생물학적 체계 정보를 미리 생성하여 저장하고 관리하며, 상기 검색 쿼리에 상응하여 높은 유사도를 가지는 생물학적 체계 정보를 탐색하여 상기 사용자 단말로 전송하는 지식 기반 시스템을 포함하는, 다차원 지식 검색 시스템이 제공된다.
상기 도식 쿼리 입력부는 상기 블록 및 상기 연결선을 자유롭게 배치하고 수정할 수 있는 캔버스를 포함하며, 상기 블록에는 서브젝트(Subject) 블록, 액션(Action) 블록, 상 변화(State Change) 블록, 인풋/아웃풋(Input/Output) 블록 중 하나 이상이 포함될 수 있다.
상기 서브젝트 블록은 진출하는 화살표가 연결되는 1개의 우측 노드를 가지며, 상기 액션 블록은 진입하는 화살표가 연결되는 좌측 노드 및 진출하는 화살표가 연결되는 우측 노드를 가지고, 상기 상 변화 블록은 위에 사전 상태가 기입되고 아래에 사후 상태가 기입되며 진입하는 화살표가 연결되는 좌측상단 노드 및 진출하는 화살표가 연결되는 우측하단 노드를 가지며, 상기 인풋/아웃풋 블록은 진입하는 화살표가 연결되는 상단 노드 및 진출하는 화살표가 연결되는 하단 노드를 가질 수 있다.
상기 도식 쿼리 입력부는 상기 캔버스를 통해 2개 이상의 서브젝트 블록을 포함하는 제품 지향(Product Oriented) 템플릿, 1개 이상의 서브젝트 블록 및 1개 이상의 액션 블록을 포함하는 직접 유추(Direct Analogy) 템플릿, 1개 이상의 상 변화 블록과 1개 이상의 액션 블록을 포함하는 목적 지향(Goal Oriented) 템플릿, 1개 이상의 상 변화 블록을 포함하는 시스템 모방(System Mimicking) 템플릿, 2개 이상의 액션 블록을 포함하는 전략 모방(Strategy Mimicking) 템플릿, 2개 이상의 인풋/아웃풋 블록을 포함하는 인풋 지향(Input Oriented) 템플릿, 1개 이상의 서브젝트 블록 및 1개 이상의 액션 블록을 포함하는 역 유추(Inverse Analogy) 템플릿, 2개 이상의 인풋/아웃풋 블록을 포함하는 아웃풋 지향(Output Oriented) 템플릿 중 하나 이상의 템플릿과, 1개의 자유모드(Sandbox Mode)를 제공할 수 있다.
상기 쿼리 분석 시스템은, 상기 도식화된 쿼리의 구성요소들이 가지는 조합을 분석하여 적합한 시나리오로 매핑하는 검색 문맥 분석부와; 상기 도식화된 쿼리에 포함된 상기 블록들에 색인한 값을 구문 분석하여 상기 검색 쿼리로 변경하는 쿼리 구문 분석부와; 상기 검색 쿼리를 상기 지식 기반 시스템에 전송하며 검색을 요청하는 검색 요청부를 포함할 수 있다.
상기 검색 쿼리는 현재상황(current state)과 기대결과(expected result) 중 하나 이상이 포함되도록 기술될 수 있다.
상기 지식 기반 시스템은 상기 검색 쿼리에서 상기 현재상황과 상기 기대결과에 대한 토큰을 추출하고, 추출된 토큰들을 이용하여 상기 현재상황에 대한 제1 묶음 데이터셋과 상기 기대결과에 대한 제2 묶음 데이터셋 중 하나 이상을 생성하고, 미리 지정된 규칙에 따라 생성한 옵션값을 이용하여 인과모형 데이터베이스에 저장된 생물학적 체계 정보와의 유사성 평가를 수행하여 일정 수준 이상으로 유사한 생물학적 체계 정보를 탐색하는 유사성 평가부를 포함할 수 있다.
상기 생물학적 체계 정보는 상태 변화(CoS) 요소, 물리적 현상(PPH) 요소, 물리적 효과(PEF) 요소, 인풋(Input) 요소, 생태학적 현상(EPH) 요소, 생태학적 행동(EBH) 요소, 기관(Organ) 요소, 조직(Part) 요소, 엔티티(Entity) 요소 및 액션(Action)인 노드(node)들 각각에 대해 미리 지정된 규칙에 따라 하나 이상의 어휘가 색인되어 구조화된 정보일 수 있다.
전술한 것 외의 다른 측면, 특징, 이점이 이하의 도면, 특허청구범위 및 발명의 상세한 설명으로부터 명확해질 것이다.
본 발명의 실시예에 따르면, 다차원의 지식 기반을 갖추고 있는 전문가시스템에서, 해당 전문가시스템의 사용자가, 자신이 처한 문제 상황에 적합한 질의문을 도식화된 도형들의 조합으로써 쉽게 표현하여 검색창에 시각적으로 입력할 수 있는 효과가 있다.
도 1은 본 발명의 일 실시예에 따른 도식화된 질의 구성 방식을 이용한 전문가시스템에서의 다차원 지식 검색 시스템의 구성 블록도,
도 2는 캔버스의 기본 구성을 나타낸 도면,
도 3은 최초 접속 시 캔버스 화면을 나타낸 도면,
도 4는 블록이 내포하는 데이터의 속성 유추 과정을 나타낸 도면,
도 5 및 도 6은 인과관계 구조의 패턴화 및 유사 패턴 탐색 과정을 나타낸 도면,
도 7은 본 발명의 일 실시예에 따른 생물학적 체계 정보를 구성하기 위한 인과관계에 기인한 온톨로지 구조를 예시한 도면,
도 8은 검색 쿼리를 재구성하는 과정을 나타낸 순서도,
도 9는 유사 매트릭스와 부(sub) 유사 매트릭스의 구성을 예시한 도면,
도 10 내지 도 12는 본 발명의 일 실시예에 따른 다차원 지식 검색 시스템에 적용된 캔버스의 다른 예시를 나타낸 도면,
도 13은 다차원 지식 검색 결과의 출력 화면에 대한 예시도.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세하게 설명하고자 한다. 그러나 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다.
본 명세서에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
또한, 각 도면을 참조하여 설명하는 실시예의 구성 요소가 해당 실시예에만 제한적으로 적용되는 것은 아니며, 본 발명의 기술적 사상이 유지되는 범위 내에서 다른 실시예에 포함되도록 구현될 수 있으며, 또한 별도의 설명이 생략될지라도 복수의 실시예가 통합된 하나의 실시예로 다시 구현될 수도 있음은 당연하다.
또한, 첨부 도면을 참조하여 설명함에 있어, 도면 부호에 관계없이 동일한 구성 요소는 동일하거나 관련된 참조부호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 본 발명을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.
또한, 명세서에 기재된 "…부", "…유닛", "…모듈", "…기" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다.
도 1은 본 발명의 일 실시예에 따른 도식화된 질의 구성 방식을 이용한 전문가시스템에서의 다차원 지식 검색 시스템의 구성 블록도이고, 도 2는 캔버스의 기본 구성을 나타낸 도면이며, 도 3은 최초 접속 시 캔버스 화면을 나타낸 도면이고, 도 4는 블록이 내포하는 데이터의 속성 유추 과정을 나타낸 도면이며, 도 5 및 도 6은 인과관계 구조의 패턴화 및 유사 패턴 탐색 과정을 나타낸 도면이고, 도 7은 본 발명의 일 실시예에 따른 생물학적 체계 정보를 구성하기 위한 인과관계에 기인한 온톨로지 구조를 예시한 도면이며, 도 8은 검색 쿼리를 재구성하는 과정을 나타낸 순서도이고, 도 9는 유사 매트릭스와 부(sub) 유사 매트릭스의 구성을 예시한 도면이며, 도 10 내지 도 12는 본 발명의 일 실시예에 따른 다차원 지식 검색 시스템에 적용된 캔버스의 다른 예시를 나타낸 도면이고, 도 13은 다차원 지식 검색 결과의 출력 화면에 대한 예시도이다.
본 발명의 일 실시예에 따른 도식화된 질의 구성 방식을 이용한 전문가시스템에서의 다차원 지식 검색 시스템에 의하면, 다차원의 데이터구조를 질의문에 직접 반영하여, 각 차원에 따른 질의문 복수개를 별도로 작성하여 검색을 요청하면, 전문가시스템들이 복수개의 검색 상황에 쉽게 응대할 수 있게 되고, 복잡한 문맥을 문장이나 전문가용 검색식으로 꾸며내야 하는 사용자들의 수고로움을 크게 덜어줄 수 있으며, 문장 형식의 질의문이 갖는 중의성이 검색 정확도에 미치는 악영향도 크게 해소할 수 있다.
도 1을 참조하면, 도식화된 질의 구성 방식을 이용한 전문가시스템에서의 다차원 지식 검색 시스템(100)은 사용자 단말(110), 쿼리 분석 시스템(120), 지식 기반 시스템(130)을 포함하고 있다.
사용자 단말(110)은 다차원 지식 검색을 이용하고자 하는 사용자가 소지한 단말 장치이다. 도식화된 질의 구성 방식을 이용한 전문가시스템에서의 다차원 지식 검색 서비스용 소프트웨어(혹은 어플리케이션)가 실행될 수 있는 운영체제(OS)가 탑재된 컴퓨팅 장치로서, 예를 들어, 컴퓨터, 랩탑, 태블릿 PC, 스마트폰 등일 수 있다.
사용자 단말(110)은 사용자가 검색하고자 하는 지식에 관련된 질의를 입력받는 도식 쿼리 입력부(111)와, 질의에 상응하여 검색된 지식 결과를 출력하는 결과 출력부(113)를 포함한다. 도식 쿼리 입력부(111)는 쿼리 입력을 받는 화면(윈도우)에 대응되고, 결과 출력부(113)는 최종 결과가 도출되는 화면(윈도우)에 대응될 수 있다.
도식 쿼리 입력부(111)는 캔버스를 통해 블록 등 도형과 연결선으로 구성된 형식으로 도식화된 쿼리를 입력받고, 시스템에 검색을 요청한다. 이에 대해서는 추후 도 2 내지 도 6을 참조하여 상세히 설명하기로 한다.
결과 출력부(113)는 검색 요청에 상응하여 검색된 자연 모방 아이디어들(생물학적 체계 정보들, 지식 결과들)을 출력한다. 이 때 검색된 생물학적 체계 정보들은 테이블 형태로 출력될 수 있다(도 13 참조).
쿼리 분석 시스템(120)은 검색 요청이 수신되면 사용자가 입력한 도식화된 쿼리의 문맥을 분석하고, 적합한 시나리오와 매핑하여 유사도 평가를 요청한다. 쿼리 분석 시스템(120)은 각 블록에 기입된 정보의 내용에 미루어, 다차원의 데이터 구조 속에서, 해당 블록이 내포하고 있는 데이터의 속성을 쉽게 유추해낼 수 있다. 그리고 블록과 블록 간의 연결선을 이용하여 블록들 간의 인과관계를 유추할 수 있다.
쿼리 분석 시스템(120)은 검색 문맥 분석부(121), 쿼리 구문 분석부(123), 검색 요청부(125)를 포함한다.
검색 문맥 분석부(121)는 사용자가 입력한 도식화된 쿼리의 구성요소들(어떤 종류의 블록들이 추가되었는지)이 어떠한 조합을 가지고 있는지에 따라 적합한 시나리오로 매핑한다.
검색 패턴 데이터베이스(127)는 자주 사용된 인과관계 구조를 패턴화하여 저장하고 있다. 즉, 기존에 사용자가 사용하였던 여러 검색 패턴들은 검색 패턴 데이터베이스(127)에 저장되어 있다. 따라서, 검색 패턴 데이터베이스(127)에 동일한 쿼리 사례가 있다면, 구문 분석 결과를 그대로 사용할 수도 있다. 이는 검색 결과 속도를 개선하기 위함이다.
검색 문맥 분석부(121)는 새로 입력된 도식 쿼리와 유사한 패턴들을 탐색하고, 지식 기반 시스템(130)의 인과모형 데이터베이스(133)로부터 유사한 사례를 선출할 때 필요한 인과관계들로 번역할 수 있다.
쿼리 구문 분석부(123)는 사용자가 구성한 도식화된 쿼리에 포함된 블록에 색인한(입력한) 값을 구문 분석한다.
사용자는 여러 블록들을 추가하여 쿼리를 구성해 놓게 된다. 각 블록에는 해당 블록에 맞는 구문이 정해져 있다. 예컨대, (동사 + 목적어)와 같은 구문일 수 있다.
정해져 있는 구문에 맞춰서 사용자가 블록에 색인한 값을 구문 분석할 수 있다.
사용자가 입력한 단어가 동사인지 명사인지 구분이 어려운 경우가 있을 수 있다. 예를 들어, 명사형 및 동사형이 같은 단어들로서, use 등이 있다. 이 때에는 사용자가 구문에 맞춰 값을 입력했을 것이라는 전제를 이용하여 보다 정확한 구문 분석이 가능해질 수 있다.
쿼리 구문 분석부(123)에 의해 지식 기반 시스템(130)에서 활용 가능한 인풋(input)이 될 수 있는 검색 쿼리로 변경될 수 있다. 예컨대, (동사) absorb + (명사) water 등으로 도식화된 쿼리가 쪼개져 검색용 쿼리로 전환될 수 있다.
검색 요청부(125)는 쿼리 구문 분석부(123)에서 만들어진 검색 쿼리를 지식 기반 시스템(130), 특히 유사성 평가부(131)에 인풋으로 제공한다.
지식 기반 시스템(130)은 자연계의 생물학적 체계(biological system), 즉 물리적 관계(Physical relations), 생태학적 관계(Ecological relations), 생물학적 관계(Biological relations)를 포함하는 생물학적 체계 정보를 종합적 인과 모형으로 구현하고, 온톨로지로 구축함으로써, 생체 모방 설계에서 설계자들이 다양한 정보와 조건을 이용한 효과적인 검색을 실시할 수 있게 한다.
생물학적 체계 정보는 생체 모방 설계에서 모방(mimicking) 및 활용(application)의 대상이 되는 개별적인 생물체 내부에서의 물리적 현상, 생화학적 현상 등을 물리적 관계, 생태학적 관계와 생물학적 관계로 특정한 정보이며, 이는 개체(entity) 간의 상호 작용이나 복수의 종(species)들간의 상호 작용으로 확장될 수 있다.
즉, 생체 모방 설계에서 하나의 생물체(organism)가 직접적으로 모방되는 경우도 있으나, 생물체 내부의 생물학적 현상, 여러 개체(entity)들이 발생시키는 상호작용, 혹은 다양한 생물체 종(species)들이 발생시키는 상호 작용들이 직간접적으로 응용되는 경우도 많기 때문에, 설계자들이 넓은 범주에서의 다양한 아이디어들을 도출할 수 있도록 개별 생물체 또는 생물체들이나 종 간의 상호작용까지 체계적으로 구성될 수 있다.
예를 들어, 생물학적 체계 정보로서 유럽 찌르레기가 알콜 중독을 해독하기 위해 알콜 분해를 촉진하는 내용이 저장되어 관리되는 경우, 알콜 분해 촉진을 위한 제품을 개발하고자 하는 설계자는 사용자 단말(110)을 활용하여 도식화된 쿼리를 입력함으로써 알콜 분해 촉진 등에 관한 생물학적 체계 정보의 검색을 통해 유럽 찌르레기에 관한 정보를 검색하여 활용할 수 있을 것이다.
지식 기반 시스템(130)은 유사성 평가부(131), 어휘 사전 데이터베이스(135), 인과모형 데이터베이스(133)를 포함한다.
어휘 사전 데이터베이스(135)에는 생물학적 체계 정보에 포함되는 물리적 관계, 생태학적 관계, 생물학적 관계를 각각 색인하기 위해 필요한 어휘들이 저장된다.
어휘 사전 데이터베이스(135)에는 예를 들어 ITIS(International Taxonomy Information Systems) 기준에 따른 학명(scientific name) 어휘가 수록된 학명 사전, 외부로 공개된 STONE의 2014년 논문에서 발췌된 자료(Engineering-to-biology thesaurus function terms) 등이 색인 어휘로서 저장될 수 있다. 본 발명은 학명 어휘를 사용함으로써 ITIS 기준으로 약 2만 1천개의 속(Genus)에 대한 생물학적 체계 정보를 수집할 수 있는 장점이 있다.
또한, 물리적 관계, 생태학적 관계를 각각 색인하는데, 기능(function), 물질, 에너지(energy), 신호(signal) 어휘가 필요하므로, 전문가들이 미리 작업한 기능 어휘 사전, 물질 어휘 사전(예를 들어, Material>Liquid>acid, chemical, water, blood 등), 에너지 어휘 사전(예를 들어, Energy>Hydraulic>pressure, osmosis 등), 신호 어휘 사전(예를 들어, Signal>Sense>Detect>detect, locate, see / Signal>Status>change, fatty, variation 등) 등이 저장될 수도 있다. 이때, 생태학적 현상(EPH, Ecological Phenomena)과 관련된 어휘들이 기능, 물질, 에너지, 신호의 카테고리에 맞춰 분류 관계를 정의한 자료로 구성될 수도 있다.
지식 기반 시스템(130)에는 생물학적 체계 정보를 수집하고 색인하기 위한 구성요소들로서, 문서 수집부, 수집 데이터베이스, 문서 구문 분석부, 색인 처리부가 더 포함될 수 있다.
문서 수집부는 자연어로 이루어진 생물학적 문서를 수집한다. 생물학적 문서는 예를 들어 생물학자들이 정리한 자연어 자료(natural-language based text)로서 HTML 문서일 수 있다. 물론, 생물학적 문서는 작성자나 문서 형태가 전술한 바로 제한되지 않으며, 후술될 물리적 관계, 생태학적 관계, 생물학적 관계에 관한 카테고리 분류 및 인과모형 생성이 가능한 문서이면 충분하다.
수집 데이터베이스는 문서 수집부에 의해 수집된 생물학적 문서를 저장한다.
문서 구문 분석부는 문서 수집부가 수집한 생물학적 문서를 파싱하여, 생물학적 문서의 문장 구조를 분석하고, 문장을 트리로 구성한다. 이때, 문서 구문 분석부는 예를 들어 스크래피 파서를 이용할 수 있다.
색인 처리부는 인과관계에 기반한 생물학적 체계를 표현한 온톨로지 구조(도 7 참조)에 따라 문서 구문 분석부에서 분석된 정보를 색인(indexing) 처리한다.
즉, 문서 구문 분석부에서 분석된 정보에 대해, 색인 처리부는 어휘 사전 데이터베이스(135)에 저장된 학명 어휘를 토대로 개별 생물체의 생물학적 관계를 색인하고, 어휘 사전 데이터베이스(135)에 저장된 기능, 물질, 에너지 및 신호를 각각 나타내는 어휘들을 토대로 해당 생물체의 생물학적 체계 중 물리적 관계와 생태학적 관계를 각각 색인한다.
생물학적 체계 정보는 주어(subject)-서술어(predicate)-목적어(object)의 트리플 형태에 기인하되, 도 7에 도시된 바와 같이, 생물체가 가지는 메커니즘 및 메커니즘을 통해 발현되는 인과관계를 표현한 물리적 관계, 생태학적 관계 및/또는 생물학적 관계가 조합되도록 구조화된다.
수집된 생물학적 문서에서 분석된 정보를 토대로 생물체를 색인하기 위한 최소 단위는 노드(node)이고, 각 노드의 연결 정보는 관계 정보를 형성한다.
도 7을 참조하면, 생물학적 체계 정보의 물리적 관계(Physical relations)에서, 인풋(Input)(예를 들어, 에너지, 신호 또는/및 물질 인풋)은 물리적 효과(PEF, Physical Effects)를 작동(activate)시키고, 물리적 효과는 물리적 현상(PPH, Physical Phenomena)으로 생성(create)되며, 물리적 현상은 상태 변화(CoS, Change of State)를 생성(create)하고, 상태 변화는 액션(action)으로 해석(interpret)된다.
여기서, 물리적 관계는 하나의 생물체가 특정 목적(action, goal)을 달성하기 위하여 어떤 물리적 변화(CoS)를 겪으며, 어떤 물리적 효과(PEF)를 통해서 어떤 물리적 현상(PPH)을 초래하는지 등을 인과관계 방식으로 표현한 정보이다.
구체적으로, 물리적 변화(CoS)는 목적을 달성하기 전 상태와 최종 결과 사이에 상태(state)가 어떻게 변화했느냐에 관한 것으로서, 사전 상태(Pre condition)와 사후 상태(Post condition)의 정적인 상태가 동적인 관계로 색인된다.
물리적 효과(PEF)는 목적을 달성하는데 사용한 전략에 관한 것으로, 통상적으로 생태학사전, 물리학사전 등에 등재되어 정의(definition)가 존재하는 전략들(즉, 해당 단어와 상응하는 정의)로 색인된다.
물리적 현상(PPH)은 어떤 전략이 구체적으로 어떻게 실시되었는지에 관한 것으로서, 그것이 구체적으로 어떻게 실시되었는지를 명시적으로 나타내기 위해 전문가들에 의해 미리 작성된 기능어휘 사전(동사를 담당함)과, 목적어로서 명사를 담당하는 에너지 사전, 물질 사전, 신호 사전에 정의된 용어들이 동사와 목적어의 관계로 조합되어 색인될 수 있다.
예를 들어, 유럽 찌르레기가 알콜을 해독한다면, 알콜 해독은 액션(Action)에 해당되고, 물리적 변화(CoS)는 높은 알콜 농도가 낮은 알콜 농도로 변화되는 것이며, 중독치료는 물리적 효과(PEF)에 해당될 수 있다. 따라서 알콜 분해 촉진이라는 물리적 현상(PPH)으로 액션, 즉 목적이 달성되는 것이다.
구체적으로, '많은 알콜 분자'라는 인풋은 '알콜 중독 치료'라는 물리적 효과를 작동시키고, '알콜 중독 치료'라는 물리적 효과는 '알콜 분해 촉진'이라는 물리적 현상을 생성하며, '알콜 분해 촉진'이라는 물리적 현상은 '높은 알콜 농도'(즉, 사전 상태)를 '낮은 알콜 농도'(즉, 사후 상태)로 만드는 상태 변화를 생성하고, 이러한 상태 변화는 최종적으로 '알콜 해독'이라는 액션으로 해석될 수 있다. 또한 분석적 관점에서 다시 '알콜 해독'의 액션은 '많은 알콜 분자'의 인풋이라는 원인으로 재해석될 수도 있다.
또한, 액션이 생태학적 현상(EPH, Ecological Phenomena)으로 해석(interpret)되며, 따라서 액션은 특정 생물체가 어떠한 행동(또는 습성)을 수행하기 위해서 취하게 된 물리적 '전략'으로 이해될 수 있다.
예를 들어 유럽 찌르레기가 '알콜이 함유된 발효된 과일을 먹게 될 가능성이 높다'는 생태학적 관계를 인식한 경우, 알콜 중독 치료제를 개발하고자 하는 설계자는 유럽 찌르레기의 생태학적 관계에서 알콜 해독이 필요한 알콜 중독자의 생태학적 관계를 유추할 수 있고, 따라서 전술한 유럽 찌르레기가 취한 해당 행동(습성)을 수행하기 위해서 취하게 된 물리적 전략인 '알콜 해독'의 액션을 알콜 중독 치료제를 개발하기 위한 디자인 전략으로 응용할 수 있을 것이다.
수집된 생물학적 문서에 알콜 해독 능력을 가지는 유럽 찌르레기에 관한 내용이 기재되어 있는 경우를 예로 들어, 어휘 사전 데이터베이스(135)에 저장된 어휘로 구조화된 생물학적 체계 정보를 예시하면 하기 표 1과 같다. 물론 유럽 찌르레기가 다양한 특성을 가지고 있는 경우라면, 각각의 노드(즉, Input, PEF 등)에 대응되도록 각각 저장되는 어휘들은 보다 많아지고 다양해질 수도 있을 것임은 당연하다.
[표 1]
Figure 112019004128177-pat00001
또한, 수집된 다른 생물학적 문서에 공기저항 감소를 위해 경량 골 구조를 가지는 유럽 찌르레기에 대한 내용이 포함되어 있는 경우, 유럽 찌르레기에 대한 생물학적 체계 정보가 표 2에 예시된 바와 같이 추가적으로 생성되어 관리될 수도 있다.
[표 2]
Figure 112019004128177-pat00002
표 2를 참조할 때, 유럽 찌르레기에 대한 생물학적 체계 정보는 운동에너지 인풋과 공기저항 인풋이 경량 골 구조라는 물리적 효과를 작동시키고, 경량 골 구조라는 물리적 효과는 뼈 무게 감소라는 물리적 현상을 생성하며, 뼈 무게 감소라는 물리적 현상은 큰 질량이 적은 질량이 되는 상태 변화를 생성하고, 큰 질량이 적은 질량이 되는 상태변화는 최종적으로 소모 에너지 절약이라는 액션으로 해석될 수 있다. 그리고 분석적 관점에서 다시 소모 에너지 절약의 액션은 높은 운동 에너지 인풋과 공기저항 인풋이라는 원인으로 재해석될 수 있다.
또한, 효율적으로 비행하는 습성을 갖는다는 생태학적 관계에서 설계자는 유럽 찌르레기의 생태를 비행체인 사물의 생태(즉, 운전되는 상황)로 유추할 수 있고, 유럽 찌르레기가 해당 행동을 수행하기 위해서 취하게 된 물리적 전략인 소모 에너지 절약의 액션을 비행체의 행동을 수행하는, 즉 비행체를 개발하기 위한 디자인 전략으로 응용할 수 있을 것이다.
도 7과 전술한 표 1과 2에서 각각 확인되는 바와 같이, 생물학적 체계 정보의 생물학적 관계는 기관(Organ), 조직(Part), 엔티티(Entity)로 구성된다. 생물학적 관계는 생물학적 현상이 생물체(organism)의 어떤 조직(Part)의 어떤 기관(Organ)과 연관되어 있는지를 나타내며, 조직(Part)은 기관(Organ)이 속한 조직(Part)을 의미한다.
엔티티는 각각의 생물학적 체계 정보가 어떤 생물체(organism)와 관련되어 있는지를 색인하는 요소로서, 기관(Organ)과 조직(Part)의 소유자이며, 바로 그 생물학적 현상을 관찰할 수 있는 생물체이다.
예를 들어, 무지갯빛(iridescent color)을 생성해내는 풍뎅이인 경우, 풍뎅이가 엔티티(Entity)로 색인되고, 큐티클(cuticle)은 풍뎅이의 쉘(shell)에 속한 부분이므로 생물학적 시스템의 조직(Part)은 쉘(shell)로 색인되며, 쉘(shell)의 큐티클이 연관된 기관(Organ)으로 색인될 수 있다.
다시 도 1을 참조하면, 인과모형 데이터베이스(133)에는 색인 처리부가 미리 지정된 온톨로리 구조(도 7 참조)와 어휘 사전 데이터베이스(135)에 저장된 각 사전별 어휘에 기반하여 생성한 생물학적 체계 정보가 저장된다. 인과모형 데이터베이스(133)에는 각 생물학적 체계 정보에 상응하는 썸네일 이미지, 생물학적 체계 정보 정의문서 중 하나 이상이 더 저장될 수도 있다.
이하, 인과모형 데이터베이스(133)에 각 요소별로 어휘가 색인되어 저장되는 규칙(syntax)을 간략히 설명한다.
우선 상태 변화(CoS) 요소는 하기 수학식 1에 따라 저장될 수 있다.
[수학식 1]
Figure 112019004128177-pat00003
즉, 사전 상태(Statepre)와 사후 상태(Statepost)로 저장되고, 각각 형용사부(Adj)와 명사부(Noun)로 구성된다. 여기서, 어휘 사전 데이터베이스(135)에 형용사부 색인 어휘들은 상태 형용사 사전으로 저장되고, 명사부 색인 어휘들은 각각 물질 어휘 사전, 에너지 어휘 사전, 신호 어휘 사전으로 저장된다.
그리고 물리적 현상(PPH) 요소는 하기 수학식 2의 규칙에 따라 저장될 수 있다.
[수학식 2]
Figure 112019004128177-pat00004
즉, 동사부(Predicatephysical)와 명사부(Objectphysical)로 구성된다. 어휘 사전 데이터베이스(135)에 동사부 색인 어휘들은 기능 어휘 사전으로 저장되고, 명사부 색인 어휘들은 전술한 바와 같이 각각 물질 어휘 사전, 에너지 어휘 사전, 신호 어휘 사전으로 저장된다.
그리고 물리적 효과(PEF) 요소는 하기 수학식 3의 규칙에 따라 저장될 수 있다.
[수학식 3]
Figure 112019004128177-pat00005
즉, 물리적 효과 요소는 어휘 사전 데이터베이스(135)에 저장된 PEF 색인 어휘 사전에 등록된 색인 어휘 중 하나로 색인되어 있다. PEF 색인 어휘 사전은 '색인 어휘'와 '색인 어휘의 정의(definition)'의 규칙(예를 들어, 'Camouflage' + 'Camouflage의 정의')으로 어휘 사전 데이터베이스(135)에 저장된다.
그리고 인풋(Input) 요소는 하기 수학식 4의 규칙에 따라 저장될 수 있다.
[수학식 4]
Figure 112019004128177-pat00006
해당 생물학적 체계 정보를 작동시키는 인풋은 관련된 물질 색인 어휘(Indexmaterial), 에너지 색인 어휘(Indexenergy), 신호 색인 어휘(Indexsignal)로 구성된다. 이들은 각각 어휘 사전 데이터베이스(135)에 저장된 물질 어휘 사전, 에너지 어휘 사전, 신호 어휘 사전에 등록된 어휘로 지정된다.
그리고 생태학적 현상(EPH) 요소는 하기 수학식 5의 규칙에 따라 저장된다.
[수학식 5]
Figure 112019004128177-pat00007
즉, '어떻게'에 관한 동사부(Predicate)와 '무엇을'에 관한 명사부(Object)로 구성된다. 일례로 적(foe)의 착시를 일으켜 적으로부터 발각되지 않도록 하는 생물학적 현상(camouflage)은 적(body - material)을 회피(avoid)하는 생태학적 기능을 갖는다. 동사부와 명사부의 색인 어휘들은 전술한 바와 같이 기능 어휘 사전, 물질 어휘 사전, 에너지 어휘 사전, 신호 어휘 사전으로 어휘 사전 데이터베이스(135)에 미리 저장된다.
그리고 생태학적 행동(EBH, Ecological Behavior) 요소는 하기 수학식 6의 규칙에 따라 저장된다.
[수학식 6]
Figure 112019004128177-pat00008
생태학적 행동 요소는 어휘 사전 데이터베이스(135)에 저장된 EBH 색인 어휘 사전에 등록된 색인 어휘 중 하나로 색인되어 있다. 예를 들어 적(foe)의 착시를 일으켜 적으로부터 발각되지 않도록 하는 생물학적 현상은 Camouflage(위장)이라는 생태학적 행동을 갖고 있다. 색인 어휘 사전은 '색인 어휘'와 '색인 어휘의 정의(text)'의 규칙(예를 들어 'Herbivore' + 'Herbivore의 정의')으로 어휘 사전 데이터베이스(135)에 저장된다.
그리고 기관(Organ) 요소와 조직(Part) 요소 각각은 수학식 7의 규칙에 따라 저장된다.
[수학식 7]
Figure 112019004128177-pat00009
기관 요소와 조직 요소는 어휘 사전 데이터베이스(135)에 저장된 생물학적 단어 사전의 단어를 이용하여 색인될 수 있다.
그리고 생물학적 체계 정보가 어떤 생물체(organism)와 관련되어 있는지를 색인하는 요소인 엔티티(Entity) 요소는 하기 수학식 8의 규칙에 따라 저장된다.
[수학식 8]
Figure 112019004128177-pat00010
즉, 연관 검색이 가능해질 수 있도록 하기 위해 ITIS 체계에 따른 학명에 따라 색인되며, 'ITIS 학명 사전'으로부터 생물체의 고유 ID 번호(숫자)를 색인하고, Indexscientificname는 학명(텍스트)을 색인하며, Indexcommonname는 통속명(텍스트)을 색인한다. 색인에 필요한 ITIS 사전은 어휘 사전 데이터베이스(135)에 미리 저장된다.
그리고 액션(Action) 요소는 하기 수학식 9의 규칙에 따라 저장된다.
[수학식 9]
Figure 112019004128177-pat00011
액션 요소는 별도의 사전으로 저장되지 않고, 설계자가 생물학적 체계 정보로부터 얻어낼 수 있는 설계 전략을 요약하여 기재한 설명으로 색인된다.
전술한 바와 같이, 생물학적 체계 정보는 각각의 생물체 내부의 물리적 관계, 생태학적 관계 및 생물학적 관계가 상호 연결 관계(지향성)을 가지는 인과모형으로 표현되고 각각 색인되며, 설계자는 활용하고자 하는 아이디어와 관련된 생물학적 체계 정보를 검색하기에 유용한 장점이 있다.
유사성 평가부(131)는 검색 요청부(125)로부터 검색 쿼리를 제공받고, 검색 쿼리와 인과모형 데이터베이스(133)에 저장된 각각의 생물학적 체계 정보에 대한 유사성을 평가하며, 미리 지정된 임계값 이상의 유사성을 가지는 생물학적 체계 정보를 결과 출력부(113)로 제공한다.
유사성 평가부(131)는 예를 들어 Python 언어 형태로 인과모형 데이터베이스(133)에 저장된 생물학적 체계 정보를 관리할 수 있다.
쿼리 분석 시스템(120)에서 도식 쿼리를 검색 쿼리로 전환함에 있어서, 검색 쿼리는 자연어 어구로 구성되며, <현재상황(Current State)>과 <기대결과(Expected Result)>의 조합으로 기술될 수 있다(도 8의 단계 S210 참조).
검색 쿼리가 <현재상황>과 <기대결과>의 조합으로 기술되는 경우, 검색을 수행함에 있어서 인과관계가 명확해질 수 있고, 또한 본 실시예에 따른 생물학적 체계 정보가 균일한(homogeneous) 구조 안에 표현되는 인과모형을 채택하였기 때문에 보다 효과적인 장점이 있다.
쿼리 구문 분석부(123)는 도식 쿼리의 각 블록에 기입된 텍스트를 통상의 자연어 처리 방식에 따라 의미 있는 수준의 단어인 토큰들로 분해하고, 각 토큰의 문법적 성분(예를 들어 형용사, 동사, 명사 등)을 분석한다. 또한, 쿼리 구문 분석부(123)는 지식 기반 시스템(130)의 어휘 사전 데이터베이스(135)에 저장된 어휘를 참조하여 <현재상황> 및 <기대결과> 각각의 텍스트를 토크들의 묶음(corpus) 데이터셋으로 생성한다(단계 S215 참조). 묶음 데이터셋은 단어들을 토큰화하여 나누고, 문장 기호와 제외어(stopword)(예를 들어, a, an, for, and 등)를 제거하여 리스트로 표현한 것이다.
검색 요청부(125)는 쿼리 구문 분석부(123)에 의해 분석된 검색 쿼리에 해당하는 묶음 데이터셋이 <현재상황> 및/또는 <기대결과>에 대해 존재하는지를 확인하고, 이에 상응하는 옵션값을 부가한 묶음 데이터셋을 유사성 평가부(131)로 제공한다.
유사성 평가부(131)로 제공되는 검색 쿼리에 상응하는 묶음 데이터셋이 <현재상황>과 <기대결과> 중 어느 하나만 포함한 경우에도 유사성 평가부(131)는 생물학적 체계 정보의 검색과 유사성 판단을 수행할 수 있도록 구현된다.
이는 기본적으로 생체 모방 설계가 유추 전략에 기반한 디자인 사고를 전제로 하고 있기 때문이다. 따라서, 사용자는 아이디어를 찾기 위해 <현재상황>의 조건에서 가능한 여러 결과들을 살펴보기 위해 <기대결과>를 명시하지 않을 수 있으며, 또한 <기대결과>의 조건에서 가능한 여러 사전 상태들을 살펴보기 위해 <현재상황>을 명시하지 않을 수 있다.
즉, <현재상황>과 <기대결과> 중 어느 하나를 명시하지 않는다는 것은 사고의 제한을 풀겠다는 의사 표시로 이해될 수 있으며, 유추 사고에 기반한 생체 모방 설계에서 설계자가 창의적으로 유추하도록 장려하는 디자인 사고 방법인 것이다.
예를 들어, '높은 알콜 농도'의 <현재상황>을 '낮은 알콜 농도'의 <기재결과>와 결부시켜 인과관계를 구체적으로 고정하는 경우, '높은 알콜 농도'라는 결과는 유지하면서, 오히려 알콜을 에너지원으로 활용하는 Pelotomaculum Thermopropionicum 박테리아 등에 대한 생물학적 체계 정보는 검색될 수 없기 때문이다.
검색 요청부(125)의 동작을 구체적으로 설명하면, 검색 요청부(125)는 검색 쿼리에 <현재상황>과 <기대결과> 중 어느 하나만이 기술된 경우에는 생물학적 체계 정보의 온톨로지 구조 중 물리적인 변화를 가장 추상적으로 표현하는 요소인 물리적 효과(PEF) 요소를 이용하여, 유사성 평가부(131)가 인과모형 데이터베이스(133)에 저장된 생물학적 체계 정보들의 물리적 효과 요소로 색인된 정보들과 검색 쿼리의 묶음 데이터셋 간의 유사성을 평가하고, 미리 지정된 임계값 이상의 생물학적 체계 정보들을 결과 출력부(113)로 제공하도록 하는 옵션값을 설정한다(도 8의 단계 S220과 S225 참조).
그러나, 검색 요청부(125)는 검색 쿼리에 <현재상황>과 <기대결과>가 모두 기술된 경우에는, 생물학적 체계 정보의 온톨로지 구조 중 물리적 현상(PPH)을 이용하여, 유사성 평가부(131)가 인과모형 데이터베이스(133)에 저장된 생물학적 체계 정보들의 물리적 현상 요소로 색인된 정보들과 검색 쿼리의 묶음 데이터셋 간의 유사성을 평가하고, 미리 지정된 임계값 이상의 생물학적 체계 정보들을 결과 출력부(113)로 제공하도록 하는 옵션값을 설정한다(도 3의 단계 S220 및 S230 참조).
구체적으로 설명하면, <기대결과>는 변화된 결과로써 기대하는 작동을 드러내므로, <기대결과>의 묶음 데이터셋으로부터 동사(verb) 토큰들을 수집하여 유사성 평가부(131)가 물리적 현상 요소로 색인된 정보들 각각과의 유사성을 판단하도록 할 수 있다. 이에 비해, <현재상황>은 변화의 작동 대상을 드러내므로, <현재상황>의 묶음 데이터셋으로부터 명사(noun) 토큰들을 수집하여, 유사성 평가부(131)가 물리적 현상 요소로 색인된 정보들 각각과의 유사성을 판단하도록 할 수 있다.
<기대결과>의 동사 토큰들에 의한 유사성 평가부(131)의 계산 결과와, <현재상황>의 명사 토큰들에 의한 유사성 평가부(131)의 계산 결과를 종합하여, 유사성 평가부(131)는 유사 매트릭스를 도출하고, 미리 지정된 임계값 이상의 생물학적 체계 정보들을 결과 출력부(113)로 제공할 수 있다.
또한, 검색 요청부(125)는 어휘 사전 데이터베이스(135)에 저장된 생물학적 단어 사전에 등록된 어휘가 묶음 데이터셋에서 발견되면, 유사성 평가부(131)가 생물학적 체계 정보의 온톨로지 구조 중 기관(Organ), 조직(Part) 및 엔티티(Entity)라는 요소를 유사성 평가시 추가적으로 고려하고, 또한 유사 매트릭스(Similarity Matrix) 생성시 해당 유사성 평가 결과를 이용하도록 하는 옵션값을 설정한다(도 8의 단계 S235 및 S240 참조).
여기서, 생물학적 단어는 생물체 기관, 조직 또는/및 개체명(예를 들어, 통속명, 학명 등)에 관한 단어들로서, 예를 들어 sensory-organ, lung, european-starling 등이 이에 해당된다.
그러나, 묶음 데이터셋에서 생물학적 단어 사전에 등록된 어휘가 발견되지 않으면, 기관(Organ), 조직(Part) 및 엔티티(Entity)라는 요소를 유사성 평가시 고려하지 않도록 옵션값을 설정한다.
그리고, 검색 요청부(125)는 어휘 사전 데이터베이스(135)에 저장된 상태 형용사 사전에 등록된 어휘가 묶음 데이터셋에서 발견되면, 유사성 평가부(131)가 생물학적 체계 정보의 온톨로지 구조 중 상태 변화(CoS)라는 요소를 유사성 평가시 추가적으로 고려하고, 또한 유사 매트릭스 생성시 해당 유사성 평가 결과를 이용하도록 하는 옵션값을 설정한다(도 8의 단계 S245 및 S250 참조). 여기서, 상태 형용사는 형용사 종류 중 크기, 모양, 상태, 색상, 연령, 재료 등에 해당되는 형용사로서, 예를 들어 high, small, enormous, round, ceramic, metal 등이 이에 해당된다.
그러나, 만일 묶음 데이터셋에서 상태 형용사 사전에 등록된 어휘가 발견되지 않으면, 상태 변화 요소를 유사성 평가시 고려하지 않도록 옵션값을 설정한다.
검색 요청부(125)는 도식 쿼리가 변환된 검색 쿼리에 상응하여 생성된 묶음 데이터셋과 옵션값을 유사성 평가부(131)로 제공하여 검색을 요청한다(도 8의 단계 S255 참조).
결과 출력부(113)는 유사성 평가부(131)의 유사도 평가 결과로서 제공된 하나 이상의 생물학적 체계 정보들을 테이블 형태로 출력할 수 있다. 또는 결과 출력부(113)는 하나 이상의 생물학적 체계 정보들 간의 파생성(즉, 연관성)을 측정하고, 측정된 파생성을 이용하여 리스트 혹은 네트워크 그래프로 도식화하여 출력할 수도 있다(도 8의 단계 S260 참조). 물론 파생성 측정까지 유사성 평가부(131)에서 수행하고, 파생성 측정 결과 정보를 결과 출력부(113)가 이용하여 리스트 혹은 네트워크 그래프를 도식화할 수도 있음은 당연하다.
이하, 유사성 평가부(131)가 검색 요청부(125)로부터 제공받은 검색 쿼리에 상응하는 묶음 데이터셋과 인과모형 데이터베이스(133)에 저장된 각 생물체에 관한 생물학적 체계 정보를 이용하여 검색을 수행하고, 유사성을 판단하는 과정에 대해 설명한다(도 8의 단계 S260 참조).
유사성 평가부(131)는 인과모형 데이터베이스(133)에 저장된 생물학적 체계 정보들과 제공받은 <현재상황> 또는/및 <기대결과>의 묶음 데이터셋의 유사성 평가를 수행하기 위해, 인과모형 데이터베이스(133)에 n개의 생물학적 체계 정보가 저장된 경우 묶음 데이터셋과의 비교를 위해 1 x n 행렬 형태의 유사 매트릭스를 생성한다(도 9의 (a) 참조). 유사성 평가가 수행되기 전에 각 유사도 평가값은 0으로 초기화될 수 있다.
만일 검색 쿼리에 상응하여 <현재상황> 및 <기대결과> 중 어느 하나에 대한 묶음 데이터셋만이 제공된 경우라면, 유사성 평가부(131)는 묶음 데이터셋과 인과모형 데이터베이스(133)에 n개의 생물학적 체계 정보 각각에서 물리적 효과(PEF) 요소의 색인 어휘의 정의(definition) 텍스트(이는, PEF 색인 어휘 사전에 저장되어 있음)와 토픽 연관성의 정도를 tf-idf(Term Frequency - Inverse Document Frequency) 기법을 이용하여 계산하고, 계산된 값을 각 생물학적 체계 정보 각각의 유사도 평가값으로 기록한다. 만일 이전의 유사도 평가 과정에서 이미 산출된 유사도 평가값이 존재한다면 합산 처리한다.
여기서, Tf-idf 기법은 각 문서에서 사용된 어휘(토큰)들의 유사성을 가지고 2개의 문서 간의 유사성을 비교하는 일반적인 기법으로서, 예를 들어 묶음 데이터셋이 [blood, alcohol, level, very, high]로 구성되고, 이들이 물리적 효과(PEF) 요소의 색인 어휘의 정의 텍스트인 'Alcoholism-treatment'에 대한 문서에 등장하는 횟수가, PEF 색인 어휘 사전에 들어있는 모든 용어들에 대한 정의 문서들에서 등장하는 횟수에 비해서 얼마나 많은가로 계산하는 방법이다. 이때, level, very, high 등의 토큰들은 대부분의 문서에서 일반적으로 빈번하게 사용될 수 있는 어휘이므로, blood 또는 alcohol 등의 다른 토큰들에 비해 상대적으로 낮은 유사도 값이 할당되어 적용될 수 있음은 당연하다.
그러나 만일 검색 쿼리에 상응하여 <현재상황> 및 <기대결과> 모두에 대한 묶음 데이터셋만이 제공된 경우라면, 우선 유사성 평가부(131)는 통상 POST(Part of speech tagging) 알고리즘 등을 이용하여 <기대결과>의 묶음 데이터셋(WER)에서 동사 토큰들만을 추출하여 동사 토큰 집합(Wp)을 생성하고, <현재상황>의 묶음 데이터셋(WCS)에서 명사 토큰들만을 추출, 명사 토큰 집합(Wo)을 생성한다.
예를 들어 <현재상황>의 묶음 데이터셋이 [blood, alcohol, level, very, high]인 경우, 동사로 판단되는 토큰은 없으므로, 동사 토큰 집합(Wp)은 비어 있게 되지만, 명사 토큰 집합(Wo)은 [blood, alcohol, level]로 생성된다.
이후, 유사성 평가부(131)는 동사 토큰 집합 내의 어휘들과 각 생물학적 체계 정보의 물리적 현상(PPH) 요소의 동사부(Predicatephysical)(수학식 2 참조)와의 유사도를 계산하여 제1 유사도 계산값을 생성한다. 또한 유사성 평가부(131)는 명사 토큰 집합 내의 어휘들과 각 생물학적 체계 정보의 물리적 현상(PPH) 요소의 명사부(Objectphysical)와의 유사도를 계산하여 제2 유사도 계산값을 생성하고, 이를 제1 유사도 계산값과 곱셈 연산한 값을 각 생물학적 체계 정보 각각의 유사도 평가값으로 기록한다. 만일 이전의 유사도 평가 과정(예를 들어 생물학적 단어 존재 여부에 따른 유사도 평가 등)에서 이미 산출된 유사도 평가값이 존재한다면 합산 처리한다.
전술한 예에서 동사 토큰 집합(Wp)은 비어 있는 상태이므로 제1 유사도 계산값은 0으로 산출될 것이다. 그러나 만일 동사 토큰 집합(Wp)이 비어 있지 않은 상태이고, 임의의 생물학적 체계 정보의 물리적 현상(PPH) 요소가 <Adjust> + <Direction+of+Incident+Light>로 색인되었다면, 동사 토큰 집합(Wp) 내의 동사 토큰과 물리적 현상 요소인 동사부인 <Adjust>와의 유사도를 계산하게 된다.
앞서 설명한 바와 같이, 인과모형 데이터베이스(133)에 저장된 기능 어휘 사전에 동사 어휘들이 등록되어 있으므로, 동사 토큰 집합(Wp)의 동사 토큰과 Adjust와의 의미적 거리를 계산하여 제1 유사도 계산값을 산출한다.
기능 어휘 사전은 각 어휘들간의 의미적 거리를 계산할 수 있도록 트리(Tree) 데이터 구조로 구성되며, 동사 토큰과 Adjust 간에 공통된 가장 가까운 부모 노드를 거쳐 해당 동사 토큰에서 Adjust까지 도달되는 거리(즉, 각 계층적 노드를 연결한 엣지의 수)로서 제1 유사도 계산값이 산출된다. 따라서 가장 가까운 부모 노드가 최상위 노드로부터 멀수록 제1 유사도 계산값은 높게 산출될 것이다. 이러한 트리 데이터 구조는 예를 들어 친척들간에 촌수를 산출할 수 있도록 각 노드간의 연결관계를 가지는 계층 구조와 유사하게 구성될 수 있을 것이다.
또한 마찬가지로 명사 토큰 집합(Wo)이 비어 있지 않은 상태이고, 임의의 생물학적 체계 정보의 물리적 현상(PPH) 요소가 <Adjust> + <Direction+of+Incident+Light>로 색인되었다면, 명사 토큰 집합(Wo)의 명사 토큰과 물리적 현상 요소의 명사부 중 명사인 'Direction' 및 'Light'와의 유사도를 계산하게 된다. 제2 유사도 계산값 역시 제1 유사도 계산값 산출 과정과 마찬가지로 어휘의 의미적 거리에 의해 산출되며, 대상이 되는 명사가 복수(예를 들어, 'Direction' 및 'Light')인 경우에는 예를 들어 이들의 평균값, 합산값 또는 최대값이 제2 유사도 계산값으로 산출될 수 있다.
이어서, 유사성 평가부(131)는 검색 쿼리에 상응하는 묶음 데이터셋에 상태 형용사(예를 들어, small, high 등)가 존재하는지 판단하고, 존재하는 경우에는 상태 형용사를 고려한 유사도 평가를 더 수행한다.
즉, <현재상황> 및/또는 <기대결과>의 묶음 데이터셋에서 상태 형용사가 발견되면, 인과모형 데이터베이스(133)에 저장된 각 생물학적 체계 정보의 상태 변화(CoS) 요소의 색인 정보 중 형용사부(Adj)(수학식 1 참조)에서 발견된 빈도의 총 곱을 각 생물학적 체계 정보 각각의 유사도 평가값으로 기록한다. 만일 이전의 유사도 평가 과정에서 이미 산출된 유사도 평가값이 존재한다면 합산 처리한다. 이때, <현재상황>의 묶음 데이터셋의 상태 형용사는 사전 상태의 형용사부(Adjpre)와 대비하고, <기대결과>의 묶음 데이터셋의 상태 형용사는 사후 상태의 형용사부(Adjpost)와 대비하며, 만일 <현재상태>와 <기대결과>의 묶음 데이터셋 모두에서 상태 형용사가 발견되면 각 빈도의 총 곱을 합산한 값이 유사도 평가값으로 기록된다.
예를 들어, 임의의 생물학적 체계 정보의 상태 변화(CoS) 요소가 <High+Weight> + <Low+Weight>로 이루어져 있는 경우, 사전 상태의 형용사부는 'High"이고, 사후 상태의 형용사부는 'Low'이다. 그리고 <현재상태>의 묶음 데이터셋의 상태 형용사가 'high, small'이고, <기대결과>의 묶음 데이터셋의 상태 형용사가 'Normal'인 것으로 가정하면, <현재상황>의 상태 형용사 중 high는 1회 발견되었지만 small은 0회 발견되어 그 발견 빈도의 곱은 0이고, <기대결과>의 상태 형용사에 대한 발견 빈도는 0회이다. 따라서 유사도 평가값은 0이 된다.
전술한 바와 같이 발견 빈도의 곱 메커니즘을 사용함으로써 모든 요소가 발견된 경우에는 유사도 평가값이 가산점으로 작용될 수 있는 특징이 있다.
또한, 도 9의 (b)에 도시된 것과 같이, 만일 묶은 데이터셋에 생물학적 단어가 존재하는 경우, 유사성 평가부(131)는 1 x n 크기의 부(sub) 유사 매트릭스를 추가적으로 생성한다.
예를 들어 <현재상황>의 묶음 데이터셋이 [blood, alcohol, level, very, high]이고, <기대결과>의 묶음 데이터셋이 [blood, alcohol, level, normal]인 경우, 'blood'라는 토큰이 생물학적 단어 사전에 등록된 생물학적 단어이다. 유사성 평가부(131)는 해당 생물학적 단어와 인과모형 데이터베이스(133)에 저장되어 있는 n개의 생물학적 체계 정보들 각각과의 비교를 실시한다. 이때 만일 j번째의 생물학적 체계 정보의 기관(Organ), 조직(Part), 엔티티(Entity) 요소들에 대응되어 색인된 어휘들 중 'blood'라는 생물학적 단어가 2번 검색되었다면, 빈도의 합(sum)은 2가 되고, j번째의 생물학적 체계 정보와 묶음 데이터셋에 포함된 생물학적 단어인 토큰과의 유사도 평가값인 2가 부 유사 매트릭스의 j번째 요소로 등록된다.
전술한 바와 같이, 유사성 평가부(131)는 검색 쿼리에 상응하는 묶음 데이터셋과 인과모형 데이터베이스(133)에 저장된 각 생물체애 대한 생물학적 체계 정보를 이용하여 유사 매트릭스와 부 유사 매트릭스를 각각 생성한다. 다만 유사 매트릭스는 사용자의 검색 요청 모두에 대해 생성되지만, 부 유사 매트릭스는 생물학적 단어가 묶음 데이터셋 내에 포함된 경우에만 생성된다.
이하, 유사성 평가부(131)가 전술한 과정에 의해 생성한 유사도 평가값을 참조하여 하나 이상의 생물학적 체계 정보를 결과 출력부(113)로 제공하면, 결과 출력부(113)는 하나 이상의 생물학적 체계 정보를 테이블 형태로 출력할 수 있다(도 13 참조). 또는 각 생물학적 체계 정보간의 파생성을 측정하고, 측정된 파생성을 이용하여 네트워크 그래프로 도식화할 수도 있다.
유사성 평가부(131)는 유사 매트릭스 및/또는 부 유사 매트릭스를 이용하여 묶음 데이터셋과 각 생물체에 대한 생물학적 체계 정보간의 유사성을 평가한 후, 각 생물학적 체계 정보에 대한 유사도 평가값이 임계값 이상인 하나 이상의 생물학적 체계 정보를 결과 출력부(113)로 제공한다. 여기서, 임계값은 예를 들어 0.75로 지정될 수 있으며, 이는 상위 75%에 해당하는 생물학적 체계 정보를 제공한다는 의미이다.
도 2 및 도 3을 참조하여, 블록 등 도형과 연결선으로 구성된 쿼리의 도식화에 대해 설명하기로 한다.
도식 쿼리 입력부(111)는 도형 및 연결선들을 자유롭게 배치하고 수정할 수 있는 캔버스(Canvas)를 갖추고 있다.
캔버스는 도 2에 도시되어 있는 것과 같은 구성으로 이루어져 있다.
Subject 버튼이 선택되면 새로운 Subject 요소를 캔버스에 생성한다.
Action 버튼이 선택되면 새로운 Action 요소를 캔버스에 생성한다.
State Change 버튼이 선택되면 새로운 State Change 요소를 캔버스에 생성한다.
Input/Output 버튼이 선택되면 새로운 Input/Output 요소를 캔버스에 생성한다.
하부의 빗자루 버튼이 선택되면 캔버스를 모두 깨끗이 비우도록 한다.
Wizard 버튼이 선택되면(예컨대, 터치 입력, 누름 등의 방식으로) 각 연결관계에서 사용자가 빠트렸을 수 있는 연결관계들을 추천해 준다.
사용자 단말(110)에서 맨 처음 캔버스에 접속하였을 때, 사용자들은 사용자들의 편의를 위하여 미리 구성된 8가지 템플릿 및 1개의 자유모드(Sandbox Mode)를 도 3에 도시된 것과 같은 화면에서 선택할 수 있다.
Product Oriented(제품 지향) 템플릿은 Subject블록들로 이루어진 키워드들의 연결관계로 쿼리문을 구성할 경우 쉽게 활용할 수 있는 템플릿이다. 사용자들은 주어진 템플릿에 보이는 2개 이상의 Subject블록에 명사 키워드 등을 기입하여 쿼리문을 꾸밀 수 있다. 추가로 블록들을 더 추가하여 커스텀할 수도 있다.
Direct Analogy(직접 유추) 템플릿은, 현재 가장 많은 빈도로 사용되고 있는 자연모사 방법인 Literal Mimicking을 쉽게 활용할 수 있는 템플릿이며, 어떤 생물 개체가 보이는 Action등을 유추하여 솔루션을 개발하는데 적합한 템플릿이다. 사용자들은 주어진 1개 이상의 Subject 블록 및 1개 이상의 Action 블록에 적합한 내용을 기입하여 쿼리문을 꾸밀 수 있다.
Goal Oriented(목적 지향) 템플릿은, 상 변화를 이용해 어떤 물리적 목적을 달성하고자 하는 생각이 구체화된 경우 쉽게 활용할 수 있는 템플릿이며, 어떤 생물 개체가 갖는 물리적 메커니즘을 유추하여 솔루션을 개발하는데 적합한 템플릿이다. 사용자들은 주어진 1개 이상의 State Change 블록과 1개 이상의 Action 블록에 적합한 내용을 기입하여 쿼리문을 꾸밀 수 있다.
System Mimicking(시스템 모방) 템플릿은, 중심이 되는 상 변화를 기준으로 복잡한 구조를 갖는 시스템을 구체화한 경우 쉽게 활용할 수 있는 템플릿이며, 어떤 시스템과 유사한 시스템을 갖는 솔루션을 유추해내는데 적합한 템플릿이다. 사용자들은 주어진 1개 이상의 State Change 블록에 적합한 내용을 기입하여 쿼리문을 꾸밀 수 있다.
Strategy Mimicking(전략 모방) 템플릿은, 핵심 Action들을 중심으로 쿼리문을 구성하는 경우 쉽게 활용할 수 있는 템플릿이다. 상 변화 및 인풋/아웃풋 등이 명확하지 않은 상황 즉, 시스템적 연결관계가 명확하지 않은 상황에서 쉽게 활용할 수 있는 템플릿이다. 사용자들은 주어진 2개 이상의 Action 블록에 동사 및 명사들의 쿼리를 입력하여 쿼리문을 꾸밀 수 있다.
Input Oriented(인풋 지향) 템플릿은, 시스템에 Input으로 들어오는 물질, 신호, 에너지들이 명확할 경우에 쉽게 활용할 수 있는 템플릿이다. 사용자들은 주어진 2개 이상의 Input/Output블록에 명사 쿼리를 입력하여 쿼리문을 꾸밀 수 있다.
Inverse Analogy(역 유추) 템플릿은, 개발하고자 하는 솔루션과 유사한 제품이나 시스템들의 속성으로 쿼리문을 꾸며, 실제 존재하는 제품으로부터 유사한 정보를 탐색하고자 할 때 쉽게 사용할 수 있는 템플릿이다. 사용자들은 1개 이상의 Subject 및 1개 이상의 Action 블록에 쿼리를 입력하여 쿼리문을 꾸밀 수 있다.
Output Oriented(아웃풋 지향) 템플릿은, 시스템이 Output으로 출력할 물질, 신호, 에너지들이 명확할 경우에 쉽게 활용할 수 있는 템플릿이다. 사용자들은 주어진 2개 이상의 Input/Output 블록에 명사 쿼리를 입력하여 쿼리문을 꾸밀 수 있다.
각 템플릿에는 추가로 블록을 더 추가하여 커스텀할 수도 있다.
다음으로 도 4를 참조하여 블록이 내포하는 데이터의 속성 유추에 대해 설명하기로 한다.
블록들은 서브젝트(Subject), 액션(Action), 상 변화(State Change), 인풋/아웃풋(Input/Output) 의 종류들로 구성될 수 있다. 서브젝트 블록에는 생물 개체명, 부위 이름 등이나 제품 종류 등이 기입될 수 있다. 액션 블록에는 액션이 기술된다. 상 변화 블록에는 상 변화가 기술되며, 위에 사전(이전) 상태, 아래에 사후(이후) 상태가 기입될 수 있다.
각 블록의 상하좌우에 붙은 동그란 노드가 박스로부터 나가거나 박스로 들어오는 화살표(Edge)들의 연결고리 역할을 수행하고, 그 블록이 가진 특성을 드러낸다. 화살표들은 방향성을 가지고 있으며, 인과관계를 나타낸다.
Subject의 우측 노드의 경우, 블록으로부터 나가는 화살표(Edge)와 들어오는 화살표가 복수개 연결 가능하다.
Action의 좌측 노드의 경우, 블록으로 들어오는 화살표만 복수개 연결 가능하다. 우측 노드의 경우, 블록으로부터 나가는 화살표만 복수개 연결 가능하다.
State Change 좌측상단 노드의 경우, 블록으로 들어오는 화살표만 복수개 연결 가능하다. 우측하단 노드의 경우, 블록으로부터 나가는 화살표만 복수개 연결 가능하다.
Input/Output 상단 노드의 경우, 블록으로 들어오는 화살표만 복수개 연결 가능하다. Input/Output 블록으로 들어오는 화살표만 존재하게 되면, 이 블록은 Output을 의미하게 된다. 하단 노드의 경우, 블록으로부터 나가는 화살표만 복수개 연결 가능하다. Input/Output 블록에서 나가는 화살표만 존재하게 되면, 이 블록은 Input을 의미하게 된다. 만일, 들어오는 화살표도 복수개 있고, 나가는 화살표도 복수개 있다면, 블록안에 기재된 해당 물질은 어떤 시스템에서 Output으로 도출되었다가 다시 다른 시스템에 Input으로 사용된 것이다.
다음으로 블록과 블록들 간의 인과관계 유추에 대해 설명하기로 한다.
각 블록 안에 색인된 정보의 문장구성요소(명사구, 동사, 형용사, 명사 등) 혹은 명사구 종류(물질, 신호, 에너지 등)의 특징에 따라 블록의 의미를 블록의 종류(Subject, Action, State Change, Input/Output)보다 구체화할 수 있다.
예를 들어, Subject 블록의 경우, 블록 내부에 제품분류가 색인된 경우 해당 블록은 제품에 관한 블록이라고 유추할 수 있으며, 반대로 블록 내부에 생물체 개체 이름이 색인된 경우 해당 블록은 생물체 개체에 대한 블록이라고 유추할 수 있다.
또한 예를 들어, State Change의 경우, 블록 내부에 양(Quantity)을 표현하는 형용사와 그 뒤에 에너지의 속성을 갖는 명사구가 연결된 경우, 해당 블록은 에너지의 변화를 의미하는 블록이라고 유추할 수 있다.
다음으로 도 5 및 도 6을 참조하여 인과관계 구조를 패턴화하여 저장하고, 새로 입력된 도식 쿼리와 유사한 패턴을 탐색하는 과정에 대해 설명하기로 한다.
인과관계들은 이미 인과관계 데이터베이스(검색 패턴 데이터베이스)에 학습세트로 저장되어있기 때문에, 주요하고 빈번히 등장하는 긴밀한 관계가 빠져있을 경우, 이를 사용자에게 알려줄 수 있다.
예를 들어, 도 5를 참조하면, [빠른 헤엄]이라는 Action 요소에 [물] 및 [운동에너지]라는 Input/Output 요소만 연결되어 있다.
그러나 시스템은 여기에 [해류]라는 Input/Output 요소가 빠져있다고 알아낼 수 있다.
Wizard 기능을 이용하여, 사용자가 빠트린 인과관계를 사용자가 확인하고자 할 경우, 이러한 요소들을 도면에 추가하여 보여준다.
도 6을 참조하면, 추천받은 Input에 대해서는 클릭을 통해 추가(Add to)하거나 무시(Ignore)할 수 있다.
다음으로 검색을 위해 인과관계로 번역하는 과정에 대해 설명하기로 한다.
블록과 블록들이 화살표(Edge)들로 연결되어 있으면, 도 5 및 도 6에 도시된 것과 같이, "와류생성 → 저항 감소"의 인과관계가 만들어진 것과 같이 작은 인과관계들의 집합체가 완성된다.
시스템은 노드(박스)들의 연결관계를 모두 추적하여, 이를 (와류생성, 저항 감소)와 같은 형태의 데이터 리스트로 저장한다. 도 5 및 도 6에 도시된 실시예에서는 총 9개의 관계가 추적된다.
이상에서는 완전 자율로 도식화된 쿼리를 입력받는 캔버스를 중심으로 설명하였다. 도식화된 쿼리에 익숙하지 않은 사용자들을 위해 정형화된 뷰를 가지는 쿼리 입력 화면이 도 10 내지 도 12에 도시되어 있다.
쿼리 입력 화면에서는 다양한 시나리오 카드를 선택할 수 있도록 한다. 시나리오 카드에는 기능 기반 검색(Function-based Search), 제품 기반 검색(Product-based Search), 인풋/아웃풋 지향 검색(Input/Output-oriented Search), 비쥬얼 검색(Visual Search), 상 변화 기반 검색(State Change based Search), 커스터마이즈 검색(Customized Search) 등이 있다. 이러한 검색 시나리오는 도 3에 도시된 템플릿과 유사하게 사용자가 적합한 쿼리를 입력할 수 있도록 도와준다.
도 10에 도시된 기능 기반 검색의 경우, 도 11에 도시된 것과 같이 기능의 동사 및 명사를 선택하여 입력할 수 있다. 예를 들어, 동사 및 명사에 사용되는 단어들은 트리즈(TRIZ)에서 사용되는 기능 분석법의 동사 및 명사 사전을 이용할 수 있다.
Action에 해당하는 단어(예. Deposit)과 Object에 해당하는 단어(Liquid)를 선택하면, 도 12에 도시된 것과 같이 쿼리로 조합되어 화면에 보이게 된다.
여기서, 검색 버튼을 클릭하면, 도 13에 도시된 것과 같이 검색결과가 도시될 수 있다.
본 실시예에 따른 도식화된 질의 구성 방식을 이용한 전문가시스템에서의 다차원 지식 검색 시스템의 경우, 양자컴퓨팅을 이용하여 구동하는 것과 같이 보다 검색속도가 빠른 인공지능 알고리즘을 이용할 경우, 전술한 것과 같이 기여도가 높은 요소들에 무게인자를 특정 상수값으로 기록해두는 방식이 필수적일 것이다.
양자컴퓨팅의 경우 이렇게 검색 결과의 우선순위들이 상수값으로 기록되어 있으면, 해당 결과를 바탕으로 다차원 지식 검색 시나리오에서 매우 빠른 검색 속도를 기대할 수 있게 된다.
상술한 본 실시예에 따른 도식화된 질의 구성 방식을 이용한 전문가시스템에서의 다차원 지식 검색 시스템에서 수행되는 다차원 지식 검색 방법은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터가 읽을 수 있는 코드로서 구현되는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체로는 컴퓨터 시스템에 의하여 해독될 수 있는 데이터가 저장된 모든 종류의 기록 매체를 포함한다. 예를 들어, ROM(Read Only Memory), RAM(Random Access Memory), 자기 테이프, 자기 디스크, 플래쉬 메모리, 광 데이터 저장장치 등이 있을 수 있다. 또한, 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 통신망으로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 읽을 수 있는 코드로서 저장되고 실행될 수 있다.
상기에서는 본 발명의 실시예를 참조하여 설명하였지만, 해당 기술 분야에서 통상의 지식을 가진 자라면 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.
100: 다차원 지식 검색 시스템
110: 사용자 단말
120: 쿼리 분석 시스템
130: 지식 기반 시스템

Claims (8)

  1. 도식화된 질의 구성 방식을 이용한 전문가시스템에서의 다차원 지식 검색 시스템으로서,
    블록들과 연결선으로 이루어진 도식화된 쿼리를 입력받는 도식 쿼리 입력부와, 상기 도식화된 쿼리에 상응하는 검색 결과를 출력하는 결과 출력부를 포함하는 사용자 단말;
    상기 도식화된 쿼리의 문맥을 분석하고, 상기 블록들과 상기 연결선으로부터 상기 블록들 간의 인과관계를 유추하여 검색 쿼리를 생성하고 유사도 평가를 요청하는 쿼리 분석 시스템; 및
    생물체 각각에 대해 물리적 관계, 생태학적 관계와 생물학적 관계로 특정된 정보인 생물학적 체계 정보를 미리 생성하여 저장하고 관리하며, 상기 검색 쿼리에 상응하여 높은 유사도를 가지는 생물학적 체계 정보를 탐색하여 상기 사용자 단말로 전송하는 지식 기반 시스템을 포함하되,
    상기 도식 쿼리 입력부는 상기 블록 및 상기 연결선을 자유롭게 배치하고 수정할 수 있는 캔버스를 포함하며,
    상기 블록에는 서브젝트(Subject) 블록, 액션(Action) 블록, 상 변화(State Change) 블록, 인풋/아웃풋(Input/Output) 블록 중 하나 이상이 포함되는, 다차원 지식 검색 시스템.
  2. 삭제
  3. 제1항에 있어서,
    상기 서브젝트 블록은 진출하는 화살표가 연결되는 1개의 우측 노드를 가지며, 상기 액션 블록은 진입하는 화살표가 연결되는 좌측 노드 및 진출하는 화살표가 연결되는 우측 노드를 가지고, 상기 상 변화 블록은 위에 사전 상태가 기입되고 아래에 사후 상태가 기입되며 진입하는 화살표가 연결되는 좌측상단 노드 및 진출하는 화살표가 연결되는 우측하단 노드를 가지며, 상기 인풋/아웃풋 블록은 진입하는 화살표가 연결되는 상단 노드 및 진출하는 화살표가 연결되는 하단 노드를 가지는 것을 특징으로 하는 다차원 지식 검색 시스템.
  4. 제1항에 있어서,
    상기 도식 쿼리 입력부는 상기 캔버스를 통해 2개 이상의 서브젝트 블록을 포함하는 제품 지향(Product Oriented) 템플릿, 1개 이상의 서브젝트 블록 및 1개 이상의 액션 블록을 포함하는 직접 유추(Direct Analogy) 템플릿, 1개 이상의 상 변화 블록과 1개 이상의 액션 블록을 포함하는 목적 지향(Goal Oriented) 템플릿, 1개 이상의 상 변화 블록을 포함하는 시스템 모방(System Mimicking) 템플릿, 2개 이상의 액션 블록을 포함하는 전략 모방(Strategy Mimicking) 템플릿, 2개 이상의 인풋/아웃풋 블록을 포함하는 인풋 지향(Input Oriented) 템플릿, 1개 이상의 서브젝트 블록 및 1개 이상의 액션 블록을 포함하는 역 유추(Inverse Analogy) 템플릿, 2개 이상의 인풋/아웃풋 블록을 포함하는 아웃풋 지향(Output Oriented) 템플릿 중 하나 이상의 템플릿과, 1개의 자유모드(Sandbox Mode)를 제공하는 것을 특징으로 하는 다차원 지식 검색 시스템.
  5. 제1항에 있어서,
    상기 쿼리 분석 시스템은,
    상기 도식화된 쿼리의 구성요소들이 가지는 조합을 분석하여 적합한 시나리오로 매핑하는 검색 문맥 분석부와;
    상기 도식화된 쿼리에 포함된 상기 블록들에 색인한 값을 구문 분석하여 상기 검색 쿼리로 변경하는 쿼리 구문 분석부와;
    상기 검색 쿼리를 상기 지식 기반 시스템에 전송하며 검색을 요청하는 검색 요청부를 포함하는, 다차원 지식 검색 시스템.
  6. 제5항에 있어서,
    상기 검색 쿼리는 현재상황(current state)과 기대결과(expected result) 중 하나 이상이 포함되도록 기술된 것을 특징으로 하는 다차원 지식 검색 시스템.
  7. 제6항에 있어서,
    상기 지식 기반 시스템은 상기 검색 쿼리에서 상기 현재상황과 상기 기대결과에 대한 토큰을 추출하고, 추출된 토큰들을 이용하여 상기 현재상황에 대한 제1 묶음 데이터셋과 상기 기대결과에 대한 제2 묶음 데이터셋 중 하나 이상을 생성하고, 미리 지정된 규칙에 따라 생성한 옵션값을 이용하여 인과모형 데이터베이스에 저장된 생물학적 체계 정보와의 유사성 평가를 수행하여 일정 수준 이상으로 유사한 생물학적 체계 정보를 탐색하는 유사성 평가부를 포함하는 다차원 지식 검색 시스템.
  8. 제1항에 있어서,
    상기 생물학적 체계 정보는 상태 변화(CoS) 요소, 물리적 현상(PPH) 요소, 물리적 효과(PEF) 요소, 인풋(Input) 요소, 생태학적 현상(EPH) 요소, 생태학적 행동(EBH) 요소, 기관(Organ) 요소, 조직(Part) 요소, 엔티티(Entity) 요소 및 액션(Action)인 노드(node)들 각각에 대해 미리 지정된 규칙에 따라 하나 이상의 어휘가 색인되어 구조화된 정보인 것을 특징으로 하는 다차원 지식 검색 시스템.
KR1020190004445A 2018-01-12 2019-01-14 도식화된 질의 구성 방식을 이용한 전문가시스템에서의 다차원 지식 검색 방법 및 시스템 KR102363131B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20180004353 2018-01-12
KR1020180004353 2018-01-12

Publications (2)

Publication Number Publication Date
KR20190086395A KR20190086395A (ko) 2019-07-22
KR102363131B1 true KR102363131B1 (ko) 2022-02-15

Family

ID=67469225

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190004445A KR102363131B1 (ko) 2018-01-12 2019-01-14 도식화된 질의 구성 방식을 이용한 전문가시스템에서의 다차원 지식 검색 방법 및 시스템

Country Status (1)

Country Link
KR (1) KR102363131B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102228442B1 (ko) * 2019-08-14 2021-03-16 (주)호모미미쿠스 도식을 이용한 아이디에이션 플랫폼 장치 및 방법

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100575495B1 (ko) 2003-12-17 2006-05-03 엄재홍 생물학 관련 텍스트에서 생물학개체들간의 상호작용 추출및 추론 방법, 그 방법을 실행하기 위한 프로그램 및 그프로그램을 저장한 기록매체

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060054977A (ko) 2004-11-17 2006-05-23 삼성전자주식회사 전문가 시스템의 지식 베이스 구축 방법, 이에 적합한장치, 그리고 기록 매체
US9105068B2 (en) * 2012-11-12 2015-08-11 Facebook, Inc. Grammar model for structured search queries

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100575495B1 (ko) 2003-12-17 2006-05-03 엄재홍 생물학 관련 텍스트에서 생물학개체들간의 상호작용 추출및 추론 방법, 그 방법을 실행하기 위한 프로그램 및 그프로그램을 저장한 기록매체

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Sun-Joong Kim 외, ‘A study on metadata structure and recommenders of biological systems to support bio-inspired design’, 2016.10.24.*

Also Published As

Publication number Publication date
KR20190086395A (ko) 2019-07-22

Similar Documents

Publication Publication Date Title
Kolomiyets et al. A survey on question answering technology from an information retrieval perspective
Unger et al. An introduction to question answering over linked data
Klavans et al. The balancing act: combining symbolic and statistical approaches to language
US20160203130A1 (en) Method and system for identifying and evaluating semantic patterns in written language
CN110134925A (zh) 一种中文专利文本相似度计算方法
Asher et al. Integrating type theory and distributional semantics: a case study on adjective–noun compositions
Lopez et al. QuerioDALI: question answering over dynamic and linked knowledge graphs
Baazaoui Zghal et al. A system for information retrieval in a medical digital library based on modular ontologies and query reformulation
JP6850405B2 (ja) 生物学的体系情報検索システム及び方法
CN114730317B (zh) 使用示意图的构思平台设备及方法
KR102363131B1 (ko) 도식화된 질의 구성 방식을 이용한 전문가시스템에서의 다차원 지식 검색 방법 및 시스템
Van Tu A deep learning model of multiple knowledge sources integration for community question answering
Seneviratne et al. Inductive logic programming in an agent system for ontological relation extraction
Havasi Discovering semantic relations using singular value decomposition based techniques
KR102448275B1 (ko) 생물 종 동정을 활용한 생물학적 정보 추론 장치 및 방법
Lopez et al. State of the art on semantic question answering
Arbizu Extracting knowledge from documents to construct concept maps
Yin et al. CDQA: An ontology-based question answering system for Chinese delicacy
Stojanovic On the conceptualisation of the query refinement task
Cercone THE REPRESENTATION AND USE OF KNOWLEDGE IN AN1 ASSOCIATIVE NETWORK FOR THE AUTOMATIC COMPREHENSION OF NATURAL LANGUAGE
Wu Study on English learning system based on the difficulty of English texts
Landoulsi et al. Building natural language responses from natural language questions in the spatio-temporal context
Goel et al. Extracting structural knowledge from natural language documents to support biologically inspired design
Gil Berrozpe Description, Categorization, and Representation of Hyponymy in Environmental Terminology
Sharef et al. Linguistic patterns-based translation for natural language interface

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant