KR20150032164A

KR20150032164A - 심층적 문서 분석에 기초한 능동적 지식 안내

Info

Publication number: KR20150032164A
Application number: KR20140115892A
Authority: KR
Inventors: 도나 케이 바이런; 크리슈나 쿰마무루; 알렉산더 피코브스키; 티모시 윙클러
Original assignee: 인터내셔널 비지네스 머신즈 코포레이션
Priority date: 2013-09-17
Filing date: 2014-09-02
Publication date: 2015-03-25
Also published as: CN104462056A; US20150082161A1; US20150081714A1; US10698956B2; US20170315998A1; DE102014112983A1; US9817823B2; US9824088B2; CN104462056B

Abstract

정보 처리 시스템이 지식-기반 정보를 제공하기 위한 방법이 제공된다. 상기 방법에서, 시맨틱 분석이 문서상에 수행되고, 상기 분석은 시맨틱 컨텐트의 다양한 세트들을 만들어 낸다 (result in). 상기 시맨틱 컨텐트 세트들 각각은 문서내 하나의 영역에 대응한다. 문서의 상기 영역들은 시각적 표시자들을 사용하여 시각적으로 하이라이트되는데 이것은 사용자 인터페이스를 통해 사용자에게 시맨틱 컨텐트의 상기 세트들의 이용가능성을 보여준다. 사용자 인터페이스를 사용한 선택 또는 사용자 특정 구성 셋팅과 같은 사용자 선택에 응답하여, 시맨틱 컨텐트의 선택된 세트가 상기 인터페이스를 사용하여 사용자에게 디스플레이된다.

Description

심층적 문서 분석에 기초한 능동적 지식 안내{Active Knowledge Guidance Based on Deep Document Analysis}

본 발명은 일반적으로 개선된 데이터 처리 장치 및 방법에 관련된 것이고 좀 더 구체적으로 현재 열람중인 (being viewed) 문서에 관련된 시맨틱 (semantic) 컨텐트 (content)에 관하여 사용자에게 능동적 지식 안내를 제공하기 위하여 문서들에 관한 심층적 분석을 수행한 후 다양한 사용자 인터페이스 기술들을 사용함으로써 문서들의 열람자들 (viewers)에게 안내를 제공하는 메카니즘들에 관련된 것이다.

인터넷과 같은, 컴퓨터 네트워크들의 사용이 증가함에 따라, 사람들은 현재 다양한 구조적 및 비구조적 소스들 (sources)로부터 그들에게 이용가능한 정보량에 눌려서 (inundated) 압도되고 있다 (overwhelmed). 하지만, 다양한 주제들에 관하여 정보를 검색 (searches)하는 동안 사용자들이 관련이 있다고 믿어지는 그들이 발견할 수 있는 것을 재구성하려고 (piece together) 할 때 정보의 격차들이 크다 (abound). 전술한 검색들을 돕기 위하여, 최근 연구는 지식 관리 시스템들 (knowledge management systems)을 개발하는 (generating) 쪽으로 진행되어 왔고, 이들은 입력을 취하여, 그것을 분석하고, 그리고 상기 입력에 가장 그럴듯한 (probable) 결과들을 표시하는 (indicative of) 결과들을 돌려줄 수 있다. 지식 관리 시스템들은 컨텐트의 많은 소스들, 예를 들어, 전자 문서들을 지식 베이스 (a knowledge base)를 통하여 검색하기 위한 자동화된 메카니즘들을 제공하고, 그들을 상기 입력과 관련하여 분석하여 결과와 그 결과들이 입력과 관련하여 얼마나 정확한지에 관한 신뢰 기준 (confidence measure)을 결정한다.

그러한 지식 관리 시스템의 하나가 (미국) 뉴욕, 아몬크 인터내셔널 비지네스 머신즈 코포레이션 (International Business Machines (IBM) Corporation of Armonk, New York.)으로부터 구입 가능한 IBM Watson^TM시스템이다. 상기 IBM Watson^TM시스템은 진보된 자연어 (natural language) 처리, 정보 검색 (retrieval), 지식 표시 및 추론 (knowledge representation and reasoning), 그리고 공개 도메인 (open domain)의 질의 응답 분야의 머신 학습 기술들의 어플리케이션 (application)이다. IBM Watson^TM시스템은 가설 생성, 대량 증거 수집, 분석 및 스코어링을 위해 사용되는 IBM의 DeepQA 기술에 기반한다. DeepQA는 입력 질문을 취하고, 그것을 분석하고, 상기 질문을 구성 (constituent) 부분들로 분해하고 (decomposes), 상기 분해된 질문과 대답 소스들의 1차 검색 결과들에 기초하여 하나 또는 그 이상의 가설을 생성하며, 증거 소스들로부터의 증거 검색에 기초한 가설 및 증거 스코어링을 수행하고, 하나 또는 그 이상의 가설들의 합성 (synthesis)을 수행하며, 그리고 훈련된 모델들에 기초하여, 최종 머징 (merging) 및 랭킹 (ranking)을 수행하여 신뢰 기준에 따라 상기 입력 질문에 대한 대답을 산출한다.

역사적으로 두 가지 종류의 시스템들, 즉 구조화된 데이터-기반 (structured data-based) 시스템 및 문서-기반 (document-based) 시스템이 있었다. 전통적인 기업 사용자 인터페이스들은 링크된, 구조화된 데이터에 대한 인터페이스를 제공하는데; 따라서, 스크린들 및 스크린들 사이의 내비게이션 (navigation)은 이들 객체들 (objects)의 모델 및 컨텐트를 반영한다. 이들 시스템들은 정보의 유익함 (informativeness) 및 사용의 용이성을 최대화하도록 하는 방식으로 데이터를 제공한다. 따라서, 밀도가 높고 사용의 용이성 또한 높은 정보가 신중하게 (judiciously) 선택된다. 하지만, 전술한 전통적 시스템들은 폐쇄형 (closed-end) 시스템들이라서 이용가능한 구조화된 컨텐트에 한정된다. 이에 반해서, 문서-기반 시스템들은 좀 더 얕은 (more shallow) 정보 밀도를 제공하지만, 좀 더 개방형 (more open-ended)일 수 있고 또한 구조화된 데이터 인터페이스들보다 더 많은 정보에 대한 액세스를 제공할 수 있다. 전통적 문서-기반 시스템들은 그들의 구조화된 데이터 카운터파트들 (counterparts)과 비교하여 일반적으로 열등한 사용자 경험을 제공한다. 전통적 문서-기반 인터페이스들에서, 정보 밀도는 일반적으로 낮으며 사용의 용이성 또한 구조화된 데이터 인터페이스들보다 낮다.

지식-기반 정보를 제공하는 정보 처리 시스템이 제공된다. 상기 시스템에서, 시맨틱 분석 (a semantic analysis)이 문서에 관하여 수행되는데, 이 분석으로 시맨틱 컨텐트의 여러 세트들이 만들어진다. 시맨틱 컨텐트 세트들 각각은 상기 문서내 하나의 영역에 대응한다. 문서의 상기 영역들은 시각적 표시자들 (visual indicators)을 사용하여 시각적으로 하이라이트되는데 (highlighted) 이것은 사용자 인터페이스를 통해 사용자에게 상기 시맨틱 컨텐트 세트들의 이용가능성을 보여준다. 상기 사용자 인터페이스를 사용하거나 또는 사용자 특정 구성 셋팅을 사용하는 선택과 같은 사용자 선택에 응답하여, 시맨틱 컨텐트의 선택된 세트가 상기 인터페이스를 사용하여 사용자에게 디스플레이된다.

전술한 내용은 요약이며 그러므로, 필요에 따라 (by necessity), 단순화 (simplifications), 일반화 (generalizations) 되었고, 상세 사항은 생략되었다; 따라서, 당업자는 상기 요약은 오직 예시적인 것이고 본 발명을 한정하려는 의도가 없음을 이해할 것이다. 청구범위들에 의하여 전적으로 (solely) 정의되어 있는, 본 발명의 기타 특징들, 발명 범위들, 및 장점들은 아래의 상세한 설명에서 명확히 기술될 것이다.

본 발명은 첨부된 도면들을 참조함으로써 잘 이해될 수 있으며, 본 발명의 여러 목적들, 특징들, 및 장점들이 당업자에게 명백하게 될 것이다:
도 1은 지식 베이스를 활용하는 지식 관리자를 포함하는 네트워크 환경을 묘사한다;
도 2는 도 1에서 도시한 것과 같은 정보 처리 시스템의 프로세서 및 컴포넌트들의 블록 다이어그램이다;
도 3은 심층적 문서 분석에 기초한 능동적 지식 안내를 제공하는 지식 관리자를 묘사하는 컴포넌트 다이어그램이다;
도 4는 심층적 문서 분석에 기초한 능동적 지식 안내를 제공하는데 사용되는 로직을 보여주는 흐름도를 묘사한 것이다;
도 5는 능동적 지식 안내를 위한 문서를 준비하는데 사용되는 로직을 보여주는 흐름도를 묘사한 것이다;
도 6은 시맨틱 컨텐트를 디스플레이하기 위하여 수행되는 로직을 보여주는 흐름도를 묘사한 것이다;
도 7은 시맨틱 컨텐트를 가진 문서에 사용되는 로직을 보여주는 흐름도를 묘사한 것이다; 그리고
도 8은 심층적 자연어 분석을 수행하기 위해 지식 관리자에 의하여 수행되는 로직을 보여주는 흐름도를 묘사한 것이다.

당업자들이 이해하듯이, 본 발명의 실시예들은 시스템, 방법, 또는 컴퓨터 프로그램 제품으로 구현될 수 있다. 따라서, 본 발명의 실시예들은 전적으로 하드웨어 실시예, 전적으로 소프트웨어 실시예 (펌웨어 (firmware), 상주 (resident) 소프트웨어, 마이크로-코드 등을 포함하는) 또는 이하 모두 일반적으로 “회로” ("circuit,"), “모듈” ("module") 또는 “시스템”이라 할 수 있는 하드웨어 실시예들 및 소프트웨어 실시예들을 결합하는 실시예의 형태를 취할 수 있다. 더 나아가서, 본 발명의 실시예들은 컴퓨터 프로그램 제품의 형태를 취할 수 있는데, 이는 하나 또는 그 이상의 컴퓨터 판독가능 매체(들)내에 구현되며, 컴퓨터 판독가능 프로그램 코드가 그 위에 구현된다.

하나 또는 그 이상의 컴퓨터 판독가능 매체(들)의 모든 조합이 사용될 수 있다. 컴퓨터 판독가능 매체는 컴퓨터 판독가능 신호 매체 또는 컴퓨터 판독가능 스토리지 매체일 수 있다. 컴퓨터 판독가능 저장 매체는 예를 들어, 전자 (electronic), 자기 (magnetic), 광학 (optical), 전자기 (electromagnetic), 적외선 (infrared) 또는 반도체 (semiconductor) 시스템, 장치 또는 디바이스, 또는 상기 것들의 어떠한 적절한 조합일 수 있고 이에 국한되지는 않는다. 컴퓨터 판독가능 스토리지 매체의 더 구체적인 사례들 (비-포괄적 리스트)에는 다음의 것들이 포함된다: 하나 또는 그 이상의 전선들을 가진 모든 전기 접속, 휴대용 컴퓨터 디스켓, 하드 디스크, 랜덤 액세스 메모리 (RAM), 판독-전용 메모리 (ROM), 지울 수 있는 프로그램가능 판독-전용 메모리 (EPROM 또는 플래시 메모리), 광 섬유, 휴대용 컴팩트 디스크 판독-전용 메모리 (CD-ROM), 광 스토리지 디바이스, 자기 스토리지 디바이스, 또는 이들의 모든 적절한 조합. 이 문서의 맥락에서, 컴퓨터 판독가능 스토리지 매체는 명령 실행 시스템, 장치, 또는 디바이스에 의해서 또는 연결해서 사용할 프로그램을 포함 또는 저장할 수 있는 모든 유형의 매체가 될 수 있다.

컴퓨터 판독가능 신호 매체는 그 안에 컴퓨터 판독가능 프로그램 코드가, 예를 들어, 기저 대역 (baseband)에 또는 반송파 (carrier wave)의 일부로서, 구현된 전파된 (propagated) 데이터 신호를 포함한다. 상기 전파된 신호는 전자기, 광학, 또는 그것의 적절한 조합 등을 포함하는 다양한 형태 (이에 국한되지는 않지만)를 취할 수 있다. 컴퓨터 판독가능 신호 매체는 컴퓨터 판독가능 저장 매체가 아닌 명령 실행 시스템, 장치, 또는 디바이스에 의하여 또는 이것들과 관련하여 사용되는 프로그램을 통신, 전파, 또는 전송할 수 있는 모든 컴퓨터 판독가능 매체가 될 수 있다.

컴퓨터 판독가능 매체상에 구현된 프로그램 코드는 무선, 유선, 광섬유 케이블 (optical fiber cable), 무선 주파수 (RF)등 또는 상기 것들의 적절한 조합 등을 포함하는 모든 매체 (이에 국한되지는 않지만)를 사용하여 전송될 수 있다.

본 발명의 실시예들의 동작을 수행하기 위한 컴퓨터 프로그램 코드는 하나 또는 그 이상의 프로그래밍 언어의 어떤 조합으로 기록될 수 있으며, 이 언어에는 자바 (Java), 스몰토크 (Smalltalk), C++등과 같은 객체 지향형 프로그래밍 언어 (object oriented programming language) 및 “C” 프로그래밍 언어, 또는 유사한 프로그래밍 언어들과 같은 종래의 순차 프로그래밍 언어 (conventional procedural programming languages)를 포함한다. 상기 프로그램 코드는, 독립 (stand-alone) 소프트웨어 패키지로서, 전적으로 사용자의 컴퓨터상에서, 부분적으로 사용자의 컴퓨터상에서, 부분적으로 사용자의 컴퓨터 및 원격 컴퓨터상에서 또는 전적으로 원격 컴퓨터, 서버 또는 서버들의 클러스터상에서 실행될 수 있다. 후자의 시나리오에서, 원격 컴퓨터는 근거리 통신망 (LAN) 또는 광대역 통신망 (WAN)을 포함하는, 어떠한 형태의 네트워크를 통해서 사용자의 컴퓨터와 접속될 수 있으며, 또는 이러한 접속은 (가령 인터넷 서비스 공급자를 사용한 인터넷을 통하여) 외부 컴퓨터와도 이루어질 수 있다.

본 발명의 여러 특징들이 본 발명의 실시예들에 따라, 방법들, 장치 (시스템들) 그리고 컴퓨터 프로그램 제품들의 흐름도 도시 (flowchart illustrations) 및/또는 블록 다이어그램 (block diagrams)을 참조하여 이하 설명된다. 흐름도 도시 및/또는 블록 다이어그램의 각 블록 그리고 흐름도 도시 및/또는 블록 다이어그램의 조합은 컴퓨터 프로그램 명령들에 의하여 실행될 수 있음을 이해할 수 있을 것이다. 이 컴퓨터 프로그램 명령들은 범용 컴퓨터, 특수 목적 컴퓨터, 또는 머신 (machine)을 생성하는 기타 프로그램 가능한 데이터 처리 장치의 프로세서에 제공되어, 컴퓨터나 기타 프로그램 가능한 데이터 처리 장치의 프로세서를 통하여 실행될 때, 그러한 명령들이 흐름도 및/또는 블록 다이어그램이나 블록에 규정된 기능/동작 (acts)을 구현하는 수단을 생성하도록 한다.

상기 컴퓨터 프로그램 명령들은 또한 컴퓨터 판독가능 매체에 저장될 수 있으며, 컴퓨터, 기타 프로그램가능 데이터 처리 장치 또는 다른 디바이스들에 지시하여 상기 컴퓨터 판독가능 매체에 저장된 명령들은 상기 흐름도 및/또는 블록 다이어그램의 블록 또는 블록들에 명시된 기능/동작을 구현하는 명령들을 포함하는 제품 (an article of manufacture)을 생성하도록 특정한 방식으로 기능하게 할 수 있다.

상기 컴퓨터 프로그램 명령들은 또한 컴퓨터, 기타 프로그램가능 데이터 처리 장치, 또는 다른 디바이스들에 로드되어, 컴퓨터, 기타 프로그램가능 장치 또는 다른 디바이스들에서 일련의 계산 단계들이 수행되게 하여 컴퓨터 구현 프로세스를 생성하며, 그렇게 하여 상기 컴퓨터 또는 기타 프로그램가능 장치상에서 실행되는 명령들이 흐름도 및/또는 블록 다이어그램의 블록 또는 블록들에 명시된 기능들/동작들을 구현하기 위한 프로세스들을 제공하도록 할 수 있다.

도 1은 컴퓨터 네트워크 (102)내 질문/대답 생성 (QA) 시스템 (100)의 예시적 실시예의 개략적 다이어그램을 묘사한다. 여기서 기술된 원리들에 따라 사용될 수 있는 질문/대답 생성의 한 예가 미국 특허 출원 공개 번호 2011/0125734에 기술되어 있으며, 이것은 여기서 전체로서 참조로 포함된다. 지식 관리자 (100)은 컴퓨터 네트워크 (102)에 접속된 컴퓨팅 디바이스 (104) (하나 또는 그 이상의 프로세서들 및 하나 또는 그 이상의 메모리들, 및 버스들, 스토리지 디바이스들, 통신 인터페이스들, 등을 포함하여 종래 기술에서 일반적으로 알려진 기타 컴퓨팅 디바이스 엘리먼트들을 포함함)를 포함할 수 있다. 상기 네트워크 (102)는 하나 또는 그 이상의 유선 및/또는 무선 데이터 통신 링크들을 통해 서로 통신하는 그리고 기타 디바이스들 또는 컴포넌트들과 통신하는 다수 컴퓨팅 디바이스들 (104)를 포함할 수 있는데, 여기서 각각의 통신 링크는 하나 또는 그 이상의 배선들 (wires), 라우터들 (routers), 스위치들 (switches), 송신기들 (transmitters), 수신기들 (receivers), 등을 포함할 수 있다. 지식 관리자 (100) 및 네트워크 (102)는 하나 또는 그 이상의 컨텐트 사용자들을 위하여 질문/대답 (QA) 생성 기능 (functionality)을 인에이블할 수 있다. 지식 관리자 (100)의 기타 실시예들은 여기 묘사된 것들이 아닌 컴포넌트들, 시스템들, 서브-시스템들 및/또는 디바이스들과도 사용될 수 있다.

지식 관리자 (100)은 다양한 소스들로부터 입력들을 수신하도록 구성될 수 있다. 예를 들어, 지식 관리자 (100)은 네트워크 (102), 전자 문서 (107)의 코퍼스 (corpus) 또는 기타 데이터, 컨텐트 생성기 (108), 컨텐트 사용자들, 및 기타 가능한 입력 소스들로부터 입력을 수신할 수 있다. 한 실시예에서, 지식 관리자 (100)에 대한 일부 또는 전부 입력들은 상기 네트워크 (102)를 통하여 라우트될 수 있다. 상기 네트워크 (102)상 다양한 컴퓨팅 디바이스들 (104)는 컨텐트 생성기들 및 컨텐트 사용자들을 위한 액세스 포인트를 포함할 수 있다. 일부 컴퓨팅 디바이스들 (104)는 데이터의 코퍼스를 저장하는 데이터베이스를 위한 디바이스들을 포함할 수 있다. 상기 네트워크 (102)는 다양한 실시예들에서 로컬 네트워크 접속들 및 원격 접속들을 포함할 수 있어, 지식 관리자 (100)은 로컬 및 글로벌, 예를 들어 인터넷을 포함하는 다양한 사이즈 (size)의 환경들에서 동작할 수 있다. 추가적으로, 지식 관리자 (100)은 프런트-엔드 시스템 (front-end system)으로서 기능을 할 수 있는데 이것은 문서들, 네트워크-접근가능한 소스들 및/또는 구조화된 데이터 소스들로부터 추출되거나 또는 이들에 표시된 다양한 지식을 이용가능하도록 해준다. 이런 식으로, 일부 프로세스들은 지식 관리자를 이용하는데 (populate), 지식 관리자는 또한 입력 인터페이스들을 포함하여 지식 요청들을 수신하고 이에 응답한다.

한 실시예에서, 상기 컨텐트 생성기는 지식 관리자 (100)에서 데이터 코퍼스의 일부분으로 사용하기 위하여 문서 (106)내에 컨텐트를 생성한다. 상기 문서 (106)은 지식 관리자 (100)에서 사용할 모든 파일 (any file), 본문 (text), 기사 및 데이터의 소스를 포함할 수 있다. 컨텐트 사용자들은 상기 네트워크 (102)에 대한 네트워크 접속 또는 인터넷 접속을 통하여 지식 관리자 (100)에 액세스할 수 있으며, 지식 관리자 (100)에 질문들을 입력할 수 있는데 이들은 데이터 코퍼스내 컨텐트에 의하여 대답될 수 있다. 아래에서 더 설명하겠지만, 프로세스가 시맨틱 컨텐트를 위해 문서의 주어진 섹션을 평가할 때, 상기 프로세스는 다양한 규칙들 (conventions)을 사용하여 상기 지식 관리자로부터 그것을 질의할 수 있다 (query). 한 규칙은 잘-형성된 질문을 송신하는 것이다. 시맨틱 컨텐트는 단어들, 구문들 (phrases), 부호들 (signs), 및 기호들 (symbols)과 같은, 기표들 (signifiers)과 그것들이 의미하는 것 (what they stand for), 그들의 명시적 의미 (denotation) 또는 함축적 의미 (connotation) 사이의 관계에 기초하는 컨텐트이다. 다시 말하면, 시맨틱 컨텐트는 표현 (an expression)을 해석하는, 예를 들어, 자연어 처리 (Natural Language (NL) Processing)를 사용하여, 표현을 해석하는 컨텐트이다. 한 실시예에서, 상기 프로세스는 지식 관리자에게 잘-형성된 질문들 (예를 들어, 자연어 질문들, 등)을 송신한다. 지식 관리자 (100)은 질문을 해석하여 상기 질문에 대한 하나 또는 그 이상의 대답들 (answers)을 포함하는 응답 (a response)을 컨텐트 사용자에게 제공한다. 일부 실시예들에서, 지식 관리자 (100)은 대답들의 순위 목록 (a ranked list)에서 사용자들에게 응답을 제공할 수 있다.

일부 예시적 실시예들에서, 지식 관리자 (100)은 (미국) 뉴욕, 아몬크 인터내셔널 비지네스 머신즈 코포레이션으로부터 구입가능한 IBM Watson^TM QA 시스템일 수 있는데, 이는 이후 기술되는 예시적 실시예들의 메카니즘들로 보강된다 (augmented). 상기IBM Watson^TM 지식 관리자 시스템은 입력 질문을 수신하고 그 다음 문법적으로 분석하여 (parses) 상기 질문의 주요 특징들을 추출하고, 이 특징들은 그 다음 차례로 (in turn) 데이터의 코퍼스에 적용되는 질의들 (queries)을 형성하는데 (formulate) 사용된다. 데이터의 코퍼스에 대한 질의들의 적용에 기초하여, 한 세트의 가설들, 또는 상기 입력 질문에 대한 후보 대답들이 생성되는데, 이들은 상기 입력 질문에 대한 가치 있는 응답을 포함할 어떤 가능성 (some potential)을 갖는 데이터 코퍼스의 부분들을 위해 데이터 코퍼스 전체를 조사하여 (looking across) 생성된다.

그 다음 상기 IBM Watson^TM QA 시스템은 다양한 추론 (reasoning) 알고리듬들을 사용하여 상기 입력 질문의 언어에 관하여 그리고 상기 질문들을 적용하는 동안 발견되는 데이터 코퍼스 부분들 각각에 사용된 언어에 관하여 심층적 분석을 수행한다. 수백 또는 심지어 수천 개의 추론 알고리듬들이 적용될 수 있는데, 이들 각각은 다른 분석, 예를 들어, 비교들을 수행하고, 스코어를 생성한다. 예를 들어, 일부 추론 알고리듬들은 상기 입력 질문 언어 및 상기 데이터 코퍼스의 발견된 부분들내에서 용어들 및 동의어들 (synonyms)의 매칭을 찾아낼 수 있다 (look at). 기타 추론 알고리듬들은 상기 언어에서 시간적 또는 공간적 (temporal or spatial) 특징들을 찾아낼 수 있고 반면 다른 알고리듬들은 상기 데이터 코퍼스 부분의 소스를 평가하고 그것의 정확성 (veracity)을 평가할 수 있다.

다양한 추론 알고리듬들로부터 획득된 스코어들은 잠재적 응답이 상기 추론 알고리듬이 집중하는 특정 영역 (the specific area of focus)에 기초하여 입력 질문에 의해 추론되는 (inferred) 범위를 표시한다. 그 다음 각각의 결과 스코어는 통계 모델을 고려하여 가중된다 (weighted against). 상기 통계 모델은 IBM Watson^TM QA 시스템의 훈련 기간 동안 특정 도메인을 위해 두 개의 유사한 단락들 (passages) 사이에서 추론 (inference)을 설정함에 있어서 상기 추론 알고리듬이 얼마나 잘 수행되었는지를 보여준다 (capture). 그 다음 상기 통계 모델은 잠재적 응답, 즉, 후보 대답이 상기 질문에 의하여 추론되는 증거와 관련하여 상기 IBM Watson^TM QA 시스템이 가진 신뢰 수준을 요약하기 위해 사용될 수 있다. 이 프로세스는 후보 대답들 각각에 대하여 반복될 수 있는데, 상기 IBM Watson^TM QA 시스템이 다른 대답들보다 현저히 강력한 것으로 떠오르는 후보 대답들을 식별하여, 상기 입력 질문에 대한 최종 대답, 또는 대답들의 순위 세트를 생성할 때까지 반복될 수 있다. 상기 IBM Watson^TM QA 시스템에 대한 더 많은 정보는, 예를 들어, IBM 코포레이션 웹사이트, IBM 레드북스 (Redbooks), 등으로부터 획득될 수 있다. 예를 들어, 상기 IBM Watson^TM QA 시스템에 관한 정보는 유안 등이 2011년 IBM 디벨럽퍼?스에서 발표한 “왓슨과 건강관리” (Yuan et al., “Watson and Healthcare,” IBM developerWorks, 2011) 및 랍 하이가 2012년 IBM 레드북스에서 발표한 “인식 시스템들의 시대: IBM 왓슨 내부 둘러보기 및 그것이 운영되는 방법” (“The Era of Cognitive Systems: An Inside Look at IBM Watson and How it Works” by Rob High, IBM Redbooks, 2012)에서 찾을 수 있다.

QA 시스템 (100)을 활용할 수 있는 정보 처리 시스템들의 형태들은, 휴대용 컴퓨터/이동 전화 (110)과 같은, 소형 휴대 디바이스들로부터, 메인프레임 컴퓨터 (170)과 같은, 큰 메인프레임 시스템들에까지 다양하다 (range). 휴대용 컴퓨터 (110)의 예들은 개인 휴대 단말기들 (personal digital assistants (PDAs)), MP3 플레이어, 휴대용 텔레비전들 같은, 개인 오락 디바이스들, 및 컴팩트 디스크 플레이어들 (compact disc players)을 포함한다. 정보 처리 시스템들의 기타 예들은 펜, 또는 태블릿 컴퓨터 (120), 랩탑, 또는 노트북 컴퓨터 (130), 개인용 컴퓨터 시스템 (150) 및 서버 (160)을 포함한다. 도시하는 바와 같이, 상기 다양한 정보 처리 시스템들은 컴퓨터 네트워크 (100)을 사용하여 네트워크화될 수 있다. 상기 다양한 정보 처리 시스템들을 상호접속하는데 사용될 수 있는 컴퓨터 네트워크 (102)의 형태들은 근거리 통신망들 (Local Area Networks (LANs)), 무선 LAN들 (Wireless Local Area Networks (WLANs)), 인터넷, 공중 전화 교환망 (the Public Switched Telephone Network (PSTN)), 기타 무선 네트워크들, 및 상기 정보 처리 시스템들을 상호접속하는데 사용될 수 있는 모든 다른 네트워크 토폴로지 (topology)를 포함한다. 많은 정보 처리 시스템들은 하드 드라이브들 및/또는 비휘발성 메모리와 같은, 비휘발성 데이터 스토어들을 포함한다. 도 1에서 도시된 일부 정보 처리 시스템들은 별도의 비휘발성 데이터 스토어들을 묘사한다 (서버 (160)은 비휘발성 데이터 스토어 (165)를, 그리고 메인프레임 (170)은 비휘발성 데이터 스토어 (175)를 활용한다). 상기 비휘발성 데이터 스토어는 상기 다양한 정보 처리 시스템들의 외부에 연결된 (external) 컴포넌트이거나 또는 상기 정보 처리 시스템들중 하나에 연결된 내부 컴포넌트일 수 있다. 예시적인 프로세서 및 상기 프로세서에 의하여 흔히 액세스되는 다양한 컴포넌트들을 보여주는 정보 처리 시스템의 하나의 예가 도 2에서 도시되어 있다.

도 2는 정보 처리 시스템 (200), 특히, 하나의 프로세서 및 공통 컴포넌트들을 도시하는데, 이것은 이하 기술된 계산 동작들을 수행할 수 있는 컴퓨터 시스템의 단순화된 예이다. 정보 처리 시스템 (200)은 프로세서 인터페이스 버스 (212)에 접속된 하나 또는 그 이상의 프로세서들 (210)을 포함한다. 프로세서 인터페이스 버스 (212)는 프로세서들 (210)을 노스브리지 (Northbridge) (215)에 접속하는데, 이것은 또한 메모리 컨트롤러 허브 (Memory Controller Hub (MCH))로서 알려져 있다. 노스브리지 (215)는 시스템 메모리 (220)에 접속하며 프로세서(들) (210)이 상기 시스템 메모리에 액세스하도록 하는 수단 (means)을 제공한다. 그래픽스 컨트롤러 (225)는 또한 노스브리지 (215)에 접속한다. 한 실시예에서, PCI 익스프레스 버스 (218)은 노스브리지 (215)를 그래픽스 컨트롤러 (225)에 접속한다. 그래픽스 컨트롤러 (225)는 컴퓨터 모니터와 같은, 디스플레이 디바이스 (230)에 접속한다.

노스브리지 (215) 및 사우스브리지 (Southbridge) (235)는 버스 (219)를 사용하여 서로 접속한다. 한 실시예에서, 상기 버스는 다이렉트 미디어 인터페이스 (Direct Media Interface (DMI))인데 이것은 노스브리지 (215) 및 사우스브리지 (235) 사이 각각의 방향에서 고속으로 데이터를 전송한다. 다른 실시예에서, 주변 컴포넌트 상호접속 (Peripheral Component Interconnect (PCI)) 버스는 상기 노스브리지 및 사우스브리지에 접속한다. 입출력 컨트롤러 허브 (I/O Controller Hub (ICH))라고도 또한 알려진, 사우스브리지 (235)는 상기 노스브리지에 의하여 제공된 능력들보다 더 느린 속도로 동작하는 능력들을 일반적으로 구현하는 하나의 칩이다. 사우스브리지 (235)는 다양한 컴포넌트들을 접속하도록 사용되는 다양한 버스들 (busses)을 제공한다. 이들 버스들은, 예를 들어 PCI 및 PCI 익스프레스 버스들, ISA 버스, 시스템 관리 버스 (System Management Bus (SMBus 또는 SMB)), 및/또는 로우 핀 카운트 (Low Pin Count (LPC)) 버스를 포함한다. 상기 LPC 버스는 부트 롬 (boot ROM) (296) 및 “레거시” (“legacy”) I/O 디바이스들 (“수퍼 I/O” 칩을 사용하여)과 같은, 저대역폭 (low-bandwidth) 디바이스들을 종종 접속한다. 상기 "레거시” (“legacy”) I/O 디바이스들 (298)은, 예를 들어, 직렬 및 병렬 포트들, 키보드, 마우스, 및/또는 플로피 디스크 컨트롤러를 포함할 수 있다. 상기 LPC버스는 또한 사우스브리지 (235)를 보안 플랫폼 모듈 (Trusted Platform Module (TPM)) (295)에 접속한다. 종종 사우스브리지 (235)에 포함되는 기타 컴포넌트들은 직접 메모리 액세스 (a Direct Memory Access (DMA)) 컨트롤러, 프로그램 가능한 인터럽트 컨트롤러 (a Programmable Interrupt Controller (PIC)), 및 스토리지 디바이스 컨트롤러를 포함하는데, 이들은 사우스브리지 (235)를, 버스 (284)를 사용하여, 하드 디스크 드라이브와 같은 비휘발성 스토리지 디바이스 (285)에 접속한다.

익스프레스카드 (ExpressCard) (255)는 핫-플러거블 (hot-pluggable) 디바이스들을 상기 정보 처리 시스템에 접속하는 슬롯 (slot)이다. 익스프레스카드 (255)는 범용 직렬 버스 (Universal Serial Bus (USB)) 및 PCI 익스프레스 버스 둘 모두를 사용하여 사우스브리지 (235)에 접속할 때 PCI 익스프레스 및 USB 접속성 (connectivity) 모두를 지원한다. 사우스브리지 (235)는 상기 USB에 접속하는 디바이스들에 USB 접속성을 제공하는 USB 컨트롤러 (240)을 포함한다. 이들 디바이스들은 웹캡 (webcam) (카메라) (250), 적외선 수신기 (infrared (IR) receiver) (248), 키보드 및 트랙패드 (trackpad) (244), 및 블루투스 (Bluetooth) 디바이스 (246)을 포함하는데, 이들은 무선 사설망 (wireless personal area networks (PANs))을 위해 제공된다 (provides for). USB 컨트롤러 (240)은 또한 마우스, 착탈식 (removable) 비휘발성 스토리지 디바이스 (245), 모뎀들, 네트워크 카드들, ISDN 커넥터들, 팩스, 프린터들 USB 허브들 및 많은 기타 형태들의 USB 접속 디바이스들과 같은, 기타 다양한 USB 접속 디바이스들 (245)에 USB 접속성을 또한 제공한다. 착탈식 비휘발성 스토리지 디바이스 (245)는 USB-접속 디바이스로 도시되었지만, 착탈식 비휘발성 스토리지 디바이스 (245)는 파이어와이어 (Firewire) 인터페이스, 등과 같은, 다른 인터페이스를 사용하여 접속될 수도 있다.

무선 LAN 디바이스 (275)는 상기 PCI 또는 PCI 익스프레스 버스 (272)를 통해 사우스브리지 (235)에 접속한다. LAN 디바이스 (275)는 통상적으로 OTA 변조 (over-the-air modulation) 기술들의 IEEE .802.11 표준들중 하나를 구현하며, 상기 표준들 모두는 정보 처리 시스템 (200)과 다른 컴퓨터 시스템 또는 디바이스 사이에서 무선으로 통신하기 위하여 동일 프로토콜을 사용한다. 광학적 스토리지 디바이스 (290)은 직렬 ATA (Serial ATA (SATA)) 버스 (288)을 사용하여 사우스브리지 (235)에 접속한다. 직렬 ATA 어댑터들 및 디바이스들은 고속 직렬 링크 (a high-speed serial link)를 통해 통신한다. 상기 직렬 ATA 버스는 또한 사우스브리지 (235)를 하드디스크 드라이브들과 같은, 기타 형태들의 스토리지 디바이스들에 접속시킨다. 사운드 카드와 같은, 오디오 회로 (260)은 버스 (258)를 통해 사우스브리지 (235)에 접속한다. 오디오 회로 (260)은 오디오 입력 및 광학적 디지털 오디오 입력 단자 (audio line-in and optical digital audio in port) (262), 광학적 디지털 출력 및 헤드폰 잭 (264), 내부 스피커들 (266), 및 내부 마이크로폰 (268)과 같은 기능성을 또한 제공한다. 이더넷 (Ethernet) 컨트롤러 (270)은 상기 PCI 또는 PCI 익스프레스 버스와 같은, 버스를 사용하여 사우스브리지 (235)에 접속한다. 이더넷 컨트롤러 (270)은 정보 처리 시스템 (200)을 LAN, 인터넷, 및 기타 공공 및 개인 컴퓨터 네트워크들과 같은, 컴퓨터 네트워크에 접속시킨다.

도 2가 하나의 정보 처리 시스템을 도시하였지만, 정보 처리 시스템은 많은 형태들을 취할 수 있는데, 그들의 일부가 도 1에 도시되어 있다. 예를 들어, 정보 처리 시스템은 데스크탑, 서버, 휴대용, 랩탑, 노트북, 또는 기타 폼 팩터 컴퓨터 (other form factor computer) 또는 데이터 처리 시스템의 형태를 취할 수 있다. 게다가, 정보 처리 시스템은 PDA, 게임기, ATM 머신, 휴대용 전화기, 통신 디바이스 또는 프로세서 및 메모리를 포함하는 기타 디바이스들과 같은, 기타 폼 팩터들을 취할 수 있다.

도 3-8은 도 1에 도시한 지식 관리자 (100)과 같은, 지식 관리 시스템을 사용하여 심층적 문서 분석에 기초한 능동적 문서 지식 안내를 제공하기 위하여, 정보 처리 시스템상에서 실행될 수 있는 방식을 묘사한다. 여기서 기술된 상기 방식은 문서를 열람할 때 사용자의 경험을 개선하는데, 심층적 지식 (deep knowledge)을 상호작용 층 (an interactive layer) 또는 기타 시각적 표시자 (other visual indicator)로서 주도적으로 (pro-actively) 이용가능하게 함으로써 개선하며, 상호작용 층 또는 기타 시각적 표시자는 상기 문서의 심층적 시맨틱 분석에 의하여 발견되는 추가적인 지식, 추론들, 및 관련 사항들 (associations)을 포함한다. 한 실시예에서, 심층적 시맨틱 분석의 발견은 코퍼스 준비 (corpus preparation)와 유사한 프로세스에 의하여 수행된다. 상기 방식은 많은 사용자 인터페이스 기술들을 통해서 추론된 지식을 사용자에게 제공하는데, 이 지식은 사용자에게 이용가능한 지식과 직접적으로 상호작용하여, 따라서 디스플레이되는 상기 지식 전체를 조사하여 (navigate through), 원치 않는 지식들 (unwanted knowledge annotations) 등을 걸러내도록 해준다. 이 방식으로, 표면 본문 (the surface text)은, 하이퍼링크들 (hyperlinks)을 갖는 평평한 표면 (a flat surface with hyperlinks)이 되는 대신에, 컴퓨터 및 인간 사용자가 문서내의 주제에 관하여 완전한 범위의 지식을 서로에게 제공할 수가 있는 공동의 작업 공간 (collaborative task space)이 된다. 시맨틱 분석을 통한 시스템과 사용자에 의하여 이용가능한 지식의 범위는 상기 표면 본문이 제공하는 것보다 훨씬 더 넓고 더 깊을 수 있다. 위에서 논의된 상기 방법은 도 3-8 및 아래 논의된 상세한 설명에서 추가로 기술되는데, 이것은 지식 관리자를 사용하여 심층적 문서 분석에 기초한 능동적 문서 지식 안내를 제공하는 하나 또는 그 이상의 실시예들에 관련된 추가적인 상세 사항을 제공한다.

도 3은 심층적 문서 분석에 기초한 능동적 지식 안내를 제공하는 지식 관리자를 묘사하는 컴포넌트 다이어그램이다. 지식 관리자 (104)는 문서 (325)상에서 시맨틱 분석을 수행하는데 이 분석은 하나 또는 그 이상 세트들의 시맨틱 컨텐트 (350)를 만들어 낸다. 이전에 설명하였듯이, 상기 지식 관리자는 상기 문서와 관련된 시맨틱 컨텐트를 찾기 위하여, 정보의 방대한 소스인. 지식 베이스 (106)을 활용한다. 상기 다양한 세트들의 시맨틱 컨텐트는 문서 (325)의 다른 영역들에 대응한다. 상기 다양한 세트들의 시맨틱 컨텐트가 다양한 시각적 효과들 또는 기술들을 사용하여 디스플레이 스크린상에서 사용자에게 시각적으로 보여지거나 또는 표시될 수 있도록 사용자 인터페이스가 제공된다. 그 다음 상기 사용자는 디스플레이 스크린상에서 사용자에게 디스플레이된 사용자 인터페이스를 사용하여 상기 디스플레이된 시맨틱 컨텐트를 열람하거나 또는 달리 그것과 작업할 수 있다.

상기 다양한 효과들, 또는 표시자들은 시각적 기술들을 포함할 수 있는데. 이들은 다음과 같다. 문서의 대응 영역상에 하이라이트 (a highlight) 를 디스플레이함, 문서상에 시맨틱 컨텐트의 오버레이 (an overylay)를 디스플레이함, 시맨틱 컨텐트의 전체 또는 일부의 문서상에 주석 (an annotation)을 디스플레이함, 시맨틱 컨텐트의 전체 또는 일부의 문서상에 인접하여 정보 버블 (an information bubble)을 디스플레이함, 시맨틱 컨텐트에 대하여 사용자에게 경고하는 문서의 대응 영역에 인접한 문서 상에 마크업 (a markup)을 디스플레이함, 문서상에 시맨틱 컨텐트의 디스플레이 층 (a display layer)을 디스플레이함, 시맨틱 컨텐트의 전체 또는 일부 문서상에 플라이오버 (a flyover)를 디스플레이함, 및 시맨틱 컨텐트의 사용자에게 경고하는 대응 영역 근처에 선택가능한 아이콘 (a selectable icon)을 디스플레이함. 상기 시맨틱 컨텐트는 동일 스크린 또는 스크린의 영역상에 오버레이될 (overlaid) 수 있거나 또는 별도의 스크린 영역에서 보여질 수 있다.

상기 시맨틱 컨텐트의 이용가능성을 사용자에게 경고하는데 사용되는 시각적 표시자는 발견되는 시맨틱 컨텐트의 형태에 기초할 수 있다. 시맨틱 컨텐트의 한 형태는 문서내의 차트 또는 표 (a chart or a table)에 대응하는 추가적인 정보이다. 시맨틱 컨텐트의 다른 형태는 문서내에서 발견되는 컨텐트보다 더 최신 (up-to-date)인 컨텐트이며, 시각적 표시자가 사용자에게 더 최신의 정보가 이용가능함을 알려준다. 시맨틱 컨텐트의 또 다른 형태는 챕터, 토론, 등 (a chapter, discussion, etc )과 같은, 문서의 영역에 링크되거나 또는 관련된 컨텐트이다. 시맨틱 컨텐트는 문서 및/또는 시맨틱 컨텐트와 사용자의 상호작용 (user interaction)에 기초하여 동적으로 (dynamically) 계산을 수행하기 위해 라이브 코드 객체들 (live code objects)로 구현될 수 있는 기능적 블록을 형성하는 모든 관련된 시맨틱 컨텐트를 또한 포함한다.

사용자는 재무 문서를 브라우즈 (browse)할 수도 있고 시스템은 좀 더 최근 정보가 이용가능함을 탐지할 수도 있으며 그 최근 정보는 능동적으로 디스플레이 될 수도 있는데, 예를 들어, 재무 문서내의 회사의 신용도 (credit rating)가 오래되었음을 표시하고 시스템에 의하여 확인된 좀 더 새로운 정보를 기초하여 새로운 신용도가 디스플레이될 수도 있다. 심층적 분석은 또한 문서내에 주어진 (rendered) 한 세트의 표들을 식별할 수도 있는데, 이 표들에서 기능적 서명 (functional signature)이 분석되어 문서가 공식적인 시의 스테이트먼트들 (official municipal statements)을 포함하는 것으로 인식된다. 그러한 분류 (classification)에 기초하여, 알려진 기능적 블록들이 시스템에 의하여 자동적으로 인식되고 분석된다. 수입 범주들 (revenue categories)의 요약 (summation)에 대한 잘-알려진 기능적 블록에는 주석이 붙혀진다 (annotated). 상기 시스템은 또한 기타 링크된 셀들뿐만아니라 수입 계산들의 소스들도 자동적으로 하이라이트한다 (highlights). 상기 시스템은 정보가 후속 제출시 수정되었음을 표시하는 콜아웃 (callout) 또는 기타 하이라이트를 또한 제공한다.

다른 예에서, 사용자는 상기 시스템에서 제공된 검색 창 (search field)내 ‘수입의 소스들’을 입력한다 (enters). 사용자에 의하여 열람되는 상기 재무 문서는 수입의 소스들에 대한 언급이 없다. 하지만, 사용자의 질문은 심층적 질문 분석 및 시맨틱 정렬 (semantical alignment)을 통해 시스템에 의하여 대답된다. 이런 식으로, 시스템은 수입 구성 (revenue composition)을 위해 기능적 블록에서 수입 컴포넌트들의 명칭과 ‘수입 소스들’의 시맨틱 (semantics)을 정렬한다.

또 다른 예에서, 사용자의 커서가 발견된 지식을 갖는 셀 위에 위치한다고 하자 (예를 들어, 발견된 지식은 계산된 값이고 시스템은 상기 계산 및 의미를 ‘이해’하며; 그리고/또는 상기 셀은 다른 어떤 계산된 값에 대한 소스라고 하자). 이 예에서, 시스템은 어떤 데이터가 상기 셀 값에 영향을 미쳤는지, 그리고 어떤 셀들이 그의 값에 좌우되는지에 대하여 암시한다 (hints). 게다가, 만일 이용가능한 좀 더 최근 정보가 있다면 (예를 들어, 셀은 2011 회계 년도 (FY'2011)의 경상 수입 (operational revenue)을 표시하고 2013 회계 년도 (FY'2013)에 대한 좀 더 최근 정보가 있다면), 시스템은 그러한 업데이트된 정보를 주도적으로 사용자에게 디스플레이해줄 수 있다.

또 다른 예에서, 심층적 문서 분석 및 이해를 통해서, 문서의 프리젠테이션 (presentation)은 보강될 수 있는데, 컨텐츠들의 표, 체인들 (chains), 문서의 상호-비교들 (cross-document comparisons), 등과 같은 추가된 항해 조력물들 (navigational aids)과 함께, 법률 문서내 핵심 개체들의 파생 목록들로 시스템에 의하여 보강될 수 있다. 이 기술을 이용하면, 문서를 열람하는 사람은 문서의 저작자에 의하여 생성되었던 정보, 요약물들 및 상호-관계들에 의하여 제한을 받지 않는다. 후속 데이터 보강 (subsequent data augmentation)으로 원문 (the original)이 덮어쓰이거나/삽입될 (overlaid/embedded) 수 있는데, 이는 문서를 덜 소극적인 정보 배열 (layout)로 만들어, 더욱 라이브 소프트웨어 객체 (a live software object)처럼 만들어 주기 위함이다.

한 실시예에서, 사용자 구성 셋팅들은 사용자들에게 원하는 시맨틱 컨텐트를 디스플레이하기 위해 사용되는, 시각적 표시자, 또는, 기술뿐만아니라 사용자 인터페이스상에서 보여지는 시맨틱 컨텐트의 형태를 컨트롤하기 위해 사용된다. 오버레이 (an overlay), 디스플레이 층 (display layer), 등과 같은, 일부 시각적 표시자들은 추가적인 사용자 개입 (user intervention)의 필요없이 시맨틱 컨텐트를 보여줄 수 있다. 기타 시각적 표시자들은 시맨틱 컨텐트의 일부분을 보여줄 수 있는데, 만약 사용자가 시맨틱 컨텐트의 더 많은 부분을 보기를 원하면, 사용자는 시각적 표시자를 선택할 수 있다. 예를 들어, 정보 버블 (an information bubble)은 시맨틱 컨텐트의 일부분을 보여줄 수 있는데, 만약 사용자가 시맨틱 컨텐트의 더 많은 부분의 열람을 원하면, 사용자는 단순히 정보 버블을 선택하고 그러면 시맨틱 컨텐트가 디스플레이된다 (예를 들어, 새로운 윈도우, 등에서 오버레이로서). 아이콘 (icon)과 같은, 기타 시각적 표시자들은 실제 시맨틱 컨텐트의 많은 부분을 디스플레이하지 않고 이용가능성 및/또는 이용가능한 시맨틱 컨텐트의 형태를 표시할 수 있어서, 사용자는 그 시각적 표시자를 선택하여 관련된 시맨틱 컨텐트를 볼 수 있다. 예를 들어, 만약 사용자가 회사 재무 데이터를 열람하고 있는데 좀 더 새로운 재무 데이터가 이용가능하게 되면, 그 재무 데이터에 인접한 아이콘이 디스플레이 되어 사용자에게 좀 더 새로운 데이터가 이용가능하다는 사실을 알려줄 수 있다. 만약 사용자가 역사적 분석을 수행하고 있다면, 그는 데이터가 오래된 것 (older)이라는 것을 이미 알고 있을 수도 있다. 하지만, 만약 사용자가 현재 분석을 수행하고 있다면, 좀 더 최신의 정보 표시는 매우 중요한 관심거리이고 사용자가 시각적 표시자를 선택하여 좀 더 최신의 재무 데이터를 열람할 수 있게 해준다.

도 4는 심층적 문서 분석에 기초하여 능동적 지식 안내를 제공하는데 사용되는 로직을 보여주는 흐름도를 묘사한 것이다. 처리는 사용자가 문서 (325)를 열람하거나, 또는 열람을 요청하는 단계 (400)에서 시작한다. 분석은 문서를 다양한 섹션으로 쪼개는데 (breaks the document into), 이 섹션들은 지식 관리자 (104)를 사용하여 분석된다. 섹션들은 문서의 챕터들, 문서의 부분들, 문서내의 단락들 (paragraphs) 또는 문장들, 표들, 차트들, 및 문서내의 도면들, 또는 문서의 기타 모든 컴포넌트 부분이 될 수 있다.

단계 (410)에서, 프로세스는 문서 (325)의 제1 섹션을 선택한다. 단계 (420)에서, 프로세스는 상기 선택된 섹션의 심층적 시맨틱 컨텐트 분석을 위하여 지식 관리자 (104)에게 상기 문서의 선택된 섹션을 분석해 달라는 요청을 송신한다. 단계 (425)에서, 프로세스는 상기 선택된 섹션에서 모든 문서간 메타데이터 (inter-document metadata)를 식별한다. 문서간 메타데이터는 문서의 기타 섹션들과 관련된 (pertains to) 메타데이터이다. 예를 들어, 컨텐츠 또는 색인 (index)의 표 (table)는 문서의 다른 영역들을 가리키는 엔트리들을 가질 수 있다. 게다가, 표, 그래프, 또는 도면은 문서의 다른 부분에 위치한 본문 (textual) 섹션을 가질 수 있는데 이것은 상기 표, 그래프, 또는 도면에 대한 분석 또는 기타 지원을 제공한다. 필요하다면, 사용자는 메타데이터와 관련된 컨텐트 (예를 들어, 도면, 등과 관련된 본문 분석 또는 지원의 오버레이)를 제공하는 시각적 표시자들로 식별된 문서간 메타데이터 (inter-document metadata)를 가질 수 있다. 프로세스가 선택된 섹션에서 모든 문서간 메타데이터를 식별하였는지 여부에 대하여 결정이 이루어진다 (결정 (430)). 만약 문서간 메타데이터가 식별되었다면, 결정 (430)은 “예” 가지로 분기하며 (branches to), 그 결과로 (whereupon), 단계 (440)에서, 프로세스는 문서간 메타데이터 및 섹션 식별자를 메모리 영역 (450)내에 유지한다(retain). 다른 한편으로, 만약 어떤 문서간 메타데이터도 식별되지 않았다면 (또는 만약 사용자의 구성 셋팅들이 사용자가 사용자 인터페이스내 문서간 컨텐트를 보고 싶어하지 않는다고 표시한다면), 결정 단계 (430)은 “아니오” 가지로 분기하여, 단계 (440)을 우회한다 (bypassing).

단계 (460)에서, 프로세스는 지식 관리자 (104)에 의하여 수행되고 상기 문서의 선택된 섹션상 수행된 시맨틱 컨텐트 분석을 수신한다. 지식 관리자에 의하여 수행된 시맨틱 컨텐트 분석이 상기 문서의 선택된 섹션과 관련된 어떤 시맨틱 컨텐트를 식별하였는지 여부에 대하여 결정이 이루어진다 (결정 단계(470)). 만약 시맨틱 컨텐트가 식별되었다면, 결정 단계 (470)은 “예” 가지로 분기하며, 그 결과로, 단계 (475)에서, 프로세스는 시맨틱 컨텐트 및 대응하는 섹션 식별자를 메모리 영역 (480)내에 유지한다. 다른 한편으로, 만약 어떤 시맨틱 컨텐트도 지식 관리자 (104)에 의하여 식별되지 않았다면 (또는 만약 사용자의 구성 셋팅들이 사용자가 사용자 인터페이스내 그러한 시맨틱 컨텐트를 보고 싶어하지 않는다고 표시한다면), 결정 단계 (470)은 “아니오” 가지로 분기하여, 단계 (475)를 우회한다.

프로세스에 의하여 분석될 더 많은 섹션들이 문서내 있는지 여부에 대하여 결정이 이루어진다 (결정 단계 (490)). 만약 분석될 더 많은 섹션들이 있다면, 결정 단계 (490)은 “예” 가지로 분기하여 되돌아가는데 (loops back), 그 다음 위에서 기술한 바와 같이 상기 문서의 다음 섹션을 선택 및 처리한다. 이 되돌아가기 (looping)는 문서 (325)의 모든 섹션들의 처리가 완료될 때까지 계속되고, 처리가 완료되는 시점에서 결정 단계 (490)은 “아니오” 가지로 분기하며, 그 결과로, 미리정의된 프로세스 (495)에서, 프로세스는 사용자를 위하여 문서를 준비한다 (처리의 상세 사항들에 대해서는 도 5 와 대응하는 본문을 보라).

도 5는 능동적 지식 안내를 위하여 문서를 준비하는데 사용되는 로직을 보여주는 흐름도를 묘사한 것이다. 처리는 단계 (500)에서 시작하고, 그 다음 단계 (505)에서, 프로세스는 데이터 스토어 (510)으로부터 사용자 구성 셋팅들을 검색한다 (retrieves). 사용자 구성 셋팅들은 디폴트 (default) 값을 가지며 사용자 인터페이스상에 디스플레이 할 메타데이터 및 시맨틱 컨텐트의 형태들을 표시하고 또한 그러한 데이터가 사용자 인터페이스상에서 사용자들에게 어떻게 제공될 것인지를 표시하기 위해 사용자에 의하여 업데이트될 수 있다.

단계 (515)에서, 프로세스는 문서의 제1 섹션을 선택하여 그것을 사용자 인터페이스상에서 디스플레이를 위하여 준비한다. 상기 사용자 구성 셋팅들에 기초하여, 사용자가 문서-내 시각적 표시자 (intra-document visual indicator)를 보고 싶어 하는지 여부에 대하여 결정이 이루어진다 (결정 단계 (520)). 만약 사용자가 문서-내 시각적 표시자들을 보고 싶어 한다면, 결정 단계(520)은 “예” 가지로 분기하여 상기 문서의 선택된 섹션에 대하여 발견된 모든 문서-내 메타데이터를 처리한다. 단계 (525)에서, 프로세스는 상기 문서의 선택된 섹션과 관련된 모든 문서-내 메타데이터를 검색한다. 상기 메타데이터는 메모리 영역 (450)으로부터 검색되는데, 이것은 도 4에서 도시된 처리에 의하여 메모리 영역내 이전에 저장되었던 것이다. 상기 문서의 선택된 섹션에 대하여 어떠한 문서-내 메타데이터가 발견되었는지 여부에 대하여 결정이 이루어진다 (결정 단계 (530)). 만약 상기 문서의 선택된 섹션에 대하여 문서-내 메타데이터가 발견되었다면, 결정 단계 (530)은 “예” 가지로 분기하며, 그 결과로, 단계 (540)에서, 문서-내 시각적 표시자들이 상기 문서의 선택된 섹션이 디스플레이되는 디스플레이 영역에 인접한 사용자 인터페이스상에 제공된다 (rendered). 사용되는 상기 시각적 표시자들은 사용자의 구성 셋팅들에 따른다. 예를 들어, 컨텐츠들의 표 또는 색인 엔트리를 위해서, 사용자는 상기 구성 셋팅들을 세트하여 사용자가 문서내의 섹션으로 항해, 또는 “점프”하기 위해 선택할 수 있는 상기 엔트리에 인접한 아이콘을 디스플레이할 수 있다. 마찬가지로, 사용자는 상기 구성 셋팅들을 세트하여 문서내에서 컨텐트를 위한 버블 또는 오버레이 (a bubble or overlay)를 제공하는데 이것은 표, 그래프, 또는 도면에 관련된 지원 또는 정보를 제공한다. 사용자는 상기 버블 또는 오버레이내의 관련된 컨텐트를 읽거나 또는 상기 버블 또는 오버레이를 선택하여 문서의 지원 섹션으로 항해 (점프)할 수 있다. 결정 단계 (530)으로 돌아가서, 만약 상기 선택된 섹션에 대하여 어떠한 문서-내 메타데이터도 발견되지 않으면, 결정 단계 (530)은 “아니오” 가지로 분기하여 단계 (540)을 우회한다. 또한 결정 단계 (520)으로 돌아가서, 만약 상기 사용자의 구성 셋팅들이 사용자가 문서-내 시각적 표시자들을 보고 싶어하지 않는다고 표시한다면, 결정 단계 (520)은 “아니오” 가지로 분기하여 단계 (525) 내지 단계 (540)을 우회한다.

상기 사용자 구성 셋팅들에 기초하여, 사용자가 상기 문서와 관련된 시맨틱 컨텐트를 보고 싶어 하는지 여부에 대하여 결정이 이루어진다 (결정 단계 (550)). 만약 사용자가 상기 문서와 관련된 시맨틱 컨텐트들을 보고 싶어 한다면, 결정 단계 (550)은 “예” 가지로 분기하여 상기 문서의 선택된 섹션에 대하여 지식 관리자에 의하여 발견된 모든 시맨틱 컨텐트를 처리한다. 상기 문서의 선택된 섹션에 대하여 모든 시맨틱 컨텐트가 발견되었는지 여부에 대하여 결정이 이루어진다 (결정 단계 (560)). 만약 상기 문서의 선택된 섹션에 대하여 지식 관리자에 의하여 시맨틱 컨텐트가 발견되었다면, 결정 단계 (560)는 “예” 가지로 분기하고, 그 결과로, 미리정의된 프로세스 (570)에서, 프로세스는 사용자의 구성 셋팅들에 따라 상기 시맨틱 컨텐트를 디스플레이한다 (처리의 상세 사항들에 대해서는 도 6 및 대응하는 본문을 보라). 다른 한편으로, 만약 상기 문서의 선택된 섹션에 대하여 어떠한 시맨틱 컨텐트가 발견되지 않았다면, 결정 단계 (560)은 “아니오” 가지로 분기하고 미리정의된 프로세스 (570)을 우회한다. 결정 (550)으로 돌아가서, 만약 상기 사용자의 구성 셋팅들이 사용자가 상기 문서와 관련된 시맨틱 컨텐트들을 보고 싶어하지 않는다고 표시한다면, 결정 단계 (550)은 “아니오” 가지로 분기하고 단계 (555) 내지 단계 (570)을 우회한다.

상기 문서에서 처리되어야 할 섹션들이 더 있는지 여부에 대하여 결정이 이루어진다 (결정 단계 (580)). 만약 처리되어야 할 섹션들이 더 있다면, 결정 (580)은 “예” 가지로 분기하여 되돌아가서 위에서 기술한 바와 같이 상기 문서의 다음 섹션을 선택 및 처리한다. 이 되돌아가기는 상기 문서의 모든 섹션들의 처리가 완료될 때까지 계속되며, 완료 시점에서 결정 단계 (580)이 “아니오” 가지로 분기하고, 그 결과로, 미리정의된 프로세스 (590)에서, 프로세스는 사용자에 의한 열람 및 상호작용을 위하여 사용자 인터페이스상에서 문서를 디스플레이한다 (처리의 상세 사항들에 대해서는 도 6 및 대응하는 본문을 보라).

도 6은 시맨틱 컨텐트를 디스플레이 하기 위하여 수행되는 로직을 보여주는 흐름도를 묘사한 것이다. 처리는 단계 (600)에서 시작하고, 단계 (605)에서, 프로세스는 시맨틱 컨텐트가 발견된 문서 섹션의 형태를 식별한다. 단계 (610)에서, 프로세스는 발견된 시맨틱 컨텐트 형태 및 문서 섹션의 형태에 기초하여 상기 사용자 인터페이스와 함께 사용하기 위하여 디스플레이 기술, 또는 시각적 표시자를 식별한다. 결정 단계 (620)으로부터 단계 (670)에까지의 처리는 예시적 사용자 구성 셋팅들에 기초하는데 이들은 만약 사용자가 시각적 표시자 선호 (preference)를 표시하지 않는다면 사용하기 위한 디폴트 값으로 사용될 수도 있다. 단계들 (625), (635), (645), (655), 및 (665)에서 사용되는 시각적 표시자들은 사용자 구성 셋팅들에서 명시된 사용자의 선호에 기초하여 변경될 수 있다. 게다가, 사용자는 특정 형태의 시맨틱 컨텐트는 사용자 인터페이스상에서는 금지되어야 한다고 (inhibited) (보여지지 않아야 한다고) 표시할 수 있다.

다음은 다양한 형태의 시맨틱 컨텐트 및 문서 섹션들에 사용된 도 6에서 보여준 예시적 시각적 표시자들을 기술한 것이다. 발견된 시맨틱 컨텐트가 문서내 차트, 도면, 또는 표와 관련된 추가적인 정보를 제공하는지 여부에 대하여 결정이 이루어진다 (결정 단계 (620)). 만약 상기 시맨틱 컨텐트가 문서내 차트, 도면, 또는 표와 관련된 추가적인 정보를 제공한다면, 결정 단계 (620)은 “예” 가지로 분기하며, 그 결과로, 단계 (625)에서, 프로세스는 문서내 차트/표/도면에 컨트롤을 삽입하는데 이것은 상기 컨트롤이 사용자에 의하여 선택될 때 추가적인 정보가 이용가능함을 사용자에게 알려준다. 처리는 이제 단계 (695)에서 호출 루틴 (calling routine) (도 5를 보라)으로 되돌아간다. 다른 한편으로, 만약 상기 시맨틱 컨텐트가 문서내 차트, 도면, 또는 표와 관련된 추가적인 정보를 제공하지 않는다면, 결정 단계 (620)은 추가 처리를 위하여 “아니오” 가지로 분기한다.

발견된 상기 시맨틱 컨텐트가 문서내의 발견된 정보보다 더 최신의 정보를 제공하는지 여부에 대하여 결정이 이루어진다 (결정 단계 (630)). 예를 들어, 재무 보고서에서, 상기 시맨틱 컨텐트는 새롭게 발표된 (released) 재무 수치들 (figures)일 수 있는데 이것은 문서에서 제공된 수치들보다 더 새로운 것이다. 만약 상기 시맨틱 컨텐트가 문서내의 발견된 정보보다 좀 더 최신의 정보를 제공한다면, 결정 단계 (630)은 “예” 가지로 분기하며, 그 결과로, 단계 (635)에서, 프로세스는 아이콘 또는 오버레이와 같은, 시각적 표시자 경고 (an visual indicator alert)를 삽입하는데, 이것은 상기 시각적 표시자를 통해서 이용가능한 더 최신의 컨텐트와 함께 상기 시맨틱 컨텐트내 이용가능한 좀 더 새로운 컨텐트를 사용자에게 알려준다. 처리는 이제 단계 (695)에서 호출 루틴 (도 5를 보라)으로 되돌아간다. 다른 한편으로, 만약 상기 시맨틱 컨텐트가 문서내 발견된 정보보다 더 최신의 정보를 제공하지 않는다면, 결정 단계 (630)은 추가 처리를 위하여 “아니오” 가지로 분기한다.

발견된 시맨틱 컨텐트가 상기 문서 섹션에 링크된 컨텐트인지 여부에 대하여 결정이 이루어진다 (결정 단계 (640)). 시맨틱 컨텐트 링크의 예는 문서내의 발견된 본문에 대응하는 시맨틱 컨텐트내에서 발견된 차트, 표, 또는 도면일 수 있다. 만약 상기 시맨틱 컨텐트가 상기 문서 섹션과 링크된 컨텐트라면, 결정 단계 (640)은 “예” 가지로 분기하며, 그 결과로, 단계 (645)에서, 프로세스는 문서 디스플레이내에 시각적 표시자 링크를 삽입하는데 이것은 상기 시맨틱 컨텐트를 알려주고 사용자로 하여금 시각적 표시자를 통해 상기 시맨틱 컨텐트를 항해, 또는 열람하도록 해준다. 처리는 이제 단계 (695)에서 호출 루틴 (도 5를 보라)으로 되돌아간다. 다른 한편으로, 만약 상기 시맨틱 컨텐트가 상기 문서 섹션과 링크된 컨텐트가 아니라면, 결정 단계 (640)은 추가 처리를 위하여 “아니오” 가지로 분기한다.

상기 시맨틱 컨텐트가 상기 문서 섹션과 관련되었는지 여부에 대하여 결정이 이루어진다 (결정 단계 (650)). 예를 들어, 상기 문서의 영역과 관련된 것은 관련 서류 (filing), 기사, 연구 (study), 등이다. 만약 상기 시맨틱 컨텐트가 상기 문서 섹션과 관련되었다면, 결정 단계 (650)은 “예” 가지로 분기하며, 그 결과로, 단계 (655)에서, 프로세스는 하이라이트 또는 정보 버블과 같은, 시각적 표시자 경고를 삽입하는데, 이것은 상기 시각적 표시자를 통해 사용자에게 이용가능한 관련 컨텐트와 함께 상기 시맨틱 컨텐트내 이용가능한 관련 정보를 사용자에게 알려준다. 처리는 이제 단계 (695)에서 호출 루틴 (도 5를 보라)으로 되돌아간다. 다른 한편으로, 만약 상기 시맨틱 컨텐트가 상기 문서 섹션과 관련되지 않았다면, 결정 단계 (650)은 추가 처리를 위하여 “아니오” 가지로 분기한다.

상기 문서 또는 상기 시맨틱 컨텐트내 표들 및/또는 도면들과 같은, 데이터가 기능적 블록을 형성하는지 여부에 대하여 결정이 이루어진다 (결정 단계 (660)). 예를 들어, 상기 지식 관리자에 의하여 수행된 심층적 분석은 문서내 주어진 한 세트의 표들을 발견할 수도 있는데, 이 표들에서 기능적인 서명은 상기 문서가 공식적인 시의 스테이트먼트들 (municipal statements)을 포함하는 것으로 인식되도록 분석된다. 그러한 분류에 기초하여, 알려진 기능적 블록들이 인식되고 및 분석된다. 수입 범주들의 요약에 대한 기능적 블록이 시각적 표시자에 의하여 주해가 추가되고 보여질 수 있다. 만약 그러한 기능적 블록이 발견되면, 결정 단계 (660)은 “예” 가지로 분기하며, 그 결과로, 단계 (665)에서, 프로세스는 라이브 코드 객체를 삽입하는데, 이것은 상기 문서 및/또는 관련된 시맨틱 컨텐트내 포함된 도면들과 사용자의 상호작용에 기초한 동적인 계산들을 수행한다. 처리는 이제 단계 (695)에서 호출 루틴 (도 5를 보라)으로 되돌아간다. 다른 한편으로, 만약 기능적 블록이 식별되지 않았다면, 결정 단계 (660)은 추가 처리를 위하여 “아니오” 가지로 분기한다.

단계 (670)에서, 만약 상기 시맨틱 컨텐트가 이전에 설명된 형태들의 시맨틱 컨텐트중 어느 것과도 매치되지 않았다면, 힌트, 링크, 오버레이, 버블, 층, 마크업 (markup), 플라이오버 (a flyover), 윈도우, 등과 같은, 시각적 표시자가 사용자 인터페이스내에 삽입되는데, 이것은 상기 시맨틱 컨텐트를 사용자에게 알려주고 사용자로 하여금 전술한 컨텐트를 열람하도록 해준다. 처리는 이제 단계 (695)에서 호출 루틴 (도 5를 보라)으로 되돌아간다.

도 7은 시맨틱 컨텐트를 가진 문서에 사용되는 로직을 보여주는 흐름도를 묘사한 것이다. 처리는 단계 (700)에서 시작하는데, 그 결과로, 단계 (705)에서, 프로세스는 문서 및 다양한 시각적 표시자들이 디스플레이되는 사용자 인터페이스와 상호작용하는 사용자로부터 사용자 입력을 수신한다. 사용자가 프로세스를 빠져나와 (exit) 사용자 인터페이스를 사용하여 문서 열람하는 것을 중단하고 싶어하는지 여부에 대하여 결정이 이루어진다 (결정 단계 (710)). 만약 사용자가 빠져나가지 않는다면, 결정 단계 (710)은 “아니오” 가지로 분기하여 사용자의 입력을 처리한다. 아래 기술하는 바와 같이, 사용자의 입력은 프로세스를 빠져나갈 때까지 계속적으로 처리되고, 프로세스를 빠져나가는 시점에서 결정 단계 (710)은 “예” 가지로 분기하며 처리는 단계 (795)에서 종료된다.

사용자의 입력이 문서 차트, 표, 또는 도면에 관한 추가적인 정보를 디스플레이하기 위해 사용된 문서 차트, 표, 또는 도면과 관련된 시각적 표시자의 선택인지 여부에 대하여 결정이 이루어진다. 만약 사용자의 입력이 그러한 시각적 표시자의 선택이라면, 결정 단계 (720)은 “예” 가지로 분기하며, 그 결과로, 단계 (725)에서, 프로세스는 상기 차트, 표, 또는 도면과 관련된 추가적인 시맨틱 컨텐트를 디스플레이하는 오버레이, 층, 마크업, 플라이오버, 윈도우, 등을 디스플레이한다. 상기 시맨틱 컨텐트를 디스플레이 하는데 사용되는 기술은 사용자의 구성 셋팅들에 기초한다. 처리는 단계 (705)로 되돌아가 다음 사용자 입력을 수신한다. 다른 한편으로, 만약 사용자의 입력이 문서 차트, 표, 또는 도면과 관련된 시각적 표시자의 선택이 아니라면, 결정 단계 (720)은 추가 처리를 위하여 “아니오” 가지로 분기한다.

사용자의 입력이 사용자에게 문서를 위해 이용가능한 좀 더 최신의 컨텐트를 알려주는 시각적 표시자의 선택인지 여부에 대하여 결정이 이루어진다 (결정 단계 (730)). 만약 사용자의 입력이 사용자에게 문서를 위해 이용가능한 좀 더 최신의 컨텐트를 알려주는 시각적 표시자의 선택이라면, 결정 단계 (730)은 “예” 가지로 분기하며, 그 결과로, 단계 (735)에서, 프로세스는 문서와 관련된 새로운 시맨틱 컨텐트를 디스플레이하는 오버레이, 층, 마크업, 플라이오버, 윈도우, 등을 디스플레이한다. 상기 좀 더 최신의 컨텐트를 디스플레이하기 위해 사용되는 기술은 사용자의 구성 셋팅들에 기초한다. 처리는 단계 (705)로 되돌아가 그 다음 사용자 입력을 수신한다. 다른 한편으로, 만약 사용자의 입력이 사용자에게 문서를 위해 이용가능한 좀 더 최신의 컨텐트를 알려주는 시각적 표시자의 선택이 아니라면, 결정 단계 (730)은 추가 처리를 위하여 “아니오” 가지로 분기한다.

사용자의 입력이 문서와 관련된 컨텐트에 대한 링크의 선택인지 여부에 대하여 결정이 이루어진다 (결정 단계 (740)). 만약 사용자의 입력이 문서와 관련된 컨텐트에 대한 링크의 선택이라면, 결정 단계 (740)은 “예” 가지로 분기하며, 그 결과로, 상기 링크가 문서내의 컨텐트 (문서내의 메타데이터)에 대한 것인지 또는 지식 관리자에 의하여 식별된 외부 시맨틱 컨텐트에 대한 것인지 여부에 대하여 결정이 이루어진다 (결정 단계 (745)). 만약 상기 링크가 문서-내 메타데이터에 대한 것이라면, 결정 단계 (745)는 “예” 가지로 분기하며, 그 결과로, 단계 (750)에서, 디스플레이 되는 문서의 부분은 상기 링크에 의하여 참조되는 부분 (예를 들어, 색인에 의하여 참조되는 페이지 또는 컨텐츠 엔트리의 표, 등) 으로 점프한다. 다른 한편으로, 만약 상기 링크가 지식 관리자에 의하여 식별된 외부 시맨틱 컨텐트에 대한 것이라면, 결정 단계 (745)는 “아니오” 가지로 분기하며, 그 결과로, 단계 (755)에서, 프로세스는 사용자에 의하여 선택된 문서의 부분과 관련된 시맨틱 컨텐트를 디스플레이하는 오버레이, 층, 마크업, 플라이오버, 윈도우, 등을 디스플레이한다. 상기 시맨틱 컨텐트를 디스플레이 하기 위해 사용되는 기술은 사용자의 구성 셋팅들에 기초한다. 처리는 단계 (705)로 되돌아가 그 다음 사용자 입력을 수신한다. 결정 단계 (740)으로 돌아가서, 만약 상기 사용자의 입력이 문서와 관련된 컨텐트에 대한 링크의 선택이 아니라면, 결정 단계 (740)은 추가 처리를 위하여 “아니오” 가지로 분기한다.

상기 사용자의 입력이 문서와 관련되고 지식 관리자에 의하여 발견된 외부 시맨틱 컨텐트에 대한 링크의 선택인지 여부에 대하여 결정이 이루어진다 (결정 단계 (760)). 만약 상기 사용자의 입력이 지식 관리자에 의하여 발견된 외부 시맨틱 컨텐트에 대한 링크의 선택이라면, 결정 단계 (760)은 “예” 가지로 분기하며, 그 결과로, 단계 (765)에서, 프로세스는 사용자에 의하여 선택된 문서의 부분과 관련된 외부 시맨틱 컨텐트를 디스플레이하는 오버레이, 층, 마크업, 플라이오버, 윈도우, 등을 디스플레이한다. 상기 시맨틱 컨텐트를 디스플레이하기 위해 사용되는 기술은 사용자의 구성 셋팅들에 기초한다. 처리는 단계 (705)로 되돌아가 그 다음 사용자 입력을 수신한다. 다른 한편으로, 만약 상기 사용자의 입력이 외부 시맨틱 컨텐트에 대한 링크의 선택이 아니라면, 결정 단계 (760)은 추가 처리를 위하여 “아니오” 가지로 분기한다.

상기 사용자의 입력이 문서내 또는 지식 관리자에 의하여 발견된 시맨틱 컨텐트내 기능적 블록과 관련된 라이브 코드 객체 (a live code object)의 선택인지 여부에 대하여 결정이 이루어진다 (결정 단계 (770)). 만약 상기 사용자의 입력이 라이브 코드 객체의 선택이라면, 결정 단계 (770)은 “예” 가지로 분기하며, 그 결과로, 단계 (775)에서, 프로세스는 사용자 인터페이스 및 문서 및/또는 시맨틱 컨텐트 내에서 발견된 데이터의 기능적 블록, 또는 블록들과 사용자의 상호작용에 기초하여 동적으로 계산들을 수행한다. 상기 계산들을 디스플레이하기 위해 사용되는 기술은 사용자의 구성 셋팅들에 기초한다. 처리는 단계 (705)로 되돌아가 그 다음 사용자 입력을 수신한다. 다른 한편으로, 만약 상기 사용자의 입력이 라이브 코드 객체의 선택이 아니라면, 결정 단계 (770)은 추가 처리를 위하여 “아니오” 가지로 분기한다.

상기 사용자의 입력이 사용자 인터페이스내에서 발견된 검색창내 질문의 엔트리인지 여부에 대하여 결정이 이루어진다 (결정 단계 (780)). 만약 상기 사용자의 입력이 사용자 인터페이스내에서 발견된 검색창내 질문의 엔트리라면, 결정 단계 (780)은 “예” 가지로 분기하며, 그 결과로, 미리정의된 프로세스 (785)에서, 심층적 자연어 (NL) 분석이 상기 사용자의 질문에 기초하여 지식 관리자에 의하여 수행된다 (처리의 상세 사항들에 대해서는 도 8 및 대응하는 본문을 보라). 처리는 단계 (705)로 되돌아가 그 다음 사용자 입력을 수신한다. 다른 한편으로, 만약 상기 사용자의 입력이 검색창 내 질문의 엔트리가 아니라면, 결정 단계 (770)은 “아니오” 가지로 분기하며, 그 결과로, 단계 (790)에서, 사용자의 구성 셋팅들을 편집하거나 또는 지식 베이스 (106)내의 문서들 또는 관련 사항들을 업데이트하는 것, 등과 같이, 일부 기타 형태의 사용자 입력이 처리된다. 지식 베이스 (knowledge base) (106)을 업데이트하는 것은 지식 관리자 및 사용자 사이에 교환되는 지식에 좌우된다. 회사의 신용도 (rating)가 변경된 경우, 사용자는 (예를 들어, 재무 분석가, 등) 상기 변경의 이유에 관한 추가적인 정보를 공급한다. 어떤 종류의 입력 기술도 지식 관리자를 업데이트하기 위하여 여기서 사용될 수 있다. 문서 (text)의 입력, 추가된 링크들, 등은 단계 (790)에서 취합되어 지식 베이스 (106)에 대한 업데이트를 위하여 지식 관리자로 전송될 수 있다. 예를 들어, 법률 문서 셋팅에서, 시스템은 관련된 사례들을 검색하고 인간 사용자는 제공된 사례들을 제거하거나 또는 다시 등급을 매길 수 있다 (re-rank). 처리는 단계 (705)로 되돌아가 그 다음 사용자 입력을 수신한다.

도 8은 시맨틱 컨텐트에 대한 요청들을 서비스하기 (serve) 위해 지식 관리자에 의하여 수행되는 로직을 보여주는 흐름도를 묘사한 것이다. 한 실시예에서 처리는 단계 (800)에서 시작하는데, 그 결과로, 단계 (810)에서, 프로세스는 사용자 인터페이스의 엔트리창에서 사용자에 의한 자연어 질문 입력을 수신한다. 단계 (820)에서, 프로세스는 광범위한 지식 베이스 (106)을 활용하여 심층적 시맨틱 분석을 하기 위해 자연어 질문을 지식 관리자 (104)에게 송신한다. 지식 베이스 (106)은 문서들 및 기타 컨텐츠들의 방대한 어레이를 포함하고 문서를 디스플레이하기 위하여 준비할 때 문서 컨텐트 (325)뿐만아니라 지식 관리자에 의하여 이전에 식별된 시맨틱 컨텐트 (480)도 또한 포함함을 주목해야 한다.

단계 (830)에서, 프로세스는 지식 관리자 (104)로부터 응답을 수신한다. 상기 응답은 자연어 질문에 대한 대답일 수 있으며 문서 (325)내 발견된 컨텐트 (예를 들어, 시맨틱 컨텐트, 등), 이전에 식별된 시맨틱 컨텐트 (480), 또는 지식 베이스 (106)내에서 발견된 기타 컨텐트를 제공할 수 있다. 단계 (840)에서, 상기 수신된 대답(들) 및/또는 지식 관리자로부터 수신된 컨텐트가 사용자 인터페이스상의 사용자에게 디스플레이 된다. 상기 대답(들) 및/또는 컨텐트를 디스플레이 하기 위해 사용되는 기술은 사용자의 구성 셋팅들에 기초한다. 처리는 그 후에 단계 (895)에서 호출 루틴 (도 7을 보라)으로 되돌아간다.

도면들내 흐름도 및 블록 다이어그램들은 본 발명의 여러 실시예들에 따른 시스템들, 방법들 및 컴퓨터 프로그램 제품들의 가능한 구현들의 아키텍처, 기능성, 및 동작을 예시한다. 이와 관련하여, 상기 흐름도 또는 블록 다이어그램들내 각 블록은 상기 명시된 논리적 기능(들)을 구현하기 위한 하나 또는 그 이상의 실행 가능한 명령들을 포함한 모듈, 세그먼트 또는 코드의 일부분을 나타낼 수 있다. 일부 다른 구현들에서, 상기 블록에 언급되는 기능들은 도면들에 언급된 순서와 다르게 일어날 수도 있다는 것에 또한 유의해야 한다. 예를 들면, 연속으로 도시된 두 개의 블록들은 실제로는 사실상 동시에 실행될 수 있고, 또는 이 두 블록들은 때때로 관련된 기능성에 따라서는 역순으로 실행될 수도 있다. 블록 다이어그램들 및/또는 흐름도 예시의 각 블록, 및 블록 다이어그램들 및/또는 흐름도 예시 내의 블록들의 조합들은 특수목적용 하드웨어 및 컴퓨터 명령들의 명시된 기능들 또는 동작들, 또는 이들의 조합들을 수행하는 특수목적용 하드웨어-기반 시스템들에 의해 구현될 수 있다는 것에 또한 유의한다.

본 발명의 특정한 실시예들이 도시되고 기술되었지만, 이하 개시되는 사항들에 기초하여 본 발명 및 그것의 더 넓은 실시예들로부터 벗어남이 없이 전기한 변경들 및 수정들이 이루어질 수 있다는 것은 당업자들에게는 자명할 것이다. 그러므로, 첨부된 청구범위들은 본 발명의 진정한 정신 및 범위내에 존재하듯이 그들의 범위내에 전술한 모든 변경들 및 수정들을 포함한다 (encompass). 나아가서, 본 발명은 상기 첨부된 청구범위들에 의해서만 한정된다는 것을 이해해야 한다. 만약 도입된 청구범위 구성요소 (element)의 특정 수치 (a specific number)가 포함된다면, 그러한 의도는 상기 청구범위내 명확히 인용될 것이며 (recited), 그리고 그러한 인용이 없는 경우에는 그러한 한정이 존재하지 않는다는 것을 당업자는 이해할 것이다. 이해를 돕기 위한 목적으로서, 비-제한적 예를 위해, 다음의 첨부된 청구범위는 청구범위 구성요소들을 도입하기 위하여 “적어도 한 개의” 및 “하나 또는 그 이상의” 같은 도입 문구들의 사용을 포함한다. 하지만, 그러한 문구들을 사용하는 것이, 동일 청구항이 “하나 또는 그 이상의 (one or more)” 또는 “적어도 하나의 (at least one)”라는 문구도 포함하고 단수 표시도 포함할 때 조차도, 단수로 표시된 청구범위 구성요소의 도입이 그러한 청구범위 구성요소를 포함하는 모든 특정 청구항을 오직 하나의 그러한 구성요소를 포함하는 발명들로 한정하는 것으로 암시하는 것으로 해석되어서는 안된다.

Claims

프로세서 및 메모리를 포함하는 정보 처리 시스템에서, 지식-기반 정보를 제공하는 방법에 있어서, 상기 방법은:
상기 정보 처리 시스템에 의하여, 문서에 관하여 시맨틱 분석 (a semantic analysis 을 수행하는 단계 - 상기 분석은 시맨틱 컨텐트의 하나 또는 그 이상 세트들을 만들고 (result in), 상기 시맨틱 컨텐트 세트들 각각은 상기 문서의 영역에 대응함 - ;
상기 정보 처리 시스템에 의하여, 사용자 인터페이스에서 상기 시맨틱 컨텐트 세트들의 이용가능성을 보여주는 시각적 표시자들 (visual indicators)을 사용하여 상기 문서의 대응 영역을 시각적으로 표시하는 단계; 및
사용자 선택에 응답하여 시맨틱 컨텐트의 선택된 세트를 디스플레이하는 단계를 포함하는
방법.
제 1항에 있어서, 상기 시각적으로 표시하는 단계는 상기 대응 영역상에 하이라이트 (a highlight)를 디스플레이하는 단계, 상기 대응 영역에 인접하여 오버레이 (an overlay)를 디스플레이하는 단계, 상기 대응 영역에 인접하여 주석 (an annotation)을 디스플레이하는 단계, 상기 대응 영역에 인접하여 정보 버블 (an information bubble)을 디스플레이하는 단계, 상기 대응 영역에 인접하여 마크업 (a markup)을 디스플레이하는 단계, 상기 대응 영역에 인접하여 디스플레이 층 (a display layer)을 디스플레이하는 단계, 상기 대응 영역에 인접하여 플라이오버 (a flyover)를 디스플레이하는 단계, 및 상기 대응 영역에 인접하여 선택가능한 아이콘 (a selectable icon)을 디스플레이하는 단계로 구성되는 그룹으로부터 선택되는
방법.
제 1항에 있어서, 상기 방법은:
시맨틱 컨텐트의 상기 선택된 세트의 형태 (a type of the selected set of semantic content)를 식별하는 단계를 더 포함하고, 상기 시맨틱 컨텐트의 형태는 차트 또는 표에 대한 추가적인 정보, 문서 컨텐트보다 좀 더 최신의 정보, 상기 문서 영역에 링크된 시맨틱 컨텐트, 상기 문서 영역에 관련된 시맨틱 컨텐트, 그리고 기능적 블록을 형성하는 관련된 시맨틱 컨텐트로 구성되는 그룹으로부터 선택되는
방법.
제 3항에 있어서, 상기 방법은:
상기 시각적 표시자에 대응하는 시맨틱 컨텐트의 상기 세트의 이용가능성을 보여주기 위해 사용되는 시각적 표시자를 선택하는 단계를 더 포함하고, 상기 시각적 표시자의 선택은 상기 시맨틱 컨텐트의 식별된 형태에 기초하는
방법.
제 4항에 있어서, 상기 사용자 선택에 응답하여 시맨틱 컨텐트의 상기 선택된 세트를 디스플레이하는 단계는:
상기 시맨틱 컨텐트의 식별된 형태를 만났을 때 (encountered) 이용할 시각적 표시자를 식별하는 사용자 구성 셋팅을 검색하는 단계 (retrieving);
상기 식별된 시각적 표시자에 기초하여 사용자 인터페이스에서 사용자 요청을 수신하는 대신에 상기 대응 영역에 인접하여 시맨틱 컨텐트의 상기 세트를 자동적으로 디스플레이하는 단계 (displaying)를 더 포함하고, 상기 식별된 시각적 표시자는 정보 버블 (an information bubble), 디스플레이 층 (a display layer) 및 플라이오버 (a flyover)로 구성되는 그룹으로부터 선택되는
방법.
제 1항에 있어서, 상기 방법은:
시맨틱 컨텐트의 상기 선택된 세트를 디스플레이하는 사용자 인터페이스에서, 사용자로부터 데이터 변경을 수신하는 단계; 및
상기 수신된 데이터 변경에 기초하여 시맨틱 컨텐트의 상기 세트들을 포함하는 지식 베이스 (a knowledge base) 업데이트하는 단계를 더 포함하는
방법.
제 1항에 있어서, 상기 방법은:
상기 시맨틱 분석을 위한 요청을 질문 대답 (QA) 시스템으로 전송하는 단계를 더 포함하고, 상기 시맨틱 분석의 수행은 지식 관리자로부터 상기 시맨틱 분석을 수신하는 단계를 포함하는
방법.
정보 처리 시스템에 있어서, 상기 시스템은:
하나 또는 그 이상의 프로세서들;
상기 프로세서들중 적어도 하나에 접속되는 메모리;
디스플레이; 및
지식-기반의 정보 (knowledge-based information)를 제공하기 위하여 상기 메모리내에 저장되고 상기 프로세서들중 적어도 하나에 의하여 실행되는 한 세트의 명령들을 포함하되, 상기 명령들의 세트는:
문서에 관하여 시맨틱 분석 (a semantic analysis)을 수행하는 단계 - 상기 분석은 시맨틱 컨텐트의 하나 또는 그 이상 세트들을 만들고 (result in), 상기 시맨틱 컨텐트 세트들 각각은 상기 문서의 영역에 대응함 - ;
사용자 인터페이스에서 상기 시맨틱 컨텐트 세트들의 이용가능성을 보여주는 시각적 표시자들 (visual indicators)을 사용하여 상기 문서의 대응 영역들을 시각적으로 표시하는 단계; 및
사용자 선택에 응답하여 시맨틱 컨텐트의 선택된 세트를, 상기 디스플레이상에, 디스플레이하는 단계의 동작들 (actions)을 수행하는
시스템.
제 8항에 있어서, 상기 시각적으로 표시하는 단계는 상기 대응 영역상에 하이라이트 (a highlight)를 디스플레이하는 단계, 상기 대응 영역에 인접하여 오버레이 (an overlay)를 디스플레이하는 단계, 상기 대응 영역에 인접하여 주석 (an annotation)을 디스플레이하는 단계, 상기 대응 영역에 인접하여 정보 버블 (an information bubble)을 디스플레이하는 단계, 상기 대응 영역에 인접하여 마크업 (a markup)을 디스플레이하는 단계, 상기 대응 영역에 인접하여 디스플레이 층 (a display layer)을 디스플레이하는 단계, 상기 대응 영역에 인접하여 플라이오버 (a flyover)를 디스플레이하는 단계, 및 상기 대응 영역에 인접하여 선택가능한 아이콘 (a selectable icon)을 디스플레이하는 단계로 구성되는 그룹으로부터 선택되는
시스템.
제 8항에 있어서, 상기 동작들은:
시맨틱 컨텐트의 상기 선택된 세트의 형태 (a type of the selected set of semantic content)를 식별하는 단계를 더 포함하고, 상기 시맨틱 컨텐트의 형태는 차트 또는 표에 대한 추가적인 정보, 문서 컨텐트보다 좀 더 최신의 정보, 상기 문서 영역에 링크된 시맨틱 컨텐트, 상기 문서 영역에 관련된 시맨틱 컨텐트, 그리고 기능적 블록을 형성하는 관련된 시맨틱 컨텐트로 구성되는 그룹으로부터 선택되는
시스템.
제 10항에 있어서, 상기 동작들은:
시맨틱 컨텐트의 상기 세트들중 하나를 상기 문서의 일부분에 대한 업데이트된 정보로서 식별하는 단계를 더 포함하고, 상기 문서의 일부분에 인접하여 디스플레이 되는 상기 시각적 표시자는 상기 업데이트된 정보가 상기 문서의 일부분보다 더 새롭다고 표시하는
시스템.
제 11항에 있어서, 상기 사용자 선택에 응답하여 시맨틱 컨텐트의 상기 선택된 세트를 디스플레이하는 단계는:
상기 시맨틱 컨텐트의 식별된 형태를 만났을 때 (encountered) 이용할 시각적 표시자를 식별하는 사용자 구성 셋팅을 검색하는 단계 (retrieving);
상기 식별된 시각적 표시자에 기초하여 사용자 인터페이스에서 사용자 요청을 수신하는 대신에 상기 대응 영역에 인접하여 시맨틱 컨텐트의 상기 세트를 자동적으로 디스플레이하는 단계 (displaying)를 더 포함하고, 상기 식별된 시각적 표시자는 정보 버블 (an information bubble), 디스플레이 층 (a display layer) 및 플라이오버 (a flyover)로 구성되는 그룹으로부터 선택되는
시스템.
제 8항에 있어서, 상기 동작들은:
시맨틱 컨텐트의 상기 선택된 세트를 디스플레이하는 사용자 인터페이스에서, 사용자로부터 데이터 변경을 수신하는 단계; 및
상기 수신된 데이터 변경에 기초하여 시맨틱 컨텐트의 상기 세트들을 포함하는 지식 베이스 (a knowledge base)를 업데이트하는 단계를 더 포함하는
시스템.
제 8항에 있어서, 상기 동작들은:
상기 시맨틱 분석을 위한 요청을 질문 대답 (QA) 시스템으로 전송하는 단계를 더 포함하고, 상기 시맨틱 분석의 수행은 지식 관리자로부터 상기 시맨틱 분석을 수신하는 단계를 포함하는
시스템.
컴퓨터 판독가능 매체내 저장되어, 정보 처리 시스템에 의하여 실행될 때, 상기 정보 처리 시스템이 동작들을 수행하게 함으로써 지식-기반 정보를 제공하도록 해주는 컴퓨터 명령들을 포함하는 컴퓨터 프로그램 제품에 있어서, 상기 동작들은:
문서에 관하여 시맨틱 분석(a semantic analysis)을 수행하는 단계 - 상기 분석은 시맨틱 컨텐트의 하나 또는 그 이상 세트들을 만들고 (result in), 상기 시맨틱 컨텐트 세트들 각각은 상기 문서의 영역에 대응함 - ;
사용자 인터페이스에서 상기 시맨틱 컨텐트 세트들의 이용가능성을 보여주는 시각적 표시자들 (visual indicators)을 사용하여 상기 문서의 대응 영역들을 시각적으로 표시하는 단계; 및
사용자 선택에 응답하여 시맨틱 컨텐트의 선택된 세트를 디스플레이하는 단계를 포함하는
컴퓨터 프로그램 제품.
제 15항에 있어서, 상기 시각적으로 표시하는 단계는 상기 대응 영역상에 하이라이트 (a highlight)를 디스플레이하는 단계, 상기 대응 영역에 인접하여 오버레이 (an overlay)를 디스플레이하는 단계, 상기 대응 영역에 인접하여 주석 (an annotation)을 디스플레이하는 단계, 상기 대응 영역에 인접하여 정보 버블 (an information bubble)을 디스플레이하는 단계, 상기 대응 영역에 인접하여 마크업 (a markup)을 디스플레이하는 단계, 상기 대응 영역에 인접하여 디스플레이 층 (a display layer)을 디스플레이하는 단계, 상기 대응 영역에 인접하여 플라이오버 (a flyover)를 디스플레이하는 단계, 및 상기 대응 영역에 인접하여 선택가능한 아이콘 (a selectable icon)을 디스플레이하는 단계로 구성되는 그룹으로부터 선택되는
컴퓨터 프로그램 제품.
제 15항에 있어서, 상기 동작들은:
시맨틱 컨텐트의 상기 선택된 세트의 형태 (a type of the selected set of semantic content)를 식별하는 단계를 더 포함하고, 상기 시맨틱 컨텐트의 형태는 차트 또는 표에 대한 추가적인 정보, 문서 컨텐트보다 좀 더 최신의 정보, 상기 문서 영역에 링크된 시맨틱 컨텐트, 상기 문서 영역에 관련된 시맨틱 컨텐트, 그리고 기능적 블록을 형성하는 관련된 시맨틱 컨텐트로 구성되는 그룹으로부터 선택되는
컴퓨터 프로그램 제품.
제 17항에 있어서, 상기 동작들은:
상기 시각적 표시자에 대응하는 시맨틱 컨텐트의 상기 세트의 이용가능성을 보여주기 위해 사용되는 시각적 표시자를 선택하는 단계를 더 포함하고, 상기 시각적 표시자의 선택은 상기 시맨틱 컨텐트의 식별된 형태에 기초하는
컴퓨터 프로그램 제품.
제 19항에 있어서, 상기 사용자 선택에 응답하여 시맨틱 컨텐트의 상기 선택된 세트를 디스플레이하는 단계는:
상기 시맨틱 컨텐트의 식별된 형태를 만났을 때 (encountered) 이용할 시각적 표시자를 식별하는 사용자 구성 셋팅을 검색하는 단계 (retrieving);
상기 식별된 시각적 표시자에 기초하여 사용자 인터페이스에서 사용자 요청을 수신하는 대신에 상기 대응 영역에 인접하여 시맨틱 컨텐트의 상기 세트를 자동적으로 디스플레이하는 단계 (displaying)를 더 포함하고, 상기 식별된 시각적 표시자는 정보 버블 (an information bubble), 디스플레이 층 (a display layer) 및 플라이오버 (a flyover)로 구성되는 그룹으로부터 선택되는
컴퓨터 프로그램 제품.
제 15항에 있어서, 상기 동작들은:
시맨틱 컨텐트의 상기 선택된 세트를 디스플레이하는 사용자 인터페이스에서, 사용자로부터 데이터 변경을 수신하는 단계; 및
상기 수신된 데이터 변경에 기초하여 시맨틱 컨텐트의 상기 세트들을 포함하는 지식 베이스 (a knowledge base)를 업데이트하는 단계를 더 포함하는
컴퓨터 프로그램 제품.