KR20050085012A - 문서의 일부분의 해석된 의미를 나타내는 방법, 문서의일부분을 명확하게 하는 방법 및 프로그램 저장 장치 - Google Patents

문서의 일부분의 해석된 의미를 나타내는 방법, 문서의일부분을 명확하게 하는 방법 및 프로그램 저장 장치 Download PDF

Info

Publication number
KR20050085012A
KR20050085012A KR1020057008822A KR20057008822A KR20050085012A KR 20050085012 A KR20050085012 A KR 20050085012A KR 1020057008822 A KR1020057008822 A KR 1020057008822A KR 20057008822 A KR20057008822 A KR 20057008822A KR 20050085012 A KR20050085012 A KR 20050085012A
Authority
KR
South Korea
Prior art keywords
interpreted
storage device
document
program storage
meaning
Prior art date
Application number
KR1020057008822A
Other languages
English (en)
Inventor
다니엘 포드
크리스탈 폴락
Original Assignee
인터내셔널 비지네스 머신즈 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 인터내셔널 비지네스 머신즈 코포레이션 filed Critical 인터내셔널 비지네스 머신즈 코포레이션
Publication of KR20050085012A publication Critical patent/KR20050085012A/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Library & Information Science (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Machine Translation (AREA)
  • User Interface Of Digital Computer (AREA)
  • Digital Computer Display Output (AREA)

Abstract

본 발명은 텍스트 또는 이미지와 같은 비텍스트인 문서 부분 근방에 상기 해석된 의미의 표시를 디스플레이함으로써 문서의 일부의 해석된 의미를 표시하는 것에 관한 것이다. 이 표시는 (관련 코드가 없는) 심벌 또는 (특정 기능을 활성호시키는 관련 코드를 갖는) 아이콘일 수도 있다. 또한 본 발명은 문서의 부분 중 적어도 두 개의 다르게 해석된 의미의 표시를 제공하는 단계와, 해석된 의미 중 선택된 하나의 의미에 응답하여 선택된 해석된 의미의 표시를 디스플레이하는 단계를 포함하는 문서의 일부의 명확화에 관한 것이다.

Description

문서의 일부분의 해석된 의미를 나타내는 방법, 문서의 일부분을 명확하게 하는 방법 및 프로그램 저장 장치{GRAPHICAL FEEDBACK FOR SEMANTIC INTERPRETATION OF TEXT AND IMAGES}
본 발명은 텍스트 및 이미지의 해석된 의미를 나타내고, 복수 의미를 명확하게 하는 시각 인터페이스(visual interface) 및 이 인터페이스를 생성하는 기본적인 방법에 관한 것이다.
사용자가, 예를 들어 전자 캘린더, 일정표(to-do list) 또는 워드 프로세싱 프로그램과 같은 컴퓨터 기반 시스템에 텍스트를 입력할 때, 텍스트의 의미에 기초하여 입력 동작에 이용할 수 있는 툴이 있다. 예를 들면, 액티브 캘린더(Ford 등의 미국 특허 제 6,480,830 호에 개시되어 있는 바와 같이)는 캘린더 엔트리를 분석하여 자동으로 이용가능한 항공편(airline flight availability)을 검사하고, 회의실(conference room)을 예약하고, 참석자(attendees)를 통지할 수 있다. 이들 기능을 수행하기 위해, 캘린더 프로그램이 텍스트 엔트리의 의미를 정확하게 해석하는 것이 필수적이다. "fly to CA"에 대한 엔트리는 캐나다로의 비행 또는 캘리포니아로의 비행을 나타낼 수 있다. 따라서 사용자는 San diego가 아니라 Saskatoon으로 정확하게 종료해야 하며, 시스템은 사용자에게 텍스트가 어떻게 해석되었는 지를 편리하게 나타내어야 하고 시스템이 문맥 또는 다른 단서로부터 유일한 의미를 식별할 수 없는 경우에는 다른 의미들 사이에서 선택하는 방법을 제공해야 한다.
한 방법 또는 다른 방법으로 텍스트를 해석하지만 원하는 기능은 제공하지 않는 다른 시스템이 공지되어 있다. Kupiec의 미국 특허 제 5,500,920 호에 그 일례가 있는데, 여기서는 질의 목적으로 스피치(또는 다른 비기계식 포맷(non-machine ready format)이 기계식 심벌의 스트링으로 번역된다. 그 다음에 컴퓨터는 텍스트 분석 및 가설 테스팅(hypothesis testing)을 이용하여 명확화 처리를 수행한다. 이 시스템은 의미를 나타내는 시각 피드백 메커니즘을 제공하지 않고, 명확화 방법(disambiguation method)을 제공하지도 않는다.
Hedin 등의 미국 특허 5,386,556 호에는 다른 예가 개시되어 있다. 여기서는 자연어 분석기가 텍스트를 해석하지만, 그 결과는 텍스트 그 자체와는 별도로 스피치의 일부를 나타내는 텍스트를 포함하는 "입력의 논리 형식 표현"이다.
미국 특허 제 5,960,384 호에는, 텍스트 구문 분석기(parser)가 단어를 "픽처(pictures)"(즉, 명사) 또는 "관계(relations)"(즉, 형용사 또는 동사)로서 지정하고 이들을 별개의 포맷(박스, 괄호)으로 표시하지만, 의미 또는 명확화 방법을 나타내는 시각 피드백 메커니즘을 제공하는 데에는 실패한다.
로봇에 의한 커맨드 처리에서의 명확성은 2000년 6월 카네기 멜론 대학에서의 Workshop on Interactive Robotics in Entertainment에서 Perzanowski 등에 의해 재기된 "Towards Seamless Integration in a Multimodal Interface"에서 다루어졌지만, 사용자는 추가적인 정보에 대해 로봇에 의해 질문을 받는다. 텍스트와 관련된 시각 표시는 언급이 없다.
따라서, 사용자가 선택된 의미가 올바른지를 확인하기 위해 텍스트의 일부(또는 전체 문서)의 해석된 의미를 나타내도록 텍스트 근방에 시각 피드백 메커니즘을 갖는 것이 바람직하다.
도 1은 시각 피드백 메커니즘의 일례를 도시한 도면.
도 2는 이미지에 인가된 시각 피드백 메커니즘을 도시한 도면.
도 3은 시스템의 아키텍처를 도시한 도면.
도 4는 온톨로지의 구성을 도시한 도면.
도 5는 도 3으로부터의 키워드/URL/미디어 데이터베이스 내의 엔트리의 간략화된 예를 도시한 도면.
본 발명은 문서 부분 근방에 해석된 의미의 표시를 디스플레이함으로써 문서의 일부의 해석된 의미를 나타내는 방법을 제공한다.
이 부분은 텍스트일 수도 있고, 이미지와 같이 비 텍스트(non-text)일 수도 있다. 표시는 심벌(관련 코드가 없는) 또는 아이콘(지정된 기능을 활성화시키는 관련 코드를 갖는)일 수도 있다. 문서의 일부를 명확하게 하는 방법은 또한 문서 부분의 적어도 두 개의 다른 의미의 표시를 제공하는 단계와, 선택되는 해석된 의미들 중 하나에 응답하여 선택된 해석된 의미의 표시를 디스플레이하는 단계를 포함한다.
본 발명의 특징 및 이점을 보다 완벽하게 이해하기 위해, 첨부 도면과 함께 이하의 상세한 설명을 참조하라.
도 1은 해석된 텍스트의 의미를 나타내기 위해 시각 피드백 메커니즘이 어떻게 작동하는 지의 일례를 도시한 것이다. 이것은 사용자가 "Fly to CA meet with Jones at IMM J2-609"를 타이핑한 샘플 캘린더 엔트리(100)이다. 사용자가 타이핑하면, 시스템은 텍스트의 의미를 해석하고 해석된 텍스트 위 또는 근방에 심벌(관련 코드가 없는) 또는 아이콘(원하는 기능을 수행하기 위해 관련 코드를 활성화시키는 선택)을 디스플레이한다. 이 시스템은 이전에 생성된 텍스트를 해석하는데 사용될 수도 있다.
여기서, 시스템은 "CA" 용어에 대해 두 개의 잠재적인 의미, 즉 캐나다 국기 아이콘(102)으로 표시된 캐나다 또는 캘리포니아주 기 아이콘(104)으로 표시된 캘리포니아를 발견하였다. 이 시스템은 "IBM", "Jones" 및 "J2-609"(회의실)와 같은 다른 단어에 대한 의미를 해석하였다는 점에 유의하라. 해석된 의미는 문맥(주변 텍스트 또는 디스플레이 상의 다른 정보와 같은), 또는 온톨로지 속성(후술함) 또는 e-메일내의 외부 텍스트 또는 웹 앵커 텍스트(web anchor text)와 같은 다른 요인에 기초하여 가장 유망한 해석에 따라서 등급 순으로 디스플레이될 수 있다. 디스플레이 상에 여백이 없으면, 시스템은 단순히 화살표 또는 + 신호와 같은 표시를 단독으로 또는 단일 아이콘과 함께 사용하여, 하나보다 많은 의미가 가능하다는 것을 나타낸다.
용어의 의미가 모호하면, 즉 시스템이 인식하는 하나보다 많은 가능한 의미가 존재하면, 사용자는 단순히 (마우스, 포인터, 터치 스크린 등과 같은 적절한 입력 수단에 의해) 정확한 아이콘을 선택하며, 시스템은 디스플레이를 갱신한다. 내부 해석 모델이 각 선택에 의해 갱신되기 때문에, 이 하나의 아이콘의 갱신은 다른 아이콘에 변화를 발생할 수도 있다. 예를 들면, 캐나다와 캘리포니아를 명확하게 하면 리스트된 도시의 해석이 달라질 수도 있다.
또는, 사용자 입력 없이 시스템이 단순히 의미의 첫 번째 리스트된 해석을 받아들이면 사용자 입력이 요구되지 않을 수도 있다. 이것은 예를 들어 사용자가 엔트리 내의 하나의 텍스트 항목에 대해 바람직한 해석을 선택하고 나머지는 그대로 두거나 또는 개별 해석 수락을 나타내지 않고 글로벌 방식으로 전체 엔트리의 수락을 나타낼 때 구현될 수도 있다. 이러한 자동 명확화는 예를 들어 사용자가 특정 텍스트를 입력할 때 사용자가 의도하는 것을 시스템이 시행착오를 통해 학습하는 환경에서 바람직할 것이다.
도 2는 시스템이 임의의 적절한 이미지 인식 소프트웨어를 이용하여 (JPEG, MPEG, TIFF, PDF 등과 같은 임의의 식별할 수 있는 포맷으로) 이미지를 해석할 수 있는 다른 예를 도시하고 있다. 여기서, 이미지는 두 사람을 포함하고, 시스템은 화상 요소의 "의미(meanining)"를 두 사람(202, 206)으로서 해석한다. 시스템은 해석된 사람(202)을 "Dan"으로 해석하였고, 아이콘(204)을 근처에 삽입하고, 사람(206)을 아이콘(208, 210)으로 표시된 "Kristal" 또는 "Ali"로 해석하였다. 아이콘(208, 210)은 활성화될 수 있으며, Kristal 및 Ali의 홈페이지에 대한 링크 역할을 할 수 있다. 이들 페이지를 브라우징하면, 누가 실제로 화상 내에 있는지 식별할 수도 있으며, 그러면 사용자는 이미지로 돌아가서 명확성을 위해 적절하게 선택할 수 있다.
이미지를 갖는 해석기의 다른 사용예로는 포르노그래피와 같은 거북한 컨텐츠의 표시가 있다. 여기서, 거북한 컨텐츠를 검출하기 위해 적절한 컨텐츠 필터(예를 들면, Ulead Systems, Inc의 iMira Screening tool)가 사용되며, 시스템은 이미지 위에 아이콘을 중복시킨다. 아이콘은 이미지의 실질적인 부분이 보이지 않도록 중첩될 수도 있다. 선택되면, 아이콘은 경고 문구를 디스플레이하거나 또는 연방 통신 위원회에 고소하기 위한 웹 형태에 링크될 수 있다.
도 3은 시스템의 아키텍처를 도시하고 있다. 다음의 설명은 그래픽 해석보다는 텍스트 해석에 중점을 두고 있지만, 이 시스템은 둘 모두에 적용된다. 정보(world knowledge)의 온톨로지(302)는 사람, 장소, 물건, 아이디어의 계층적으로 조직된 개념의 네트워크를 생성하는 조직화된 데이터 세트이다. 온톨로지(302)는 XML(extensible markup language) 내에 나열된 RDF(Resource Description Framework)와 같은 기술을 이용하여 텍스트 형태로 표현된 계층적 또는 관계형 표현과 같은 데이터 구조이다.
도 4는 온톨로지의 구조를 도시하고 있다. 온톨로지 계층의 최상위 엔티티는 자연 내의 개념으로 정의되는 엔티티(402)이다. 여기서, 계층적 표현에 의하면, 최상위 엔티티는 여기에 도시된 바와 같이 "트리(tree)"형 표현의 루트(root)가 될 수 있으며 또는 DAG(directed acyclic graph) 내에 페어런트(parent)를 갖지 않는 노드가 될 수도 있다. 온톨로지 내의 엔티티의 나머지는 문서 내에서 설명될 수도 있는 것을 가상으로 나타내도록 시도하는 보다 정확한 부 개념을 나타낸다. 여기서, Dan 및 Kristal에 대한 엔티티는 온톨로지에 저장된 링크를 갖는 페어런트 엔티티로서 "인류(Human)"(404)를 갖는다. 마찬가지로, 엔티티 캘리포니아(406) 및 캐나다(408)는 페어런트인 주(410) 및 국가(412)를 각각 포함하며, 이들은 지역, 주 등과 같은 인위적인 그룹을 포함하도록 정의한 개념인 "행정 구역(political division)"까지 이어진다. 온톨로지는 각 엔티티에 대해, 엔티티를 나타내는 텍스트 문서에 사용될 수도 있는 식별자인 키워드를 포함하는 적어도 하나의 키워드를 포함한다. 예를 들어, 엔티티 "캘리포니아"는 "CA"의 키워드를 가질 수도 있으며, 이는 "캐나다"에서도 마찬가지다. 엔티티는 흔히 하나보다 많은 키워드를 가질 수도 있으며, 하나의 키워드가 하나보다 많은 엔티티를 표현할 수도 있으며, 따라서 엔티티와 키워드 사이에 많은 관계가 존재한다. 또한 엔티티는 하나보다 많은 페어런트를 가질 수도 있다.
온톨로지(402)는 또한 해석을 위한 엔티티의 최선의 선택을 결정하기 위해 해석기(아래 참조)에 의해 검사될 수도 있는 각각의 엔트리에 대한 다른 속성 또는 데이터를 포함할 수도 있다. 속성의 예로는 URL(다양한 관련 실제 데이터 소스에 대한 지시), 스트리트 어드레스, 개인 프로파일 정보, 아이콘 또는 (시스템이 시각 장애인에 의해 사용되는 경우에 도움이 되는)음악 노트 또는 오디오 음조와 같은 다른 미디어 파일이 있다. 공항에 대한 일반적인 느낌과 같은 보다 추상적인 엔티티에 대해서는, 이것은 모든 공항을 나타내는 아이콘일 수도 있다. 특정 공항에 대해서는 이용가능하다면 그 공항의 로고로 나타낼 수 있다. 사람의 생각에 대해서는, 관련 아이콘이 사람 형상의 실루엣일 수 있지만, 특정 개인에 대한 온톨로지 내의 엔티티는 이들 표시에 대한 URL을 포함할 수도 있다. 아이콘은 계층 표현이 온톨로지에 사용되는 경우에 온톨로지 내의 각 엔티티에 대해 명시적으로 지정될 필요는 없다. 만약 아무런 아이콘도 그 엔티티에 대해 지정되지 않으면, 엔티티의 페어런트와 관련된 아이콘으로 충분할 것이며, 이 아이콘은 쉽게 찾을 수 있다. 예를 들면, 전술한 예에서, 사람들을 개인과 교섭 대상으로 나누되 이들 각각에 대해 특정 아이콘을 갖고 있지 않다면, 사람의 생각과 관련된 아이콘이 사용될 수 있다.
도 3에서, 온톨로지 내의 엔티티는 키워드/URL/미디어 데이터베이스(304) 내에 관련 엔트리를 갖는다. 데이터베이스(304)는 엔티티의 키워드와 그것의 URL(이것이 발견되는 경우) 사이의 관계를 생성하기 위해 온톨로지를 전처리함으로써 작성된다. 온톨로지를 표현하는데 사용된 기법은 고유 URL을 각 엔트리와 관련시키는 것을 가능하게 한다. 이 URL은 특정 사람, 장소 또는 사물에 대한 구유 식별자가 된다. 아이콘 (및 다른 미디어)에 대한 엔티티의 관련 URL은 전처리 동안 데이터베이스 엔트리의 일부가 되며, 따라서 이들은 임의의 룩업(look up) 동안에 엔티티 URL과 함께 검색된다. 이 URL은 엔티티가 온톨로지에 대해 어디에 위치하는 지와 관련되며, 이것은 엔티티에 대한 웹사이트를 지시하는 URL이 아님에 유의하라. 이 유형의 URL은 미디어 유형이다.
도 5는 도 3의 키워드/URL/미디어 데이터베이스(304) 내에 두 엔트리의 단순화된 예를 도시한 것이다. 앞의 캘린더 예에서, 키워드 CA의 룩업은 두 개의 엔티티, 즉 캘리포니아(502) 및 캐나다(504)를 나타낸다. 캘리포니아는 디스플레이에 대한 아이콘을 구성하는데 사용된 파일(상태 플래그를 나타냄)을 포함하는 calflag.jpg 파일 및 www.ca.gov의 관련 URL을 갖는다. 마찬가지로, 캐나다는 canada.gc.ca 및 mapleleaf.jpg에 대한 아이콘에 대한 링크를 갖는다.
도 3을 참조하면, 의미 해석기(semantic interpreter)(306)는 텍스트의 시퀀스와 온톨로지 내의 엔티티의 URL 사이의 관계를 생성하는 것을 담당한다. 이것은 단어의 시퀀스를 검사한 후, 적당하다면 "견해(opinion)"에서 이들 단어들이 나타내는 온톨로지의 URL의 집합을 생성한다. 의미 해석기는 텍스트 내의 단어들을 키워드/URL 데이터베이스(304)로의 질의에 대한 소스 재료로서 사용하여 이것을 행한다. 이들 질의의 결과는 해석기(306)에 의해 처리되며 원래의 시퀀스로부터의 단어(들)와 관련된다(즉, 저장된다). 만약 이렇게 관련된 단일 URL이 존재하면, 단어에 대한 해석은 유일하며(그러나 여전히 부정확할 수도 있음), 하나보다 많은 URL이 존재하면, 그 해석은 모호하다.
어느 경우든, 사용자는 이미지 및 텍스트(308)의 의미론적 해석 디스플레이를 이용하여 해석을 거부하거나 정제할 기회를 갖는다. 이 디스플레이는 사용자가 시스템과 상호작용할 수 있게 하는 인터페이스를 나타낸다. 이것은 사용자가 텍스트를 타이핑하고 마우스 또는 다른 포인팅 디바이스를 클릭하게 하여 항목들 또는 영역들을 선택할 수 있게 한다. 디스플레이(308) 및 해석기(306)는 일련의 "이벤트(event)"를 통해 상호작용한다. 디스플레이는 텍스트 생성 및 포인터 선택 이벤트(310)를 생성하고, 해석기는 텍스트 및 이미지의 배치를 조작하는 디스플레이 이벤트(312)를 생성한다.
작동 중에, 사용자는 (타이핑, 스피킹 또는 다른 입력 수단에 의해) 디스플레이 내에 텍스트를 입력하고, 텍스트는 의미 해석기(306)와 통신하며, 이 의미 해석기는 그것이 해석을 갖는 지의 여부를 판정한다. 그것이 해석을 갖는 경우, 해석기(306)는 디스플레이로 하여금 특정 아이콘 또는 아이콘들을 텍스트의 단어 또는 단어들과 명확하게 관련시키는 방식으로 텍스트와 혼합된 아이콘을 그리게 하는 이벤트를 생성한다. 예를 들면, 캘린더 예에서, 단어 "캐나다"를 입력하면, 단어 "캐나다" 위에 작은 캐나다 플래그 아이콘이 나타난다. 내부적으로, 해석기는 "캐나다"(국가)에 대한 URL을 단어 "캐나다"(텍스트)와 관련시킨다. 하나보다 많은 해석이 존재하는 경우에는, 해석기는 가장 유망한 해석으로 생각되는 것의 서열을 생성하고 디스플이에 적절한 모든 아이콘(등급 순으로)을 제공한다. 이들 복수의 아이콘 및 이들의 등급은 하나보다 많은 방법으로 디스플레이될 수 있다. 예를 들면, 제한된 공간으로, 가장 유망한 해석이 (좌측에)우선적으로 표시될 수 있고, "JONES" 텍스트 항목과 관련하여 도 1에 도시된 바와 같이 나머지는 화살표(더 이상의 아이콘이 있음을 나타냄) 뒤에 감추어진다.
이 방법의 이면의 사상은 사용자가 해석이 이루어졌으며 다른 해석이 가능하다는 것을 명확하게 볼 수 있게 한다. 만약 사용자가 "more" 화살표를 클릭하면, 사용자는 다른 아이콘들을 볼 수 있고, 다른 아이콘들 중 하나를 클릭함으로써 해석 등급을 재조정할 수 있을 것이다. 이들 사용자 동작은 모두 해석기(306)로 보고되며, 따라서 해석기는 내부 해석 모델을 갱신할 수 있다. 이것은 해석기로 하여금 이전의 해석의 일부를 재평가하게 한다(예를 들면, 사용자가 텍스트 문서 내의 국명을 확실하게 하면, 도시명이 식별된 국가 내의 도시가 될 가능성이 높아지기 때문에, 해석기는 도시명의 해석을 재평가할 수도 있을 것이다).
이런 방법으로, 사용자에 의해 입력된 텍스트는 해석기로 보고되고, 해석기는 다시 그 해석을 나타내는 아이콘(및 그들의 순서)을 디스플레이로 보고한다. 사용자는 이들 아이콘을 보고 텍스트와의 관련을 시각적으로 확인한다. 만약 이들이 그 관계(양호한 해석기 및 온톨로지에 대해 적절한)와 일치하면 이들은 아무것도 할 필요가 없고, 만약 이들이 일치하지 않으면 다른 아이콘(및 그들의 해석)을 선택하며 또는 정확한 아이콘/해석이 존재하지 않으면 그렇게 표시할 수 있다(아마도 "우측 클릭"에 의해). 또는, 텍스트가 해석될 수 없으면, 시스템은 사용자가 URL을 직접 입력하여 시스템에 시작점을 제공하게 하는 기회를 제공할 수도 있다.
이 프로세스의 최종 결과는 해석기의 내부 모델의 컨텐츠이다. 온톨로지(302)를 지시하는 URL과 텍스트 내의 단어들 사이의 관계는 (전자 상거래와 같은) 다른 애플리케이션에 의해 검사되어 적절하게 처리될 수 있다. 다른 응용예로는 캘린더 입력과 관련된 정보의 자동 페치 또는 항공 티켓 및 기타 여행에 필요한 사항을 예약하는 소프트웨어 에이전트가 있다. 이러한 애플리케이션은 Ford 등의 발명의 명칭이 Active Calendar인 미국 특허 제 6,480,830 호에 개시되어 있다.
본 발명의 로직은 일련의 컴퓨터 실행가능한 인스트럭션으로서 프로세서에 의해 실행될 수도 있다. 인스트럭션은 프로그램 코드가 저장되어 있는 컴퓨터에서 사용가능한 매체를 포함하는 컴퓨터 디스켓, CD ROM 또는 DVD와, DASD 어레이, 자기 테이프, 종래의 하드디스크 드라이브, 전자 판독 전용 메모리 또는 광 저장 장치와 같은 컴퓨터 액세스 가능 매체를 구비한 임의의 적절한 데이터 저장 장치 상에 포함될 수도 있다.
요약하면, 선택된 의미가 정확한 지를 사용자가 확인하기 위해 택스트의 일부(또는 전체 문서)의 해석된 의미를 나타내는 텍스트 근방의 시각 피드백 메커니즘을 설명하였다. 또한, 이 메커니즘은 텍스트가 의미하는 것을 명확하게 하는 수단을 제공할 수 있다.
이상, 바람직한 실시예를 참조하여 본 발명을 설명하였지만, 당업자라면 본 발명의 사상 및 범주로부터 벗어나지 않고 형식 세부사항에 있어 여러 변경이 이루어질 수 있음을 알 수 있을 것이다. 따라서, 본 발명은 단순히 예시적인 것일 뿐 첨부한 청구범위에 기재된 범위 내에서만 한정된다.

Claims (42)

  1. 문서의 일부분의 해석된 의미를 나타내는 방법에 있어서,
    상기 문서 근방에 상기 해석된 의미의 표시를 디스플레이하는 단계를 포함하는
    방법.
  2. 제 1 항에 있어서,
    상기 부분은 텍스트인
    방법.
  3. 제 2 항에 있어서,
    상기 표시는 지정된 기능을 활성화시키는 관련 코드를 포함하는 아이콘인
    방법.
  4. 제 2 항에 있어서,
    상기 의미는 키워드를 룩업하는 것에 의해 해석되는
    방법.
  5. 제 2 항에 있어서,
    상기 의미는 상기 문서 내의 문맥을 검사함으로써 해석되는
    방법.
  6. 제 2 항에 있어서,
    상기 의미는 데이터베이스로의 질의에 대한 소스로서 상기 텍스트 내의 단어들을 사용하여 해석되는
    방법.
  7. 제 1 항에 있어서,
    상기 부분은 이미지인
    방법.
  8. 제 7 항에 있어서,
    상기 해석된 의미의 표시는 상기 이미지 상에 중첩되는
    방법.
  9. 제 8 항에 있어서,
    상기 해석된 의미의 표시는 상기 이미지의 실질적인 부분이 보여질 수 없도록 상기 이미지 상에 중첩되는
    방법.
  10. 제 1 항에 있어서,
    상기 표시는 임의의 관련 코드가 없는 심벌인
    방법.
  11. 제 1 항에 있어서,
    상기 표시는 지정된 기능을 활성화시키는 관련 코드를 포함하는 아이콘인
    방법.
  12. 제 1 항에 있어서,
    상기 표시는 하나보다 많은 가능한 의미가 있음을 나타내는
    방법.
  13. 제 12 항에 있어서,
    상기 표시는 화살표와 + 부호 중 적어도 하나를 포함하는
    방법.
  14. 제 12 항에 있어서,
    상기 가능한 의미는 상기 문서 내의 문맥에 기초하여 순서화되는
    방법.
  15. 제 12 항에 있어서,
    상기 가능한 의미는 상기 문서 외부의 관련 정보에 기초하여 순서화되는
    방법.
  16. 제 1 항에 있어서,
    상기 문서 부분은 그것이 생성될 때 해석되는
    방법.
  17. 문서의 일부분을 명확하게 하는 방법에 있어서,
    상기 문서의 부분 중 적어도 두 개의 다르게 해석된 의미의 표시를 제공하는 단계와,
    상기 해석된 의미 중 선택된 하나의 의미에 응답하여 선택된 해석된 의미의 표시를 디스플레이하는 단계를 포함하는
    방법.
  18. 제 17 항에 있어서,
    상기 선택은 사용자가 입력 장치를 이용하여 상기 표시 중 하나를 선택하는 것인
    방법.
  19. 제 18 항에 있어서,
    상기 선택은 자동적인
    방법.
  20. 제 19 항에 있어서,
    상기 선택은 사용자의 입력이 없는 경우에 첫 번째로 나열된 해석을 취함으로써 결정되는
    방법.
  21. 제 17 항에 있어서,
    상기 문서 부분의 명확화는 상기 문서의 다른 부분의 상기 해석된 의미를 갱신하도록 하는
    방법.
  22. 문서의 일부분의 해석된 의미를 나타내는 방법 단계를 수행하도록 기계에 의해 실행가능한 인스트럭션의 프로그램을 유형적으로 구현하는 기계에 의해 액세스 가능한 프로그램 저장 장치에 있어서,
    상기 방법 단계는 상기 문서 근방에 상기 해석된 의미의 표시를 디스플레이하는 단계를 포함하는
    프로그램 저장 장치.
  23. 제 22 항에 있어서,
    상기 부분은 텍스트인
    프로그램 저장 장치.
  24. 제 23 항에 있어서,
    상기 표시는 지정된 기능을 활성화시키는 관련 코드를 포함하는 아이콘인
    프로그램 저장 장치.
  25. 제 23 항에 있어서,
    상기 의미는 키워드를 룩업하는 것에 의해 해석되는
    프로그램 저장 장치.
  26. 제 23 항에 있어서,
    상기 의미는 상기 문서 내의 문맥을 검사함으로써 해석되는
    프로그램 저장 장치.
  27. 제 23 항에 있어서,
    상기 의미는 데이터베이스로의 질의에 대한 소스로서 상기 텍스트 내의 단어들을 사용하여 해석되는
    프로그램 저장 장치.
  28. 제 22 항에 있어서,
    상기 부분은 이미지인
    프로그램 저장 장치.
  29. 제 28 항에 있어서,
    상기 해석된 의미의 표시는 상기 이미지 상에 중첩되는
    프로그램 저장 장치.
  30. 제 29 항에 있어서,
    상기 해석된 의미의 표시는 상기 이미지의 실질적인 부분이 보여질 수 없도록 상기 이미지 상에 중첩되는
    프로그램 저장 장치.
  31. 제 22 항에 있어서,
    상기 표시는 임의의 관련 코드가 없는 심벌인
    프로그램 저장 장치.
  32. 제 22 항에 있어서,
    상기 표시는 지정된 기능을 활성화시키는 관련 코드를 포함하는 아이콘인
    프로그램 저장 장치.
  33. 제 22 항에 있어서,
    상기 표시는 하나보다 많은 가능한 의미가 있음을 나타내는
    프로그램 저장 장치.
  34. 제 33 항에 있어서,
    상기 표시는 화살표와 + 부호 중 적어도 하나를 포함하는
    프로그램 저장 장치.
  35. 제 33 항에 있어서,
    상기 가능한 의미는 상기 문서 내의 문맥에 기초하여 순서화되는
    프로그램 저장 장치.
  36. 제 33 항에 있어서,
    상기 가능한 의미는 상기 문서 외부의 관련 정보에 기초하여 순서화되는
    프로그램 저장 장치.
  37. 제 22 항에 있어서,
    상기 문서 부분은 그것이 생성될 때 해석되는
    프로그램 저장 장치.
  38. 문서의 일부분을 명확하게 하는 방법 단계를 수행하도록 기계에 의해 실행 가능한 인스트럭션의 프로그램을 유형적으로 구현하는, 상기 기계에 의해 액세스 가능한 프로그램 저장 장치에 있어서,
    상기 방법 단계는
    상기 문서의 부분 중 적어도 두 개의 다르게 해석된 의미의 표시를 제공하는 단계와,
    상기 해석된 의미 중 선택된 하나의 의미에 응답하여 선택된 해석된 의미의 표시를 디스플레이하는 단계를 포함하는
    프로그램 저장 장치.
  39. 제 38 항에 있어서,
    상기 선택은 사용자가 입력 장치를 이용하여 상기 표시 중 하나를 선택하는 것인
    프로그램 저장 장치.
  40. 제 39 항에 있어서,
    상기 선택은 자동적인
    프로그램 저장 장치.
  41. 제 40 항에 있어서,
    상기 선택은 사용자의 입력이 없는 경우에 첫 번째로 나열된 해석을 취함으로써 결정되는
    프로그램 저장 장치.
  42. 제 38 항에 있어서,
    상기 문서 부분의 명확화는 상기 문서의 다른 부분의 상기 해석된 의미를 갱신하도록 하는
    프로그램 저장 장치.
KR1020057008822A 2002-12-18 2003-12-11 문서의 일부분의 해석된 의미를 나타내는 방법, 문서의일부분을 명확하게 하는 방법 및 프로그램 저장 장치 KR20050085012A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/323,042 2002-12-18
US10/323,042 US20040117173A1 (en) 2002-12-18 2002-12-18 Graphical feedback for semantic interpretation of text and images

Publications (1)

Publication Number Publication Date
KR20050085012A true KR20050085012A (ko) 2005-08-29

Family

ID=32507304

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020057008822A KR20050085012A (ko) 2002-12-18 2003-12-11 문서의 일부분의 해석된 의미를 나타내는 방법, 문서의일부분을 명확하게 하는 방법 및 프로그램 저장 장치

Country Status (8)

Country Link
US (1) US20040117173A1 (ko)
EP (1) EP1611531A2 (ko)
JP (1) JP4238220B2 (ko)
KR (1) KR20050085012A (ko)
CN (1) CN100533430C (ko)
AU (1) AU2003299221A1 (ko)
TW (1) TWI242728B (ko)
WO (1) WO2004055614A2 (ko)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005020091A1 (en) * 2003-08-21 2005-03-03 Idilia Inc. System and method for processing text utilizing a suite of disambiguation techniques
US20070136251A1 (en) * 2003-08-21 2007-06-14 Idilia Inc. System and Method for Processing a Query
US9195766B2 (en) * 2004-12-14 2015-11-24 Google Inc. Providing useful information associated with an item in a document
US7681147B2 (en) * 2005-12-13 2010-03-16 Yahoo! Inc. System for determining probable meanings of inputted words
US9081609B2 (en) * 2005-12-21 2015-07-14 Xerox Corporation Image processing system and method employing a threaded scheduler
US20070219773A1 (en) * 2006-03-17 2007-09-20 Xerox Corporation Syntactic rule development graphical user interface
US20100036797A1 (en) * 2006-08-31 2010-02-11 The Regents Of The University Of California Semantic search engine
US8977631B2 (en) * 2007-04-16 2015-03-10 Ebay Inc. Visualization of reputation ratings
US8103498B2 (en) * 2007-08-10 2012-01-24 Microsoft Corporation Progressive display rendering of processed text
US8548791B2 (en) * 2007-08-29 2013-10-01 Microsoft Corporation Validation of the consistency of automatic terminology translation
US20090313101A1 (en) * 2008-06-13 2009-12-17 Microsoft Corporation Processing receipt received in set of communications
US8788350B2 (en) 2008-06-13 2014-07-22 Microsoft Corporation Handling payment receipts with a receipt store
US8335889B2 (en) * 2008-09-11 2012-12-18 Nec Laboratories America, Inc. Content addressable storage systems and methods employing searchable blocks
US8949241B2 (en) * 2009-05-08 2015-02-03 Thomson Reuters Global Resources Systems and methods for interactive disambiguation of data
EP2383684A1 (en) 2010-04-30 2011-11-02 Fujitsu Limited Method and device for generating an ontology document
EP2583421A1 (en) 2010-06-16 2013-04-24 Sony Mobile Communications AB User-based semantic metadata for text messages
CN102156608B (zh) * 2010-12-10 2013-07-24 上海合合信息科技发展有限公司 多字符连续书写的手写输入方法
US8996359B2 (en) 2011-05-18 2015-03-31 Dw Associates, Llc Taxonomy and application of language analysis and processing
TWI465940B (zh) * 2011-11-04 2014-12-21 Inventec Corp 輔助記憶雙語同義詞彙的系統及其方法
US9269353B1 (en) 2011-12-07 2016-02-23 Manu Rehani Methods and systems for measuring semantics in communications
BR112014015666A8 (pt) * 2011-12-27 2017-07-04 Koninklijke Philips Nv sistema de análise de texto, estação de trabalho, sistema de informações de serviço de saúde para a provisão de um fluxo de trabalho de relatório eletrônico, método de análise de texto, e produto de programa de computador
US9020807B2 (en) 2012-01-18 2015-04-28 Dw Associates, Llc Format for displaying text analytics results
US9667513B1 (en) 2012-01-24 2017-05-30 Dw Associates, Llc Real-time autonomous organization
CN103218157B (zh) * 2013-03-04 2016-08-17 东莞宇龙通信科技有限公司 一种移动终端及解说信息的管理方法
CN108647705B (zh) * 2018-04-23 2019-04-05 北京交通大学 基于图像和文本语义相似度的图像语义消歧方法和装置
US11829420B2 (en) 2019-12-19 2023-11-28 Oracle International Corporation Summarized logical forms for controlled question answering
US20210191938A1 (en) * 2019-12-19 2021-06-24 Oracle International Corporation Summarized logical forms based on abstract meaning representation and discourse trees

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US550920A (en) * 1895-12-03 Cuff-holder
SE466029B (sv) * 1989-03-06 1991-12-02 Ibm Svenska Ab Anordning och foerfarande foer analys av naturligt spraak i ett datorbaserat informationsbehandlingssystem
US5924089A (en) * 1996-09-03 1999-07-13 International Business Machines Corporation Natural language translation of an SQL query
US5960384A (en) * 1997-09-03 1999-09-28 Brash; Douglas E. Method and device for parsing natural language sentences and other sequential symbolic expressions
WO2002005137A2 (en) * 2000-07-07 2002-01-17 Criticalpoint Software Corporation Methods and system for generating and searching ontology databases

Also Published As

Publication number Publication date
CN1745378A (zh) 2006-03-08
TWI242728B (en) 2005-11-01
JP2006510968A (ja) 2006-03-30
US20040117173A1 (en) 2004-06-17
WO2004055614A3 (en) 2005-11-10
AU2003299221A1 (en) 2004-07-09
JP4238220B2 (ja) 2009-03-18
WO2004055614A2 (en) 2004-07-01
CN100533430C (zh) 2009-08-26
TW200422874A (en) 2004-11-01
AU2003299221A8 (en) 2004-07-09
EP1611531A2 (en) 2006-01-04

Similar Documents

Publication Publication Date Title
KR20050085012A (ko) 문서의 일부분의 해석된 의미를 나타내는 방법, 문서의일부분을 명확하게 하는 방법 및 프로그램 저장 장치
JP5744873B2 (ja) トラステッドクエリのシステムおよび方法
Zeng Knowledge organization systems (KOS)
AU2008312423B2 (en) NLP-based content recommender
US20140280072A1 (en) Method and Apparatus for Human-Machine Interaction
EP1014282A1 (en) Search channels between queries for use in an information retrieval system
US20150286943A1 (en) Decision Making and Planning/Prediction System for Human Intention Resolution
US7885973B2 (en) Computer method and apparatus for parameterized semantic inquiry templates with type annotations
AU1571699A (en) Data input and retrieval apparatus
JP2010517133A (ja) Webサイト統合検索装置及び方法
AU2005202353A1 (en) Methods and apparatus for storing and retrieving knowledge
Thalheim et al. The use of metaphorical structures for internet sites
US11720240B1 (en) Visual autocompletion for geospatial queries
McCoy et al. Towards generating textual summaries of graphs.
Gnörlich MultiNet-WR: a Knowledge Engineering Toolkit for Natural Language Information
JP4138048B2 (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
Wilson Enhancing multimedia interfaces with intelligence
Oard et al. Vapor Engine: Demonstrating an early prototype of a language-independent search engine for speech
EP2207105A1 (en) A method for visualizing a text, corresponding device, storage means, and software program therefor
Mäkelä et al. View-based search interfaces for the semantic web
Wilson Building intelligent multimedia interfaces
Sansonnet et al. Kiwi: An environment for capturing the Perceptual Cues of an Application for an Assisting Conversational Agent
Rennison The mind's eye: an approach to understanding large complex information-bases through visual discourse
Gollogley Assisting the hypertext authoring process with topology metrics and information retrieval
AU1797801A (en) Methods and apparatus for storing and retrieving knowledge

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application