KR20080092337A - 자연어 문서들에서 인과 관계들의 인식을 위한 시맨틱프로세서 - Google Patents

자연어 문서들에서 인과 관계들의 인식을 위한 시맨틱프로세서 Download PDF

Info

Publication number
KR20080092337A
KR20080092337A KR1020087012454A KR20087012454A KR20080092337A KR 20080092337 A KR20080092337 A KR 20080092337A KR 1020087012454 A KR1020087012454 A KR 1020087012454A KR 20087012454 A KR20087012454 A KR 20087012454A KR 20080092337 A KR20080092337 A KR 20080092337A
Authority
KR
South Korea
Prior art keywords
esao
causal
text
knowledge base
recognizing
Prior art date
Application number
KR1020087012454A
Other languages
English (en)
Inventor
제임스 토드헌터
이고르 소브펠
디지아니스 파스타노하우
알렉산더 보론트소브
Original Assignee
인벤션 머신 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 인벤션 머신 코포레이션 filed Critical 인벤션 머신 코포레이션
Publication of KR20080092337A publication Critical patent/KR20080092337A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Machine Translation (AREA)

Abstract

자연어 문서들에서 인과 관계들의 인식을 위한 시맨틱 프로세서에 관한 것으로서, 텍스트 프리 포맷기(Text Preformatter), 언어 분석기 및 원인-결과 지식 기반 생성기를 포함한다. 상기 시맨틱 프로세서는 단일 팩트 내에서 그리고 자의적인 텍스트 문서들의 팩트들 사이에서 양쪽 모두에서 인과관계의 자동 인식을 제공하며, 여기서 상기 팩트들은 또한 상기 텍스트로부터 7개의 필드 시맨틱 유닛들의 형태로 자동으로 추출된다. 상기 인과 관계들의 인식은 언어적(시맨틱을 포함함) 텍스트 분석 및 패턴들의 형태로 수립된 다수의 언어 모델들에 기초하여 수행된다.
자연어, 인과관계 자동 인식, 지식 기반, 언어 기반

Description

자연어 문서들에서 인과 관계들의 인식을 위한 시맨틱 프로세서{SEMANTIC PROCESSOR FOR RECOGNITION OF CAUSE-EFFECT RELATIONS IN NATURAL LANGUAGE DOCUMENTS}
본 발명은 전자 또는 디지털 형태의 문서들로부터 자동 지식 인식 및 추출 시스템 및 방법에 관한 것으로서, 팩트들(facts) 간의 인과관계(cause-effect relations)의 형태로 외부 규칙들을 반영한다.
하기의 미국 특허 서류들은 본 발명에 관련된 종래기술을 기술한다: Ito에 의해 1995년 5월에 발행된, 미국특허번호 제5,418,889호(이하 Ito라 함); Boguraev 등에 의해 2001년 2월 발행된, 미국특허번호 제6,185,592호(이하 Boguraev 1 이라 함); Boguraev에 의해 2001년 4월에 발행된, 미국특허번호 제 6,212,494호(이하 Boguraev 2 라 함); Paik 등에 의해 2001년 7월에 발행된, 미국특허번호 제 6, 263,335호(이하 Paik 라 함); Kim 등에 의해 2004년 6월에 발행된, 미국특허번호 제 6,754, 654호(이하 Kim 이라 함); Davies 등에 의해 2004년 11월에 발행된, 미국특허번호 제6,823,325호(이하 Davies라 함); Binniget 등에 의해 2005년 3월에 발행된, 미국특허번호 제6,871,199호(이하 Binniget 라 함).
지식 엔지니어링은 모뎀 정보 기술들의 지능화를 위한 주요한 툴(tool)이다. 지식 엔지니어링은 전통적으로 다양한 지식 분야에서의 전문가들로부터 획득된 정보의 일반화에 기초했다. 하지만, 분석은 이러한 접근법이 적당한 실생활(산업) 응용들을 생성하기 위해 이용될 수 없다는 점을 보여준다. 두 개의 질문이 발생한다: 첫째, 그러한 지식의 가장 신뢰할 수 있고 효과적인 원천(source)은 무엇인가; 둘째, 어떻게 이러한 지식을 알게 되고, 추출하여 추후에 공식화하는가. 글로벌 컴퓨터화의 시대인 요즘 시대에서, 가장 신뢰할 수 있는 지식의 원천은 넓은 의미로 텍스트, 즉, 자연어로 된 문서 세트로서의 텍스트이다(서적, 기사, 페이턴트, 보고서 등). 따라서, 두 번째 질문에 비추어 지식 엔지니어링의 기본 전제는 다음과 같다:
1. 텍스트는 지식 표현의 이상적인 타고난 지적 모델이다.
2. 텍스트에서 모든 것을 찾을 수 있다.
상기 두 번째 전제는 지나치게 절대적인 것 같을 수 있으나, 텍스트 범위가 증가하는 추세에 있어, 이는 점점 더 사실이 된다.
텍스트로부터 어떤 유형의 지식이 획득될 수 있는가 및 자동화 수단은 무엇인가? 일부 기존 방법들은 엄격한 구조를 가지고 수동적으로 컴파일된 데이터베이스로 또는 엄격하게 규정된 필드를 갖는 텍스트들로 목적을 이룬다. 텍스트의 피상적인 언어 분석이 대개 수행된다. Kim은 리지드(rigid) 구조(일차적 이메일)를 갖는 텍스트 프로세싱을 기술한다. Kim의 프로세스는 미리 공지된 필드의 원천 문서들로부터 해당 정보를 추출하고 조직(organization)의 구조를 반영하는 데이터베이스(DB)의 미리 규정된 필드에 그것을 배치한다(그러한 DB는, 예를 들면, 조직 내 개별요소들의 명칭 및 제목에 대한 필드를 갖는다). Kim에서 기술된 언어 프로세싱 은 소위 필터라 불리는 것에 따라 단지 문서들로부터 핵심(key) 용어들을 추출하기 위해 이용된다.
Davies는 명사를 동사와 구분하고 "어떻게", "왜", "무엇을" 및 "무엇이" 관계들에 따라 미리 규정되어 구조화된 데이터베이스에서 강력하게 규정한 검색 방법으로 수행하기 위한 텍스트의 어휘 및 문법상 분석의 수행을 기술한다.
Binniget는 또한 프랙털(fractal) 계층적 네트워크의 형식으로 미리-구조화된 데이터베이스(이를 테면, 지식 데이터베이스)의 사용을 기술하는 것으로, 입력 스트링으로부터 정보를 자동으로 확장하기 위해 외부(지식 영역)의 지식을 반영한다. 초기에 상기 입력 스트링(예를 들면, 문장의 일부, 또는 전체 문장 등)은 언어 및 문법상 파싱(parsing)과 입력 네트워크를 수립하기 위한 변환(transforming)을 수행하는 시맨틱 프로세서(semantic processor)에 의해 취급된다. 상기 네트워크는 그후 상기 입력 정보, 즉, 목적어, 그들의 관계 및 속성들에 관한 외부의 모델에 의한 입력 정보의 일부 레코딩 종류 및 추후 확장성(expantion)을 늘이기 위해 상기 지식 데이터베이스에 내장된다.
Boguraev 1은 텍스트 세그먼트에 대해, 가장 중요한 명사 그룹이 비중있는 의미론적 역할에 있어서 그들의 사용 빈도를 기초로 표시되는 심층 텍스트 분석의 수행을 기술한다.
상기 언급된 모든 경우들은 개념(concept)에 대한 특정 지식에 관한 것이다. 이는 텍스트로부터 추출될 수 있는 지식의 등록(entry) 레벨이다.
Boguraev 2는 기술분야에서 중요한 용어들의 카탈로그를 생성하고 또한 기술 적 기능들(동사-목적어)의 행위자(해결자)를 결정하기 위한 컴퓨터-매개 언어 분석의 사용을 기술한다.
Ito는 원인 모델 기반 및 장치 모델 기반을 포함하는 지식 기반의 사용을 기술한다. 상기 장치 모델 기반은 타겟 머신의 장치들의 계층을 기술하는 장치 지식 세트를 갖는다. 상기 원인 모델 기반은 상기 장치 모델 기반에 기초하여 형성되며 타겟 머신에서 폴트(fault) 이벤트들의 원인 관계 세트를 갖는다. 따라서, 상기 장치의 각 엘리먼트에 있어서 가능한 실패 원인이 상기 장치의 다른 엘리먼트들과의 그 구조적 결합에 대한 정보에 기초하여 추측된다. 대개, 이러한 것들은 가장 많이 "결합된" 엘리먼트들에 따라, 원인으로 결정된다.
Paik는 영역-독립적이고 그 자체의 주어 지식 기반을 자동으로 수립하는 시스템을 기술한다. 상기 시스템은 개념(사람, 장소, 물건 또는 조직과 같은 임의 명칭된 엔티티 또는 아이디어)과 그들 간의 관계들을 인식한다. 이러한 관계들은 개념-관계-개념 트리플의 생성을 허용한다. 그래서 Paik에서 인식된 지식은 다음의 중요한 지식 레벨-팩트(주어-동작-목적어)에 가까우나, 그들은 아직 팩트가 아니다. Paik는 또한 (개념-관계-개념 트리플의 문맥에서) 개념들 간의 "원인" 관계를 언급한다. 하지만, 이는 아직 팩트들 사이의 인과관계는 아니며, 그것은 외부 규칙들(또는 지식 영역의 규칙들)을 반영하는 지식이기 때문에, 다음으로 매우 중요한 레벨의 지식이다.
본 발명의 실시예들은 팩트(7-필드의 eSAO의 시맨틱 유닛의 유형: 주어-동작-목적어-형용사-전치사-간접 목적어-부사)의 형태로 외부(지식 영역)에 대한 정보 및 상기 팩트들 사이의 인과관계의 형태로 외부(지식 영역)의 규칙들을 반영하는 규칙들을 자의적인 텍스트 문서들로부터 자동으로 추출하기 위한 컴퓨터에 대한 능력을 제공한다. 상기 팩트들 사이의 인과관계의 자동 인식은 상기 시맨틱 프로세서에 의해 수행되는데, 상기 시맨틱 프로세서는 상기 텍스트의 프리 포맷(preformatting)과 상기 텍스트의 언어적(시맨틱을 포함함) 분석을 수행한다. 상기 시맨틱 프로세서는 또한 이러한 분석과 패턴들로 형성된 맞춤 인식 언어 모델을 사용하여 인과(Cause-Effect;C-E) 지식 기반을 생성한다.
텍스트의 언어 분석은: 품사(parts-of speech) 태깅(tagging), 파싱(parsing) 및 시맨틱 분석을 포함한다. 시맨틱 분석 단계 동안, 상기 시맨틱 프로세서는 목적어, 그들의 eSAO 유형(팩트들) 사이의 시맨틱 관계 및 상기 팩트들 사이의 인과관계, 뿐만 아니라, 개별 팩트들에서의 이러한 관계를 인식한다. 상기 인과 관계 인식은 텍스트와 패턴들의 언어 분석 결과들에 기초하여 수행되는 것으로, 단일 eSAO 내부에 그리고 다른 eSAO 사이의 인과(C-E) 관계들을 검출하기 위한 알고리즘들을 기술한다. 이러한 패턴들은 첫째, 그들 사용 환경, 이를 테면, 문장에 있어서 C-E 관계의 존재의 표시기와, 둘째, 상기 관계의 원인 부분으로서의 어느 eSAO 컴포넌트들 또는 전체 eSAO에 대한 그리고 결과로서의 어느 eSAO 컴포넌트 또는 전체 eSAO에 대한 정보를 기술한다. 인과 표시기란 개별 eSAO 컴포넌트들을 말하며 언어 유닛, 그들의 어휘 및 문법 태그, 클래스 등을 기술한다. 예를 들어, 패턴들 중 하나는, 문장이 두 개의 eSAO를 포함하는 경우, 제1 eSAO는 논-엠프티(non-empty) 주어 및 동작을 가지며, 제2 eSAO는 논-엠프티 동작 및 목적어를 가지는 경우를 말하며, 상기 문장에서 그들 간에 접속사 "so that" 또는 "such that"이 존재하고, 이러한 eSAO는 인과 관계에 있으며, 제1 eSAO가 원인이 되고, 제2 eSAO가 결과부분이 된다.
상기 인과 인식기(Cause-Effect Recognizer)는 모든 eSAO들 및 공통 목록으로부터 패턴들 중 하나에 따르는 한 쌍의 eSAO들을 분석한다. eSAO가 규칙에 따른다면, 상기 인과 인식기는 인과 관계의 존재를 등록하고 인과 지식 기반에 그것을 집어넣는다.
언어 모델들의 인식을 생성하는 절차는 많은 텍스트 코퍼스들을 분석하는 단계, 인과 관계의 특정 표시기를 표시하는 단계 및 패턴들로 일반화를 수행하고 테스팅하는 단계에 기초한다. 이러한 패턴들, 뿐만 아니라 다양한 사전들, 문법 등은 언어 지식 기반, 상기 시맨틱 프로세서의 주요 컴포넌트 중 하나를 포함한다.
도 1은 본 발명의 실시예에 따른 시맨틱 프로세서의 구조적이고 기능적 도면.
도 2는 본 발명의 실시예에 따른 언어 분석기의 구조적이고 기능적 도면.
도 3은 본 발명의 실시예에 따른 시맨틱 분석기의 구조적이고 기능적 도면.
도 4는 본 발명의 실시예에 따른 C-E 패턴들의 데이터베이스를 수립하는 주요 도면.
본 발명의 실시예들은 외부 지식의 3개의 전형적인 유형들의 자동 인식을 위한 시스템 및 방법에 관한 것이다: 목적어(개념); 팩트; 및 외부(주어 영역)의 규정들을 반영하는 규칙들의 형태로 공식화된 팩트들 사이의 인과 관계. 목적어와 팩트의 자동 삭제, 즉, 주어-동작-목적어(Subject-Action-Object: SAO) 형식에서 목적어들 사이의 시맨틱(semantic) 관계가 "Document Semantic Analysis/Selection with Knowledge Creativity Capability"로 표제된, 미국특허번호 제 6,167,370호에서 기술된다.
종래기술의 시스템에서, SAO는 단지 3개의 컴포넌트들 또는 엘리먼트 유형들을 포함했다: 주어(Subject: S), 동작(Action: A) 및 목적어(Object: O). 종래기술에서, 적어도 하나의 이러한 컴포넌트들은 SAO에 규정되어야 한다. 하지만, 본 발명의 실시예에 따르면, 확장형 SAO들(eSAO들)이 사용된다. 바람직한 실시예들에서, eSAO들은 7개의 컴포넌트들을 포함하며, 여기서, 또한 적어도 하나의 컴포넌트가 규정된다. 추가 컴포넌트들은 훨씬 더 심층적이고 품질이 우수한 분석을 제공한다. 다른 실시예들에서, 상기 eSAO들은 추가 컴포넌트들을 포함하기 위해 확장될 수 있었다. 본원에서, 용어 "eSAO" 및 "eSAO 세트"는 호환적으로 사용되며, 두 용어 모두는 eSAO 컴포넌트들의 집합을 말한다.
바람직한 실시예에서, 상기 eSAO 컴포넌트는 다음을 포함한다:
1. 목적어(O)에 동작(A)을 수행하는, 주어(S);
2. 주어(S)에 의해 목적어(O)에 수행된, 동작(A);
3. 주어(S)에 의해 동작(A)이 행해진, 목적어(O);
4. 주어(S) 또는 동작(A)을 기술하는, 형용사(Adj)로서 목적어(O)가 비어있는eSAO에서 주어 뒤에 온다(예를 들면, "The invention is "efficient", "The water becames "Hot"");
5. 간접 목적어(IO)를 지배하는, 전치사(Prep)(예를 들면, "The lamp is placed "on" the table", "The device reduces friction "by" ultrasound");
6. 명사의 위치에 의해, 규칙으로 명시된, 간접 목적어(IO)로서, 이는 전치사와 함께 동작(A)을 기술하며, 부수적인 수식어구가 된다(예를 들면, "The lamp is placed on the "table"", "The device reduces friction by "ultrasound"");
7. 규칙으로서, 동작(A)의 수행 상태를 기술하는, 부사(Adv)(예를 들면, "The process is "slowly" modifie", "The driver must not turn wheel "in such a manner"").
상기 eSAO 형식의 적용예들이 표 1과 표2에 도시된다.
Figure 112008036939596-PCT00001
[표 1]
Figure 112008036939596-PCT00002
[표 2]
팩트들 사이의, 이를테면, eSAO들 사이의 원인과 결과 즉, 인과(Cause-Effect; C-E) 유형의 시맨틱 관계가 "Computer Based Summarization of Natural Language Documents"로 표제된, 미국특허출원공개번호 제20030130837호에 기술된다. 인과 관계의 인식 또한 상기 공보에 기술된다. 예를 들어, 입력 문장 "Today the user can download 10,000 papers from the web by typing the word "screen""은 표 3에 도시된 eSAO들 사이의 인과관계가 될 것이다.
Figure 112008036939596-PCT00003
[표 3]
본 발명의 실시예들은 자연어 문서들 내의 지식에 존재하는 인과관계들을 수립하기 위해 사용된 시맨틱 프로세싱 단계를 어드레스 한다.
본 발명의 실시예들에 따르면, 전자 또는 디지털 형태의 텍스트에서 인과관계를 인식하기 위한 상기 시맨틱 프로세싱 단계는: 텍스트를 프리 포맷하는(preformatting) 단계; 언어 분석을 수행하는 단계; 및 인과 지식 기반을 생성하는 단계를 포함한다.
본 발명에 따른, 인과 시맨틱 프로세서, 이하 시맨틱 프로세서(Semantic Processor:SP)의 실시예는 도 1을 참조하면 이해될 수 있다. 상기 시맨틱 프로세서(100)는 인과 지식 기반(50)을 생성하기 위해 원시 텍스트(10)를 프로세스한다. 이 실시예에서, 상기 시맨틱 프로세서(100)는 (상기 원시 텍스트를 미리형성하기 위한) 프리 포맷기(Preformatter)(20), (언어 분석을 수행하기 위한) 언어 분석 기(30) 및 (상기 인과 지식 기반(50)을 생성하기 위한) 지식 기반 생성기(40)를 포함한다. 상기 시맨틱 프로세서(100)의 모든 모듈의 기능은 언어 지식 기반(60) 내에 유지될 수 있는 것으로, 사전, 분류자, 통계 데이터 등과 같은, 다양한 데이터베이스 및 (텍스트-대-단어 분열, 명사와 동사 위치의 인식, 주어, 목적어, 동작 및 그들 속성, 인과 인식 등에 대한) 언어 모델들을 인식하기 위한 데이터베이스를 포함한다. 상기 언어 분석기(30) 및 상기 지식 기반 생성기(40)는 하기에 추가로 상세하게 기술된다.
상기 프리 포맷기(20)에 의해 수행된 텍스트를 프리 포맷하는 단계는 바람직하게는 미국특허출원공개번호 제20030130837호에 기술된 기법들에 따라 수행된다. 상기 프리 포맷기(20)는 바람직하게는 자연어 텍스트의 일부를 형성하지 않는 텍스트의 디지털 또는 전자식 표현에 있어서 임의의 심볼을 제거한다. 예들 들면, 상기 프리 포맷기(20)는 문단 마크, 탭 문자 등과 같은 심볼들의 형성; 폰트 색상 및 폰트 크기와 같은 폰트 제어 심볼; 및 텍스트가 디스플레이되는 방법을 제어하기 위해 사용될 수 있으나, 상기 텍스트의 의미에는 영향을 주지 않는 기타 심볼들을 제거할 수 있다. 상기 프리 포맷기(20)는 또한 상기 원시 텍스트(10)에서 임의의 부정합 또는 실수들을 검출하고 정정할 수 있다. 상기 프리 포맷기(20)는 또한 상기 원시 텍스트(10)를 프리 포맷된 텍스트(12)를 생성하기 위한 문장들 및 단어들의 구조로 분할할 수도 있다(도 2 참조). 상기의 설명은 상기 프리 포맷기(20)에 의해 수행될 수 있는 모든 기능들을 설명하는 것으로 해석되어서는 안 된다. 상기 프리 포맷기(20)는 또한 하기에 설명된 언어 분석기(30)에 상기 원시 텍스트(10)를 보다 더 잘 준비하기 위해 다른 텍스트 조종 기능을 수행할 수 있다.
도 2는 상기 언어 분석기(30)를 포함하는 모듈들을 도시한다. 상기 언어 분석기(30)는 의미론적으로 분석된 텍스트(16)를 생성하기 위해 상기 프리 포맷기(20)로부터 프리 포맷된 텍스트를 프로세스 한다. 상기 프리 포맷된 텍스트(12)는 (상기 프리 포맷된 텍스트(12)에 대한 품사 태그들을 결정하고 적용하는) 품사 태거(Parts-of-Speech Tagger)(32)에 의해 수신된다. 파서(parser)(34)는 그후 상기 시맨틱 분석기(300)로 프로세싱하기 위해 상기 POS 태깅된 텍스트를 파싱한다. 상기 POS 태거 및 파서(34)에 의해 수행된 기능은 바람직하게는 미국특허출원공개번호 제20030130837호에 기술된 기법들에 따라 수행된다.
상기 언어 분석기에서, 상기 POS 태거(22)는 상기 프리 포맷된(preformated) 텍스트(12)의 각 단어에 품사 태그를 할당한다. 바람직하게는, 상기 품사 태깅은 상기 언어 지식 기반(60)의 일부를 형성하는 통계 데이터에 기초한다. 상기 태그들은 전형적으로 품사에 해당한다. 태그들의 예들로: JJ-형용사구, VB-동사, NN-명사 등을 포함한다. 본 발명의 실시예들은 종래기술에 공지된 품사 태그들을 사용할 수 있다. 상기 파서(34)는 태깅된 텍스트에서 동사구 문장들 및 명사구를 인식하고 구문상 파싱된 트리(syntactical parsed tree)를 수립하기 위한 동작을 수행한다. 상기 구문상 파싱된 트리의 생성을 용이하게 하기 위해, 언어 지식 기반(60)은 언어 모델들을 인식하는 단계를 포함한다. 이러한 모델들은 문장의 구조에 대한 규칙들, 이를 테면, 품사 태그들과 구문상 그룹들(클래스들)을 상관시키기 위한 규칙들을 포함한다. 따라서, 바람직한 형태로, 상기 파서(34)의 제1 단계는 POS 태그들을 다 루고, 그런 다음 상기 파서(34)는 점차적으로 POS 태그들의 문장들을 구문상 그룹들로 대체한다. 이러한 그룹들은 그 후 다른 그룹들에 의해 좀더 높은 문장 계층으로 대체되며, 따라서 트리 형태로, 이를 테면 구문상 파싱된 트리 형태로 문장의 다중-레벨 구문상 구조를 수립한다.
도 3은 상기 시맨틱 분석기(300)를 포함하는 모듈들을 도시한다. 상기 시맨틱 분석기(300)는 파싱된 텍스트(14)를 수신하고 의미론적으로 분석된 텍스트(16)를 생성한다. 상기 시맨틱 분석기(300)는 eSAO 인식을 수행하는 eSAO 인식기(310)를 갖는다. ESAO 인식은 바람직하게는 미국특허출원공개번호 제20020010574호 및 미국특허출원공개번호 제 20020116176호에 기술된 기법들에 따라 수행된다. 모든 eSAO 엘리먼트들의 인식은 상기 언어 지식 기반(60)의 일부인 해당 인식 언어 모델들에 의해 구현된다. 이러한 모델들은 품사 태그들, 어휘 항목들 및 구문상 카테고리들로서 한정 동작들, 비-한정 동작들, 동사적 명사들을 가진 상기 파싱된 텍스트 eSAO들로부터 추출하기 위해 사용되는 규칙들을 설명한다. 동작 추출 규칙의 일례로:
<HVZ><BEN><VBN>=>(<A>=<VBN>)이다.
이러한 규칙은 "입력 문장이 HVZ, BEN, VBN 태그들 각각 획득된 품사 태깅의 단계에서 단어들(w1, w2, w2)의 순서를 포함한다면, 그 후 이 문장에서 VBN을 갖는 단어는 동작이다"라는 것을 의미한다. 예를 들어, 상기 구 "has been produced"는 "has_HVZ been_BEN produced_VBN"으로 품사 태깅될 것이며 상기 규칙은 "produce"가 동작, 즉, (A=produce)임을 나타낼 것이다. 게다가, 상기 동작의 보이스(능동태 또는 수동태)는 주어와 목적어의 추출에 대한 규칙들로 고려된다. 상기 eSAO 내 및/또는 사이의 인과관계는 상기 인과(CE) 인식기(320)에 의해 수행되며, 그후 의미론적으로 분석된 텍스트(16)를 생성한다. 본 발명의 실시예들에 따른 인과 관계의 인식은 하기에 추가로 자세히 기술된다.
본 발명의 실시예들에 따른 인과 관계는 (완전 및 불완전 모두의)원인으로서의 하나 이상의 eSAO들과 (또한 완전 및 불완전 모두의)결과로서의 하나 이상의 eSAO들의 페어링(pairing)을 포함한다. 공정식으로 인과 관계는 하기와 같이 표현될 수 있다:
{eSAOi}->{eSAOj}
세트 {eSAOi}가 원인을 나타내고, 세트 {eSAOj}가 결과를 나타내는 경우, "->"는 특정 어휘, 문법 및 의미상 언어 수단을 가진 원인 및 결과에 관련된 순차적 오퍼레이터를 나타낸다. 단일 eSAO는 원인 eSAO와 결과 eSAO 둘 모두를 낳는다는 것을 주목하라. 또한, 지식 엔지니어링과 자연어 특수성의 관점에서, 인과관계는 개별 eSAO들에서 발견될 수 있다. 이러한 경우는 개별적으로 간주 될 것이다. 원인 및 격과 eSAO들 모두를 낳는 단일 eSAO의 경우가 우선 고려될 것이다.
상기 인과 인식기(320)는 단일 eSAO 내부의 그리고 다른 eSAO들 사이의 텍스트 문장에서 인과 관계를 검출하기 위한 알고리즘들을 사용한다. 이러한 알고리즘들은 언어 모델들 또는 패턴들을 생성함에 따라 분류될 수 있다. 이러한 패턴들은 첫째, 그 사용 환경, 이를테면, 문장에서 C-E 관계의 존재의 표시기들과 둘째, 상 기 관계의 원인 부분 역할을 하는 어느 eSAO 컴포넌트들 또는 전체 eSAO들 및 상기 관계의 결과 부분 역할을 하는 어느 eSAO 컴포넌트들 또는 전체 eSAO들에 대한 정보를 기술한다. 인과 표시기란 개별 eSAO 컴포넌트들을 말하며 언어 유닛, 그들의 어휘 및 문법 태그들, 클래스 등을 기술한다.
상기 인과 인식기(320)는 바람직하게는 공통 목록으로부터 상기 패턴들 중 하나에 따르기 위해 모든 eSAO들 및 eSAO의 쌍들을 분석한다. eSAO 또는 eSAO들 쌍이 패턴에 따른다면, 상기 인과 인식기(320)는 인과 관계의 존재를 등록하고 상기 인과 지식 기반(50)에 포함하기 위해 eSAO 또는 eSAO들 쌍을 표시한다. 상기 지식 기반 생성기(40)는 인과정보를 나타내고 이 정보에 기초한 상기 인과 지식 기반(50)을 생성하는 상기 eSAO들의 집합을 수행한다. 상기 지식 기반 생성기(40)는 또한 상기 인과 지식 기반(50)으로 등록하기 전에 상기 인과 관계를 편집할 수 있다. 예를 들면, 상기 지식 기반 생성기(40)는 반복하는 인과관계를 제거할 수 있다(또는 등록하지 않을 수 있다).
텍스트에서의 인과 관계를 인식하기 위한 바람직한 패턴들이 하기에 제시된다. 하지만, 다른 패턴들이 본 발명의 실시예들에 따라 사용될 수도 있다.
I. 단일 eSAO로부터 인과관계의 인식을 위한 패턴들
패턴 1: "CAUSE" 센스를 가진 동작
상기 패턴은 eSAO가 텍스트에서 인식되는 경우 발생하며, 상기 eSAO는 주어, 동작 및 목적어를 위한 적어도 3개의 논-엠프티(non-empty) 필드를 가지며, 상기 동작 필드는 "CAUSE" 센스를 갖는다. C-E 관계는 그후 상기 eSAO의 주어가 출력 관 계의 "원인" 부분이 되고 상기 eSAO의 목적어가 상기 관계의 "결과" 부분이 되는 경우 형성된다. 상기 패턴에서, "CAUSE" 동작 센스는 cause 동작과 관련된 의미를 가지는 임의의 어휘 유닛을 상징하는 비종단(nonterminal) 심볼이다. 예를 들면, 바람직한 실시예에서, "CAUSE" 일부는 단어 또는 구 "cause;resultin/create/develop/induce/actuate/arouse/bringabout/bringforth/bringon/generate/produce/etc."와 동일하다. 영어로, 40 이상의 어휘 유닛이 "CAUSE" 유형인 것으로 간주될 수 있다. 표 4는 패턴 1의 일반 형식(generic form)을 나타낸다.
Figure 112008036939596-PCT00004
[표 4]
예로서, "The vacuum knife causes a shearing air flow"로 된 입력 문장을 고려하자. 표 5는 상기 문장으로부터 추출된 eSAO를 나타낸다:
Figure 112008036939596-PCT00005
[표 5]
상기 eSAO가 패턴 1의 조건들을 만족하므로, (표 6에 도시된) 하기 C-E관계가 획득된다:
Figure 112008036939596-PCT00006
[표 6]
패턴 2: "Result From"센스를 가진 동작들
패턴 2는 상기 동작 필드가 "RESULT FROM" 센스를 가질 경우 발생한다. 상기 패턴에서, "RESULT FROM" 동작 센스는 result from 동작에 관련된 의미를 가지는 임의의 어휘 유닛을 상징하는 비종단 심볼이다. 예를 들면, 바람직한 실시예에서, "RESULT FROM" 일부는 단어 또는 구 "derive from/result from/spring from/stem from"과 동일하다. 표 7은 패턴 2의 일반 형식을 나타낸다.
Figure 112008036939596-PCT00007
[표 7]
예를 들면, 입력 문장 "In order to detect such unsafe situations resulting from insufficient air flow, a sail switc is utilized to measure the air flow in the combustion area as well as in the tumbler chamber,"은 표 8에 도시된 eSAO가 될 것이다. 본 발명의 바람직한 실시예에 따른 상기 입력 문장으로 인한 C-E 관계가 표 9에 도시된다.
Figure 112008036939596-PCT00008
[표 8]
Figure 112008036939596-PCT00009
[표 9]
패턴 3: 목적어에서 "cause of" 구성
패턴 3은 상기 목적어가 "CAUSE OF" 센스를 가질 경우 발생하며, 상기 동작은 "BE" 센스를 가진 목적어에 주어를 연결한다. 상기 패턴에서, "CAUSE OF" 목적어 센스는 명사구를 상징하는 비종단 심볼로서, 바람직하게는 하기의 패턴, 즉, 다수의 단어들; 단어 "cause" 또는 "causes", 다수의 단어들에 이어지는, 전치사 "of"에 따른다. 상기 "CAUSE OF" 센스는 다음의 식으로 표현될 수 있다:
CAUSE_PF=.*("cause"|"causes")"of".*
바람직한 실시예에서, 상기 "BE" 센스 일부는 단어 또는 구 "be/become/contain/correspond/demonstrate/establish/identify/indicate/indicate/present/represent."와 동일하다. 표 10은 패턴 3의 일반 형식을 나타낸다.
Figure 112008036939596-PCT00010
[표 10]
예를 들면, 입력 문장 "The water stream presents the cause of metal corrosion"은 표 11에 도시된 eSAO가 될 것이다. 본 발명의 바람직한 실시예에 따른 상기 입력 문장으로 인한 C-E 관계가 표 12에 도시된다.
Figure 112008036939596-PCT00011
[표 11]
Figure 112008036939596-PCT00012
[표 12]
패턴 4: 주어에서 "cause of" 구성
패턴 4는 상기 주어가 "CAUSE OF" 센스를 가질 경우 발생하며 상기 동작은 "BE" 센스를 가진 목적어에 주어를 연결한다. 상기 패턴에서, "CAUSE OF" 주어 센스는 또한 명사구를 상징하는 비종단 심볼로서, 바람직하게는 하기의 패턴, 즉 다수의 단어들; 단어 "cause" 또는 "causes", 다수의 단어들에 이어지는, 전치사 "of"에 따른다. 상기 "CAUSE OF" 센스는 다음의 식으로 표현될 수 있다:
CAUSE_OF=.*("cause"|"causes")"of".*
바람직한 실시예에서, 상기 "BE" 센스 일부는 단어 또는 구 "be/become"과 동일하다. 표 13은 패턴 4의 일반 형식을 나타낸다.
Figure 112008036939596-PCT00013
[표 13]
예를 들면, 입력 문장"The cause of water evaporation is heat"은 표 14에 도시된 eSAO가 될 것이다. 본 발명의 바람직한 실시예에 따른 상기 입력 문장으로 인한 C-E 관계가 표 15에 도시된다.
Figure 112008036939596-PCT00014
[표 14]
Figure 112008036939596-PCT00015
[표 15]
패턴 5: "technical" 센스를 가진 동작
패턴 5는 동작이 "TECHNICAL_ACTION"센스를 가질 경우 발생한다. 상기 패턴에서, "TECHNICAL_ACTION" 동작센스는 기술이란 의미를 가지는, 이를 테면 (그것의 속성 또는 파라미터를 변경하는) 목적어에 대한 일부 동작을 연습하는 동작 목록으로부터 임의의 어휘 유닛을 상징하는 비종단 심볼이다. 영어로, 3000개 이상의 어휘 유닛들이 상기"TECHNICAL_ACTION" 센스를 만족하는 것으로 간주될 수 있다. 예를 들면, 상기 "TECHNICAL_ACTION" 센스는 단어 또는 구 "abate/abrade/absorb/accelerate/emulsify/enamel/nitrogenize/straighten/soften/shield/protect/pressurize"를 포함할 수 있다. 표 16은 패턴 5의 일반 형식을 나타낸다.
Figure 112008036939596-PCT00016
[표 16]
예를 들면, 입력 문장 "The power plant generates electrical current"는 표 17에 도시된 eSAO가 될 것이다. 본 발명의 바람직한 실시예에 따른 상기 입력문장으로 인한 C-E 관계가 표 18에 도시된다.
Figure 112008036939596-PCT00017
[표 17]
Figure 112008036939596-PCT00018
[표18]
패턴 6: 목적어 1에서 명사 프로세스
패턴 6은 목적어가 "PROCESS_NN" 센스를 갖고 동작이 "LINK_ACTION" 센스를 가질 경우 발생한다. 상기 패턴에서, "PROCESS_NN" 목적어 센스는 process 또는 processes를 상징하는 명사 목록으로부터 임의의 어휘 유닛을 상징하는 비종단 심볼이다. 영어로, 6000개 이상의 어휘 유닛이 상기"PROCESS_NN" 센스를 만족하는 것으로 간주될 수 있다. 예를 들면, 상기 "PROCESS_NN" 센스는 단어 또는 구"abhesion/acctation/clearing/coextrusion/equilibration/filtering/hydration/isolation/oscillation/phos-phating."를 포함할 수 있다. "LINK_ACTION" 동작센스는 "link actions"의 목록으로부터 임의의 어휘 유닛을 상징하는 비종단 심볼로서, 출력 관계에서 누락될 것이다. 바람직하게는, 상기 "LINK_ACTION" 센스는 단어 "allow/do/execte/make/perform/permit/produce/propose/provide/realize/reestablish/reproduce."를 포함한다. 표 19는 패턴 6의 일반 형식을 나타낸다.
Figure 112008036939596-PCT00019
[표 19]
예를 들면, 입력 문장 "Alkali water performs polishing"은 표 20에 도시된 eSAO가 될 것이다. 본 발명의 바람직한 실시예에 따른 상기 입력 문장으로 인한 C- E관계가 표 21에 도시된다.
Figure 112008036939596-PCT00020
[표 20]
Figure 112008036939596-PCT00021
[표 21]
패턴 7: 목적어 2에서 명사 프로세스
패턴 7은 목적어가 "PROCESS_NN" 센스를 갖고 동작이 "LINK_TECH_ACTION" 센스를 가질 경우 발생한다. 상기 패턴에서, "PROCESS_NN" 목적어 센스는 또한 process 또는 processes를 상징하는 명사 목록으로부터 임의의 어휘 유닛을 상징하는 비종단 심볼이다. 영어로, 6000개 이상의 어휘 유닛들이 상기 패턴을 위해 "PROCESS_NN" 센스를 만족하는 것으로 간주될 수 있다. 예를 들면, 상기 패턴에서, "PROCESS_NN" 센스는 단어 또는 구 "abhesion/acetation/clearing/coextrusion/equilibration/filtering/hydration/isolation/oscillation/phos-phating."을 포함할 수 있다. "LINK_TECH_ACTION" 동작 센스는 동작 목록으로부터 임의의 어휘 유닛을 상징하는 비종단 심볼로서, 완전히 기술적이지는 않지만, 목적어에서 process 또는 processes를 의미하는 명사로 사용될 경우 기술적 의미를 갖는다. 영어로, "LINK_TECH_ACTION"은 70개 이상의 다른 어휘 유닛들을 포함할 수 있다. 예를 들면, 상기 "LINK_TECH_ACTION" 센스는 적어도 단어 "accomplish/achieve/acquire/actuate/aid/assist/assure/attain/avoid/begin/carryout/compel/constrain."을 포함할 수 있다. 표 22는 패턴 7의 일반 형식을 나타낸다.
Figure 112008036939596-PCT00022
[표 22]
예를 들면, 입력 문장 "Multiple changes of direction facilitate separation of water and debris from the air"은 표 23에 도시된 eSAO가 될 것이다. 본 발명의 바람직한 실시예에 따른 상기 입력 문장으로 인한 C-E관계가 표 24에 도시된다.
Figure 112008036939596-PCT00023
[표 23]
Figure 112008036939596-PCT00024
[표 24]
eSAO들 사이의 인과 관계 인식을 위한 패턴들
이 섹션은 eSAO들 사이에 결정될 수 있는 인과관계들을 논의한다. 이 섹션에서의 패턴들에 대한 예들은 이러한 패턴들이 인과관계를 따를 때(이전 섹션으로부터의 패턴들과는 대조적으로, 인과관계들이 단일 eSAO로부터 추출되는 경우) eSAO들을 변경하지 않기 때문에 각 문장에 대한 eSAO들을 설명하지 않는다.
패턴 1: 목적의 부사적 수식어구: TO VB/DO/HV
상기 패턴에서, 원인에 관련된 것으로 간주된, 제1 eSAO는 "ACTIVE"센스를 가지는 동작을 가지며, 결과에 관련된 것으로 간주된, 제 2 eSAO는 "TO_VB/HB/HV" 센스를 가지는 동작을 갖는다. 상기 "ACTIVE" 동작 센스는 액티브 보이스 동사 그룹으로부터 추출된 동작을 상징하는 비종단 심볼이다. 상기 "TO_VB/HB/HV" 동작 센스는 임의의 부정사형 동사(VB), 즉, 동사 앞에 관사 "to"를 갖는, 부정사형 "have"(HV); 또는 부정사형 "do"(DO)의 태그들을 갖는 동사들로 구성되는 동사 그룹으로부터 추출된 동작을 상징하는 비종단 심볼이다. 표 25는 패턴 1의 일반 형식을 나타낸다.
Figure 112008036939596-PCT00025
[표 25]
예를 들면, 입력 문장 "The register contains the proper bit pattern to begin its shift-out operation"은 표 26에 도시된 C-E관계가 될 것이다.
Figure 112008036939596-PCT00026
[표 26]
패턴 2: 원인의 부사적 수식어구: BY VBG
상기 패턴에서, 제1 eSAO는 결과에 관계되는 것으로 간주되며, 원인에 관계되는 것으로 간주된, 제2 eSAO는 "BY_VBG" 센스를 가지는 동작을 갖는다. 상기 "BY_VBG" 동작 센스는 전치사 "by"에 의해 앞에 위치하는 분사 I(동명사형 동사(VBG))로 구성되는 분사 구문으로부터 추출된 동작을 상징하는 비종단 심볼이다. 표 27은 패턴 2의 일반 형식을 나타낸다.
Figure 112008036939596-PCT00027
[표 27]
예를 들면, 입력 문장 "The evaporating treatment was carried out by passing air onto the tube"은 표 28에 도시된 C-E관계가 될 것이다.
Figure 112008036939596-PCT00028
[표 28]
패턴 3: 목적의 부사적 수식어구: FOR VBG
상기 패턴에서, 제1 eSAO는 원인에 관계된 것으로 간주되며, 결과에 관계된 것으로 간주된, 제2 eSAO는 "FOR_VBG" 센스를 가지는 동작을 갖는다. 상기 "FOR_VBG" 동작 센스는 전치사 "for"에 의해 앞에 위치하는 분사I(동명사형 동사(VBG))로 구성되는 분사 구문으로부터 추출된 동작을 상징하는 비종단 심볼이다. 표 29는 패턴 3의 일반 형식을 나타낸다.
Figure 112008036939596-PCT00029
[표 29]
예를 들면, 입력 문장 "The developed control signal is applied to the bias voltage generator for varying the bias voltage" 은 표 30에 도시된 C-E 관계가 될 것이다.
Figure 112008036939596-PCT00030
[표 30]
패턴 4: 목적의 부사적 수식어구: THUS VBG
상기 패턴에서, 제1 eSAO는 원인에 관계되는 것으로 간주되며, 결과에 관계되는 것으로 간주된, 제2 eSAO는 "THUS_VBG" 센스를 가지는 동작을 갖는다. 상기 "THUS_VBG" 동작 센스는 다음의 부사, 즉, "thus," "thereby," 및 "therefore." 중 어느 것에 의해 앞에 위치하는 분사I(동명사형 동사(VBG))로 구성되는 동사구로부터 추출된 동작을 상징하는 비종단 심볼이다. 표 31은 패턴 4의 일반 형식을 나타낸다.
Figure 112008036939596-PCT00031
[표 31]
예를 들면, 입력 문장 "The aforementioned armature is secured to the side plates by pivot devices, thus obtaing excellent mechanical operation"은 표 32에 도시된 C-E관계가 될 것이다.
Figure 112008036939596-PCT00032
[표 32]
패턴 5: 분사구 형식의 주어
상기 패턴들은 제1 eSAO의 동작이 센스 "VBG", 즉, 상기 동작이 분사I(동명사형 동사(VBG))로 구성되는 동사로부터 추출되는 동작을 가지며, 제2 eSAO의 동작은 센스들 "TECHNICAL_ACTION," "LINK_ACTION," 또는 "LINK_TECH_ACTION,"에 의해 기술될 수 있으며, 목적어는 동작이 "LINK_ACTION" 또는 "PROCESS_NN"일 경우와 동작이 "LINK_ACTION" 또는 "LINK_TECH_ACTION"일 경우에 임의의 논-엠프티 스트링일 수 있을 때 발생한다. 출력 C-E 관계의 "결과" 부분은 비종단 심볼"LINK_ACTION." "TECHNICAL_ACTION," "LINK_ACTION," "LINK_TECH_ACTION,"에 해당하는 동작들을 포함하지 않을 것이며 "PROCESS_NN"는 단일 eSAO들에 기초한 패턴들을 위해 상기에 규정되었던 것과 같이 규정된다. 표 33은 패턴 5의 일반 형식을 나타낸다.
Figure 112008036939596-PCT00033
[표 33]
예를 들면, 입력 문장 "Forming all members from the same die facilitates economical manufactureing"은 표 34에 도시된 C-E 관계가 될 것이다.
Figure 112008036939596-PCT00034
[표 34]
패턴 6: 원인의 부사적 수식어구: DEPEND ON
상기 패턴은 제2 eSAO의 동작이 센스 "DEPEND_ON", 즉, 상기 동작이 전치사 "on"으로 뒤따르는 "depend" 또는 "depending"으로 구성되는 동사 그룹으로부터 추출되는 동작을 가질 경우 발생한다. 표 35는 패턴 6의 일반 형식을 나타낸다.
Figure 112008036939596-PCT00035
[표 35]
예를 들면, 입력 문장 "The durometer hardness of the elastomeric tube can also be changed depending on the mechanical properties and design of the various stents to be crimped"은 표 36에 도시된 C-E 관계가 될 것이다.
Figure 112008036939596-PCT00036
[표 36]
패턴 7: 복합 문장, CONJUNCTION CAUSE 1
상기 패턴은 두 개의 eSAO들을 가진 복합 문장과 상기 두 개의 eSAO들에 앞서는 "CONJUNCTION_CAUSE_1" 센스에 해당하는 어휘 유닛을 인식했을 시 발생한다. C-E관계는 제1 eSAO가 원인이 되고 제2 eSAO가 C-E관계의 결과 부분이 될 경우 추출된다. 상기 "CONJUNCTION_CAUSE_1" 센스는 적어도 다음의 단어 또는 구 "because/as/if/as long as/as soon as/for the reason that/in case/inasmuch/on condition that/provied/since."를 포함한다. 표 37은 패턴 7의 일반 형식을 나타낸다.
Figure 112008036939596-PCT00037
[표 37]
예를 들면, 입력 문장 "As soon as the switch has become warm, the electrical connection to the wire is interrupted"은 표 38에 도시된 C-E 관계가 될 것이다.
Figure 112008036939596-PCT00038
[표 38]
패턴 8: 복합 문장, CONJUNCTION CAUSE 2
상기 패턴은 두 개의 eSAO들을 가진 복합 문장 및 상기 두 개의 eSAO들을 분리하는 "CONJUNCTION_CAUSE_2" 센스에 해당하는 어휘 유닛을 인식했을 시 발생한다. C-E 관계는 제1 eSAO가 결과가 되고 제2 eSAO가 C-E관계의 원인 부분이 될 경우 추출된다. 상기 "CONJUNCTION_CAUSE_2" 센스는 적어도 다음의 단어 또는 구 "because/as/if/as long as/as soon as/for the reason that/in case/inasmuch/on condition that/provided/since."를 포함한다. 표 39는 패턴 8의 일반 형식을 나타낸다.
Figure 112008036939596-PCT00039
[표 39]
예를 들면, 입력 문장 "This contact period can be further reduced if the milk and resin are stirred"은 표 40에 도시된 C-E 관계가 될 것이다.
Figure 112008036939596-PCT00040
[표 40]
패턴 9: 복합 문장, CONJUNCTION EFFECT
상기 패턴은 두 개의 eSAO들을 가진 복합 문장 및 상기 두 개의 eSAO들을 분리하는 "CONJUNCTION_EFFECT" 센스에 해당하는 어휘 유닛을 인식했을 시 발생한다. C-E 관계는 제1 eSAO가 원인이 되고 제2 eSAO가 C-E 관계의 결과 부분이 될 경우 추출된다. 상기 "CONJUNCTION_EFFECT" 센스는 적어도 다음의 단어 또는 구 "so that/such that."을 포함한다. 표 41은 패턴 8의 일반 형식을 나타낸다.
Figure 112008036939596-PCT00041
[표 41]
예를 들면, 입력 문장 "side portions of the top surface are spaced from the side surfaces to define foul ball openings so that balls can fall from the top surface to the bottom surface"은 표 42에 도시된 C-E 관계가 될 것이다.
Figure 112008036939596-PCT00042
[표 42]
도 4는 본 발명의 실시예들에 의해 사용될 수 있는 관계도 모델들을 생성하기 위해 사용될 수 있는 모듈들을 도시한다. 도 4에 도시된 바와 같이, 충분히 큰 텍스트 문서의 코퍼스(170)는 상기 모델들 또는 패턴들을 수립하고 형성하기 위해 사용된다. 상기 코퍼스 언어 분석기(180)는 eSAO들을 인식하기 위해 상기 코퍼스(170)에 대한 언어 분석을 수행한다. 코퍼스 ESAO 생성기(190)는 적어도 하나의 eSAO를 포함하는 문장들의 코퍼스를 생성한다. 관계 인식기(200)는 적어도 하나의 eSAO를 포함하는 문장들에서 C-E 관계들의 일부 특정 경우들의 인식 프로세스를 수행한다. 패턴 생성기(210)는 보다 일반적인 특정 경우들을 보다 일반적인 패턴들로 일반화한다. 패턴 테스터기(220)는 인과 관계들의 존재에 대해 확인하며 인과관계 인식을 위해 데이터베이스(230)로 승인된 패턴들을 배치한다.
바람직하게는, 상기 관계 인식기(200)의 기능은 전문자들에 의해 수동으로 수행된다. 예를 들면, 전문가는 eSAO 텍스트 코퍼스로부터 문장 "The aforementioned armature is secured to the plates by pivot devices, thus obtaining excellent mechanical operation"을 분석하며, 여기서 품사 태깅, 파싱 및 시맨틱 분석이 수행되고 두 개의 eSAO들(표 31 참조)이 인식되는 언어 분석기는 이러한 eSAO들이 인과관계의 부분을 형성한다는 점을 나타내는 특별한 태그들을 집어넣는다. 그 후 이 문장은 상기 패턴 생성기(210)로 간다.
상기 패턴 생성기(210)는 패턴들의 레벨에 대한 C-E 관계의 분석 및 일반화를 수행한다. 상기 패턴 생성기의 기능은 또한 바람직하게는 전문자들에 의해 수동으로 수행된다. 이러한 방식에서, 전문가는 그의 또는 그녀의 경험과 지식과 언어 지식 기반에 포함된 지식을 고려한다. 이전 예로 돌아가, 상기 전문가는 부사들 "thereby" 및 "therefore"이 부사 "thus"와 유사한 의미를 가진다는 결론에 도달해야 한다. 게다가, 단어 "thus"에 태그 VBG를 갖는 "obtaining"이 뒤따른다. 그러므로, 전문가는 표 30에 나타낸 방법으로 상기 패턴의 원형(prototype)을 등록한다.
원형의 패턴들을 사용하는, 상기 패턴 테스터기(220)는 eSAO 텍스트 코퍼스에서 인과관계의 예들을 찾는다. 상기 전문가는 회수된 예들을 분석하고 (아마 일부 수정된) 패턴을 승인한다. 상기 패턴 테스터기(220)는 그 후 상기 승인된 패턴을 C-E 인식을 위한 패턴들의 데이터베이스(230)에 집어넣는다.
상기에 나타낸 바와 같이, 상기 시맨틱 분석기(180) 및 상기 패턴 생성기(210) 모두는 그들의 기능의 수행을 위해 상기 언어 지식 기반에 접근할 수 있다. 또한, 본 발명의 일부 실시예들에서, 상기 패턴들의 데이터베이스(230)는 도 1-3에 관해 상기에 기술된 상기 인과 시맨틱 프로세싱을 지지하기 위해 상기 언어 지식 기반(60) 내에 병합될 수 있다.
본 발명의 실시예들은 하나 이상의 컴퓨터, 마이크로프로세서, 마이크로컨트롤러, 또는 다른 프로세싱 장치들에 상주하는 컴퓨터 수행가능 명령들에 의해 제공될 수 있다. 상기 시스템 및 방법을 수행하기 위한 상기 컴퓨터-수행가능 명령들은 프로세싱 장치들 안의 메모리에 존재할 수 있으며 또는 플로피 디스크, 하드 디스크, 컴팩트 디스크(CD들), 디지털 다기능 디스크(DVD들), 롬(ROM), 또는 기타 저장 매체에 의한 프로세싱 장치들에 제공될 수 있다.
대표적이고 바람직한 실시예들의 전술한 상세설명은 법률 조항들에 따라 도시 및 개시를 목적으로 제시된다. 본 발명이 정확한 형태(들)로 국한되어서는 안되며, 단지 본 발명에 속하는 기술분야에서 통상의 지식을 가진 자들이 본 발명이 특정 사용 또는 구현을 위해 어떻게 적응되는 지를 이해하게 할 뿐이다. 변형 및 변경의 가능성은 본 발명의 기술분야에 속하는 통상의 지식을 가진 자들에게 명백해질 것이다. 대표적인 실시예들의 설명에 의해 국한되는 것으로 의도하지 않으며, 이에는 허용치, 특정 규격들, 특정 동작 조건들, 엔지니터링 사양 등이 포함될 수 있으며, 구체에들 간에 또는 기술의 상태에 대한 변경들로 변할 수 있으며, 그것으로부터 국한되어서는 안 된다. 상기 개시물은 기술의 현재 상태에 관해 작성되었으나, 또한 장점들을 심사숙고하고 기술의 현재 상태에 따른 장래 개조에 있어서 그러한 발전을 고려할 수도 있다. 본 발명의 범위는 작성된 청구항들 및 적용가능한 것으로서의 상응물에 의해 규정되는 것으로 의도된다. 단일의 주장 요소에 대한 참조는 명백하게 그렇다고 하지 언급하지 않는 한 "하나 및 단지 하나"를 의미하는 것으로 의도되지 않는다. 게다가, 본 개시물에 없는 엘리먼트, 컴포넌트, 또는 방법 또는 프로세스 단계는 상기 엘리먼트, 컴포넌트, 또는 단계가 청구항들에 명백하게 인용되는지에 상관없이 공개적으로 전용된 것으로 의도된다. 본원에 주장 요소가 구문 "...을 위한 수단"을 사용하여 확실히 언급되지 않는 한 그리고 본원에 방법 또는 프로세스가 구문 "...하기 위한 단계(들)"을 사용하여 확실히 언급되지 않는 한 법조항 35 U.S.C. Sec.112, 6번째 문단에 의해 구성될 수 없다.

Claims (22)

  1. 적어도 하나의 자연어 문서로부터 텍스트를 제공하는 단계;
    상기 텍스트에서 하나 이상의 확장형 주어-동작-목적어(eSAO) 세트들을 인식하는 단계로서, 각 eSAO 세트는 하나 이상의 eSAO 컴포넌트들을 가지는, 단계;
    인과(cause-effect) 관계도 패턴들에 상기 하나 이상의 eSAO 세트들을 매치시키는 단계;
    상기 매칭에 기초한 하나 이상의 eSAO 인과 관계들을 생성하는 단계로서, 상기 eSAO 인과 관계는 원인 eSAO와 결과 eSAO를 포함하는 단계; 및
    상기 하나 이상의 eSAO 인과 관계들을 지식 기반에 저장하는 단계를 포함하는, 인과 지식 기반을 생성하기 위해 자연어 문서들에서 인과 관계들을 인식하기 위한 방법.
  2. 제 1 항에 있어서, 상기 하나 이상의 eSAO 컴포넌트들은 주어, 목적어, 동작, 형용사, 전치사, 간접 목적어, 및 부사로 구성되는 그룹의 하나 이상의 엘리먼트들과 관련된 텍스트를 포함하는, 인과 지식 기반을 생성하기 위해 자연어 문서들에서 인과 관계들을 인식하기 위한 방법.
  3. 제 1 항에 있어서, 상기 원인 eSAO는 상기 하나 이상의 eSAO 세트들 중 하나 이상의 eSAO 컴포넌트들을 포함하고, 상기 결과 eSAO는 상기 하나 이상의 eSAO 세 트들 중 하나 이상의 eSAO 컴포넌트들을 포함하는, 인과 지식 기반을 생성하기 위해 자연어 문서들에서 인과 관계들을 인식하기 위한 방법.
  4. 제 2 항에 있어서, 상기 eSAO 인과 관계는 상기 원인 eSAO의 eSAO 컴포넌트들에 상기 결과 eSAO의 eSAO 컴포넌트들을 어휘, 문법 및/또는 시맨틱 언어 수단들로 관련시키는 순차적 오퍼레이터를 포함하는, 인과 지식 기반을 생성하기 위해 자연어 문서들에서 인과 관계들을 인식하기 위한 방법.
  5. 제 1 항에 있어서,
    상기 텍스트의 태깅된 부분들을 생성하기 위해 상기 텍스트의 적어도 일부분에 품사(parts-of-speech) 태그들을 적용하는 단계; 및
    상기 텍스트의 파싱 및 태깅된 부분들을 생성하기 위해 상기 텍스트의 태깅된 부분들을 파싱하는 단계를 더 포함하며, 상기 텍스트에서 상기 eSAO 세트들을 인식하는 단계는 상기 텍스트의 상기 파싱 및 태깅된 부분들에 대해 수행되는, 인과 지식 기반을 생성하기 위해 자연어 문서들에서 인과 관계들을 인식하기 위한 방법.
  6. 제 4 항에 있어서, 품사 태그들을 적용하는 단계는 상기 텍스트의 프리 포맷된(preformatted) 부분들에 대해 수행되어, 이로써 제거된 비자연어 심볼들을 가진 텍스트를 상기 텍스트의 상기 프리 포맷된 부분들이 포함하는, 인과 지식 기반을 생성하기 위해 자연어 문서들에서 인과 관계들을 인식하기 위한 방법.
  7. 제 1 항에 있어서, 인과 관계도 패턴들에 상기 하나 이상의 eSAO 세트들을 매치시키는 단계는 단일 eSAO 세트를 매치시키는 단계를 포함하고 상기 매칭에 기초한 하나 이상의 eSAO 인과 관계들을 생성하는 단계는 단일 eSAO 인과 관계를 생성하는 단계를 포함하는, 인과 지식 기반을 생성하기 위해 자연어 문서들에서 인과 관계들을 인식하기 위한 방법.
  8. 제 1 항에 있어서, 인과 관계도 패턴들에 상기 하나 이상의 eSAO 세트들을 매치시키는 단계는 한 쌍의 eSAO 세트들을 매치시키는 단계를 포함하고 상기 매칭에 기초한 하나 이상의 eSAO 인과 관계들을 생성하는 단계는 상기 쌍의 매칭에 기초한 단일 eSAO 인과 관계를 생성하는 단계를 포함하는, 인과 지식 기반을 생성하기 위해 자연어 문서들에서 인과 관계들을 인식하기 위한 방법.
  9. 제 1 항에 있어서, 인과 관계도 패턴들에 사기 하나 이상의 eSAO 세트들을 매치시키는 단계는 인과 패턴 데이터베이스에 접근하는 단계를 포함하며, 상기 인과 패턴 데이터베이스가,
    텍스트 문서들에서 eSAO 세트들을 인식하는 단계;
    문장들의 코퍼스(corpus)를 생성하는 단계로서, 각 문장은 상기 인식된 eSAO 세트들 중 적어도 하나를 포함하는, 단계;
    상기 문장들에서 인과 관계들의 특정 경우들을 인식하는 단계;
    상기 인과 관계들의 특정 경우들을 eSAO 인과 패턴들로 일반화시키는 단계;
    상기 eSAO 인과 패턴들을 인과 패턴 데이터베이스에 저장하는 단계를 포함하는 방법에 의해 생성되는, 인과 지식 기반을 생성하기 위해 자연어 문서들에서 인과 관계들을 인식하기 위한 방법.
  10. 제 1 항에 있어서, 상기 텍스트에서 하나 이상의 확장형 주어-동작-목적어(eSAO) 세트들을 인식하는 단계는 eSAO 컴포넌트들을 규정하는 데이터베이스를 가지는 언어 지식 기반에 접근하는 단계를 포함하는, 인과 지식 기반을 생성하기 위해 자연어 문서들에서 인과 관계들을 인식하기 위한 방법.
  11. 제 1 항에 있어서, 상기 텍스트에서 하나 이상의 확장형 주어-동작-목적어(eSAO) 세트들을 인식하는 단계는 상기 텍스트의 하나 이상의 문장들에서 주어, 목적어, 동작, 형용사, 전치사, 간접 목적어, 및/또는 부사를 인식하는 단계를 포함하는, 인과 지식 기반을 생성하기 위해 자연어 문서들에서 인과 관계들을 인식하기 위한 방법.
  12. 적어도 하나의 자연어 문서로부터 텍스트를 제공하는 단계;
    상기 텍스트에서 하나 이상의 확장형 주어-동작-목적어(eSAO) 세트들을 인식하는 단계로서, 각 eSAO 세트는 하나 이상의 eSAO 컴포넌트들을 가지는, 단계;
    인과(cause-effect) 관계도 패턴들에 상기 하나 이상의 eSAO 세트들을 매치시키는 단계;
    상기 매칭에 기초한 하나 이상의 eSAO 인과 관계들을 생성하는 단계로서, 상기 eSAO 인과 관계는 원인 eSAO와 결과 eSAO를 포함하는, 단계; 및
    상기 하나 이상의 eSAO 인관 관계들을 지식 기반에 저장하는 단계를 포함하는, 인과 지식 기반을 생성하기 위해 자연어 문서들에서 인과 관계들을 인식하기 위한 방법을 수행하기 위한 컴퓨터에서 실행가능한 명령들을 포함하는 컴퓨터 프로그램 제품.
  13. 전자 또는 디지털 형태의 텍스트에서 인과 관계들을 인식하기 위한 시맨틱 프로세서에 있어서,
    언어 지식 기반; 및
    상기 텍스트에 기초한 하나 이상의 eSAO 세트들을 생성하기 위한 확장형 주어-동작-목적어(eSAO) 인식기로서, 상기 eSAO 세트들은 상기 언어 지식 기반에 저장된 eSAO 정의에 기초하는, 인식기; 및
    상기 하나 이상의 eSAO 세트들과, 상기 언어 지식 기반에 저장된 공지된 인과 관계 패턴들을 매치시키고 상기 매치에 기초한 하나 이상의 eSAO 인과 관계들을 생성하기 위한 인과 인식기를 포함하는 시맨틱 분석기를 포함하며,
    상기 하나 이상의 eSAO 인과 관계들이 추후 사용을 위해 지식 기반에 저장되는, 시맨틱 프로세서.
  14. 제 13 항에 있어서, 상기 시맨틱 프로세서는 상기 시맨틱 분석기를 포함하는 언어 분석기를 포함하며 상기 언어 분석기는,
    전자 또는 디지털 형식의 상기 텍스에 기초한 프리 포맷된(preformatted) 텍스트를 수신하기 위한 품사 태거(parts-of-speech tagger); 및
    상기 품사 태거에 의해 태깅된 텍스트를 수신하고 상기 시맨틱 분석기로 파싱된 텍스트를 제공하기 위한 파서(parser)를 더 포함하며,
    상기 품사 태거 및 상기 파서는 상기 언어 지식 기반에 저장된 데이터로 동작하는, 시맨틱 프로세서.
  15. 제 14 항에 있어서,
    전자 또는 디지털 형식의 텍스트를 수신하고 상기 언어 지식 기반에 저장된 데이터에 기초한 프리 포맷된 텍스트를 생성하기 위한 프리 포맷기(preformatter); 및
    상기 언어 분석기에 의해 생성된 상기 하나 이상의 eSAO 인과 관계들로부터 지식 기반을 생성하기 위한 지식 기반 생성기를 더 포함하는, 시맨틱 프로세서.
  16. 제 15 항에 있어서, 상기 프리 포맷기는 하기의 기능들로서,
    자연어 텍스트 부분을 형성하지 않는 텍스트의 디지털 또는 전자식 표현에 있어 임의의 심볼 제거;
    상기 텍스트에서 임의의 부정합 또는 실수들의 삭제 및 정정; 및
    상기 텍스트를 문장 및 단어의 구조로 분할하는 기능들 중 적어도 하나를 수행하는, 시맨틱 프로세서.
  17. 제 13 항에 있어서, 공지된 인과 관계도 패턴들은,
    텍스트 문서들의 코퍼스에서 eSAO 세트들을 인식하기 위한 코퍼스 언어 분석기;
    문장들의 코퍼스를 생성하기 위한 코퍼스 eSAO 생성기로서, 각 문장은 상기 인식된 eSAO 세트들 중 적어도 하나를 포함하는, 생성기;
    상기 문장들에서 인과 관계들의 특정 경우들을 인식하기 위한 관계 인식기;
    상기 인과 관계들의 특정 경우들을 eSAO 인과 패턴들로 일반화시키기 위한 패턴 생성기; 및
    상기 eSAO 인과 패턴들을 상기 언어 지식 기반 내의 데이터베이스인, 인과 패턴 데이터베이스에 저장하기 위한 패턴 테스터기를 포함하는 인과 관계도 생성기에 의해 생성되는, 시맨틱 프로세서.
  18. 제 13 항에 있어서, 상기 eSAO 인과 관계는 원인 eSAO, 결과 eSAO, 및 상기 인과 eSAO에 상기 결과 eSAO를 관련시키는 적어도 하나의 순차적 오퍼레이터를 포함하는, 시맨틱 프로세서.
  19. 제 18 항에 있어서, 상기 텍스트에 기초한 각 eSAO 세트는 eSAO 컴포넌트들을 포함하고 상기 원인 eSAO는 하나 이상의 상기 eSAO 컴포넌트들을 포함하고 상기 결과 eSAO는 상기 원인 eSAO의 상기 하나 이상의 eSAO 컴포넌트들과는 다른 하나 이상의 eSAO 컴포넌트들을 포함하는, 시맨틱 프로세서.
  20. 제 19 항에 있어서, 상기 eSAO 컴포넌트들은 주어, 목적어, 동작, 형용사, 전치사, 간접 목적어, 및 부사로 구성되는 그룹의 하나 이상의 엘리먼트들과 관련된 텍스트를 포함하는, 시맨틱 프로세서.
  21. 제 13 항에 있어서, 상기 인과 인식기는 단일 eSAO 세트와 공지된 인과 관계도 패턴을 매치시키며 단일 eSAO 인과 관계를 생성하는, 시맨틱 프로세서.
  22. 제 13 항에 있어서, 상기 인과 인식기는 한 쌍의 eSAO 세트들과 공지된 인과 관계도 패턴을 매치시키며 단일 eSAO 인과 관계를 생성하는, 시맨틱 프로세서.
KR1020087012454A 2005-10-24 2006-10-24 자연어 문서들에서 인과 관계들의 인식을 위한 시맨틱프로세서 KR20080092337A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/258,250 US9009590B2 (en) 2001-07-31 2005-10-24 Semantic processor for recognition of cause-effect relations in natural language documents
US11/258,250 2005-10-24

Publications (1)

Publication Number Publication Date
KR20080092337A true KR20080092337A (ko) 2008-10-15

Family

ID=37873241

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020087012454A KR20080092337A (ko) 2005-10-24 2006-10-24 자연어 문서들에서 인과 관계들의 인식을 위한 시맨틱프로세서

Country Status (4)

Country Link
US (1) US9009590B2 (ko)
EP (1) EP1941394A2 (ko)
KR (1) KR20080092337A (ko)
WO (1) WO2007051106A2 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011065617A1 (ko) * 2009-11-27 2011-06-03 한국과학기술정보연구원 과학기술핵심개체 간 의미적 연관관계 자동 추출을 위한 시맨틱 구문 트리 커널 기반 처리 시스템 및 방법
WO2017048030A1 (ko) * 2015-09-14 2017-03-23 강민구 3단계 음성 언어 학습을 위한 더블 음원 재생 장치 및 방법

Families Citing this family (150)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US9009590B2 (en) 2001-07-31 2015-04-14 Invention Machines Corporation Semantic processor for recognition of cause-effect relations in natural language documents
US8799776B2 (en) * 2001-07-31 2014-08-05 Invention Machine Corporation Semantic processor for recognition of whole-part relations in natural language documents
US20060277525A1 (en) * 2005-06-06 2006-12-07 Microsoft Corporation Lexical, grammatical, and semantic inference mechanisms
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US7672831B2 (en) * 2005-10-24 2010-03-02 Invention Machine Corporation System and method for cross-language knowledge searching
US7805455B2 (en) * 2005-11-14 2010-09-28 Invention Machine Corporation System and method for problem analysis
US7668791B2 (en) * 2006-07-31 2010-02-23 Microsoft Corporation Distinguishing facts from opinions using a multi-stage approach
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8671341B1 (en) * 2007-01-05 2014-03-11 Linguastat, Inc. Systems and methods for identifying claims associated with electronic text
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US8521512B2 (en) * 2008-04-30 2013-08-27 Deep Sky Concepts, Inc Systems and methods for natural language communication with a computer
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
WO2010067118A1 (en) 2008-12-11 2010-06-17 Novauris Technologies Limited Speech recognition involving a mobile device
WO2010105214A2 (en) 2009-03-13 2010-09-16 Invention Machine Corporation Question-answering system and method based on semantic labeling of text documents and user questions
CN102439594A (zh) * 2009-03-13 2012-05-02 发明机器公司 用于知识搜索的系统和方法
US8972445B2 (en) 2009-04-23 2015-03-03 Deep Sky Concepts, Inc. Systems and methods for storage of declarative knowledge accessible by natural language in a computer capable of appropriately responding
US8214366B2 (en) * 2009-11-17 2012-07-03 Glace Holding Llc Systems and methods for generating a language database that can be used for natural language communication with a computer
US8275788B2 (en) 2009-11-17 2012-09-25 Glace Holding Llc System and methods for accessing web pages using natural language
US9805020B2 (en) 2009-04-23 2017-10-31 Deep Sky Concepts, Inc. In-context access of stored declarative knowledge using natural language expression
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10255566B2 (en) 2011-06-03 2019-04-09 Apple Inc. Generating and processing task items that represent tasks to perform
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US20140114986A1 (en) * 2009-08-11 2014-04-24 Pearl.com LLC Method and apparatus for implicit topic extraction used in an online consultation system
US9646079B2 (en) 2012-05-04 2017-05-09 Pearl.com LLC Method and apparatus for identifiying similar questions in a consultation system
US9904436B2 (en) 2009-08-11 2018-02-27 Pearl.com LLC Method and apparatus for creating a personalized question feed platform
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US8719006B2 (en) * 2010-08-27 2014-05-06 Apple Inc. Combined statistical and rule-based part-of-speech tagging for text-to-speech synthesis
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US20130013616A1 (en) * 2011-07-08 2013-01-10 Jochen Lothar Leidner Systems and Methods for Natural Language Searching of Structured Data
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US9934218B2 (en) * 2011-12-05 2018-04-03 Infosys Limited Systems and methods for extracting attributes from text content
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9275038B2 (en) 2012-05-04 2016-03-01 Pearl.com LLC Method and apparatus for identifying customer service and duplicate questions in an online consultation system
US9501580B2 (en) 2012-05-04 2016-11-22 Pearl.com LLC Method and apparatus for automated selection of interesting content for presentation to first time visitors of a website
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
KR20230137475A (ko) 2013-02-07 2023-10-04 애플 인크. 디지털 어시스턴트를 위한 음성 트리거
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
AU2014233517B2 (en) 2013-03-15 2017-05-25 Apple Inc. Training an at least partial voice command system
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
DE112014002747T5 (de) 2013-06-09 2016-03-03 Apple Inc. Vorrichtung, Verfahren und grafische Benutzerschnittstelle zum Ermöglichen einer Konversationspersistenz über zwei oder mehr Instanzen eines digitalen Assistenten
CN105265005B (zh) 2013-06-13 2019-09-17 苹果公司 用于由语音命令发起的紧急呼叫的系统和方法
WO2015020942A1 (en) 2013-08-06 2015-02-12 Apple Inc. Auto-activating smart responses based on activities from remote devices
JP5904559B2 (ja) 2013-12-20 2016-04-13 国立研究開発法人情報通信研究機構 シナリオ生成装置、及びそのためのコンピュータプログラム
JP6403382B2 (ja) * 2013-12-20 2018-10-10 国立研究開発法人情報通信研究機構 フレーズペア収集装置、及びそのためのコンピュータプログラム
JP5907393B2 (ja) 2013-12-20 2016-04-26 国立研究開発法人情報通信研究機構 複雑述語テンプレート収集装置、及びそのためのコンピュータプログラム
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
EP3149728B1 (en) 2014-05-30 2019-01-16 Apple Inc. Multi-command single utterance input method
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9606986B2 (en) 2014-09-29 2017-03-28 Apple Inc. Integrated word N-gram and class M-gram language models
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US20170103182A1 (en) * 2015-01-25 2017-04-13 International Business Machines Corporation Modelling Disease Progression and Intervention Effects Using Non-Clinical Information Proxies for Clinical Information
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US10592519B2 (en) 2016-03-29 2020-03-17 Microsoft Technology Licensing, Llc Computational-model operation using multiple subject representations
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179588B1 (en) 2016-06-09 2019-02-22 Apple Inc. INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
WO2018000272A1 (zh) * 2016-06-29 2018-01-04 深圳狗尾草智能科技有限公司 一种语料生成装置和方法
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US10706113B2 (en) * 2017-01-06 2020-07-07 Microsoft Technology Licensing, Llc Domain review system for identifying entity relationships and corresponding insights
US10339180B2 (en) 2017-04-14 2019-07-02 International Business Machines Corporation Preventing biased queries by using a dictionary of cause and effect terms
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10503791B2 (en) * 2017-09-04 2019-12-10 Borislav Agapiev System for creating a reasoning graph and for ranking of its nodes
US11960839B2 (en) * 2017-11-06 2024-04-16 Resonac Corporation Cause-effect sentence analysis device, cause-effect sentence analysis system, program, and cause-effect sentence analysis method
EP3759656A4 (en) 2018-02-28 2022-03-30 Northrup, Charles SYSTEM AND METHOD FOR A DING MACHINE FOR RUNNING MODELS
KR102203895B1 (ko) 2019-02-20 2021-01-15 성균관대학교산학협력단 임베딩 기반의 인과 관계 탐지 시스템과 방법 및 이를 실행하기 위한 프로그램이 기록된 기록매체
JP2022547750A (ja) 2019-09-16 2022-11-15 ドキュガミ インコーポレイテッド クロスドキュメントインテリジェントオーサリングおよび処理アシスタント
KR102634624B1 (ko) * 2021-05-04 2024-02-08 인제대학교 산학협력단 플랜트 절차서의 프로세스 모델 생성방법 및 그의 시스템

Family Cites Families (88)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4829423A (en) 1983-01-28 1989-05-09 Texas Instruments Incorporated Menu-based natural language understanding system
US5696916A (en) 1985-03-27 1997-12-09 Hitachi, Ltd. Information storage and retrieval system and display method therefor
US4887212A (en) 1986-10-29 1989-12-12 International Business Machines Corporation Parser for natural language text
US4868750A (en) 1987-10-07 1989-09-19 Houghton Mifflin Company Collocational grammar system
US4864502A (en) 1987-10-07 1989-09-05 Houghton Mifflin Company Sentence analyzer
US5146405A (en) * 1988-02-05 1992-09-08 At&T Bell Laboratories Methods for part-of-speech determination and usage
NL8900247A (nl) 1989-02-01 1990-09-03 Bso Buro Voor Systeemontwikkel Werkwijze en stelsel voor het weergeven van meervoudige analyses in een afhankelijkheidsgrammatica, alsmede ontleed-inrichting voor het genereren van een dergelijke weergave.
JP3266246B2 (ja) 1990-06-15 2002-03-18 インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン 自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法
US5404295A (en) 1990-08-16 1995-04-04 Katz; Boris Method and apparatus for utilizing annotations to facilitate computer retrieval of database material
US5559940A (en) 1990-12-14 1996-09-24 Hutson; William H. Method and system for real-time information analysis of textual material
US5418889A (en) 1991-12-02 1995-05-23 Ricoh Company, Ltd. System for generating knowledge base in which sets of common causal relation knowledge are generated
US5377103A (en) 1992-05-15 1994-12-27 International Business Machines Corporation Constrained natural language interface for a computer that employs a browse function
US5369575A (en) 1992-05-15 1994-11-29 International Business Machines Corporation Constrained natural language interface for a computer system
JP2821840B2 (ja) 1993-04-28 1998-11-05 日本アイ・ビー・エム株式会社 機械翻訳装置
US5638543A (en) 1993-06-03 1997-06-10 Xerox Corporation Method and apparatus for automatic document summarization
US5331556A (en) * 1993-06-28 1994-07-19 General Electric Company Method for natural language data processing using morphological and part-of-speech information
US5774845A (en) 1993-09-17 1998-06-30 Nec Corporation Information extraction processor
US5873056A (en) 1993-10-12 1999-02-16 The Syracuse University Natural language processing system for semantic vector representation which accounts for lexical ambiguity
US5576954A (en) 1993-11-05 1996-11-19 University Of Central Florida Process for determination of text relevancy
US5692176A (en) 1993-11-22 1997-11-25 Reed Elsevier Inc. Associative text search and retrieval system
JPH07160684A (ja) 1993-12-03 1995-06-23 Matsushita Electric Ind Co Ltd 文書圧縮装置および文書圧縮方法
US5485372A (en) * 1994-06-01 1996-01-16 Mitsubishi Electric Research Laboratories, Inc. System for underlying spelling recovery
EP0692765B1 (en) 1994-06-21 2003-05-21 Canon Kabushiki Kaisha Text preparing system using knowledge base and method therefor
US5748973A (en) 1994-07-15 1998-05-05 George Mason University Advanced integrated requirements engineering system for CE-based requirements assessment
US5799268A (en) 1994-09-28 1998-08-25 Apple Computer, Inc. Method for extracting knowledge from online documentation and creating a glossary, index, help database or the like
US5715468A (en) 1994-09-30 1998-02-03 Budzinski; Robert Lucius Memory system for storing and retrieving experience and knowledge with natural language
US5794050A (en) 1995-01-04 1998-08-11 Intelligent Text Processing, Inc. Natural language understanding system
JP3571408B2 (ja) 1995-03-31 2004-09-29 株式会社日立製作所 文書加工方法および装置
US5708825A (en) 1995-05-26 1998-01-13 Iconovex Corporation Automatic summary page creation and hyperlink generation
US5724571A (en) 1995-07-07 1998-03-03 Sun Microsystems, Inc. Method and apparatus for generating query responses in a computer-based document retrieval system
US5963940A (en) 1995-08-16 1999-10-05 Syracuse University Natural language information retrieval system and method
US6026388A (en) 1995-08-16 2000-02-15 Textwise, Llc User interface and other enhancements for natural language information retrieval system and method
US5873076A (en) 1995-09-15 1999-02-16 Infonautics Corporation Architecture for processing search queries, retrieving documents identified thereby, and method for using same
US5867164A (en) 1995-09-29 1999-02-02 Apple Computer, Inc. Interactive document summarization
US6076088A (en) 1996-02-09 2000-06-13 Paik; Woojin Information extraction system and method using concept relation concept (CRC) triples
US5924108A (en) 1996-03-29 1999-07-13 Microsoft Corporation Document summarizer for word processors
US5966686A (en) 1996-06-28 1999-10-12 Microsoft Corporation Method and system for computing semantic logical forms from syntax trees
US5878385A (en) 1996-09-16 1999-03-02 Ergo Linguistic Technologies Method and apparatus for universal parsing of language
US6056428A (en) 1996-11-12 2000-05-02 Invention Machine Corporation Computer based system for imaging and analyzing an engineering object system and indicating values of specific design changes
US6202043B1 (en) 1996-11-12 2001-03-13 Invention Machine Corporation Computer based system for imaging and analyzing a process system and indicating values of specific design changes
JP3579204B2 (ja) 1997-01-17 2004-10-20 富士通株式会社 文書要約装置およびその方法
US6076051A (en) 1997-03-07 2000-06-13 Microsoft Corporation Information retrieval utilizing semantic representation of text
EP0968478A1 (de) 1997-03-18 2000-01-05 Siemens Aktiengesellschaft Verfahren zur automatischen generierung einer zusammenfassung von einem text durch einen rechner
JP3001047B2 (ja) 1997-04-17 2000-01-17 日本電気株式会社 文書要約装置
US5933822A (en) * 1997-07-22 1999-08-03 Microsoft Corporation Apparatus and methods for an information retrieval system that employs natural language processing of search results to improve overall precision
US6055528A (en) 1997-07-25 2000-04-25 Claritech Corporation Method for cross-linguistic document retrieval
US6185592B1 (en) 1997-11-18 2001-02-06 Apple Computer, Inc. Summarizing text documents by resolving co-referentiality among actors or objects around which a story unfolds
US6128634A (en) 1998-01-06 2000-10-03 Fuji Xerox Co., Ltd. Method and apparatus for facilitating skimming of text
JP3614648B2 (ja) 1998-03-13 2005-01-26 富士通株式会社 文書理解支援装置、要約文生成方法、並びに文書理解支援プログラムを記録したコンピュータ読み取り可能な記録媒体
JP3429184B2 (ja) 1998-03-19 2003-07-22 シャープ株式会社 テキスト構造解析装置および抄録装置、並びにプログラム記録媒体
EP0962873A1 (en) 1998-06-02 1999-12-08 International Business Machines Corporation Processing of textual information and automated apprehension of information
US6167370A (en) 1998-09-09 2000-12-26 Invention Machine Corporation Document semantic analysis/selection with knowledge creativity capability utilizing subject-action-object (SAO) structures
US6789230B2 (en) 1998-10-09 2004-09-07 Microsoft Corporation Creating a summary having sentences with the highest weight, and lowest length
US6459949B1 (en) 1998-10-21 2002-10-01 Advanced Micro Devices, Inc. System and method for corrective action tracking in semiconductor processing
US6442566B1 (en) 1998-12-15 2002-08-27 Board Of Trustees Of The Leland Stanford Junior University Frame-based knowledge representation system and methods
US6381598B1 (en) 1998-12-22 2002-04-30 Xerox Corporation System for providing cross-lingual information retrieval
US6317708B1 (en) 1999-01-07 2001-11-13 Justsystem Corporation Method for producing summaries of text document
GB9904663D0 (en) * 1999-03-01 1999-04-21 Canon Kk Apparatus and method for generating processor usable data from natural langage input data
US6242362B1 (en) * 1999-08-04 2001-06-05 Taiwan Semiconductor Manufacturing Company Etch process for fabricating a vertical hard mask/conductive pattern profile to improve T-shaped profile for a silicon oxynitride hard mask
US6823325B1 (en) 1999-11-23 2004-11-23 Trevor B. Davies Methods and apparatus for storing and retrieving knowledge
WO2001067225A2 (en) 2000-03-06 2001-09-13 Kanisa Inc. A system and method for providing an intelligent multi-step dialog with a user
US7120574B2 (en) 2000-04-03 2006-10-10 Invention Machine Corporation Synonym extension of search queries with validation
US6701345B1 (en) 2000-04-13 2004-03-02 Accenture Llp Providing a notification when a plurality of users are altering similar data in a health care solution environment
US20020010574A1 (en) 2000-04-20 2002-01-24 Valery Tsourikov Natural language processing and query driven information retrieval
US7962326B2 (en) 2000-04-20 2011-06-14 Invention Machine Corporation Semantic answering system and method
US8706747B2 (en) 2000-07-06 2014-04-22 Google Inc. Systems and methods for searching using queries written in a different character-set and/or language from the target pages
US20020103793A1 (en) 2000-08-02 2002-08-01 Daphne Koller Method and apparatus for learning probabilistic relational models having attribute and link uncertainty and for performing selectivity estimation using probabilistic relational models
US6823331B1 (en) 2000-08-28 2004-11-23 Entrust Limited Concept identification system and method for use in reducing and/or representing text content of an electronic document
US6557011B1 (en) 2000-10-31 2003-04-29 International Business Machines Corporation Methods for analyzing dynamic program behavior using user-defined classifications of an execution trace
DE10122756A1 (de) 2001-05-10 2002-11-21 Daimler Chrysler Ag Verfahren zur Generierung von Daten für die semantische Sprachanalyse
US7251781B2 (en) 2001-07-31 2007-07-31 Invention Machine Corporation Computer based summarization of natural language documents
US9009590B2 (en) 2001-07-31 2015-04-14 Invention Machines Corporation Semantic processor for recognition of cause-effect relations in natural language documents
US8799776B2 (en) 2001-07-31 2014-08-05 Invention Machine Corporation Semantic processor for recognition of whole-part relations in natural language documents
US6754654B1 (en) 2001-10-01 2004-06-22 Trilogy Development Group, Inc. System and method for extracting knowledge from documents
US7035877B2 (en) 2001-12-28 2006-04-25 Kimberly-Clark Worldwide, Inc. Quality management and intelligent manufacturing with labels and smart tags in event-based product manufacturing
US20040001099A1 (en) 2002-06-27 2004-01-01 Microsoft Corporation Method and system for associating actions with semantic labels in electronic documents
US7552149B2 (en) 2003-09-06 2009-06-23 Oracle International Corporation Querying past versions of data in a distributed database
US7536368B2 (en) 2003-11-26 2009-05-19 Invention Machine Corporation Method for problem formulation and for obtaining solutions from a database
US20050131874A1 (en) 2003-12-15 2005-06-16 Mikhail Verbitsky Method and system for obtaining solutions to contradictional problems from a semantically indexed database
US8126890B2 (en) 2004-12-21 2012-02-28 Make Sence, Inc. Techniques for knowledge discovery by constructing knowledge correlations using concepts or terms
US7761844B2 (en) 2005-04-22 2010-07-20 Ubs Ag Technique for platform-independent service modeling
US7805496B2 (en) 2005-05-10 2010-09-28 International Business Machines Corporation Automatic generation of hybrid performance models
US7668825B2 (en) 2005-08-26 2010-02-23 Convera Corporation Search system and method
US7672831B2 (en) 2005-10-24 2010-03-02 Invention Machine Corporation System and method for cross-language knowledge searching
US8832064B2 (en) 2005-11-30 2014-09-09 At&T Intellectual Property Ii, L.P. Answer determination for natural language questioning
CN1794233A (zh) 2005-12-28 2006-06-28 刘文印 一种网上用户交互问答方法及其系统
US8527262B2 (en) 2007-06-22 2013-09-03 International Business Machines Corporation Systems and methods for automatic semantic role labeling of high morphological text for natural language processing applications
US8914278B2 (en) 2007-08-01 2014-12-16 Ginger Software, Inc. Automatic context sensitive language correction and enhancement using an internet corpus

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011065617A1 (ko) * 2009-11-27 2011-06-03 한국과학기술정보연구원 과학기술핵심개체 간 의미적 연관관계 자동 추출을 위한 시맨틱 구문 트리 커널 기반 처리 시스템 및 방법
WO2017048030A1 (ko) * 2015-09-14 2017-03-23 강민구 3단계 음성 언어 학습을 위한 더블 음원 재생 장치 및 방법

Also Published As

Publication number Publication date
EP1941394A2 (en) 2008-07-09
WO2007051106A3 (en) 2007-06-14
US20060041424A1 (en) 2006-02-23
WO2007051106A2 (en) 2007-05-03
US9009590B2 (en) 2015-04-14

Similar Documents

Publication Publication Date Title
KR20080092337A (ko) 자연어 문서들에서 인과 관계들의 인식을 위한 시맨틱프로세서
KR101139903B1 (ko) 자연어 문서들에서 전체 부분 관계들을 인식하는 시만틱 프로세서
Agrawal et al. Unsupervised emotion detection from text using semantic and syntactic relations
Savary et al. Without lexicons, multiword expression identification will never fly: A position statement
JP2012520528A (ja) 自然言語テキストの自動的意味ラベリングのためのシステム及び方法
Abid et al. Urdu word sense disambiguation using machine learning approach
Mohseni et al. A Persian Part-Of-Speech Tagger Based on Morphological Analysis.
Miranda et al. Named entity recognition using machine learning techniques
Zavrel et al. Feature-Rich Memory-Based Classification for Shallow NLP and Information Extraction.
Al-Arfaj et al. Arabic NLP tools for ontology construction from Arabic text: An overview
Srivastav et al. Advances in Computational Linguistics and Text Processing Frameworks
Jebbor et al. Overview of knowledge extraction techniques in five question-answering systems
Boltayevich et al. Pos Taging of Uzbek Text Using Hidden Markov Model
Kamath et al. Text and speech basics
Ouersighni Robust rule-based approach in Arabic processing
Xia et al. Distributed representation of Chinese collocation
Kaur et al. Noise Estimation and Removal in Natural Language Processing
Badawi The Effectiveness of Natural Language Processing (Nlp) as a Processing Solution and Semantic Improvement
Nazri1&2 et al. An exploratory study of the Malay text processing tools in ontology learning
Nazri et al. An exploratory study on malay processing tool for acquisition of taxonomy using FCA
Maynard et al. Linguistic Processing
Sarr et al. Part-Of-Speech Tagging in French: State-of-the-Art and Obstacles
Torjmen¹ et al. Check for updates
Hegde et al. Tagging Speech For Words In Low Resourced Monolingual Contexts of Sanskrit Shlokas
Биллиг et al. Interpretation of the meaning of natural language phrases in problem-oriented systems

Legal Events

Date Code Title Description
N231 Notification of change of applicant
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application