KR20080092337A - 자연어 문서들에서 인과 관계들의 인식을 위한 시맨틱프로세서 - Google Patents
자연어 문서들에서 인과 관계들의 인식을 위한 시맨틱프로세서 Download PDFInfo
- Publication number
- KR20080092337A KR20080092337A KR1020087012454A KR20087012454A KR20080092337A KR 20080092337 A KR20080092337 A KR 20080092337A KR 1020087012454 A KR1020087012454 A KR 1020087012454A KR 20087012454 A KR20087012454 A KR 20087012454A KR 20080092337 A KR20080092337 A KR 20080092337A
- Authority
- KR
- South Korea
- Prior art keywords
- esao
- causal
- text
- knowledge base
- recognizing
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
- G06F16/345—Summarisation for human users
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Machine Translation (AREA)
Abstract
자연어 문서들에서 인과 관계들의 인식을 위한 시맨틱 프로세서에 관한 것으로서, 텍스트 프리 포맷기(Text Preformatter), 언어 분석기 및 원인-결과 지식 기반 생성기를 포함한다. 상기 시맨틱 프로세서는 단일 팩트 내에서 그리고 자의적인 텍스트 문서들의 팩트들 사이에서 양쪽 모두에서 인과관계의 자동 인식을 제공하며, 여기서 상기 팩트들은 또한 상기 텍스트로부터 7개의 필드 시맨틱 유닛들의 형태로 자동으로 추출된다. 상기 인과 관계들의 인식은 언어적(시맨틱을 포함함) 텍스트 분석 및 패턴들의 형태로 수립된 다수의 언어 모델들에 기초하여 수행된다.
자연어, 인과관계 자동 인식, 지식 기반, 언어 기반
Description
본 발명은 전자 또는 디지털 형태의 문서들로부터 자동 지식 인식 및 추출 시스템 및 방법에 관한 것으로서, 팩트들(facts) 간의 인과관계(cause-effect relations)의 형태로 외부 규칙들을 반영한다.
하기의 미국 특허 서류들은 본 발명에 관련된 종래기술을 기술한다: Ito에 의해 1995년 5월에 발행된, 미국특허번호 제5,418,889호(이하 Ito라 함); Boguraev 등에 의해 2001년 2월 발행된, 미국특허번호 제6,185,592호(이하 Boguraev 1 이라 함); Boguraev에 의해 2001년 4월에 발행된, 미국특허번호 제 6,212,494호(이하 Boguraev 2 라 함); Paik 등에 의해 2001년 7월에 발행된, 미국특허번호 제 6, 263,335호(이하 Paik 라 함); Kim 등에 의해 2004년 6월에 발행된, 미국특허번호 제 6,754, 654호(이하 Kim 이라 함); Davies 등에 의해 2004년 11월에 발행된, 미국특허번호 제6,823,325호(이하 Davies라 함); Binniget 등에 의해 2005년 3월에 발행된, 미국특허번호 제6,871,199호(이하 Binniget 라 함).
지식 엔지니어링은 모뎀 정보 기술들의 지능화를 위한 주요한 툴(tool)이다. 지식 엔지니어링은 전통적으로 다양한 지식 분야에서의 전문가들로부터 획득된 정보의 일반화에 기초했다. 하지만, 분석은 이러한 접근법이 적당한 실생활(산업) 응용들을 생성하기 위해 이용될 수 없다는 점을 보여준다. 두 개의 질문이 발생한다: 첫째, 그러한 지식의 가장 신뢰할 수 있고 효과적인 원천(source)은 무엇인가; 둘째, 어떻게 이러한 지식을 알게 되고, 추출하여 추후에 공식화하는가. 글로벌 컴퓨터화의 시대인 요즘 시대에서, 가장 신뢰할 수 있는 지식의 원천은 넓은 의미로 텍스트, 즉, 자연어로 된 문서 세트로서의 텍스트이다(서적, 기사, 페이턴트, 보고서 등). 따라서, 두 번째 질문에 비추어 지식 엔지니어링의 기본 전제는 다음과 같다:
1. 텍스트는 지식 표현의 이상적인 타고난 지적 모델이다.
2. 텍스트에서 모든 것을 찾을 수 있다.
상기 두 번째 전제는 지나치게 절대적인 것 같을 수 있으나, 텍스트 범위가 증가하는 추세에 있어, 이는 점점 더 사실이 된다.
텍스트로부터 어떤 유형의 지식이 획득될 수 있는가 및 자동화 수단은 무엇인가? 일부 기존 방법들은 엄격한 구조를 가지고 수동적으로 컴파일된 데이터베이스로 또는 엄격하게 규정된 필드를 갖는 텍스트들로 목적을 이룬다. 텍스트의 피상적인 언어 분석이 대개 수행된다. Kim은 리지드(rigid) 구조(일차적 이메일)를 갖는 텍스트 프로세싱을 기술한다. Kim의 프로세스는 미리 공지된 필드의 원천 문서들로부터 해당 정보를 추출하고 조직(organization)의 구조를 반영하는 데이터베이스(DB)의 미리 규정된 필드에 그것을 배치한다(그러한 DB는, 예를 들면, 조직 내 개별요소들의 명칭 및 제목에 대한 필드를 갖는다). Kim에서 기술된 언어 프로세싱 은 소위 필터라 불리는 것에 따라 단지 문서들로부터 핵심(key) 용어들을 추출하기 위해 이용된다.
Davies는 명사를 동사와 구분하고 "어떻게", "왜", "무엇을" 및 "무엇이" 관계들에 따라 미리 규정되어 구조화된 데이터베이스에서 강력하게 규정한 검색 방법으로 수행하기 위한 텍스트의 어휘 및 문법상 분석의 수행을 기술한다.
Binniget는 또한 프랙털(fractal) 계층적 네트워크의 형식으로 미리-구조화된 데이터베이스(이를 테면, 지식 데이터베이스)의 사용을 기술하는 것으로, 입력 스트링으로부터 정보를 자동으로 확장하기 위해 외부(지식 영역)의 지식을 반영한다. 초기에 상기 입력 스트링(예를 들면, 문장의 일부, 또는 전체 문장 등)은 언어 및 문법상 파싱(parsing)과 입력 네트워크를 수립하기 위한 변환(transforming)을 수행하는 시맨틱 프로세서(semantic processor)에 의해 취급된다. 상기 네트워크는 그후 상기 입력 정보, 즉, 목적어, 그들의 관계 및 속성들에 관한 외부의 모델에 의한 입력 정보의 일부 레코딩 종류 및 추후 확장성(expantion)을 늘이기 위해 상기 지식 데이터베이스에 내장된다.
Boguraev 1은 텍스트 세그먼트에 대해, 가장 중요한 명사 그룹이 비중있는 의미론적 역할에 있어서 그들의 사용 빈도를 기초로 표시되는 심층 텍스트 분석의 수행을 기술한다.
상기 언급된 모든 경우들은 개념(concept)에 대한 특정 지식에 관한 것이다. 이는 텍스트로부터 추출될 수 있는 지식의 등록(entry) 레벨이다.
Boguraev 2는 기술분야에서 중요한 용어들의 카탈로그를 생성하고 또한 기술 적 기능들(동사-목적어)의 행위자(해결자)를 결정하기 위한 컴퓨터-매개 언어 분석의 사용을 기술한다.
Ito는 원인 모델 기반 및 장치 모델 기반을 포함하는 지식 기반의 사용을 기술한다. 상기 장치 모델 기반은 타겟 머신의 장치들의 계층을 기술하는 장치 지식 세트를 갖는다. 상기 원인 모델 기반은 상기 장치 모델 기반에 기초하여 형성되며 타겟 머신에서 폴트(fault) 이벤트들의 원인 관계 세트를 갖는다. 따라서, 상기 장치의 각 엘리먼트에 있어서 가능한 실패 원인이 상기 장치의 다른 엘리먼트들과의 그 구조적 결합에 대한 정보에 기초하여 추측된다. 대개, 이러한 것들은 가장 많이 "결합된" 엘리먼트들에 따라, 원인으로 결정된다.
Paik는 영역-독립적이고 그 자체의 주어 지식 기반을 자동으로 수립하는 시스템을 기술한다. 상기 시스템은 개념(사람, 장소, 물건 또는 조직과 같은 임의 명칭된 엔티티 또는 아이디어)과 그들 간의 관계들을 인식한다. 이러한 관계들은 개념-관계-개념 트리플의 생성을 허용한다. 그래서 Paik에서 인식된 지식은 다음의 중요한 지식 레벨-팩트(주어-동작-목적어)에 가까우나, 그들은 아직 팩트가 아니다. Paik는 또한 (개념-관계-개념 트리플의 문맥에서) 개념들 간의 "원인" 관계를 언급한다. 하지만, 이는 아직 팩트들 사이의 인과관계는 아니며, 그것은 외부 규칙들(또는 지식 영역의 규칙들)을 반영하는 지식이기 때문에, 다음으로 매우 중요한 레벨의 지식이다.
본 발명의 실시예들은 팩트(7-필드의 eSAO의 시맨틱 유닛의 유형: 주어-동작-목적어-형용사-전치사-간접 목적어-부사)의 형태로 외부(지식 영역)에 대한 정보 및 상기 팩트들 사이의 인과관계의 형태로 외부(지식 영역)의 규칙들을 반영하는 규칙들을 자의적인 텍스트 문서들로부터 자동으로 추출하기 위한 컴퓨터에 대한 능력을 제공한다. 상기 팩트들 사이의 인과관계의 자동 인식은 상기 시맨틱 프로세서에 의해 수행되는데, 상기 시맨틱 프로세서는 상기 텍스트의 프리 포맷(preformatting)과 상기 텍스트의 언어적(시맨틱을 포함함) 분석을 수행한다. 상기 시맨틱 프로세서는 또한 이러한 분석과 패턴들로 형성된 맞춤 인식 언어 모델을 사용하여 인과(Cause-Effect;C-E) 지식 기반을 생성한다.
텍스트의 언어 분석은: 품사(parts-of speech) 태깅(tagging), 파싱(parsing) 및 시맨틱 분석을 포함한다. 시맨틱 분석 단계 동안, 상기 시맨틱 프로세서는 목적어, 그들의 eSAO 유형(팩트들) 사이의 시맨틱 관계 및 상기 팩트들 사이의 인과관계, 뿐만 아니라, 개별 팩트들에서의 이러한 관계를 인식한다. 상기 인과 관계 인식은 텍스트와 패턴들의 언어 분석 결과들에 기초하여 수행되는 것으로, 단일 eSAO 내부에 그리고 다른 eSAO 사이의 인과(C-E) 관계들을 검출하기 위한 알고리즘들을 기술한다. 이러한 패턴들은 첫째, 그들 사용 환경, 이를 테면, 문장에 있어서 C-E 관계의 존재의 표시기와, 둘째, 상기 관계의 원인 부분으로서의 어느 eSAO 컴포넌트들 또는 전체 eSAO에 대한 그리고 결과로서의 어느 eSAO 컴포넌트 또는 전체 eSAO에 대한 정보를 기술한다. 인과 표시기란 개별 eSAO 컴포넌트들을 말하며 언어 유닛, 그들의 어휘 및 문법 태그, 클래스 등을 기술한다. 예를 들어, 패턴들 중 하나는, 문장이 두 개의 eSAO를 포함하는 경우, 제1 eSAO는 논-엠프티(non-empty) 주어 및 동작을 가지며, 제2 eSAO는 논-엠프티 동작 및 목적어를 가지는 경우를 말하며, 상기 문장에서 그들 간에 접속사 "so that" 또는 "such that"이 존재하고, 이러한 eSAO는 인과 관계에 있으며, 제1 eSAO가 원인이 되고, 제2 eSAO가 결과부분이 된다.
상기 인과 인식기(Cause-Effect Recognizer)는 모든 eSAO들 및 공통 목록으로부터 패턴들 중 하나에 따르는 한 쌍의 eSAO들을 분석한다. eSAO가 규칙에 따른다면, 상기 인과 인식기는 인과 관계의 존재를 등록하고 인과 지식 기반에 그것을 집어넣는다.
언어 모델들의 인식을 생성하는 절차는 많은 텍스트 코퍼스들을 분석하는 단계, 인과 관계의 특정 표시기를 표시하는 단계 및 패턴들로 일반화를 수행하고 테스팅하는 단계에 기초한다. 이러한 패턴들, 뿐만 아니라 다양한 사전들, 문법 등은 언어 지식 기반, 상기 시맨틱 프로세서의 주요 컴포넌트 중 하나를 포함한다.
도 1은 본 발명의 실시예에 따른 시맨틱 프로세서의 구조적이고 기능적 도면.
도 2는 본 발명의 실시예에 따른 언어 분석기의 구조적이고 기능적 도면.
도 3은 본 발명의 실시예에 따른 시맨틱 분석기의 구조적이고 기능적 도면.
도 4는 본 발명의 실시예에 따른 C-E 패턴들의 데이터베이스를 수립하는 주요 도면.
본 발명의 실시예들은 외부 지식의 3개의 전형적인 유형들의 자동 인식을 위한 시스템 및 방법에 관한 것이다: 목적어(개념); 팩트; 및 외부(주어 영역)의 규정들을 반영하는 규칙들의 형태로 공식화된 팩트들 사이의 인과 관계. 목적어와 팩트의 자동 삭제, 즉, 주어-동작-목적어(Subject-Action-Object: SAO) 형식에서 목적어들 사이의 시맨틱(semantic) 관계가 "Document Semantic Analysis/Selection with Knowledge Creativity Capability"로 표제된, 미국특허번호 제 6,167,370호에서 기술된다.
종래기술의 시스템에서, SAO는 단지 3개의 컴포넌트들 또는 엘리먼트 유형들을 포함했다: 주어(Subject: S), 동작(Action: A) 및 목적어(Object: O). 종래기술에서, 적어도 하나의 이러한 컴포넌트들은 SAO에 규정되어야 한다. 하지만, 본 발명의 실시예에 따르면, 확장형 SAO들(eSAO들)이 사용된다. 바람직한 실시예들에서, eSAO들은 7개의 컴포넌트들을 포함하며, 여기서, 또한 적어도 하나의 컴포넌트가 규정된다. 추가 컴포넌트들은 훨씬 더 심층적이고 품질이 우수한 분석을 제공한다. 다른 실시예들에서, 상기 eSAO들은 추가 컴포넌트들을 포함하기 위해 확장될 수 있었다. 본원에서, 용어 "eSAO" 및 "eSAO 세트"는 호환적으로 사용되며, 두 용어 모두는 eSAO 컴포넌트들의 집합을 말한다.
바람직한 실시예에서, 상기 eSAO 컴포넌트는 다음을 포함한다:
1. 목적어(O)에 동작(A)을 수행하는, 주어(S);
2. 주어(S)에 의해 목적어(O)에 수행된, 동작(A);
3. 주어(S)에 의해 동작(A)이 행해진, 목적어(O);
4. 주어(S) 또는 동작(A)을 기술하는, 형용사(Adj)로서 목적어(O)가 비어있는eSAO에서 주어 뒤에 온다(예를 들면, "The invention is "efficient", "The water becames "Hot"");
5. 간접 목적어(IO)를 지배하는, 전치사(Prep)(예를 들면, "The lamp is placed "on" the table", "The device reduces friction "by" ultrasound");
6. 명사의 위치에 의해, 규칙으로 명시된, 간접 목적어(IO)로서, 이는 전치사와 함께 동작(A)을 기술하며, 부수적인 수식어구가 된다(예를 들면, "The lamp is placed on the "table"", "The device reduces friction by "ultrasound"");
7. 규칙으로서, 동작(A)의 수행 상태를 기술하는, 부사(Adv)(예를 들면, "The process is "slowly" modifie", "The driver must not turn wheel "in such a manner"").
상기 eSAO 형식의 적용예들이 표 1과 표2에 도시된다.
[표 1]
[표 2]
팩트들 사이의, 이를테면, eSAO들 사이의 원인과 결과 즉, 인과(Cause-Effect; C-E) 유형의 시맨틱 관계가 "Computer Based Summarization of Natural Language Documents"로 표제된, 미국특허출원공개번호 제20030130837호에 기술된다. 인과 관계의 인식 또한 상기 공보에 기술된다. 예를 들어, 입력 문장 "Today the user can download 10,000 papers from the web by typing the word "screen""은 표 3에 도시된 eSAO들 사이의 인과관계가 될 것이다.
[표 3]
본 발명의 실시예들은 자연어 문서들 내의 지식에 존재하는 인과관계들을 수립하기 위해 사용된 시맨틱 프로세싱 단계를 어드레스 한다.
본 발명의 실시예들에 따르면, 전자 또는 디지털 형태의 텍스트에서 인과관계를 인식하기 위한 상기 시맨틱 프로세싱 단계는: 텍스트를 프리 포맷하는(preformatting) 단계; 언어 분석을 수행하는 단계; 및 인과 지식 기반을 생성하는 단계를 포함한다.
본 발명에 따른, 인과 시맨틱 프로세서, 이하 시맨틱 프로세서(Semantic Processor:SP)의 실시예는 도 1을 참조하면 이해될 수 있다. 상기 시맨틱 프로세서(100)는 인과 지식 기반(50)을 생성하기 위해 원시 텍스트(10)를 프로세스한다. 이 실시예에서, 상기 시맨틱 프로세서(100)는 (상기 원시 텍스트를 미리형성하기 위한) 프리 포맷기(Preformatter)(20), (언어 분석을 수행하기 위한) 언어 분석 기(30) 및 (상기 인과 지식 기반(50)을 생성하기 위한) 지식 기반 생성기(40)를 포함한다. 상기 시맨틱 프로세서(100)의 모든 모듈의 기능은 언어 지식 기반(60) 내에 유지될 수 있는 것으로, 사전, 분류자, 통계 데이터 등과 같은, 다양한 데이터베이스 및 (텍스트-대-단어 분열, 명사와 동사 위치의 인식, 주어, 목적어, 동작 및 그들 속성, 인과 인식 등에 대한) 언어 모델들을 인식하기 위한 데이터베이스를 포함한다. 상기 언어 분석기(30) 및 상기 지식 기반 생성기(40)는 하기에 추가로 상세하게 기술된다.
상기 프리 포맷기(20)에 의해 수행된 텍스트를 프리 포맷하는 단계는 바람직하게는 미국특허출원공개번호 제20030130837호에 기술된 기법들에 따라 수행된다. 상기 프리 포맷기(20)는 바람직하게는 자연어 텍스트의 일부를 형성하지 않는 텍스트의 디지털 또는 전자식 표현에 있어서 임의의 심볼을 제거한다. 예들 들면, 상기 프리 포맷기(20)는 문단 마크, 탭 문자 등과 같은 심볼들의 형성; 폰트 색상 및 폰트 크기와 같은 폰트 제어 심볼; 및 텍스트가 디스플레이되는 방법을 제어하기 위해 사용될 수 있으나, 상기 텍스트의 의미에는 영향을 주지 않는 기타 심볼들을 제거할 수 있다. 상기 프리 포맷기(20)는 또한 상기 원시 텍스트(10)에서 임의의 부정합 또는 실수들을 검출하고 정정할 수 있다. 상기 프리 포맷기(20)는 또한 상기 원시 텍스트(10)를 프리 포맷된 텍스트(12)를 생성하기 위한 문장들 및 단어들의 구조로 분할할 수도 있다(도 2 참조). 상기의 설명은 상기 프리 포맷기(20)에 의해 수행될 수 있는 모든 기능들을 설명하는 것으로 해석되어서는 안 된다. 상기 프리 포맷기(20)는 또한 하기에 설명된 언어 분석기(30)에 상기 원시 텍스트(10)를 보다 더 잘 준비하기 위해 다른 텍스트 조종 기능을 수행할 수 있다.
도 2는 상기 언어 분석기(30)를 포함하는 모듈들을 도시한다. 상기 언어 분석기(30)는 의미론적으로 분석된 텍스트(16)를 생성하기 위해 상기 프리 포맷기(20)로부터 프리 포맷된 텍스트를 프로세스 한다. 상기 프리 포맷된 텍스트(12)는 (상기 프리 포맷된 텍스트(12)에 대한 품사 태그들을 결정하고 적용하는) 품사 태거(Parts-of-Speech Tagger)(32)에 의해 수신된다. 파서(parser)(34)는 그후 상기 시맨틱 분석기(300)로 프로세싱하기 위해 상기 POS 태깅된 텍스트를 파싱한다. 상기 POS 태거 및 파서(34)에 의해 수행된 기능은 바람직하게는 미국특허출원공개번호 제20030130837호에 기술된 기법들에 따라 수행된다.
상기 언어 분석기에서, 상기 POS 태거(22)는 상기 프리 포맷된(preformated) 텍스트(12)의 각 단어에 품사 태그를 할당한다. 바람직하게는, 상기 품사 태깅은 상기 언어 지식 기반(60)의 일부를 형성하는 통계 데이터에 기초한다. 상기 태그들은 전형적으로 품사에 해당한다. 태그들의 예들로: JJ-형용사구, VB-동사, NN-명사 등을 포함한다. 본 발명의 실시예들은 종래기술에 공지된 품사 태그들을 사용할 수 있다. 상기 파서(34)는 태깅된 텍스트에서 동사구 문장들 및 명사구를 인식하고 구문상 파싱된 트리(syntactical parsed tree)를 수립하기 위한 동작을 수행한다. 상기 구문상 파싱된 트리의 생성을 용이하게 하기 위해, 언어 지식 기반(60)은 언어 모델들을 인식하는 단계를 포함한다. 이러한 모델들은 문장의 구조에 대한 규칙들, 이를 테면, 품사 태그들과 구문상 그룹들(클래스들)을 상관시키기 위한 규칙들을 포함한다. 따라서, 바람직한 형태로, 상기 파서(34)의 제1 단계는 POS 태그들을 다 루고, 그런 다음 상기 파서(34)는 점차적으로 POS 태그들의 문장들을 구문상 그룹들로 대체한다. 이러한 그룹들은 그 후 다른 그룹들에 의해 좀더 높은 문장 계층으로 대체되며, 따라서 트리 형태로, 이를 테면 구문상 파싱된 트리 형태로 문장의 다중-레벨 구문상 구조를 수립한다.
도 3은 상기 시맨틱 분석기(300)를 포함하는 모듈들을 도시한다. 상기 시맨틱 분석기(300)는 파싱된 텍스트(14)를 수신하고 의미론적으로 분석된 텍스트(16)를 생성한다. 상기 시맨틱 분석기(300)는 eSAO 인식을 수행하는 eSAO 인식기(310)를 갖는다. ESAO 인식은 바람직하게는 미국특허출원공개번호 제20020010574호 및 미국특허출원공개번호 제 20020116176호에 기술된 기법들에 따라 수행된다. 모든 eSAO 엘리먼트들의 인식은 상기 언어 지식 기반(60)의 일부인 해당 인식 언어 모델들에 의해 구현된다. 이러한 모델들은 품사 태그들, 어휘 항목들 및 구문상 카테고리들로서 한정 동작들, 비-한정 동작들, 동사적 명사들을 가진 상기 파싱된 텍스트 eSAO들로부터 추출하기 위해 사용되는 규칙들을 설명한다. 동작 추출 규칙의 일례로:
<HVZ><BEN><VBN>=>(<A>=<VBN>)이다.
이러한 규칙은 "입력 문장이 HVZ, BEN, VBN 태그들 각각 획득된 품사 태깅의 단계에서 단어들(w1, w2, w2)의 순서를 포함한다면, 그 후 이 문장에서 VBN을 갖는 단어는 동작이다"라는 것을 의미한다. 예를 들어, 상기 구 "has been produced"는 "has_HVZ been_BEN produced_VBN"으로 품사 태깅될 것이며 상기 규칙은 "produce"가 동작, 즉, (A=produce)임을 나타낼 것이다. 게다가, 상기 동작의 보이스(능동태 또는 수동태)는 주어와 목적어의 추출에 대한 규칙들로 고려된다. 상기 eSAO 내 및/또는 사이의 인과관계는 상기 인과(CE) 인식기(320)에 의해 수행되며, 그후 의미론적으로 분석된 텍스트(16)를 생성한다. 본 발명의 실시예들에 따른 인과 관계의 인식은 하기에 추가로 자세히 기술된다.
본 발명의 실시예들에 따른 인과 관계는 (완전 및 불완전 모두의)원인으로서의 하나 이상의 eSAO들과 (또한 완전 및 불완전 모두의)결과로서의 하나 이상의 eSAO들의 페어링(pairing)을 포함한다. 공정식으로 인과 관계는 하기와 같이 표현될 수 있다:
{eSAOi}->{eSAOj}
세트 {eSAOi}가 원인을 나타내고, 세트 {eSAOj}가 결과를 나타내는 경우, "->"는 특정 어휘, 문법 및 의미상 언어 수단을 가진 원인 및 결과에 관련된 순차적 오퍼레이터를 나타낸다. 단일 eSAO는 원인 eSAO와 결과 eSAO 둘 모두를 낳는다는 것을 주목하라. 또한, 지식 엔지니어링과 자연어 특수성의 관점에서, 인과관계는 개별 eSAO들에서 발견될 수 있다. 이러한 경우는 개별적으로 간주 될 것이다. 원인 및 격과 eSAO들 모두를 낳는 단일 eSAO의 경우가 우선 고려될 것이다.
상기 인과 인식기(320)는 단일 eSAO 내부의 그리고 다른 eSAO들 사이의 텍스트 문장에서 인과 관계를 검출하기 위한 알고리즘들을 사용한다. 이러한 알고리즘들은 언어 모델들 또는 패턴들을 생성함에 따라 분류될 수 있다. 이러한 패턴들은 첫째, 그 사용 환경, 이를테면, 문장에서 C-E 관계의 존재의 표시기들과 둘째, 상 기 관계의 원인 부분 역할을 하는 어느 eSAO 컴포넌트들 또는 전체 eSAO들 및 상기 관계의 결과 부분 역할을 하는 어느 eSAO 컴포넌트들 또는 전체 eSAO들에 대한 정보를 기술한다. 인과 표시기란 개별 eSAO 컴포넌트들을 말하며 언어 유닛, 그들의 어휘 및 문법 태그들, 클래스 등을 기술한다.
상기 인과 인식기(320)는 바람직하게는 공통 목록으로부터 상기 패턴들 중 하나에 따르기 위해 모든 eSAO들 및 eSAO의 쌍들을 분석한다. eSAO 또는 eSAO들 쌍이 패턴에 따른다면, 상기 인과 인식기(320)는 인과 관계의 존재를 등록하고 상기 인과 지식 기반(50)에 포함하기 위해 eSAO 또는 eSAO들 쌍을 표시한다. 상기 지식 기반 생성기(40)는 인과정보를 나타내고 이 정보에 기초한 상기 인과 지식 기반(50)을 생성하는 상기 eSAO들의 집합을 수행한다. 상기 지식 기반 생성기(40)는 또한 상기 인과 지식 기반(50)으로 등록하기 전에 상기 인과 관계를 편집할 수 있다. 예를 들면, 상기 지식 기반 생성기(40)는 반복하는 인과관계를 제거할 수 있다(또는 등록하지 않을 수 있다).
텍스트에서의 인과 관계를 인식하기 위한 바람직한 패턴들이 하기에 제시된다. 하지만, 다른 패턴들이 본 발명의 실시예들에 따라 사용될 수도 있다.
I. 단일 eSAO로부터 인과관계의 인식을 위한 패턴들
패턴 1: "CAUSE" 센스를 가진 동작
상기 패턴은 eSAO가 텍스트에서 인식되는 경우 발생하며, 상기 eSAO는 주어, 동작 및 목적어를 위한 적어도 3개의 논-엠프티(non-empty) 필드를 가지며, 상기 동작 필드는 "CAUSE" 센스를 갖는다. C-E 관계는 그후 상기 eSAO의 주어가 출력 관 계의 "원인" 부분이 되고 상기 eSAO의 목적어가 상기 관계의 "결과" 부분이 되는 경우 형성된다. 상기 패턴에서, "CAUSE" 동작 센스는 cause 동작과 관련된 의미를 가지는 임의의 어휘 유닛을 상징하는 비종단(nonterminal) 심볼이다. 예를 들면, 바람직한 실시예에서, "CAUSE" 일부는 단어 또는 구 "cause;resultin/create/develop/induce/actuate/arouse/bringabout/bringforth/bringon/generate/produce/etc."와 동일하다. 영어로, 40 이상의 어휘 유닛이 "CAUSE" 유형인 것으로 간주될 수 있다. 표 4는 패턴 1의 일반 형식(generic form)을 나타낸다.
[표 4]
예로서, "The vacuum knife causes a shearing air flow"로 된 입력 문장을 고려하자. 표 5는 상기 문장으로부터 추출된 eSAO를 나타낸다:
[표 5]
상기 eSAO가 패턴 1의 조건들을 만족하므로, (표 6에 도시된) 하기 C-E관계가 획득된다:
[표 6]
패턴 2: "Result From"센스를 가진 동작들
패턴 2는 상기 동작 필드가 "RESULT FROM" 센스를 가질 경우 발생한다. 상기 패턴에서, "RESULT FROM" 동작 센스는 result from 동작에 관련된 의미를 가지는 임의의 어휘 유닛을 상징하는 비종단 심볼이다. 예를 들면, 바람직한 실시예에서, "RESULT FROM" 일부는 단어 또는 구 "derive from/result from/spring from/stem from"과 동일하다. 표 7은 패턴 2의 일반 형식을 나타낸다.
[표 7]
예를 들면, 입력 문장 "In order to detect such unsafe situations resulting from insufficient air flow, a sail switc is utilized to measure the air flow in the combustion area as well as in the tumbler chamber,"은 표 8에 도시된 eSAO가 될 것이다. 본 발명의 바람직한 실시예에 따른 상기 입력 문장으로 인한 C-E 관계가 표 9에 도시된다.
[표 8]
[표 9]
패턴 3: 목적어에서 "cause of" 구성
패턴 3은 상기 목적어가 "CAUSE OF" 센스를 가질 경우 발생하며, 상기 동작은 "BE" 센스를 가진 목적어에 주어를 연결한다. 상기 패턴에서, "CAUSE OF" 목적어 센스는 명사구를 상징하는 비종단 심볼로서, 바람직하게는 하기의 패턴, 즉, 다수의 단어들; 단어 "cause" 또는 "causes", 다수의 단어들에 이어지는, 전치사 "of"에 따른다. 상기 "CAUSE OF" 센스는 다음의 식으로 표현될 수 있다:
CAUSE_PF=.*("cause"|"causes")"of".*
바람직한 실시예에서, 상기 "BE" 센스 일부는 단어 또는 구 "be/become/contain/correspond/demonstrate/establish/identify/indicate/indicate/present/represent."와 동일하다. 표 10은 패턴 3의 일반 형식을 나타낸다.
[표 10]
예를 들면, 입력 문장 "The water stream presents the cause of metal corrosion"은 표 11에 도시된 eSAO가 될 것이다. 본 발명의 바람직한 실시예에 따른 상기 입력 문장으로 인한 C-E 관계가 표 12에 도시된다.
[표 11]
[표 12]
패턴 4: 주어에서 "cause of" 구성
패턴 4는 상기 주어가 "CAUSE OF" 센스를 가질 경우 발생하며 상기 동작은 "BE" 센스를 가진 목적어에 주어를 연결한다. 상기 패턴에서, "CAUSE OF" 주어 센스는 또한 명사구를 상징하는 비종단 심볼로서, 바람직하게는 하기의 패턴, 즉 다수의 단어들; 단어 "cause" 또는 "causes", 다수의 단어들에 이어지는, 전치사 "of"에 따른다. 상기 "CAUSE OF" 센스는 다음의 식으로 표현될 수 있다:
CAUSE_OF=.*("cause"|"causes")"of".*
바람직한 실시예에서, 상기 "BE" 센스 일부는 단어 또는 구 "be/become"과 동일하다. 표 13은 패턴 4의 일반 형식을 나타낸다.
[표 13]
예를 들면, 입력 문장"The cause of water evaporation is heat"은 표 14에 도시된 eSAO가 될 것이다. 본 발명의 바람직한 실시예에 따른 상기 입력 문장으로 인한 C-E 관계가 표 15에 도시된다.
[표 14]
[표 15]
패턴 5: "technical" 센스를 가진 동작
패턴 5는 동작이 "TECHNICAL_ACTION"센스를 가질 경우 발생한다. 상기 패턴에서, "TECHNICAL_ACTION" 동작센스는 기술이란 의미를 가지는, 이를 테면 (그것의 속성 또는 파라미터를 변경하는) 목적어에 대한 일부 동작을 연습하는 동작 목록으로부터 임의의 어휘 유닛을 상징하는 비종단 심볼이다. 영어로, 3000개 이상의 어휘 유닛들이 상기"TECHNICAL_ACTION" 센스를 만족하는 것으로 간주될 수 있다. 예를 들면, 상기 "TECHNICAL_ACTION" 센스는 단어 또는 구 "abate/abrade/absorb/accelerate/emulsify/enamel/nitrogenize/straighten/soften/shield/protect/pressurize"를 포함할 수 있다. 표 16은 패턴 5의 일반 형식을 나타낸다.
[표 16]
예를 들면, 입력 문장 "The power plant generates electrical current"는 표 17에 도시된 eSAO가 될 것이다. 본 발명의 바람직한 실시예에 따른 상기 입력문장으로 인한 C-E 관계가 표 18에 도시된다.
[표 17]
[표18]
패턴 6: 목적어 1에서 명사 프로세스
패턴 6은 목적어가 "PROCESS_NN" 센스를 갖고 동작이 "LINK_ACTION" 센스를 가질 경우 발생한다. 상기 패턴에서, "PROCESS_NN" 목적어 센스는 process 또는 processes를 상징하는 명사 목록으로부터 임의의 어휘 유닛을 상징하는 비종단 심볼이다. 영어로, 6000개 이상의 어휘 유닛이 상기"PROCESS_NN" 센스를 만족하는 것으로 간주될 수 있다. 예를 들면, 상기 "PROCESS_NN" 센스는 단어 또는 구"abhesion/acctation/clearing/coextrusion/equilibration/filtering/hydration/isolation/oscillation/phos-phating."를 포함할 수 있다. "LINK_ACTION" 동작센스는 "link actions"의 목록으로부터 임의의 어휘 유닛을 상징하는 비종단 심볼로서, 출력 관계에서 누락될 것이다. 바람직하게는, 상기 "LINK_ACTION" 센스는 단어 "allow/do/execte/make/perform/permit/produce/propose/provide/realize/reestablish/reproduce."를 포함한다. 표 19는 패턴 6의 일반 형식을 나타낸다.
[표 19]
예를 들면, 입력 문장 "Alkali water performs polishing"은 표 20에 도시된 eSAO가 될 것이다. 본 발명의 바람직한 실시예에 따른 상기 입력 문장으로 인한 C- E관계가 표 21에 도시된다.
[표 20]
[표 21]
패턴 7: 목적어 2에서 명사 프로세스
패턴 7은 목적어가 "PROCESS_NN" 센스를 갖고 동작이 "LINK_TECH_ACTION" 센스를 가질 경우 발생한다. 상기 패턴에서, "PROCESS_NN" 목적어 센스는 또한 process 또는 processes를 상징하는 명사 목록으로부터 임의의 어휘 유닛을 상징하는 비종단 심볼이다. 영어로, 6000개 이상의 어휘 유닛들이 상기 패턴을 위해 "PROCESS_NN" 센스를 만족하는 것으로 간주될 수 있다. 예를 들면, 상기 패턴에서, "PROCESS_NN" 센스는 단어 또는 구 "abhesion/acetation/clearing/coextrusion/equilibration/filtering/hydration/isolation/oscillation/phos-phating."을 포함할 수 있다. "LINK_TECH_ACTION" 동작 센스는 동작 목록으로부터 임의의 어휘 유닛을 상징하는 비종단 심볼로서, 완전히 기술적이지는 않지만, 목적어에서 process 또는 processes를 의미하는 명사로 사용될 경우 기술적 의미를 갖는다. 영어로, "LINK_TECH_ACTION"은 70개 이상의 다른 어휘 유닛들을 포함할 수 있다. 예를 들면, 상기 "LINK_TECH_ACTION" 센스는 적어도 단어 "accomplish/achieve/acquire/actuate/aid/assist/assure/attain/avoid/begin/carryout/compel/constrain."을 포함할 수 있다. 표 22는 패턴 7의 일반 형식을 나타낸다.
[표 22]
예를 들면, 입력 문장 "Multiple changes of direction facilitate separation of water and debris from the air"은 표 23에 도시된 eSAO가 될 것이다. 본 발명의 바람직한 실시예에 따른 상기 입력 문장으로 인한 C-E관계가 표 24에 도시된다.
[표 23]
[표 24]
eSAO들 사이의 인과 관계 인식을 위한 패턴들
이 섹션은 eSAO들 사이에 결정될 수 있는 인과관계들을 논의한다. 이 섹션에서의 패턴들에 대한 예들은 이러한 패턴들이 인과관계를 따를 때(이전 섹션으로부터의 패턴들과는 대조적으로, 인과관계들이 단일 eSAO로부터 추출되는 경우) eSAO들을 변경하지 않기 때문에 각 문장에 대한 eSAO들을 설명하지 않는다.
패턴 1: 목적의 부사적 수식어구: TO VB/DO/HV
상기 패턴에서, 원인에 관련된 것으로 간주된, 제1 eSAO는 "ACTIVE"센스를 가지는 동작을 가지며, 결과에 관련된 것으로 간주된, 제 2 eSAO는 "TO_VB/HB/HV" 센스를 가지는 동작을 갖는다. 상기 "ACTIVE" 동작 센스는 액티브 보이스 동사 그룹으로부터 추출된 동작을 상징하는 비종단 심볼이다. 상기 "TO_VB/HB/HV" 동작 센스는 임의의 부정사형 동사(VB), 즉, 동사 앞에 관사 "to"를 갖는, 부정사형 "have"(HV); 또는 부정사형 "do"(DO)의 태그들을 갖는 동사들로 구성되는 동사 그룹으로부터 추출된 동작을 상징하는 비종단 심볼이다. 표 25는 패턴 1의 일반 형식을 나타낸다.
[표 25]
예를 들면, 입력 문장 "The register contains the proper bit pattern to begin its shift-out operation"은 표 26에 도시된 C-E관계가 될 것이다.
[표 26]
패턴 2: 원인의 부사적 수식어구: BY VBG
상기 패턴에서, 제1 eSAO는 결과에 관계되는 것으로 간주되며, 원인에 관계되는 것으로 간주된, 제2 eSAO는 "BY_VBG" 센스를 가지는 동작을 갖는다. 상기 "BY_VBG" 동작 센스는 전치사 "by"에 의해 앞에 위치하는 분사 I(동명사형 동사(VBG))로 구성되는 분사 구문으로부터 추출된 동작을 상징하는 비종단 심볼이다. 표 27은 패턴 2의 일반 형식을 나타낸다.
[표 27]
예를 들면, 입력 문장 "The evaporating treatment was carried out by passing air onto the tube"은 표 28에 도시된 C-E관계가 될 것이다.
[표 28]
패턴 3: 목적의 부사적 수식어구: FOR VBG
상기 패턴에서, 제1 eSAO는 원인에 관계된 것으로 간주되며, 결과에 관계된 것으로 간주된, 제2 eSAO는 "FOR_VBG" 센스를 가지는 동작을 갖는다. 상기 "FOR_VBG" 동작 센스는 전치사 "for"에 의해 앞에 위치하는 분사I(동명사형 동사(VBG))로 구성되는 분사 구문으로부터 추출된 동작을 상징하는 비종단 심볼이다. 표 29는 패턴 3의 일반 형식을 나타낸다.
[표 29]
예를 들면, 입력 문장 "The developed control signal is applied to the bias voltage generator for varying the bias voltage" 은 표 30에 도시된 C-E 관계가 될 것이다.
[표 30]
패턴 4: 목적의 부사적 수식어구: THUS VBG
상기 패턴에서, 제1 eSAO는 원인에 관계되는 것으로 간주되며, 결과에 관계되는 것으로 간주된, 제2 eSAO는 "THUS_VBG" 센스를 가지는 동작을 갖는다. 상기 "THUS_VBG" 동작 센스는 다음의 부사, 즉, "thus," "thereby," 및 "therefore." 중 어느 것에 의해 앞에 위치하는 분사I(동명사형 동사(VBG))로 구성되는 동사구로부터 추출된 동작을 상징하는 비종단 심볼이다. 표 31은 패턴 4의 일반 형식을 나타낸다.
[표 31]
예를 들면, 입력 문장 "The aforementioned armature is secured to the side plates by pivot devices, thus obtaing excellent mechanical operation"은 표 32에 도시된 C-E관계가 될 것이다.
[표 32]
패턴 5: 분사구 형식의 주어
상기 패턴들은 제1 eSAO의 동작이 센스 "VBG", 즉, 상기 동작이 분사I(동명사형 동사(VBG))로 구성되는 동사로부터 추출되는 동작을 가지며, 제2 eSAO의 동작은 센스들 "TECHNICAL_ACTION," "LINK_ACTION," 또는 "LINK_TECH_ACTION,"에 의해 기술될 수 있으며, 목적어는 동작이 "LINK_ACTION" 또는 "PROCESS_NN"일 경우와 동작이 "LINK_ACTION" 또는 "LINK_TECH_ACTION"일 경우에 임의의 논-엠프티 스트링일 수 있을 때 발생한다. 출력 C-E 관계의 "결과" 부분은 비종단 심볼"LINK_ACTION." "TECHNICAL_ACTION," "LINK_ACTION," "LINK_TECH_ACTION,"에 해당하는 동작들을 포함하지 않을 것이며 "PROCESS_NN"는 단일 eSAO들에 기초한 패턴들을 위해 상기에 규정되었던 것과 같이 규정된다. 표 33은 패턴 5의 일반 형식을 나타낸다.
[표 33]
예를 들면, 입력 문장 "Forming all members from the same die facilitates economical manufactureing"은 표 34에 도시된 C-E 관계가 될 것이다.
[표 34]
패턴 6: 원인의 부사적 수식어구: DEPEND ON
상기 패턴은 제2 eSAO의 동작이 센스 "DEPEND_ON", 즉, 상기 동작이 전치사 "on"으로 뒤따르는 "depend" 또는 "depending"으로 구성되는 동사 그룹으로부터 추출되는 동작을 가질 경우 발생한다. 표 35는 패턴 6의 일반 형식을 나타낸다.
[표 35]
예를 들면, 입력 문장 "The durometer hardness of the elastomeric tube can also be changed depending on the mechanical properties and design of the various stents to be crimped"은 표 36에 도시된 C-E 관계가 될 것이다.
[표 36]
패턴 7: 복합 문장, CONJUNCTION CAUSE 1
상기 패턴은 두 개의 eSAO들을 가진 복합 문장과 상기 두 개의 eSAO들에 앞서는 "CONJUNCTION_CAUSE_1" 센스에 해당하는 어휘 유닛을 인식했을 시 발생한다. C-E관계는 제1 eSAO가 원인이 되고 제2 eSAO가 C-E관계의 결과 부분이 될 경우 추출된다. 상기 "CONJUNCTION_CAUSE_1" 센스는 적어도 다음의 단어 또는 구 "because/as/if/as long as/as soon as/for the reason that/in case/inasmuch/on condition that/provied/since."를 포함한다. 표 37은 패턴 7의 일반 형식을 나타낸다.
[표 37]
예를 들면, 입력 문장 "As soon as the switch has become warm, the electrical connection to the wire is interrupted"은 표 38에 도시된 C-E 관계가 될 것이다.
[표 38]
패턴 8: 복합 문장, CONJUNCTION CAUSE 2
상기 패턴은 두 개의 eSAO들을 가진 복합 문장 및 상기 두 개의 eSAO들을 분리하는 "CONJUNCTION_CAUSE_2" 센스에 해당하는 어휘 유닛을 인식했을 시 발생한다. C-E 관계는 제1 eSAO가 결과가 되고 제2 eSAO가 C-E관계의 원인 부분이 될 경우 추출된다. 상기 "CONJUNCTION_CAUSE_2" 센스는 적어도 다음의 단어 또는 구 "because/as/if/as long as/as soon as/for the reason that/in case/inasmuch/on condition that/provided/since."를 포함한다. 표 39는 패턴 8의 일반 형식을 나타낸다.
[표 39]
예를 들면, 입력 문장 "This contact period can be further reduced if the milk and resin are stirred"은 표 40에 도시된 C-E 관계가 될 것이다.
[표 40]
패턴 9: 복합 문장, CONJUNCTION EFFECT
상기 패턴은 두 개의 eSAO들을 가진 복합 문장 및 상기 두 개의 eSAO들을 분리하는 "CONJUNCTION_EFFECT" 센스에 해당하는 어휘 유닛을 인식했을 시 발생한다. C-E 관계는 제1 eSAO가 원인이 되고 제2 eSAO가 C-E 관계의 결과 부분이 될 경우 추출된다. 상기 "CONJUNCTION_EFFECT" 센스는 적어도 다음의 단어 또는 구 "so that/such that."을 포함한다. 표 41은 패턴 8의 일반 형식을 나타낸다.
[표 41]
예를 들면, 입력 문장 "side portions of the top surface are spaced from the side surfaces to define foul ball openings so that balls can fall from the top surface to the bottom surface"은 표 42에 도시된 C-E 관계가 될 것이다.
[표 42]
도 4는 본 발명의 실시예들에 의해 사용될 수 있는 관계도 모델들을 생성하기 위해 사용될 수 있는 모듈들을 도시한다. 도 4에 도시된 바와 같이, 충분히 큰 텍스트 문서의 코퍼스(170)는 상기 모델들 또는 패턴들을 수립하고 형성하기 위해 사용된다. 상기 코퍼스 언어 분석기(180)는 eSAO들을 인식하기 위해 상기 코퍼스(170)에 대한 언어 분석을 수행한다. 코퍼스 ESAO 생성기(190)는 적어도 하나의 eSAO를 포함하는 문장들의 코퍼스를 생성한다. 관계 인식기(200)는 적어도 하나의 eSAO를 포함하는 문장들에서 C-E 관계들의 일부 특정 경우들의 인식 프로세스를 수행한다. 패턴 생성기(210)는 보다 일반적인 특정 경우들을 보다 일반적인 패턴들로 일반화한다. 패턴 테스터기(220)는 인과 관계들의 존재에 대해 확인하며 인과관계 인식을 위해 데이터베이스(230)로 승인된 패턴들을 배치한다.
바람직하게는, 상기 관계 인식기(200)의 기능은 전문자들에 의해 수동으로 수행된다. 예를 들면, 전문가는 eSAO 텍스트 코퍼스로부터 문장 "The aforementioned armature is secured to the plates by pivot devices, thus obtaining excellent mechanical operation"을 분석하며, 여기서 품사 태깅, 파싱 및 시맨틱 분석이 수행되고 두 개의 eSAO들(표 31 참조)이 인식되는 언어 분석기는 이러한 eSAO들이 인과관계의 부분을 형성한다는 점을 나타내는 특별한 태그들을 집어넣는다. 그 후 이 문장은 상기 패턴 생성기(210)로 간다.
상기 패턴 생성기(210)는 패턴들의 레벨에 대한 C-E 관계의 분석 및 일반화를 수행한다. 상기 패턴 생성기의 기능은 또한 바람직하게는 전문자들에 의해 수동으로 수행된다. 이러한 방식에서, 전문가는 그의 또는 그녀의 경험과 지식과 언어 지식 기반에 포함된 지식을 고려한다. 이전 예로 돌아가, 상기 전문가는 부사들 "thereby" 및 "therefore"이 부사 "thus"와 유사한 의미를 가진다는 결론에 도달해야 한다. 게다가, 단어 "thus"에 태그 VBG를 갖는 "obtaining"이 뒤따른다. 그러므로, 전문가는 표 30에 나타낸 방법으로 상기 패턴의 원형(prototype)을 등록한다.
원형의 패턴들을 사용하는, 상기 패턴 테스터기(220)는 eSAO 텍스트 코퍼스에서 인과관계의 예들을 찾는다. 상기 전문가는 회수된 예들을 분석하고 (아마 일부 수정된) 패턴을 승인한다. 상기 패턴 테스터기(220)는 그 후 상기 승인된 패턴을 C-E 인식을 위한 패턴들의 데이터베이스(230)에 집어넣는다.
상기에 나타낸 바와 같이, 상기 시맨틱 분석기(180) 및 상기 패턴 생성기(210) 모두는 그들의 기능의 수행을 위해 상기 언어 지식 기반에 접근할 수 있다. 또한, 본 발명의 일부 실시예들에서, 상기 패턴들의 데이터베이스(230)는 도 1-3에 관해 상기에 기술된 상기 인과 시맨틱 프로세싱을 지지하기 위해 상기 언어 지식 기반(60) 내에 병합될 수 있다.
본 발명의 실시예들은 하나 이상의 컴퓨터, 마이크로프로세서, 마이크로컨트롤러, 또는 다른 프로세싱 장치들에 상주하는 컴퓨터 수행가능 명령들에 의해 제공될 수 있다. 상기 시스템 및 방법을 수행하기 위한 상기 컴퓨터-수행가능 명령들은 프로세싱 장치들 안의 메모리에 존재할 수 있으며 또는 플로피 디스크, 하드 디스크, 컴팩트 디스크(CD들), 디지털 다기능 디스크(DVD들), 롬(ROM), 또는 기타 저장 매체에 의한 프로세싱 장치들에 제공될 수 있다.
대표적이고 바람직한 실시예들의 전술한 상세설명은 법률 조항들에 따라 도시 및 개시를 목적으로 제시된다. 본 발명이 정확한 형태(들)로 국한되어서는 안되며, 단지 본 발명에 속하는 기술분야에서 통상의 지식을 가진 자들이 본 발명이 특정 사용 또는 구현을 위해 어떻게 적응되는 지를 이해하게 할 뿐이다. 변형 및 변경의 가능성은 본 발명의 기술분야에 속하는 통상의 지식을 가진 자들에게 명백해질 것이다. 대표적인 실시예들의 설명에 의해 국한되는 것으로 의도하지 않으며, 이에는 허용치, 특정 규격들, 특정 동작 조건들, 엔지니터링 사양 등이 포함될 수 있으며, 구체에들 간에 또는 기술의 상태에 대한 변경들로 변할 수 있으며, 그것으로부터 국한되어서는 안 된다. 상기 개시물은 기술의 현재 상태에 관해 작성되었으나, 또한 장점들을 심사숙고하고 기술의 현재 상태에 따른 장래 개조에 있어서 그러한 발전을 고려할 수도 있다. 본 발명의 범위는 작성된 청구항들 및 적용가능한 것으로서의 상응물에 의해 규정되는 것으로 의도된다. 단일의 주장 요소에 대한 참조는 명백하게 그렇다고 하지 언급하지 않는 한 "하나 및 단지 하나"를 의미하는 것으로 의도되지 않는다. 게다가, 본 개시물에 없는 엘리먼트, 컴포넌트, 또는 방법 또는 프로세스 단계는 상기 엘리먼트, 컴포넌트, 또는 단계가 청구항들에 명백하게 인용되는지에 상관없이 공개적으로 전용된 것으로 의도된다. 본원에 주장 요소가 구문 "...을 위한 수단"을 사용하여 확실히 언급되지 않는 한 그리고 본원에 방법 또는 프로세스가 구문 "...하기 위한 단계(들)"을 사용하여 확실히 언급되지 않는 한 법조항 35 U.S.C. Sec.112, 6번째 문단에 의해 구성될 수 없다.
Claims (22)
- 적어도 하나의 자연어 문서로부터 텍스트를 제공하는 단계;상기 텍스트에서 하나 이상의 확장형 주어-동작-목적어(eSAO) 세트들을 인식하는 단계로서, 각 eSAO 세트는 하나 이상의 eSAO 컴포넌트들을 가지는, 단계;인과(cause-effect) 관계도 패턴들에 상기 하나 이상의 eSAO 세트들을 매치시키는 단계;상기 매칭에 기초한 하나 이상의 eSAO 인과 관계들을 생성하는 단계로서, 상기 eSAO 인과 관계는 원인 eSAO와 결과 eSAO를 포함하는 단계; 및상기 하나 이상의 eSAO 인과 관계들을 지식 기반에 저장하는 단계를 포함하는, 인과 지식 기반을 생성하기 위해 자연어 문서들에서 인과 관계들을 인식하기 위한 방법.
- 제 1 항에 있어서, 상기 하나 이상의 eSAO 컴포넌트들은 주어, 목적어, 동작, 형용사, 전치사, 간접 목적어, 및 부사로 구성되는 그룹의 하나 이상의 엘리먼트들과 관련된 텍스트를 포함하는, 인과 지식 기반을 생성하기 위해 자연어 문서들에서 인과 관계들을 인식하기 위한 방법.
- 제 1 항에 있어서, 상기 원인 eSAO는 상기 하나 이상의 eSAO 세트들 중 하나 이상의 eSAO 컴포넌트들을 포함하고, 상기 결과 eSAO는 상기 하나 이상의 eSAO 세 트들 중 하나 이상의 eSAO 컴포넌트들을 포함하는, 인과 지식 기반을 생성하기 위해 자연어 문서들에서 인과 관계들을 인식하기 위한 방법.
- 제 2 항에 있어서, 상기 eSAO 인과 관계는 상기 원인 eSAO의 eSAO 컴포넌트들에 상기 결과 eSAO의 eSAO 컴포넌트들을 어휘, 문법 및/또는 시맨틱 언어 수단들로 관련시키는 순차적 오퍼레이터를 포함하는, 인과 지식 기반을 생성하기 위해 자연어 문서들에서 인과 관계들을 인식하기 위한 방법.
- 제 1 항에 있어서,상기 텍스트의 태깅된 부분들을 생성하기 위해 상기 텍스트의 적어도 일부분에 품사(parts-of-speech) 태그들을 적용하는 단계; 및상기 텍스트의 파싱 및 태깅된 부분들을 생성하기 위해 상기 텍스트의 태깅된 부분들을 파싱하는 단계를 더 포함하며, 상기 텍스트에서 상기 eSAO 세트들을 인식하는 단계는 상기 텍스트의 상기 파싱 및 태깅된 부분들에 대해 수행되는, 인과 지식 기반을 생성하기 위해 자연어 문서들에서 인과 관계들을 인식하기 위한 방법.
- 제 4 항에 있어서, 품사 태그들을 적용하는 단계는 상기 텍스트의 프리 포맷된(preformatted) 부분들에 대해 수행되어, 이로써 제거된 비자연어 심볼들을 가진 텍스트를 상기 텍스트의 상기 프리 포맷된 부분들이 포함하는, 인과 지식 기반을 생성하기 위해 자연어 문서들에서 인과 관계들을 인식하기 위한 방법.
- 제 1 항에 있어서, 인과 관계도 패턴들에 상기 하나 이상의 eSAO 세트들을 매치시키는 단계는 단일 eSAO 세트를 매치시키는 단계를 포함하고 상기 매칭에 기초한 하나 이상의 eSAO 인과 관계들을 생성하는 단계는 단일 eSAO 인과 관계를 생성하는 단계를 포함하는, 인과 지식 기반을 생성하기 위해 자연어 문서들에서 인과 관계들을 인식하기 위한 방법.
- 제 1 항에 있어서, 인과 관계도 패턴들에 상기 하나 이상의 eSAO 세트들을 매치시키는 단계는 한 쌍의 eSAO 세트들을 매치시키는 단계를 포함하고 상기 매칭에 기초한 하나 이상의 eSAO 인과 관계들을 생성하는 단계는 상기 쌍의 매칭에 기초한 단일 eSAO 인과 관계를 생성하는 단계를 포함하는, 인과 지식 기반을 생성하기 위해 자연어 문서들에서 인과 관계들을 인식하기 위한 방법.
- 제 1 항에 있어서, 인과 관계도 패턴들에 사기 하나 이상의 eSAO 세트들을 매치시키는 단계는 인과 패턴 데이터베이스에 접근하는 단계를 포함하며, 상기 인과 패턴 데이터베이스가,텍스트 문서들에서 eSAO 세트들을 인식하는 단계;문장들의 코퍼스(corpus)를 생성하는 단계로서, 각 문장은 상기 인식된 eSAO 세트들 중 적어도 하나를 포함하는, 단계;상기 문장들에서 인과 관계들의 특정 경우들을 인식하는 단계;상기 인과 관계들의 특정 경우들을 eSAO 인과 패턴들로 일반화시키는 단계;상기 eSAO 인과 패턴들을 인과 패턴 데이터베이스에 저장하는 단계를 포함하는 방법에 의해 생성되는, 인과 지식 기반을 생성하기 위해 자연어 문서들에서 인과 관계들을 인식하기 위한 방법.
- 제 1 항에 있어서, 상기 텍스트에서 하나 이상의 확장형 주어-동작-목적어(eSAO) 세트들을 인식하는 단계는 eSAO 컴포넌트들을 규정하는 데이터베이스를 가지는 언어 지식 기반에 접근하는 단계를 포함하는, 인과 지식 기반을 생성하기 위해 자연어 문서들에서 인과 관계들을 인식하기 위한 방법.
- 제 1 항에 있어서, 상기 텍스트에서 하나 이상의 확장형 주어-동작-목적어(eSAO) 세트들을 인식하는 단계는 상기 텍스트의 하나 이상의 문장들에서 주어, 목적어, 동작, 형용사, 전치사, 간접 목적어, 및/또는 부사를 인식하는 단계를 포함하는, 인과 지식 기반을 생성하기 위해 자연어 문서들에서 인과 관계들을 인식하기 위한 방법.
- 적어도 하나의 자연어 문서로부터 텍스트를 제공하는 단계;상기 텍스트에서 하나 이상의 확장형 주어-동작-목적어(eSAO) 세트들을 인식하는 단계로서, 각 eSAO 세트는 하나 이상의 eSAO 컴포넌트들을 가지는, 단계;인과(cause-effect) 관계도 패턴들에 상기 하나 이상의 eSAO 세트들을 매치시키는 단계;상기 매칭에 기초한 하나 이상의 eSAO 인과 관계들을 생성하는 단계로서, 상기 eSAO 인과 관계는 원인 eSAO와 결과 eSAO를 포함하는, 단계; 및상기 하나 이상의 eSAO 인관 관계들을 지식 기반에 저장하는 단계를 포함하는, 인과 지식 기반을 생성하기 위해 자연어 문서들에서 인과 관계들을 인식하기 위한 방법을 수행하기 위한 컴퓨터에서 실행가능한 명령들을 포함하는 컴퓨터 프로그램 제품.
- 전자 또는 디지털 형태의 텍스트에서 인과 관계들을 인식하기 위한 시맨틱 프로세서에 있어서,언어 지식 기반; 및상기 텍스트에 기초한 하나 이상의 eSAO 세트들을 생성하기 위한 확장형 주어-동작-목적어(eSAO) 인식기로서, 상기 eSAO 세트들은 상기 언어 지식 기반에 저장된 eSAO 정의에 기초하는, 인식기; 및상기 하나 이상의 eSAO 세트들과, 상기 언어 지식 기반에 저장된 공지된 인과 관계 패턴들을 매치시키고 상기 매치에 기초한 하나 이상의 eSAO 인과 관계들을 생성하기 위한 인과 인식기를 포함하는 시맨틱 분석기를 포함하며,상기 하나 이상의 eSAO 인과 관계들이 추후 사용을 위해 지식 기반에 저장되는, 시맨틱 프로세서.
- 제 13 항에 있어서, 상기 시맨틱 프로세서는 상기 시맨틱 분석기를 포함하는 언어 분석기를 포함하며 상기 언어 분석기는,전자 또는 디지털 형식의 상기 텍스에 기초한 프리 포맷된(preformatted) 텍스트를 수신하기 위한 품사 태거(parts-of-speech tagger); 및상기 품사 태거에 의해 태깅된 텍스트를 수신하고 상기 시맨틱 분석기로 파싱된 텍스트를 제공하기 위한 파서(parser)를 더 포함하며,상기 품사 태거 및 상기 파서는 상기 언어 지식 기반에 저장된 데이터로 동작하는, 시맨틱 프로세서.
- 제 14 항에 있어서,전자 또는 디지털 형식의 텍스트를 수신하고 상기 언어 지식 기반에 저장된 데이터에 기초한 프리 포맷된 텍스트를 생성하기 위한 프리 포맷기(preformatter); 및상기 언어 분석기에 의해 생성된 상기 하나 이상의 eSAO 인과 관계들로부터 지식 기반을 생성하기 위한 지식 기반 생성기를 더 포함하는, 시맨틱 프로세서.
- 제 15 항에 있어서, 상기 프리 포맷기는 하기의 기능들로서,자연어 텍스트 부분을 형성하지 않는 텍스트의 디지털 또는 전자식 표현에 있어 임의의 심볼 제거;상기 텍스트에서 임의의 부정합 또는 실수들의 삭제 및 정정; 및상기 텍스트를 문장 및 단어의 구조로 분할하는 기능들 중 적어도 하나를 수행하는, 시맨틱 프로세서.
- 제 13 항에 있어서, 공지된 인과 관계도 패턴들은,텍스트 문서들의 코퍼스에서 eSAO 세트들을 인식하기 위한 코퍼스 언어 분석기;문장들의 코퍼스를 생성하기 위한 코퍼스 eSAO 생성기로서, 각 문장은 상기 인식된 eSAO 세트들 중 적어도 하나를 포함하는, 생성기;상기 문장들에서 인과 관계들의 특정 경우들을 인식하기 위한 관계 인식기;상기 인과 관계들의 특정 경우들을 eSAO 인과 패턴들로 일반화시키기 위한 패턴 생성기; 및상기 eSAO 인과 패턴들을 상기 언어 지식 기반 내의 데이터베이스인, 인과 패턴 데이터베이스에 저장하기 위한 패턴 테스터기를 포함하는 인과 관계도 생성기에 의해 생성되는, 시맨틱 프로세서.
- 제 13 항에 있어서, 상기 eSAO 인과 관계는 원인 eSAO, 결과 eSAO, 및 상기 인과 eSAO에 상기 결과 eSAO를 관련시키는 적어도 하나의 순차적 오퍼레이터를 포함하는, 시맨틱 프로세서.
- 제 18 항에 있어서, 상기 텍스트에 기초한 각 eSAO 세트는 eSAO 컴포넌트들을 포함하고 상기 원인 eSAO는 하나 이상의 상기 eSAO 컴포넌트들을 포함하고 상기 결과 eSAO는 상기 원인 eSAO의 상기 하나 이상의 eSAO 컴포넌트들과는 다른 하나 이상의 eSAO 컴포넌트들을 포함하는, 시맨틱 프로세서.
- 제 19 항에 있어서, 상기 eSAO 컴포넌트들은 주어, 목적어, 동작, 형용사, 전치사, 간접 목적어, 및 부사로 구성되는 그룹의 하나 이상의 엘리먼트들과 관련된 텍스트를 포함하는, 시맨틱 프로세서.
- 제 13 항에 있어서, 상기 인과 인식기는 단일 eSAO 세트와 공지된 인과 관계도 패턴을 매치시키며 단일 eSAO 인과 관계를 생성하는, 시맨틱 프로세서.
- 제 13 항에 있어서, 상기 인과 인식기는 한 쌍의 eSAO 세트들과 공지된 인과 관계도 패턴을 매치시키며 단일 eSAO 인과 관계를 생성하는, 시맨틱 프로세서.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/258,250 US9009590B2 (en) | 2001-07-31 | 2005-10-24 | Semantic processor for recognition of cause-effect relations in natural language documents |
US11/258,250 | 2005-10-24 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20080092337A true KR20080092337A (ko) | 2008-10-15 |
Family
ID=37873241
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020087012454A KR20080092337A (ko) | 2005-10-24 | 2006-10-24 | 자연어 문서들에서 인과 관계들의 인식을 위한 시맨틱프로세서 |
Country Status (4)
Country | Link |
---|---|
US (1) | US9009590B2 (ko) |
EP (1) | EP1941394A2 (ko) |
KR (1) | KR20080092337A (ko) |
WO (1) | WO2007051106A2 (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011065617A1 (ko) * | 2009-11-27 | 2011-06-03 | 한국과학기술정보연구원 | 과학기술핵심개체 간 의미적 연관관계 자동 추출을 위한 시맨틱 구문 트리 커널 기반 처리 시스템 및 방법 |
WO2017048030A1 (ko) * | 2015-09-14 | 2017-03-23 | 강민구 | 3단계 음성 언어 학습을 위한 더블 음원 재생 장치 및 방법 |
Families Citing this family (150)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
US9009590B2 (en) | 2001-07-31 | 2015-04-14 | Invention Machines Corporation | Semantic processor for recognition of cause-effect relations in natural language documents |
US8799776B2 (en) * | 2001-07-31 | 2014-08-05 | Invention Machine Corporation | Semantic processor for recognition of whole-part relations in natural language documents |
US20060277525A1 (en) * | 2005-06-06 | 2006-12-07 | Microsoft Corporation | Lexical, grammatical, and semantic inference mechanisms |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US7672831B2 (en) * | 2005-10-24 | 2010-03-02 | Invention Machine Corporation | System and method for cross-language knowledge searching |
US7805455B2 (en) * | 2005-11-14 | 2010-09-28 | Invention Machine Corporation | System and method for problem analysis |
US7668791B2 (en) * | 2006-07-31 | 2010-02-23 | Microsoft Corporation | Distinguishing facts from opinions using a multi-stage approach |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8671341B1 (en) * | 2007-01-05 | 2014-03-11 | Linguastat, Inc. | Systems and methods for identifying claims associated with electronic text |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US8521512B2 (en) * | 2008-04-30 | 2013-08-27 | Deep Sky Concepts, Inc | Systems and methods for natural language communication with a computer |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
WO2010067118A1 (en) | 2008-12-11 | 2010-06-17 | Novauris Technologies Limited | Speech recognition involving a mobile device |
WO2010105214A2 (en) | 2009-03-13 | 2010-09-16 | Invention Machine Corporation | Question-answering system and method based on semantic labeling of text documents and user questions |
CN102439594A (zh) * | 2009-03-13 | 2012-05-02 | 发明机器公司 | 用于知识搜索的系统和方法 |
US8972445B2 (en) | 2009-04-23 | 2015-03-03 | Deep Sky Concepts, Inc. | Systems and methods for storage of declarative knowledge accessible by natural language in a computer capable of appropriately responding |
US8214366B2 (en) * | 2009-11-17 | 2012-07-03 | Glace Holding Llc | Systems and methods for generating a language database that can be used for natural language communication with a computer |
US8275788B2 (en) | 2009-11-17 | 2012-09-25 | Glace Holding Llc | System and methods for accessing web pages using natural language |
US9805020B2 (en) | 2009-04-23 | 2017-10-31 | Deep Sky Concepts, Inc. | In-context access of stored declarative knowledge using natural language expression |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US10255566B2 (en) | 2011-06-03 | 2019-04-09 | Apple Inc. | Generating and processing task items that represent tasks to perform |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US20140114986A1 (en) * | 2009-08-11 | 2014-04-24 | Pearl.com LLC | Method and apparatus for implicit topic extraction used in an online consultation system |
US9646079B2 (en) | 2012-05-04 | 2017-05-09 | Pearl.com LLC | Method and apparatus for identifiying similar questions in a consultation system |
US9904436B2 (en) | 2009-08-11 | 2018-02-27 | Pearl.com LLC | Method and apparatus for creating a personalized question feed platform |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US8719006B2 (en) * | 2010-08-27 | 2014-05-06 | Apple Inc. | Combined statistical and rule-based part-of-speech tagging for text-to-speech synthesis |
US10762293B2 (en) | 2010-12-22 | 2020-09-01 | Apple Inc. | Using parts-of-speech tagging and named entity recognition for spelling correction |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US20130013616A1 (en) * | 2011-07-08 | 2013-01-10 | Jochen Lothar Leidner | Systems and Methods for Natural Language Searching of Structured Data |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
US9934218B2 (en) * | 2011-12-05 | 2018-04-03 | Infosys Limited | Systems and methods for extracting attributes from text content |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US9275038B2 (en) | 2012-05-04 | 2016-03-01 | Pearl.com LLC | Method and apparatus for identifying customer service and duplicate questions in an online consultation system |
US9501580B2 (en) | 2012-05-04 | 2016-11-22 | Pearl.com LLC | Method and apparatus for automated selection of interesting content for presentation to first time visitors of a website |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
KR20230137475A (ko) | 2013-02-07 | 2023-10-04 | 애플 인크. | 디지털 어시스턴트를 위한 음성 트리거 |
US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
AU2014233517B2 (en) | 2013-03-15 | 2017-05-25 | Apple Inc. | Training an at least partial voice command system |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
DE112014002747T5 (de) | 2013-06-09 | 2016-03-03 | Apple Inc. | Vorrichtung, Verfahren und grafische Benutzerschnittstelle zum Ermöglichen einer Konversationspersistenz über zwei oder mehr Instanzen eines digitalen Assistenten |
CN105265005B (zh) | 2013-06-13 | 2019-09-17 | 苹果公司 | 用于由语音命令发起的紧急呼叫的系统和方法 |
WO2015020942A1 (en) | 2013-08-06 | 2015-02-12 | Apple Inc. | Auto-activating smart responses based on activities from remote devices |
JP5904559B2 (ja) | 2013-12-20 | 2016-04-13 | 国立研究開発法人情報通信研究機構 | シナリオ生成装置、及びそのためのコンピュータプログラム |
JP6403382B2 (ja) * | 2013-12-20 | 2018-10-10 | 国立研究開発法人情報通信研究機構 | フレーズペア収集装置、及びそのためのコンピュータプログラム |
JP5907393B2 (ja) | 2013-12-20 | 2016-04-26 | 国立研究開発法人情報通信研究機構 | 複雑述語テンプレート収集装置、及びそのためのコンピュータプログラム |
US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
EP3149728B1 (en) | 2014-05-30 | 2019-01-16 | Apple Inc. | Multi-command single utterance input method |
US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US9606986B2 (en) | 2014-09-29 | 2017-03-28 | Apple Inc. | Integrated word N-gram and class M-gram language models |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
US20170103182A1 (en) * | 2015-01-25 | 2017-04-13 | International Business Machines Corporation | Modelling Disease Progression and Intervention Effects Using Non-Clinical Information Proxies for Clinical Information |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US10592519B2 (en) | 2016-03-29 | 2020-03-17 | Microsoft Technology Licensing, Llc | Computational-model operation using multiple subject representations |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179588B1 (en) | 2016-06-09 | 2019-02-22 | Apple Inc. | INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
WO2018000272A1 (zh) * | 2016-06-29 | 2018-01-04 | 深圳狗尾草智能科技有限公司 | 一种语料生成装置和方法 |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
US10706113B2 (en) * | 2017-01-06 | 2020-07-07 | Microsoft Technology Licensing, Llc | Domain review system for identifying entity relationships and corresponding insights |
US10339180B2 (en) | 2017-04-14 | 2019-07-02 | International Business Machines Corporation | Preventing biased queries by using a dictionary of cause and effect terms |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK179560B1 (en) | 2017-05-16 | 2019-02-18 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US10503791B2 (en) * | 2017-09-04 | 2019-12-10 | Borislav Agapiev | System for creating a reasoning graph and for ranking of its nodes |
US11960839B2 (en) * | 2017-11-06 | 2024-04-16 | Resonac Corporation | Cause-effect sentence analysis device, cause-effect sentence analysis system, program, and cause-effect sentence analysis method |
EP3759656A4 (en) | 2018-02-28 | 2022-03-30 | Northrup, Charles | SYSTEM AND METHOD FOR A DING MACHINE FOR RUNNING MODELS |
KR102203895B1 (ko) | 2019-02-20 | 2021-01-15 | 성균관대학교산학협력단 | 임베딩 기반의 인과 관계 탐지 시스템과 방법 및 이를 실행하기 위한 프로그램이 기록된 기록매체 |
JP2022547750A (ja) | 2019-09-16 | 2022-11-15 | ドキュガミ インコーポレイテッド | クロスドキュメントインテリジェントオーサリングおよび処理アシスタント |
KR102634624B1 (ko) * | 2021-05-04 | 2024-02-08 | 인제대학교 산학협력단 | 플랜트 절차서의 프로세스 모델 생성방법 및 그의 시스템 |
Family Cites Families (88)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4829423A (en) | 1983-01-28 | 1989-05-09 | Texas Instruments Incorporated | Menu-based natural language understanding system |
US5696916A (en) | 1985-03-27 | 1997-12-09 | Hitachi, Ltd. | Information storage and retrieval system and display method therefor |
US4887212A (en) | 1986-10-29 | 1989-12-12 | International Business Machines Corporation | Parser for natural language text |
US4868750A (en) | 1987-10-07 | 1989-09-19 | Houghton Mifflin Company | Collocational grammar system |
US4864502A (en) | 1987-10-07 | 1989-09-05 | Houghton Mifflin Company | Sentence analyzer |
US5146405A (en) * | 1988-02-05 | 1992-09-08 | At&T Bell Laboratories | Methods for part-of-speech determination and usage |
NL8900247A (nl) | 1989-02-01 | 1990-09-03 | Bso Buro Voor Systeemontwikkel | Werkwijze en stelsel voor het weergeven van meervoudige analyses in een afhankelijkheidsgrammatica, alsmede ontleed-inrichting voor het genereren van een dergelijke weergave. |
JP3266246B2 (ja) | 1990-06-15 | 2002-03-18 | インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン | 自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法 |
US5404295A (en) | 1990-08-16 | 1995-04-04 | Katz; Boris | Method and apparatus for utilizing annotations to facilitate computer retrieval of database material |
US5559940A (en) | 1990-12-14 | 1996-09-24 | Hutson; William H. | Method and system for real-time information analysis of textual material |
US5418889A (en) | 1991-12-02 | 1995-05-23 | Ricoh Company, Ltd. | System for generating knowledge base in which sets of common causal relation knowledge are generated |
US5377103A (en) | 1992-05-15 | 1994-12-27 | International Business Machines Corporation | Constrained natural language interface for a computer that employs a browse function |
US5369575A (en) | 1992-05-15 | 1994-11-29 | International Business Machines Corporation | Constrained natural language interface for a computer system |
JP2821840B2 (ja) | 1993-04-28 | 1998-11-05 | 日本アイ・ビー・エム株式会社 | 機械翻訳装置 |
US5638543A (en) | 1993-06-03 | 1997-06-10 | Xerox Corporation | Method and apparatus for automatic document summarization |
US5331556A (en) * | 1993-06-28 | 1994-07-19 | General Electric Company | Method for natural language data processing using morphological and part-of-speech information |
US5774845A (en) | 1993-09-17 | 1998-06-30 | Nec Corporation | Information extraction processor |
US5873056A (en) | 1993-10-12 | 1999-02-16 | The Syracuse University | Natural language processing system for semantic vector representation which accounts for lexical ambiguity |
US5576954A (en) | 1993-11-05 | 1996-11-19 | University Of Central Florida | Process for determination of text relevancy |
US5692176A (en) | 1993-11-22 | 1997-11-25 | Reed Elsevier Inc. | Associative text search and retrieval system |
JPH07160684A (ja) | 1993-12-03 | 1995-06-23 | Matsushita Electric Ind Co Ltd | 文書圧縮装置および文書圧縮方法 |
US5485372A (en) * | 1994-06-01 | 1996-01-16 | Mitsubishi Electric Research Laboratories, Inc. | System for underlying spelling recovery |
EP0692765B1 (en) | 1994-06-21 | 2003-05-21 | Canon Kabushiki Kaisha | Text preparing system using knowledge base and method therefor |
US5748973A (en) | 1994-07-15 | 1998-05-05 | George Mason University | Advanced integrated requirements engineering system for CE-based requirements assessment |
US5799268A (en) | 1994-09-28 | 1998-08-25 | Apple Computer, Inc. | Method for extracting knowledge from online documentation and creating a glossary, index, help database or the like |
US5715468A (en) | 1994-09-30 | 1998-02-03 | Budzinski; Robert Lucius | Memory system for storing and retrieving experience and knowledge with natural language |
US5794050A (en) | 1995-01-04 | 1998-08-11 | Intelligent Text Processing, Inc. | Natural language understanding system |
JP3571408B2 (ja) | 1995-03-31 | 2004-09-29 | 株式会社日立製作所 | 文書加工方法および装置 |
US5708825A (en) | 1995-05-26 | 1998-01-13 | Iconovex Corporation | Automatic summary page creation and hyperlink generation |
US5724571A (en) | 1995-07-07 | 1998-03-03 | Sun Microsystems, Inc. | Method and apparatus for generating query responses in a computer-based document retrieval system |
US5963940A (en) | 1995-08-16 | 1999-10-05 | Syracuse University | Natural language information retrieval system and method |
US6026388A (en) | 1995-08-16 | 2000-02-15 | Textwise, Llc | User interface and other enhancements for natural language information retrieval system and method |
US5873076A (en) | 1995-09-15 | 1999-02-16 | Infonautics Corporation | Architecture for processing search queries, retrieving documents identified thereby, and method for using same |
US5867164A (en) | 1995-09-29 | 1999-02-02 | Apple Computer, Inc. | Interactive document summarization |
US6076088A (en) | 1996-02-09 | 2000-06-13 | Paik; Woojin | Information extraction system and method using concept relation concept (CRC) triples |
US5924108A (en) | 1996-03-29 | 1999-07-13 | Microsoft Corporation | Document summarizer for word processors |
US5966686A (en) | 1996-06-28 | 1999-10-12 | Microsoft Corporation | Method and system for computing semantic logical forms from syntax trees |
US5878385A (en) | 1996-09-16 | 1999-03-02 | Ergo Linguistic Technologies | Method and apparatus for universal parsing of language |
US6056428A (en) | 1996-11-12 | 2000-05-02 | Invention Machine Corporation | Computer based system for imaging and analyzing an engineering object system and indicating values of specific design changes |
US6202043B1 (en) | 1996-11-12 | 2001-03-13 | Invention Machine Corporation | Computer based system for imaging and analyzing a process system and indicating values of specific design changes |
JP3579204B2 (ja) | 1997-01-17 | 2004-10-20 | 富士通株式会社 | 文書要約装置およびその方法 |
US6076051A (en) | 1997-03-07 | 2000-06-13 | Microsoft Corporation | Information retrieval utilizing semantic representation of text |
EP0968478A1 (de) | 1997-03-18 | 2000-01-05 | Siemens Aktiengesellschaft | Verfahren zur automatischen generierung einer zusammenfassung von einem text durch einen rechner |
JP3001047B2 (ja) | 1997-04-17 | 2000-01-17 | 日本電気株式会社 | 文書要約装置 |
US5933822A (en) * | 1997-07-22 | 1999-08-03 | Microsoft Corporation | Apparatus and methods for an information retrieval system that employs natural language processing of search results to improve overall precision |
US6055528A (en) | 1997-07-25 | 2000-04-25 | Claritech Corporation | Method for cross-linguistic document retrieval |
US6185592B1 (en) | 1997-11-18 | 2001-02-06 | Apple Computer, Inc. | Summarizing text documents by resolving co-referentiality among actors or objects around which a story unfolds |
US6128634A (en) | 1998-01-06 | 2000-10-03 | Fuji Xerox Co., Ltd. | Method and apparatus for facilitating skimming of text |
JP3614648B2 (ja) | 1998-03-13 | 2005-01-26 | 富士通株式会社 | 文書理解支援装置、要約文生成方法、並びに文書理解支援プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP3429184B2 (ja) | 1998-03-19 | 2003-07-22 | シャープ株式会社 | テキスト構造解析装置および抄録装置、並びにプログラム記録媒体 |
EP0962873A1 (en) | 1998-06-02 | 1999-12-08 | International Business Machines Corporation | Processing of textual information and automated apprehension of information |
US6167370A (en) | 1998-09-09 | 2000-12-26 | Invention Machine Corporation | Document semantic analysis/selection with knowledge creativity capability utilizing subject-action-object (SAO) structures |
US6789230B2 (en) | 1998-10-09 | 2004-09-07 | Microsoft Corporation | Creating a summary having sentences with the highest weight, and lowest length |
US6459949B1 (en) | 1998-10-21 | 2002-10-01 | Advanced Micro Devices, Inc. | System and method for corrective action tracking in semiconductor processing |
US6442566B1 (en) | 1998-12-15 | 2002-08-27 | Board Of Trustees Of The Leland Stanford Junior University | Frame-based knowledge representation system and methods |
US6381598B1 (en) | 1998-12-22 | 2002-04-30 | Xerox Corporation | System for providing cross-lingual information retrieval |
US6317708B1 (en) | 1999-01-07 | 2001-11-13 | Justsystem Corporation | Method for producing summaries of text document |
GB9904663D0 (en) * | 1999-03-01 | 1999-04-21 | Canon Kk | Apparatus and method for generating processor usable data from natural langage input data |
US6242362B1 (en) * | 1999-08-04 | 2001-06-05 | Taiwan Semiconductor Manufacturing Company | Etch process for fabricating a vertical hard mask/conductive pattern profile to improve T-shaped profile for a silicon oxynitride hard mask |
US6823325B1 (en) | 1999-11-23 | 2004-11-23 | Trevor B. Davies | Methods and apparatus for storing and retrieving knowledge |
WO2001067225A2 (en) | 2000-03-06 | 2001-09-13 | Kanisa Inc. | A system and method for providing an intelligent multi-step dialog with a user |
US7120574B2 (en) | 2000-04-03 | 2006-10-10 | Invention Machine Corporation | Synonym extension of search queries with validation |
US6701345B1 (en) | 2000-04-13 | 2004-03-02 | Accenture Llp | Providing a notification when a plurality of users are altering similar data in a health care solution environment |
US20020010574A1 (en) | 2000-04-20 | 2002-01-24 | Valery Tsourikov | Natural language processing and query driven information retrieval |
US7962326B2 (en) | 2000-04-20 | 2011-06-14 | Invention Machine Corporation | Semantic answering system and method |
US8706747B2 (en) | 2000-07-06 | 2014-04-22 | Google Inc. | Systems and methods for searching using queries written in a different character-set and/or language from the target pages |
US20020103793A1 (en) | 2000-08-02 | 2002-08-01 | Daphne Koller | Method and apparatus for learning probabilistic relational models having attribute and link uncertainty and for performing selectivity estimation using probabilistic relational models |
US6823331B1 (en) | 2000-08-28 | 2004-11-23 | Entrust Limited | Concept identification system and method for use in reducing and/or representing text content of an electronic document |
US6557011B1 (en) | 2000-10-31 | 2003-04-29 | International Business Machines Corporation | Methods for analyzing dynamic program behavior using user-defined classifications of an execution trace |
DE10122756A1 (de) | 2001-05-10 | 2002-11-21 | Daimler Chrysler Ag | Verfahren zur Generierung von Daten für die semantische Sprachanalyse |
US7251781B2 (en) | 2001-07-31 | 2007-07-31 | Invention Machine Corporation | Computer based summarization of natural language documents |
US9009590B2 (en) | 2001-07-31 | 2015-04-14 | Invention Machines Corporation | Semantic processor for recognition of cause-effect relations in natural language documents |
US8799776B2 (en) | 2001-07-31 | 2014-08-05 | Invention Machine Corporation | Semantic processor for recognition of whole-part relations in natural language documents |
US6754654B1 (en) | 2001-10-01 | 2004-06-22 | Trilogy Development Group, Inc. | System and method for extracting knowledge from documents |
US7035877B2 (en) | 2001-12-28 | 2006-04-25 | Kimberly-Clark Worldwide, Inc. | Quality management and intelligent manufacturing with labels and smart tags in event-based product manufacturing |
US20040001099A1 (en) | 2002-06-27 | 2004-01-01 | Microsoft Corporation | Method and system for associating actions with semantic labels in electronic documents |
US7552149B2 (en) | 2003-09-06 | 2009-06-23 | Oracle International Corporation | Querying past versions of data in a distributed database |
US7536368B2 (en) | 2003-11-26 | 2009-05-19 | Invention Machine Corporation | Method for problem formulation and for obtaining solutions from a database |
US20050131874A1 (en) | 2003-12-15 | 2005-06-16 | Mikhail Verbitsky | Method and system for obtaining solutions to contradictional problems from a semantically indexed database |
US8126890B2 (en) | 2004-12-21 | 2012-02-28 | Make Sence, Inc. | Techniques for knowledge discovery by constructing knowledge correlations using concepts or terms |
US7761844B2 (en) | 2005-04-22 | 2010-07-20 | Ubs Ag | Technique for platform-independent service modeling |
US7805496B2 (en) | 2005-05-10 | 2010-09-28 | International Business Machines Corporation | Automatic generation of hybrid performance models |
US7668825B2 (en) | 2005-08-26 | 2010-02-23 | Convera Corporation | Search system and method |
US7672831B2 (en) | 2005-10-24 | 2010-03-02 | Invention Machine Corporation | System and method for cross-language knowledge searching |
US8832064B2 (en) | 2005-11-30 | 2014-09-09 | At&T Intellectual Property Ii, L.P. | Answer determination for natural language questioning |
CN1794233A (zh) | 2005-12-28 | 2006-06-28 | 刘文印 | 一种网上用户交互问答方法及其系统 |
US8527262B2 (en) | 2007-06-22 | 2013-09-03 | International Business Machines Corporation | Systems and methods for automatic semantic role labeling of high morphological text for natural language processing applications |
US8914278B2 (en) | 2007-08-01 | 2014-12-16 | Ginger Software, Inc. | Automatic context sensitive language correction and enhancement using an internet corpus |
-
2005
- 2005-10-24 US US11/258,250 patent/US9009590B2/en active Active
-
2006
- 2006-10-24 KR KR1020087012454A patent/KR20080092337A/ko not_active Application Discontinuation
- 2006-10-24 EP EP06839521A patent/EP1941394A2/en not_active Withdrawn
- 2006-10-24 WO PCT/US2006/060191 patent/WO2007051106A2/en active Application Filing
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011065617A1 (ko) * | 2009-11-27 | 2011-06-03 | 한국과학기술정보연구원 | 과학기술핵심개체 간 의미적 연관관계 자동 추출을 위한 시맨틱 구문 트리 커널 기반 처리 시스템 및 방법 |
WO2017048030A1 (ko) * | 2015-09-14 | 2017-03-23 | 강민구 | 3단계 음성 언어 학습을 위한 더블 음원 재생 장치 및 방법 |
Also Published As
Publication number | Publication date |
---|---|
EP1941394A2 (en) | 2008-07-09 |
WO2007051106A3 (en) | 2007-06-14 |
US20060041424A1 (en) | 2006-02-23 |
WO2007051106A2 (en) | 2007-05-03 |
US9009590B2 (en) | 2015-04-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20080092337A (ko) | 자연어 문서들에서 인과 관계들의 인식을 위한 시맨틱프로세서 | |
KR101139903B1 (ko) | 자연어 문서들에서 전체 부분 관계들을 인식하는 시만틱 프로세서 | |
Agrawal et al. | Unsupervised emotion detection from text using semantic and syntactic relations | |
Savary et al. | Without lexicons, multiword expression identification will never fly: A position statement | |
JP2012520528A (ja) | 自然言語テキストの自動的意味ラベリングのためのシステム及び方法 | |
Abid et al. | Urdu word sense disambiguation using machine learning approach | |
Mohseni et al. | A Persian Part-Of-Speech Tagger Based on Morphological Analysis. | |
Miranda et al. | Named entity recognition using machine learning techniques | |
Zavrel et al. | Feature-Rich Memory-Based Classification for Shallow NLP and Information Extraction. | |
Al-Arfaj et al. | Arabic NLP tools for ontology construction from Arabic text: An overview | |
Srivastav et al. | Advances in Computational Linguistics and Text Processing Frameworks | |
Jebbor et al. | Overview of knowledge extraction techniques in five question-answering systems | |
Boltayevich et al. | Pos Taging of Uzbek Text Using Hidden Markov Model | |
Kamath et al. | Text and speech basics | |
Ouersighni | Robust rule-based approach in Arabic processing | |
Xia et al. | Distributed representation of Chinese collocation | |
Kaur et al. | Noise Estimation and Removal in Natural Language Processing | |
Badawi | The Effectiveness of Natural Language Processing (Nlp) as a Processing Solution and Semantic Improvement | |
Nazri1&2 et al. | An exploratory study of the Malay text processing tools in ontology learning | |
Nazri et al. | An exploratory study on malay processing tool for acquisition of taxonomy using FCA | |
Maynard et al. | Linguistic Processing | |
Sarr et al. | Part-Of-Speech Tagging in French: State-of-the-Art and Obstacles | |
Torjmen¹ et al. | Check for updates | |
Hegde et al. | Tagging Speech For Words In Low Resourced Monolingual Contexts of Sanskrit Shlokas | |
Биллиг et al. | Interpretation of the meaning of natural language phrases in problem-oriented systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
N231 | Notification of change of applicant | ||
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |