KR920003498B1 - 자연언어 처리방법 및 장치 - Google Patents

자연언어 처리방법 및 장치 Download PDF

Info

Publication number
KR920003498B1
KR920003498B1 KR1019850007969A KR850007969A KR920003498B1 KR 920003498 B1 KR920003498 B1 KR 920003498B1 KR 1019850007969 A KR1019850007969 A KR 1019850007969A KR 850007969 A KR850007969 A KR 850007969A KR 920003498 B1 KR920003498 B1 KR 920003498B1
Authority
KR
South Korea
Prior art keywords
word
words
semantic
dictionary
concept
Prior art date
Application number
KR1019850007969A
Other languages
English (en)
Other versions
KR860003560A (ko
Inventor
야스노리 가따야마
구니오 나까니시
히로시 요시우라
고우따로우 히라사와
Original Assignee
가부시기가이샤 히다찌 세이사꾸쇼
미다 가쓰시게
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 가부시기가이샤 히다찌 세이사꾸쇼, 미다 가쓰시게 filed Critical 가부시기가이샤 히다찌 세이사꾸쇼
Publication of KR860003560A publication Critical patent/KR860003560A/ko
Application granted granted Critical
Publication of KR920003498B1 publication Critical patent/KR920003498B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory

Abstract

내용 없음.

Description

자연언어 처리방법 및 장치
제1도는 본 발명의 1실시예에 관한 전체 구성도.
제2도는 입력문의 1예를 나타낸 도.
제3도는 형태소해석(形態素解析)수단의 처리수단을 설명하는 플로우챠트.
제4도는 구문(構文)해석수단의 처리수단을 설명하는 플로우챠트.
제5도는 단어계층사전의 1예를 나타낸 도.
제6도는 의미해석수단의 처리 수순을 설명하는 플로우챠트.
제7도는 구문목(構文木)의 1예를 나타낸 도.
제8도는 동의어(同義語)의 표시의 1예를 나타낸 도.
제9도는 본 발명의 다른 실시예에 관한 전체 구성도.
제10도는 정보 단말(端末)의 화면상태의 1예 및 지식베이스(상태 메모리)의 표현예를 나타낸 도.
제11도는 지식베이스(기능 메모리)의 1예를 나타낸 도.
제12도는 본 발명의 다른 실시예에 관한 처리 수순을 설명하는 플로우챠트이다.
본 발명은 일본어, 한국어, 중국어등의 자연적인 언어(자연언어)를 처리하는 자연언어 처리방법 및 장치에 관한 것으로 특히 사전에 등록되어 있지 않은 단어(이하, 미정의어(未定義語)라 한다)를 포함한 문장을 처리하는데 적합한 자연언어 처리방법 및 장치에 관한 것이다.
자연언어의 고도한 처리를 행할 경우, 일반적으로 문장의 구문해석을 행하고 이것에 의거하여 문장작성·편집을 행하고 있다. 그러나 자연언어 처리를 하기 위해서는 문장을 구성하는 가능성이 있는 단어가 모두 사전에 등록되어 있다고는 할 수 없고, 아무리 큰 사전을 준비하여 사전에 등록되어 있지 않은 미정의어가 문장중에 나타나는 일이 많다. 이 문제를 해결하는 하나의 수법으로서 일본국 특허청 공개 특허공보소화 58-175074호, 소화 58-175075호, 소화 58-175076호가 있다. 이들의 공보에 공개되어 있는 수법은 사전 찾기에 실패한 미정의어에 대하여 사전중에 존재하는 등록되어 있는 언어에 포함되는 동의어를 유자(user)에 입력시켜 그 대응으로부터 구문해석용 정보를 부가한다고 하는 것이다.
그러나 이 방법에서는 사전중에 등록되어 있는 동의어등을 사전에 유자가 기억하여 두거나 사전에 등록되어 있는 모든 단어의 리스트를 출력하고 그 중에서 유자 스스로가 동의어등을 추출(抽出)할 필요가 있으며, 고도의 처리를 행하는 경우에는 등록어 수가 증가하여 유자의 부담은 격증해 버려, 간이하며 또한 효과적으로 자연언어 처리를 행할 수가 없었다.
그러므로 상기 문제점을 감안하여 본 발명의 목적은 고도의 자연언어 처리를 행하는 장치에 있어서, 미정의어가 출현하였을 경우라도 장치로부터 동의어의 정보를 유자에 부여함으로써 한정된 기억용량의 사전으로 고도의 자연언어 처리를 행하는 실용적인 자연언어 처리방법 및 장치를 제공하는데 있다.
본 발명은 자연언어의 입력문자열중에 미정의어가 출현하였을 경우, 격(格)사전을 사용하여 단어의 의미적 개념을 결정하는 의미해석수단에서 미정의어의 상위개념을 구하고, 이 상위개념에 따라 단어를 계층화(階層化)시켜 개념에 해당되는 단어군을 추출하는 것이다.
또한 추출한 단어군을 표시장치에 표시하고 유자에 그중에서 동의어를 선택시키도록한 것을 특징으로 한다.
본 발명의 다른 특징은 자연언어의 입력문자열중에 미정의어가 출현하였을 경우 격사전을 사용하여 단어의 의미적개념을 결정하는 의미해석수단으로 미정의어의 상위개념을 구하고 상위개념에 따라 단어를 계층화시켜 등록되어 있는 단어계층사전을 사용하여 하위개념에 해당하는 단어군을 추출하고 추출된 하위개념의 단어군중에서 입력된 문자열의 의도(意圖)에 합치하는 단어를 추론(推論)하여 선택하는 추론수단에 의하여 동의어를 선택하고 미정의어를 선택한 동의어로 치환(置換)하도록 한 것이다.
이하, 본 발명의 1실시예를 도면에 의거하여 설명한다.
제1도는 본 발명의 전체구성을 나타낸 것이며, 유자는 입력장치(1)(예를 들면 키이보오드, 음성인식장치, 수서(手書)(hand Writing)문자입력장치등)에 의해 자연언어(예를 들면 일본어)를 처리장치(2)에 입력하고, 처리장치(2)는 자연언어에 관한 처리를 행하며, 그 내용이나 결과를 표시장치(3)에 표시하여 유자에 대하여 정보를 제공하는 질문응답 형식의 지적(知的) 가이던스(guidancd)시스템이다. 여기서 처리장치(2)는 표제어(lemma)사전(8), 접속관계사전(9), 활용어미(語尾)사전(10) 및 이들 사전의 정보를 사용하여 입력문을 단어로 분할하는 형태소해석수단(4), 문법규칙사전(11) 및 이 사전을 사용하여 입력문의 문법적인 구성을 구하는 구문해석수단(5), 격사전(12)과 단어계층사전(13) 및 이들의 사전을 사용하여 입력문의 의미를 추출하는 의미해석수단(6), 응답문의 몇개의 패턴을 준비한 문장(文章) 패턴사전(14) 및 이 사전을 사용하여 문장을 생성하는 문장생성수단(12)으로 구성된다.
다음에 제2a도에 나타낸 바와 같이
Figure kpo00001
ナ라고 하는 문자의 일본어의 문장이 입력문으로서 입력되었을 경우를 예로들어 각각의 처리에 대하여 상세히 설명한다.
(1) 형태소 해석
먼저 형태소해석은 표제어사전(8), 접속관계사전(9), 활용어미사전(10)을 사용하여 입력문의 문자열로부터 표제어가 존재하는지의 여부를 찾아내고 접속관계를 첵크하여 단어로 분할하는 것이다. 여기서 표 1, 표 2, 표 3에 각각 표제어사전(8), 접속관계사전(9), 활용어미사전(10)의 1예를 나타낸다.
[표 1]
표제어사전
Figure kpo00002
[표 2]
접속관계 사전
Figure kpo00003
[표 3]
활용어미 사전
Figure kpo00004
표제어사전(8)은 어드레스 표제어 품사 접속조건을 등록하고 있고 특히 접속조건은 표제어의 앞쪽, 뒤쪽의 접속관계를 등록하고 있다. 또 접속관계사전(9)은 상술한 표제어의 접속관계의 대응을 등록하고 있으며 예를 들면 앞쪽에 α3의 접속조건을 갖는 단어와 뒤쪽에 β6의 접속조건을 갖는 단어가 접속가능하면 "1"로서 등록되어 있다. 활용어미사전(10)은 표제어가 동사등의 경우 어미가 변화하므로 활용에 따른 어미를 사전에 동록하여 두는 것이며 어미가 변화하는 표제어(
Figure kpo00005
)에 해당하는 경우에는 표제어사전(8)의 뒤쪽의 접속조건을 "1"로서 등록해두고, 즉시 활용어미사전(10)을 참조할 수 있도록 되어 있다.
제3도를 사용하여 형태소 해석수단(4)의 처리 수순을 설명한다. 먼저 스탭(20)에서 다음의 처리에 필요한 플레그, 포인터, 스택류의 초기 설정을 한다. 다음에 스탭(21)에서 입력문자열의 포인터로부터 뒤의 문장열이 표제어 사전(8)에 존재하는지의 여부를 판단하고 그 판단 결과 표제어가 존재할 경우에는 스탭(24), 존재하지 않을 경우에는 스탭(22)을 실행한다. 표제어가 존재하지 않을 경우 스탭(2)에서는 별도해석용(別解用) 스택으로부터 단어를 1개 꺼내고(pick out) 꺼낸 단어의 앞의 단어와 접속의 가부를 구한다. 여기서 앞의 단어와 접속되지 않을 경우에 별도해석용스택이 비어 있으면 스탭(23)에서 포인터 이후의 입력문자열에 여러가지 길이의 미정의어를 가정하여 별도해석용 스택에 격납하고 포인터의 뒤의 문자열의 처리(스탭 21)로 복귀한다. 앞의 단어와 접속하지 않을 경우에 있어서 별도해석용 스택에 별도의 해석이 있으면 자기 자신의 스탭(22)을 재차 시행한다. 스텝(21)에서 찾아낸 표제어가 존재했을 경우에는 스탭(24)에 이행하고 스탭(21)단어중에 가장 긴 것을 꺼내고, 나머지를 별도해석용의 스택에 격납하고 꺼낸 단어와 입력문중에서 해당단어의 바로 앞에 나타난 단어의 접속의 여부를 접속관계사전(9)을 사용하여 첵크한다. 접속할 경우는 스탭(25)으로 이행하여 해석이 문장 끝까지 진행되었는지의 여부를 판단하고 접속하지 않는 경우도 스탭(22)을 실행한다. 또 스탭(22)에서 별도해석이 있고 앞의 단어와 접속할 경우에는 스탭(25)으로 이행한다.
스탭(25)에서 해석이 문장 끝까지 이르지 않았을 경우는 스탭(26)을 실행하고 포인터나 플랙의 갱신을 하는 후 후처리를 행하고 스탭(21)으로 복귀한다. 또 스탭(25)에서 문장 끝까지 이르렀을 경우는 스탭(27)에서 문장 끝까지 이른(도달한) 해석중에서 미정의어가 존재할 경우에 가장 짧은 후보(候補)를 미정의어로 선택하고 형태소 해석은 종료된다. 또한 스탭(22,24)에 있어서 접속의 여부를 첵크할때에 미정의어는 어떠한 단어와도 접속할 수 있는 것으로 한다.
다음에 상술한 제2a도에 나타난 예문이 입력되었을 경우의 형태소해석에 대하여 상세히 기술한다. 에문이 형태소해석수단(5)에 입력되었을 경우 초기 설정스탭(20)에서 포인터가 입력문의 선두, 즉 '
Figure kpo00006
'의 "
Figure kpo00007
"의 위치에 있고, "ミ"로부터 시작하는 단어를 사전에서 찾으면 표 1의 표제어 사전의 "
Figure kpo00008
"(어드레스 0007)와 "
Figure kpo00009
"(어드레스 0008)가 얻어지고 가장 긴 단어가 올바른 구절이라는 확률이 가장 높다고 하는 경험규칙에 의거한 규칙(최장 일치법)을 적용하여 "
Figure kpo00010
"를 구하고 그 앞쪽의 접속조건(α1)을 스탭(21)에서 구하고 스탭(24)에서 표 3의 접속관계 사전에서 문장 서두와 α1의 교점(交点)의 데이타를 취출한다. 여기서 교차점의 데이타는 "1"이고 접속조건을 만족하고 있으므로 스탭(25)을 거쳐 스탭(26)의 후처리에서 포인터는 "
Figure kpo00011
"의 "
Figure kpo00012
"를 나타낸다.
다음에 스탭(21)으로 복귀하고 사전을 찾아서 어드레스 0005의 격조사 "
Figure kpo00013
"를 얻는다. 마찬가지로 처리를 진행시킨면 "ニ"까지는 단어로 분할할 수 있으나 "ク"에서 막힌다. 막힌 다음에는 스탭(22,23)에서 "ク", "クウ", "クウハ", "クウハ…"와 같이 미정의어를 결정하여 별도 해석 스택에 격납하고 맨 먼저 "ク"를 미정의어로서 선택하고 "ウハ…"이하의 단어 꺼내기를 행하지만 실패하고, "クウ"를 미정의어로 하여 다시 그 다음을 단어분할하지만 이것도 실패한다. 이와 같이 하여 "クウハクイキ"라고 하는 미정의어를 취출하면 스탭(25)에 이행하여 그 이후의 단어 꺼내기가 문장 끝까지 이르러 미정의어의 단어를 꺼낼수가 있다(제2b도).
여기서 표 3의 활용어미 사전의 사용법을 기술한다. 즉, "サクセイ"라는 단어가 스탭(21)에서 꺼내어진 시점에서 サ변동사(サ행 변격을 활용동사를 말한다)임을 알 수 있고 그 활용어미로서 표 3의 미연형(未然形) "ミ"연용형 "シ"의 2종류의 후보가 구해진다. 이 시점에서는 어는 것인지 결정할 수 없으므로 2개의 후보를 스택에 격납하고 다음의 단어 "
Figure kpo00014
"를 끌어낸 시점에서 "
Figure kpo00015
"의 앞쪽의 접속조건(α3)과 상기 미연형 "シ"이 뒤쪽 접속조건(β)의 교점을 표 2의 접속관계사전으로부터 구하고 그곳이 "0"이기 때문에 미연형은 접속조건을 만족시키지 못하고 한편 상기 연용형의 "シ"의 뒤쪽 접속조건(β6)은 접속관계 사전의 α3의 교점이 "1"이므로 "サクセイシ"는 연용형으로서 원하는 조동사 "
Figure kpo00016
"가 접속된 것을 알 수 있다.
이와 같이 끄집어낸 결과 제2c도에 나타낸 바와 같이 단어의 문자열을 얻을 수 있고 미정의어로서 "
Figure kpo00017
"를 얻는다.
(2) 구문 해석
형태소 해석수단(4)에서 얻어진 문자열은 다음 처리 즉 구문 해석수단(5)의 입력이 된다. 구문해석수단(5)은 문법규칙사전(11)을 사용하여 적용할 수 있는 문법규칙과 입력된 단어가 해당 문법규칙의 어느 역할을 담당하고 있는가를 구하는 처리이다. 여기서 표 4에서 문법규칙사전(11)의 1예를 나타낸다.
[표 4]
Figure kpo00018
문법규칙사전(11)은 문법의 규칙을 체계화 하여 등록되어 있고 예를 들면 형태소 해석 결과 "
Figure kpo00019
"와 "ノ"가 꺼내어졌을 경우 규칙의 번호(5)의 우변의 명사+조사에 해당되고 좌편을 참조하여 명사구임을 알수 있도록 되어 있다.
제4도를 사용하여 구문해석수단(5)의 처리 수순을 설명한다. 먼저 스탭(30)에서 구문해석에 필요한 변수 스택류의 초기설정을 한다. 다음에 스탭(31)에서 스택의 선두의 구(句)와 입력문의 선두의 단어의 문법정보(표제어사전 8에 존재)의 관계가 같은 것을 표 4에 나타낸 문법규칙사전(11)의 우변에서 찾아 그 규칙이 존재하는지의 여부를 판단하고 규칙이 사전에 존재할 경우는 스탭(32)을, 규칙이 사전에 존재하지 않을 경우는 스탭(33)을 실행시킨다. 규칙이 사전에 존재할 경우 스탭(32)으로 이동하여 스텝(31)에서 찾아낸 규칙이 복수개 있을 경우에 별도해석용 데이타에 그 규칙을 격납하고, 그들 규칙중에서 1개의 규칙에 착안하여 스택의 선두의 구(句)와 입력문의 선두를 합성하고 그 문법적인 조건을 해당 문법규칙 좌변을 할당하여 입력문의 선두의 단어( 이 경우는 구)로 한다. 단, 미정의어가 존재할 경우 미정의어의 문법조건이 결정될 수 없기 때문에 어떠한 단어와도 접속될 수 있는 것이라고 가정한다. 규칙이 사전에 존재하지 않을 경우 스탭(33)에서 입력문중의 선두의 구를 스택에 스택킹(stacking)처리를 행하고 스탭(34)에서 스택에 스택킹한 후의 입력문이 문장 끝에 이르고 있는 지의 여부를 판단하여 문장 끝이 아니면 스탭(31)을, 문장 끝이라면 스탭(35)을 실행시키는 처리를 행한다. 스탭(35)은 스탭(31)에서 별도해석이 존재하였는지의 여부를 판단하는 스탭으로서 별도해석이 존재하면 스탭(36)을, 별도해석이 없다면 구문해석을 종료시키는 처리이다. 상기 스탭(36)은 스탭(32)에서 보관한 별도해석의 후보의 1개와 스탭(31)까지의 해석 결과의 데이타를 세트하고 별도해석의 후보가 발견된 처리 다음부터 처리를 속행할 수 있도록 하고 있다.
다음에 이 처리의 동작을 1예를 들어 설명한다. 입력문으로 제2b도에 나타난 문장과 부속의 문법정보가 입력된다. 스택은 맨처음 비어 있으므로 스탭(31,33)이 실행되어 "
Figure kpo00020
"가 스택에 보관된다. 다음에 스탭(31)에서 입력문 "ノ"와 "
Figure kpo00021
"의 접속관계를 표 4의 문법규칙에서 구하면 규칙번호(15)의 우변의 명사+조사를 적용할 수 있다는 것을 알 수 있고 한개의 명사구로서 스택에 보관된다. 다음에 "
Figure kpo00022
"와는 상기의 명사구는 접속되지 않으므로 상기 명사 "
Figure kpo00023
"가 스택에 스택킹된다.
이와 같이 "
Figure kpo00024
"와 "ニ"는 명사구, 미정의어 "
Figure kpo00025
"는 명사라고 가정하면 "
Figure kpo00026
"와 "ヲ"는 명사구 "
Figure kpo00027
"는 술어이므로 규칙의 번호(2)의 우변을 적용하여 절(節)임을 알 수 있다. 또 규칙의 번호(4)로부터 명사구+절(우변)은 절(좌변)이기 때문에 "
Figure kpo00028
""ヲ""
Figure kpo00029
"는 절이라고 판단된다. 이와 같이 하여 문장 끝까지 해석하고 규칙의 번호 1의 절+"end 마크"에 의해 문장인 것을 알 수 있어 해석은 성공한다.
(3) 의미해석
상기 구문해석의 결과를 받은 의미해석수단(6)은 격사전(12)을 사용하여 문법조건으로부터 미정의어의 의미의 상위개념을 구하고 그 상위개념을 다시 계층화한 단어계층사전(13)을 사용하여 의미해석을 행하는 것이다. 여기서 표 5에 격사전(12)의 1예를 제5도에 단어계층사전(13)의 1예를 나타낸다.
[표 5]
Figure kpo00030
격사전(12)은 어떤 단어(여기서는
Figure kpo00031
)의 문법조건에 대하여 의미의 개념을 대응시켜서 등록하고 있고 예를 들면「
Figure kpo00032
」에 「명사 +が」가 접속되어 있으면 그 명사의 개념으로서는 동일임을 알 수 있도록 되어 있다, 여기서 생략시의 값이라는 것은 후술하겠으나 생략 가능한 것에 대하여 적용시켜 의미해석을 행하는 경우의 값을 말하는 것이다. 또 제5도에 나타낸 단어계층사전(13)은 격사전(12)의 개념을 상위개념하여 계측구성으로 하여 하위개념의 단어가 등록되어 있다.
제6도를 참조하여 의미해석수단(6)의 처리 수순을 설명한다. 먼저 스탭(40)에서 구문해석수단(5)의 출력으로부터의 미정의어를 제외하고 우선도가 높은 단저(예를 들면 술어를 구성하는 동사)를 취출하고 표 5에 나타낸 격사전(12)을 사용하여 단어의 정보를 구한다.
다음에 스탭(41)에서 입력분의 구로부터 상기 스탭(40)에서 구한 단어의 문법 조건을 만족하는 것을 선택하고 구문목(構文木)의 슬롯(제7도의 틀로 둘러싸인 개념)에 대입한다. 그리고 스탭(42)에서 완성된 구문목이 의미조건을 만족하는지의 여부를 조사하고 미정의어가 존재한다면 스탭(43)을, 의미조건이 성립되지 않으면 스탭(44)을 실행하고 그 이외의 경우에는 RETURN시킨다. 스탭(43)에서는 미정의어가 매꾸어야 할 슬롯의 개념을 구하고 단어계층사전(13)으로부터 그 하위 개념을 구하여 문장생성용 데이타로 한다. 스탭(41)에서는 의미해석에서 실패하였을 경우 구문해석의 별도 해석을 구할 수 있는 처리로 되어 있다.
이 동작을 상술한 예를 사용하여 설명하면 술어를 구성하는 동사가 "
Figure kpo00033
"라 하는 것이 스탭(40)에서 판명하여 표 5의 격사전을 취출한다. 이 격사전의 문법규칙의 항목에 합치하는 구를 구문해석수단 5의 출력으로부터 취출하여 적용시킨다. 예를 들면 동작주(主)에 상당하는 구「명사 +が」이 문장중에 없으므로 생략되어 있다고 간주하고 생략시의 값(default value)의 "유자"를 적용시킨다. 다음에 장소격(格)은 필수격이므로 생략할 수 없고 대응하는 어구 "
Figure kpo00034
" + "に"에 해당되며 목적격은 "
Figure kpo00035
"+"を"임을 알 수 있다. 다음에 스탭(42)에서는 "
Figure kpo00036
"는 위치를 나타내고 있는가를 조사한다. 이 경우 위치를 나타내고 있기 때문에 의미조건은 만족된다. "
Figure kpo00037
"는 미정의어이기 때문에 의미조건은 만족할 수 없으나 만족할 경우의 의미조건으로서 「표시물」의 개념이라는 것을 알 수 있다. 이와 같은 개념을 정리한 것이 제5도의 단어의 계층 구성의 1예에서 "
Figure kpo00038
"는 표시물의 하위개념이고, 「
Figure kpo00039
」~「문자」의 1종인 것을 알 수 있다. 이와 같이 하여 구성된 구문목을 제7도에 나타낸다.
(4) 문장생성
문장생성수단(7)은 의미해석수단(6)의 결과를 받아서 미정의어를 질문패턴을 문장패턴사전(14)으로부터 호출하고 그 속에 상기 의미해석수단(6)에서 얻은 계층구조의 단어를 메워넣고, 그것을 제8도에 1예를 나타낸 바와 같은 질문 문장으로서 표시하고 유자에 동의어를 선택시키는 것이다.
유자가 동의어를 선택하면 사전중의 동의어의 여러가지 정보를 이용하여 다시 해석을 진행해 가는 것이다.
이와 같은 구성으로 하면 제2a도에 나타낸 바와 같은 예문이 입력되어도 미정의어 "
Figure kpo00040
"가 단어로서 취출되어 제8도와 같이 표시장치(3)에 표시된 단어중에서 동의어를 유자에 선택시킨다. 유자는 "
Figure kpo00041
白"이라는 단어를 입력하면 시스템은 "
Figure kpo00042
白"이라는 단어의 각종 정보를 이용하여 이후의 해석을 진행시키는 것이다.
그 결과 종래는 동의어가 존재하는지의 여부가 불분명할 경우에는 단어를 넣어서 없을때에 다시 바꾸어 넣지 않으면 안되었으나 미정의어의 개념에 속하는 단어가 표시되고 이들 단어는 만일 동의어가 사전중에 등폭되어 있으면 반드시 표시된다. 따라서 유자에 있어서도 매우 사용하기 쉬운 시스템이 되는 것이다.
다음에 본 발명의 다른 실시예를 제9도 내지 제12도를 사용하여 설명한다. 상술한 제1도에 나타낸 실시예와 다른 점은 제9도에 나타낸 바와 같이 대상(100), 지식베이스 처리수단(101), 지식베이스(102), 추론수단(103)을 추가한 것이다. 여기서 대상(100)은 화제를 한정하기 위한 것이고 지식베이스(102)을 작성, 갱신하는 지식베이스 처리수단(101)을 거쳐 지식베이스(102)에는 상태변화에 추수(追隨)하여 정보를 격납한다. 한편 추론수단(103)에서는 앞의 실시예에서 기술한 의미해석수단(6)의 출력인 구문목(fig 7)을 입력하고 지식베이스(102)를 참조하여 미정의어의 동의어를 자동적으로 치환하여 사용자에게 표시하는 것이다.
여기에서는 대상(100)의 1예로서 「정보단말 시스템」에 관한 자연언어를 처리하는 경우에 대하여 설명한다.
여기서 「정보단말 시스템」이란 인간과 콤퓨터와의 정보에 관한 인터페이스를 갖는 장치를 말한다. 즉 지식베이스를 사용하여 추론을 행함에 있어 화제의 대상을 정보단말 시스템의 구체적 조작방법이나 처리방법에 한정시켜 언어처리를 행하는 1예를 나타낸 것이다. 물론 대상(100)은 「정보단말 시스템」에 한정되는 것은 아니고 다른 화제의 대상에 대해서도 자연언어 처리는 가능하다.
정보단말과 온라인으로 결합된 지식베이스 처리수단(101)은 그 지식베이스(102)를 표현하는 방법으로서 술어논리나 프레임등의 여러가지의 표현이 있으나 예를 들면 여기서는 제10a도에 나타낸 바와 같은 정보 단말의 화면상태를 표현하는데 있어 제10b도인 표현을 하면 지식베이스 처리수단(101)은 정보단말의 내부표현을 지식베이스 표기법으로 변환하는 데이타 변환 처리라고 말할 수 있다. 여기서 이 제10b도는 장소(1)라는 이름이 붙은 정보가 장소의 종류에 속하고 그 위치는 우하의 장소이고 그 곳에 문장(1)이라는 이름을 붙인 문장이 존재한다고 하는 의미를 나타내고 있다. 마찬가지로 장소(2)는 장소라고 하는 종류의 정보를 나타내고 그 위치는 좌상(左上)의 장소에 있고 도면(1)이라는 이름의 도면이 존재한다는 것을 의미한다.
이와 같은 정보는 유자의 정보단말의 조작할때마다 화면표시의 내용이 변화하고 예를 들면 제10a도의 좌상(左上)의 도면을 소거하면 제10b도의 (장소 2(……)(……)의 항목이 없어지도록 구성한다.
한편, 지식베이스(102)에는 상술한 바와 같이 제10b도에서 나타낸 정보단말의 상태변화에 추수(追隨)하여 변화하는 정보(그 정보의 집합을 상태메모리리고 한다) 외에 제11도에 나타낸 바와 같이 정보단말의 기능을 나타내는 기능메모리가 포함된다. 이 메모리는 각 어드레스에 대하여 1) 동사 2) 지명령 3) 전제조건 4) 표시위치(goal)로 구성한다. 2) 지명령은 정보단말의 상태가 키이조작 할때마다 변화하는 것에 착안하여 그 조작에 대응하는 지명령을 기억하는 것이다. 3) 전제조건은 그 키이조작을 실행하기 위하여 필요한 정보단말의 전제가되는 상태를 기억하는 것이다. 4) 표시위치(goal)는 키이조작을 실행한 후 새로 생성되는 상태를 기억하는 것이다. 그리고 1) 동사는 입력문중의 동사(단, 이 동사도 동의어등은 일괄하여 상위개념등으로 통합한다)를 기억하는 것이며 입력문중에서 키이조작을 나타내는 동작인 2) 지령과 대응이 취해지고 있다.
또한 이들 지식베이스의 표현법을 이하 프레임이라고 한다. 또 지식베이스의 기능메모리는 일반적인 표현을 하고 있기 때문에 #가 붙은 이름은 변수이고 이들은 입력문이나 지식베이스의 상태메모리와 대응이 취해졌을때에 그 대응이 취해진 정수(定數)와 바인드(bind)한다.
상술한 실시예에 기술한 처리를 행하면 의미해석의 출력은 구문목(제7도)이다. 이 구문목을 받아 추론수단(103)은 제12도와 같은 처리를 실행한다.
여기서 추론수단(103)은 의미해석수단(6)의 출력인 구문목이 지식베이스 기술(記述)의 프레임표현과 다르기 때문에, 표 7에 나타낸 구문목 변환규칙사전, 표 8에 나타낸 문형결정사전을 사용한다.
[표 7]
Figure kpo00043
[표 8]
Figure kpo00044
처리 수순은 제12도의 스탭(110)에서 표 7에 나타낸 구문목 변환규칙사전을 사용하여 구문목을 프레임표현으로 변환하고, 스탭(120)에서 상기 프레임중의 미정의어를 변수로 한다.
다음에 제7도의 구문목에서 이 문장은 소망 즉, 정보단말의 조작법의 질문이라는 것을 알 수 있으므로 스탭(130)에서 이 정보와 표 8에 나타낸 문형결정사전을 사용하여 문장을 판단하고 다음에 실행하는 처리스탭(140)으로 하고 스탭(140)에서 동사로부터 지령을 선택한다. 이 지령을 실행하기 위해서 스탭(150)에서 정보단말이 만족하지 않으면 안될 전제조건과, 정보단말의 상태와의 대응의 변수 속박을 행하고 정합(整合)이 취해지는 지령을 선택한다.
스탭(160)에서는 선택한 지령의 요시위치상태와 구문목의 내용과의 대조와 변수 속박을 행하여 정합을 취하고 스탭(170)에서 상기 스탭(150,160)에서 변수와 정수(예를 들면 장소 1,도 1,문장 etc)의 바인딩(binding)의 결과를 취출한다.
본 처리에 들어가기까지는 미정의어라고 하는 것은 무엇을 가리키는 것인지 결정할 수 없기 때문에 변수로하고 있으나 스탭(170)의 실행에서 미정의어의 변수에 바인딩(binding)된 정수가 미정의어의 동의어가 된다.
여기서 대응과 변수 속박의 방법은 LISP by Patrcik H. Winstion & Berthold K. P. Horn(Addison-Wesley Publishing Company, Inc., Reading, Mass., U. S. A)에 상세히 기술되어 있다.
이 처리를 예제(例題)로 사용하여 설명하면 제7도의 구문목은 (
Figure kpo00045
(종류 (동작))과 (
Figure kpo00046
(존재 (
Figure kpo00047
)))의 논리합(OR)으로 표 7의 구문목 변환규칙 사전에 의해 스탭(110), (120)에서 변형된다. 여기서 #표시는 변수임을 나타낸다. 표 8의 문형결정사전으로부터 문장의 형은 소망의 조동사로부터 HOW 형(목표상태를 기술하고 그것을 실현하는 수단을 질문하는 문장)이라고 인정할 수 있다. 스탭(120)의 프레임의 제1항목의 동시를 의미하는(
Figure kpo00048
(종류 (동작))을 제11도의 지식베이스(기능메모리)에서 탐색하면 "스페이스"지령과 "작도"지령과 정합이 취해진다. 다음에 현재의 상태인 제10b도의 상태 메모리(이것도 지식베이스에 포함되어 있다)와 전제조건의 정합을 취한다. 전제조건은 # 장소명에 "
Figure kpo00049
"를 대입하면 "스페이스" 지령과는 정합이 취해지고 "작도"지령과는 정합이 취해지지 않음을 스탭(150)에서 판명되고 입력문장에서 직접 표현된 상태(
Figure kpo00050
(존재 (
Figure kpo00051
)))와 제11도의 표시 위치에 스탭(150)에서 구한 변수의 값을 대입한 (
Figure kpo00052
(존재 (여백)))과 정합을 취하는 스탭(160)을 실행하고
Figure kpo00053
와 여백이 속박된다. 그 결과
Figure kpo00054
는 여백의 동의어라는 것이 판명된다. 문장생성수단(7)에서는
Figure kpo00055
는 여백으로 치환하여 해석할 것을 사용자에게 표시한다.
본 발명의 다른 실시예에 의하면 자동적으로 동의어가 선택가능하게 됨을 나타낸다.
본 발명의 다른 실시예에 있어서는 「정보단말 시스템」에 대하여 기술하고는 있으나 「정보단말 시스템」뿐만 아니라 다른 시스템에 대하여도 적용할 수 있다는 것은 본 실시예로부터 자명하다.
본 발명에 의하여 미정의어가 출현했을 경우에도 동의어의 정보가 추출되어 사용자에게 부여되므로 사용자가 동의어를 모두 기억할 필요가 없어지며 한정된 기억용량의 사전으로 사용자에 있어서도 실용적이며 또한 효율적인 자연언어 처리를 행할 수가 있다.

Claims (7)

  1. 입력된 자연언어의 문자열을 단어로 분할하는 형태소 해석수단과, 단어의 배열이 문법규칙에 합치하는 지의 여부를 판단하는 구문해석수단을 갖고 문자열의 처리를 행하는 자연언어 처리장치에 있어서, 문법규칙에 합치된 단어간의 의미적인 역할을 등록하는 격(格)사전과 상기 구문해석수단으로부터의 출력을 격사전을 사용하여 단어의 의미적개념을 결정하는 의미해석수단과, 단어의 의미적개념에 따라 상위로부터 하위로 단어를 분류하여 등록하는 단어계층사전을 설치하고 미정의어를 포함하는 문자열이 입력되었을 경우, 의미해석수단으로 미정의어의 의미적개념을 구하고, 단어계층사전으로부터 미정의어의 의미적개념의 하위개념에 해당하는 단어군을 추출하도록 한 것을 특징으로 하는 자연언어 처리장치.
  2. 제1항에 있어서, 의미해석수단은 구문해석수단의 출력으로부터 미정의어를 제외한 우선도가 높은 단어를 취출하고 격사전을 사용하여 미정의어의 의미적개념을 구하는 것을 특징으로 하는 자연언어 처리장치.
  3. 제2항에 있어서, 우선도가 높은 단어에 술어를 구성하는 동사를 사용한 것을 특징으로 하는 자연언어 처리장치.
  4. 입력된 자연언어의 문자열을 단어로 분할하는 형태소 해석수단과, 단어의 배열이 문법규칙에 합치하는지의 여부를 판단하는 구문해석수단과, 문자열의 처리내용 및 결과를 표시장치를 가지며 문자열의 처리를 행하는 자연언어 처리장에 있어서, 문법규칙에 합치된 단어간이 의미적 역할을 등록하는 격사전과, 상기 구문해석수단으로부터의 출력을 격사진을 사용하여 단어의 의미적개념을 결정하는 의미해석수단과, 단어의 의미적개념에 따라 상위로부터 하위로 단어를 분류하여 등록하는 단어계층사전을 설치하고 미정의어를 포함하는 문자열이 입력되었을 경우, 의미해석수단으로 미정의어의 의미적개념을 구하고 단어계층사전에서 미정의어의 의미적개념의 하위개념에 해당하는 단어군을 추출하고 추출된 하위개념의 단어군을 상기 표시장치에 표시하고 표시된 단어군중에서 동의어를 선택시키도록한 것을 특징으로 하는 자연언어 처리장치.
  5. 입력된 자연언어의 문자열을 단어로 분할하는 형태소해석수단과, 단어의 배열이 문법규칙에 합치하는지의 여부를 판단하는 구문해석수단을 가지며 문자열의 처리를 행하는 자연언어 처리장에 있어서, 문법규칙에 합치된 단어간의 의미적인 역할을 등록하는 격사전과, 상기 구문해석수단으로부터의 출력을 격사진을 사용하여 단어의 의미적개념을 결정하는 의미해석수단과, 단어의 의미적개념에 따라 상위로부터 하위로 단어를 분류하여 등록하는 단어계층사전과, 단어계층사전에 하위개념으로서 등록되어 있는 단어군중에서 입력된 문자열의 의도에 합치하는 단어를 추론하여 선택하는 추론수단을 설치하고 미정의어를 포함하는 문자열이 입력되었을 경우 의미해석수단으로 미정의어의 의미적개념을 구하고 단어계층사전으로부터 미정의어의 의미적개념의 하위개념에 해당하는 단어군을 추출하고 추출수단에 의해 추출한 하위개념의 단어군중에서 입력된 문자열의 의도에 합치하는 동의어를 선택하고 미정의어를 선택한 동의어로 치환하도록 한 것을 특징으로 하는 자연언어 처리장치.
  6. 제5항에 있어서, 입력된 자연언어를 사용하여 정보단말 시스템의 조작을 행하는 것을 특징으로 하는 자연언어 처리장치.
  7. 사전에 등록되어 있지 않은 미정의어를 포함하는 자연언어의 입력문자열을 단어별로 분할하는 형태소해석 스탭과, 단어의 배열이 문법규칙에 합치되는지의 여부를 판단하는 구문해석 스탭을 가지며 입력문자열로부터 미정의어를 추출하여 처리를 행하는 자연언어 처리방법으로서, 적어도 구문해석으로 얻어진 출력으로부터 단어사이의 의미적 역활을 등록하는 격사전을 사용하여 미정의어의 의미적개념을 구하는 스탭과, 단어를 상위로부터 하위의 개념에 따라 등록하는 단어계층사전을 사용하여 미정의어 의미적개념의 하위에 해당하는 단어군을 추출하는 스탭을 가지는 것을 특징으로 하는 자연언어 처리장치.
KR1019850007969A 1984-10-29 1985-10-28 자연언어 처리방법 및 장치 KR920003498B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP84-227251 1984-10-29
JP59227251A JPS61105671A (ja) 1984-10-29 1984-10-29 自然言語処理装置

Publications (2)

Publication Number Publication Date
KR860003560A KR860003560A (ko) 1986-05-26
KR920003498B1 true KR920003498B1 (ko) 1992-05-01

Family

ID=16857884

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019850007969A KR920003498B1 (ko) 1984-10-29 1985-10-28 자연언어 처리방법 및 장치

Country Status (6)

Country Link
US (1) US5109509A (ko)
EP (1) EP0180888B1 (ko)
JP (1) JPS61105671A (ko)
KR (1) KR920003498B1 (ko)
CA (1) CA1235817A (ko)
DE (1) DE3587993T2 (ko)

Families Citing this family (184)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5696916A (en) * 1985-03-27 1997-12-09 Hitachi, Ltd. Information storage and retrieval system and display method therefor
DE3616011A1 (de) * 1985-05-14 1986-11-20 Sharp K.K., Osaka Uebersetzungsgeraet
DE3615972A1 (de) * 1985-05-14 1986-11-20 Sharp K.K., Osaka Zweisprachiges uebersetzungssystem mit eigen-intelligenz
US6443840B2 (en) * 1986-03-10 2002-09-03 Response Reward Systems, L.C. Evaluation of responses of participatory broadcast audience with prediction of winning contestants; monitoring, checking and controlling of wagering, and automatic crediting and couponing
JP2654001B2 (ja) * 1986-05-08 1997-09-17 株式会社東芝 機械翻訳方法
JPS62272359A (ja) * 1986-05-20 1987-11-26 Sharp Corp 機械翻訳装置
JPS6310265A (ja) * 1986-06-30 1988-01-16 Sharp Corp 翻訳装置
US5225981A (en) * 1986-10-03 1993-07-06 Ricoh Company, Ltd. Language analyzer for morphemically and syntactically analyzing natural languages by using block analysis and composite morphemes
NL8702359A (nl) * 1986-10-03 1988-05-02 Ricoh Kk Taal analyse inrichting.
GB2197510A (en) * 1986-10-27 1988-05-18 Sharp Kk Translation apparatus
JPS63121977A (ja) * 1986-11-11 1988-05-26 Fujitsu Ltd 機械翻訳装置
GB2199170A (en) * 1986-11-28 1988-06-29 Sharp Kk Translation apparatus
JPH0827797B2 (ja) * 1986-12-01 1996-03-21 松下電器産業株式会社 構文解析装置
US4890230A (en) * 1986-12-19 1989-12-26 Electric Industry Co., Ltd. Electronic dictionary
JPH0731677B2 (ja) * 1987-09-29 1995-04-10 シャープ株式会社 文書作成・校正支援装置
JPH01314373A (ja) * 1988-06-15 1989-12-19 Hitachi Ltd 機械翻訳システムにおける訳語選択方式
US5111398A (en) * 1988-11-21 1992-05-05 Xerox Corporation Processing natural language text using autonomous punctuational structure
US5276616A (en) * 1989-10-16 1994-01-04 Sharp Kabushiki Kaisha Apparatus for automatically generating index
JPH03222065A (ja) * 1990-01-26 1991-10-01 Sharp Corp 機械翻訳装置
US5255386A (en) * 1990-02-08 1993-10-19 International Business Machines Corporation Method and apparatus for intelligent help that matches the semantic similarity of the inferred intent of query or command to a best-fit predefined command intent
FR2660085A1 (fr) * 1990-03-20 1991-09-27 Philips Electronique Lab Dispositif de traitement de donnees et procede pour selectionner des mots de donnees contenus dans un dictionnaire.
JP3266246B2 (ja) * 1990-06-15 2002-03-18 インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン 自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法
US5477451A (en) * 1991-07-25 1995-12-19 International Business Machines Corp. Method and system for natural language translation
US5488725A (en) * 1991-10-08 1996-01-30 West Publishing Company System of document representation retrieval by successive iterated probability sampling
US5265065A (en) * 1991-10-08 1993-11-23 West Publishing Company Method and apparatus for information retrieval from a database by replacing domain specific stemmed phases in a natural language to create a search query
US5541836A (en) * 1991-12-30 1996-07-30 At&T Corp. Word disambiguation apparatus and methods
US5523946A (en) * 1992-02-11 1996-06-04 Xerox Corporation Compact encoding of multi-lingual translation dictionaries
US5268840A (en) * 1992-04-30 1993-12-07 Industrial Technology Research Institute Method and system for morphologizing text
US5390281A (en) * 1992-05-27 1995-02-14 Apple Computer, Inc. Method and apparatus for deducing user intent and providing computer implemented services
US5434777A (en) * 1992-05-27 1995-07-18 Apple Computer, Inc. Method and apparatus for processing natural language
US5477447A (en) * 1992-05-27 1995-12-19 Apple Computer, Incorporated Method and apparatus for providing computer-implemented assistance
JPH0728815A (ja) * 1993-02-18 1995-01-31 Matsushita Electric Ind Co Ltd 構文解析装置
US5448474A (en) * 1993-03-03 1995-09-05 International Business Machines Corporation Method for isolation of Chinese words from connected Chinese text
US5359514A (en) * 1993-08-03 1994-10-25 International Business Machines Corporation Method and apparatus for facilitating comprehension of on-line documents
US5523945A (en) * 1993-09-17 1996-06-04 Nec Corporation Related information presentation method in document processing system
US5546573A (en) * 1993-10-27 1996-08-13 International Business Machines Corporation Specification of cultural bias in database manager
US5510981A (en) * 1993-10-28 1996-04-23 International Business Machines Corporation Language translation apparatus and method using context-based translation models
WO1995012173A2 (en) * 1993-10-28 1995-05-04 Teltech Resource Network Corporation Database search summary with user determined characteristics
US5692176A (en) * 1993-11-22 1997-11-25 Reed Elsevier Inc. Associative text search and retrieval system
KR100304654B1 (ko) * 1993-11-30 2001-11-22 윤종용 한국어문서해석방법및장치
ZA948426B (en) * 1993-12-22 1995-06-30 Qualcomm Inc Distributed voice recognition system
JPH07182465A (ja) * 1993-12-22 1995-07-21 Hitachi Ltd 文字認識方法
US6594628B1 (en) 1995-09-21 2003-07-15 Qualcomm, Incorporated Distributed voice recognition system
US5682538A (en) * 1994-08-12 1997-10-28 Wall Data Incorporated Automatic adaptive computer screen generation
US6993471B1 (en) * 1995-11-13 2006-01-31 America Online, Inc. Integrated multilingual browser
US5987404A (en) * 1996-01-29 1999-11-16 International Business Machines Corporation Statistical natural language understanding using hidden clumpings
JP2987099B2 (ja) * 1996-03-27 1999-12-06 株式会社日立国際ビジネス 文書作成支援システム及び用語辞書
US5878385A (en) * 1996-09-16 1999-03-02 Ergo Linguistic Technologies Method and apparatus for universal parsing of language
US6144968A (en) * 1997-03-04 2000-11-07 Zellweger; Paul Method and apparatus for menu access to information objects indexed by hierarchically-coded keywords
DE19740793C2 (de) * 1997-09-17 2003-03-20 Bosch Gmbh Robert Verfahren zur Beschichtung von Oberflächen mittels einer Anlage mit Sputterelektroden und Verwendung des Verfahrens
US6411926B1 (en) 1999-02-08 2002-06-25 Qualcomm Incorporated Distributed voice recognition system
US6324509B1 (en) 1999-02-08 2001-11-27 Qualcomm Incorporated Method and apparatus for accurate endpointing of speech in the presence of noise
US6574596B2 (en) 1999-02-08 2003-06-03 Qualcomm Incorporated Voice recognition rejection scheme
WO2000062193A1 (en) 1999-04-08 2000-10-19 Kent Ridge Digital Labs System for chinese tokenization and named entity recognition
US6401061B1 (en) * 1999-05-13 2002-06-04 Yuri L. Zieman Combinatorial computational technique for transformation phrase text-phrase meaning
JP3266586B2 (ja) * 1999-07-07 2002-03-18 インターナショナル・ビジネス・マシーンズ・コーポレーション データ分析システム
JP2001125897A (ja) * 1999-10-28 2001-05-11 Sony Corp 言語学習装置およびその方法
US6834280B2 (en) * 2000-02-07 2004-12-21 Josiah Lee Auspitz Systems and methods for determining semiotic similarity between queries and database entries
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US7792676B2 (en) * 2000-10-25 2010-09-07 Robert Glenn Klinefelter System, method, and apparatus for providing interpretive communication on a network
US6665642B2 (en) 2000-11-29 2003-12-16 Ibm Corporation Transcoding system and method for improved access by users with special needs
US7013263B1 (en) 2001-10-25 2006-03-14 Mindfabric, Inc. Online interaction processing
US6685188B2 (en) * 2001-10-25 2004-02-03 Rehbein Juerg Method and apparatus for performing a transaction without the use of spoken communication between the transaction parties
US20030157470A1 (en) * 2002-02-11 2003-08-21 Michael Altenhofen E-learning station and interface
US20040012643A1 (en) * 2002-07-18 2004-01-22 August Katherine G. Systems and methods for visually communicating the meaning of information to the hearing impaired
US7349839B2 (en) * 2002-08-27 2008-03-25 Microsoft Corporation Method and apparatus for aligning bilingual corpora
WO2005124599A2 (en) * 2004-06-12 2005-12-29 Getty Images, Inc. Content search in complex language, such as japanese
KR100682897B1 (ko) * 2004-11-09 2007-02-15 삼성전자주식회사 사전 업데이트 방법 및 그 장치
US9002725B1 (en) 2005-04-20 2015-04-07 Google Inc. System and method for targeting information based on message content
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US7949714B1 (en) * 2005-12-05 2011-05-24 Google Inc. System and method for targeting advertisements or other information using user geographical information
US8601004B1 (en) * 2005-12-06 2013-12-03 Google Inc. System and method for targeting information items based on popularities of the information items
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
AU2008259833B2 (en) * 2007-06-01 2012-11-08 Getty Images, Inc. Method and system for searching for digital assets
US8996433B2 (en) * 2007-10-11 2015-03-31 Steven Ginzberg Automated natural language formula translator and data evaluator
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
WO2010067118A1 (en) 2008-12-11 2010-06-17 Novauris Technologies Limited Speech recognition involving a mobile device
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US20120309363A1 (en) 2011-06-03 2012-12-06 Apple Inc. Triggering notifications associated with tasks items that represent tasks to perform
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
JP5921716B2 (ja) * 2012-11-30 2016-05-24 三菱電機株式会社 意図推定装置および意図推定方法
CN113470640B (zh) 2013-02-07 2022-04-26 苹果公司 数字助理的语音触发器
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
CN105027197B (zh) 2013-03-15 2018-12-14 苹果公司 训练至少部分语音命令系统
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
DE112014002747T5 (de) 2013-06-09 2016-03-03 Apple Inc. Vorrichtung, Verfahren und grafische Benutzerschnittstelle zum Ermöglichen einer Konversationspersistenz über zwei oder mehr Instanzen eines digitalen Assistenten
CN105265005B (zh) 2013-06-13 2019-09-17 苹果公司 用于由语音命令发起的紧急呼叫的系统和方法
AU2014306221B2 (en) 2013-08-06 2017-04-06 Apple Inc. Auto-activating smart responses based on activities from remote devices
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
AU2015266863B2 (en) 2014-05-30 2018-03-15 Apple Inc. Multi-command single utterance input method
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9606986B2 (en) 2014-09-29 2017-03-28 Apple Inc. Integrated word N-gram and class M-gram language models
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
CN104573028B (zh) * 2015-01-14 2019-01-25 百度在线网络技术(北京)有限公司 实现智能问答的方法和系统
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10191899B2 (en) 2016-06-06 2019-01-29 Comigo Ltd. System and method for understanding text using a translation of the text
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179588B1 (en) 2016-06-09 2019-02-22 Apple Inc. INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
KR102375800B1 (ko) * 2017-04-28 2022-03-17 삼성전자주식회사 음성 인식 서비스를 제공하는 전자 장치 및 그 방법
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4193119A (en) * 1977-03-25 1980-03-11 Xerox Corporation Apparatus for assisting in the transposition of foreign language text
GB1596411A (en) * 1977-09-19 1981-08-26 Shadin Hojin Kyodo Tsushinsha Translation system
US4164025A (en) * 1977-12-13 1979-08-07 Bell Telephone Laboratories, Incorporated Spelled word input directory information retrieval system with input word error corrective searching
GB2014765B (en) * 1978-02-17 1982-05-12 Carlson C W Portable translator device
JPS5936795B2 (ja) * 1979-08-17 1984-09-05 シャープ株式会社 電子辞書
US4623985A (en) * 1980-04-15 1986-11-18 Sharp Kabushiki Kaisha Language translator with circuitry for detecting and holding words not stored in dictionary ROM
JPS5748159A (en) * 1980-09-03 1982-03-19 Sharp Corp Electronic interpreter
JPS5924452B2 (ja) * 1980-09-22 1984-06-09 株式会社日立製作所 日本文入力装置
JPS57201958A (en) * 1981-06-05 1982-12-10 Hitachi Ltd Device and method for interpretation between natural languages
JPS57201926A (en) * 1981-06-05 1982-12-10 Hitachi Ltd "kanji" selecting method for "kanji" input device
JPS5840684A (ja) * 1981-09-04 1983-03-09 Hitachi Ltd 自然言語間の自動翻訳方式
JPS58175074A (ja) * 1982-04-07 1983-10-14 Toshiba Corp 構文分析方式
JPS58201175A (ja) * 1982-05-20 1983-11-22 Kokusai Denshin Denwa Co Ltd <Kdd> 機械翻訳方式
US4468756A (en) * 1982-05-20 1984-08-28 Chan Computer Corporation Method and apparatus for processing languages
US4544276A (en) * 1983-03-21 1985-10-01 Cornell Research Foundation, Inc. Method and apparatus for typing Japanese text using multiple systems
JPS6140672A (ja) * 1984-07-31 1986-02-26 Hitachi Ltd 多品詞解消処理方式

Also Published As

Publication number Publication date
CA1235817A (en) 1988-04-26
EP0180888A2 (en) 1986-05-14
DE3587993T2 (de) 1995-06-14
JPS61105671A (ja) 1986-05-23
KR860003560A (ko) 1986-05-26
US5109509A (en) 1992-04-28
DE3587993D1 (de) 1995-03-30
EP0180888B1 (en) 1995-02-22
JPH0510703B2 (ko) 1993-02-10
EP0180888A3 (en) 1986-08-27

Similar Documents

Publication Publication Date Title
KR920003498B1 (ko) 자연언어 처리방법 및 장치
US5200893A (en) Computer aided text generation method and system
JP3189186B2 (ja) パターンに基づく翻訳装置
US6393389B1 (en) Using ranked translation choices to obtain sequences indicating meaning of multi-token expressions
EP0645720B1 (en) Dictionary creation supporting system
KR100650427B1 (ko) 자연어 인식 애플리케이션 구축을 위한 통합 개발 툴
JPH06195373A (ja) 機械翻訳装置
EP0118187B1 (en) Menu-based natural language understanding system
US5283737A (en) Mechanism for generating linguistic expressions based on synonyms and rules derived from examples
JPH05120324A (ja) 言語処理方式
JPS61278970A (ja) 自然言語処理装置における構文解析結果の表示及び校正のための制御方法
JPS63228326A (ja) キ−ワ−ド自動抽出方式
JP4043176B2 (ja) 自然言語処理装置
JP2000330984A (ja) 文書処理装置及び方法
JPH0561902A (ja) 機械翻訳システム
JPH06195380A (ja) 翻訳支援システムにおける検索結果表示方式
JP3253311B2 (ja) 言語処理装置および言語処理方法
JPH03273360A (ja) 機械翻訳方法及び装置
JPH10149364A (ja) 訳語選択装置と記憶媒体
JP2574741B2 (ja) 言語処理方法
JPH0264859A (ja) 文章処理装置
JPH06290210A (ja) 自然言語の翻訳装置
JPH0778166A (ja) 翻訳方法及び機械翻訳装置
JPH10320395A (ja) 機械翻訳装置および機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH05225232A (ja) テキスト自動前編集装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
G160 Decision to publish patent application
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 19980325

Year of fee payment: 7

LAPS Lapse due to unpaid annual fee