KR102019757B1 - 언어 분석 오류 보정 장치 및 방법 - Google Patents

언어 분석 오류 보정 장치 및 방법 Download PDF

Info

Publication number
KR102019757B1
KR102019757B1 KR1020150179528A KR20150179528A KR102019757B1 KR 102019757 B1 KR102019757 B1 KR 102019757B1 KR 1020150179528 A KR1020150179528 A KR 1020150179528A KR 20150179528 A KR20150179528 A KR 20150179528A KR 102019757 B1 KR102019757 B1 KR 102019757B1
Authority
KR
South Korea
Prior art keywords
analysis
language
main
analysis result
error
Prior art date
Application number
KR1020150179528A
Other languages
English (en)
Other versions
KR20170071325A (ko
Inventor
임수종
김현기
박상규
배용진
이충희
이형직
임준호
장명길
최미란
정 허
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020150179528A priority Critical patent/KR102019757B1/ko
Priority to US15/244,100 priority patent/US10089300B2/en
Publication of KR20170071325A publication Critical patent/KR20170071325A/ko
Application granted granted Critical
Publication of KR102019757B1 publication Critical patent/KR102019757B1/ko

Links

Images

Classifications

    • G06F17/273
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F17/20
    • G06F17/271
    • G06F17/277
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/01Assessment or evaluation of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/32Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems

Abstract

본 발명은 언어 분석 오류 보정 장치로, 복수의 언어 처리 모듈들이 순차적으로 연결되어, 문서가 입력됨에 따라 처리 모듈들 별로 최선인 하나의 메인 분석 결과를 생성하는 메인 언어 분석부와, 상기 메인 언어 분석부와 동일한 구성으로 복수의 언어 처리 모듈들이 순차적으로 연결되어, 상기 문서가 입력됨에 따라 처리 모듈들 별로 다수의 보조 분석 결과들을 생성하는 보조 언어 분석부와, 상기 메인 분석 결과의 오류가 발생될 경우, 오류가 발생된 메인 분석 결과에 상응하는 보조 분석 결과를 획득하여 상기 메인 언어 분석부에 전달하는 분석 결과 보정부를 포함하되, 상기 메인 언어 분석부는 상기 수신된 보조 분석 결과로 오류가 발생된 메인 분석 결과를 대체한 후, 언어 분석을 재 수행한다.

Description

언어 분석 오류 보정 장치 및 방법{Apparatus and Method for Amending Language Analysis Error}
본 발명은 자연 언어 처리(Natural Language Processing: NLP) 기술에 관한 것으로, 특히 언어 분석 오류를 보정하는 장치 및 방법에 관한 것이다.
고도화된 지능형 서비스를 위해 심층적인 언어 분석 기술이 필요한데, 질의응답이나 자동 통역, 대화 시스템과 같이 복잡한 언어 분석이 필요한 경우에는 목적에 따라 서로 상이한 다양한 언어 분석 방식으로 처리될 수 있다.
그런데 일반적으로 사용되는 언어 분석 기술은 파이프라인과 같이 복수의 세부 분석 단계들을 순차적으로 수행하는 방식을 취한다. 예컨대, 형태소 분석 이외에도 개체명 인식, 어휘의미중의성해소(Word Sense Disambiguation), 구문분석, 의미역 인식(Semantic Role Labeling), 상호참조해결, 무형대용어 복원 및 대화처리와 같은 복잡한 세부 언어 분석 단계들이 순차적으로 수행될 수 있다.
그런데 이와 같이 세부 분석 단계들이 순차적으로 수행될 경우, 각 세부 분석 단계들은 이전 단계의 분석 결과를 입력으로 하여 분석하기 때문에, 어느 하나의 분석 단계에서 오류가 발생되었을 경우 그 이후의 분석 단계에서 모두 오류가 발생될 수 있다. 일 예로, "하늘을 나는 새가 좋다" 라는 문장에 대해 형태소 분석시 "하늘/일반명사/을/격조사 나/대명사+는/보조사 새/일반명사+가/격조사 좋/동사+다/종결어미"와 같이 동사인 "날다"를 대명사인 "나"로 오분석할 경우, 어휘 의미 중의성 해소 분석에서 "날다"라는 동사에서 의미를 찾는 것이 아니라 "나"라는 대명사에서 의미를 찾게 된다. 즉, 전 단계의 분석 결과에 대한 의존성으로 인해 분석 단계에서 그 분석 성능이 저하되고, 전 단계가 많을수록 성능 저하는 심화될 수 밖에 없다.
이런 현상을 극복하기 위한 방안으로 종래와 같이 이전 단계의 분석 결과를 이용하지 않고, 각 단계별로 분석 결과를 획득하는 방법이 제안되었다. 그런데 이러한 방법은 n번째 분석 단계에서 n번째 분석 뿐만 아니라 1번째 내지 n번째 분석 단계의 분석 정보까지 포함하여 n번째 분석을 수행해야 하므로, 각 단계별 프로세스 난이도를 높여 그 구현을 어렵게 한다. 또한, 7번째 단계인 경우 이전 단계들이 6개이므로 접근 방법을 고안하는 것은 거의 불가능하다.
다른 방안으로, 서로 상이한 접근 방법을 갖는 복수의 분석 결과들을 이용하여, 다수결로 복수의 분석 결과들 중 최종 결과를 채택한다. 그런데 동일한 문제에 대해서 다양한 접근 방법을 고안하여 다수개의 시스템을 구축해야 하고, 이를 병렬로 동일한 시간에 구동하여 결과를 얻어야 하므로 구현의 복잡도가 크다. 또한, 다수결로 결정하여 도출된 결과가 항상 옳다고 간주할 수 없으므로, 그 분석 결과의 정확도가 떨어진다.
본 발명은 다수의 언어 분석 단계들을 순차적으로 수행할 경우, 이전 단계의 분석 결과에 대한 의존성으로 발생하는 오류 전파 및 누적 현상을 해결하는 언어 분석 오류 보정 장치 및 방법을 제공한다.
본 발명은 프로세싱 구현의 난이도가 높지 않으면서, 오류 정정의 정확성을 향상시키는 언어 분석 오류 보정 장치 및 방법을 제공한다.
본 발명은 언어 분석 오류 보정 장치로, 복수의 언어 처리 모듈들이 순차적으로 연결되어, 문서가 입력됨에 따라 처리 모듈들 별로 최선인 하나의 메인 분석 결과를 생성하는 메인 언어 분석부와, 상기 메인 언어 분석부와 동일한 구성으로 복수의 언어 처리 모듈들이 순차적으로 연결되어, 상기 문서가 입력됨에 따라 처리 모듈들 별로 다수의 보조 분석 결과들을 생성하는 보조 언어 분석부와, 상기 메인 분석 결과의 오류가 발생될 경우, 오류가 발생된 메인 분석 결과에 상응하는 보조 분석 결과를 획득하여 상기 메인 언어 분석부에 전달하는 분석 결과 보정부를 포함하되, 상기 메인 언어 분석부는 상기 수신된 보조 분석 결과로 오류가 발생된 메인 분석 결과를 대체한 후, 언어 분석을 재 수행한다.
본 발명은 언어 분석 오류 보정 방법으로, 입력된 문서에 대한 복수의 언어 처리 단계들을 순차적으로 수행하여, 복수의 언어 처리 단계들 별로 최선인 하나의 메인 분석 결과를 생성하는 단계와, 상기 입력된 문서에 대한 복수의 언어 처리 단계들을 순차적으로 수행하여, 복수의 언어 처리 단계들 별로 다수의 보조 분석 결과들을 생성하는 단계와, 상기 메인 분석 결과의 오류가 발생될 경우, 오류가 발생된 메인 분석 결과에 상응하는 보조 분석 결과로 상기 메인 분석 결과로 보정하는 단계를 포함한다.
본 발명은 다수의 언어 분석 단계들을 순차적으로 수행할 경우, 이전 단계의 분석 결과에 대한 의존성으로 발생하는 오류 전파 및 누적 현상을 해결한다. 본 발명은 프로세싱 구현의 난이도가 높지 않으면서, 오류 정정의 정확성을 향상시킨다. 따라서, 질의 응답 시스템, 자동 번역, 대화 처리 시스템 등과 같은 다양한 지능형 서비스에 사용되는 언어 분석 기술로 본 발명을 사용하게 되면, 궁극적으로는 지능형 서비스의 질을 향상시켜 관련 시장을 더욱 활성화시킬 수 있다.
도 1은 본 발명의 일 실시 예에 따른 언어 분석 오류 보정 장치의 구성도이다.
도 2는 본 발명의 일 실시 예에 따른 분석 결과 보정부의 내부 구성도이다.
도 3은 메인 분석 결과에 오류가 발생되지 않은 경우의 예를 도시한 도면이다.
도 4는 메인 분석 결과에 오류가 발생한 경우의 예를 도시한 도면이다.
도 5는 본 발명의 일 실시 예에 따른 언어 분석 오류 보정 방법을 설명하기 위한 신호 흐름도이다.
이하, 첨부된 도면을 참조하여 기술되는 바람직한 실시 예를 통하여 본 발명을 당업자가 용이하게 이해하고 재현할 수 있도록 상세히 기술하기로 한다.
본 발명을 설명함에 있어 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명 실시 예들의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다.
명세서 전반에 걸쳐 사용되는 용어들은 본 발명 실시 예에서의 기능을 고려하여 정의된 용어들로서, 사용자 또는 운용자의 의도, 관례 등에 따라 충분히 변형될 수 있는 사항이므로, 이 용어들의 정의는 본 발명의 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
도 1은 본 발명의 일 실시 예에 따른 언어 분석 오류 보정 장치의 구성도이다.
도 1을 참조하면, 언어 분석 오류 보정 장치(100)는 메인 언어 분석부(110)와 보조 언어 분석부(120)가 동일한 문서를 동시에 병렬로 언어 분석을 수행하도록 하여, 메인 언어 분석부(110)에서 발생된 오류를 보조 언어 분석부(120)의 분석 결과로 보정한다.
메인 언어 분석부(110)는 복수의 언어 처리 모듈들(111, 112, ...11n)이 순차적으로 연결되어, 문서가 입력됨에 따라 처리 모듈들(111, 112, ...11n) 별로 최선인 하나의 메인 분석 결과를 생성한다.
보조 언어 분석부(120) 또한 메인 언어 분석부(110)와 동일한 구성으로 복수의 언어 처리 모듈들(121, 122, ...12n)이 순차적으로 연결되어, 문서가 입력됨에 따라 언어 처리 모듈들(121, 122, ...12n) 별로 다수의 보조 분석 결과들을 생성한다. 즉, 보조 언어 분석부(120)는 문서의 언어 분석을 수회 반복하여 복수의 언어 처리 모듈들(121, 122, ...12n) 각각에서 다수의 보조 분석 결과들을 생성하게 된다.
분석 결과 보정부(130)는 메인 분석 결과에 오류가 발생된 것으로 판단될 경우, 오류가 발생된 메인 분석 결과에 상응하는 보조 분석 결과를 획득하여, 메인 언어 분석부(110)에 전달한다. 그러면, 메인 언어 분석부(110)는 수신된 보조 분석 결과로 오류가 발생된 메인 분석 결과를 대체한 후, 언어 분석을 재 수행한다.
도 2는 본 발명의 일 실시 예에 따른 분석 결과 보정부의 내부 구성도이다.
도 2를 참조하면, 분석 결과 보정부(130)는 제어부(131) 및 결정 리소스(132)를 포함한다.
제어부(131)는 메인 분석 결과들 간에 모순이 있는지를 판단하고, 모순의 원인이 되는 오류를 발생시킨 언어 처리 모듈의 후보를 결정하고, 상기 후보에 상응하는 보조 언어 분석부(120)의 언어 처리 모듈로부터 메인 분석 결과와는 상이한 보조 분석 결과를 획득하여 메인 언어 분석부(110)의 언어 처리 모듈에 전달한다. 이때, 다수 보조 분석 결과들 중에서 오류가 발생된 메인 분석 결과를 제외한 나머지 보조 분석 결과들 중에서 차선으로 선별된 보조 분석 결과가 전달된다.
이때, 제어부(131)는 메인 분석 결과들 간의 모순 여부 결정 및 모순의 원인이 되는 언어 처리 모듈의 후보 결정은 미리 정해진 소정 결정 규칙(Decision Rule)에 따라 수행된다. 이러한 결정 규칙은 결정 리소스(132)에 저장되는데, 결정 리소스(132)는 결정 규칙 뿐만 아니라 학습 모델 등도 저장할 수 있다. 즉, 제어부(131)는 기계 학습 기법을 이용하여 메인 분석 결과들 간의 모순 여부 결정 및 모순의 원인이 되는 언어 처리 모듈의 후보 결정을 수행할 수도 있다.
그러면, 언어 분석 오류 보정 장치(100)에서 언어 분석 오류를 보정하는 예를 도 3 및 도 4를 들어 설명하기로 한다. 도 3은 메인 분석 결과에 오류가 발생되지 않은 경우의 예를 도시한 도면이고, 도 4는 메인 분석 결과에 오류가 발생한 경우의 예를 도시한 도면이다.
도 3 및 도 4에서 메인 언어 분석부(110) 및 보조 언어 분석부(120) 각각은 다수의 언어 처리 모듈들로 형태소 분석 모듈(111, 121), 어휘 의미 중의성 해소 모듈(112, 122), 개체명 인식 모듈(113, 123), 구문 분석 모듈(114, 124), 의미역 인식 모듈(115, 125), 상호 참조 해결 모듈(116, 126) 및 무형 대용어 복원 모듈(117, 127)을 포함하는데, 이는 설명의 편의를 위한 일 예일 뿐, 본 발명은 이에 한정되지 않는다. 또한, 도시된 모듈들의 동작은 주지된 내용이므로, 여기서는 상세한 설명은 생략하기로 한다.
도 3을 참조하면, 분석 결과 보정부(130)는 메인 언어 분석부(110)의 두 번째 단계인 어휘 의미 중의성 해소 분석 모듈(112)에 의한 메인 분석 결과에서부터 오류 발생 여부를 판단한다. 즉, 첫 번째 단계인 형태소 분석 모듈(111)의 메인 분석 결과만으로는 메인 분석 결과들 간의 모순 여부를 발견할 수 없기 때문이다. 어휘 의미 중의성 해소 분석 모듈(112)의 메인 분석 결과에 모순이 없을 경우, 분석 결과 보정부(130)는 다음 단계인 개체명 인식 모듈(113)에 실행 지시를 내린다. 그런 후, 개체명 인식 모듈(113)의 메인 분석 결과와 그 이전 단계들의 메인 분석 결과들을 비교하여 오류 여부를 판단한다. 판단 결과, 오류가 발생되지 않을 경우 다음 단계인 구문 분석 모듈(114)에 실행 지시를 내린다. 이와 같은 방식으로 무형 대용어 복원 모듈(117)이 동작을 종료할 때까지 분석 결과 보정부(130)의 오류 여부 판단은 반복되고, 최종적으로 언어 분석 결과를 생성한다.
그런데, 다른 실시 예로, 메인 언어 분석부(110)의 모든 언어 처리 모듈들이 분석을 완료한 후에, 오류 여부를 판단할 수도 있다. 이는 전술한 바와 같이 매 언어 처리 모듈이 동작을 완료할 때마다 오류 여부를 판단하게 되면, 메인 언어 분석부(110)가 다음 단계를 수행하게 위해 보조 언어 분석부(120)의 분석 결과를 기다려야 하므로, 지연이 발생될 수 있기 때문이다. 즉, 메인 언어 분석부(110)는 1회의 최선의 결과만을 도출하나, 보조 언어 분석부(120)는 수회 분석 처리를 수행하므로, 그 보조 언어 분석부(120)는 메인 언어 분석부(110)에 비해 속도가 느릴 수 있다. 따라서, 분석 결과 보정부(130)는 모든 메인 분석 결과들을 이용하여 모순을 발견하고, 발견된 모순의 원인인 오류를 발생시키는 언어 처리 모듈을 찾아내어 해당 언어 처리 모듈부터 언어 분석이 재수행되도록 명령할 수 있다.
도 4를 참조하면, 분석 결과 보정부(130)는 메인 언어 분석부(110)의 메인 분석 결과들 간에 모순이 발생될 경우, 해당 모순을 발생시킨 언어 처리 모듈의 후보를 결정한다. 그리고 결정된 언어 처리 모듈의 후보에 상응하는 보조 언어 분석부(120)의 언어 처리 모듈로부터 차선의 보조 분석 결과를 획득하여, 메인 언어 분석부(110)의 언어 처리 모듈에 전달한다.
일 예로, 어휘 의미 중의성 해소 모듈(112)과 구문 분석 모듈(114)의 분석 결과들 간에 모순이 발생된 경우를 들어 설명하기로 한다. "철수가 사과를 먹다" 라는 문장에 대해 형태소 분석 모듈(111)은 "먹다"의 주어를 "철수"로, "목적어"를 "사과"라고 분석하고, 어휘 의미 중의성 해소 모듈(112)은 "사과"를 "열매"가 아닌 "용서"의 하위어로 분석한 경우, 구문 분석 모듈(114)가 "먹다"의 선택 제약에 의해 "열매"가 아닌 "용서"로 분석하는 것이 불가능하므로, 어휘 의미 중의성 해소 모듈(112)과 구문 분석 모듈(114)의 분석 결과들 간에 모순이 발생된다. 그러면, 분석 결과 보정부(130)는 소정 결정 규칙에 따라 어휘 의미 중의성 해소 모듈(112)에서 오류가 발생된 것으로 결정하고, 보조 언어 분석부(120)의 어휘 의미 중의성 해소 모듈(122)로부터 "용서"라는 결과는 배제한 다른 보조 분석 결과를 획득하여, 메인 언어 분석부(110)의 어휘 의미 중의성 해소 모듈(112)에 전달한다. 그러면, 어휘 의미 중의성 해소 모듈(112)은 보조 분석 결과를 다음 단계로 전달하여 오류가 다음 단계로 전파되지 않도록 한다.
다른 예로, 형태소 분석 모듈(111)과 개체명 인식 모듈(113)의 분석 결과들 간에 모순이 발생된 경우를 들어 설명하기로 한다. 문장에서 발생하는 특정 단어에 대해 형태소 분석 모듈(111)은 고유 명사로 분석하고, 개체명 인식 모듈(113)은 개체명이 아닌 것으로 분석할 경우, 형태소 분석 모듈(111)과 개체명 인식 모듈(113)의 분석 결과들 간에 모순이 발생된다. 그러면, 분석 결과 보정부(130)는 소정 결정 규칙에 따라 개체명 인식 모듈(113)에서 오류가 발생된 것으로 결정하고, 보조 언어 분석부(120)의 개체명 인식 모듈(123)로부터 특정 단어의 보조 분석 결과를 획득하여, 메인 언어 분석부(110)의 개체명 인식 모듈(113)에 전달한다. 그러면, 개체명 인식 모듈(113)은 보조 분석 결과를 다음 단계로 전달하여 오류가 다음 단계로 전파되지 않도록 한다.
다음으로, 언어 분석 보정을 수행하는 방법에 대해 살펴보기로 한다. 그런데, 언어 분석 보정 방법은 다양한 실시 예가 가능한데, 매 언어 처리 단계가 완료될 때마다 언어 분석 오류 보정을 수행할 수도 있고, 모든 언어 처리 단계가 완료된 후에 언어 분석 오류 보정을 수행할 수도 있다. 하기의 도 5에서는 설명의 편의를 위해 모든 언어 처리 단계가 완료된 후에 언어 분석 오류 보정을 수행하는 예를 들어 살펴보기로 한다.
도 5는 본 발명의 일 실시 예에 따른 언어 분석 오류 보정 방법을 설명하기 위한 신호 흐름도이다.
도 5를 참조하면, 언어 분석 오류 보정 장치(100)는 메인 언어 분석부(110)와 보조 언어 분석부(120)가 동일한 문서를 동시에 병렬로 언어 분석을 수행한다(S510-1, S501-2).
메인 언어 분석부(110)는 복수의 언어 처리 단계들을 순차적으로 수행하여, 문서가 입력됨에 따라 복수의 언어 처리 단계들 별로 하나의 최선인 메인 분석 결과들을 생성한다(S520-2).
보조 언어 분석부(120) 복수의 언어 처리 단계들을 순차적으로 수행하여, 문서가 입력됨에 따라 복수의 언어 처리 단계들 별로 다수의 보조 분석 결과를 생성한다(S520-2). 이를 위해, 보조 언어 분석부(120)는 문서의 언어 분석을 수회 반복한다.
메인 언어 분석부(110)로부터 분석 결과 보정부(130)로 메인 분석 결과가 전달(S530)되면, 분석 결과 보정부(130)는 단계별로 오류 발생 여부를 검사하고(S540), 검사한 단계에서 오류 검출 여부를 판단한다(S540). 즉, 메인 분석 결과들 간에 모순이 있는지를 판단한다.
S550에서 오류 검출되지 않을 것으로 판단될 경우, 분석 결과 보정부(130)는 S540로 돌아가서, 다음 언어 처리 단계의 오류 여부를 결정한다(S560). 반면, S550에서 오류 검출된 것으로 판단될 경우, 분석 결과 보정부(130)는 오류가 발생된 언어 처리 단계의 후보를 결정한다(S560).
그런데, S540 내지 S560에서 분석 결과 보정부(130)는 메인 분석 결과들 간의 모순 여부 결정 및 모순의 원인이 되는 언어 처리 모듈의 후보 결정은 미리 정해진 소정 결정 규칙(Decision Rule)에 따라 수행한다. 이러한 결정 규칙은 결정 리소스(132)에 저장되는데, 결정 리소스(132)는 결정 규칙 뿐만 아니라 학습 모델 등도 저장할 수 있다. 즉, 분석 결과 보정부(130)는 기계 학습 기법을 이용하여 메인 분석 결과들 간의 모순 여부 결정 및 모순의 원인이 되는 언어 처리 모듈의 후보 결정을 수행할 수도 있다.
그런 후, 분석 결과 보정부(130)는 오류가 발생된 언어 처리 단계의 보조 분석 결과들을 보조 언어 분석부(120)에 요청(S570)하고, 보조 언어 분석부(120)는 해당 보조 분석 결과들을 검출(S580)하여, 분석 결과 보정부(130)에 전달한다(S590).
그러면, 분석 결과 보정부(130)는 오류가 발생된 메인 분석 결과를 제외한 나머지 보조 분석 결과들 중에서 차선인 보조 분석 결과를 선별(S600)하고, 차선의 보조 분석 결과를 메인 언어 분석부(110)에 전달된다(S610).
그러면, 메인 언어 분석부(110)는 수신된 보조 분석 결과로 오류가 발생된 메인 분석 결과를 대체(S620)한 후, 언어 분석을 재 수행한다(S630).

Claims (14)

  1. 복수의 언어 처리 모듈들이 순차적으로 연결되어, 문서가 입력됨에 따라 처리 모듈들 별로 최선인 하나의 메인 분석 결과를 생성하는 메인 언어 분석부와,
    상기 메인 언어 분석부와 동일한 구성으로 복수의 언어 처리 모듈들이 순차적으로 연결되어, 상기 문서가 입력됨에 따라 처리 모듈들 별로 상기 메인 언어 분석부의 분석과 동시에 병렬로 다수의 보조 분석 결과들을 생성하는 보조 언어 분석부와,
    상기 메인 언어 분석부로부터 수신된 각 처리 모듈별 메인 분석 결과 간에 모순이 있는지 판단하고, 모순이 있다면 모순의 원인이 되는 오류를 발생시킨 언어 처리 모듈의 후보를 결정하고, 이 후보에 상응하는 상기 보조 언어 분석부의 언어 처리 모듈로부터 상기 메인 분석 결과와 상이한 보조 분석 결과를 획득하여 상기 메인 언어 분석부의 언어 처리 모듈에 전달하도록 구성된 분석 결과 보정부를 포함하되,
    상기 메인 언어 분석부는 상기 수신된 보조 분석 결과로 오류가 발생된 메인 분석 결과를 대체한 후, 언어 분석을 재수행함을 특징으로 하는 언어 분석 오류 보정 장치.
  2. 제 1항에 있어서,
    상기 메인 언어 분석부와 보조 언어 분석부는 동일한 문서를 수신하여 동시에 병렬로 언어 분석을 수행함을 특징으로 하는 언어 분석 오류 보정 장치.
  3. 제 1항에 있어서, 상기 보조 언어 분석부는
    상기 문서의 언어 분석을 반복함을 특징으로 하는 언어 분석 오류 보정 장치.
  4. 삭제
  5. 제 1항에 있어서, 상기 분석 결과 보정부는
    소정 결정 규칙을 저장하는 결정 리소스를 더 포함하여, 상기 소정 결정 규칙을 이용하여 메인 분석 결과들 간의 모순 여부 결정 및 모순의 원인이 되는 언어 처리 모듈의 후보를 결정함을 특징으로 하는 언어 분석 오류 보정 장치.
  6. 제 1항에 있어서, 상기 분석 결과 보정부는
    상기 다수 보조 분석 결과들 중에서 상기 메인 분석 결과를 제외한 차선의 보조 분석 결과를 선별하여 메인 언어 분석부에 전달함을 특징으로 하는 언어 분석 오류 보정 장치.
  7. 제 1항에 있어서, 상기 분석 결과 보정부는
    두 번째 언어 처리 모듈의 메인 분석 결과부터 획득하여 오류 여부를 판단함을 특징으로 하는 언어 분석 오류 보정 장치.
  8. 입력된 문서에 대한 복수의 언어 처리 단계들을 순차적으로 수행하여, 복수의 언어 처리 단계들 별로 최선인 하나의 메인 분석 결과를 생성하는 단계와,
    상기 메인 분석 결과 생성 단계와 동시에 병렬로 상기 입력된 문서에 대한 복수의 언어 처리 단계들을 순차적으로 수행하여, 복수의 언어 처리 단계들 별로 다수의 보조 분석 결과들을 생성하는 단계와,
    상기 각 언어 처리 단계별 메인 분석 결과 간에 모순이 있는지 판단하는 단계와,
    모순이 있다면 모순의 원인이 되는 오류를 발생시킨 언어 처리 단계의 후보를 결정하는 단계와,
    이 결정된 후보의 언어 처리 단계의 보조 분석 결과를 획득하여 상기 메인 분석 결과를 보조 분석 결과로 대체하는 단계를 포함함을 특징으로 하는 언어 분석 오류 보정 방법.
  9. 제 8항에 있어서,
    상기 메인 분석 결과를 생성하는 단계와 보조 분석 결과를 생성하는 단계는 동일한 문서를 수신하여 동시에 병렬로 언어 분석을 수행함을 특징으로 하는 언어 분석 오류 보정 방법.
  10. 제 8항에 있어서, 상기 보조 분석 결과를 생성하는 단계는
    상기 문서의 언어 분석을 수회 반복함을 특징으로 하는 언어 분석 오류 보정 방법.
  11. 삭제
  12. 제 8항에 있어서, 상기 보정하는 단계는
    소정 결정 규칙을 이용하여 메인 분석 결과들 간의 모순 여부 결정 및 모순의 원인이 되는 언어 처리 단계의 후보를 결정함을 특징으로 하는 언어 분석 오류 보정 방법.
  13. 제 8항에 있어서, 상기 보정하는 단계는
    상기 다수 보조 분석 결과들 중에서 상기 메인 분석 결과를 제외한 차선의 보조 분석 결과를 선별함을 특징으로 하는 언어 분석 오류 보정 방법.
  14. 제 8항에 있어서, 상기 보정하는 단계는
    두 번째 단계부터 분석 결과를 획득하여 오류 여부를 판단함을 특징으로 하는 언어 분석 오류 보정 방법.
KR1020150179528A 2015-12-15 2015-12-15 언어 분석 오류 보정 장치 및 방법 KR102019757B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020150179528A KR102019757B1 (ko) 2015-12-15 2015-12-15 언어 분석 오류 보정 장치 및 방법
US15/244,100 US10089300B2 (en) 2015-12-15 2016-08-23 Apparatus and method for amending language analysis error

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150179528A KR102019757B1 (ko) 2015-12-15 2015-12-15 언어 분석 오류 보정 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20170071325A KR20170071325A (ko) 2017-06-23
KR102019757B1 true KR102019757B1 (ko) 2019-09-10

Family

ID=59020082

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150179528A KR102019757B1 (ko) 2015-12-15 2015-12-15 언어 분석 오류 보정 장치 및 방법

Country Status (2)

Country Link
US (1) US10089300B2 (ko)
KR (1) KR102019757B1 (ko)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6070809B1 (ja) * 2015-12-03 2017-02-01 国立大学法人静岡大学 自然言語処理装置及び自然言語処理方法
US10606952B2 (en) 2016-06-24 2020-03-31 Elemental Cognition Llc Architecture and processes for computer learning and understanding
JP2019191713A (ja) * 2018-04-19 2019-10-31 ヤフー株式会社 決定プログラム、決定方法、及び決定装置
KR102041621B1 (ko) * 2019-02-25 2019-11-06 (주)미디어코퍼스 인공지능 음성인식 기반 기계학습의 대규모 말뭉치 구축을 위한 대화형 말뭉치 분석 서비스 제공 시스템 및 구축 방법
KR102263309B1 (ko) * 2019-10-02 2021-06-10 (주)디앤아이파비스 이미지 정보를 이용한 특허문서의 단어 세트 획득 방법 및 시스템
KR102255961B1 (ko) * 2019-10-02 2021-05-25 (주)디앤아이파비스 오류 단어 수정을 통한 특허문서의 단어 세트 획득 방법 및 시스템
KR102255962B1 (ko) * 2019-10-02 2021-05-25 (주)디앤아이파비스 템플릿 정보를 이용한 특허문서의 단어 세트 획득 방법 및 시스템
KR102085214B1 (ko) * 2019-10-02 2020-03-04 (주)디앤아이파비스 특허문서의 단어 세트 획득 방법 및 시스템
KR102297962B1 (ko) * 2019-10-02 2021-09-03 (주)디앤아이파비스 특허문서의 단어 세트 의미 정보 획득 방법 및 시스템
KR102291930B1 (ko) * 2019-10-02 2021-08-23 (주)디앤아이파비스 복합 명사구를 포함하는 특허문서의 단어 세트 획득 방법 및 시스템

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6912498B2 (en) * 2000-05-02 2005-06-28 Scansoft, Inc. Error correction in speech recognition by correcting text around selected area
KR100509917B1 (ko) 2003-04-15 2005-08-25 한국전자통신연구원 어절 엔-그램을 이용한 띄어쓰기와 철자 교정장치 및 방법
US20040210437A1 (en) * 2003-04-15 2004-10-21 Aurilab, Llc Semi-discrete utterance recognizer for carefully articulated speech
KR101134436B1 (ko) * 2003-05-01 2012-04-09 메드제닉스 인코포레이티드 진피 미세 기관, 그를 생산 및 이용하기 위한 방법 및 장치
US7809568B2 (en) * 2005-11-08 2010-10-05 Microsoft Corporation Indexing and searching speech with text meta-data
US8972268B2 (en) * 2008-04-15 2015-03-03 Facebook, Inc. Enhanced speech-to-speech translation system and methods for adding a new word
US8712758B2 (en) * 2007-08-31 2014-04-29 Microsoft Corporation Coreference resolution in an ambiguity-sensitive natural language processing system
KR100919225B1 (ko) * 2007-09-19 2009-09-28 한국전자통신연구원 음성 대화 시스템에 있어서 다단계 검증을 이용한 대화오류 후처리 장치 및 방법
US8364481B2 (en) * 2008-07-02 2013-01-29 Google Inc. Speech recognition with parallel recognition tasks
US8930179B2 (en) * 2009-06-04 2015-01-06 Microsoft Corporation Recognition using re-recognition and statistical classification
US10282419B2 (en) * 2012-12-12 2019-05-07 Nuance Communications, Inc. Multi-domain natural language processing architecture
KR101740330B1 (ko) * 2013-10-14 2017-05-29 한국전자통신연구원 단어 공기 정보에 기반한 다국어 형태소 분석 오류 정정 장치 및 방법
US10380253B2 (en) * 2014-03-04 2019-08-13 International Business Machines Corporation Natural language processing with dynamic pipelines
US20150364129A1 (en) * 2014-06-17 2015-12-17 Google Inc. Language Identification

Also Published As

Publication number Publication date
US20170169009A1 (en) 2017-06-15
KR20170071325A (ko) 2017-06-23
US10089300B2 (en) 2018-10-02

Similar Documents

Publication Publication Date Title
KR102019757B1 (ko) 언어 분석 오류 보정 장치 및 방법
US8688454B2 (en) Method and apparatus for adapting a language model in response to error correction
US10019984B2 (en) Speech recognition error diagnosis
CN105654945B (zh) 一种语言模型的训练方法及装置、设备
US8990066B2 (en) Resolving out-of-vocabulary words during machine translation
CN107688803B (zh) 字符识别中识别结果的校验方法和装置
WO2018097907A1 (en) Answer to question neural networks
CN105047198B (zh) 语音纠错处理方法及装置
CN106503231B (zh) 基于人工智能的搜索方法和装置
US8204738B2 (en) Removing bias from features containing overlapping embedded grammars in a natural language understanding system
CN104573099A (zh) 题目的搜索方法及装置
WO2018153316A1 (zh) 获取文本提取模型的方法及装置
US11182566B2 (en) Processing text sequences using neural networks
KR20160138837A (ko) 음성 인식 및 번역 시스템,방법 및 컴퓨터 프로그램
JP2018206261A (ja) 単語分割推定モデル学習装置、単語分割装置、方法、及びプログラム
CN111309596A (zh) 数据库测试方法、装置、终端设备及存储介质
KR102209786B1 (ko) 자연어 처리 기반의 청크 구성 방법 및 장치
KR20150092879A (ko) n-gram 데이터 및 언어 분석에 기반한 문법 오류 교정장치 및 방법
KR101374900B1 (ko) 문법 오류 정정 시스템 및 이를 이용한 문법 오류 정정 방법
KR20100062834A (ko) 번역 오류 후처리 보정 장치 및 방법
US9710450B2 (en) Recombining incorrectly separated tokens in natural language processing
CN109558600B (zh) 翻译处理方法及装置
EP4254256A1 (en) Spoken language processing method and apparatus, electronic device, and storage medium
US20220292266A1 (en) System and Method for Resource Efficient Natural Language Processing
JP2010257021A (ja) 文章修正装置、文章修正システム、文章修正方法、文章修正プログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant