KR20200101891A - 복합 문장 분석 장치, 이를 위한 기록매체 - Google Patents

복합 문장 분석 장치, 이를 위한 기록매체 Download PDF

Info

Publication number
KR20200101891A
KR20200101891A KR1020200103630A KR20200103630A KR20200101891A KR 20200101891 A KR20200101891 A KR 20200101891A KR 1020200103630 A KR1020200103630 A KR 1020200103630A KR 20200103630 A KR20200103630 A KR 20200103630A KR 20200101891 A KR20200101891 A KR 20200101891A
Authority
KR
South Korea
Prior art keywords
sentence
semantic
short sentences
meaning
compound
Prior art date
Application number
KR1020200103630A
Other languages
English (en)
Inventor
신승은
Original Assignee
에스케이텔레콤 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에스케이텔레콤 주식회사 filed Critical 에스케이텔레콤 주식회사
Priority to KR1020200103630A priority Critical patent/KR20200101891A/ko
Publication of KR20200101891A publication Critical patent/KR20200101891A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 복합 문장 분석 장치, 이를 위한 기록매체가 개시된다. 본 발명의 복합 문장 분석 장치는 복수 개의 단문이 연결된 복합 문장을 입력 받는 인터페이스부, 입력 받은 복합 문장을 복수 개의 단문으로 분리하는 복합 문장 분리 모듈 및 분리된 복수 개의 단문으로부터 입력 받은 복합 문장에 대한 의미표현을 생성하는 의미 분석 모듈을 포함한다.

Description

복합 문장 분석 장치, 이를 위한 기록매체 {Apparatus for analyzing complex sentence, and recording medium therefor}
본 발명은 대화체 문장 분석에 관한 것으로, 보다 상세하게는 여러 단문이 연결된 복합 문장의 의미를 분석하기 위한 장치 및 이를 위한 프로그램이 기록된 기록매체에 관한 것이다.
정보가 중심적 가치가 되는 정보화 시대 속에서 많은 사람들은 시간과 장소에 구애 받지 않고 자신이 필요로 하는 정보에 접근하고자 한다. 기술의 발달은 기존에 존재하지 않았던 새로운 정보화 기기를 등장하게 하였고, 하루가 멀게 이를 일컫는 신조어가 탄생하고 있다. 예컨대, 태블릿 기능을 포함한 스마트폰의 등장으로 폰(Phone)과 태블릿(Tablet)의 합성어인 패블릿(Phablet)이란 신조어가 탄생하였다. 그러나, 새로운 정보화 기기의 등장이 언제나 환영 받는 것은 아니었다. 사용자들은 종종 새로운 정보화 기기를 위한 새로운 조작 방법을 습득 하여야 했으며, 이러한 습득에 서투른 자들은 시대의 흐름에서 뒤쳐지게 되었다.
이러한 단점을 보완하기 위하여, 근래에는 보다 쉽고 단순한 조작 방법에 대하여 많은 제조사 및 사용자들이 주의를 기울이고 있으며, 최근에는 문명의 발달 이전부터 인간의 의사를 전달하기 위한 도구였던 언어를 기초로 하는 인터페이스가 적용된 제품 및 서비스가 속속 등장하고 있다.
언어를 기초로 하는 인터페이스에 관한 연구는 초기 일방적인 음성 물음에 다이얼 내지 버튼으로 답하는 방식에서, 음성 물음에 제한된 단어로서 답하는 방식까지 발전하였으며, 궁극적으로 자연스러운 음성 대화를 통한 인터페이스를 목표로 하고 있다.
하지만, 음성 대화, 즉 대화체는 흔히 여러 단문이 접속 조사 등으로 연결된 복합 문장의 형태를 가지고 있으며, 이러한 복합 문장으로부터 화자의 의도를 명확히 파악하기 곤란하다는 점이 음성 대화를 통한 인터페이스의 상용화를 지연시키고 있다. 따라서, 복합 문장을 보다 단순화시켜 복합 문장에 포함된 화자의 명확한 의도를 분석하기 위한 다양한 방법이 요구되고 있다.
한국공개특허 제2005-0036303호, 2005년 04월 20일 공개 (명칭: 대화체 연속음성인식을 위한 의사형태소 기반 다중발음사전 구축 방법 및 그 시스템과 이를 이용한 대화체 음성인식 방법)
본 발명의 목적은 복합 문장의 의미 분석에 있어, 복합 문장을 의미 분석에 보다 유리한 복수 개의 단문으로 분리하여 의미 분석할 수 있는 장치 및 이를 위한 프로그램이 기록된 기록매체를 제안한다.
또한, 본 발명의 목적은 복합 문장으로부터 분리된 복수 개의 단문의 의미를 분석한 후 분석된 단문의 의미와 단문의 연결 형태를 고려하여 하나의 의미표현을 생성할 수 있는 장치 및 이를 위한 기록매체를 제안한다.
본 발명에서 이루고자 하는 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급하지 않은 또 다른 기술적 과제들은 아래의 기재들로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
상기 목적을 달성하기 위해 본 발명에 따른 복합 문장 분석 장치는 복수 개의 단문이 연결된 복합 문장을 입력 받는 인터페이스부, 상기 입력 받은 복합 문장을 복수 개의 단문으로 분리하는 복합 문장 분리 모듈 및 상기 분리된 복수 개의 단문으로부터 상기 입력 받은 복합 문장에 대한 의미표현을 생성하는 의미 분석 모듈을 포함하고, 상기 의미 분석 모듈은 상기 복수 개의 단문 각각에 대한 의미표현을 병합하여 상기 복합 문장에 포함된 화자의 의도를 나타내는 의미표현을 생성한다.
또한 복수 개의 단문이 의미 분석되어 생성된 복수 개의 의미 표현을 하나의 의미표현으로 병합하기 위한 병합 규칙을 포함하는 병합 규칙 데이터베이스를 더 포함한다.
또한 상기 병합 규칙은 상기 복합 문장을 구성하는 복수 개의 단문의 연결 형태 및 의미 표현을 기준으로 정의되고, 상기 연결 형태는 병렬형, 선택형, 대조형 및 종결형 중 어느 하나를 포함한다.
또한 상기 의미 분석 모듈은 상기 분리된 복수 개의 단문에 대한 의미를 분석하여 각각의 의미표현을 생성하고, 상기 분리된 복수 개의 단문의 연결 형태를 판단하며, 상기 병합 규칙 데이터베이스에서 상기 판단된 연결 형태 및 상기 생성된 의미표현과 상응하는 병합 규칙을 검색하고, 상기 검색된 병합 규칙에 따라 상기 분리된 복수 개의 단문의 의미표현을 병합한다.
또한 상기 입력 받은 복합 문장에 포함된 형태소를 분석하여 품사 태그를 부여하는 형태소 분석 모듈을 더 포함하고, 상기 복합 문장 분리 모듈은 상기 부여된 품사 태그를 기준으로 상기 입력 받은 복합 문장을 복수 개의 단문으로 분리한다.
또한 상기 입력 받은 복합 문장에 포함된 어휘에 대하여 의미자질을 부여하는 의미자질 인식 모듈 및 상기 의미자질이 부여된 복합 문장에 개체명이 포함되어 있는지 검색하여 개체명을 부여하는 개체명 인식 모듈을 더 포함하고, 상기 의미 분석 모듈은 상기 부여된 의미자질과 개체명을 기초로 상기 분리된 복수 개의 단문에 대한 의미를 분석하여 각각에 대한 의미표현을 생성한다.
본 발명에 따른 복합 문장 분석 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 판독할 수 있는 기록매체는 복수 개의 단문이 연결된 복합 문장을 입력 받는 단계, 상기 입력 받은 복합 문장을 복수 개의 단문으로 분리하는 단계 및 상기 분리된 복수 개의 단문으로부터 상기 입력 받은 복합 문장에 대한 의미표현을 생성하는 단계를 포함하고, 상기 생성하는 단계는 상기 복수 개의 단문 각각에 대한 의미표현을 병합하는 단계 및 상기 복합 문장에 포함된 화자의 의도를 나타내는 의미표현을 생성하는 단계를 포함한다.
본 발명은 복합 문장의 의미를 분석함에 있어, 복합 문장을 의미 분석에 보다 유리한 복수 개의 단문으로 분리하여 의미 분석함으로써, 복합 문장의 보다 명확한 의미 분석을 가능하게 한다. 특히, 복합 문장으로부터 분리된 복수 개의 단문의 의미를 분석한 후 분석된 단문의 의미와 단문의 연결 형태를 고려하여 하나의 의미표현을 생성함으로써, 복합 문장에 포함된 화자의 진정한 의도를 규명할 수 있다.
본 발명에서 얻을 수 있는 효과는 이상에서 언급한 효과로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
본 발명에 관한 이해를 돕기 위해 상세한 설명의 일부로 포함되는, 첨부 도면은 본 발명에 대한 실시예를 제공하고, 상세한 설명과 함께 본 발명의 기술적 특징을 설명한다.
도 1은 본 발명의 일 실시예에 따른 복합 문장 분석 장치의 구성을 예시하는 도면이다.
도 2는 본 발명의 일 실시예에 따라 복합 문장의 의미를 분석하는 과정을 예시하기 위한 도면이다.
도 3은 본 발명의 일 실시예에 따른 복합 문장 분석 방법을 예시하는 도면이다.
도 4는 본 발명의 일 실시예에 따른 복합 문장 분석 방법을 예시하는 다른 도면이다.
도 5는 본 발명의 일 실시예에 따라 복수 개의 단문으로부터 복합 문장에 대한 의미표현을 생성하는 방법을 예시하는 도면이다.
이하, 본 발명에 따른 바람직한 실시 형태를 첨부된 도면을 참조하여 상세하게 설명한다. 첨부된 도면과 함께 이하에 개시될 상세한 설명은 본 발명의 예시적인 실시형태를 설명하고자 하는 것이며, 본 발명이 실시될 수 있는 유일한 실시형태를 나타내고자 하는 것이 아니다. 이하의 상세한 설명은 본 발명의 완전한 이해를 제공하기 위해서 구체적 세부사항을 포함한다. 그러나, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명이 이러한 구체적 세부사항 없이도 실시될 수 있음을 안다.
몇몇 경우, 본 발명의 개념이 모호해지는 것을 피하기 위하여 공지의 구조 및 장치는 생략되거나, 각 구조 및 장치의 핵심기능을 중심으로 한 블록도 형식으로 도시될 수 있다.
명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함(comprising 또는 including)"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다. 또한, 명세서에 기재된 "??부", "??기", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다. 또한, "일(a 또는 an)", "하나(one)", "그(the)" 및 유사 관련어는 본 발명을 기술하는 문맥에 있어서(특히, 이하의 청구항의 문맥에서) 본 명세서에 달리 지시되거나 문맥에 의해 분명하게 반박되지 않는 한, 단수 및 복수 모두를 포함하는 의미로 사용될 수 있다.
이하의 설명에서 사용되는 특정 용어들은 본 발명의 이해를 돕기 위해서 제공된 것이며, 이러한 특정 용어의 사용은 본 발명의 기술적 사상을 벗어나지 않는 범위에서 다른 형태로 변경될 수 있다.
설명에 앞서, 본 발명에서 언급하는 용례(用例, example)는 사전적 의미로 '쓰고 있는 예'를 말하는 것으로, 언어학적 분야에서는 특정 단어가 사용되는 예문을 말한다. 특히, 본 발명에서 언급하는 용례는 정형적인 문법구조에 맞추어 문장이 구성된 코퍼스(corpus)가 아니라, 정형적인 규칙에 벗어나는 문장으로서 실생활에서 사용되고 있는 문장, 다양한 문체를 포함한 문장 등을 모두 포함한다.
도 1은 본 발명의 일 실시예에 따른 복합 문장 분석 장치의 구성을 예시하는 도면이다.
본 발명에 따른 복합 문장 분석 장치(100)는 복수 개의 단문이 접속사로 연결된 복합 문장의 의미를 분석하기 위한 장치를 의미한다. 도 1에서 도시된 복합 문장 분석 장치(100)의 구성은 기능적으로 구분되는 기능 요소들을 나타낸 것으로서, 어느 하나 이상의 구성이 실제 물리적으로는 서로 통합되어 구현될 수도 있다.
도 1을 참조하면, 본 발명의 일 실시예에 따른 복합 문장 분석 장치(100)는 인터페이스부(110), 저장부(120) 및 제어부(130)를 포함하여 구성될 수 있다.
각 구성 요소에 대해 보다 구체적으로 설명하면, 인터페이스부(110)는 복합 문장을 입력 받고, 복합 문장의 의미 표현(즉, 복합 문장의 의미 분석 결과)을 제공하기 위한 수단이다. 특히, 본 발명에 있어서, 인터페이스부(110)는 별도의 통신 모듈(미도시)을 통해 하나 이상의 다른 장치로부터 복합 문장을 전송 받거나, 별도의 입력 모듈(미도시)을 통해 사용자로부터 복합 문장을 입력 받을 수 있다. 또한, 인터페이스부(110)는 복합 문장의 의미 표현(즉, 복합 문장의 의미 분석 결과)을 별도의 통신 모듈(미도시)을 통해 하나 이상의 다른 장치로 전송하거나, 별도의 출력 모듈(미도시)을 통해 사용자에게 출력할 수 있다.
저장부(120)는 복합 문장 분석에 필요한 자료들을 저장하기 위한 수단이다. 구체적으로, 저장부(120)는 의미자질 데이터베이스(DB, 121), 개체명 데이터베이스(DB, 122) 및 병합 규칙 데이터베이스(DB, 123)를 포함하여 구성될 수 있다.
의미자질 데이터베이스(DB, 121)는 어휘와 상기 어휘에 내포된 의미를 구성하는 최소 단위인 의미자질(意味資質, Semantic Feature)의 집합으로 구성되며, 제어부(130)가 복합 문장에 포함된 어휘들에 대하여 의미자질을 부여함에 있어 참조될 수 있다.
개체명 데이터베이스(122)는 인명, 지명, 기관명, 날짜, 숫자 등과 같은 고유한 의미를 가지는 개체명(Named Entity)의 집합으로 구성되며, 제어부(130)가 복합 문장에 포함된 어휘들에 대하여 개체명을 부여함에 있어 참조될 수 있다.
병합 규칙 데이터베이스(123)은 복수 개의 단문이 의미 분석되어 생성된 복수 개의 의미표현을 하나의 의미표현으로 병합하기 위한 병합 규칙으로 구성되며, 제어부(130)가 복합 문장의 의미를 분석함에 있어 참조될 수 있다. 특히, 병합 규칙 데이터베이스(123)의 병합 규칙은 복합 문장을 구성하는 복수 개의 단문의 연결 형태 및 복수 개의 단문 각각에 대한 의미표현을 기준으로 정의된다. 구체적으로, 병합 규칙을 정의하는 기준이 되는 복수 개의 단문의 연결 형태에는 병렬형, 선택형, 대조형, 종결형이 포함될 수 있으며, 이에 한정되지 않고 복수 개의 단문을 연결할 수 있는 형태라면 모두 포함 될 수 있다. 여기서, 병렬형은 복수 개의 단문이 대등적으로 연결된 형태이며, 예컨대, 복수 개의 단문이 "과", "와", "하고", "이고", "이며", "하며", "및", "그리고", "고", "(으)며", "(으)면서" 등의 조사 또는 어휘로 연결된 경우 이에 해당된다. 선택형은 복수 개의 단문이 선택적으로 연결된 형태이며, 예컨대, 복수 개의 단문이 "(이)나", "(이)든지", "또는", "거나" 등의 조사 또는 어휘로 연결된 경우 이에 해당한다. 대조형은 복수 개의 단문이 대립적으로 연결된 형태이며, 예컨대, 복수 개의 단문이 "(으)나", "지만", "그러나", "그렇지만" 등으로 연결된 경우 이에 해당된다. 종결형은 하나의 단문 말미에 종결 어미가 위치하고 그 뒤로 새로운 단문이 연결된 형태이며, 예컨대, 하나의 단문 말미에 종결 어미 "다", "자", "라", "니", "구나" 등이 위치하고 그 뒤로 새로운 단문이 연결된 경우 이에 해당한다.
제어부(130)는 복합 문장 분석 장치(100)의 전반적인 제어를 수행하는 구성으로, 인터페이스부(110) 또는 저장부(120)의 기능 수행을 위한 신호의 흐름을 제어하게 된다. 이때, 제어부(130)는 운영 체제(OS, Operating System), 응용 프로그램 및 각 구성을 구동시키는 프로세스 장치, 예컨대, 중앙처리장치(CPU, Central Processing Unit)로 이루어질 수 있다.
특히, 본 발명에 있어서, 제어부(130)는 형태소 분석 모듈(131), 의미자질 인식 모듈(132), 개체명 인식 모듈(133), 복합 문장 분리 모듈(134) 및 의미 분석 모듈(135)을 포함하여 구성될 수 있다.
형태소 분석 모듈(131)은 인터페이스부(110)를 통해 입력 받은 복합 문장에 포함된 형태소를 분석하여 품사 태그를 부여한다. 즉, 형태소 분석 모듈(131)은 인터페이스부(110)를 통해 입력 받은 복합 문장을 의미를 지니는 가장 작은 단위인 형태소(形態素, Morpheme) 단위로 분석하기 위한 것이다.
보다 구체적으로, 형태소 분석 모듈(131)은 인터페이스부(110)를 통해 입력 받은 복합 문장으로부터 어절을 검색하여 추출한다. 형태소 분석 모듈(131)은 복합 문장에 포함된 어절에 대하여 왼쪽에서 오른쪽(Left to right), 오른쪽에서 왼쪽(Right to left), 양방향(Bi-directional) 검색을 할 수 있다. 형태소 분석 모듈(131)은 추출된 어절에 포함된 형태소의 후보들을 생성한다. 후보들의 생성 방법에 따라, 머리-꼬리(Head-tail) 구분법 등의 방법을 이용할 수 있다. 형태소 분석 모듈(131)은 생성된 후보들에 대하여 음운 현상 등에 따른 결합 문제를 검사한다. 후보들의 결합 문제 검사 방법에 따라, 도표 분석(Tabular Phasing)법, 최장/최단 일치법 등의 방법을 이용할 수 있다. 형태소 분석 모듈(131)은 검사된 후보들에 대하여 사전 탐색, 단어 형성 규칙 등을 고려하여 형태소를 선택한다. 또한, 형태소 분석 모듈(131)은 상술한 형태소 분석 방법 외에도 음절 단위 분석법에 따라 형태소를 분석할 수 있으며, 이에 한정되지 않는다. 그리고, 형태소 분석 모듈(131)은 복합 문장에 포함된 형태소에 대하여 분석 결과에 따라 상응하는 품사 태그를 부여한다.
의미자질 인식 모듈(132)은 의미자질 데이터베이스(121)을 기초로 복합 문장에 포함된 어휘에 대하여 상응하는 의미자질을 부여한다. 구체적으로, 의미자질 인식 모듈(132)은 의미자질 데이터베이스(121)에 저장된 어휘와 상응하는 어휘가 복합 문장에 포함되어 있는지 검색하고, 상응하는 어휘가 검색되면 의미자질 데이터베이스(121)를 참조하여 복합 문장에 포함된 어휘에 의미자질을 부여한다. 특히, 의미자질 인식 모듈(132)은 하나 혹은 복수 개의 형태소가 결합되어 구성된 어휘에 대하여 의미자질을 부여할 수 있다.
개체명 인식 모듈(133)은 개체명 데이터베이스(122)를 기초로 복합 문장에 개체명이 포함되어 있는지 검색하여 개체명을 부여한다. 구체적으로, 개체명 인식 모듈(133)은 개체명 데이터베이스(122)에 저장된 개체명과 상응하는 개체명이 복합 문장에 포함되어 있는지 검색하고, 상응하는 개체명이 검색되면 개체명 데이터베이스(122)를 참조하여 개체명을 부여한다. 특히, 개체명 인식 모듈(133)은 하나의 형태소로 구성된 어휘에 대하여 개체명을 부여할 수 있으나, 이에 한정되지 않고 복수 개의 형태소가 결합되어 구성된 어휘에 대하여 개체명을 부여할 수 있다. 또한, 개체명 인식 모듈(133)은 개체명을 기계 학습하기 위하여, 은닉 마코브 모델(Hidden Markov Model), 서포트 벡터 머신(Support Vector Machines), 조건부 임의 필드 모델(Conditional Random Field Model) 등의 방법을 이용하여 학습된 개체명을 개체명 데이터베이스(122)에 추가로 저장할 수 있다.
복합 문장 분리 모듈(134)은 인터페이스부(110)를 통해 입력 받은 복합 문장을 복수 개의 단문으로 분리한다. 구체적으로, 복합 문장 분리 모듈(134)은 인터페이스부(110)를 통해 입력 받은 복합 문장을 형태소 인식 모듈(131)을 통해 부여된 품사 태그를 기준으로 문장 구조에 따라 복수 개의 단문으로 분리 할 수 있으며, 이에 한정되지 않고 의미자질 인식 모듈(132)을 통해 부여된 의미자질을 기준으로 분리될 단문의 의미 분석을 고려하여 복수 개의 단문으로 분리 할 수 있다.
의미 분석 모듈(135)은 병합 규칙 데이터베이스(123)를 기준으로 복합 문장 분리 모듈(134)을 통해 분리된 복수 개의 단문으로부터 상기 인터페이스부(110)를 통해 입력 받은 복합 문장에 대한 의미표현을 생성한다. 구체적으로, 의미 분석 모듈(135)은 의미자질 인식 모듈(132)과 개체명 인식 모듈(133)을 통해 부여된 의미자질과 개체명을 기초로 복합 문장 분리 모듈(134)을 통해 분리된 복수 개의 단문에 대한 의미를 분석하여, 상기 복수 개의 단문 각각에 대한 의미표현을 생성한다.
의미 분석 모듈(135)은 복합 문장 분리 모듈(134)을 통해 분리된 복수 개의 단문의 연결 형태를 판단한다. 구체적으로, 복수 개의 단문의 연결 형태를 판단함에 있어, 복합 문장 분리 모듈(134)을 통해 분리된 복수 개의 단문 각각의 말단에 위치한(즉, 복수 개의 단문을 연결하는) 조사 또는 어휘를 기준으로 판단할 수 있으며, 이에 한정되지 않고, 형태소 분석 모듈(131)을 통해 부여된 품사 태그를 기준으로 판단할 수도 있다. 특히, 복수 개의 단문의 연결 형태에는 병렬형, 선택형, 대조형, 종결형 중 어느 하나가 포함될 수 있으며, 이에 한정되지 않고 복수 개의 단문을 연결할 수 있는 형태라면 모두 포함될 수 있다. 여기서, 병렬형은 복수 개의 단문이 대등적으로 연결된 형태이며, 예컨대, 복수 개의 단문이 "과", "와", "하고", "이고", "이며", "하며", "및", "그리고", "고", "(으)며", "(으)면서", "(는)데" 등의 조사 또는 어휘로 연결된 경우 이에 해당된다. 선택형은 복수 개의 단문이 선택적으로 연결된 형태이며, 예컨대, 복수 개의 단문이 "(이)나", "(이)든지", "또는", "거나" 등의 조사 또는 어휘로 연결된 경우 이에 해당한다. 대조형은 복수 개의 단문이 대립적으로 연결된 형태이며, 예컨대, 복수 개의 단문이 "(으)나", "지만", "그러나", "그렇지만" 등으로 연결된 경우 이에 해당된다. 종결형은 하나의 단문 말미에 종결 어미가 위치하고 그 뒤로 새로운 단문이 연결된 형태이며, 예컨대, 하나의 단문 말미에 종결 어미 "다", "자", "라", "니", "구나" 등이 위치하고 그 뒤로 새로운 단문이 연결된 경우 이에 해당한다.
의미 분석 모듈(135)은 병합 규칙 데이터베이스(123)에 대하여 상기 판단된 연결 형태 및 상기 생성된 복수 개의 단문 각각에 대한 의미표현과 상응하는 병합 규칙을 검색한다. 그리고, 의미 분석 모듈(135)은 검색된 병합 규칙에 따라 상기 복수 개의 단문 각각에 대한 의미표현을 병합하여 상기 인터페이스부(110)를 통해 입력 받은 복합 문장에 대한 의미표현을 생성한다.
예컨대, 복합 문장 분석 장치(100)의 인터페이스부(110)에 "전체 화면으로 변경하고 서울 시청으로 가자"라는 문장이 입력되었고, 복합 문장 분리 모듈(134)이 상기 복합 문장을 "전체 화면으로 변경하고"와 "서울 시청으로 가자"라는 두 개의 단문으로 분리하였다고 가정하자.
의미 분석 모듈(135)은 의미자질 인식 모듈(132)과 개체명 인식 모듈(133)을 통해 부여된 의미자질과 개체명을 기초로 상기 두 개의 단문의 의미를 분석하여, 상기 두 개의 단문 각각에 대한 "지도보기_화면변경: 전체화면"과 "길 안내_목적지: 서울 시청"이라는 의미표현을 생성한다. 의미 분석 모듈(135)은 상기 두 개의 단문을 연결하고 있었던 "고"라는 연결 어미를 기준으로 상기 두 개의 단문의 연결 형태가 병렬형이라고 판단한다. 그리고, 의미 분석 모듈(135)은 병합 규칙 데이터베이스(123)에 대하여 상기 판단된 병렬형의 연결 형태 및 상기 생성된 "지도보기_화면변경: 전체화면"과 "길 안내_목적지: 서울 시청"라는 두 개의 의미표현과 상응하는 병합 규칙을 검색한다.
하지만, 상기 두 개의 의미표현은 서로 무관한 의미를 가지는 단문이므로, 의미 분석 모듈(135)은 병합 규칙 데이터베이스(123)로부터 상응하는 병합 규칙을 검색하지 못할 것이다. 따라서, 의미 분석 모듈(135)은 상기 두 개의 단문을 단순히 "지도보기_화면변경: 전체화면 | 길 안내_목적지 서울 시청"로 병합하여, 인터페이스부(110)를 통해 입력 받은 복합 문장에 대한 의미표현을 생성한다.
또 다른 예로, 복합 문장 분석 장치(100)의 인터페이스부(110)에 "고속도로 타고 부산으로 가는데 가장 안 막히는 고속도로 타자"라는 문장이 입력되었고, 복합 문장 분리 모듈(134)이 상기 복합 문장을 "고속도로 타고 부산으로 가는데"와 "가장 안 막히는 고속도로 타자"라는 두 개의 단문으로 분리하였다고 가정하자.
의미 분석 모듈(135)은 의미자질 인식 모듈(132)과 개체명 인식 모듈(133)을 통해 부여된 의미자질과 개체명을 기초로 상기 두 개의 단문의 의미를 분석하여, 상기 두 개의 단문 각각에 대한 "길 안내_경로: 고속도로_목적지: 부산"과 "길 안내_경로: 최대원활: 고속도로"라는 의미표현을 생성한다. 의미 분석 모듈(135)은 상기 두 개의 단문을 연결하고 있었던 "데"라는 연결 어미를 기준으로 상기 두 개의 단문의 연결 형태가 병렬형이라고 판단한다. 그리고, 의미 분석 모듈(135)은 병합 규칙 데이터베이스(123)에 대하여 상기 판단된 병렬형의 연결 형태 및 상기 생성된 "길 안내_경로: 고속도로_목적지: 부산"과 "길 안내_경로: 최대원활: 고속도로"라는 두 개의 의미표현과 상응하는 병합 규칙을 검색한다.
의미 분석 모듈(135)은 병합 규칙 데이터베이스(123)로부터 병렬형으로 연결된 "길 안내_경로: 도로1_목적지: 장소1"와 "길 안내_경로: 옵션: 도로1"라는 두 개의 단문을 "길 안내_경로: 옵션: 도로1_목적지: 장소1"라는 하나의 단문으로 병합할 수 있는 병합 규칙을 검색하고, 상기 검색된 병합 규칙에 따라 상기 생성된 두 개의 의미표현을 "길 안내_경로: 최대원활: 고속도로_목적지: 부산"으로 병합하여, 인터페이스부(110)를 통해 입력 받은 복합 문장에 대한 의미표현을 생성한다.
도 2는 본 발명의 일 실시예에 따라 복합 문장의 의미를 분석하는 과정을 예시하기 위한 도면이다.
도 2의 (2a)를 참조하면, 본 발명의 실시예에 따른 복합 문장 분석 장치(100)는 인터페이스부(110)를 통해 "주유소 들렸다가 서울 시청 가자 가장 가까운 주유소로 가자"라는 복합 문장을 입력 받는다.
(2b)를 참조하면, 형태소 분석 모듈(131)은 (2a)에서 입력 받은 복합 문장에 포함된 형태소를 분석하여 품사 태그를 부여한다. 구체적으로, 형태소 분석 모듈(131)은 "주유소", "서울", "시청"에 대하여 일반명사에 해당하는 "NNG"를, "들"(들리), "가"에 대하여 동사에 해당하는 "VV"를, "렸"(었)에 대하여 선어말 어미에 해당하는 "EP", "다가"에 대하여 연결 어미에 해당하는 "EC", "자"에 대하여 종결 어미에 해당하는 "EF", "가장"에 대하여 부사에 해당하는 "MA", "가까"(가깝)에 대하여 형용사에 해당하는 "VA", "운"(ㄴ)에 대하여 관형형 전성 어미에 해당하는 "ETM", "로"에 대하여 격조사에 해당하는 "JK"를 부여한다.
(2c)를 참조하면, 의미자질 인식 모듈(132)은 의미자질 데이터베이스(121)를 기초로 (2a)에서 입력 받은 복합 문장에 포함된 어휘에 대하여 의미자질을 부여한다. 구체적으로, 의미자질 인식 모듈(132)은 "주유소"에 대하여 "장소", "들렸다가"에 대하여 "경유", "서울 시청"에 대하여 "장소", "가자"에 대하여 "이동", "가장"에 대하여 "최대", "가까운"에 대하여 "근접"이라는 의미자질을 부여한다.
(2d)를 참조하면, 복합 문장 분리 모듈(134)은 (2a)에서 입력 받은 복합 문장을 복수 개의 단문으로 분리한다. 구체적으로, 복합 문장 분리 모듈(134)은 상기 (2b)에서 부여된 종결 어미에 해당하는 "EF"라는 품사 태그 또는 상기 (2c)에서 부여된 의미자질을 기준으로 상기 복합 문장을 "주유소 들렸다가 서울 시청 가자"와 "가장 가까운 주유소로 가자"라는 두 개의 단문으로 분리할 수 있다.
(2e)를 참조하면, 의미 분석 모듈(135)은 (2d)에서 분리된 "주유소 들렸다가 서울 시청 가자"와 "가장 가까운 주유소로 가자"라는 두 개의 단문에 대한 의미를 분석하여, 상기 두 개의 단문 각각에 대한 의미표현을 생성한다. 구체적으로, 의미 분석 모듈(135)은 (2c)에서 부여된 의미자질을 기초로 "주유소 들렸다가 서울 시청 가자"라는 단문의 의미를 분석하여 "길 안내_경유지: 주유소_목적지: 서울 시청"라는 의미표현을 생성하고, "가장 가까운 주유소로 가자"라는 단문의 의미를 분석하여 "길 안내_목적지: 최단거리: 주유소"라는 의미표현을 생성한다.
(2f)를 참조하면, 의미 분석 모듈(135)은 병합 규칙 데이터베이스(123)를 기준으로 상기 생성된 두 개의 의미표현을 병합하여, (2a)에서 입력 받은 복합 문장에 대한 의미표현을 생성한다. 구체적으로, 의미 분석 모듈(135)은 상기 두 개의 단문 사이를 연결하고 있었던 "자"라는 종결 어미를 기준으로 상기 두 개의 단문의 연결 형태가 종결형이라고 판단한다. 의미 분석 모듈(135)은 병합 규칙 데이터베이스(123)에 대하여 상기 판단된 종결형의 연결 형태 및 상기 (2e)에서 생성된 두 개의 의미표현과 상응하는 병합 규칙을 검색한다. 그리고, 의미 분석 모듈(135)은 병합 규칙 데이터베이스(123)로부터 종결형으로 연결된 "길 안내_경유지: 장소1_목적지: 장소2"와 "길 안내_목적지: 옵션: 장소1"라는 두 개의 단문을 "길 안내_경유지: 옵션: 장소1_목적지: 장소2"라는 하나의 단문으로 병합할 수 있는 병합 규칙을 검색하고, 상기 검색된 병합 규칙에 따라 상기 (2e)에서 생성된 두 개의 의미표현을 "길 안내_경유지: 최단거리: 주유소_목적지: 서울 시청"이라는 하나의 의미표현으로 병합하여, (2a)에서 입력 받은 복합 문장에 대한 의미표현을 생성한다.
도 3은 본 발명의 일 실시예에 따른 복합 문장 분석 방법을 예시하는 도면이다.
도 3을 참조하면, 복합 문장 분석 장치(100)의 형태소 분석 모듈(131)은 인터페이스부(110)를 통해 복합 문장을 입력 받는다(S301).
복합 문장 분리 모듈(134)은 S301 단계를 통해 입력 받은 복합 문장을 복수 개의 단문으로 분리한다(S303). 구체적으로, 복합 문장 분리 모듈(134)은 S301 단계를 통해 입력 받은 복합 문장을 문장 구조에 따라 복수 개의 단문으로 분리 할 수 있으며, 이에 한정되지 않고 분리될 단문의 의미 분석을 고려하여 복수 개의 단문으로 분리 할 수 있다.
의미 분석 모듈(135)은 S303 단계를 통해 분리된 복수 개의 단문으로부터 S301 단계를 통해 입력 받은 복합 문장에 대한 의미표현을 생성한다(S305). S305 단계에 대해서는 도 5를 참조하여 보다 구체적으로 설명하기로 한다.
도 4는 본 발명의 일 실시예에 따른 복합 문장 분석 방법을 예시하는 다른 도면이다.
도 4를 참조하면, 복합 문장 분석 장치(100)의 형태소 분석 모듈(131)은 인터페이스부(110)를 통해 복합 문장을 입력 받는다(S401). 그리고, 형태소 분석 모듈(131)은 S401 단계를 통해 입력 받은 복합 문장에 포함된 형태소를 분석하고 분석 결과에 따라 상응하는 품사 태그를 부여한다(S403).
의미자질 인식 모듈(132)은 S401 단계를 통해 입력 받은 복합 문장에 포함된 어휘에 대하여 상응하는 의미자질을 부여한다(S405). 구체적으로, 의미자질 인식 모듈(132)은 의미자질 데이터베이스(121)에 저장된 어휘와 상응하는 어휘가 복합 문장에 포함되어 있는지 검색하고, 상응하는 어휘가 검색되면 의미자질 데이터베이스(121)를 참조하여 의미자질을 부여한다. 특히, 의미자질 인식 모듈(132)은 하나 혹은 복수 개의 형태소가 결합되어 구성된 어휘에 대하여 의미자질을 부여할 수 있다.
개체명 인식 모듈(133)은 개체명 데이터베이스(122)를 기초로 복합 문장에 개체명이 포함되어 있는지 검색하여 개체명을 부여한다(S407). 구체적으로, 개체명 인식 모듈(133)은 개체명 데이터베이스(122)에 저장된 개체명과 상응하는 개체명이 복합 문장에 포함되어 있는지 검색하고, 상응하는 개체명이 검색되면 개체명 데이터베이스(122)를 참조하여 개체명을 부여한다. 개체명 인식 모듈(133)은 하나의 형태소로 구성된 어휘에 대하여 개체명을 부여할 수 있으나, 이에 한정되지 않고 복수 개의 형태소가 결합되어 구성된 어휘에 대하여 개체명을 부여할 수 있다. 또한, 개체명 인식 모듈(133)은 개체명을 기계 학습하기 위하여, 은닉 마코브 모델(Hidden Markov Model), 서포트 벡터 머신(Support Vector Machines), 조건부 임의 필드 모델(Conditional Random Field Model) 등의 방법을 이용하여 학습된 개체명을 개체명 데이터베이스(122)에 추가로 저장할 수 있다.
복합 문장 분리 모듈(134)은 S401 단계를 통해 입력 받은 복합 문장을 복수 개의 단문으로 분리한다(409). 구체적으로, 복합 문장 분리 모듈(134)은 S401 단계를 통해 입력 받은 복합 문장을 문장 구조에 따라 복수 개의 단문으로 분리 할 수 있으며, 이에 한정되지 않고 분리될 단문의 의미 분석을 고려하여 복수 개의 단문으로 분리 할 수 있다.
의미 분석 모듈(135)은 S409 단계를 통해 분리된 복수 개의 단문으로부터 S401 단계를 통해 입력 받은 복합 문장에 대한 의미표현을 생성한다(S411). S411 단계에 대해서는 도 5를 참조하여 보다 구체적으로 설명하기로 한다.
도 5는 본 발명의 일 실시예에 따라 복수 개의 단문으로부터 복합 문장에 대한 의미표현을 생성하는 방법을 예시하는 도면이다.
도 5를 참조하면, 의미 분석 모듈(135)은 복합 문장 분리 모듈(134)을 통해 분리된 복수 개의 단문에 대한 의미를 분석하여, 상기 복수 개의 단문 각각에 대한 의미표현을 생성한다(S501).
의미 분석 모듈(135)은 복합 문장 분리 모듈(135)을 통해 분리된 복수 개의 단문의 연결 형태를 판단한다(S503). 구체적으로, 복수 개의 단문의 연결 형태를 판단함에 있어, 복합 문장 분리 모듈(134)을 통해 분리된 복수 개의 단문 각각의 말단에 위치한(즉, 복수 개의 단문을 연결하는) 조사 또는 어휘를 기준으로 판단할 수 있으며, 이에 한정되지 않고, 형태소 분석 모듈(131)을 통해 부여된 품사 태그를 기준으로 판단할 수도 있다. 특히, 복수 개의 단문의 연결 형태에는 병렬형, 선택형, 대조형, 종결형 중 어느 하나가 포함될 수 있으며, 이에 한정되지 않고 복수 개의 단문을 연결할 수 있는 형태라면 모두 포함될 수 있다. 여기서, 병렬형은 복수 개의 단문이 대등적으로 연결된 형태이며, 예컨대, 복수 개의 단문이 "과", "와", "하고", "이고", "이며", "하며", "및", "그리고", "고", "(으)며", "(으)면서", "(는)데" 등의 조사 또는 어휘로 연결된 경우 이에 해당된다. 선택형은 복수 개의 단문이 선택적으로 연결된 형태이며, 예컨대, 복수 개의 단문이 "(이)나", "(이)든지", "또는", "거나" 등의 조사 또는 어휘로 연결된 경우 이에 해당한다. 대조형은 복수 개의 단문이 대립적으로 연결된 형태이며, 예컨대, 복수 개의 단문이 "(으)나", "지만", "그러나", "그렇지만" 등으로 연결된 경우 이에 해당된다. 종결형은 하나의 단문 말미에 종결 어미가 위치하고 그 뒤로 새로운 단문이 연결된 형태이며, 예컨대, 하나의 단문 말미에 종결 어미 "다", "자", "라", "니", "구나" 등이 위치하고 그 뒤로 새로운 단문이 연결된 경우 이에 해당한다.
의미 분석 모듈(135)은 병합 규칙 데이터베이스(123)에 대하여 상기 S503 단계를 통해 판단된 연결 형태 및 상기 S501 단계를 통해 생성된 복수 개의 의미표현과 상응하는 병합 규칙을 검색한다(S505).
그리고, 의미 분석 모듈(135)은 S505 단계를 통해 검색된 병합 규칙에 따라 상기 S501 단계를 통해 생성된 복수 개의 의미표현을 병합하여 복합 문장에 대한 의미표현을 생성한다(S507).
본 발명의 실시예에 따른 복합 문장 분석 장치(100)는 복합 문장을 의미 분석에 보다 유리한 복수 개의 단문으로 분리하여 의미 분석함으로써, 복합 문장의 보다 명확한 의미 분석을 가능하게 한다. 특히, 복합 문장 분석 장치(100)는 복합 문장으로부터 분리된 복수 개의 단문의 의미를 분석한 후 분석된 단문의 의미와 단문의 연결 형태를 고려하여 하나의 의미표현을 생성함으로써, 복합 문장에 포함된 화자의 진정한 의도를 규명할 수 있다.
본 발명에 따른 실시예는 다양한 수단, 예를 들어, 하드웨어, 펌웨어(firmware), 소프트웨어 또는 그것들의 결합 등에 의해 구현될 수 있다. 하드웨어에 의한 구현의 경우, 본 발명의 일 실시예는 하나 또는 그 이상의 ASICs(application specific integrated circuits), DSPs(digital signal processors), DSPDs(digital signal processing devices), PLDs(programmable logic devices), FPGAs(field programmable gate arrays), 프로세서, 콘트롤러, 마이크로 콘트롤러, 마이크로 프로세서 등에 의해 구현될 수 있다.
또한, 펌웨어나 소프트웨어에 의한 구현의 경우, 본 발명의 일 실시예는 이상에서 설명된 기능 또는 동작들을 수행하는 모듈, 절차, 함수 등의 형태로 구현되어, 다양한 컴퓨터 수단을 통하여 판독 가능한 기록매체에 기록될 수 있다. 여기서, 기록매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 기록매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 예컨대 기록매체는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(Magnetic Media), CD-ROM(Compact Disk Read Only Memory), DVD(Digital Video Disk)와 같은 광 기록 매체(Optical Media), 플롭티컬 디스크(Floptical Disk)와 같은 자기-광 매체(Magneto-Optical Media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치를 포함한다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함할 수 있다.
이상과 같이, 본 명세서와 도면에는 본 발명의 바람직한 실시예에 대하여 개시하였으나, 여기에 개시된 실시예외에도 본 발명의 기술적 사상에 바탕을 둔 다른 변형 예들이 실시 가능하다는 것은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 자명한 것이다. 또한, 본 명세서와 도면에서 특정 용어들이 사용되었으나, 이는 단지 본 발명의 기술 내용을 쉽게 설명하고 발명의 이해를 돕기 위한 일반적인 의미에서 사용된 것이지, 본 발명의 범위를 한정하고자 하는 것은 아니다. 따라서, 상술한 상세한 설명은 모든 면에서 제한적으로 해석되어서는 아니 되고 예시적인 것으로 고려되어야 한다. 본 발명의 범위는 첨부된 청구항의 합리적 해석에 의해 선정되어야 하고, 본 발명의 등가적 범위 내에서의 모든 변경은 본 발명의 범위에 포함된다.
아울러, 본 발명에 따른 장치나 단말은 하나 이상의 프로세서로 하여금 앞서 설명한 기능들과 프로세스를 수행하도록 하는 명령에 의하여 구동될 수 있다. 예를 들어 그러한 명령으로는, 예컨대 JavaScript나 ECMAScript 명령 등의 스크립트 명령과 같은 해석되는 명령이나 실행 가능한 코드 혹은 컴퓨터로 판독 가능한 매체에 저장되는 기타의 명령이 포함될 수 있다. 나아가 본 발명에 따른 장치는 서버 팜(Server Farm)과 같이 네트워크에 걸쳐서 분산형으로 구현될 수 있으며, 혹은 단일의 컴퓨터 장치에서 구현될 수도 있다.
또한, 본 발명에 따른 장치에 탑재되고 본 발명에 따른 방법을 실행하는 컴퓨터 프로그램(프로그램, 소프트웨어, 소프트웨어 어플리케이션, 스크립트 혹은 코드로도 알려져 있음)은 컴파일 되거나 해석된 언어나 선험적 혹은 절차적 언어를 포함하는 프로그래밍 언어의 어떠한 형태로도 작성될 수 있으며, 독립형 프로그램이나 모듈, 컴포넌트, 서브루틴 혹은 컴퓨터 환경에서 사용하기에 적합한 다른 유닛을 포함하여 어떠한 형태로도 전개될 수 있다. 컴퓨터 프로그램은 파일 시스템의 파일에 반드시 대응하는 것은 아니다. 프로그램은 요청된 프로그램에 제공되는 단일 파일 내에, 혹은 다중의 상호 작용하는 파일(예컨대, 하나 이상의 모듈, 하위 프로그램 혹은 코드의 일부를 저장하는 파일) 내에, 혹은 다른 프로그램이나 데이터를 보유하는 파일의 일부(예컨대, 마크업 언어 문서 내에 저장되는 하나 이상의 스크립트) 내에 저장될 수 있다. 컴퓨터 프로그램은 하나의 사이트에 위치하거나 복수의 사이트에 걸쳐서 분산되어 통신 네트워크에 의해 상호 접속된 다중 컴퓨터나 하나의 컴퓨터 상에서 실행되도록 전개될 수 있다.
아울러, 본 발명에 따른 실시예를 설명하는데 있어서, 특정한 순서로 도면에서 동작들을 묘사하고 있지만, 이는 바람직한 결과를 얻기 위하여 도시된 그 특정한 순서나 순차적인 순서대로 그러한 동작들을 수행하여야 한다거나 모든 도시된 동작들이 수행되어야 하는 것으로 이해되어서는 안 된다. 특정한 경우, 멀티태스킹과 병렬 프로세싱이 유리할 수 있다. 또한, 상술한 실시형태의 다양한 시스템 컴포넌트의 분리는 그러한 분리를 모든 실시형태에서 요구하는 것으로 이해되어서는 안되며, 설명한 프로그램 컴포넌트와 시스템들은 일반적으로 단일의 소프트웨어 제품으로 함께 통합되거나 다중 소프트웨어 제품에 패키징될 수 있다는 점을 이해하여야 한다.
본 발명에 따른 복합 문장 분석 장치는 대화형 질의 응답 시스템, 음성 대화를 통한 사용자 장치 운용 등 다양한 대화체 문장 의미 분석을 기반으로 하는 기술 분야에 적용하는 것이 가능하다.
100: 복합 문장 분석 장치 110: 인터페이스부
120: 저장부 121: 의미자질 데이터베이스
122: 개체명 데이터베이스 123: 병합 규칙 데이터베이스
130: 제어부 131: 형태소 분석 모듈
132: 의미자질 인식 모듈 133: 개체명 인식 모듈
134: 복합 문장 분리 모듈 135: 의미 분석 모듈

Claims (7)

  1. 복수 개의 단문이 연결된 복합 문장을 입력 받는 인터페이스부;
    상기 입력 받은 복합 문장을 복수 개의 단문으로 분리하는 복합 문장 분리 모듈; 및
    상기 분리된 복수 개의 단문으로부터 상기 입력 받은 복합 문장에 대한 의미표현을 생성하는 의미 분석 모듈;을 포함하고,
    상기 의미 분석 모듈은
    상기 복수 개의 단문 각각에 대한 의미표현을 병합하여 상기 복합 문장에 포함된 화자의 의도를 나타내는 의미표현을 생성하는 복합 문장 분석 장치.
  2. 제 1항에 있어서,
    복수 개의 단문이 의미 분석되어 생성된 복수 개의 의미 표현을 하나의 의미표현으로 병합하기 위한 병합 규칙을 포함하는 병합 규칙 데이터베이스;
    를 더 포함하는 복합 문장 분석 장치.
  3. 제 2항에 있어서,
    상기 병합 규칙은 상기 복합 문장을 구성하는 복수 개의 단문의 연결 형태 및 의미 표현을 기준으로 정의되고,
    상기 연결 형태는 병렬형, 선택형, 대조형 및 종결형 중 어느 하나를 포함하는 복합 문장 분석 장치.
  4. 제 2항에 있어서,
    상기 의미 분석 모듈은
    상기 분리된 복수 개의 단문에 대한 의미를 분석하여 각각의 의미표현을 생성하고, 상기 분리된 복수 개의 단문의 연결 형태를 판단하며, 상기 병합 규칙 데이터베이스에서 상기 판단된 연결 형태 및 상기 생성된 의미표현과 상응하는 병합 규칙을 검색하고, 상기 검색된 병합 규칙에 따라 상기 분리된 복수 개의 단문의 의미표현을 병합하는 복합 문장 분석 장치.
  5. 제 1항에 있어서,
    상기 입력 받은 복합 문장에 포함된 형태소를 분석하여 품사 태그를 부여하는 형태소 분석 모듈;을 더 포함하고,
    상기 복합 문장 분리 모듈은
    상기 부여된 품사 태그를 기준으로 상기 입력 받은 복합 문장을 복수 개의 단문으로 분리하는 복합 문장 분석 장치.
  6. 제 1항에 있어서,
    상기 입력 받은 복합 문장에 포함된 어휘에 대하여 의미자질을 부여하는 의미자질 인식 모듈; 및
    상기 의미자질이 부여된 복합 문장에 개체명이 포함되어 있는지 검색하여 개체명을 부여하는 개체명 인식 모듈;을 더 포함하고,
    상기 의미 분석 모듈은
    상기 부여된 의미자질과 개체명을 기초로 상기 분리된 복수 개의 단문에 대한 의미를 분석하여 각각에 대한 의미표현을 생성하는 복합 문장 분석 장치.
  7. 복수 개의 단문이 연결된 복합 문장을 입력 받는 단계;
    상기 입력 받은 복합 문장을 복수 개의 단문으로 분리하는 단계; 및
    상기 분리된 복수 개의 단문으로부터 상기 입력 받은 복합 문장에 대한 의미표현을 생성하는 단계;를 포함하고,
    상기 생성하는 단계는
    상기 복수 개의 단문 각각에 대한 의미표현을 병합하는 단계; 및
    상기 복합 문장에 포함된 화자의 의도를 나타내는 의미표현을 생성하는 단계;
    를 포함하는 복합 문장 분석 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 판독할 수 있는 기록매체.
KR1020200103630A 2020-08-19 2020-08-19 복합 문장 분석 장치, 이를 위한 기록매체 KR20200101891A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200103630A KR20200101891A (ko) 2020-08-19 2020-08-19 복합 문장 분석 장치, 이를 위한 기록매체

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200103630A KR20200101891A (ko) 2020-08-19 2020-08-19 복합 문장 분석 장치, 이를 위한 기록매체

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020130122002A Division KR102147670B1 (ko) 2013-10-14 2013-10-14 복합 문장 분석 장치, 이를 위한 기록매체

Publications (1)

Publication Number Publication Date
KR20200101891A true KR20200101891A (ko) 2020-08-28

Family

ID=72265886

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200103630A KR20200101891A (ko) 2020-08-19 2020-08-19 복합 문장 분석 장치, 이를 위한 기록매체

Country Status (1)

Country Link
KR (1) KR20200101891A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102558933B1 (ko) * 2022-08-19 2023-07-25 델타인덱스주식회사 시간 조건을 포함한 한글 요구사항을 위한 체계적 테스트 케이스 생성 방법 및 장치

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050036303A (ko) 2003-10-15 2005-04-20 한국전자통신연구원 대화체 연속음성인식을 위한 의사형태소 기반다중발음사전 구축 방법 및 그 시스템과 이를 이용한대화체 음성인식 방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050036303A (ko) 2003-10-15 2005-04-20 한국전자통신연구원 대화체 연속음성인식을 위한 의사형태소 기반다중발음사전 구축 방법 및 그 시스템과 이를 이용한대화체 음성인식 방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102558933B1 (ko) * 2022-08-19 2023-07-25 델타인덱스주식회사 시간 조건을 포함한 한글 요구사항을 위한 체계적 테스트 케이스 생성 방법 및 장치

Similar Documents

Publication Publication Date Title
Tur et al. Spoken language understanding: Systems for extracting semantic information from speech
US7158934B2 (en) Speech recognition with feedback from natural language processing for adaptation of acoustic model
US7286987B2 (en) Multi-phoneme streamer and knowledge representation speech recognition system and method
US7072837B2 (en) Method for processing initially recognized speech in a speech recognition session
US8566102B1 (en) System and method of automating a spoken dialogue service
Watts Unsupervised learning for text-to-speech synthesis
Kumar et al. A knowledge graph based speech interface for question answering systems
WO2009014465A2 (en) System and method for multilingual translation of communicative speech
Bonneau-Maynard et al. Results of the French Evalda-Media evaluation campaign for literal understanding
Hasegawa-Johnson et al. Grapheme-to-phoneme transduction for cross-language ASR
KR102106797B1 (ko) 복합 문장 분석 장치, 이를 위한 기록매체
KR20110068491A (ko) 문법 오류 시뮬레이션 장치 및 방법
KR101097186B1 (ko) 대화체 앞뒤 문장정보를 이용한 다국어 음성합성 시스템 및 방법
Gustafson Developing multimodal spoken dialogue systems: Empirical studies of spoken human–computer interaction
KR20200101891A (ko) 복합 문장 분석 장치, 이를 위한 기록매체
Minker et al. Spoken dialogue systems technology and design
Ronzhin et al. Survey of russian speech recognition systems
Turunen Jaspis-a spoken dialogue architecture and its applications
KR102147670B1 (ko) 복합 문장 분석 장치, 이를 위한 기록매체
Noormamode et al. A speech engine for mauritian creole
Jackson Automatic speech recognition: Human computer interface for kinyarwanda language
Bose Natural Language Processing: Current state and future directions
Liu et al. Emotion-Aware Prosodic Phrasing for Expressive Text-to-Speech
KR20150042532A (ko) 복합 문장 분석 장치, 이를 위한 기록매체
Kumar et al. An automatic spontaneous speech recognition system for Punjabi language

Legal Events

Date Code Title Description
A107 Divisional application of patent
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
X091 Application refused [patent]
AMND Amendment
X601 Decision of rejection after re-examination