KR20160060822A - 용언의 문형정보를 이용한 선택 제약 사전 구축 방법 및 시스템 - Google Patents

용언의 문형정보를 이용한 선택 제약 사전 구축 방법 및 시스템 Download PDF

Info

Publication number
KR20160060822A
KR20160060822A KR1020140162399A KR20140162399A KR20160060822A KR 20160060822 A KR20160060822 A KR 20160060822A KR 1020140162399 A KR1020140162399 A KR 1020140162399A KR 20140162399 A KR20140162399 A KR 20140162399A KR 20160060822 A KR20160060822 A KR 20160060822A
Authority
KR
South Korea
Prior art keywords
sentence
predicate
verb
dictionary
path
Prior art date
Application number
KR1020140162399A
Other languages
English (en)
Other versions
KR101709185B1 (ko
Inventor
임수종
김영래
김현기
류법모
배용진
오효정
이충희
이형직
임준호
장명길
최미란
허정
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020140162399A priority Critical patent/KR101709185B1/ko
Publication of KR20160060822A publication Critical patent/KR20160060822A/ko
Application granted granted Critical
Publication of KR101709185B1 publication Critical patent/KR101709185B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 용언의 문형정보를 이용한 선택 제약 사전 구축 방법을 제공한다. 상기 용언의 문형정보를 이용한 선택 제약 사전 구축 방법은 용언의 문형정보를 획득하는 단계, 상기 획득한 용언의 문형정보에서 용언을 추출하고, 상기 추출된 용언이 포함된 용례 문장을 검색하는 단계, 상기 검색된 용례 문장의 의미를 분석하여 상기 용언과 다른 의미의 용언이 포함된 용례 문장을 필터링하는 단계, 상기 필터링된 용례 문장의 구문을 분석하여 상기 용언과 관련 없는 구성 성분을 필터링하는 단계, 상기 필터링된 용례 문장에서 선택 제약 대상을 선택하고, 어휘 의미망을 이용하여 상기 선택된 선택 제약 대상의 상위 경로를 추출하는 단계 및 상기 추출된 상위 경로들의 비교를 통해 상기 용언에 대한 선택 제약 경로를 설정하고, 상기 설정된 선택 제약 경로를 이용하여 상기 용언에 대한 선택 제약 사전을 구축하는 단계를 포함한다.

Description

용언의 문형정보를 이용한 선택 제약 사전 구축 방법 {METHOD FOR BUILDING SELECTIONAL RESTRICTION DICTIONARY USING SENTENCE PATTERN OF PREDICATE}
본 발명은 전자 사전 구축 방법에 관한 것으로서, 보다 상세하게는 문장의 용언과 관련된 정보를 이용하여 문장의 구조와 의미를 파악하기 위한 선택 제약 사전을 구축하는 방법에 관한 것이다.
자연어 처리 기술은 인간이 사용하는 자연어를 기계적으로 분석하여 컴퓨터가 이해할 수 있는 인공언어 형태로 만드는 기술이다.
자연어 처리 기술은 크게 형태소 분석 단계, 구문 분석 단계, 의미 분석 단계, 담화 분석 단계, 단어 및 문장 생성 단계로 구분된다.
이 중, 구문 분석 단계는 형태소 분석 결과를 기반으로 문장을 이루고 있는 구성 성분을 추출하여 이들 사이의 관계를 분석함으로써 문장의 문법적 구조를 결정하는 단계이다.
의미 분석 단계는 문장을 구성하는 단어들의 의미를 구분하고, 문장의 구성 성분들 사이의 의미적 관계를 분석함으로써 문장 전체의 의미를 파악하는 단계이다.
이러한 구문 분석 단계 및 의미 분석 단계를 위해 필요한 종래의 선택 제약 사전은 언어전문가의 수작업으로 구축하는 방법과 고정된 의미 체계 및 말뭉치를 이용하여 반자동으로 구축하는 방법이 있다.
그러나, 전자의 방법을 이용하는 '세종 전자 사전'은 일곱 계층, 581개의 의미 분류 체계를 모두 수작업으로 구축하여 정확도는 높지만 시간 및 비용 소모가 매우 큰 문제점이 있다(도 1은 '세종 전자 사전'의 의미 분류 체계의 예시를 나타낸다).
후자의 방법은 반자동으로 구축하여 작업 효율은 높지만 동사 별로 달라지는 의미의 분류 정도를 결정하기 힘든 문제점이 있다.
예컨대, 'X가 Y에 타다'라는 문형의 경우(여기서 '타다'는 '탈것이나 짐승의 등 따위에 몸을 얹다'의 뜻), 말뭉치를 이용하여 자동으로 분석하면 아래와 같다.
[고갱[X:사람]은 1865년 견습선원이 되어 상선[Y:교통기관]에 탔으나]
이때의 주어 '고갱'은 [사람]이라는 의미 분류로 충분하지만,
[남자는 여자가 아이를 낳을 수 있게 피했다]
이때의 용언 '낳다'에 대한 주어 '여자'는 [사람]이라는 의미 분류보다 세분화된 [여자]라는 의미 계층으로 분류될 필요가 있다.
즉, 후자의 방법은 용언 별로 의미 분류의 정도를 다르게 설정되어야 하는 문제점을 해결할 수 없고, 의미 분류 체계가 달라질 경우 구축한 정보를 달라진 체계에 맞게 모두 수정해야 하는 문제점이 있다.
본 발명은 전술한 문제점을 해결하기 위하여, 의미 분류 체계를 고정화하지 않고 한국어의 어휘 의미망을 이용하여 용언 별로 적합한 의미 개념을 자동으로 설정하는 용언의 문형정보를 이용한 선택 제약 사전 구축 방법을 제공하는 것을 목적으로 한다.
상술한 목적을 달성하기 위한 본 발명의 일면에 따른 용언의 문형정보를 이용한 선택 제약 사전 구축 방법은 용언의 문형정보를 획득하는 단계, 상기 획득한 용언의 문형정보에서 용언을 추출하고, 상기 추출된 용언이 포함된 용례 문장을 검색하는 단계, 상기 검색된 용례 문장의 의미를 분석하여 상기 용언과 다른 의미의 용언이 포함된 용례 문장을 필터링하는 단계, 상기 필터링된 용례 문장의 구문을 분석하여 상기 용언과 관련 없는 구성 성분을 필터링하는 단계, 상기 필터링된 용례 문장에서 선택 제약 대상을 선택하고, 어휘 의미망을 이용하여 상기 선택된 선택 제약 대상의 상위 경로를 추출하는 단계 및 상기 추출된 상위 경로들의 비교를 통해 상기 용언에 대한 선택 제약 경로를 설정하고, 상기 설정된 선택 제약 경로를 이용하여 상기 용언에 대한 선택 제약 사전을 구축하는 단계를 포함한다.
본 발명에 따르면, 용언의 문형정보를 이용하여 선택 제약 사전을 자동으로 구축함으로써 구축에 필요한 시간과 비용을 절약할 수 있는 이점을 제공한다. 또한, 어휘 의미망 변경에 따라 선택 제약 정보를 재구축하는 번거로움을 해소할 수 있는 이점을 제공한다.
도 1은 종래기술에 따른 세종 전자 사전의 의미 분류 체계의 예시를 나타낸 도면이다.
도 2는 본 발명의 일실시예에 따른 용언의 문형정보를 이용한 선택 제약 사전 구축 방법의 과정을 나타낸 흐름도이다.
도 3은 본 발명의 일실시예에 따른 용언의 문형정보를 이용한 선택 제약 사전 구축 방법을 이용한 선택 제약 사전 구축 시스템의 구성을 나타낸 블록도이다.
본 발명의 전술한 목적 및 그 이외의 목적과 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다.
그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 이하의 실시예들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 발명의 목적, 구성 및 효과를 용이하게 알려주기 위해 제공되는 것일 뿐으로서 본 발명의 권리범위는 청구항의 기재에 의해 정하여진다.
한편, 본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 본 명세서에서 사용되는 "포함한다(comprises)" 및/또는 "포함하는(comprising)"은 언급된 구성소자, 단계, 동작 및/또는 소자에 하나 이상의 다른 구성소자, 단계, 동작 및/또는 소자의 존재 또는 추가됨을 배제하지 않는다.
이하, 본 발명의 따른 실시예를 첨부된 도면을 참조하여 상세하게 설명하도록 한다.
도 2는 본 발명의 일실시예에 따른 용언의 문형정보를 이용한 선택 제약 사전 구축 방법의 과정을 나타낸 흐름도이다.
도 2에 도시된 바와 같이, 본 발명의 일실시예에 따른 용언의 문형정보를 이용한 선택 제약 사전 구축 방법은 먼저, 말뭉치에서 용언의 문형정보를 획득한다(S200). 여기서, 말뭉치는 다양한 형태의 문장이 포함된 정보로서, 전자 사전에서 획득한 것일 수 있다.
예컨대,'탈것이나 짐승의 등 따위에 몸을 얹다'의 의미를 갖는 용언 '타다'에 대한 선택 제약 사전을 구축할 경우, 전자 사전에서 용언 '타다'에 대한 문형정보('~에 타다', '~을 타다' 등)를 획득할 수 있다.
용언의 문형정보가 획득되면, 획득한 용언의 문형정보에서 용언을 추출한다(S210).
예컨대, 획득한 용언의 문형정보가 '~에 타다', '~을 타다'이면, 여기서 용언 '타다'를 추출할 수 있다.
용언이 추출되면, 추출된 용언이 포함된 용례 문장을 검색하고(S220), 검색된 용례 문장의 의미를 분석하여 추출된 용언과 다른 의미의 용언이 포함된 용례 문장을 필터링한다(S230).
이때, 텍스트 빅데이터를 기반으로 용례 문장 또는 용례 문장의 의미를 검색할 수 있으며, 문장의 의미를 분석하는 기술은 공지된 기술이므로 구체적인 설명은 생략한다.
예컨대, 추출된 용언 '타다'가 포함된 용례 문장을 검색한 결과가 하기와 같으며,
1. [고갱]은 1865년 견습선원이 되어 [상선]에 탔으나
2. [숭렬전]은 정유재란 때 [불]에 타서
용례 문장 1 및 2의 의미를 분석한 결과, 용례 문장 2는 '탈것이나 짐승의 등 따위에 몸을 얹다'의 '타다'와는 다른 의미를 갖는 용언 '타다'가 포함된 용례 문장이므로 필터링될 수 있다.
검색된 용례 문장들 중에서 다른 의미의 용언이 포함된 용례 문장이 필터링되면, 필터링된 용례 문장의 구문을 분석하여 용례 문장에서 추출된 용언과 관련 없는 구성 성분을 필터링한다(S240).
예컨대, 필터링되고 남은 전술한 용례 문장 1의 구문을 분석한 결과, '1865년', '견습선원이', '되어'는 용언 '타다'와 관계없는 구성 성분들로 판단되면, 이들을 용례 문장에서 필터링할 수 있다.
필터링 과정이 완료되면, 필터링된 용례 문장에서 선택 제약 대상을 선택한다(S250). 여기서, 선택 제약 대상은 필터링되고 남은 문장에서 '명사' 역할을 하는 구성 성분일 수 있다.
예컨대, 필터링 과정이 완료된 결과가 하기와 같으면,
3. [고갱]은 [상선]에 탔으나
4. [그들]이 [차]에 탔다
5. [그녀]는 [엘리베이터]에 탔다
6. [모터사이클]에 타는 [안전원]
7. [비행기]에 타다
8. [버스]에 타신 [승객]에게
선택되는 선택 제약 대상은 '고갱', '상선', '그들;, '차', '그녀', '엘리베이터', '모터사이클', '안전원', '비행기', '버스', '승객'일 수 있다.
선택 제약 대상이 선택되면, 어휘 의미망을 이용하여 조사 별 선택 제약 대상의 상위 경로를 추출한다(S260). 이때, 어휘의미망은 한국어의 KorLex 또는 UwordMap일 수 있다.
전술한 예에 대해, 조사 '이' 및 '에'에 대해 추출된 상위 경로는 표 1과 같을 수 있다.
구분 상위 경로(→)
그들 남자 사람 동물 생물
그녀 여자 사람 동물 생물
안전원 사람 동물 생물
승객 손님 이용자 사람 동물 생물
교통기관 기계장치 기계
엘리베이터 운반기계 기계장치 기계
모터사이클 자전거 이륜차 교통기관 기계장치 기계
비행기 항공기 교통기관 기계장치 기계
버스 대형자동차 자동차 교통기관 기계장치 기계
앞자리 자리 공간
상기에 대해서는 조사 '이', '에'에 대해서만 상위 경로를 추출하였으나, 주격 조사 '은, 는, 이, 가'가 포함된 용례 문장이 검색되는 경우, 이에 해당하는 상위 경로 또한 전술한 방법으로 추출될 수 있음은 물론이다.
상위 경로가 추출되면, 추출된 상위 경로 중에서 공통적으로 해당하는 경로를 추출하고, 추출된 공통 경로들을 비교하여 공통 경로들 중에서 길이가 가장 긴 공통 경로를 최종적인 선택 제약 경로로 설정한다(S270).
예컨대, 추출된 선택 제약 경로 중에서 조사 '이'에 대한 최종 선택 제약 경로는 '사람→동물→생물'로 결정될 수 있으며, 조사 '에'에 대한 최종 선택 제약 경로는 '교통기관→기계장치→기계'로 설정될 수 있다.
이때, '엘리베이터', '앞자리'와 같이 최종 설정된 선택 제약 경로가 매칭되지 않은 구성 성분이 존재할 경우, 추가적으로 용례 문장을 수집하는 단계 및 수집된 용례 문장 및 어휘 의미망을 이용하여 선택 제약 경로를 검증하는 단계를 더 포함할 수 있다.
최종적인 선택 제약 경로가 설정되면, 설정된 선택 제약 경로에 대한 정보를 이용하여 선택 제약 사전을 구축하고(S280), 특정 용언의 문형에 해당하는 의미 정보를 사용자에게 제공할 수 있다.
도 3은 본 발명의 일실시예에 따른 용언의 문형정보를 이용한 선택 제약 사전 구축 방법을 이용한 선택 제약 사전 구축 시스템의 구성을 나타낸 블록도이다.
본 발명의 일실시예에 따른 선택 제약 사전 구축 방법을 이용한 선택 제약 사전 구축 시스템(100)은 정보획득부(110), 용언추출부(120), 필터링부(130), 경로추출부(140) 및 사전구축부(150)를 포함한다.
정보획득부(110)는 말뭉치에서 용언의 문형정보를 획득하여 획득한 용언의 문형정보에 대한 데이터를 용언추출부(120)로 제공한다. 여기서, 말뭉치는 다양한 형태의 문장이 포함된 정보로서, 정보획득부(110)는 전자 사전(10)에서 용언의 문형정보를 획득할 수 있다.
용언추출부(120)는 정보획득부(110)로부터 용언의 문형정보에 대한 데이터를 제공 받아 획득한 용언의 문형정보에서 용언을 추출하고, 추출된 용언에 대한 데이터를 필터링부(130)로 제공한다.
필터링부(130)는 용언추출부(120)로부터 용언에 대한 데이터를 제공 받아 추출된 용언이 포함된 용례 문장을 검색하고, 검색된 용례 문장의 의미를 분석하여 추출된 용언과 다른 의미의 용언이 포함된 용례 문장을 필터링한다.
이때, 필터링부(130)는 텍스트 빅데이터(20)를 기반으로 용례 문장 또는 용례 문장의 의미를 검색할 수 있으며, 문장의 의미를 분석하는 기술은 공지된 기술이므로 구체적인 설명은 생략한다.
다른 의미의 용언이 포함된 용례 문장이 필터링되면, 필터링부(130)는 필터링된 용례 문장의 구문을 분석하여 용례 문장에서 추출된 용언과 관련 없는 구성 성분을 필터링하고, 필터링된 용례 문장에 대한 데이터를 경로추출부(140)로 제공한다.
경로추출부(140)는 필터링부(130)로부터 필터링된 용례 문장에 대한 데이터를 제공 받아 필터링된 용례 문장에서 선택 제약 대상을 선택한다. 여기서, 선택 제약 대상은 필터링되고 남은 문장에서 '명사' 역할을 하는 구성 성분일 수 있다.
선택 제약 대상의 선택이 완료되면, 경로추출부(140)는 어휘 의미망(30)을 이용하여 조사 별 선택 제약 대상의 상위 경로를 추출하고, 추출된 선택 제약 대상의 상위 경로에 대한 데이터를 사전구축부(150)로 제공한다. 이때, 어휘의미망은 한국어의 KorLex 또는 UwordMap일 수 있다.
사전구축부(150)는 경로추출부(140)로부터 추출된 선택 제약 대사의 상위 경로에 대한 데이터를 제공 받아 추출된 상위 경로 중에서 공통적으로 해당하는 경로를 추출하고, 추출된 공통 경로들을 비교하여 공통 경로들 중에서 길이가 가장 긴 공통 경로를 최종적인 선택 제약 경로로 설정한다.
이때, 최종 설정된 선택 제약 경로가 매칭되지 않은 구성 성분이 존재할 경우, 사전구축부(150)는 추가적으로 용례 문장을 수집하고, 수집된 용례 문장 및 어휘 의미망(30)을 이용하여 선택 제약 경로를 검증할 수 있다.
최종적인 선택 제약 경로가 설정되면, 사전구축부(150)는 설정된 선택 제약 경로에 대한 정보를 이용하여 선택 제약 사전을 구축하고, 특정 용언의 문형에 해당하는 의미 정보를 사용자에게 제공할 수 있다.
본 발명에 따르면 용언에 대한 선택 제약 정보를 효율적으로 구축할 수 있고, 다양한 목적에 따라 어휘 의미망이 변경되어도 기설정된 선택 제약 정보를 재구축할 필요가 없는 이점을 제공한다.
이와 같이, 선택 제약 사전을 자동으로 확장 구축 또는 검증함으로써 구문 구조나 의미역 부착된 문장에 기반한 의미 수준의 텍스트 이해를 통해 자연어 질의 응답(Natural Language Question Answering) 시스템, 텍스트 마이닝(Text Mining) 기술, 의미기반 정보검색(Semantic Based Information Retrieval), 자동번역(Machine Translation) 시스템, 정보추출(Information Extraction)에 중요한 기술로 사용될 수 있다.
문장 단위 분석 기술인 구문 분석텍스트 및 의미역 인식 기술의 정확성을 높임으로써 의미 기반 지식 서비스를 활성화하여 전체적인 텍스트 빅데이터의 활용도를 높일 수 있는 이점을 제공한다.
이상의 설명은 본 발명의 기술적 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적 특성을 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능하다.
따라서 본 발명에 표현된 실시예들은 본 발명의 기술적 사상을 한정하는 것이 아니라, 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 권리범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 특허청구범위에 의하여 해석되어야 하고 그와 동등하거나 균등한 범위 내에 있는 모든 기술적 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.

Claims (1)

  1. 용언의 문형정보를 획득하는 단계;
    상기 획득한 용언의 문형정보에서 용언을 추출하고, 상기 추출된 용언이 포함된 용례 문장을 검색하는 단계;
    상기 검색된 용례 문장의 의미를 분석하여 상기 용언과 다른 의미의 용언이 포함된 용례 문장을 필터링하는 단계;
    상기 필터링된 용례 문장의 구문을 분석하여 상기 용언과 관련 없는 구성 성분을 필터링하는 단계;
    상기 필터링된 용례 문장에서 선택 제약 대상을 선택하고, 어휘 의미망을 이용하여 상기 선택된 선택 제약 대상의 상위 경로를 추출하는 단계; 및
    상기 추출된 상위 경로들의 비교를 통해 상기 용언에 대한 선택 제약 경로를 설정하고, 상기 설정된 선택 제약 경로를 이용하여 상기 용언에 대한 선택 제약 사전을 구축하는 단계
    를 포함하는 용언의 문형정보를 이용한 선택 제약 사전 구축 방법.
KR1020140162399A 2014-11-20 2014-11-20 용언의 문형정보를 이용한 선택 제약 사전 구축 방법 및 시스템 KR101709185B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020140162399A KR101709185B1 (ko) 2014-11-20 2014-11-20 용언의 문형정보를 이용한 선택 제약 사전 구축 방법 및 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140162399A KR101709185B1 (ko) 2014-11-20 2014-11-20 용언의 문형정보를 이용한 선택 제약 사전 구축 방법 및 시스템

Publications (2)

Publication Number Publication Date
KR20160060822A true KR20160060822A (ko) 2016-05-31
KR101709185B1 KR101709185B1 (ko) 2017-02-23

Family

ID=56098841

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140162399A KR101709185B1 (ko) 2014-11-20 2014-11-20 용언의 문형정보를 이용한 선택 제약 사전 구축 방법 및 시스템

Country Status (1)

Country Link
KR (1) KR101709185B1 (ko)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020048715A (ko) * 2000-12-18 2002-06-24 오길록 한국어 표준 문형 규칙에 의한 표준 문형 유도 장치 및 그방법
KR20080019948A (ko) * 2006-08-29 2008-03-05 울산대학교 산학협력단 사전을 기반으로 하는 어휘지능망 구축방법 및 이를 통해구축된 어휘지능망
KR20090015604A (ko) * 2007-08-09 2009-02-12 한국전자통신연구원 번역 지식 구축 방법 및 장치
KR20150082783A (ko) * 2014-01-08 2015-07-16 한국전자통신연구원 텍스트 빅데이터 기반 의미 프레임 운용 방법 및 이를 지원하는 장치

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020048715A (ko) * 2000-12-18 2002-06-24 오길록 한국어 표준 문형 규칙에 의한 표준 문형 유도 장치 및 그방법
KR20080019948A (ko) * 2006-08-29 2008-03-05 울산대학교 산학협력단 사전을 기반으로 하는 어휘지능망 구축방법 및 이를 통해구축된 어휘지능망
KR20090015604A (ko) * 2007-08-09 2009-02-12 한국전자통신연구원 번역 지식 구축 방법 및 장치
KR20150082783A (ko) * 2014-01-08 2015-07-16 한국전자통신연구원 텍스트 빅데이터 기반 의미 프레임 운용 방법 및 이를 지원하는 장치

Also Published As

Publication number Publication date
KR101709185B1 (ko) 2017-02-23

Similar Documents

Publication Publication Date Title
Faure et al. First experiments of using semantic knowledge learned by ASIUM for information extraction task using INTEX
Baldwin et al. Extracting the unextractable: A case study on verb-particles
EP1793318A2 (en) Answer determination for natural language questionning
KR20160060247A (ko) 자연어 질의응답 시스템과 방법 및 패러프라이즈 모듈
US8375033B2 (en) Information retrieval through identification of prominent notions
CN102169495A (zh) 行业词典生成方法及装置
CN105320644B (zh) 一种基于规则的自动汉语句法分析方法
Vincze et al. Dependency parsing for identifying Hungarian light verb constructions
CN102654866A (zh) 例句索引创建方法和装置以及例句检索方法和装置
CN109271492A (zh) 一种语料正则表达式的自动生成方法及系统
CN105320650A (zh) 一种机器翻译方法及其系统
CN100424685C (zh) 一种基于标点处理的层次化汉语长句句法分析方法及装置
KR101757222B1 (ko) 한글 문장에 대한 의역 문장 생성 방법
Qiu et al. Syntactic dependencies and distributed word representations for analogy detection and mining
KR20100073163A (ko) 복합 명사 인식 장치 및 그 방법
Kim et al. Design of question answering system with automated question generation
KR101709185B1 (ko) 용언의 문형정보를 이용한 선택 제약 사전 구축 방법 및 시스템
KR20200073524A (ko) 특허 문서의 키프레이즈 추출 장치 및 방법
KR101400548B1 (ko) 문서의 자동 학습 장치와 이를 이용한 문서 자동 학습 방법, 문서의 자동 분류 장치와 이를 이용한 문서 자동 분류 방법
KR101414492B1 (ko) 유사문장 검색장치 및 그 검색방법
Rondon et al. Never-ending multiword expressions learning
KR100513161B1 (ko) 기계번역 대역어 선정을 위한 한국어 복합명사 의미결정장치 및 방법
WO2010067142A1 (en) A method using contextual analysis, semantic analysis and artificial intelligence in text search engines
Yasukawa et al. Phonetic Matching in Japanese.
CN111814025A (zh) 一种观点提取方法及装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20200128

Year of fee payment: 4