KR101508070B1 - 어휘지도를 이용한 용언의 다의어 의미 분석 방법 - Google Patents

어휘지도를 이용한 용언의 다의어 의미 분석 방법 Download PDF

Info

Publication number
KR101508070B1
KR101508070B1 KR20130157614A KR20130157614A KR101508070B1 KR 101508070 B1 KR101508070 B1 KR 101508070B1 KR 20130157614 A KR20130157614 A KR 20130157614A KR 20130157614 A KR20130157614 A KR 20130157614A KR 101508070 B1 KR101508070 B1 KR 101508070B1
Authority
KR
South Korea
Prior art keywords
noun
verb
word
vocabulary
sentence
Prior art date
Application number
KR20130157614A
Other languages
English (en)
Inventor
옥철영
배영준
Original Assignee
울산대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 울산대학교 산학협력단 filed Critical 울산대학교 산학협력단
Priority to KR20130157614A priority Critical patent/KR101508070B1/ko
Application granted granted Critical
Publication of KR101508070B1 publication Critical patent/KR101508070B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/117Tagging; Marking up; Designating a block; Setting of attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 어휘지도(UWordMap)를 이용한 용언의 다의어 의미 분석 방법에 관한 것으로, 입력된 문장의 형태소를 분석하는 형태소 분석단계, 동형이의어를 분석하는 동형이의어 분석단계, 상기 단계를 통해 분석된 문장에서 동사와 형용사를 찾고, 그 앞의 논항을 검색하여 종속격조사가 검색되면 그 앞의 명사를 해당 논항 명사를 용언과 함께 저장하는 논항 추출단계, 추출된 논항에 대하여 어휘지도와의 비교를 통하여 다의어에 가중치를 부여하는 가중치 측정단계, 가중치가 부여된 다의어에 대하여 어휘지도에 저장된 해당 용언과의 관계를 확인한 후 용언의 다의어를 결정하는 다의어 결정단계를 포함하는 어휘지도를 이용한 용언의 다의어 의미 분석 방법에 관한 것이다.

Description

어휘지도를 이용한 용언의 다의어 의미 분석 방법{Method for word sense diambiguration of polysemy predicates using UWordMap}
본 발명은 용언의 다의어 의미 분석 방법에 관한 것으로, 더욱 상세하게는 어휘지도를 이용하는 용언의 다의어 의미 분석을 통하여 용언의 의미 중의성을 해소하고 의미 분석 정확도가 향상된 어휘지도를 이용한 용언의 다의어 의미 분석방법에 관한 것이다.
지식 정보화 사회에서 고도화된 맞춤형 정보와 지식을 추출하기 위해 다양한 종류의 데이터 정보를 정확히 분석하기 위한 방법에 대한 개발이 진행되고 있다. 특히 데이터 중 텍스트로 된 언어자원과 관련된 개발에서는 단어의 의미 또는 문맥의 의미를 분석하기 위한 방법에 대한 개발이 활발히 진행되고 있다. 그러나 특정 단어가 가지는 의미의 수가 다양할수록 그리고 이러한 단어들의 빈도가 높은 문서일수록 의미 분석 복잡도가 상승하기 때문에 정확한 의미 분석은 어려워지며, 이러한 의미 분석을 통해 제공되는 정보는 정확성이 부족한 경향이 있다. 예를 들면 정보검색에서 사용자가 ‘맛있는 배’를 검색어로 입력했을 경우 사람은 ‘과일 배’로 인지하여 의미에 맞는 문서를 결과로 제시할 수 있지만, 컴퓨터는 의미를 구분하지 못해 단순히 일치되는 단어 ‘배’{과일, 신체부위, 기계, …}가 포함된 모든 문서를 검색결과로 제시한다. 그러나 이를 적절히 분류하여 ‘과일 배’가 포함된 문서만을 결과로 제시한다면 보다 정확성이 높은 다의어 의미 분석 방법이 될 수 있다.
이러한 문제를 해결하기 위해 단어의 다의어 의미 분석을 위한 방법들이 개발되고 있다. 크게 두 부류의 방법으로 나눌 수 있는데, 대용량 말뭉치를 바탕으로 베이지안 분류기, 결정 트리, 신경망, CRF(Conditional random fields), SVM(Support vector machine)등의 기계학습 기법의 통계정보에 기반을 둔 방법과 기계가독형 사전, 시소러스(동의어 및 반의어 사전), 온톨로지(ontology), 의미망, 연어 등의 정보를 이용한 지식정보에 기반을 둔 방법으로 나눌 수 있다.
그러나 기존의 의미 분석 방법 대부분이 동형이의어 중의성 의미 분석을 위한 것이거나 학습된 말뭉치를 기반으로 하고 다의어 의미 분석을 이용하여 의미 중의성 해소를 시도하는 방법이었다.
한편, 용언의 다의어 의미 분석에 관한 방법 중 종속격 정보를 적용한 동사 의미 분석과 관련된 방법에 대한 개발이 있었다. 해당 방법에서는 공기빈도(co-occurrence frequency)와 더불어 목적격, 부사격, 보격 정보를 활용하였다. 이 방법은 12개의 동사를 대상으로 높은 정확률을 보였지만, 동형이의어 단위의 의미 분석 방법이었다.
또한, 한국어 동사의 의미 중의성 해소에 관하여 문맥에서 추출한 가중치 정보를 이용한 모델을 제안하는 방법도 있었다. 약 300만 어절의 사전에서 추출한 공기관계의 문맥에서 얻은 품사정보와 거리정보를 사용하였다. 다의어 수준의 동사 '감다, 피우다, 빠지다, 타다' 4개를 대상으로 한 방법 개발이 있었다.
대한민국 등록특허 10-1070371
본 발명은 의미 분석에서 다의어 기반으로 구축된 어휘지도를 이용하여 용언의 다의어 의미 분석을 함으로써 다의어 중의성을 해소하며, 의미 분석의 정확률이 향상된 어휘지도를 이용한 용언의 다의어 의미 분석 방법을 제공하는 데에 그 목적이 있다.
입력된 문장의 형태소를 분석하는 형태소 분석단계, 상기 형태소 분석단계에서 분석된 문장의 동형이의어를 분석하는 동형이의어 분석단계, 상기 형태소 분석단계와 상기 동형이의어 분석단계를 거친 문장에 대하여 동사와 형용사를 찾고, 동사 또는 형용사 앞의 논항이 종속격조사인지 검색하며 동사 또는 형용사 앞의 명사를 해당 논항 명사로 용언과 함께 저장하는 논항 추출단계, 상기 논항 추출단계에서 저장된 명사를 어휘지도에 저장된 명사와 비교하여 다의어에 가중치를 부여하는 가중치 측정단계, 상기 가중치 측정단계에서 가중치가 부여된 다의어에 대하여 상기 어휘지도에 저장된 용언과 비교한 후 용언의 다의어를 결정하는 다의어 결정단계를 포함할 수 있다.
상기 논항 측정단계에서 상기 종속격조사는 주격조사, 목적격조사, 부사격조사 중 어느 하나를 포함할 수 있다.
상기 가중치 측정단계에서 상기 어휘지도에 저장된 논항 명사의 명사어휘망 내 위치를 확인한 후 상위탐색을 통한 확장검색 기능을 더 포함할 수 있다.
상기 형태소 분석단계에서 품사 태그 부착 말뭉치를 사용하는 용언의 다의어 의미 분석 방법을 더 포함할 수 있다.
상기 형태소 분석단계에서 품사 및 동형이의어 태그 부착 말뭉치를 사용하는 용언의 다의어 의미 분석 방법을 더 포함할 수 있다.
상기와 같이 구성된 본 발명에 따른 어휘지도를 이용한 용언의 다의어 의미 분석 방법에 의하면, 다의어 단위 중의성을 해소하며, 의미 분석의 정확률을 상승시키는 효과가 있다.
도 1은 본 발명에 따른 다의어 의미 분석 과정을 도시한 구성도,
도 2는 용언의 다의어를 분석하는 실시예를 나타낸 도면이다.
본 발명은 다양한 변형 및 여러 가지 실시예를 가질 수 있는바, 특정 실시예들을 도면에 예시하고 상세한 설명에 보다 상세하게 설명하고자 한다. 본 발명을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.
이하, 본 발명의 바람직한 실시예를 첨부된 도면을 참조하여 상세히 설명하기로 한다.
도 1은 본 발명에 따른 다의어 의미 분석 과정을 도시한 구성도이다.
도 1을 참조하면, 문장이 입력되면 다의어 의미 분석이 시작된다. 다의어 의미 분석 방법은 형태소 분석단계(S110), 동형이의어 분석단계(S120), 논항 추출단계(S130), 가중치 측정단계(S140), 다의어 결정단계(S150)를 포함한다.
상기 형태소 분석단계(S110)에서는 입력된 문장의 형태소를 분석한다.
상기 동형이의어 분석단계(S120)에서는 상기 형태소 분석단계(S110)에서 분석된 문장의 동형이의어를 분석하고 각 의미에 따라 문장을 구분한다.
상기 논항 추출단계(S130)에서는 상기 형태소 분석단계(S110)와 상기 동형이의어 분석단계(S120)를 거친 문장에 대하여 동사와 형용사를 찾고, 그 앞의 논항을 검색하여 종속격조사가 검색되면 그 앞의 명사를 해당 논항 명사로 용언과 함께 저장한다.
또한, 종속격조사는 주격조사, 목적격조사, 부사격조사 중 어느 하나를 포함한다.
상기 가중치 측정단계(S140)에서는 상기 논항 추출단계(S130)에서 저장된 명사를 어휘지도(UWordMap)(200)에 저장된 명사와 비교하여 다의어에 가중치를 부여한다.
상기 어휘지도(200)는 표준국어대사전을 기반으로 한국어 어휘의 다의적 수준의 통사-의미 관계를 구축한 어휘지식베이스이다. 상기 어휘지도(200)는 U-WIN(User Word Intelligent Network)을 기반으로 구축되었다. U-WIN은 한국어의 고통적이고 개별적인 속성을 바탕으로 한국인의 보편적인 인지 체계와 개념 관계를 파악하여 이를 어휘의 의미적, 개념적 네트워크를 형성한 온톨로지적 의미망이다. U-WIN은 품사 간의 관계, 주로 같은 품사인 명사들 간의 다양한 관계에 중심이 맞춰져 구축되었다. 상기 어휘지도(200)는 이러한 U-WIN의 관계를 기반으로 일부만 존재하던 다른 품사 간의 연결 정보에 의한 구문관계와 의미관계를 보다 확장하여 구축되었다.
상기 어휘지도(200)는 구문관계에 의한 용언과 명사 등의 하위범주 정보와 용언과 부사의 관계, 부사와 부사의 관계와 의미관계에 의한 용언과 관련된 명사의 의미역등이 구축되어 있다.
상기 어휘지도(200)는 구문관계에 의한 용언과 명사 등의 하위범주화 정보 뿐 아니라, 용언과 부사의 관계, 부사와 부사의 관계와 의미관계에 의한 용언과 관련된 명사의 의미역 등이 확장 구축되고 있다. 구문 관계의 주요 대상이 되는 용언 중 말뭉치에 출현 빈도가 높은 용언은 대부분 구축되었고 출현 빈도가 낮은 용언은 구축 중에 있다.
도 2는 용언의 다의어를 분석하는 일실시예를 나타낸 것이다.
일실시예로써 실험데이터로 "영수가 밥을 먹다."라는 문장이 입력되면 '밥'의 명사어휘망 내의 위치에서 상위탐색을 통해 논항 관계가 설정되어 있는 '음식물'을 발견하면 실험데이터의 '먹다'를 다의어 '먹다 020101'로 설정하게 된다.
상기 어휘지도(200)의 하위범주 정보는 최소상위공통노드(least common subsumer)로 설정되어 있어 다의어와 용언이 직접적으로 연결된 관계를 찾지 못하는 경우도 있다.
상기 가중치 측정단계(S140)는 상기 어휘지도(200)의 다의어와 용언이 직접적으로 연결된 관계가 찾아지지 않는 경우 상기 어휘지도(200)의 논항 명사의 명사어휘망 내의 위치확인 후 상위탐색을 통한 확장검색을 하는 기능을 더 포함한다.
상기 다의어 결정단계(S150)에서는 상기 가중치가 부여된 다의어에 대하여 어휘지도(200)에 저장된 해당 용언과의 관계를 확인한 후 용언의 다의어를 결정한다.
다른 실시예로, 표준국어대사전의 용언 중 옛말, 북한말, 방언을 제외한 다의어 52224개 중 상기 어휘지도(200)에 포함된 15514개의 다의어 용언을 대상으로 하여 표준국어대사전의 용례 216809개의 문장에 대하여 동의어 의미 분석을 실시하였다. 실험 말뭉치는 품사 태그 부착 말뭉치와 품사 및 동형이의어 태그 부착 말뭉치를 대상으로 하였으며, 정답 말뭉치는 용례에 다의어 의미 태그를 반자동으로 부착하고 전문가가 확인 후 수정하는 방식으로 실시하였다.
품사 태그 부착 말뭉치를 사용한 경우 다의어 단위 정확률은 67.65% 이다. 품사 및 동형이의어 태그 부착 말뭉치를 사용한 경우 다의어 단위 정확률은 77.22%이다. 품사 및 동형이의어 태그 부착 말뭉치를 사용한 경우, 품사 태그 부착 말뭉치를 사용한 경우보다 약 10%가량 정확률이 높다.
본 명세서에 기재된 본 발명의 실시예와 도면에 도시된 구성은 본 발명의 가장 바람직한 실시예에 관한 것이고, 발명의 기술적 사상을 모두 포괄하는 것은 아니므로, 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형예들이 있을 수 있음을 이해하여야 한다. 따라서 본 발명은 상술한 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변형실시가 가능한 것은 물론이고, 그와 같은 변경은 청구범위 기재의 권리범위 내에 있게 된다.
S110: 형태소 분석단계
S120: 동형이의어 분석단계
S130: 논항 추출단계
S140: 가중치 측정단계
200: 어휘지도DB
S150: 다의어 결정단계

Claims (5)

  1. 입력된 문장의 형태소를 분석하는 형태소 분석단계;
    상기 형태소 분석단계에서 분석된 문장의 동형이의어를 분석하는 동형이의어 분석단계;
    상기 형태소 분석단계와 상기 동형이의어 분석단계를 거친 문장에 대하여 동사와 형용사를 찾고, 동사 또는 형용사 앞의 논항이 종속격조사인지 검색하며 동사 또는 형용사 앞의 명사를 해당 논항 명사로 용언과 함께 저장하는 논항 추출단계;
    상기 논항 추출단계에서 저장된 명사를 어휘지도에 저장된 명사와 비교하여 다의어에 가중치를 부여하는 가중치 측정단계; 및
    상기 가중치 측정단계에서 가중치가 부여된 다의어에 대하여 상기 어휘지도에 저장된 용언과 비교한 후 용언의 다의어를 결정하는 다의어 결정단계;를 포함하며,
    상기 어휘지도는 구문관계에 의한 용언과 명사의 하위범주 정보와 용언과 부사의 관계, 부사와 부사의 관계와 의미관계에 의한 용언과 관련된 명사의 의미역이 구축되고,
    상기 어휘지도의 하위범주 정보는 최소상위공통노드(least common subsumer)로 설정하며,
    상기 다의어 결정단계에서, 특정 문장이 입력되면 상기 특정 문장내의 '명사'를 상기 어휘지도의 명사어휘망 내의 위치에서 상위탐색을 통해 논항 관계가 설정되어 있는 '다른 명사'를 발견하여 상기 '명사'를 해당 다의어로 설정하는 것을 특징으로 하는 는 용언의 다의어 의미 분석 방법.
  2. 제 1항에 있어서, 상기 논항 측정단계에서
    상기 종속격조사는 주격조사, 목적격조사, 부사격조사 중 어느 하나를 포함하는 용언의 다의어 의미 분석 방법.
  3. 제 1항에 있어서, 상기 가중치 측정단계에서
    상기 어휘지도에 저장된 논항 명사의 명사어휘망 내 위치를 확인한 후 상위탐색을 통한 확장검색 기능을 더 포함하는 용언의 다의어 의미 분석 방법.
  4. 제 1항에 있어서, 상기 형태소 분석단계에서
    품사 태그 부착 말뭉치를 사용하는 용언의 다의어 의미 분석 방법.
  5. 제 1항에 있어서, 상기 형태소 분석단계에서
    품사 및 동형이의어 태그 부착 말뭉치를 사용하는 용언의 다의어 의미 분석 방법.
KR20130157614A 2013-12-17 2013-12-17 어휘지도를 이용한 용언의 다의어 의미 분석 방법 KR101508070B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR20130157614A KR101508070B1 (ko) 2013-12-17 2013-12-17 어휘지도를 이용한 용언의 다의어 의미 분석 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR20130157614A KR101508070B1 (ko) 2013-12-17 2013-12-17 어휘지도를 이용한 용언의 다의어 의미 분석 방법

Publications (1)

Publication Number Publication Date
KR101508070B1 true KR101508070B1 (ko) 2015-04-07

Family

ID=53032275

Family Applications (1)

Application Number Title Priority Date Filing Date
KR20130157614A KR101508070B1 (ko) 2013-12-17 2013-12-17 어휘지도를 이용한 용언의 다의어 의미 분석 방법

Country Status (1)

Country Link
KR (1) KR101508070B1 (ko)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170073354A (ko) * 2015-12-18 2017-06-28 한국전자통신연구원 문장 유사도 기반 다의어 데이터베이스 확장장치 및 그 방법
KR101797365B1 (ko) * 2016-06-15 2017-11-15 울산대학교 산학협력단 어휘 의미망을 이용한 단어 의미 임베딩 장치 및 방법
KR101799681B1 (ko) * 2016-06-15 2017-11-20 울산대학교 산학협력단 어휘 의미망 및 단어 임베딩을 이용한 동형이의어 분별 장치 및 방법
WO2017217661A1 (ko) * 2016-06-15 2017-12-21 울산대학교 산학협력단 어휘 의미망을 이용한 단어 의미 임베딩 장치 및 방법과, 어휘 의미망 및 단어 임베딩을 이용한 동형이의어 분별 장치 및 방법
KR20180079838A (ko) * 2017-01-03 2018-07-11 네이버 주식회사 개체명 연결 방법, 장치 및 컴퓨터 프로그램
KR20180113444A (ko) * 2017-04-06 2018-10-16 네이버 주식회사 개체명 연결 방법, 장치, 시스템 및 컴퓨터 프로그램
CN109635125A (zh) * 2018-12-20 2019-04-16 广东小天才科技有限公司 一种词汇图谱搭建方法及电子设备
KR20200082559A (ko) * 2018-12-31 2020-07-08 경희대학교 산학협력단 한글 형태소 분석 장치 및 방법
KR20220129713A (ko) * 2021-03-16 2022-09-26 주식회사 웨이센 복수 의미 유형 단어의 단일 의미 유형 단어로의 라벨링 방법

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100030835A (ko) * 2008-09-11 2010-03-19 에스케이 텔레콤주식회사 논항 분석 장치, 논항 분석 방법, 저장 매체, 정보 제공 시스템, 정보 제공 서비스 서버 및 정보 제공 방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100030835A (ko) * 2008-09-11 2010-03-19 에스케이 텔레콤주식회사 논항 분석 장치, 논항 분석 방법, 저장 매체, 정보 제공 시스템, 정보 제공 서비스 서버 및 정보 제공 방법

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
김준수 외 2명, ‘가중치를 이용한 통계 기반 한국어 동형이의어 분별 모델’, 한국정보과학회논문지: 소프트웨어 및 응용 제30권 제11호, pp. 1112-1123, 2003.12
김준수 외 2명, '가중치를 이용한 통계 기반 한국어 동형이의어 분별 모델', 한국정보과학회논문지: 소프트웨어 및 응용 제30권 제11호, pp. 1112-1123, 2003.12 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170073354A (ko) * 2015-12-18 2017-06-28 한국전자통신연구원 문장 유사도 기반 다의어 데이터베이스 확장장치 및 그 방법
US10984318B2 (en) 2016-06-15 2021-04-20 University Of Ulsan Foundation For Industry Cooperation Word semantic embedding apparatus and method using lexical semantic network and homograph disambiguating apparatus and method using lexical semantic network and word embedding
KR101797365B1 (ko) * 2016-06-15 2017-11-15 울산대학교 산학협력단 어휘 의미망을 이용한 단어 의미 임베딩 장치 및 방법
KR101799681B1 (ko) * 2016-06-15 2017-11-20 울산대학교 산학협력단 어휘 의미망 및 단어 임베딩을 이용한 동형이의어 분별 장치 및 방법
WO2017217661A1 (ko) * 2016-06-15 2017-12-21 울산대학교 산학협력단 어휘 의미망을 이용한 단어 의미 임베딩 장치 및 방법과, 어휘 의미망 및 단어 임베딩을 이용한 동형이의어 분별 장치 및 방법
KR20180079838A (ko) * 2017-01-03 2018-07-11 네이버 주식회사 개체명 연결 방법, 장치 및 컴퓨터 프로그램
KR101890207B1 (ko) * 2017-01-03 2018-08-22 네이버 주식회사 개체명 연결 방법, 장치 및 컴퓨터 프로그램
KR20180113444A (ko) * 2017-04-06 2018-10-16 네이버 주식회사 개체명 연결 방법, 장치, 시스템 및 컴퓨터 프로그램
KR102053419B1 (ko) * 2017-04-06 2019-12-09 네이버 주식회사 개체명 연결 방법, 장치, 시스템 및 컴퓨터 프로그램
CN109635125B (zh) * 2018-12-20 2021-01-26 广东小天才科技有限公司 一种词汇图谱搭建方法及电子设备
CN109635125A (zh) * 2018-12-20 2019-04-16 广东小天才科技有限公司 一种词汇图谱搭建方法及电子设备
KR20200082559A (ko) * 2018-12-31 2020-07-08 경희대학교 산학협력단 한글 형태소 분석 장치 및 방법
KR102171373B1 (ko) 2018-12-31 2020-10-28 경희대학교 산학협력단 한글 형태소 분석 장치 및 방법
KR20220129713A (ko) * 2021-03-16 2022-09-26 주식회사 웨이센 복수 의미 유형 단어의 단일 의미 유형 단어로의 라벨링 방법
KR102579293B1 (ko) 2021-03-16 2023-09-18 주식회사 웨이센 복수 의미 유형 단어의 단일 의미 유형 단어로의 라벨링 방법

Similar Documents

Publication Publication Date Title
KR101508070B1 (ko) 어휘지도를 이용한 용언의 다의어 의미 분석 방법
US10496928B2 (en) Non-factoid question-answering system and method
AU2016269573B2 (en) Input entity identification from natural language text information
US20100332217A1 (en) Method for text improvement via linguistic abstractions
Ramisch et al. mwetoolkit: A framework for multiword expression identification.
US9483460B2 (en) Automated formation of specialized dictionaries
US20100205198A1 (en) Search query disambiguation
JP2013502643A (ja) 構造化データ翻訳装置、システム及び方法
US9600469B2 (en) Method for detecting grammatical errors, error detection device for same and computer-readable recording medium having method recorded thereon
Higashinaka et al. Syntactic filtering and content-based retrieval of twitter sentences for the generation of system utterances in dialogue systems
US11068653B2 (en) System and method for context-based abbreviation disambiguation using machine learning on synonyms of abbreviation expansions
US11893537B2 (en) Linguistic analysis of seed documents and peer groups
JP2011118689A (ja) 検索方法及びシステム
KR20120064559A (ko) 오픈 웹 질의응답을 위한 질문분석 장치 및 방법
Garrido et al. GEO-NASS: A semantic tagging experience from geographical data on the media
Quan et al. Combine sentiment lexicon and dependency parsing for sentiment classification
JP6106489B2 (ja) 語義解析装置、及びプログラム
US11210471B2 (en) Machine learning based quantification of performance impact of data veracity
Liebeskind et al. An algorithmic scheme for statistical thesaurus construction in a morphologically rich language
CN111814025A (zh) 一种观点提取方法及装置
Magnolini A Survey on Paraphrase Recognition.
Malumba et al. AfriWeb: a web search engine for a marginalized language
US11928427B2 (en) Linguistic analysis of seed documents and peer groups
Schäfer et al. Advances in deep parsing of scholarly paper content
Florou Detecting metaphor by contextual analogy

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20190212

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20200213

Year of fee payment: 6