KR101045762B1 - 실시간 시맨틱 어노테이션 장치 및 이를 활용하여 사용자가입력한 자연어 스트링을 실시간으로 의미 가독형 지식 구조 문서로 생성하는 방법 - Google Patents

실시간 시맨틱 어노테이션 장치 및 이를 활용하여 사용자가입력한 자연어 스트링을 실시간으로 의미 가독형 지식 구조 문서로 생성하는 방법 Download PDF

Info

Publication number
KR101045762B1
KR101045762B1 KR1020080108474A KR20080108474A KR101045762B1 KR 101045762 B1 KR101045762 B1 KR 101045762B1 KR 1020080108474 A KR1020080108474 A KR 1020080108474A KR 20080108474 A KR20080108474 A KR 20080108474A KR 101045762 B1 KR101045762 B1 KR 101045762B1
Authority
KR
South Korea
Prior art keywords
semantic
triple
input
natural language
real
Prior art date
Application number
KR1020080108474A
Other languages
English (en)
Other versions
KR20100049353A (ko
Inventor
최기선
안진현
정재은
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Priority to KR1020080108474A priority Critical patent/KR101045762B1/ko
Priority to US12/610,882 priority patent/US20100114563A1/en
Priority to EP09174899A priority patent/EP2182447A1/en
Publication of KR20100049353A publication Critical patent/KR20100049353A/ko
Application granted granted Critical
Publication of KR101045762B1 publication Critical patent/KR101045762B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/169Annotation, e.g. comment data or footnotes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Abstract

본 발명은 실시간 시맨틱 어노테이션 장치 및 이를 이용하여 사용자가 입력한 자연어 문자열을 실시간으로 의미 가독형 지식 구조로 변환하는 방법에 관한 것으로,
본 발명에 따른 실시간 시맨틱 어노테이션 장치는, 사용자로 하여금 자연어 문자열을 입력하게 하는 입력 장치부; 정규 표현식으로 표현된 자연어 문자열과 그에 대응되는 트리플(triplet)이 기술된 문자열 패턴-트리플 매핑 테이블; 패턴-트리플 매핑 테이블을 활용해서 상기 입력된 자연어 문자열을 해석 처리하여 트리플 형태로 변환 시키는 트리플 추출장치; 사용자가 입력하고자 하는 내용의 정확한 의미 파악을 위해 대체 단어를 추천하는 대체 단어 추천장치; 및 의미 가독형 지식 구조를 활용하여 상기 추출된 트리플들을 기계 가독형 문서로 변환하는 기계 가독형 문서 생성부를 포함한다.
시맨틱, 실시간 어노테이션, 온톨로지, 위키

Description

실시간 시맨틱 어노테이션 장치 및 이를 활용하여 사용자가 입력한 자연어 스트링을 실시간으로 의미 가독형 지식 구조 문서로 생성하는 방법{Real-time semantic annotation device and the method of creating ontology documents on-the-fly from natural language strings entered by user}
본 발명은 사용자가 입력 장치를 이용해 입력한 자연어 문자열을 실시간으로 의미 가독형 지식 구조 문서로 변환하는 실시간 시맨틱 어노테이션 장치 및 방법에 관한 것이다. 일상 생활 속에서 모바일 기기를 사용하여 짧은 글의 형태로 생성된 정보를 자동으로 기계 가독형 문서로 변환하고 그것을 웹상의 다른 문서와 연관시킴으로써 일상 생활에서 생성된 정보가 웹상에서 원활히 공유되게 하기 위함이다.
월드와이드웹은 지식 표현에 많은 문제가 있는바, 이를 해결코자 많은 노력이 시도되었다. 이러한 시도된 종래의 기술로는 SHOE(Simple HTML Ontology Extention)을 이용하여 HTML 문서에 어노테이션을 하는 장치가 있으며 (문헌1: J. Heflin, J. Hendler, and S. Luke. Shoe: A knowledge representation language for internet applications. In Technical Report CS-TR-4078, volume UMIACS TR-99-7. Dept. of Computer Science, University of Maryland at College Park, 1999), 웹 브라우저를 통해서 여러 사용자가 협동적으로 주어진 HTML 웹문서를 어노테이션하는 장치로서 웹사이트에 정보가 게시되면 사용자가 자신의 정보나 의견을 제공하여 웹페이지를 편집하는 방법이 있다(문헌2: B. Jung, I. Yoon, H. Lim, F. A. Ramirez-Weber, and D. Petkovic. Annotizer: User-friendly www annotation system for collaboration in research and education environments. In The IASTED International Conference on Web Technolgies, Applciations and Services, WTAS 2006, 2006.). 또한, 사용자가 주어진 문서의 특정 부분을 선택하고 그것을 주어진 의미 가독형 지식 구조를 활용해 어노테이션하는 방법 (문헌 3: M. Backhaus and J. Kelso. Proceedings of the workshop on social and collaborative construction of structured knowledge (ckc 2007) at the 16th international world wide web conference (www2007) banff,canada, may 8, 2007. In N. F. Noy, H. Alani, G. Stumme, P. Mika, Y. Sure, and D. Vrandecic, editors, CKC, volume 273 of CEUR Workshop Proceedings. CEUR-WS.org, 2007.), 및 위키피디어(Wikipedia)의 내용을 검색, 구성, 태깅 및 평가할 수 있는 오픈소스의 SMW(Semantic MediaWiki) 시스템을 확장해서 여러 사용자가 동시에 Wiki 문서를 작성하는 장치가 개시되어 있다.
상기 기술된 종래의 장치 및 방법에서는, 주어진 문서를 분석하여 어노테이션을 하는 것으로 문서의 작성자가 특정 단어를 사용한 의도를 파악할 수가 없기 때문에 정확한 어노테이션을 할 수 없다. 따라서, 본 발명은 문서 작성자가 문서를 작성하는 순간에 실시간으로 어노테이션을 함으로서 상기한 바와 같은 문제점을 해결하기 위해 제공되는 것이다.
상기한 바와 같은 목적을 달성하기 위한 본 발명에 따른 실시간 시맨틱 어노테이션 장치는,
사용자로 하여금 자연어 문자열을 입력하게 하는 자연어 문자열 입력 장치; 자연어 문자열 패턴과 트리플간의 대응관계가 저장된 문자열 패턴-트리플 매핑 테이블; 상기 문자열 패턴-트리플 매핑 테이블을 이용해서 상기 입력된 자연어 문자열로부터 트리플을 추출하는 트리플 추출 장치; 상기 입력된 자연어 문자열 중 의미 가독형 지식 구조 데이터베이스에 없기 때문에 그 의미를 파악하지 못하는 경우 대체 단어를 찾아서 추천해 주는 대체 단어 추천 장치; 및 상기 추출된 트리플을 의미 가독형 지식 구조를 참조해서 기계 가독형 문서를 생성하는 기계 가독형 문서 생성 장치를 포함한다.
상기 자연어 문자열 입력 장치는 사용자가 자연어 문자열을 입력할 수 있는 키보드, 터치 스크린 등의 장치이다.
상기 자연어 문자열 패턴은 정규 표현식, 의존 문법 트리 등 자연어 문자열을 구조적으로 분석할 수 있는 데이터 구조이다.
상기 대체 단어 추천 장치는 사용자가 단어를 입력하는 중에 대체 단어를 인식할 수 있도록 하는 화면 출력 장치, 및 음성 메시지 등의 출력 장치를 포함한다.
상기 의미 가독형 지식 구조 데이터베이스는 OWL (Web Ontology Language), KIF (Knowledge Interchange Format) 등 지식을 기계가 이해할 수 있는 형태로 표현할 수 있는 메시지 포멧을 포함한다.
또한, 상기 기계 가독형 문서 생성 장치는 OWL, KIF 포멧의 문서를 생성하여 화면에 출력하거나 네트워크를 통해서 다른 서버에 저장하는 웹 브라우저를 포함한다.
상기한 바와 같은 본 발명에 따른 실시간 시맨틱 어노테이션 장치 및 방법에 의해서, 사용자가 문자열을 입력하는 매 순간마다 어노테이션이 일어나기 때문에 시맨틱 어노테이션 장치가 처리하기 어려운 단어가 입력되는 경우 사용자로 하여금 대체 단어를 입력할 수 있게 할 수가 있다. 따라서, 어노테이션이 정확하게 이루어질 수 있는 장점이 있다.
또한, 여러 사용자가 동시에 한 가지 주제에 관련된 문자열을 실시간 시맨틱 어노테이션 시스템을 통해 입력하는 경우 의견 충돌 등을 실시간으로 알아낼 수도 있다.
이하, 첨부된 도면을 참조하여 본 발명의 실시예를 상세히 설명한다. 본 발명을 설명함에 있어서 관련된 공지 기능 혹은 구성에 대한 구체적인 설명은 본 발명의 요지를 모호하게 하지 않기 위해 생략한다.
도 1에 나타낸 바와 같이, 본 발명에 따른 실시간 시맨틱 어노테이션 장치는, 자연어 문자열 입력 장치, 트리플 추출 장치, 의미 가독형 지식 구조 문서 생성 장치, 대체 단어 추천 장치, 문자열 패턴-트리플 매핑 테이블, 그리고 의미 가독형 지식구조 데이터베이스를 포함하여 구성된다.
상기 자연어 문자열 입력 장치는 사용자로 하여금 자연어 문자열을 입력할 수 있게 하는 입력 장치와 입력된 내용을 확인할 수 있는 출력 장치로 구성된다. 입력 장치는 키보드, 터치 패드 등 자연어 문자열을 입력할 수 있는 모든 장치가 포함된다. 입력된 내용을 확인할 수 있는 출력 장치는 시각적으로 확인할 수 있는 모니터와 청각적으로 확인할 수 있는 스피커 등 사용자가 어떤 문자열을 입력했는지 알 수 있게 하는 어떠한 장치도 가능하다.
의미 가독형 지식 구조는 아래의 표 1에 나타낸 바와 같이 지식을 기계가 이 해할 수 있는 형태로 구조화한 것을 가리킨다. 이는 클래스와 그것의 속성으로 구성되어 있다. 예를 들어, "Country"는 "hasCapital"이라는 속성을 가지는데 그 속성은 "City"를 목적어로 가져야 한다는 지식이 기술되어 있다. 즉, "<Korea><hasCapital><Seoul>", "<China><hasCapital><Beijing>"과 같은 세부 지식들에 대한 개념이다.
표 1: 의미 가독형 지식 구조 문서의 예
Figure 112008076215845-pat00001
문자열 패턴-트리플 매핑 테이블은 아래 표 2에 나타낸 바와 같이 문자열 패턴과 그에 대응되는 트리플 쌍으로 구성되어 있다. 트리플의 가운데 부분은 상기 의미 가독형 지식 구조의 속성에 대응된다. 표 1은 하나의 예에 해당하는 것으로, "isA", "definedAs", "motivationOf" 등이 표 1에 기술되지 않았지만 또한 가능하다는 것을 유의해야 한다.
표 2: 문자열 패턴-트리플 매핑 테이블의 예
Figure 112008076215845-pat00002
상기 문자열 패턴-트리플 매핑 테이블의 의미는 아래 트리플 추출 장치에서 설명한다. 트리플 추출 장치는 상기 입력된 자연어 문자열을 문자열 패턴-트리플 매핑 테이블에 기반하여 트리플을 추출한다. 먼저 자연어 문자열이 주어지면 그것은 문자열 패턴-트리플 매핑 테이블의 모든 문자열 패턴과 비교한다. 예를 들어, "Tom expresses sorry"이 입력된 경우 표 2의 세 번째 문자열 패턴에 해당한다. 물론 "expresses"가 "express"에 대응된다는 것은 3인칭 접미어인 "es"를 제거하는 간단한 규칙을 구현한 모듈에 의해 알아낼 수 있다. 그 다음은 ARG1과 ARG2에 해당하는 단어가 의미 가독형 지식 구조에 위반되지 않는지 검사하는 단계이다. 예를 들어, "The capital of apple"의 경우 ARG1에 해당하는 단어는 "apple"이다. 그리고 그 문자열 패턴에 대응되는 트리플과 그것의 의미 가독형 지식 구조에 따르면 ARG1은 "country"이어야만 한다. 왜냐하면 표 2에 따르면 "hasCapitalCity"의 range는 "country"라고 의미 가독형 지식 구조에 정의되어 있기 때문이다. "Korea"가 "country"이고 "apple"이 "country"가 아니라는 사실을 알기 위해서는 기계 가 독형 전자 사전을 이용하면 된다. 기계 가독형 전자 사전으로는 WordNet이 대표적이다. 다음은 ARG를 대체하여 트리플 생성하는 단계이다. "The capital of Korea" 문자열이 입력된 경우 ARG1에 해당 하는 단어는 "Korea"이므로 <Korea><hasCapitalCity><*>라는 트리플이 생성된다. 여기서 기호(" * ")표시는 해당 부분에 들어갈 내용이 아직 입력되지 않았다는 것을 의미한다. "The capital of Korea"가 입력되는 순간에 생성되는 기계 가동형 문서는 표 3의 오른쪽 위이다. 즉, 아직 "city"를 입력하지 않았으므로 일단 그 내용이 비어있는 문서가 생성된다. 나머지 내용을 사용자가 입력한 경우, "is Seoul", <T1><isA><Seoul>이라는 트리플이 추출된다. 여기서 T1은 "The capital of Korea"로 부터 추출된 트리플에서 "*" 분을 가리킨다. 따라서, 표 3의 맨 마지막 행에서와 같이 총 2개의 트리플이 추출되게 된다. 이것을 기계 가독형 문서로 바꾸면 표 3의 오른쪽 아래와 같이 된다.
대체 단어 추천 장치는 상기 기술된데로 사용자가 "country"를 입력해야 하는 순간에 "apple"을 입력할 경우 "country"를 입력하라고 알려주는 장치이다. 사용자가 보고 있는 화면에 "country"를 입력하라는 메시지 창을 띄울 수도 있고 음성으로 알려줄 수도 있다.
기계 가독형 문서 생성 장치는 상기 기술된데로 의미 가독형 지식 구조를 참조해서 트리플을 기계 가독형 문서로 생성하는 장치이다. 예를 들어, <Korea><hasCapital><*> 인 경우 "hasCaptial"의 domain은 "Country"이고 range는 "City"라는 사실이 의미 가독형 지식 구조에 기술되어 있으므로 (표 2 참조), "Korea"는 "Country" 클래스 기호 "*"는 "City" 클래스에 대응 된다는 사실을 알 수 있으므로 그와 같은 정보를 XML (Extensible Markup Language) 형태로 표현하면 표 3의 오른쪽 위와 같이 된다.
표 3: 사용자가 입력한 문자열을 처리해서 트리플을 추출하고 기계 가독형 문서를 생성하는 단계를 나타낸 예
Figure 112008076215845-pat00003
이상과 같이 본 발명에 따른 실시간 시맨틱 어노테이션 장치 및 방법은 예시한 표(1 내지 3)를 참조로 하여 설명하였으나, 본 명세서에 개시된 실시예와 도면에 의해 본 발명이 한정되는 것은 아니며, 본 발명의 기술사상 범위내에서 당업자에 의해 다양한 변형이 이루어질 수 있음은 물론이다.
도 1은 본 발명에 따른 실시간 시맨틱 어노테이션 장치를 개념적으로 도시한
블록도이다.

Claims (6)

  1. 다음을 포함하는 실시간 시맨틱 어노테이션 장치:
    사용자로 하여금 자연어 문자열을 입력하게 하는 자연어 문자열 입력 장치;
    자연어 문자열 패턴과 이에 대응하는 트리플 쌍을 저장한 문자열 패턴 트리플-매핑 테이블;
    패턴-트리플 매핑 테이블을 활용해서 상기 입력된 자연어 문자열을 해석 처리하여 트리플 형태로 변환 시키는 트리플 추출장치;
    사용자에게 다른 단어를 입력해야 한다는 사실을 알려주는 대체 단어 추천 장치; 및
    의미 가독형 지식 구조를 활용하여 트리플로부터 기계 가독형 문서를 생성하는 기계 가독형 문서 생성 장치.
  2. 제 1항에 있어서, 자연어 문자열 입력 장치는 문자열을 입력할 수 있는 키보드 및 터치 패드를 포함하는 입력 장치와 입력된 문자열을 눈으로 확인할 수 있는 모니터 및 음성으로 확인할 수 있는 음성 출력 장치를 포함하는 실시간 시맨틱 어노테이션 장치.
  3. 제 1항에 있어서, 문자열 패턴-트리플 매핑 테이블은 문자열 패턴의 ARG 부분이 트리플의 ARG에 대체되도록 한 실시간 시맨틱 어노테이션 장치.
  4. 제 1항에 있어서, 문자열 패턴-트리플 매핑 테이블은 기호(예로서, * ) 표시를 사용하여 앞으로 입력될 내용을 표시하도록 한 실시간 시맨틱 어노테이션 장치.
  5. 제 1항에 있어서, 트리플 추출 장치는 기호(예로서, * ) 표시된 트리플의 히스토리를 기록하고 있다가 그에 해당하는 정보가 입력되면 그 부분을 해당 내용으로 채우도록 한 실시간 시맨틱 어노테이션 장치.
  6. 제 1항에 있어서, 대체 단어 추천 장치는 사용자로 하여금 의미 가독형 지식 구조에 맞는 단어를 입력할 수 있게 대체 단어를 알려주도록 구성된 실시간 시맨틱 어노테이션 장치.
KR1020080108474A 2008-11-03 2008-11-03 실시간 시맨틱 어노테이션 장치 및 이를 활용하여 사용자가입력한 자연어 스트링을 실시간으로 의미 가독형 지식 구조 문서로 생성하는 방법 KR101045762B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020080108474A KR101045762B1 (ko) 2008-11-03 2008-11-03 실시간 시맨틱 어노테이션 장치 및 이를 활용하여 사용자가입력한 자연어 스트링을 실시간으로 의미 가독형 지식 구조 문서로 생성하는 방법
US12/610,882 US20100114563A1 (en) 2008-11-03 2009-11-02 Real-time semantic annotation system and the method of creating ontology documents on the fly from natural language string entered by user
EP09174899A EP2182447A1 (en) 2008-11-03 2009-11-03 Real-time semantic annotation system and the method of creating ontology documents on the fly from natural language string entered by user

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080108474A KR101045762B1 (ko) 2008-11-03 2008-11-03 실시간 시맨틱 어노테이션 장치 및 이를 활용하여 사용자가입력한 자연어 스트링을 실시간으로 의미 가독형 지식 구조 문서로 생성하는 방법

Publications (2)

Publication Number Publication Date
KR20100049353A KR20100049353A (ko) 2010-05-12
KR101045762B1 true KR101045762B1 (ko) 2011-07-01

Family

ID=41531062

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080108474A KR101045762B1 (ko) 2008-11-03 2008-11-03 실시간 시맨틱 어노테이션 장치 및 이를 활용하여 사용자가입력한 자연어 스트링을 실시간으로 의미 가독형 지식 구조 문서로 생성하는 방법

Country Status (3)

Country Link
US (1) US20100114563A1 (ko)
EP (1) EP2182447A1 (ko)
KR (1) KR101045762B1 (ko)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2011201127A1 (en) * 2011-03-14 2012-10-04 Moxy Studios Pty Ltd Collaborative Knowledge Management
JP6200431B2 (ja) * 2011-12-27 2017-09-20 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. テキスト分析システム
KR101662399B1 (ko) * 2014-10-27 2016-10-04 포항공과대학교 산학협력단 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치 및 방법
US9898452B2 (en) 2015-10-16 2018-02-20 International Business Machines Corporation Annotation data generation and overlay for enhancing readability on electronic book image stream service
US10356103B2 (en) 2016-08-31 2019-07-16 Genesys Telecommunications Laboratories, Inc. Authentication system and method based on authentication annotations
US20180060871A1 (en) * 2016-08-31 2018-03-01 Genesys Telecommunications Laboratories, Inc. System and method for providing secure access to electronic records
US11934465B2 (en) 2016-11-28 2024-03-19 Thomson Reuters Enterprise Centre Gmbh System and method for finding similar documents based on semantic factual similarity
US11475488B2 (en) 2017-09-11 2022-10-18 Accenture Global Solutions Limited Dynamic scripts for tele-agents
US11853930B2 (en) 2017-12-15 2023-12-26 Accenture Global Solutions Limited Dynamic lead generation
US11468882B2 (en) * 2018-10-09 2022-10-11 Accenture Global Solutions Limited Semantic call notes
US10923114B2 (en) 2018-10-10 2021-02-16 N3, Llc Semantic jargon
US11132695B2 (en) 2018-11-07 2021-09-28 N3, Llc Semantic CRM mobile communications sessions
US10972608B2 (en) 2018-11-08 2021-04-06 N3, Llc Asynchronous multi-dimensional platform for customer and tele-agent communications
US10742813B2 (en) 2018-11-08 2020-08-11 N3, Llc Semantic artificial intelligence agent
US11443264B2 (en) 2020-01-29 2022-09-13 Accenture Global Solutions Limited Agnostic augmentation of a customer relationship management application
US11392960B2 (en) 2020-04-24 2022-07-19 Accenture Global Solutions Limited Agnostic customer relationship management with agent hub and browser overlay
US11481785B2 (en) 2020-04-24 2022-10-25 Accenture Global Solutions Limited Agnostic customer relationship management with browser overlay and campaign management portal
US11507903B2 (en) 2020-10-01 2022-11-22 Accenture Global Solutions Limited Dynamic formation of inside sales team or expert support team
US11797586B2 (en) 2021-01-19 2023-10-24 Accenture Global Solutions Limited Product presentation for customer relationship management
US11816677B2 (en) 2021-05-03 2023-11-14 Accenture Global Solutions Limited Call preparation engine for customer relationship management

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050060521A (ko) * 2003-12-16 2005-06-22 한국전자통신연구원 엑스엠엘 문서를 owl문서로 변환시키는 변환 장치 및방법
KR100725643B1 (ko) 2006-06-09 2007-06-07 한국과학기술정보연구원 온톨로지 기반 참고문헌 분석을 통한 연구자 성과정보 구축및 서비스 시스템과 그 방법 및 그 방법에 대한 컴퓨터프로그램을 저장한 기록매체
KR20080019439A (ko) * 2006-08-28 2008-03-04 한국과학기술정보연구원 Dbms 기반 지식 확장 및 추론 서비스 시스템 및 그방법

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5210689A (en) * 1990-12-28 1993-05-11 Semantic Compaction Systems System and method for automatically selecting among a plurality of input modes
US5528491A (en) * 1992-08-31 1996-06-18 Language Engineering Corporation Apparatus and method for automated natural language translation
US5704060A (en) * 1995-05-22 1997-12-30 Del Monte; Michael G. Text storage and retrieval system and method
US5963940A (en) * 1995-08-16 1999-10-05 Syracuse University Natural language information retrieval system and method
US6006221A (en) * 1995-08-16 1999-12-21 Syracuse University Multilingual document retrieval system and method using semantic vector matching
US6470306B1 (en) * 1996-04-23 2002-10-22 Logovista Corporation Automated translation of annotated text based on the determination of locations for inserting annotation tokens and linked ending, end-of-sentence or language tokens
US5995922A (en) * 1996-05-02 1999-11-30 Microsoft Corporation Identifying information related to an input word in an electronic dictionary
EP0972254A1 (en) * 1997-04-01 2000-01-19 Yeong Kuang Oon Didactic and content oriented word processing method with incrementally changed belief system
US6233546B1 (en) * 1998-11-19 2001-05-15 William E. Datig Method and system for machine translation using epistemic moments and stored dictionary entries
KR100318762B1 (ko) * 1999-10-01 2002-01-04 윤덕용 외래어 음차표기의 음성적 거리 계산방법
US7107204B1 (en) * 2000-04-24 2006-09-12 Microsoft Corporation Computer-aided writing system and method with cross-language writing wizard
US7865358B2 (en) * 2000-06-26 2011-01-04 Oracle International Corporation Multi-user functionality for converting data from a first form to a second form
AU2001293596A1 (en) * 2000-09-29 2002-04-08 Gavagai Technology Incorporated A method and system for adapting synonym resources to specific domains
US20030093261A1 (en) * 2001-03-16 2003-05-15 Eli Abir Multilingual database creation system and method
US7483828B2 (en) * 2001-03-16 2009-01-27 Meaningful Machines, L.L.C. Multilingual database creation system and method
EP1473639A1 (en) * 2002-02-04 2004-11-03 Celestar Lexico-Sciences, Inc. Document knowledge management apparatus and method
US20050192802A1 (en) * 2004-02-11 2005-09-01 Alex Robinson Handwriting and voice input with automatic correction
US7765098B2 (en) * 2005-04-26 2010-07-27 Content Analyst Company, Llc Machine translation using vector space representations
US7277029B2 (en) * 2005-06-23 2007-10-02 Microsoft Corporation Using language models to expand wildcards
US7769804B2 (en) * 2006-01-17 2010-08-03 Microsoft Corporation Server side search with multi-word word wheeling and wildcard expansion
KR100756921B1 (ko) * 2006-02-28 2007-09-07 한국과학기술원 문서 분류방법 및 그 문서 분류방법을 컴퓨터에서 실행시키기 위한 프로그램을 포함하는 컴퓨터로 읽을 수있는 기록매체.
US7778837B2 (en) * 2006-05-01 2010-08-17 Microsoft Corporation Demographic based classification for local word wheeling/web search
US8706470B2 (en) * 2006-05-08 2014-04-22 David T. Lorenzen Methods of offering guidance on common language usage utilizing a hashing function consisting of a hash triplet
US20080300861A1 (en) * 2007-06-04 2008-12-04 Ossama Emam Word formation method and system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050060521A (ko) * 2003-12-16 2005-06-22 한국전자통신연구원 엑스엠엘 문서를 owl문서로 변환시키는 변환 장치 및방법
KR100725643B1 (ko) 2006-06-09 2007-06-07 한국과학기술정보연구원 온톨로지 기반 참고문헌 분석을 통한 연구자 성과정보 구축및 서비스 시스템과 그 방법 및 그 방법에 대한 컴퓨터프로그램을 저장한 기록매체
KR20080019439A (ko) * 2006-08-28 2008-03-04 한국과학기술정보연구원 Dbms 기반 지식 확장 및 추론 서비스 시스템 및 그방법

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"Relation Extraction for Semantic Intranet Annotations," Konwledge Media Institute, Technical Report kmi-06-17, LUCIA Specia 외 2인, pp.1-22, (2006.08.31.)

Also Published As

Publication number Publication date
EP2182447A1 (en) 2010-05-05
KR20100049353A (ko) 2010-05-12
US20100114563A1 (en) 2010-05-06

Similar Documents

Publication Publication Date Title
KR101045762B1 (ko) 실시간 시맨틱 어노테이션 장치 및 이를 활용하여 사용자가입력한 자연어 스트링을 실시간으로 의미 가독형 지식 구조 문서로 생성하는 방법
Gamal et al. Twitter benchmark dataset for Arabic sentiment analysis
Schmidt The role of markup in the digital humanities
WO2018017378A1 (en) Extracting actionable information from emails
CN107608948A (zh) 一种文本信息抽取模型的构建方法及装置
KR102006214B1 (ko) 복수의 데이터 소스들 기반 지식 베이스 구축 시스템 및 방법
Algur et al. Sentiment analysis by identifying the speaker's polarity in Twitter data
Fernandes et al. Analysis of product Twitter data though opinion mining
CN114064923A (zh) 数据处理方法、装置、电子设备和存储介质
KR101684579B1 (ko) 지식 생성 시스템 및 방법
Labra Gayo et al. Multilingual linked data patterns
Jung Semantic wiki-based knowledge management system by interleaving ontology mapping tool
Hellmann et al. Nif combinator: Combining nlp tool output
JP2015028699A (ja) プログラム、情報処理装置、および方法
JP2008003656A (ja) 概念辞書生成装置、文書分類装置、概念辞書生成方法および文書分類方法
Johnston The reluctant oracle: Using strategic annotations to add value to, and extract value from, a signed language corpus
Witte et al. Integrating wiki systems, natural language processing, and semantic technologies for cultural heritage data management
Zahidi et al. Arabic sentiment analysis problems and challenges
Bouziane et al. Annotating Arabic Texts with Linked Data
Khalil et al. Challenges in information retrieval from unstructured arabic data
Lim-Cheng et al. Semi-automatic population of ontology of Philippine medicinal plants from on-line text
El-Taher et al. An Arabic CCG approach for determining constituent types from Arabic Treebank
JP2015225412A (ja) 文書要約装置、方法、及びプログラム
Asmi et al. A framework for automated corpus generation for semantic sentiment analysis
JP5856905B2 (ja) 主題抽出装置およびそのプログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140709

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20150526

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20160526

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee