KR101045762B1 - 실시간 시맨틱 어노테이션 장치 및 이를 활용하여 사용자가입력한 자연어 스트링을 실시간으로 의미 가독형 지식 구조 문서로 생성하는 방법 - Google Patents
실시간 시맨틱 어노테이션 장치 및 이를 활용하여 사용자가입력한 자연어 스트링을 실시간으로 의미 가독형 지식 구조 문서로 생성하는 방법 Download PDFInfo
- Publication number
- KR101045762B1 KR101045762B1 KR1020080108474A KR20080108474A KR101045762B1 KR 101045762 B1 KR101045762 B1 KR 101045762B1 KR 1020080108474 A KR1020080108474 A KR 1020080108474A KR 20080108474 A KR20080108474 A KR 20080108474A KR 101045762 B1 KR101045762 B1 KR 101045762B1
- Authority
- KR
- South Korea
- Prior art keywords
- semantic
- triple
- input
- natural language
- real
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/169—Annotation, e.g. comment data or footnotes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Abstract
본 발명은 실시간 시맨틱 어노테이션 장치 및 이를 이용하여 사용자가 입력한 자연어 문자열을 실시간으로 의미 가독형 지식 구조로 변환하는 방법에 관한 것으로,
본 발명에 따른 실시간 시맨틱 어노테이션 장치는, 사용자로 하여금 자연어 문자열을 입력하게 하는 입력 장치부; 정규 표현식으로 표현된 자연어 문자열과 그에 대응되는 트리플(triplet)이 기술된 문자열 패턴-트리플 매핑 테이블; 패턴-트리플 매핑 테이블을 활용해서 상기 입력된 자연어 문자열을 해석 처리하여 트리플 형태로 변환 시키는 트리플 추출장치; 사용자가 입력하고자 하는 내용의 정확한 의미 파악을 위해 대체 단어를 추천하는 대체 단어 추천장치; 및 의미 가독형 지식 구조를 활용하여 상기 추출된 트리플들을 기계 가독형 문서로 변환하는 기계 가독형 문서 생성부를 포함한다.
시맨틱, 실시간 어노테이션, 온톨로지, 위키
Description
본 발명은 사용자가 입력 장치를 이용해 입력한 자연어 문자열을 실시간으로 의미 가독형 지식 구조 문서로 변환하는 실시간 시맨틱 어노테이션 장치 및 방법에 관한 것이다. 일상 생활 속에서 모바일 기기를 사용하여 짧은 글의 형태로 생성된 정보를 자동으로 기계 가독형 문서로 변환하고 그것을 웹상의 다른 문서와 연관시킴으로써 일상 생활에서 생성된 정보가 웹상에서 원활히 공유되게 하기 위함이다.
월드와이드웹은 지식 표현에 많은 문제가 있는바, 이를 해결코자 많은 노력이 시도되었다. 이러한 시도된 종래의 기술로는 SHOE(Simple HTML Ontology Extention)을 이용하여 HTML 문서에 어노테이션을 하는 장치가 있으며 (문헌1: J. Heflin, J. Hendler, and S. Luke. Shoe: A knowledge representation language for internet applications. In Technical Report CS-TR-4078, volume UMIACS TR-99-7. Dept. of Computer Science, University of Maryland at College Park, 1999), 웹 브라우저를 통해서 여러 사용자가 협동적으로 주어진 HTML 웹문서를 어노테이션하는 장치로서 웹사이트에 정보가 게시되면 사용자가 자신의 정보나 의견을 제공하여 웹페이지를 편집하는 방법이 있다(문헌2: B. Jung, I. Yoon, H. Lim, F. A. Ramirez-Weber, and D. Petkovic. Annotizer: User-friendly www annotation system for collaboration in research and education environments. In The IASTED International Conference on Web Technolgies, Applciations and Services, WTAS 2006, 2006.). 또한, 사용자가 주어진 문서의 특정 부분을 선택하고 그것을 주어진 의미 가독형 지식 구조를 활용해 어노테이션하는 방법 (문헌 3: M. Backhaus and J. Kelso. Proceedings of the workshop on social and collaborative construction of structured knowledge (ckc 2007) at the 16th international world wide web conference (www2007) banff,canada, may 8, 2007. In N. F. Noy, H. Alani, G. Stumme, P. Mika, Y. Sure, and D. Vrandecic, editors, CKC, volume 273 of CEUR Workshop Proceedings. CEUR-WS.org, 2007.), 및 위키피디어(Wikipedia)의 내용을 검색, 구성, 태깅 및 평가할 수 있는 오픈소스의 SMW(Semantic MediaWiki) 시스템을 확장해서 여러 사용자가 동시에 Wiki 문서를 작성하는 장치가 개시되어 있다.
상기 기술된 종래의 장치 및 방법에서는, 주어진 문서를 분석하여 어노테이션을 하는 것으로 문서의 작성자가 특정 단어를 사용한 의도를 파악할 수가 없기 때문에 정확한 어노테이션을 할 수 없다. 따라서, 본 발명은 문서 작성자가 문서를 작성하는 순간에 실시간으로 어노테이션을 함으로서 상기한 바와 같은 문제점을 해결하기 위해 제공되는 것이다.
상기한 바와 같은 목적을 달성하기 위한 본 발명에 따른 실시간 시맨틱 어노테이션 장치는,
사용자로 하여금 자연어 문자열을 입력하게 하는 자연어 문자열 입력 장치; 자연어 문자열 패턴과 트리플간의 대응관계가 저장된 문자열 패턴-트리플 매핑 테이블; 상기 문자열 패턴-트리플 매핑 테이블을 이용해서 상기 입력된 자연어 문자열로부터 트리플을 추출하는 트리플 추출 장치; 상기 입력된 자연어 문자열 중 의미 가독형 지식 구조 데이터베이스에 없기 때문에 그 의미를 파악하지 못하는 경우 대체 단어를 찾아서 추천해 주는 대체 단어 추천 장치; 및 상기 추출된 트리플을 의미 가독형 지식 구조를 참조해서 기계 가독형 문서를 생성하는 기계 가독형 문서 생성 장치를 포함한다.
상기 자연어 문자열 입력 장치는 사용자가 자연어 문자열을 입력할 수 있는 키보드, 터치 스크린 등의 장치이다.
상기 자연어 문자열 패턴은 정규 표현식, 의존 문법 트리 등 자연어 문자열을 구조적으로 분석할 수 있는 데이터 구조이다.
상기 대체 단어 추천 장치는 사용자가 단어를 입력하는 중에 대체 단어를 인식할 수 있도록 하는 화면 출력 장치, 및 음성 메시지 등의 출력 장치를 포함한다.
상기 의미 가독형 지식 구조 데이터베이스는 OWL (Web Ontology Language), KIF (Knowledge Interchange Format) 등 지식을 기계가 이해할 수 있는 형태로 표현할 수 있는 메시지 포멧을 포함한다.
또한, 상기 기계 가독형 문서 생성 장치는 OWL, KIF 포멧의 문서를 생성하여 화면에 출력하거나 네트워크를 통해서 다른 서버에 저장하는 웹 브라우저를 포함한다.
상기한 바와 같은 본 발명에 따른 실시간 시맨틱 어노테이션 장치 및 방법에 의해서, 사용자가 문자열을 입력하는 매 순간마다 어노테이션이 일어나기 때문에 시맨틱 어노테이션 장치가 처리하기 어려운 단어가 입력되는 경우 사용자로 하여금 대체 단어를 입력할 수 있게 할 수가 있다. 따라서, 어노테이션이 정확하게 이루어질 수 있는 장점이 있다.
또한, 여러 사용자가 동시에 한 가지 주제에 관련된 문자열을 실시간 시맨틱 어노테이션 시스템을 통해 입력하는 경우 의견 충돌 등을 실시간으로 알아낼 수도 있다.
이하, 첨부된 도면을 참조하여 본 발명의 실시예를 상세히 설명한다. 본 발명을 설명함에 있어서 관련된 공지 기능 혹은 구성에 대한 구체적인 설명은 본 발명의 요지를 모호하게 하지 않기 위해 생략한다.
도 1에 나타낸 바와 같이, 본 발명에 따른 실시간 시맨틱 어노테이션 장치는, 자연어 문자열 입력 장치, 트리플 추출 장치, 의미 가독형 지식 구조 문서 생성 장치, 대체 단어 추천 장치, 문자열 패턴-트리플 매핑 테이블, 그리고 의미 가독형 지식구조 데이터베이스를 포함하여 구성된다.
상기 자연어 문자열 입력 장치는 사용자로 하여금 자연어 문자열을 입력할 수 있게 하는 입력 장치와 입력된 내용을 확인할 수 있는 출력 장치로 구성된다. 입력 장치는 키보드, 터치 패드 등 자연어 문자열을 입력할 수 있는 모든 장치가 포함된다. 입력된 내용을 확인할 수 있는 출력 장치는 시각적으로 확인할 수 있는 모니터와 청각적으로 확인할 수 있는 스피커 등 사용자가 어떤 문자열을 입력했는지 알 수 있게 하는 어떠한 장치도 가능하다.
의미 가독형 지식 구조는 아래의 표 1에 나타낸 바와 같이 지식을 기계가 이 해할 수 있는 형태로 구조화한 것을 가리킨다. 이는 클래스와 그것의 속성으로 구성되어 있다. 예를 들어, "Country"는 "hasCapital"이라는 속성을 가지는데 그 속성은 "City"를 목적어로 가져야 한다는 지식이 기술되어 있다. 즉, "<Korea><hasCapital><Seoul>", "<China><hasCapital><Beijing>"과 같은 세부 지식들에 대한 개념이다.
표 1: 의미 가독형 지식 구조 문서의 예
문자열 패턴-트리플 매핑 테이블은 아래 표 2에 나타낸 바와 같이 문자열 패턴과 그에 대응되는 트리플 쌍으로 구성되어 있다. 트리플의 가운데 부분은 상기 의미 가독형 지식 구조의 속성에 대응된다. 표 1은 하나의 예에 해당하는 것으로, "isA", "definedAs", "motivationOf" 등이 표 1에 기술되지 않았지만 또한 가능하다는 것을 유의해야 한다.
표 2: 문자열 패턴-트리플 매핑 테이블의 예
상기 문자열 패턴-트리플 매핑 테이블의 의미는 아래 트리플 추출 장치에서 설명한다. 트리플 추출 장치는 상기 입력된 자연어 문자열을 문자열 패턴-트리플 매핑 테이블에 기반하여 트리플을 추출한다. 먼저 자연어 문자열이 주어지면 그것은 문자열 패턴-트리플 매핑 테이블의 모든 문자열 패턴과 비교한다. 예를 들어, "Tom expresses sorry"이 입력된 경우 표 2의 세 번째 문자열 패턴에 해당한다. 물론 "expresses"가 "express"에 대응된다는 것은 3인칭 접미어인 "es"를 제거하는 간단한 규칙을 구현한 모듈에 의해 알아낼 수 있다. 그 다음은 ARG1과 ARG2에 해당하는 단어가 의미 가독형 지식 구조에 위반되지 않는지 검사하는 단계이다. 예를 들어, "The capital of apple"의 경우 ARG1에 해당하는 단어는 "apple"이다. 그리고 그 문자열 패턴에 대응되는 트리플과 그것의 의미 가독형 지식 구조에 따르면 ARG1은 "country"이어야만 한다. 왜냐하면 표 2에 따르면 "hasCapitalCity"의 range는 "country"라고 의미 가독형 지식 구조에 정의되어 있기 때문이다. "Korea"가 "country"이고 "apple"이 "country"가 아니라는 사실을 알기 위해서는 기계 가 독형 전자 사전을 이용하면 된다. 기계 가독형 전자 사전으로는 WordNet이 대표적이다. 다음은 ARG를 대체하여 트리플 생성하는 단계이다. "The capital of Korea" 문자열이 입력된 경우 ARG1에 해당 하는 단어는 "Korea"이므로 <Korea><hasCapitalCity><*>라는 트리플이 생성된다. 여기서 기호(" * ")표시는 해당 부분에 들어갈 내용이 아직 입력되지 않았다는 것을 의미한다. "The capital of Korea"가 입력되는 순간에 생성되는 기계 가동형 문서는 표 3의 오른쪽 위이다. 즉, 아직 "city"를 입력하지 않았으므로 일단 그 내용이 비어있는 문서가 생성된다. 나머지 내용을 사용자가 입력한 경우, "is Seoul", <T1><isA><Seoul>이라는 트리플이 추출된다. 여기서 T1은 "The capital of Korea"로 부터 추출된 트리플에서 "*" 분을 가리킨다. 따라서, 표 3의 맨 마지막 행에서와 같이 총 2개의 트리플이 추출되게 된다. 이것을 기계 가독형 문서로 바꾸면 표 3의 오른쪽 아래와 같이 된다.
대체 단어 추천 장치는 상기 기술된데로 사용자가 "country"를 입력해야 하는 순간에 "apple"을 입력할 경우 "country"를 입력하라고 알려주는 장치이다. 사용자가 보고 있는 화면에 "country"를 입력하라는 메시지 창을 띄울 수도 있고 음성으로 알려줄 수도 있다.
기계 가독형 문서 생성 장치는 상기 기술된데로 의미 가독형 지식 구조를 참조해서 트리플을 기계 가독형 문서로 생성하는 장치이다. 예를 들어, <Korea><hasCapital><*> 인 경우 "hasCaptial"의 domain은 "Country"이고 range는 "City"라는 사실이 의미 가독형 지식 구조에 기술되어 있으므로 (표 2 참조), "Korea"는 "Country" 클래스 기호 "*"는 "City" 클래스에 대응 된다는 사실을 알 수 있으므로 그와 같은 정보를 XML (Extensible Markup Language) 형태로 표현하면 표 3의 오른쪽 위와 같이 된다.
표 3: 사용자가 입력한 문자열을 처리해서 트리플을 추출하고 기계 가독형 문서를 생성하는 단계를 나타낸 예
이상과 같이 본 발명에 따른 실시간 시맨틱 어노테이션 장치 및 방법은 예시한 표(1 내지 3)를 참조로 하여 설명하였으나, 본 명세서에 개시된 실시예와 도면에 의해 본 발명이 한정되는 것은 아니며, 본 발명의 기술사상 범위내에서 당업자에 의해 다양한 변형이 이루어질 수 있음은 물론이다.
도 1은 본 발명에 따른 실시간 시맨틱 어노테이션 장치를 개념적으로 도시한
블록도이다.
Claims (6)
- 다음을 포함하는 실시간 시맨틱 어노테이션 장치:사용자로 하여금 자연어 문자열을 입력하게 하는 자연어 문자열 입력 장치;자연어 문자열 패턴과 이에 대응하는 트리플 쌍을 저장한 문자열 패턴 트리플-매핑 테이블;패턴-트리플 매핑 테이블을 활용해서 상기 입력된 자연어 문자열을 해석 처리하여 트리플 형태로 변환 시키는 트리플 추출장치;사용자에게 다른 단어를 입력해야 한다는 사실을 알려주는 대체 단어 추천 장치; 및의미 가독형 지식 구조를 활용하여 트리플로부터 기계 가독형 문서를 생성하는 기계 가독형 문서 생성 장치.
- 제 1항에 있어서, 자연어 문자열 입력 장치는 문자열을 입력할 수 있는 키보드 및 터치 패드를 포함하는 입력 장치와 입력된 문자열을 눈으로 확인할 수 있는 모니터 및 음성으로 확인할 수 있는 음성 출력 장치를 포함하는 실시간 시맨틱 어노테이션 장치.
- 제 1항에 있어서, 문자열 패턴-트리플 매핑 테이블은 문자열 패턴의 ARG 부분이 트리플의 ARG에 대체되도록 한 실시간 시맨틱 어노테이션 장치.
- 제 1항에 있어서, 문자열 패턴-트리플 매핑 테이블은 기호(예로서, * ) 표시를 사용하여 앞으로 입력될 내용을 표시하도록 한 실시간 시맨틱 어노테이션 장치.
- 제 1항에 있어서, 트리플 추출 장치는 기호(예로서, * ) 표시된 트리플의 히스토리를 기록하고 있다가 그에 해당하는 정보가 입력되면 그 부분을 해당 내용으로 채우도록 한 실시간 시맨틱 어노테이션 장치.
- 제 1항에 있어서, 대체 단어 추천 장치는 사용자로 하여금 의미 가독형 지식 구조에 맞는 단어를 입력할 수 있게 대체 단어를 알려주도록 구성된 실시간 시맨틱 어노테이션 장치.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020080108474A KR101045762B1 (ko) | 2008-11-03 | 2008-11-03 | 실시간 시맨틱 어노테이션 장치 및 이를 활용하여 사용자가입력한 자연어 스트링을 실시간으로 의미 가독형 지식 구조 문서로 생성하는 방법 |
US12/610,882 US20100114563A1 (en) | 2008-11-03 | 2009-11-02 | Real-time semantic annotation system and the method of creating ontology documents on the fly from natural language string entered by user |
EP09174899A EP2182447A1 (en) | 2008-11-03 | 2009-11-03 | Real-time semantic annotation system and the method of creating ontology documents on the fly from natural language string entered by user |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020080108474A KR101045762B1 (ko) | 2008-11-03 | 2008-11-03 | 실시간 시맨틱 어노테이션 장치 및 이를 활용하여 사용자가입력한 자연어 스트링을 실시간으로 의미 가독형 지식 구조 문서로 생성하는 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20100049353A KR20100049353A (ko) | 2010-05-12 |
KR101045762B1 true KR101045762B1 (ko) | 2011-07-01 |
Family
ID=41531062
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020080108474A KR101045762B1 (ko) | 2008-11-03 | 2008-11-03 | 실시간 시맨틱 어노테이션 장치 및 이를 활용하여 사용자가입력한 자연어 스트링을 실시간으로 의미 가독형 지식 구조 문서로 생성하는 방법 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20100114563A1 (ko) |
EP (1) | EP2182447A1 (ko) |
KR (1) | KR101045762B1 (ko) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2011201127A1 (en) * | 2011-03-14 | 2012-10-04 | Moxy Studios Pty Ltd | Collaborative Knowledge Management |
JP6200431B2 (ja) * | 2011-12-27 | 2017-09-20 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | テキスト分析システム |
KR101662399B1 (ko) * | 2014-10-27 | 2016-10-04 | 포항공과대학교 산학협력단 | 키워드 입력 기반의 사용자 관심정보를 이용한 질의응답 장치 및 방법 |
US9898452B2 (en) | 2015-10-16 | 2018-02-20 | International Business Machines Corporation | Annotation data generation and overlay for enhancing readability on electronic book image stream service |
US10356103B2 (en) | 2016-08-31 | 2019-07-16 | Genesys Telecommunications Laboratories, Inc. | Authentication system and method based on authentication annotations |
US20180060871A1 (en) * | 2016-08-31 | 2018-03-01 | Genesys Telecommunications Laboratories, Inc. | System and method for providing secure access to electronic records |
US11934465B2 (en) | 2016-11-28 | 2024-03-19 | Thomson Reuters Enterprise Centre Gmbh | System and method for finding similar documents based on semantic factual similarity |
US11475488B2 (en) | 2017-09-11 | 2022-10-18 | Accenture Global Solutions Limited | Dynamic scripts for tele-agents |
US11853930B2 (en) | 2017-12-15 | 2023-12-26 | Accenture Global Solutions Limited | Dynamic lead generation |
US11468882B2 (en) * | 2018-10-09 | 2022-10-11 | Accenture Global Solutions Limited | Semantic call notes |
US10923114B2 (en) | 2018-10-10 | 2021-02-16 | N3, Llc | Semantic jargon |
US11132695B2 (en) | 2018-11-07 | 2021-09-28 | N3, Llc | Semantic CRM mobile communications sessions |
US10972608B2 (en) | 2018-11-08 | 2021-04-06 | N3, Llc | Asynchronous multi-dimensional platform for customer and tele-agent communications |
US10742813B2 (en) | 2018-11-08 | 2020-08-11 | N3, Llc | Semantic artificial intelligence agent |
US11443264B2 (en) | 2020-01-29 | 2022-09-13 | Accenture Global Solutions Limited | Agnostic augmentation of a customer relationship management application |
US11392960B2 (en) | 2020-04-24 | 2022-07-19 | Accenture Global Solutions Limited | Agnostic customer relationship management with agent hub and browser overlay |
US11481785B2 (en) | 2020-04-24 | 2022-10-25 | Accenture Global Solutions Limited | Agnostic customer relationship management with browser overlay and campaign management portal |
US11507903B2 (en) | 2020-10-01 | 2022-11-22 | Accenture Global Solutions Limited | Dynamic formation of inside sales team or expert support team |
US11797586B2 (en) | 2021-01-19 | 2023-10-24 | Accenture Global Solutions Limited | Product presentation for customer relationship management |
US11816677B2 (en) | 2021-05-03 | 2023-11-14 | Accenture Global Solutions Limited | Call preparation engine for customer relationship management |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20050060521A (ko) * | 2003-12-16 | 2005-06-22 | 한국전자통신연구원 | 엑스엠엘 문서를 owl문서로 변환시키는 변환 장치 및방법 |
KR100725643B1 (ko) | 2006-06-09 | 2007-06-07 | 한국과학기술정보연구원 | 온톨로지 기반 참고문헌 분석을 통한 연구자 성과정보 구축및 서비스 시스템과 그 방법 및 그 방법에 대한 컴퓨터프로그램을 저장한 기록매체 |
KR20080019439A (ko) * | 2006-08-28 | 2008-03-04 | 한국과학기술정보연구원 | Dbms 기반 지식 확장 및 추론 서비스 시스템 및 그방법 |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5210689A (en) * | 1990-12-28 | 1993-05-11 | Semantic Compaction Systems | System and method for automatically selecting among a plurality of input modes |
US5528491A (en) * | 1992-08-31 | 1996-06-18 | Language Engineering Corporation | Apparatus and method for automated natural language translation |
US5704060A (en) * | 1995-05-22 | 1997-12-30 | Del Monte; Michael G. | Text storage and retrieval system and method |
US5963940A (en) * | 1995-08-16 | 1999-10-05 | Syracuse University | Natural language information retrieval system and method |
US6006221A (en) * | 1995-08-16 | 1999-12-21 | Syracuse University | Multilingual document retrieval system and method using semantic vector matching |
US6470306B1 (en) * | 1996-04-23 | 2002-10-22 | Logovista Corporation | Automated translation of annotated text based on the determination of locations for inserting annotation tokens and linked ending, end-of-sentence or language tokens |
US5995922A (en) * | 1996-05-02 | 1999-11-30 | Microsoft Corporation | Identifying information related to an input word in an electronic dictionary |
EP0972254A1 (en) * | 1997-04-01 | 2000-01-19 | Yeong Kuang Oon | Didactic and content oriented word processing method with incrementally changed belief system |
US6233546B1 (en) * | 1998-11-19 | 2001-05-15 | William E. Datig | Method and system for machine translation using epistemic moments and stored dictionary entries |
KR100318762B1 (ko) * | 1999-10-01 | 2002-01-04 | 윤덕용 | 외래어 음차표기의 음성적 거리 계산방법 |
US7107204B1 (en) * | 2000-04-24 | 2006-09-12 | Microsoft Corporation | Computer-aided writing system and method with cross-language writing wizard |
US7865358B2 (en) * | 2000-06-26 | 2011-01-04 | Oracle International Corporation | Multi-user functionality for converting data from a first form to a second form |
AU2001293596A1 (en) * | 2000-09-29 | 2002-04-08 | Gavagai Technology Incorporated | A method and system for adapting synonym resources to specific domains |
US20030093261A1 (en) * | 2001-03-16 | 2003-05-15 | Eli Abir | Multilingual database creation system and method |
US7483828B2 (en) * | 2001-03-16 | 2009-01-27 | Meaningful Machines, L.L.C. | Multilingual database creation system and method |
EP1473639A1 (en) * | 2002-02-04 | 2004-11-03 | Celestar Lexico-Sciences, Inc. | Document knowledge management apparatus and method |
US20050192802A1 (en) * | 2004-02-11 | 2005-09-01 | Alex Robinson | Handwriting and voice input with automatic correction |
US7765098B2 (en) * | 2005-04-26 | 2010-07-27 | Content Analyst Company, Llc | Machine translation using vector space representations |
US7277029B2 (en) * | 2005-06-23 | 2007-10-02 | Microsoft Corporation | Using language models to expand wildcards |
US7769804B2 (en) * | 2006-01-17 | 2010-08-03 | Microsoft Corporation | Server side search with multi-word word wheeling and wildcard expansion |
KR100756921B1 (ko) * | 2006-02-28 | 2007-09-07 | 한국과학기술원 | 문서 분류방법 및 그 문서 분류방법을 컴퓨터에서 실행시키기 위한 프로그램을 포함하는 컴퓨터로 읽을 수있는 기록매체. |
US7778837B2 (en) * | 2006-05-01 | 2010-08-17 | Microsoft Corporation | Demographic based classification for local word wheeling/web search |
US8706470B2 (en) * | 2006-05-08 | 2014-04-22 | David T. Lorenzen | Methods of offering guidance on common language usage utilizing a hashing function consisting of a hash triplet |
US20080300861A1 (en) * | 2007-06-04 | 2008-12-04 | Ossama Emam | Word formation method and system |
-
2008
- 2008-11-03 KR KR1020080108474A patent/KR101045762B1/ko not_active IP Right Cessation
-
2009
- 2009-11-02 US US12/610,882 patent/US20100114563A1/en not_active Abandoned
- 2009-11-03 EP EP09174899A patent/EP2182447A1/en not_active Withdrawn
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20050060521A (ko) * | 2003-12-16 | 2005-06-22 | 한국전자통신연구원 | 엑스엠엘 문서를 owl문서로 변환시키는 변환 장치 및방법 |
KR100725643B1 (ko) | 2006-06-09 | 2007-06-07 | 한국과학기술정보연구원 | 온톨로지 기반 참고문헌 분석을 통한 연구자 성과정보 구축및 서비스 시스템과 그 방법 및 그 방법에 대한 컴퓨터프로그램을 저장한 기록매체 |
KR20080019439A (ko) * | 2006-08-28 | 2008-03-04 | 한국과학기술정보연구원 | Dbms 기반 지식 확장 및 추론 서비스 시스템 및 그방법 |
Non-Patent Citations (1)
Title |
---|
"Relation Extraction for Semantic Intranet Annotations," Konwledge Media Institute, Technical Report kmi-06-17, LUCIA Specia 외 2인, pp.1-22, (2006.08.31.) |
Also Published As
Publication number | Publication date |
---|---|
EP2182447A1 (en) | 2010-05-05 |
KR20100049353A (ko) | 2010-05-12 |
US20100114563A1 (en) | 2010-05-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101045762B1 (ko) | 실시간 시맨틱 어노테이션 장치 및 이를 활용하여 사용자가입력한 자연어 스트링을 실시간으로 의미 가독형 지식 구조 문서로 생성하는 방법 | |
Gamal et al. | Twitter benchmark dataset for Arabic sentiment analysis | |
Schmidt | The role of markup in the digital humanities | |
WO2018017378A1 (en) | Extracting actionable information from emails | |
CN107608948A (zh) | 一种文本信息抽取模型的构建方法及装置 | |
KR102006214B1 (ko) | 복수의 데이터 소스들 기반 지식 베이스 구축 시스템 및 방법 | |
Algur et al. | Sentiment analysis by identifying the speaker's polarity in Twitter data | |
Fernandes et al. | Analysis of product Twitter data though opinion mining | |
CN114064923A (zh) | 数据处理方法、装置、电子设备和存储介质 | |
KR101684579B1 (ko) | 지식 생성 시스템 및 방법 | |
Labra Gayo et al. | Multilingual linked data patterns | |
Jung | Semantic wiki-based knowledge management system by interleaving ontology mapping tool | |
Hellmann et al. | Nif combinator: Combining nlp tool output | |
JP2015028699A (ja) | プログラム、情報処理装置、および方法 | |
JP2008003656A (ja) | 概念辞書生成装置、文書分類装置、概念辞書生成方法および文書分類方法 | |
Johnston | The reluctant oracle: Using strategic annotations to add value to, and extract value from, a signed language corpus | |
Witte et al. | Integrating wiki systems, natural language processing, and semantic technologies for cultural heritage data management | |
Zahidi et al. | Arabic sentiment analysis problems and challenges | |
Bouziane et al. | Annotating Arabic Texts with Linked Data | |
Khalil et al. | Challenges in information retrieval from unstructured arabic data | |
Lim-Cheng et al. | Semi-automatic population of ontology of Philippine medicinal plants from on-line text | |
El-Taher et al. | An Arabic CCG approach for determining constituent types from Arabic Treebank | |
JP2015225412A (ja) | 文書要約装置、方法、及びプログラム | |
Asmi et al. | A framework for automated corpus generation for semantic sentiment analysis | |
JP5856905B2 (ja) | 主題抽出装置およびそのプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20140709 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20150526 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20160526 Year of fee payment: 6 |
|
LAPS | Lapse due to unpaid annual fee |