KR100739726B1 - 문자열 매칭 방법 및 시스템과 그 방법을 기록한 컴퓨터판독 가능한 기록매체 - Google Patents
문자열 매칭 방법 및 시스템과 그 방법을 기록한 컴퓨터판독 가능한 기록매체 Download PDFInfo
- Publication number
- KR100739726B1 KR100739726B1 KR1020050080172A KR20050080172A KR100739726B1 KR 100739726 B1 KR100739726 B1 KR 100739726B1 KR 1020050080172 A KR1020050080172 A KR 1020050080172A KR 20050080172 A KR20050080172 A KR 20050080172A KR 100739726 B1 KR100739726 B1 KR 100739726B1
- Authority
- KR
- South Korea
- Prior art keywords
- string
- representative
- language
- input
- list
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/247—Thesauruses; Synonyms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
Abstract
본 발명은 다양한 방법으로 표기된 동일 의미의 문자열들에 대해서 대표하는 대표 문자열을 검색하는 문자열 매칭 방법 및 시스템과 그 방법을 기록한 컴퓨터 판독 가능한 기록매체에 관한 것으로, 제1언어와 제2언어 간의 매핑 정보가 저장된 언어 매핑 테이블을 참조하여 입력 문자열을 하나 이상의 제2언어 문자열로 변환하여 변환 리스트를 생성하는 제2언어 문자열 생성단계; 대표 문자열과 그에 대응하는 제2언어 대표 문자열이 저장되는 대표 리스트 데이터베이스에서 변환 리스트의 문자열과 동일한 제2언어 대표 문자열을 가진 레코드를 찾아 후보 리스트를 생성하는 대표 리스트 검색단계; 및 후보 리스트의 레코드 중 하나에 포함된 대표 문자열을 출력 문자열로 결정하는 대표 문자열 결정단계를 포함하는 것을 특징으로 하여, 문자열에 의한 분류 시나리오에 유용하게 이용될 수 있다.
문자열 매칭, ID3 태그, MP3, WMA, 초성, 중성, 종성
Description
도 1은 본 발명의 일실시예에 따른 문자열 매칭 시스템의 구성도,
도 2는 본 발명의 다른 실시예에 따른 문자열 매칭 시스템의 구성도,
도 3은 본 발명에 따른 문자열 매칭 방법의 매커니즘 흐름도,
도 4는 본 발명에 따른 제2언어 문자열 생성단계의 매커니즘 흐름도,
도 5는 본 발명에 따른 대표 문자열 결정단계에서 사용자가 대표 문자열을 결정하는 경우의 매커니즘 흐름도,
도 6은 본 발명에 따른 대표 문자열 결정단계에서 매칭 점수를 이용하여 대표 문자열을 결정하는 경우의 매커니즘 흐름도,
도 7a 및 도 7b는 본 발명에서 제1언어가 한글이고 제2언어가 영어일 경우에 대한 초/중성과 종성 매핑 테이블의 예 ,
도 8은 본 발명에 따른 이전결과 데이터베이스의 예,
도 9는 본 발명에 따른 대표 리스트 데이터베이스의 예,
도 10은 MP3(MPEG Audio Layer-3) 파일의 구조.
본 발명은 문자열의 매칭에 관한 것으로, 더욱 상세하게는 동일한 의미를 가진 것으로 간주되는 문자열들을 분류하기 위한 방법 및 시스템과 그 방법을 기록한 컴퓨터 판독 가능한 기록매체에 관한 것이다.
MP3(MPEG Audio Layer-3) 등의 멀티미디어 파일의 메타 정보를 이용한 응용 서비스에 있어서, 메타 정보에 포함된 아티스트명이나 장르 등의 정보를 기준으로 멀티미디어 데이터를 분류하여 사용자에게 보여주는 기능이 필요한 경우가 많다.
이러한 메타 정보는, 외국어로 입력된 경우 다양한 외국어 표기가 가능하고, 공백(' ')이나 하이픈('-') 등의 특수 문자가 섞여 있는 경우도 많고, 일반 사용자가 입력하는 경우도 많기 때문에, 같은 의미를 가진 문자열이라도 일관성 없이 입력되어 있어 다른 문자열로 해석되고 분류되는 문제가 있다.
예컨대, MP3 플레이어에서 아티스트별로 음악을 분류하는 응용 프로그램에 있어서, 종래의 방법에 의하면 '이미자', '이 미자', 'Lee Mi-Za', 'Lee Mi Ja', 'Lee Miza' 등으로 입력되어 있는 아티스트가 동일인임에도 불구하고 각기 다른 가수로 분류되어 사용자에게 불편을 초래하고 응용 서비스의 개발에 제약이 따르는 형편이다.
본 발명은 상기와 같은 문제를 해결하여, 다양한 방법으로 표기된 동일 의미의 문자열을 대표하는 대표 문자열을 검색하는 문자열 매칭 방법 및 시스템과 그 방법을 기록한 컴퓨터 판독 가능한 기록매체를 제공하는 것을 목적으로 한다.
상기 목적의 달성을 위해 본 발명은, 언어 간 매핑 정보를 이용하여 문자열을 외국어로 변환하고 변환된 문자열에 의한 검색을 통해 대표 문자열을 결정하는 문자열 매칭 방법 및 시스템과 그 방법을 기록한 컴퓨터 판독 가능한 기록매체를 제공한다.
본 발명의 특징은, 입력 문자열에 매칭되는 대표 문자열을 출력하는 문자열 매칭 방법에 있어서, 제1언어와 제2언어 간의 매핑 정보가 저장된 언어 매핑 테이블을 참조하여 상기 입력 문자열을 하나 이상의 제2언어 문자열로 변환하여 변환 리스트를 생성하는 제2언어 문자열 생성단계; 대표 문자열과 그에 대응하는 제2언어 대표 문자열이 저장되는 대표 리스트 데이터베이스에서 상기 변환 리스트의 문자열과 동일한 제2언어 대표 문자열을 가진 레코드를 찾아 후보 리스트를 생성하는 대표 리스트 검색단계; 및 상기 후보 리스트의 레코드 중 하나에 포함된 대표 문자열을 출력 문자열로 결정하는 대표 문자열 결정단계를 포함하는 것이다.
바람직하게는 상기 문자열 매칭 방법에서, 문자열과 그에 대응하는 대표 문자열이 포함된 매칭 결과가 저장되는 이전 결과 데이터베이스를 검색하여 상기 입력 문자열과 동일한 문자열이 존재하면, 그에 대응하는 대표 문자열을 출력 문자열로 결정하는 이전 결과 검색단계; 및 상기 입력 문자열과 상기 출력 문자열이 상기 이전 결과 데이터베이스에 존재하지 않는 경우 상기 이전 결과 데이터베이스에 저장하는 결과 저장단계를 더 포함한다.
바람직하게는 상기 문자열 매칭 방법에서, 상기 제2언어 문자열 생성단계는, 상기 변환 전에 상기 입력 문자열에 포함된 유효하지 않은 소정의 특수문자를 제거하는 특수문자 처리 단계를 더 포함한다.
바람직하게는 상기 문자열 매칭 방법에서, 상기 특수문자가 '-'과 ' '을 포함한다.
바람직하게는 상기 문자열 매칭 방법에서, 상기 제1언어는 한글이고 상기 제2언어는 영어인 경우, 상기 언어 매핑 테이블이, 한글의 초성과 중성을 조합한 글자를 하나 이상의 영어 문자열로 매핑하는 정보와, 한글의 종성을 하나 이상의 영어 문자열로 매핑하는 정보를 포함하고; 상기 제2언어 문자열 생성단계는, 상기 입력 문자열이 영어인 경우 상기 입력 문자열을 소문자로 변환한 문자열을 상기 변환 리스트에 포함시키는 단계를 더 포함한다.
바람직하게는 상기 문자열 매칭 방법에서, 상기 매핑 정보에 항목별 우선순위 점수를 부여하는 단계를 더 포함하고; 상기 제2언어 문자열 생성단계는, 상기 우선순위 점수를 이용하여 상기 변환 리스트에 포함된 각 문자열에 대한 매칭 점수를 계산하여 부여하고, 상기 매칭 점수가 높은 지정된 개수의 문자열만을 상기 변환 리스트에 포함시키는 단계를 더 포함한다.
바람직하게는 상기 문자열 매칭 방법에서, 상기 매핑 정보에 항목별 우선순위 점수를 부여하는 단계를 더 포함하고; 상기 제2언어 문자열 생성단계에서, 상기 우선순위 점수를 이용하여 상기 변환 리스트에 포함된 각 문자열에 대한 매칭 점수를 계산하여 부여하고, 상기 매칭 점수가 지정된 점수 이상인 문자열만을 상기 변 환 리스트에 포함시키는 단계를 더 포함한다.
바람직하게는 상기 문자열 매칭 방법에서, 상기 대표 문자열 결정단계는, 상기 후보 리스트에서 사용자가 선택한 레코드의 대표 문자열을 출력 문자열로 결정하는 단계를 포함한다.
바람직하게는 상기 문자열 매칭 방법에서, 상기 대표 문자열 결정단계는, 상기 사용자가 상기 후보 리스트의 레코드 중 어느 것도 선택하지 않은 경우 상기 입력 문자열을 상기 출력 문자열로 결정하는 단계를 더 포함하고; 상기 결과 저장단계는, 상기 입력 문자열과 상기 후보 리스트의 영어 대표 문자열 중 상기 매칭 점수가 최고인 문자열을 상기 대표 리스트 데이터베이스에 저장하는 단계를 더 포함한다.
바람직하게는 상기 문자열 매칭 방법에서, 상기 사용자에 의해 선택된 상기 후보 리스트 레코드의 대표 문자열을 제2언어 대표 문자열로 변환하는데 사용된 매핑 정보 항목들에 대해서는 지정된 가산점을 부여한 새로운 우선순위 점수를 부여하는 우선순위 변경단계를 더 포함한다.
바람직하게는 상기 문자열 매칭 방법에서, 상기 대표 문자열 결정단계는, 상기 후보 리스트에 포함된 영어 대표 문자열 중 상기 매칭 점수가 최고인 문자열에 대응하는 대표 문자열을 출력 문자열로 결정하는 단계를 포함한다.
바람직하게는 상기 문자열 매칭 방법에서, 상기 대표 문자열 결정단계는, 상기 후보 리스트에 포함된 영어 대표 문자열 중 지정된 기준 점수 이상인 문자열이 없는 경우 상기 입력 문자열을 상기 출력 문자열로 결정하는 단계를 더 포함하고; 상기 결과 저장단계는, 상기 입력 문자열과 상기 후보 리스트의 영어 대표 문자열 중 최고 매칭 점수를 가진 문자열을 대표 리스트 데이터베이스에 저장하는 단계를 더 포함한다.
바람직하게는 상기 문자열 매칭 방법에서, 입력 문자열이 포함된 멀티미디어 정보를 입력받고 상기 멀티미디어 정보에 포함된 상기 입력 문자열을 추출하는 입력 문자열 추출단계를 더 포함한다.
바람직하게는 상기 문자열 매칭 방법에서, 상기 멀티미디어 정보는 MP3 파일이고, 상기 입력 문자열 추출단계는, 상기 MP3 파일을 파싱하여 ID3 태그에 포함된 아티스트명을 추출하는 단계를 포함한다.
바람직하게는 상기 문자열 매칭 방법에서, 상기 대표 문자열 결정단계는, 상기 멀티미디어 정보의 입력 문자열을 상기 출력 문자열로 수정하는 단계를 더 포함한다.
본 발명의 다른 특징은, 상기 문자열 매칭 방법을 수행하는 프로그램을 기록한 컴퓨터 판독 가능한 기록매체를 제공하는 것이다.
본 발명의 또 다른 특징은, 입력 문자열에 매칭되는 대표 문자열을 출력하는 문자열 매칭 시스템에 있어서, 대표 문자열과 그에 대응하는 제2언어 대표 문자열이 저장되는 대표 리스트 데이터베이스; 제1언어와 제2언어 간의 매핑 정보가 저장되는 언어 매핑 테이블; 상기 언어 매핑 테이블을 이용하여 상기 입력 문자열을 하나 이상의 제2언어 문자열로 변환하여 변환 리스트를 생성하는 제2언어 문자열 생성수단; 상기 대표 리스트 데이터베이스를 검색하여 상기 변환 리스트의 문자열과 동일한 제2언어 대표 문자열을 가진 레코드로 구성된 후보 리스트를 생성하는 대표 리스트 검색수단; 및 상기 후보 리스트의 레코드 중 하나에 포함된 대표 문자열을 출력 문자열로 결정하는 대표 문자열 결정수단을 포함하는 것이다.
바람직하게는 상기 문자열 매칭 시스템에서, 문자열과 그에 대응하는 대표 문자열이 포함된 문자열 매칭 결과가 저장되는 이전 결과 데이터베이스; 상기 이전 결과 데이터베이스를 검색하여 상기 입력 문자열과 동일한 문자열이 존재하면, 그에 대응하는 대표 문자열을 출력 문자열로 결정하는 이전 결과 검색수단; 및 상기 입력 문자열과 상기 출력 문자열이 상기 이전 결과 데이터베이스에 존재하지 않는 경우, 상기 이전 결과 데이터베이스에 저장하는 결과 저장수단을 더 포함한다.
바람직하게는 상기 문자열 매칭 시스템에서, 상기 제2언어 문자열 생성수단은, 상기 입력 문자열에 포함된 소정의 특수문자를 제거한 후 제2언어 문자열로 변환한다.
바람직하게는 상기 문자열 매칭 시스템에서, 상기 제1언어는 한글이고 상기 제2언어는 영어인 경우, 상기 언어 매핑 테이블은, 한글의 초성과 중성을 조합한 글자를 하나 이상의 영어 문자열로 매핑하는 정보와, 한글의 종성을 하나 이상의 영어 문자열로 매핑하는 정보를 포함하고; 상기 제2언어 문자열 생성수단은, 상기 입력 문자열이 영어인 경우 상기 입력 문자열을 소문자로 변환한 문자열을 상기 변환 리스트에 포함시킨다.
바람직하게는 상기 문자열 매칭 시스템에서, 상기 매핑 정보에는 항목별 우선순위 점수가 부여되어 있고, 상기 제2언어 문자열 생성수단은, 상기 우선순위 점 수를 이용하여 상기 변환 리스트에 포함된 각 문자열에 대한 매칭 점수를 계산하여 부여하고, 상기 매칭 점수가 높은 지정된 개수의 문자열만을 상기 변환 리스트에 포함시킨다.
바람직하게는 상기 문자열 매칭 시스템에서, 상기 대표 문자열 결정수단은, 상기 후보 리스트에서 사용자가 선택한 레코드의 대표 문자열을 출력 문자열로 결정하고, 상기 사용자가 상기 후보 리스트의 레코드 중 어느 것도 선택하지 않은 경우 상기 입력 문자열을 상기 출력 문자열로 결정하고; 상기 결과 저장수단은, 상기 입력 문자열이 상기 출력 문자열로 결정되는 경우, 상기 입력 문자열과 상기 후보 리스트의 영어 대표 문자열 중 매칭 점수가 최고인 문자열을 상기 대표 리스트 데이터베이스에 저장한다.
바람직하게는 상기 문자열 매칭 시스템에서, 상기 사용자의 선택에 의해 상기 출력 문자열이 결정되는 경우, 상기 선택된 후보 리스트 레코드의 대표 문자열을 제2언어 대표 문자열로 변환하는데 사용된 매핑 정보 항목들에 대해서는 지정된 가산점을 부여한 새로운 우선순위 점수를 부여하는 우선순위 변경수단을 더 포함한다.
바람직하게는 상기 문자열 매칭 시스템에서, 상기 매핑 정보에 항목별 우선순위 점수가 부여되어 있고, 상기 제2언어 문자열 생성수단은, 상기 우선순위 점수를 이용하여 상기 변환 리스트에 포함된 각 문자열에 대한 매칭 점수를 계산하여 부여하고; 상기 대표 문자열 결정수단은, 상기 후보 리스트에 포함된 영어 대표 문자열 중 상기 매칭 점수가 최고인 문자열에 대응하는 대표 문자열을 출력 문자열로 결정한다.
바람직하게는 상기 문자열 매칭 시스템에서, 상기 대표 문자열 결정수단은, 상기 후보 리스트에 포함된 영어 대표 문자열 중 지정된 점수 이상인 문자열이 없는 경우 상기 입력 문자열을 상기 출력 문자열로 결정하고; 상기 결과 저장수단은, 상기 입력 문자열을 상기 출력 문자열로 결정하는 경우, 상기 입력 문자열과 상기 후보 리스트의 영어 대표 문자열 중 최고 매칭 점수를 가진 문자열을 대표 리스트 데이터베이스에 저장한다.
바람직하게는 상기 문자열 매칭 시스템에서, 상기 입력 문자열이 포함된 멀티미디어 정보를 입력받고 상기 멀티미디어 정보에 포함된 상기 입력 문자열을 추출하는 입력 문자열 추출수단을 더 포함한다.
바람직하게는 상기 문자열 매칭 시스템에서, 상기 대표 문자열 결정수단은, 상기 멀티미디어 정보의 입력 문자열을 상기 출력 문자열로 수정한다.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 설명한다.
도 1은 본 발명의 일실시예에 따른 문자열 매칭 시스템의 구성도로서, 대표 문자열에 대한 정보가 저장되는 대표 리스트 데이터베이스(DB)(130), 언어 간의 매핑 정보가 저장되는 언어 매핑 테이블이 포함된 언어 매핑 데이터베이스(120), 입력 문자열을 하나 이상의 제2언어 문자열로 변환한 변환 리스트를 생성하는 제2언어 문자열 생성 수단(101), 변환 리스트로부터 대표 문자열의 후보 리스트를 생성하는 대표 리스트 검색수단(102), 후보 리스트에서 하나의 대표 문자열을 선택하는 대표 문자열 결정수단(103)을 포함한다.
대표 리스트 데이터베이스(130)는 매칭이 완료된 대표 문자열과 그에 대응하는 제2언어 표기인 제2언어 대표 문자열의 리스트가 저장되어 있다. 도 9는 아티스트명과 관련된 응용에서의 대표 리스트 데이터베이스(130) 구성 예로서, 아티스트들의 대표적인 이름 표기(대표 문자열, 901)와 그에 대한 영어 표기(영어 대표 문자열, 902)가 저장되어 있음을 알 수 있다.
언어 매핑 테이블은 제1언어와 제2언어 간의 매핑 정보가 저장되는 것으로, 예컨대 한글의 자소와 그에 매핑되는 영어 문자열이 저장되어 있으며, 하나의 한글 자소에 다수의 영어 문자열이 매핑될 수 있다.
제2언어 문자열 생성수단(101)은 언어 간 매핑 정보인 언어 매핑 테이블을 이용하여 입력된 문자열을 가능한 모든 제2언어 문자열로 변환한 리스트를 생성한다. 대표 리스트 검색수단(102)은 변환 리스트의 외국어 표기들이 대표 리스트 데이터베이스(130)에 있는지 검색하여 일치하는 제2언어 대표 문자열을 가진 레코드를 찾아 후보 리스트에 포함시킨다. 대표 문자열 결정수단(103)은 후보 리스트의 레코드 중 하나에 포함된 대표 문자열을 선택하여 출력 문자열로 결정한다.
도 2는 본 발명의 다른 실시예에 따른 문자열 매칭 시스템의 구성도로서, 대표 리스트 데이터베이스(130), 언어 매핑 테이블이 저장된 데이터베이스(120), 제2언어 문자열 생성수단(101), 대표 리스트 검색수단(102), 대표 문자열 결정수단(103), 문자열과 그에 대응하는 대표 문자열이 포함된 문자열 매칭 결과가 저장되는 이전 결과 데이터베이스(140), 이전에 입력 문자열과 동일한 문자열에 대해 매칭한 적이 있는지 검색하는 이전 결과 검색수단(104), 매칭 결과를 저장하는 결과 저장수단(106), 우선순위를 점수를 변경하는 우선순위 변경수단(105)을 포함한다.
도 8은 본 발명에 따른 이전 결과 데이터베이스(140)의 예로서, 사용자가 입력할 수 있는 다양한 표기의 문자열(801)과 그에 대응하는 대표 문자열(802)을 저장하고 있다. 이는 시스템 운영중 결과 저장수단(106)에 의해 축적된 문자열 매칭 결과에 대한 정보이다. 입력 문자열이 이전 결과 데이터베이스(140)에 존재한다면 더 이상 매칭 작업을 수행할 필요가 없다. 이전 결과 검색수단(104)은 먼저 이전 결과 데이터베이스(140)를 검색하여 입력 문자열과 동일한 문자열이 존재하면, 그에 대응하는 대표 문자열을 출력 문자열로 결정하므로 효율적이다. 예컨대, 입력 문자열이 '룰 라'라면, (룰 라, 룰라)(811)라는 레코드가 데이터베이스(140)에 존재하므로, 이전에도 동일 문자열에 대해 매칭 작업을 수행한 적이 있음을 알 수 있으며, 대표 문자열로 '룰라'가 출력된다.
반면, 이전 결과 데이터베이스(140)에 존재하지 않는 문자열이 입력되어 그에 매칭되는 대표 문자열이 결정되었다면, 결과 저장수단(106)은 입력 문자열과 출력된 대표 문자열을 데이터베이스(140)에 저장하고, 추후 동일한 문자열이 입력된 경우는 이 정보를 참조한다.
제2언어 문자열 생성수단(101)은, 입력 문자열에 포함된 소정의 특수문자를 제거한 후 제2언어 문자열로 변환함으로써, 특수문자가 포함된 문자열의 경우도 매칭이 가능하도록 한다. 가수 이름이나 그룹 이름 등은 의미 있는 특수문자를 포함할 가능성이 있기 때문에, '-'(하이픈)과 ' '(공백)에 대해서만 삭제 처리하는 것이 바람직하다. 예컨대, 입력 문자열 '이 미 자', 'Lee Mi-Ja'는 각각 '이미자', 'LeeMiJa'로 수정된다. 실시예에 따라 적절한 특수문자에 대해 삭제 등의 처리가 필요할 것이다.
제1언어가 한글이고 제2언어가 영어인 예에서, 언어 매핑 테이블은, 한글의 초성과 중성을 조합한 글자를 하나 이상의 영어 문자열로 매핑하는 정보와, 한글의 종성을 하나 이상의 영어 문자열로 매핑하는 정보를 포함하는 것이 바람직하며, 입력 문자열이 영어인 경우는 매핑 정보를 참조할 필요 없이 소문자로 변환하여 변환 리스트에 포함시키면 된다. 영어로 매핑할 때, 한글의 초성과 중성을 따로 매핑할 경우는 한글 이름 등의 한글 문자열에 대해 실제로 사용되지 않는 영어 문자열들까지 생성될 수 있으며, 경우의 수가 커지므로 시스템이 복잡해져 효율이 저하될 수 있다. 또한, 한글의 종성까지 초성 및 중성과 함께 조합하여 영어로 매핑하면 매핑 테이블의 경우의 수가 너무 커진다. 따라서, 한글의 초성과 중성을 하나로 합해 영어로 매핑하고 종성을 따로 매핑하는 것이 효율적이다. 도 7a 및 도 7b가 그 예로서, 각각 초/중성 매핑 테이블과 종성 매핑 테이블이다.
매핑 정보에는 항목별 우선순위 점수가 부여될 수 있으며, 제2언어 문자열 생성수단(101)은, 우선순위 점수를 이용하여 변환 리스트에 포함된 각 문자열에 대한 매칭 점수를 계산하여 부여하고, 매칭 점수가 높은 지정된 개수의 문자열만을 변환 리스트에 포함시켜 출력할 수 있다.
생성된 변환 리스트는 대표 리스트 검색수단(102)에 입력되며, 대표 리스트 검색수단(102)은 대표 리스트 데이터베이스(130)를 검색하여 변환 리스트 문자열과 동일한 제2언어 대표 문자열이 포함된 레코드들을 찾아 후보 리스트를 생성한다.
대표 문자열 결정수단(103)은, 후보 리스트를 사용자에게 보여주고 사용자가 선택한 레코드의 대표 문자열을 출력 문자열로 결정할 수 있다. 만일, 사용자가 후보 리스트의 레코드 중 어느 것도 선택하지 않은 경우는, 입력 문자열을 출력 문자열로 결정한다. 이 경우, 결과 저장수단(106)은 입력 문자열을 대표 리스트 데이터베이스(130)에 저장하여 추후 매칭 작업에 이용될 수 있도록 한다. 이때, 후보 리스트의 영어 대표 문자열 중 매칭 점수가 최고인 문자열이 함께 저장되는 것이 바람직하다.
한편, 대표 문자열 결정수단(103)은, 사용자에게 질의하지 않고, 후보 리스트에 포함된 영어 대표 문자열 중 매칭 점수가 최고인 문자열에 대응하는 대표 문자열을 출력 문자열로 결정할 수 있다. 또한, 후보 리스트에 포함된 영어 대표 문자열 중 지정된 매칭 점수 이상인 문자열이 없는 경우는 입력 문자열을 출력 문자열로 결정할 수 있다. 이 경우 결과 저장수단(106)에 의해, 입력 문자열과 후보 리스트의 영어 대표 문자열 중 최고 매칭 점수를 가진 문자열이 대표 리스트 데이터베이스(130)에 저장될 것이다.
우선순위 변경수단(105)은 언어 매핑 테이블의 매핑 정보 항목에 부여된 우선순위 점수를 변경한다. 예컨대, 사용자에 의해 출력 문자열이 결정되는 경우, 선택된 후보 리스트 레코드의 대표 문자열을 제2언어 대표 문자열로 변환하는데 사용된 매핑 정보 항목들에 대해서는 지정된 가산점을 부여한 새로운 우선순위 점수를 부여할 수 있다. 이렇게 문자열 매칭 결과에 따라 적응적으로 우선순위 점수를 변경하여 매핑 정보의 우선순위 점수를 최적화할 수 있다.
한편, 입력 문자열이 포함된 멀티미디어 정보를 입력받고 멀티미디어 정보에 포함된 입력 문자열을 추출하는 입력 문자열 추출수단(도시되지 않음)이 포함될 수 있다. 또한, 대표 문자열 결정수단(103)은 멀티미디어 정보의 입력 문자열을 결정된 대표 문자열로 수정할 수 있다.
도 3은 본 발명에 따른 문자열 매칭 방법의 메커니즘 흐름도이다. 이하에서는 대표로 제1언어가 한글이고 제2언어가 영어인 경우에 대해서 설명한다. 그러나, 제1언어와 제2언어는 다른 어떤 언어에 대해서도 적용 가능하다.
먼저, 문자열을 입력 받는다(S301). MP3(MPEG Audio Layer-3) 파일의 아티스트명을 대상으로 하는 응용의 경우, 이 파일을 파싱함으로써 ID3 태그에 포함된 아티스트명을 추출하여 입력 문자열로 할 수 있다. 도 10은 MP3 파일 구조를 도시한 것이다. 이 파일은 오디오 데이터(1010)와 태그(1020)로 구성되며, 태그(1020) 정보에서 아티스트명(1021)을 파싱하여 추출할 수 있다.
문자열이 입력되면(S301), 문자열에 포함된 특수문자를 처리한다(S302). 특수문자의 처리는 소정의 특수문자를 제거하는 과정이 될 수 있으며, 제거되는 특수문자는 '-'와 ' ' 등이다. 그리고, 이전 결과 데이터베이스(140)를 검색하여(S303) 이전 결과가 존재하면, 즉 과거의 매칭 결과가 존재하면(S304), 그에 대응하는 대표 문자열을 출력 문자열로 결정하여 출력하고 종료한다(S305).
입력 문자열이 한글이면(S306), 언어 매핑 테이블의 매핑 정보를 참조하여 변환 리스트를 생성한다(S308). 이때, 한글의 초성과 중성을 조합한 글자를 하나 이상의 영어 문자열로 매핑하는 정보와, 한글의 종성을 하나 이상의 영어 문자열로 매핑하는 정보를 포함하는 언어 매핑 테이블을 이용하여 입력 문자열을 하나 이상의 영어 문자열로 변환하고 변환 리스트를 생성하는 것이 바람직하다. 입력 문자열이 영어이면(S306), 영어로 매핑할 필요 없이 소문자로 변환하여 변환 리스트로 한다(S307).
다음으로, 변환 리스트의 문자열이 대표 리스트 데이터베이스(130)의 대표 리스트 정보에 존재하는지 검색하여 후보 리스트를 생성한다(S309). 후보 리스트는 변환 리스트와 일치하는 영어 대표 문자열과 한글로 된 대표 문자열이 포함된 레코드 리스트이다.
후보 리스트가 생성되면, 리스트의 대표 문자열 중 하나를 대표 문자열로 결정하고 출력한다(S310). 대표 문자열의 출력은 멀티미디어 정보에 기록된 입력 문자열을 출력 문자열로 직접 수정함으로써 수행될 수도 있다. 예컨대, ID3 태그(1020)의 아티스트명(1021)을 대표 문자열로 직접 수정하도록 구현할 수 있다.
이전 결과가 존재하지 않는 경우, 즉 출력 문자열이 이전 결과 데이터베이스(140)에서 선택되지 않은 경우는, 입력 문자열에 매칭되는 대표 문자열로 결정된 출력 문자열을 입력 문자열과 함께 이전 결과 데이터베이스(140)에 저장한다(S311). 또한, 입력 문자열이 대표 문자열로 결정되어 출력되는 경우, 즉 대표 리스트 데이터베이스(130)에 존재하지 않는 대표 문자열이 선택된 경우는 입력 문자열을 대표 문자열로 하여 데이터베이스(130)에 저장한다(S311). 이때, 후보 리스트의 영어 대표 문자열 중 매칭 점수가 최고인 문자열을 영어 대표 문자열로 하여 함께 저장할 수 있다.
사용자에 의해 출력 문자열이 선택된 경우는 이 출력 문자열의 영어 표기에 해당하는 매핑 정보 항목들에 대해서 우선순위 점수를 변경하여 다음 매칭에 적용되도록 할 수 있다(S312).
도 4는 본 발명에 따른 제2언어 문자열 생성단계의 매커니즘 흐름도이다. 먼저 입력 문자열을 분해한다(S308-1). 문자열의 각 글자를 초성과 중성, 종성 두 부분으로 분해하고, 언어 매핑 테이블을 참조하여 분해된 각 자소에 영어 문자 또는 문자열을 할당하여 하나 이상의 영어 문자열을 생성한다(S802-2).
도 7a 및 도 7b는 본 발명에 따른 언어 매핑 테이블에 포함되는 초/중성 매핑 테이블 및 종성 매핑 테이블의 예로서, 하나의 한글 자소당 3개의 매핑 정보 항목이 도시되어 있으나, 이는 실시예에 따라 다양한 개수로 구현될 수 있다. 도 7a를 참조하면, 초/중성 매핑 테이블은 한글 표기가 가능한 초성과 중성의 모든 조합과 그에 대응하는 하나 이상의 영어 표기(701, 702, 703)를 포함한 매핑 정보를 저장하고 있다. 또한, 도 7b를 참조하면, 종성 매핑 테이블은 종성에 올 수 있는 한글 자소와 그에 대응하는 하나 이상의 영어 표기(701, 702, 703)를 포함한 매핑 정보를 저장하고 있다. 도 7a를 참조하면, 초성과 중성을 조합한 '거'에 'gou', 'geo'라는 매핑 정보가 기록되어 있으며(711), '희'에 'hee', 'hui', 'heui'라는 매핑 정보가 기록되어 있다(712). 도 7b를 참조하면, 종성인 'ㄴ'에 'n'이 매핑된다(721). 따라서, 입력 문자열이 '건희'라면, 이 문자열은 '거', 'ㄴ', '희'로 분해되고, 변환 리스트는 'gounhee', 'gounhui', 'gounheui', 'geonhee', 'geonhui', 'geonheui'이다.
도 7a 및 도 7b에 도시된 예에서는 한글 한자당 최대 9개의 조합이 가능하며, 효율적인 검색을 위해 이들 조합 중 정해진 개수(n)만 포함된 변환 리스트를 생성할 필요가 있을 수 있다. 이러한 경우 언어 매핑 테이블의 매핑 정보에 항목별 우선순위 점수를 부여하고, 이 우선순위 점수를 이용하여 변환 리스트에 포함된 각 문자열에 대한 매칭 점수를 계산하고(S308-3), 매칭 점수가 높은 n개의 문자열만을 변환 리스트에 포함한다(S308-4). 우선순위 점수는 매핑 테이블의 각 열에 부여되거나, 매핑 테이블의 각 매핑 정보 항목마다 부여될 수 있다. 예컨대, 초/중성 매핑 테이블 및 종성 매핑 테이블의 열 '1st 영어'(701)에 10점, '2nd 영어'(702)에 7점, '3rd 영어'(703)에 4점을 부여하였다면, 다음과 같이 매칭 점수가 계산될 수 있다(S308-3).
'gounhee' = 30점('gou'의 10점 + 'n'의 10점 + 'hee'의 10점)
'gounhui' = 27점('gou'의 10점 + 'n'의 10점 + 'hui'의 7점)
'gounheui' = 24점('gou'의 10점 + 'n'의 10점 + 'heui'의 4점)
'geonhee' = 27점('geo'의 7점 + 'n'의 10점 + 'hee'의 10점)
'geonhui' = 24점('geo'의 7점 + 'n'의 10점 + 'hui'의 7점)
'geonheui' = 21점('geo'의 7점 + 'n'의 10점 + 'heui'의 4점)
또, n이 3인 경우, 'gounhee', 'gounhui', 'geonhee' 만이 변환 리스트에 포함될 것이다(S308-4). 한편, 실시예에 따라서는 매칭 점수가 지정된 점수 이상인 문자열만 변환 리스트에 포함시킬 수도 있다.
도 5는 본 발명에 따른 대표 문자열 결정단계에서 사용자가 대표 문자열을 결정하는 경우의 매커니즘 흐름도이다. 먼저, 전 단계(S309)에서 생성된 후보 리스트가 입력된다(S310-0). 예컨대 '루라'라는 입력 문자열에 대해 대표 리스트 데이터베이스(130)의 검색을 통해 (룰라, roola)(911), (루우라, roora)(912)라는 후보 리스트가 생성되어 입력될 수 있다.
사용자가 후보 리스트의 레코드 중 하나를 선택하면(S310-1), 선택된 레코드의 문자열이 출력 문자열로 결정된다(310-2). 사용자가 (룰라, roola)(911)를 선택하였다면 (루라, 룰라)가 이전 결과 데이터베이스(130)에 저장되고, 다음 매칭에서 '루라'가 입력되면 이 정보가 참조된다.
사용자가 후보 리스트 전부를 거부하고 입력 문자열을 사용하기를 원하는 경우는(S310-1) 입력 문자열이 출력 문자열로 결정되며(S310-3), 입력 문자열이 대표 리스트 데이터베이스(130)에 저장된다(S311-1). 또한, 매칭 결과인 입력 문자열과 출력 문자열은 이전 결과 데이터베이스(140)에 저장되어 다음 문자열 매칭시 우선적으로 참조 된다(S311-2). 이처럼 사용자에 의해 출력 문자열이 선택된 경우는 출력 문자열에 대응하는 영어 매핑 정보 항목의 우선순위 점수를 변경한다(S312). 즉, 소정의 가산점을 더하여 사용자의 의사가 매핑 정보에 반영되도록 하는 것이다.
도 6은 본 발명에 따른 대표 문자열 결정단계에서 매칭 점수를 이용하여 대표 문자열을 결정하는 경우의 매커니즘 흐름도이다. 사용자의 선택 입력이 번거롭거나 불필요한 서비스인 경우는, 입력되는 후보 리스트(S310-0)에 포함된 영어 대표 문자열 중 매칭 점수가 최고인 문자열에 대응하는 대표 문자열이 출력 문자열로 선택될 수 있다(S310-10). 이때, 후보 리스트에 포함된 영어 대표 문자열 중 지정된 기준 점수 이상인 문자열이 없는 경우는(S310-11), 입력 문자열을 대표 문자열로 결정하여 출력하고(S310-3) 대표 리스트 데이터베이스(130)에 저장하도록 하여(S311-1), 매칭 결과에 대한 신뢰도를 향상시킬 수 있다. 한편, 최고 점수를 가진 문자열에 대해 사용자의 허락을 받아(S310-12) 사용자가 컨펌한 경우만 대표 문자열로 결정할 수 있다(S310-13). 마찬가지로 매칭 결과를 이전 결과 데이터베이스(140)에 저장한다(S311-2).
본 발명은 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다.
이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
이상에서 설명한 바와 같은 본 발명의 구성에 의하면, 다른 표기로 기록된 동일 의미의 문자열에 대한 대표 문자열을 찾을 수 있으므로, 문자열에 의해 분류를 제공하는 서비스에 유용하다. 예컨대, MP3 플레이어에서 아티스트명에 의한 분 류 시나리오를 제공하는 경우, '이 미 자', '이 미자', '이미자', 'Lee Mi-Za', 'Lee Mi Ja', 'Lee miza' 등으로 아티스트명이 입력되어 있는 경우에도 하나의 대표 이름인 '이미자'로 매칭되어, 해당 음악 파일들이 한 아티스트의 것으로 정확히 분류될 수 있다. 또한, 한글의 초성과 중성을 묶어 영어로 매핑함으로써 간단하고 효율적으로 매칭 알고리즘을 수행할 수 있으며, 매핑 정보의 우선순위 점수를 적응적으로 변경함으로써 매칭이 수행될 수록 더욱 최적화된 결과를 얻을 수 있다.
Claims (34)
- 입력 문자열에 매칭되는 대표 문자열을 출력하는 문자열 매칭 방법에 있어서,제1언어와 제2언어 간의 매핑 정보가 저장된 언어 매핑 테이블을 참조하여 상기 입력 문자열을 하나 이상의 제2언어 문자열로 변환하여 변환 리스트를 생성하는 제2언어 문자열 생성단계;대표 문자열과 그에 대응하는 제2언어 대표 문자열이 저장되는 대표 리스트 데이터베이스에서 상기 변환 리스트의 문자열과 동일한 제2언어 대표 문자열을 가진 레코드를 찾아 후보 리스트를 생성하는 대표 리스트 검색단계; 및상기 후보 리스트의 레코드 중 하나에 포함된 대표 문자열을 출력 문자열로 결정하는 대표 문자열 결정단계를 포함하는 것을 특징으로 하는 문자열 매칭 방법.
- 제1항에 있어서,문자열과 그에 대응하는 대표 문자열이 포함된 매칭 결과가 저장되는 이전 결과 데이터베이스를 검색하여 상기 입력 문자열과 동일한 문자열이 존재하면, 그에 대응하는 대표 문자열을 출력 문자열로 결정하는 이전 결과 검색단계; 및상기 입력 문자열과 상기 출력 문자열이 상기 이전 결과 데이터베이스에 존재하지 않는 경우 상기 이전 결과 데이터베이스에 저장하는 결과 저장단계를 더 포 함하는 것을 특징으로 하는 문자열 매칭 방법.
- 제2항에 있어서,상기 제2언어 문자열 생성단계는, 상기 변환 전에 상기 입력 문자열에 포함된 유효하지 않은 소정의 특수문자를 제거하는 특수문자 처리 단계를 더 포함하는 것을 특징으로 하는 문자열 매칭 방법.
- 제3항에 있어서,상기 특수문자는 '-'과 ' '을 포함하는 것을 특징으로 하는 문자열 매칭 방법.
- 제3항에 있어서,상기 제1언어는 한글이고 상기 제2언어는 영어인 경우에는,상기 언어 매핑 테이블은, 한글의 초성과 중성을 조합한 글자를 하나 이상의 영어 문자열로 매핑하는 정보와, 한글의 종성을 하나 이상의 영어 문자열로 매핑하는 정보를 포함하고;상기 제2언어 문자열 생성단계는, 상기 입력 문자열이 영어인 경우 상기 입력 문자열을 소문자로 변환한 문자열을 상기 변환 리스트에 포함시키는 단계를 더 포함하는 것을 특징으로 하는 문자열 매칭 방법.
- 제3항에 있어서,상기 매핑 정보에 항목별 우선순위 점수를 부여하는 단계를 더 포함하고;상기 제2언어 문자열 생성단계는, 상기 우선순위 점수를 이용하여 상기 변환 리스트에 포함된 각 문자열에 대한 매칭 점수를 계산하여 부여하고, 상기 매칭 점수가 높은 지정된 개수의 문자열만을 상기 변환 리스트에 포함시키는 단계를 더 포함하는 것을 특징으로 하는 문자열 매칭 방법.
- 제5항에 있어서,상기 매핑 정보에 항목별 우선순위 점수를 부여하는 단계를 더 포함하고;상기 제2언어 문자열 생성단계는, 상기 우선순위 점수를 이용하여 상기 변환 리스트에 포함된 각 문자열에 대한 매칭 점수를 계산하여 부여하고, 상기 매칭 점수가 높은 지정된 개수의 문자열만을 상기 변환 리스트에 포함시키는 단계를 더 포함하는 것을 특징으로 하는 문자열 매칭 방법.
- 제5항에 있어서,상기 매핑 정보에 항목별 우선순위 점수를 부여하는 단계를 더 포함하고;상기 제2언어 문자열 생성단계는, 상기 우선순위 점수를 이용하여 상기 변환 리스트에 포함된 각 문자열에 대한 매칭 점수를 계산하여 부여하고, 상기 매칭 점수가 지정된 점수 이상인 문자열만을 상기 변환 리스트에 포함시키는 단계를 더 포함하는 것을 특징으로 하는 문자열 매칭 방법.
- 제3항에 있어서,상기 대표 문자열 결정단계는, 상기 후보 리스트에서 사용자가 선택한 레코드의 대표 문자열을 출력 문자열로 결정하는 단계를 포함하는 것을 특징으로 하는 문자열 매칭 방법.
- 제5항에 있어서,상기 대표 문자열 결정단계는, 상기 후보 리스트에서 사용자가 선택한 레코드의 대표 문자열을 상기 출력 문자열로 결정하는 단계를 포함하는 것을 특징으로 하는 문자열 매칭 방법.
- 제7항에 있어서,상기 대표 문자열 결정단계는, 상기 후보 리스트에서 사용자가 선택한 레코드의 대표 문자열을 상기 출력 문자열로 결정하는 단계를 포함하는 것을 특징으로 하는 문자열 매칭 방법.
- 제11항에 있어서,상기 대표 문자열 결정단계는, 상기 사용자가 상기 후보 리스트의 레코드 중 어느 것도 선택하지 않은 경우 상기 입력 문자열을 상기 출력 문자열로 결정하는 단계를 더 포함하고;상기 결과 저장단계는, 상기 입력 문자열과 상기 후보 리스트의 영어 대표 문자열 중 상기 매칭 점수가 최고인 문자열을 상기 대표 리스트 데이터베이스에 저장하는 단계를 더 포함하는 것을 특징으로 하는 문자열 매칭방법.
- 제12항에 있어서,상기 사용자에 의해 선택된 상기 후보 리스트 레코드의 대표 문자열을 제2언어 대표 문자열로 변환하는데 사용된 매핑 정보 항목들에 대해서는 지정된 가산점을 부여한 새로운 우선순위 점수를 부여하는 우선순위 변경단계를 더 포함하는 것을 특징으로 하는 문자열 매칭 방법.
- 제3항에 있어서,상기 매핑 정보에 항목별 우선순위 점수를 부여하는 단계를 더 포함하고;상기 제2언어 문자열 생성단계는, 상기 우선순위 점수를 이용하여 상기 변환 리스트에 포함된 각 문자열에 대한 매칭 점수를 계산하여 부여하는 단계를 더 포함하고;상기 대표 문자열 결정단계는, 상기 후보 리스트에 포함된 영어 대표 문자열 중 상기 매칭 점수가 최고인 문자열에 대응하는 대표 문자열을 출력 문자열로 결정하는 단계를 포함하는 것을 특징으로 하는 문자열 매칭 방법.
- 제5항에 있어서,상기 매핑 정보에 항목별 우선순위 점수를 부여하는 단계를 더 포함하고;상기 제2언어 문자열 생성단계는, 상기 우선순위 점수를 이용하여 상기 변환 리스트에 포함된 각 문자열에 대한 매칭 점수를 계산하여 부여하는 단계를 더 포함하고;상기 대표 문자열 결정단계는, 상기 후보 리스트에 포함된 영어 대표 문자열 중 상기 매칭 점수가 최고인 문자열에 대응하는 대표 문자열을 출력 문자열로 결정하는 단계를 포함하는 것을 특징으로 하는 문자열 매칭 방법.
- 제7항에 있어서,상기 대표 문자열 결정단계는, 상기 후보 리스트에 포함된 영어 대표 문자열 중 상기 매칭 점수가 최고인 문자열에 대응하는 대표 문자열을 출력 문자열로 결정하는 단계를 포함하는 것을 특징으로 하는 문자열 매칭 방법.
- 제16항에 있어서,상기 대표 문자열 결정단계는, 상기 후보 리스트에 포함된 영어 대표 문자열 중 지정된 기준 점수 이상인 문자열이 없는 경우 상기 입력 문자열을 상기 출력 문자열로 결정하는 단계를 더 포함하고;상기 결과 저장단계는, 상기 입력 문자열과 상기 후보 리스트의 영어 대표 문자열 중 최고 매칭 점수를 가진 문자열을 대표 리스트 데이터베이스에 저장하는 단계를 더 포함하는 것을 특징으로 하는 문자열 매칭방법.
- 제17항에 있어서,입력 문자열이 포함된 멀티미디어 정보를 입력받고 상기 멀티미디어 정보에 포함된 상기 입력 문자열을 추출하는 입력 문자열 추출단계를 더 포함하는 것을 특징으로 하는 문자열 매칭 방법.
- 제18항에 있어서,상기 멀티미디어 정보는 MP3 파일이고,상기 입력 문자열 추출단계는, 상기 MP3 파일을 파싱하여 ID3 태그에 포함된 아티스트명을 추출하는 단계를 포함하는 것을 특징으로 하는 문자열 매칭 방법.
- 제19항에 있어서,상기 대표 문자열 결정단계는, 상기 멀티미디어 정보의 입력 문자열을 상기 출력 문자열로 수정하는 단계를 더 포함하는 것을 특징으로 하는 문자열 매칭 방법.
- 제1항 내지 제20항 중 어느 한 항의 방법을 수행하는 프로그램을 기록한 컴퓨터 판독 가능한 기록매체.
- 입력 문자열에 매칭되는 대표 문자열을 출력하는 문자열 매칭 시스템에 있어 서,대표 문자열과 그에 대응하는 제2언어 대표 문자열이 저장되는 대표 리스트 데이터베이스;제1언어와 제2언어 간의 매핑 정보가 저장되는 언어 매핑 테이블;상기 언어 매핑 테이블을 이용하여 상기 입력 문자열을 하나 이상의 제2언어 문자열로 변환하여 변환 리스트를 생성하는 제2언어 문자열 생성수단;상기 대표 리스트 데이터베이스를 검색하여 상기 변환 리스트의 문자열과 동일한 제2언어 대표 문자열을 가진 레코드로 구성된 후보 리스트를 생성하는 대표 리스트 검색수단; 및상기 후보 리스트의 레코드 중 하나에 포함된 대표 문자열을 출력 문자열로 결정하는 대표 문자열 결정수단을 포함하는 것을 특징으로 하는 문자열 매칭 시스템.
- 제22항에 있어서,문자열과 그에 대응하는 대표 문자열이 포함된 문자열 매칭 결과가 저장되는 이전 결과 데이터베이스;상기 이전 결과 데이터베이스를 검색하여 상기 입력 문자열과 동일한 문자열이 존재하면, 그에 대응하는 대표 문자열을 출력 문자열로 결정하는 이전 결과 검색수단; 및상기 입력 문자열과 상기 출력 문자열이 상기 이전 결과 데이터베이스에 존 재하지 않는 경우, 상기 이전 결과 데이터베이스에 저장하는 결과 저장수단을 더 포함하는 것을 특징으로 하는 문자열 매칭 시스템.
- 제22항 또는 제23항에 있어서,상기 제2언어 문자열 생성수단은, 상기 입력 문자열에 포함된 소정의 특수문자를 제거한 후 제2언어 문자열로 변환하는 것을 특징으로 하는 문자열 매칭 시스템.
- 제24항에 있어서,상기 제1언어는 한글이고 상기 제2언어는 영어인 경우에는,상기 언어 매핑 테이블은, 한글의 초성과 중성을 조합한 글자를 하나 이상의 영어 문자열로 매핑하는 정보와, 한글의 종성을 하나 이상의 영어 문자열로 매핑하는 정보를 포함하고;상기 제2언어 문자열 생성수단은, 상기 입력 문자열이 영어인 경우 상기 입력 문자열을 소문자로 변환한 문자열을 상기 변환 리스트에 포함시키는 것을 특징으로 하는 문자열 매칭 시스템.
- 제25항에 있어서,상기 매핑 정보에는 항목별 우선순위 점수가 부여되어 있고,상기 제2언어 문자열 생성수단은, 상기 우선순위 점수를 이용하여 상기 변환 리스트에 포함된 각 문자열에 대한 매칭 점수를 계산하여 부여하고, 상기 매칭 점수가 높은 지정된 개수의 문자열만을 상기 변환 리스트에 포함시키는 것을 특징으로 하는 문자열 매칭 시스템.
- 제25항에 있어서,상기 대표 문자열 결정수단은, 상기 후보 리스트에서 사용자가 선택한 레코드의 대표 문자열을 출력 문자열로 결정하고, 상기 사용자가 상기 후보 리스트의 레코드 중 어느 것도 선택하지 않은 경우 상기 입력 문자열을 상기 출력 문자열로 결정하고;상기 결과 저장수단은, 상기 입력 문자열이 상기 출력 문자열로 결정되는 경우, 상기 입력 문자열과 상기 후보 리스트의 영어 대표 문자열 중 매칭 점수가 최고인 문자열을 상기 대표 리스트 데이터베이스에 저장하는 것을 특징으로 하는 문자열 매칭 시스템.
- 제26항에 있어서,상기 대표 문자열 결정수단은, 상기 후보 리스트에서 사용자가 선택한 레코드의 대표 문자열을 출력 문자열로 결정하고, 상기 사용자가 상기 후보 리스트의 레코드 중 어느 것도 선택하지 않은 경우 상기 입력 문자열을 상기 출력 문자열로 결정하고;상기 결과 저장수단은, 상기 입력 문자열이 상기 출력 문자열로 결정되는 경 우, 상기 입력 문자열과 상기 후보 리스트의 영어 대표 문자열 중 매칭 점수가 최고인 문자열을 상기 대표 리스트 데이터베이스에 저장하는 것을 특징으로 하는 문자열 매칭 시스템.
- 제28항에 있어서,상기 사용자의 선택에 의해 상기 출력 문자열이 결정되는 경우, 상기 선택된 후보 리스트 레코드의 대표 문자열을 제2언어 대표 문자열로 변환하는데 사용된 매핑 정보 항목들에 대해서는 지정된 가산점을 부여한 새로운 우선순위 점수를 부여하는 우선순위 변경수단을 더 포함하는 것을 특징으로 하는 문자열 매칭 시스템.
- 제25항에 있어서,상기 매핑 정보에 항목별 우선순위 점수가 부여되어 있고,상기 제2언어 문자열 생성수단은, 상기 우선순위 점수를 이용하여 상기 변환 리스트에 포함된 각 문자열에 대한 매칭 점수를 계산하여 부여하고;상기 대표 문자열 결정수단은, 상기 후보 리스트에 포함된 영어 대표 문자열 중 상기 매칭 점수가 최고인 문자열에 대응하는 대표 문자열을 출력 문자열로 결정하는 것을 특징으로 하는 문자열 매칭 시스템.
- 제26항에 있어서,상기 대표 문자열 결정수단은, 상기 후보 리스트에 포함된 영어 대표 문자열 중 상기 매칭 점수가 최고인 문자열에 대응하는 대표 문자열을 출력 문자열로 결정하는 것을 특징으로 하는 문자열 매칭 시스템.
- 제31항에 있어서,상기 대표 문자열 결정수단은, 상기 후보 리스트에 포함된 영어 대표 문자열 중 지정된 점수 이상인 문자열이 없는 경우 상기 입력 문자열을 상기 출력 문자열로 결정하고;상기 결과 저장수단은, 상기 입력 문자열을 상기 출력 문자열로 결정하는 경우, 상기 입력 문자열과 상기 후보 리스트의 영어 대표 문자열 중 최고 매칭 점수를 가진 문자열을 대표 리스트 데이터베이스에 저장하는 것을 특징으로 하는 문자열 매칭 시스템.
- 제31항에 있어서,상기 입력 문자열이 포함된 멀티미디어 정보를 입력받고 상기 멀티미디어 정보에 포함된 상기 입력 문자열을 추출하는 입력 문자열 추출수단을 더 포함하는 것을 특징으로 하는 문자열 매칭 시스템.
- 제33항에 있어서,상기 대표 문자열 결정수단은, 상기 멀티미디어 정보의 입력 문자열을 상기 출력 문자열로 수정하는 것을 특징으로 하는 문자열 매칭 시스템.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020050080172A KR100739726B1 (ko) | 2005-08-30 | 2005-08-30 | 문자열 매칭 방법 및 시스템과 그 방법을 기록한 컴퓨터판독 가능한 기록매체 |
US11/453,597 US7979268B2 (en) | 2005-08-30 | 2006-06-16 | String matching method and system and computer-readable recording medium storing the string matching method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020050080172A KR100739726B1 (ko) | 2005-08-30 | 2005-08-30 | 문자열 매칭 방법 및 시스템과 그 방법을 기록한 컴퓨터판독 가능한 기록매체 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20070028664A KR20070028664A (ko) | 2007-03-13 |
KR100739726B1 true KR100739726B1 (ko) | 2007-07-13 |
Family
ID=37831049
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020050080172A KR100739726B1 (ko) | 2005-08-30 | 2005-08-30 | 문자열 매칭 방법 및 시스템과 그 방법을 기록한 컴퓨터판독 가능한 기록매체 |
Country Status (2)
Country | Link |
---|---|
US (1) | US7979268B2 (ko) |
KR (1) | KR100739726B1 (ko) |
Families Citing this family (136)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
CN101206659B (zh) * | 2006-12-15 | 2013-09-18 | 谷歌股份有限公司 | 自动搜索查询校正 |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
WO2009029865A1 (en) * | 2007-08-31 | 2009-03-05 | Google Inc. | Automatic correction of user input |
US8666976B2 (en) | 2007-12-31 | 2014-03-04 | Mastercard International Incorporated | Methods and systems for implementing approximate string matching within a database |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US8583418B2 (en) * | 2008-09-29 | 2013-11-12 | Apple Inc. | Systems and methods of detecting language and natural language strings for text to speech synthesis |
US8712776B2 (en) | 2008-09-29 | 2014-04-29 | Apple Inc. | Systems and methods for selective text to speech synthesis |
WO2010067118A1 (en) | 2008-12-11 | 2010-06-17 | Novauris Technologies Limited | Speech recognition involving a mobile device |
US8380507B2 (en) | 2009-03-09 | 2013-02-19 | Apple Inc. | Systems and methods for determining the language to use for speech generated by a text to speech engine |
US20120309363A1 (en) | 2011-06-03 | 2012-12-06 | Apple Inc. | Triggering notifications associated with tasks items that represent tasks to perform |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US8972930B2 (en) * | 2010-06-04 | 2015-03-03 | Microsoft Corporation | Generating text manipulation programs using input-output examples |
US9613115B2 (en) | 2010-07-12 | 2017-04-04 | Microsoft Technology Licensing, Llc | Generating programs based on input-output examples using converter modules |
US10762293B2 (en) | 2010-12-22 | 2020-09-01 | Apple Inc. | Using parts-of-speech tagging and named entity recognition for spelling correction |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
KR101159493B1 (ko) * | 2011-08-31 | 2012-06-22 | 나이스신용평가정보주식회사 | 외국어 인명 추천시스템 |
WO2013127060A1 (en) * | 2012-02-28 | 2013-09-06 | Google Inc. | Techniques for transliterating input text from a first character set to a second character set |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US9552335B2 (en) | 2012-06-04 | 2017-01-24 | Microsoft Technology Licensing, Llc | Expedited techniques for generating string manipulation programs |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
WO2014004478A1 (en) * | 2012-06-26 | 2014-01-03 | Mastercard International Incorporated | Methods and systems for implementing approximate string matching within a database |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
EP4138075A1 (en) | 2013-02-07 | 2023-02-22 | Apple Inc. | Voice trigger for a digital assistant |
US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
KR101759009B1 (ko) | 2013-03-15 | 2017-07-17 | 애플 인크. | 적어도 부분적인 보이스 커맨드 시스템을 트레이닝시키는 것 |
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
WO2014200728A1 (en) | 2013-06-09 | 2014-12-18 | Apple Inc. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
CN105265005B (zh) | 2013-06-13 | 2019-09-17 | 苹果公司 | 用于由语音命令发起的紧急呼叫的系统和方法 |
JP6163266B2 (ja) | 2013-08-06 | 2017-07-12 | アップル インコーポレイテッド | リモート機器からの作動に基づくスマート応答の自動作動 |
WO2015029193A1 (ja) * | 2013-08-29 | 2015-03-05 | 株式会社野村総合研究所 | Webサーバシステム、アプリケーション開発支援システム、Webサーバシステムにおける多言語対応方法、Webサーバシステムにおけるマルチデバイス対応方法、およびアプリケーション開発支援方法 |
US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
WO2015184186A1 (en) | 2014-05-30 | 2015-12-03 | Apple Inc. | Multi-command single utterance input method |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US9606986B2 (en) | 2014-09-29 | 2017-03-28 | Apple Inc. | Integrated word N-gram and class M-gram language models |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
CN104834690B (zh) * | 2015-04-22 | 2018-04-27 | 北京金山安全软件有限公司 | 一种游戏应用的甄别方法及用户设备 |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
WO2017002199A1 (ja) * | 2015-06-30 | 2017-01-05 | 楽天株式会社 | 翻字処理装置、翻字処理方法、翻字処理プログラム、及び情報処理装置 |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179309B1 (en) | 2016-06-09 | 2018-04-23 | Apple Inc | Intelligent automated assistant in a home environment |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US11620304B2 (en) | 2016-10-20 | 2023-04-04 | Microsoft Technology Licensing, Llc | Example management for string transformation |
US11256710B2 (en) | 2016-10-20 | 2022-02-22 | Microsoft Technology Licensing, Llc | String transformation sub-program suggestion |
US10846298B2 (en) | 2016-10-28 | 2020-11-24 | Microsoft Technology Licensing, Llc | Record profiling for dataset sampling |
US11281993B2 (en) | 2016-12-05 | 2022-03-22 | Apple Inc. | Model and ensemble compression for metric learning |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
DK201770383A1 (en) | 2017-05-09 | 2018-12-14 | Apple Inc. | USER INTERFACE FOR CORRECTING RECOGNITION ERRORS |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
DK201770428A1 (en) | 2017-05-12 | 2019-02-18 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK179549B1 (en) | 2017-05-16 | 2019-02-12 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US10671353B2 (en) | 2018-01-31 | 2020-06-02 | Microsoft Technology Licensing, Llc | Programming-by-example using disjunctive programs |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20000060727A (ko) * | 1999-03-18 | 2000-10-16 | 오민희 | 다중 검색어를 갖는 전자사전 및 그 제어방법 |
KR100326936B1 (ko) | 1999-08-02 | 2002-03-13 | 이계철 | 외국어로 표기된 한글을 한글표기로 변환하여 검색하는 시스템및 그 방법 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2279164A (en) * | 1993-06-18 | 1994-12-21 | Canon Res Ct Europe Ltd | Processing a bilingual database. |
US6292768B1 (en) * | 1996-12-10 | 2001-09-18 | Kun Chun Chan | Method for converting non-phonetic characters into surrogate words for inputting into a computer |
US6460015B1 (en) * | 1998-12-15 | 2002-10-01 | International Business Machines Corporation | Method, system and computer program product for automatic character transliteration in a text string object |
JP3500097B2 (ja) | 1999-08-26 | 2004-02-23 | 日本電信電話株式会社 | 複合メディア検索方法および複合メディア検索用プログラム記録媒体 |
KR100373812B1 (ko) | 2000-05-30 | 2003-02-26 | 한상학 | 음성 자막 재생 시스템 및 방법과 자막 표시 기능을 갖는휴대용 디지털 오디오 재생기 |
US20020083029A1 (en) * | 2000-10-23 | 2002-06-27 | Chun Won Ho | Virtual domain name system using the user's preferred language for the internet |
US6950792B1 (en) * | 2000-10-25 | 2005-09-27 | Cisco Technology, Inc. | Arrangement for providing international prompts in a unified messaging system |
EP1221692A1 (en) * | 2001-01-09 | 2002-07-10 | Robert Bosch Gmbh | Method for upgrading a data stream of multimedia data |
US7107215B2 (en) * | 2001-04-16 | 2006-09-12 | Sakhr Software Company | Determining a compact model to transcribe the arabic language acoustically in a well defined basic phonetic study |
DE60142938D1 (de) | 2001-04-25 | 2010-10-07 | Sony France Sa | Verfahren und Vorrichtung zum Identifizieren des Informationstyps, z.B. zum Identifizieren des Namensinhalts einer Musikdatei |
US7191115B2 (en) * | 2001-06-20 | 2007-03-13 | Microsoft Corporation | Statistical method and apparatus for learning translation relationships among words |
US6810374B2 (en) * | 2001-07-23 | 2004-10-26 | Pilwon Kang | Korean romanization system |
BR0212419A (pt) | 2001-09-10 | 2004-08-03 | Thomson Licensing Sa | Método e aparelho para criar uma lista de execução indexada em um executor de dados de áudio digital |
FR2835642B1 (fr) * | 2002-02-07 | 2006-09-08 | Francois Teytaud | Procede et dispositif pour faire comprendre une langue |
US6864809B2 (en) * | 2002-02-28 | 2005-03-08 | Zi Technology Corporation Ltd | Korean language predictive mechanism for text entry by a user |
WO2003104963A1 (fr) * | 2002-06-05 | 2003-12-18 | Rongbin Su | Procede de saisie d'optimisation d'un code operationnel de numerisation pour des caracteres mondiaux et son systeme de traitement d'information |
US7292971B2 (en) * | 2003-10-27 | 2007-11-06 | Kuojui Su | Language phonetic system and method thereof |
US20050216253A1 (en) * | 2004-03-25 | 2005-09-29 | Microsoft Corporation | System and method for reverse transliteration using statistical alignment |
US20070011132A1 (en) * | 2005-06-17 | 2007-01-11 | Microsoft Corporation | Named entity translation |
-
2005
- 2005-08-30 KR KR1020050080172A patent/KR100739726B1/ko not_active IP Right Cessation
-
2006
- 2006-06-16 US US11/453,597 patent/US7979268B2/en not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20000060727A (ko) * | 1999-03-18 | 2000-10-16 | 오민희 | 다중 검색어를 갖는 전자사전 및 그 제어방법 |
KR100326936B1 (ko) | 1999-08-02 | 2002-03-13 | 이계철 | 외국어로 표기된 한글을 한글표기로 변환하여 검색하는 시스템및 그 방법 |
Also Published As
Publication number | Publication date |
---|---|
KR20070028664A (ko) | 2007-03-13 |
US7979268B2 (en) | 2011-07-12 |
US20070055493A1 (en) | 2007-03-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100739726B1 (ko) | 문자열 매칭 방법 및 시스템과 그 방법을 기록한 컴퓨터판독 가능한 기록매체 | |
KR101265263B1 (ko) | 발음 기호를 이용한 문자열 매칭 방법 및 시스템과 그방법을 기록한 컴퓨터 판독 가능한 기록매체 | |
JP4977589B2 (ja) | 固有表現抽出装置、固有表現抽出方法、及びプログラム | |
JP4848317B2 (ja) | データベースのインデックス作成システム、方法及びプログラム | |
JP2010541092A5 (ko) | ||
RU2004109570A (ru) | Компьютерный поиск с помощью ассоциативных связей | |
JP2013161371A (ja) | テキスト検索装置及びプログラム | |
JP2010061587A (ja) | 類似文書判定装置、類似判定方法およびそのプログラム | |
JP2010198425A (ja) | 文書管理方法、装置 | |
JP6571053B2 (ja) | 施設検索装置、施設検索方法、コンピュータプログラム及びコンピュータプログラムを記録した記録媒体 | |
JP2004287835A (ja) | オブジェクト表作成方法及びオブジェクト推薦方法及びオブジェクト表作成プログラム及びオブジェクト推薦方法 | |
JP2016018279A (ja) | 文書ファイル検索プログラム、文書ファイル検索装置、文書ファイル検索方法、文書情報出力プログラム、文書情報出力装置及び文書情報出力方法 | |
JP6881077B2 (ja) | 判別プログラム、判別装置及び判別方法 | |
JP2022002034A (ja) | 抽出方法、抽出プログラム、及び、抽出装置 | |
JP2009048351A (ja) | 情報検索装置、情報検索方法および情報検索プログラム | |
JP6753190B2 (ja) | 文書検索装置及びプログラム | |
KR20080082985A (ko) | 데이터 파일 조작 방법 및 장치 | |
JP2008090396A (ja) | 電子文書検索方法、電子文書検索装置及びプログラム | |
JP2006126883A (ja) | 情報検索装置及び情報検索方法 | |
JP2005043654A (ja) | 楽曲情報配信システム | |
JP6577925B2 (ja) | 施設検索装置、施設検索方法、コンピュータプログラム及びコンピュータプログラムを記録した記録媒体 | |
JP4248828B2 (ja) | 文書処理装置、文書処理方法及び記録媒体 | |
WO2007011140A1 (en) | Method of extracting topics and issues and method and apparatus for providing search results based on topics and issues | |
JP4061283B2 (ja) | 字句をデータに変換する装置、方法及びプログラム | |
JP2005234635A (ja) | 文書要約装置および方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130627 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20140627 Year of fee payment: 8 |
|
LAPS | Lapse due to unpaid annual fee |