KR100739726B1 - 문자열 매칭 방법 및 시스템과 그 방법을 기록한 컴퓨터판독 가능한 기록매체 - Google Patents

문자열 매칭 방법 및 시스템과 그 방법을 기록한 컴퓨터판독 가능한 기록매체 Download PDF

Info

Publication number
KR100739726B1
KR100739726B1 KR1020050080172A KR20050080172A KR100739726B1 KR 100739726 B1 KR100739726 B1 KR 100739726B1 KR 1020050080172 A KR1020050080172 A KR 1020050080172A KR 20050080172 A KR20050080172 A KR 20050080172A KR 100739726 B1 KR100739726 B1 KR 100739726B1
Authority
KR
South Korea
Prior art keywords
string
representative
language
input
list
Prior art date
Application number
KR1020050080172A
Other languages
English (en)
Other versions
KR20070028664A (ko
Inventor
이경은
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020050080172A priority Critical patent/KR100739726B1/ko
Priority to US11/453,597 priority patent/US7979268B2/en
Publication of KR20070028664A publication Critical patent/KR20070028664A/ko
Application granted granted Critical
Publication of KR100739726B1 publication Critical patent/KR100739726B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Abstract

본 발명은 다양한 방법으로 표기된 동일 의미의 문자열들에 대해서 대표하는 대표 문자열을 검색하는 문자열 매칭 방법 및 시스템과 그 방법을 기록한 컴퓨터 판독 가능한 기록매체에 관한 것으로, 제1언어와 제2언어 간의 매핑 정보가 저장된 언어 매핑 테이블을 참조하여 입력 문자열을 하나 이상의 제2언어 문자열로 변환하여 변환 리스트를 생성하는 제2언어 문자열 생성단계; 대표 문자열과 그에 대응하는 제2언어 대표 문자열이 저장되는 대표 리스트 데이터베이스에서 변환 리스트의 문자열과 동일한 제2언어 대표 문자열을 가진 레코드를 찾아 후보 리스트를 생성하는 대표 리스트 검색단계; 및 후보 리스트의 레코드 중 하나에 포함된 대표 문자열을 출력 문자열로 결정하는 대표 문자열 결정단계를 포함하는 것을 특징으로 하여, 문자열에 의한 분류 시나리오에 유용하게 이용될 수 있다.
문자열 매칭, ID3 태그, MP3, WMA, 초성, 중성, 종성

Description

문자열 매칭 방법 및 시스템과 그 방법을 기록한 컴퓨터 판독 가능한 기록매체{Method and system for name matching and computer readable medium recording the method}
도 1은 본 발명의 일실시예에 따른 문자열 매칭 시스템의 구성도,
도 2는 본 발명의 다른 실시예에 따른 문자열 매칭 시스템의 구성도,
도 3은 본 발명에 따른 문자열 매칭 방법의 매커니즘 흐름도,
도 4는 본 발명에 따른 제2언어 문자열 생성단계의 매커니즘 흐름도,
도 5는 본 발명에 따른 대표 문자열 결정단계에서 사용자가 대표 문자열을 결정하는 경우의 매커니즘 흐름도,
도 6은 본 발명에 따른 대표 문자열 결정단계에서 매칭 점수를 이용하여 대표 문자열을 결정하는 경우의 매커니즘 흐름도,
도 7a 및 도 7b는 본 발명에서 제1언어가 한글이고 제2언어가 영어일 경우에 대한 초/중성과 종성 매핑 테이블의 예 ,
도 8은 본 발명에 따른 이전결과 데이터베이스의 예,
도 9는 본 발명에 따른 대표 리스트 데이터베이스의 예,
도 10은 MP3(MPEG Audio Layer-3) 파일의 구조.
본 발명은 문자열의 매칭에 관한 것으로, 더욱 상세하게는 동일한 의미를 가진 것으로 간주되는 문자열들을 분류하기 위한 방법 및 시스템과 그 방법을 기록한 컴퓨터 판독 가능한 기록매체에 관한 것이다.
MP3(MPEG Audio Layer-3) 등의 멀티미디어 파일의 메타 정보를 이용한 응용 서비스에 있어서, 메타 정보에 포함된 아티스트명이나 장르 등의 정보를 기준으로 멀티미디어 데이터를 분류하여 사용자에게 보여주는 기능이 필요한 경우가 많다.
이러한 메타 정보는, 외국어로 입력된 경우 다양한 외국어 표기가 가능하고, 공백(' ')이나 하이픈('-') 등의 특수 문자가 섞여 있는 경우도 많고, 일반 사용자가 입력하는 경우도 많기 때문에, 같은 의미를 가진 문자열이라도 일관성 없이 입력되어 있어 다른 문자열로 해석되고 분류되는 문제가 있다.
예컨대, MP3 플레이어에서 아티스트별로 음악을 분류하는 응용 프로그램에 있어서, 종래의 방법에 의하면 '이미자', '이 미자', 'Lee Mi-Za', 'Lee Mi Ja', 'Lee Miza' 등으로 입력되어 있는 아티스트가 동일인임에도 불구하고 각기 다른 가수로 분류되어 사용자에게 불편을 초래하고 응용 서비스의 개발에 제약이 따르는 형편이다.
본 발명은 상기와 같은 문제를 해결하여, 다양한 방법으로 표기된 동일 의미의 문자열을 대표하는 대표 문자열을 검색하는 문자열 매칭 방법 및 시스템과 그 방법을 기록한 컴퓨터 판독 가능한 기록매체를 제공하는 것을 목적으로 한다.
상기 목적의 달성을 위해 본 발명은, 언어 간 매핑 정보를 이용하여 문자열을 외국어로 변환하고 변환된 문자열에 의한 검색을 통해 대표 문자열을 결정하는 문자열 매칭 방법 및 시스템과 그 방법을 기록한 컴퓨터 판독 가능한 기록매체를 제공한다.
본 발명의 특징은, 입력 문자열에 매칭되는 대표 문자열을 출력하는 문자열 매칭 방법에 있어서, 제1언어와 제2언어 간의 매핑 정보가 저장된 언어 매핑 테이블을 참조하여 상기 입력 문자열을 하나 이상의 제2언어 문자열로 변환하여 변환 리스트를 생성하는 제2언어 문자열 생성단계; 대표 문자열과 그에 대응하는 제2언어 대표 문자열이 저장되는 대표 리스트 데이터베이스에서 상기 변환 리스트의 문자열과 동일한 제2언어 대표 문자열을 가진 레코드를 찾아 후보 리스트를 생성하는 대표 리스트 검색단계; 및 상기 후보 리스트의 레코드 중 하나에 포함된 대표 문자열을 출력 문자열로 결정하는 대표 문자열 결정단계를 포함하는 것이다.
바람직하게는 상기 문자열 매칭 방법에서, 문자열과 그에 대응하는 대표 문자열이 포함된 매칭 결과가 저장되는 이전 결과 데이터베이스를 검색하여 상기 입력 문자열과 동일한 문자열이 존재하면, 그에 대응하는 대표 문자열을 출력 문자열로 결정하는 이전 결과 검색단계; 및 상기 입력 문자열과 상기 출력 문자열이 상기 이전 결과 데이터베이스에 존재하지 않는 경우 상기 이전 결과 데이터베이스에 저장하는 결과 저장단계를 더 포함한다.
바람직하게는 상기 문자열 매칭 방법에서, 상기 제2언어 문자열 생성단계는, 상기 변환 전에 상기 입력 문자열에 포함된 유효하지 않은 소정의 특수문자를 제거하는 특수문자 처리 단계를 더 포함한다.
바람직하게는 상기 문자열 매칭 방법에서, 상기 특수문자가 '-'과 ' '을 포함한다.
바람직하게는 상기 문자열 매칭 방법에서, 상기 제1언어는 한글이고 상기 제2언어는 영어인 경우, 상기 언어 매핑 테이블이, 한글의 초성과 중성을 조합한 글자를 하나 이상의 영어 문자열로 매핑하는 정보와, 한글의 종성을 하나 이상의 영어 문자열로 매핑하는 정보를 포함하고; 상기 제2언어 문자열 생성단계는, 상기 입력 문자열이 영어인 경우 상기 입력 문자열을 소문자로 변환한 문자열을 상기 변환 리스트에 포함시키는 단계를 더 포함한다.
바람직하게는 상기 문자열 매칭 방법에서, 상기 매핑 정보에 항목별 우선순위 점수를 부여하는 단계를 더 포함하고; 상기 제2언어 문자열 생성단계는, 상기 우선순위 점수를 이용하여 상기 변환 리스트에 포함된 각 문자열에 대한 매칭 점수를 계산하여 부여하고, 상기 매칭 점수가 높은 지정된 개수의 문자열만을 상기 변환 리스트에 포함시키는 단계를 더 포함한다.
바람직하게는 상기 문자열 매칭 방법에서, 상기 매핑 정보에 항목별 우선순위 점수를 부여하는 단계를 더 포함하고; 상기 제2언어 문자열 생성단계에서, 상기 우선순위 점수를 이용하여 상기 변환 리스트에 포함된 각 문자열에 대한 매칭 점수를 계산하여 부여하고, 상기 매칭 점수가 지정된 점수 이상인 문자열만을 상기 변 환 리스트에 포함시키는 단계를 더 포함한다.
바람직하게는 상기 문자열 매칭 방법에서, 상기 대표 문자열 결정단계는, 상기 후보 리스트에서 사용자가 선택한 레코드의 대표 문자열을 출력 문자열로 결정하는 단계를 포함한다.
바람직하게는 상기 문자열 매칭 방법에서, 상기 대표 문자열 결정단계는, 상기 사용자가 상기 후보 리스트의 레코드 중 어느 것도 선택하지 않은 경우 상기 입력 문자열을 상기 출력 문자열로 결정하는 단계를 더 포함하고; 상기 결과 저장단계는, 상기 입력 문자열과 상기 후보 리스트의 영어 대표 문자열 중 상기 매칭 점수가 최고인 문자열을 상기 대표 리스트 데이터베이스에 저장하는 단계를 더 포함한다.
바람직하게는 상기 문자열 매칭 방법에서, 상기 사용자에 의해 선택된 상기 후보 리스트 레코드의 대표 문자열을 제2언어 대표 문자열로 변환하는데 사용된 매핑 정보 항목들에 대해서는 지정된 가산점을 부여한 새로운 우선순위 점수를 부여하는 우선순위 변경단계를 더 포함한다.
바람직하게는 상기 문자열 매칭 방법에서, 상기 대표 문자열 결정단계는, 상기 후보 리스트에 포함된 영어 대표 문자열 중 상기 매칭 점수가 최고인 문자열에 대응하는 대표 문자열을 출력 문자열로 결정하는 단계를 포함한다.
바람직하게는 상기 문자열 매칭 방법에서, 상기 대표 문자열 결정단계는, 상기 후보 리스트에 포함된 영어 대표 문자열 중 지정된 기준 점수 이상인 문자열이 없는 경우 상기 입력 문자열을 상기 출력 문자열로 결정하는 단계를 더 포함하고; 상기 결과 저장단계는, 상기 입력 문자열과 상기 후보 리스트의 영어 대표 문자열 중 최고 매칭 점수를 가진 문자열을 대표 리스트 데이터베이스에 저장하는 단계를 더 포함한다.
바람직하게는 상기 문자열 매칭 방법에서, 입력 문자열이 포함된 멀티미디어 정보를 입력받고 상기 멀티미디어 정보에 포함된 상기 입력 문자열을 추출하는 입력 문자열 추출단계를 더 포함한다.
바람직하게는 상기 문자열 매칭 방법에서, 상기 멀티미디어 정보는 MP3 파일이고, 상기 입력 문자열 추출단계는, 상기 MP3 파일을 파싱하여 ID3 태그에 포함된 아티스트명을 추출하는 단계를 포함한다.
바람직하게는 상기 문자열 매칭 방법에서, 상기 대표 문자열 결정단계는, 상기 멀티미디어 정보의 입력 문자열을 상기 출력 문자열로 수정하는 단계를 더 포함한다.
본 발명의 다른 특징은, 상기 문자열 매칭 방법을 수행하는 프로그램을 기록한 컴퓨터 판독 가능한 기록매체를 제공하는 것이다.
본 발명의 또 다른 특징은, 입력 문자열에 매칭되는 대표 문자열을 출력하는 문자열 매칭 시스템에 있어서, 대표 문자열과 그에 대응하는 제2언어 대표 문자열이 저장되는 대표 리스트 데이터베이스; 제1언어와 제2언어 간의 매핑 정보가 저장되는 언어 매핑 테이블; 상기 언어 매핑 테이블을 이용하여 상기 입력 문자열을 하나 이상의 제2언어 문자열로 변환하여 변환 리스트를 생성하는 제2언어 문자열 생성수단; 상기 대표 리스트 데이터베이스를 검색하여 상기 변환 리스트의 문자열과 동일한 제2언어 대표 문자열을 가진 레코드로 구성된 후보 리스트를 생성하는 대표 리스트 검색수단; 및 상기 후보 리스트의 레코드 중 하나에 포함된 대표 문자열을 출력 문자열로 결정하는 대표 문자열 결정수단을 포함하는 것이다.
바람직하게는 상기 문자열 매칭 시스템에서, 문자열과 그에 대응하는 대표 문자열이 포함된 문자열 매칭 결과가 저장되는 이전 결과 데이터베이스; 상기 이전 결과 데이터베이스를 검색하여 상기 입력 문자열과 동일한 문자열이 존재하면, 그에 대응하는 대표 문자열을 출력 문자열로 결정하는 이전 결과 검색수단; 및 상기 입력 문자열과 상기 출력 문자열이 상기 이전 결과 데이터베이스에 존재하지 않는 경우, 상기 이전 결과 데이터베이스에 저장하는 결과 저장수단을 더 포함한다.
바람직하게는 상기 문자열 매칭 시스템에서, 상기 제2언어 문자열 생성수단은, 상기 입력 문자열에 포함된 소정의 특수문자를 제거한 후 제2언어 문자열로 변환한다.
바람직하게는 상기 문자열 매칭 시스템에서, 상기 제1언어는 한글이고 상기 제2언어는 영어인 경우, 상기 언어 매핑 테이블은, 한글의 초성과 중성을 조합한 글자를 하나 이상의 영어 문자열로 매핑하는 정보와, 한글의 종성을 하나 이상의 영어 문자열로 매핑하는 정보를 포함하고; 상기 제2언어 문자열 생성수단은, 상기 입력 문자열이 영어인 경우 상기 입력 문자열을 소문자로 변환한 문자열을 상기 변환 리스트에 포함시킨다.
바람직하게는 상기 문자열 매칭 시스템에서, 상기 매핑 정보에는 항목별 우선순위 점수가 부여되어 있고, 상기 제2언어 문자열 생성수단은, 상기 우선순위 점 수를 이용하여 상기 변환 리스트에 포함된 각 문자열에 대한 매칭 점수를 계산하여 부여하고, 상기 매칭 점수가 높은 지정된 개수의 문자열만을 상기 변환 리스트에 포함시킨다.
바람직하게는 상기 문자열 매칭 시스템에서, 상기 대표 문자열 결정수단은, 상기 후보 리스트에서 사용자가 선택한 레코드의 대표 문자열을 출력 문자열로 결정하고, 상기 사용자가 상기 후보 리스트의 레코드 중 어느 것도 선택하지 않은 경우 상기 입력 문자열을 상기 출력 문자열로 결정하고; 상기 결과 저장수단은, 상기 입력 문자열이 상기 출력 문자열로 결정되는 경우, 상기 입력 문자열과 상기 후보 리스트의 영어 대표 문자열 중 매칭 점수가 최고인 문자열을 상기 대표 리스트 데이터베이스에 저장한다.
바람직하게는 상기 문자열 매칭 시스템에서, 상기 사용자의 선택에 의해 상기 출력 문자열이 결정되는 경우, 상기 선택된 후보 리스트 레코드의 대표 문자열을 제2언어 대표 문자열로 변환하는데 사용된 매핑 정보 항목들에 대해서는 지정된 가산점을 부여한 새로운 우선순위 점수를 부여하는 우선순위 변경수단을 더 포함한다.
바람직하게는 상기 문자열 매칭 시스템에서, 상기 매핑 정보에 항목별 우선순위 점수가 부여되어 있고, 상기 제2언어 문자열 생성수단은, 상기 우선순위 점수를 이용하여 상기 변환 리스트에 포함된 각 문자열에 대한 매칭 점수를 계산하여 부여하고; 상기 대표 문자열 결정수단은, 상기 후보 리스트에 포함된 영어 대표 문자열 중 상기 매칭 점수가 최고인 문자열에 대응하는 대표 문자열을 출력 문자열로 결정한다.
바람직하게는 상기 문자열 매칭 시스템에서, 상기 대표 문자열 결정수단은, 상기 후보 리스트에 포함된 영어 대표 문자열 중 지정된 점수 이상인 문자열이 없는 경우 상기 입력 문자열을 상기 출력 문자열로 결정하고; 상기 결과 저장수단은, 상기 입력 문자열을 상기 출력 문자열로 결정하는 경우, 상기 입력 문자열과 상기 후보 리스트의 영어 대표 문자열 중 최고 매칭 점수를 가진 문자열을 대표 리스트 데이터베이스에 저장한다.
바람직하게는 상기 문자열 매칭 시스템에서, 상기 입력 문자열이 포함된 멀티미디어 정보를 입력받고 상기 멀티미디어 정보에 포함된 상기 입력 문자열을 추출하는 입력 문자열 추출수단을 더 포함한다.
바람직하게는 상기 문자열 매칭 시스템에서, 상기 대표 문자열 결정수단은, 상기 멀티미디어 정보의 입력 문자열을 상기 출력 문자열로 수정한다.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 설명한다.
도 1은 본 발명의 일실시예에 따른 문자열 매칭 시스템의 구성도로서, 대표 문자열에 대한 정보가 저장되는 대표 리스트 데이터베이스(DB)(130), 언어 간의 매핑 정보가 저장되는 언어 매핑 테이블이 포함된 언어 매핑 데이터베이스(120), 입력 문자열을 하나 이상의 제2언어 문자열로 변환한 변환 리스트를 생성하는 제2언어 문자열 생성 수단(101), 변환 리스트로부터 대표 문자열의 후보 리스트를 생성하는 대표 리스트 검색수단(102), 후보 리스트에서 하나의 대표 문자열을 선택하는 대표 문자열 결정수단(103)을 포함한다.
대표 리스트 데이터베이스(130)는 매칭이 완료된 대표 문자열과 그에 대응하는 제2언어 표기인 제2언어 대표 문자열의 리스트가 저장되어 있다. 도 9는 아티스트명과 관련된 응용에서의 대표 리스트 데이터베이스(130) 구성 예로서, 아티스트들의 대표적인 이름 표기(대표 문자열, 901)와 그에 대한 영어 표기(영어 대표 문자열, 902)가 저장되어 있음을 알 수 있다.
언어 매핑 테이블은 제1언어와 제2언어 간의 매핑 정보가 저장되는 것으로, 예컨대 한글의 자소와 그에 매핑되는 영어 문자열이 저장되어 있으며, 하나의 한글 자소에 다수의 영어 문자열이 매핑될 수 있다.
제2언어 문자열 생성수단(101)은 언어 간 매핑 정보인 언어 매핑 테이블을 이용하여 입력된 문자열을 가능한 모든 제2언어 문자열로 변환한 리스트를 생성한다. 대표 리스트 검색수단(102)은 변환 리스트의 외국어 표기들이 대표 리스트 데이터베이스(130)에 있는지 검색하여 일치하는 제2언어 대표 문자열을 가진 레코드를 찾아 후보 리스트에 포함시킨다. 대표 문자열 결정수단(103)은 후보 리스트의 레코드 중 하나에 포함된 대표 문자열을 선택하여 출력 문자열로 결정한다.
도 2는 본 발명의 다른 실시예에 따른 문자열 매칭 시스템의 구성도로서, 대표 리스트 데이터베이스(130), 언어 매핑 테이블이 저장된 데이터베이스(120), 제2언어 문자열 생성수단(101), 대표 리스트 검색수단(102), 대표 문자열 결정수단(103), 문자열과 그에 대응하는 대표 문자열이 포함된 문자열 매칭 결과가 저장되는 이전 결과 데이터베이스(140), 이전에 입력 문자열과 동일한 문자열에 대해 매칭한 적이 있는지 검색하는 이전 결과 검색수단(104), 매칭 결과를 저장하는 결과 저장수단(106), 우선순위를 점수를 변경하는 우선순위 변경수단(105)을 포함한다.
도 8은 본 발명에 따른 이전 결과 데이터베이스(140)의 예로서, 사용자가 입력할 수 있는 다양한 표기의 문자열(801)과 그에 대응하는 대표 문자열(802)을 저장하고 있다. 이는 시스템 운영중 결과 저장수단(106)에 의해 축적된 문자열 매칭 결과에 대한 정보이다. 입력 문자열이 이전 결과 데이터베이스(140)에 존재한다면 더 이상 매칭 작업을 수행할 필요가 없다. 이전 결과 검색수단(104)은 먼저 이전 결과 데이터베이스(140)를 검색하여 입력 문자열과 동일한 문자열이 존재하면, 그에 대응하는 대표 문자열을 출력 문자열로 결정하므로 효율적이다. 예컨대, 입력 문자열이 '룰 라'라면, (룰 라, 룰라)(811)라는 레코드가 데이터베이스(140)에 존재하므로, 이전에도 동일 문자열에 대해 매칭 작업을 수행한 적이 있음을 알 수 있으며, 대표 문자열로 '룰라'가 출력된다.
반면, 이전 결과 데이터베이스(140)에 존재하지 않는 문자열이 입력되어 그에 매칭되는 대표 문자열이 결정되었다면, 결과 저장수단(106)은 입력 문자열과 출력된 대표 문자열을 데이터베이스(140)에 저장하고, 추후 동일한 문자열이 입력된 경우는 이 정보를 참조한다.
제2언어 문자열 생성수단(101)은, 입력 문자열에 포함된 소정의 특수문자를 제거한 후 제2언어 문자열로 변환함으로써, 특수문자가 포함된 문자열의 경우도 매칭이 가능하도록 한다. 가수 이름이나 그룹 이름 등은 의미 있는 특수문자를 포함할 가능성이 있기 때문에, '-'(하이픈)과 ' '(공백)에 대해서만 삭제 처리하는 것이 바람직하다. 예컨대, 입력 문자열 '이 미 자', 'Lee Mi-Ja'는 각각 '이미자', 'LeeMiJa'로 수정된다. 실시예에 따라 적절한 특수문자에 대해 삭제 등의 처리가 필요할 것이다.
제1언어가 한글이고 제2언어가 영어인 예에서, 언어 매핑 테이블은, 한글의 초성과 중성을 조합한 글자를 하나 이상의 영어 문자열로 매핑하는 정보와, 한글의 종성을 하나 이상의 영어 문자열로 매핑하는 정보를 포함하는 것이 바람직하며, 입력 문자열이 영어인 경우는 매핑 정보를 참조할 필요 없이 소문자로 변환하여 변환 리스트에 포함시키면 된다. 영어로 매핑할 때, 한글의 초성과 중성을 따로 매핑할 경우는 한글 이름 등의 한글 문자열에 대해 실제로 사용되지 않는 영어 문자열들까지 생성될 수 있으며, 경우의 수가 커지므로 시스템이 복잡해져 효율이 저하될 수 있다. 또한, 한글의 종성까지 초성 및 중성과 함께 조합하여 영어로 매핑하면 매핑 테이블의 경우의 수가 너무 커진다. 따라서, 한글의 초성과 중성을 하나로 합해 영어로 매핑하고 종성을 따로 매핑하는 것이 효율적이다. 도 7a 및 도 7b가 그 예로서, 각각 초/중성 매핑 테이블과 종성 매핑 테이블이다.
매핑 정보에는 항목별 우선순위 점수가 부여될 수 있으며, 제2언어 문자열 생성수단(101)은, 우선순위 점수를 이용하여 변환 리스트에 포함된 각 문자열에 대한 매칭 점수를 계산하여 부여하고, 매칭 점수가 높은 지정된 개수의 문자열만을 변환 리스트에 포함시켜 출력할 수 있다.
생성된 변환 리스트는 대표 리스트 검색수단(102)에 입력되며, 대표 리스트 검색수단(102)은 대표 리스트 데이터베이스(130)를 검색하여 변환 리스트 문자열과 동일한 제2언어 대표 문자열이 포함된 레코드들을 찾아 후보 리스트를 생성한다.
대표 문자열 결정수단(103)은, 후보 리스트를 사용자에게 보여주고 사용자가 선택한 레코드의 대표 문자열을 출력 문자열로 결정할 수 있다. 만일, 사용자가 후보 리스트의 레코드 중 어느 것도 선택하지 않은 경우는, 입력 문자열을 출력 문자열로 결정한다. 이 경우, 결과 저장수단(106)은 입력 문자열을 대표 리스트 데이터베이스(130)에 저장하여 추후 매칭 작업에 이용될 수 있도록 한다. 이때, 후보 리스트의 영어 대표 문자열 중 매칭 점수가 최고인 문자열이 함께 저장되는 것이 바람직하다.
한편, 대표 문자열 결정수단(103)은, 사용자에게 질의하지 않고, 후보 리스트에 포함된 영어 대표 문자열 중 매칭 점수가 최고인 문자열에 대응하는 대표 문자열을 출력 문자열로 결정할 수 있다. 또한, 후보 리스트에 포함된 영어 대표 문자열 중 지정된 매칭 점수 이상인 문자열이 없는 경우는 입력 문자열을 출력 문자열로 결정할 수 있다. 이 경우 결과 저장수단(106)에 의해, 입력 문자열과 후보 리스트의 영어 대표 문자열 중 최고 매칭 점수를 가진 문자열이 대표 리스트 데이터베이스(130)에 저장될 것이다.
우선순위 변경수단(105)은 언어 매핑 테이블의 매핑 정보 항목에 부여된 우선순위 점수를 변경한다. 예컨대, 사용자에 의해 출력 문자열이 결정되는 경우, 선택된 후보 리스트 레코드의 대표 문자열을 제2언어 대표 문자열로 변환하는데 사용된 매핑 정보 항목들에 대해서는 지정된 가산점을 부여한 새로운 우선순위 점수를 부여할 수 있다. 이렇게 문자열 매칭 결과에 따라 적응적으로 우선순위 점수를 변경하여 매핑 정보의 우선순위 점수를 최적화할 수 있다.
한편, 입력 문자열이 포함된 멀티미디어 정보를 입력받고 멀티미디어 정보에 포함된 입력 문자열을 추출하는 입력 문자열 추출수단(도시되지 않음)이 포함될 수 있다. 또한, 대표 문자열 결정수단(103)은 멀티미디어 정보의 입력 문자열을 결정된 대표 문자열로 수정할 수 있다.
도 3은 본 발명에 따른 문자열 매칭 방법의 메커니즘 흐름도이다. 이하에서는 대표로 제1언어가 한글이고 제2언어가 영어인 경우에 대해서 설명한다. 그러나, 제1언어와 제2언어는 다른 어떤 언어에 대해서도 적용 가능하다.
먼저, 문자열을 입력 받는다(S301). MP3(MPEG Audio Layer-3) 파일의 아티스트명을 대상으로 하는 응용의 경우, 이 파일을 파싱함으로써 ID3 태그에 포함된 아티스트명을 추출하여 입력 문자열로 할 수 있다. 도 10은 MP3 파일 구조를 도시한 것이다. 이 파일은 오디오 데이터(1010)와 태그(1020)로 구성되며, 태그(1020) 정보에서 아티스트명(1021)을 파싱하여 추출할 수 있다.
문자열이 입력되면(S301), 문자열에 포함된 특수문자를 처리한다(S302). 특수문자의 처리는 소정의 특수문자를 제거하는 과정이 될 수 있으며, 제거되는 특수문자는 '-'와 ' ' 등이다. 그리고, 이전 결과 데이터베이스(140)를 검색하여(S303) 이전 결과가 존재하면, 즉 과거의 매칭 결과가 존재하면(S304), 그에 대응하는 대표 문자열을 출력 문자열로 결정하여 출력하고 종료한다(S305).
입력 문자열이 한글이면(S306), 언어 매핑 테이블의 매핑 정보를 참조하여 변환 리스트를 생성한다(S308). 이때, 한글의 초성과 중성을 조합한 글자를 하나 이상의 영어 문자열로 매핑하는 정보와, 한글의 종성을 하나 이상의 영어 문자열로 매핑하는 정보를 포함하는 언어 매핑 테이블을 이용하여 입력 문자열을 하나 이상의 영어 문자열로 변환하고 변환 리스트를 생성하는 것이 바람직하다. 입력 문자열이 영어이면(S306), 영어로 매핑할 필요 없이 소문자로 변환하여 변환 리스트로 한다(S307).
다음으로, 변환 리스트의 문자열이 대표 리스트 데이터베이스(130)의 대표 리스트 정보에 존재하는지 검색하여 후보 리스트를 생성한다(S309). 후보 리스트는 변환 리스트와 일치하는 영어 대표 문자열과 한글로 된 대표 문자열이 포함된 레코드 리스트이다.
후보 리스트가 생성되면, 리스트의 대표 문자열 중 하나를 대표 문자열로 결정하고 출력한다(S310). 대표 문자열의 출력은 멀티미디어 정보에 기록된 입력 문자열을 출력 문자열로 직접 수정함으로써 수행될 수도 있다. 예컨대, ID3 태그(1020)의 아티스트명(1021)을 대표 문자열로 직접 수정하도록 구현할 수 있다.
이전 결과가 존재하지 않는 경우, 즉 출력 문자열이 이전 결과 데이터베이스(140)에서 선택되지 않은 경우는, 입력 문자열에 매칭되는 대표 문자열로 결정된 출력 문자열을 입력 문자열과 함께 이전 결과 데이터베이스(140)에 저장한다(S311). 또한, 입력 문자열이 대표 문자열로 결정되어 출력되는 경우, 즉 대표 리스트 데이터베이스(130)에 존재하지 않는 대표 문자열이 선택된 경우는 입력 문자열을 대표 문자열로 하여 데이터베이스(130)에 저장한다(S311). 이때, 후보 리스트의 영어 대표 문자열 중 매칭 점수가 최고인 문자열을 영어 대표 문자열로 하여 함께 저장할 수 있다.
사용자에 의해 출력 문자열이 선택된 경우는 이 출력 문자열의 영어 표기에 해당하는 매핑 정보 항목들에 대해서 우선순위 점수를 변경하여 다음 매칭에 적용되도록 할 수 있다(S312).
도 4는 본 발명에 따른 제2언어 문자열 생성단계의 매커니즘 흐름도이다. 먼저 입력 문자열을 분해한다(S308-1). 문자열의 각 글자를 초성과 중성, 종성 두 부분으로 분해하고, 언어 매핑 테이블을 참조하여 분해된 각 자소에 영어 문자 또는 문자열을 할당하여 하나 이상의 영어 문자열을 생성한다(S802-2).
도 7a 및 도 7b는 본 발명에 따른 언어 매핑 테이블에 포함되는 초/중성 매핑 테이블 및 종성 매핑 테이블의 예로서, 하나의 한글 자소당 3개의 매핑 정보 항목이 도시되어 있으나, 이는 실시예에 따라 다양한 개수로 구현될 수 있다. 도 7a를 참조하면, 초/중성 매핑 테이블은 한글 표기가 가능한 초성과 중성의 모든 조합과 그에 대응하는 하나 이상의 영어 표기(701, 702, 703)를 포함한 매핑 정보를 저장하고 있다. 또한, 도 7b를 참조하면, 종성 매핑 테이블은 종성에 올 수 있는 한글 자소와 그에 대응하는 하나 이상의 영어 표기(701, 702, 703)를 포함한 매핑 정보를 저장하고 있다. 도 7a를 참조하면, 초성과 중성을 조합한 '거'에 'gou', 'geo'라는 매핑 정보가 기록되어 있으며(711), '희'에 'hee', 'hui', 'heui'라는 매핑 정보가 기록되어 있다(712). 도 7b를 참조하면, 종성인 'ㄴ'에 'n'이 매핑된다(721). 따라서, 입력 문자열이 '건희'라면, 이 문자열은 '거', 'ㄴ', '희'로 분해되고, 변환 리스트는 'gounhee', 'gounhui', 'gounheui', 'geonhee', 'geonhui', 'geonheui'이다.
도 7a 및 도 7b에 도시된 예에서는 한글 한자당 최대 9개의 조합이 가능하며, 효율적인 검색을 위해 이들 조합 중 정해진 개수(n)만 포함된 변환 리스트를 생성할 필요가 있을 수 있다. 이러한 경우 언어 매핑 테이블의 매핑 정보에 항목별 우선순위 점수를 부여하고, 이 우선순위 점수를 이용하여 변환 리스트에 포함된 각 문자열에 대한 매칭 점수를 계산하고(S308-3), 매칭 점수가 높은 n개의 문자열만을 변환 리스트에 포함한다(S308-4). 우선순위 점수는 매핑 테이블의 각 열에 부여되거나, 매핑 테이블의 각 매핑 정보 항목마다 부여될 수 있다. 예컨대, 초/중성 매핑 테이블 및 종성 매핑 테이블의 열 '1st 영어'(701)에 10점, '2nd 영어'(702)에 7점, '3rd 영어'(703)에 4점을 부여하였다면, 다음과 같이 매칭 점수가 계산될 수 있다(S308-3).
'gounhee' = 30점('gou'의 10점 + 'n'의 10점 + 'hee'의 10점)
'gounhui' = 27점('gou'의 10점 + 'n'의 10점 + 'hui'의 7점)
'gounheui' = 24점('gou'의 10점 + 'n'의 10점 + 'heui'의 4점)
'geonhee' = 27점('geo'의 7점 + 'n'의 10점 + 'hee'의 10점)
'geonhui' = 24점('geo'의 7점 + 'n'의 10점 + 'hui'의 7점)
'geonheui' = 21점('geo'의 7점 + 'n'의 10점 + 'heui'의 4점)
또, n이 3인 경우, 'gounhee', 'gounhui', 'geonhee' 만이 변환 리스트에 포함될 것이다(S308-4). 한편, 실시예에 따라서는 매칭 점수가 지정된 점수 이상인 문자열만 변환 리스트에 포함시킬 수도 있다.
도 5는 본 발명에 따른 대표 문자열 결정단계에서 사용자가 대표 문자열을 결정하는 경우의 매커니즘 흐름도이다. 먼저, 전 단계(S309)에서 생성된 후보 리스트가 입력된다(S310-0). 예컨대 '루라'라는 입력 문자열에 대해 대표 리스트 데이터베이스(130)의 검색을 통해 (룰라, roola)(911), (루우라, roora)(912)라는 후보 리스트가 생성되어 입력될 수 있다.
사용자가 후보 리스트의 레코드 중 하나를 선택하면(S310-1), 선택된 레코드의 문자열이 출력 문자열로 결정된다(310-2). 사용자가 (룰라, roola)(911)를 선택하였다면 (루라, 룰라)가 이전 결과 데이터베이스(130)에 저장되고, 다음 매칭에서 '루라'가 입력되면 이 정보가 참조된다.
사용자가 후보 리스트 전부를 거부하고 입력 문자열을 사용하기를 원하는 경우는(S310-1) 입력 문자열이 출력 문자열로 결정되며(S310-3), 입력 문자열이 대표 리스트 데이터베이스(130)에 저장된다(S311-1). 또한, 매칭 결과인 입력 문자열과 출력 문자열은 이전 결과 데이터베이스(140)에 저장되어 다음 문자열 매칭시 우선적으로 참조 된다(S311-2). 이처럼 사용자에 의해 출력 문자열이 선택된 경우는 출력 문자열에 대응하는 영어 매핑 정보 항목의 우선순위 점수를 변경한다(S312). 즉, 소정의 가산점을 더하여 사용자의 의사가 매핑 정보에 반영되도록 하는 것이다.
도 6은 본 발명에 따른 대표 문자열 결정단계에서 매칭 점수를 이용하여 대표 문자열을 결정하는 경우의 매커니즘 흐름도이다. 사용자의 선택 입력이 번거롭거나 불필요한 서비스인 경우는, 입력되는 후보 리스트(S310-0)에 포함된 영어 대표 문자열 중 매칭 점수가 최고인 문자열에 대응하는 대표 문자열이 출력 문자열로 선택될 수 있다(S310-10). 이때, 후보 리스트에 포함된 영어 대표 문자열 중 지정된 기준 점수 이상인 문자열이 없는 경우는(S310-11), 입력 문자열을 대표 문자열로 결정하여 출력하고(S310-3) 대표 리스트 데이터베이스(130)에 저장하도록 하여(S311-1), 매칭 결과에 대한 신뢰도를 향상시킬 수 있다. 한편, 최고 점수를 가진 문자열에 대해 사용자의 허락을 받아(S310-12) 사용자가 컨펌한 경우만 대표 문자열로 결정할 수 있다(S310-13). 마찬가지로 매칭 결과를 이전 결과 데이터베이스(140)에 저장한다(S311-2).
본 발명은 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다.
이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
이상에서 설명한 바와 같은 본 발명의 구성에 의하면, 다른 표기로 기록된 동일 의미의 문자열에 대한 대표 문자열을 찾을 수 있으므로, 문자열에 의해 분류를 제공하는 서비스에 유용하다. 예컨대, MP3 플레이어에서 아티스트명에 의한 분 류 시나리오를 제공하는 경우, '이 미 자', '이 미자', '이미자', 'Lee Mi-Za', 'Lee Mi Ja', 'Lee miza' 등으로 아티스트명이 입력되어 있는 경우에도 하나의 대표 이름인 '이미자'로 매칭되어, 해당 음악 파일들이 한 아티스트의 것으로 정확히 분류될 수 있다. 또한, 한글의 초성과 중성을 묶어 영어로 매핑함으로써 간단하고 효율적으로 매칭 알고리즘을 수행할 수 있으며, 매핑 정보의 우선순위 점수를 적응적으로 변경함으로써 매칭이 수행될 수록 더욱 최적화된 결과를 얻을 수 있다.

Claims (34)

  1. 입력 문자열에 매칭되는 대표 문자열을 출력하는 문자열 매칭 방법에 있어서,
    제1언어와 제2언어 간의 매핑 정보가 저장된 언어 매핑 테이블을 참조하여 상기 입력 문자열을 하나 이상의 제2언어 문자열로 변환하여 변환 리스트를 생성하는 제2언어 문자열 생성단계;
    대표 문자열과 그에 대응하는 제2언어 대표 문자열이 저장되는 대표 리스트 데이터베이스에서 상기 변환 리스트의 문자열과 동일한 제2언어 대표 문자열을 가진 레코드를 찾아 후보 리스트를 생성하는 대표 리스트 검색단계; 및
    상기 후보 리스트의 레코드 중 하나에 포함된 대표 문자열을 출력 문자열로 결정하는 대표 문자열 결정단계를 포함하는 것을 특징으로 하는 문자열 매칭 방법.
  2. 제1항에 있어서,
    문자열과 그에 대응하는 대표 문자열이 포함된 매칭 결과가 저장되는 이전 결과 데이터베이스를 검색하여 상기 입력 문자열과 동일한 문자열이 존재하면, 그에 대응하는 대표 문자열을 출력 문자열로 결정하는 이전 결과 검색단계; 및
    상기 입력 문자열과 상기 출력 문자열이 상기 이전 결과 데이터베이스에 존재하지 않는 경우 상기 이전 결과 데이터베이스에 저장하는 결과 저장단계를 더 포 함하는 것을 특징으로 하는 문자열 매칭 방법.
  3. 제2항에 있어서,
    상기 제2언어 문자열 생성단계는, 상기 변환 전에 상기 입력 문자열에 포함된 유효하지 않은 소정의 특수문자를 제거하는 특수문자 처리 단계를 더 포함하는 것을 특징으로 하는 문자열 매칭 방법.
  4. 제3항에 있어서,
    상기 특수문자는 '-'과 ' '을 포함하는 것을 특징으로 하는 문자열 매칭 방법.
  5. 제3항에 있어서,
    상기 제1언어는 한글이고 상기 제2언어는 영어인 경우에는,
    상기 언어 매핑 테이블은, 한글의 초성과 중성을 조합한 글자를 하나 이상의 영어 문자열로 매핑하는 정보와, 한글의 종성을 하나 이상의 영어 문자열로 매핑하는 정보를 포함하고;
    상기 제2언어 문자열 생성단계는, 상기 입력 문자열이 영어인 경우 상기 입력 문자열을 소문자로 변환한 문자열을 상기 변환 리스트에 포함시키는 단계를 더 포함하는 것을 특징으로 하는 문자열 매칭 방법.
  6. 제3항에 있어서,
    상기 매핑 정보에 항목별 우선순위 점수를 부여하는 단계를 더 포함하고;
    상기 제2언어 문자열 생성단계는, 상기 우선순위 점수를 이용하여 상기 변환 리스트에 포함된 각 문자열에 대한 매칭 점수를 계산하여 부여하고, 상기 매칭 점수가 높은 지정된 개수의 문자열만을 상기 변환 리스트에 포함시키는 단계를 더 포함하는 것을 특징으로 하는 문자열 매칭 방법.
  7. 제5항에 있어서,
    상기 매핑 정보에 항목별 우선순위 점수를 부여하는 단계를 더 포함하고;
    상기 제2언어 문자열 생성단계는, 상기 우선순위 점수를 이용하여 상기 변환 리스트에 포함된 각 문자열에 대한 매칭 점수를 계산하여 부여하고, 상기 매칭 점수가 높은 지정된 개수의 문자열만을 상기 변환 리스트에 포함시키는 단계를 더 포함하는 것을 특징으로 하는 문자열 매칭 방법.
  8. 제5항에 있어서,
    상기 매핑 정보에 항목별 우선순위 점수를 부여하는 단계를 더 포함하고;
    상기 제2언어 문자열 생성단계는, 상기 우선순위 점수를 이용하여 상기 변환 리스트에 포함된 각 문자열에 대한 매칭 점수를 계산하여 부여하고, 상기 매칭 점수가 지정된 점수 이상인 문자열만을 상기 변환 리스트에 포함시키는 단계를 더 포함하는 것을 특징으로 하는 문자열 매칭 방법.
  9. 제3항에 있어서,
    상기 대표 문자열 결정단계는, 상기 후보 리스트에서 사용자가 선택한 레코드의 대표 문자열을 출력 문자열로 결정하는 단계를 포함하는 것을 특징으로 하는 문자열 매칭 방법.
  10. 제5항에 있어서,
    상기 대표 문자열 결정단계는, 상기 후보 리스트에서 사용자가 선택한 레코드의 대표 문자열을 상기 출력 문자열로 결정하는 단계를 포함하는 것을 특징으로 하는 문자열 매칭 방법.
  11. 제7항에 있어서,
    상기 대표 문자열 결정단계는, 상기 후보 리스트에서 사용자가 선택한 레코드의 대표 문자열을 상기 출력 문자열로 결정하는 단계를 포함하는 것을 특징으로 하는 문자열 매칭 방법.
  12. 제11항에 있어서,
    상기 대표 문자열 결정단계는, 상기 사용자가 상기 후보 리스트의 레코드 중 어느 것도 선택하지 않은 경우 상기 입력 문자열을 상기 출력 문자열로 결정하는 단계를 더 포함하고;
    상기 결과 저장단계는, 상기 입력 문자열과 상기 후보 리스트의 영어 대표 문자열 중 상기 매칭 점수가 최고인 문자열을 상기 대표 리스트 데이터베이스에 저장하는 단계를 더 포함하는 것을 특징으로 하는 문자열 매칭방법.
  13. 제12항에 있어서,
    상기 사용자에 의해 선택된 상기 후보 리스트 레코드의 대표 문자열을 제2언어 대표 문자열로 변환하는데 사용된 매핑 정보 항목들에 대해서는 지정된 가산점을 부여한 새로운 우선순위 점수를 부여하는 우선순위 변경단계를 더 포함하는 것을 특징으로 하는 문자열 매칭 방법.
  14. 제3항에 있어서,
    상기 매핑 정보에 항목별 우선순위 점수를 부여하는 단계를 더 포함하고;
    상기 제2언어 문자열 생성단계는, 상기 우선순위 점수를 이용하여 상기 변환 리스트에 포함된 각 문자열에 대한 매칭 점수를 계산하여 부여하는 단계를 더 포함하고;
    상기 대표 문자열 결정단계는, 상기 후보 리스트에 포함된 영어 대표 문자열 중 상기 매칭 점수가 최고인 문자열에 대응하는 대표 문자열을 출력 문자열로 결정하는 단계를 포함하는 것을 특징으로 하는 문자열 매칭 방법.
  15. 제5항에 있어서,
    상기 매핑 정보에 항목별 우선순위 점수를 부여하는 단계를 더 포함하고;
    상기 제2언어 문자열 생성단계는, 상기 우선순위 점수를 이용하여 상기 변환 리스트에 포함된 각 문자열에 대한 매칭 점수를 계산하여 부여하는 단계를 더 포함하고;
    상기 대표 문자열 결정단계는, 상기 후보 리스트에 포함된 영어 대표 문자열 중 상기 매칭 점수가 최고인 문자열에 대응하는 대표 문자열을 출력 문자열로 결정하는 단계를 포함하는 것을 특징으로 하는 문자열 매칭 방법.
  16. 제7항에 있어서,
    상기 대표 문자열 결정단계는, 상기 후보 리스트에 포함된 영어 대표 문자열 중 상기 매칭 점수가 최고인 문자열에 대응하는 대표 문자열을 출력 문자열로 결정하는 단계를 포함하는 것을 특징으로 하는 문자열 매칭 방법.
  17. 제16항에 있어서,
    상기 대표 문자열 결정단계는, 상기 후보 리스트에 포함된 영어 대표 문자열 중 지정된 기준 점수 이상인 문자열이 없는 경우 상기 입력 문자열을 상기 출력 문자열로 결정하는 단계를 더 포함하고;
    상기 결과 저장단계는, 상기 입력 문자열과 상기 후보 리스트의 영어 대표 문자열 중 최고 매칭 점수를 가진 문자열을 대표 리스트 데이터베이스에 저장하는 단계를 더 포함하는 것을 특징으로 하는 문자열 매칭방법.
  18. 제17항에 있어서,
    입력 문자열이 포함된 멀티미디어 정보를 입력받고 상기 멀티미디어 정보에 포함된 상기 입력 문자열을 추출하는 입력 문자열 추출단계를 더 포함하는 것을 특징으로 하는 문자열 매칭 방법.
  19. 제18항에 있어서,
    상기 멀티미디어 정보는 MP3 파일이고,
    상기 입력 문자열 추출단계는, 상기 MP3 파일을 파싱하여 ID3 태그에 포함된 아티스트명을 추출하는 단계를 포함하는 것을 특징으로 하는 문자열 매칭 방법.
  20. 제19항에 있어서,
    상기 대표 문자열 결정단계는, 상기 멀티미디어 정보의 입력 문자열을 상기 출력 문자열로 수정하는 단계를 더 포함하는 것을 특징으로 하는 문자열 매칭 방법.
  21. 제1항 내지 제20항 중 어느 한 항의 방법을 수행하는 프로그램을 기록한 컴퓨터 판독 가능한 기록매체.
  22. 입력 문자열에 매칭되는 대표 문자열을 출력하는 문자열 매칭 시스템에 있어 서,
    대표 문자열과 그에 대응하는 제2언어 대표 문자열이 저장되는 대표 리스트 데이터베이스;
    제1언어와 제2언어 간의 매핑 정보가 저장되는 언어 매핑 테이블;
    상기 언어 매핑 테이블을 이용하여 상기 입력 문자열을 하나 이상의 제2언어 문자열로 변환하여 변환 리스트를 생성하는 제2언어 문자열 생성수단;
    상기 대표 리스트 데이터베이스를 검색하여 상기 변환 리스트의 문자열과 동일한 제2언어 대표 문자열을 가진 레코드로 구성된 후보 리스트를 생성하는 대표 리스트 검색수단; 및
    상기 후보 리스트의 레코드 중 하나에 포함된 대표 문자열을 출력 문자열로 결정하는 대표 문자열 결정수단을 포함하는 것을 특징으로 하는 문자열 매칭 시스템.
  23. 제22항에 있어서,
    문자열과 그에 대응하는 대표 문자열이 포함된 문자열 매칭 결과가 저장되는 이전 결과 데이터베이스;
    상기 이전 결과 데이터베이스를 검색하여 상기 입력 문자열과 동일한 문자열이 존재하면, 그에 대응하는 대표 문자열을 출력 문자열로 결정하는 이전 결과 검색수단; 및
    상기 입력 문자열과 상기 출력 문자열이 상기 이전 결과 데이터베이스에 존 재하지 않는 경우, 상기 이전 결과 데이터베이스에 저장하는 결과 저장수단을 더 포함하는 것을 특징으로 하는 문자열 매칭 시스템.
  24. 제22항 또는 제23항에 있어서,
    상기 제2언어 문자열 생성수단은, 상기 입력 문자열에 포함된 소정의 특수문자를 제거한 후 제2언어 문자열로 변환하는 것을 특징으로 하는 문자열 매칭 시스템.
  25. 제24항에 있어서,
    상기 제1언어는 한글이고 상기 제2언어는 영어인 경우에는,
    상기 언어 매핑 테이블은, 한글의 초성과 중성을 조합한 글자를 하나 이상의 영어 문자열로 매핑하는 정보와, 한글의 종성을 하나 이상의 영어 문자열로 매핑하는 정보를 포함하고;
    상기 제2언어 문자열 생성수단은, 상기 입력 문자열이 영어인 경우 상기 입력 문자열을 소문자로 변환한 문자열을 상기 변환 리스트에 포함시키는 것을 특징으로 하는 문자열 매칭 시스템.
  26. 제25항에 있어서,
    상기 매핑 정보에는 항목별 우선순위 점수가 부여되어 있고,
    상기 제2언어 문자열 생성수단은, 상기 우선순위 점수를 이용하여 상기 변환 리스트에 포함된 각 문자열에 대한 매칭 점수를 계산하여 부여하고, 상기 매칭 점수가 높은 지정된 개수의 문자열만을 상기 변환 리스트에 포함시키는 것을 특징으로 하는 문자열 매칭 시스템.
  27. 제25항에 있어서,
    상기 대표 문자열 결정수단은, 상기 후보 리스트에서 사용자가 선택한 레코드의 대표 문자열을 출력 문자열로 결정하고, 상기 사용자가 상기 후보 리스트의 레코드 중 어느 것도 선택하지 않은 경우 상기 입력 문자열을 상기 출력 문자열로 결정하고;
    상기 결과 저장수단은, 상기 입력 문자열이 상기 출력 문자열로 결정되는 경우, 상기 입력 문자열과 상기 후보 리스트의 영어 대표 문자열 중 매칭 점수가 최고인 문자열을 상기 대표 리스트 데이터베이스에 저장하는 것을 특징으로 하는 문자열 매칭 시스템.
  28. 제26항에 있어서,
    상기 대표 문자열 결정수단은, 상기 후보 리스트에서 사용자가 선택한 레코드의 대표 문자열을 출력 문자열로 결정하고, 상기 사용자가 상기 후보 리스트의 레코드 중 어느 것도 선택하지 않은 경우 상기 입력 문자열을 상기 출력 문자열로 결정하고;
    상기 결과 저장수단은, 상기 입력 문자열이 상기 출력 문자열로 결정되는 경 우, 상기 입력 문자열과 상기 후보 리스트의 영어 대표 문자열 중 매칭 점수가 최고인 문자열을 상기 대표 리스트 데이터베이스에 저장하는 것을 특징으로 하는 문자열 매칭 시스템.
  29. 제28항에 있어서,
    상기 사용자의 선택에 의해 상기 출력 문자열이 결정되는 경우, 상기 선택된 후보 리스트 레코드의 대표 문자열을 제2언어 대표 문자열로 변환하는데 사용된 매핑 정보 항목들에 대해서는 지정된 가산점을 부여한 새로운 우선순위 점수를 부여하는 우선순위 변경수단을 더 포함하는 것을 특징으로 하는 문자열 매칭 시스템.
  30. 제25항에 있어서,
    상기 매핑 정보에 항목별 우선순위 점수가 부여되어 있고,
    상기 제2언어 문자열 생성수단은, 상기 우선순위 점수를 이용하여 상기 변환 리스트에 포함된 각 문자열에 대한 매칭 점수를 계산하여 부여하고;
    상기 대표 문자열 결정수단은, 상기 후보 리스트에 포함된 영어 대표 문자열 중 상기 매칭 점수가 최고인 문자열에 대응하는 대표 문자열을 출력 문자열로 결정하는 것을 특징으로 하는 문자열 매칭 시스템.
  31. 제26항에 있어서,
    상기 대표 문자열 결정수단은, 상기 후보 리스트에 포함된 영어 대표 문자열 중 상기 매칭 점수가 최고인 문자열에 대응하는 대표 문자열을 출력 문자열로 결정하는 것을 특징으로 하는 문자열 매칭 시스템.
  32. 제31항에 있어서,
    상기 대표 문자열 결정수단은, 상기 후보 리스트에 포함된 영어 대표 문자열 중 지정된 점수 이상인 문자열이 없는 경우 상기 입력 문자열을 상기 출력 문자열로 결정하고;
    상기 결과 저장수단은, 상기 입력 문자열을 상기 출력 문자열로 결정하는 경우, 상기 입력 문자열과 상기 후보 리스트의 영어 대표 문자열 중 최고 매칭 점수를 가진 문자열을 대표 리스트 데이터베이스에 저장하는 것을 특징으로 하는 문자열 매칭 시스템.
  33. 제31항에 있어서,
    상기 입력 문자열이 포함된 멀티미디어 정보를 입력받고 상기 멀티미디어 정보에 포함된 상기 입력 문자열을 추출하는 입력 문자열 추출수단을 더 포함하는 것을 특징으로 하는 문자열 매칭 시스템.
  34. 제33항에 있어서,
    상기 대표 문자열 결정수단은, 상기 멀티미디어 정보의 입력 문자열을 상기 출력 문자열로 수정하는 것을 특징으로 하는 문자열 매칭 시스템.
KR1020050080172A 2005-08-30 2005-08-30 문자열 매칭 방법 및 시스템과 그 방법을 기록한 컴퓨터판독 가능한 기록매체 KR100739726B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020050080172A KR100739726B1 (ko) 2005-08-30 2005-08-30 문자열 매칭 방법 및 시스템과 그 방법을 기록한 컴퓨터판독 가능한 기록매체
US11/453,597 US7979268B2 (en) 2005-08-30 2006-06-16 String matching method and system and computer-readable recording medium storing the string matching method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020050080172A KR100739726B1 (ko) 2005-08-30 2005-08-30 문자열 매칭 방법 및 시스템과 그 방법을 기록한 컴퓨터판독 가능한 기록매체

Publications (2)

Publication Number Publication Date
KR20070028664A KR20070028664A (ko) 2007-03-13
KR100739726B1 true KR100739726B1 (ko) 2007-07-13

Family

ID=37831049

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020050080172A KR100739726B1 (ko) 2005-08-30 2005-08-30 문자열 매칭 방법 및 시스템과 그 방법을 기록한 컴퓨터판독 가능한 기록매체

Country Status (2)

Country Link
US (1) US7979268B2 (ko)
KR (1) KR100739726B1 (ko)

Families Citing this family (136)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
CN101206659B (zh) * 2006-12-15 2013-09-18 谷歌股份有限公司 自动搜索查询校正
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
WO2009029865A1 (en) * 2007-08-31 2009-03-05 Google Inc. Automatic correction of user input
US8666976B2 (en) 2007-12-31 2014-03-04 Mastercard International Incorporated Methods and systems for implementing approximate string matching within a database
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8583418B2 (en) * 2008-09-29 2013-11-12 Apple Inc. Systems and methods of detecting language and natural language strings for text to speech synthesis
US8712776B2 (en) 2008-09-29 2014-04-29 Apple Inc. Systems and methods for selective text to speech synthesis
WO2010067118A1 (en) 2008-12-11 2010-06-17 Novauris Technologies Limited Speech recognition involving a mobile device
US8380507B2 (en) 2009-03-09 2013-02-19 Apple Inc. Systems and methods for determining the language to use for speech generated by a text to speech engine
US20120309363A1 (en) 2011-06-03 2012-12-06 Apple Inc. Triggering notifications associated with tasks items that represent tasks to perform
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US8972930B2 (en) * 2010-06-04 2015-03-03 Microsoft Corporation Generating text manipulation programs using input-output examples
US9613115B2 (en) 2010-07-12 2017-04-04 Microsoft Technology Licensing, Llc Generating programs based on input-output examples using converter modules
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
KR101159493B1 (ko) * 2011-08-31 2012-06-22 나이스신용평가정보주식회사 외국어 인명 추천시스템
WO2013127060A1 (en) * 2012-02-28 2013-09-06 Google Inc. Techniques for transliterating input text from a first character set to a second character set
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US9552335B2 (en) 2012-06-04 2017-01-24 Microsoft Technology Licensing, Llc Expedited techniques for generating string manipulation programs
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
WO2014004478A1 (en) * 2012-06-26 2014-01-03 Mastercard International Incorporated Methods and systems for implementing approximate string matching within a database
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
EP4138075A1 (en) 2013-02-07 2023-02-22 Apple Inc. Voice trigger for a digital assistant
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
KR101759009B1 (ko) 2013-03-15 2017-07-17 애플 인크. 적어도 부분적인 보이스 커맨드 시스템을 트레이닝시키는 것
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
WO2014200728A1 (en) 2013-06-09 2014-12-18 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
CN105265005B (zh) 2013-06-13 2019-09-17 苹果公司 用于由语音命令发起的紧急呼叫的系统和方法
JP6163266B2 (ja) 2013-08-06 2017-07-12 アップル インコーポレイテッド リモート機器からの作動に基づくスマート応答の自動作動
WO2015029193A1 (ja) * 2013-08-29 2015-03-05 株式会社野村総合研究所 Webサーバシステム、アプリケーション開発支援システム、Webサーバシステムにおける多言語対応方法、Webサーバシステムにおけるマルチデバイス対応方法、およびアプリケーション開発支援方法
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
WO2015184186A1 (en) 2014-05-30 2015-12-03 Apple Inc. Multi-command single utterance input method
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9606986B2 (en) 2014-09-29 2017-03-28 Apple Inc. Integrated word N-gram and class M-gram language models
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
CN104834690B (zh) * 2015-04-22 2018-04-27 北京金山安全软件有限公司 一种游戏应用的甄别方法及用户设备
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
WO2017002199A1 (ja) * 2015-06-30 2017-01-05 楽天株式会社 翻字処理装置、翻字処理方法、翻字処理プログラム、及び情報処理装置
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US11620304B2 (en) 2016-10-20 2023-04-04 Microsoft Technology Licensing, Llc Example management for string transformation
US11256710B2 (en) 2016-10-20 2022-02-22 Microsoft Technology Licensing, Llc String transformation sub-program suggestion
US10846298B2 (en) 2016-10-28 2020-11-24 Microsoft Technology Licensing, Llc Record profiling for dataset sampling
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK201770428A1 (en) 2017-05-12 2019-02-18 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK179549B1 (en) 2017-05-16 2019-02-12 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10671353B2 (en) 2018-01-31 2020-06-02 Microsoft Technology Licensing, Llc Programming-by-example using disjunctive programs

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000060727A (ko) * 1999-03-18 2000-10-16 오민희 다중 검색어를 갖는 전자사전 및 그 제어방법
KR100326936B1 (ko) 1999-08-02 2002-03-13 이계철 외국어로 표기된 한글을 한글표기로 변환하여 검색하는 시스템및 그 방법

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2279164A (en) * 1993-06-18 1994-12-21 Canon Res Ct Europe Ltd Processing a bilingual database.
US6292768B1 (en) * 1996-12-10 2001-09-18 Kun Chun Chan Method for converting non-phonetic characters into surrogate words for inputting into a computer
US6460015B1 (en) * 1998-12-15 2002-10-01 International Business Machines Corporation Method, system and computer program product for automatic character transliteration in a text string object
JP3500097B2 (ja) 1999-08-26 2004-02-23 日本電信電話株式会社 複合メディア検索方法および複合メディア検索用プログラム記録媒体
KR100373812B1 (ko) 2000-05-30 2003-02-26 한상학 음성 자막 재생 시스템 및 방법과 자막 표시 기능을 갖는휴대용 디지털 오디오 재생기
US20020083029A1 (en) * 2000-10-23 2002-06-27 Chun Won Ho Virtual domain name system using the user's preferred language for the internet
US6950792B1 (en) * 2000-10-25 2005-09-27 Cisco Technology, Inc. Arrangement for providing international prompts in a unified messaging system
EP1221692A1 (en) * 2001-01-09 2002-07-10 Robert Bosch Gmbh Method for upgrading a data stream of multimedia data
US7107215B2 (en) * 2001-04-16 2006-09-12 Sakhr Software Company Determining a compact model to transcribe the arabic language acoustically in a well defined basic phonetic study
DE60142938D1 (de) 2001-04-25 2010-10-07 Sony France Sa Verfahren und Vorrichtung zum Identifizieren des Informationstyps, z.B. zum Identifizieren des Namensinhalts einer Musikdatei
US7191115B2 (en) * 2001-06-20 2007-03-13 Microsoft Corporation Statistical method and apparatus for learning translation relationships among words
US6810374B2 (en) * 2001-07-23 2004-10-26 Pilwon Kang Korean romanization system
BR0212419A (pt) 2001-09-10 2004-08-03 Thomson Licensing Sa Método e aparelho para criar uma lista de execução indexada em um executor de dados de áudio digital
FR2835642B1 (fr) * 2002-02-07 2006-09-08 Francois Teytaud Procede et dispositif pour faire comprendre une langue
US6864809B2 (en) * 2002-02-28 2005-03-08 Zi Technology Corporation Ltd Korean language predictive mechanism for text entry by a user
WO2003104963A1 (fr) * 2002-06-05 2003-12-18 Rongbin Su Procede de saisie d'optimisation d'un code operationnel de numerisation pour des caracteres mondiaux et son systeme de traitement d'information
US7292971B2 (en) * 2003-10-27 2007-11-06 Kuojui Su Language phonetic system and method thereof
US20050216253A1 (en) * 2004-03-25 2005-09-29 Microsoft Corporation System and method for reverse transliteration using statistical alignment
US20070011132A1 (en) * 2005-06-17 2007-01-11 Microsoft Corporation Named entity translation

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000060727A (ko) * 1999-03-18 2000-10-16 오민희 다중 검색어를 갖는 전자사전 및 그 제어방법
KR100326936B1 (ko) 1999-08-02 2002-03-13 이계철 외국어로 표기된 한글을 한글표기로 변환하여 검색하는 시스템및 그 방법

Also Published As

Publication number Publication date
KR20070028664A (ko) 2007-03-13
US7979268B2 (en) 2011-07-12
US20070055493A1 (en) 2007-03-08

Similar Documents

Publication Publication Date Title
KR100739726B1 (ko) 문자열 매칭 방법 및 시스템과 그 방법을 기록한 컴퓨터판독 가능한 기록매체
KR101265263B1 (ko) 발음 기호를 이용한 문자열 매칭 방법 및 시스템과 그방법을 기록한 컴퓨터 판독 가능한 기록매체
JP4977589B2 (ja) 固有表現抽出装置、固有表現抽出方法、及びプログラム
JP4848317B2 (ja) データベースのインデックス作成システム、方法及びプログラム
JP2010541092A5 (ko)
RU2004109570A (ru) Компьютерный поиск с помощью ассоциативных связей
JP2013161371A (ja) テキスト検索装置及びプログラム
JP2010061587A (ja) 類似文書判定装置、類似判定方法およびそのプログラム
JP2010198425A (ja) 文書管理方法、装置
JP6571053B2 (ja) 施設検索装置、施設検索方法、コンピュータプログラム及びコンピュータプログラムを記録した記録媒体
JP2004287835A (ja) オブジェクト表作成方法及びオブジェクト推薦方法及びオブジェクト表作成プログラム及びオブジェクト推薦方法
JP2016018279A (ja) 文書ファイル検索プログラム、文書ファイル検索装置、文書ファイル検索方法、文書情報出力プログラム、文書情報出力装置及び文書情報出力方法
JP6881077B2 (ja) 判別プログラム、判別装置及び判別方法
JP2022002034A (ja) 抽出方法、抽出プログラム、及び、抽出装置
JP2009048351A (ja) 情報検索装置、情報検索方法および情報検索プログラム
JP6753190B2 (ja) 文書検索装置及びプログラム
KR20080082985A (ko) 데이터 파일 조작 방법 및 장치
JP2008090396A (ja) 電子文書検索方法、電子文書検索装置及びプログラム
JP2006126883A (ja) 情報検索装置及び情報検索方法
JP2005043654A (ja) 楽曲情報配信システム
JP6577925B2 (ja) 施設検索装置、施設検索方法、コンピュータプログラム及びコンピュータプログラムを記録した記録媒体
JP4248828B2 (ja) 文書処理装置、文書処理方法及び記録媒体
WO2007011140A1 (en) Method of extracting topics and issues and method and apparatus for providing search results based on topics and issues
JP4061283B2 (ja) 字句をデータに変換する装置、方法及びプログラム
JP2005234635A (ja) 文書要約装置および方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130627

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20140627

Year of fee payment: 8

LAPS Lapse due to unpaid annual fee