KR20090099069A - 플렉시블 텍스트 기반 언어 식별을 제공하는 방법, 장치 및 컴퓨터 판독가능 저장 매체 - Google Patents

플렉시블 텍스트 기반 언어 식별을 제공하는 방법, 장치 및 컴퓨터 판독가능 저장 매체 Download PDF

Info

Publication number
KR20090099069A
KR20090099069A KR1020097014832A KR20097014832A KR20090099069A KR 20090099069 A KR20090099069 A KR 20090099069A KR 1020097014832 A KR1020097014832 A KR 1020097014832A KR 20097014832 A KR20097014832 A KR 20097014832A KR 20090099069 A KR20090099069 A KR 20090099069A
Authority
KR
South Korea
Prior art keywords
score
entry
languages
language
alphabetic
Prior art date
Application number
KR1020097014832A
Other languages
English (en)
Inventor
보그단 바리가
미코 에이 하주
주하 아이소-시필라
Original Assignee
노키아 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 노키아 코포레이션 filed Critical 노키아 코포레이션
Publication of KR20090099069A publication Critical patent/KR20090099069A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/263Language identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Telephone Function (AREA)

Abstract

플렉시블 텍스트 기반 언어 식별을 제공하는 장치는 알파벳 스코어링 구성요소, n-그램 빈도 구성요소 및 처리 구성요소를 포함한다. 알파벳 스코어링 구성요소는 컴퓨터 판독가능 텍스트 포맷으로 엔트리를 수신하고 복수의 언어 중 각각의 언어마다 엔트리의 알파벳 스코어를 계산하도록 구성된다. n-그램 빈도 구성요소는 복수의 언어 중 각각의 언어마다 엔트리의 n-그램 빈도 스코어를 계산하도록 구성된다. 처리 구성요소는 n-그램 빈도 구성요소 및 알파벳 스코어링 구성요소와 통신할 수 있다. 처리 구성요소는 또한 알파벳 스코어와 n-그램 빈도 스코어의 조합에 기초하여 엔트리와 관련된 언어를 결정하도록 구성될 수 있다.

Description

플렉시블 텍스트 기반 언어 식별을 제공하는 방법, 장치 및 컴퓨터 프로그램 제품{METHOD, APPARATUS AND COMPUTER PROGRAM PRODUCT FOR PROVIDING FLEXIBLE TEXT BASED LANGUAGE IDENTIFICATION}
본 발명의 실시예는 일반적으로 음성 처리 기술에 관한 것으로, 보다 구체적으로는, 플렉시블 텍스트 기반 언어 식별을 제공하는 방법, 장치 및 컴퓨터 프로그램 제품에 관한 것이다.
현대의 통신 시대는 유선 및 무선 네트워크의 거대한 확장을 초래해 왔다. 컴퓨터 네트워크, 텔레비전 네트워크 및 전화 네트워크는 소비자 요구에 의해 야기된 공전의 기술 발전을 겪고 있다. 무선 및 이동 네트워킹 기술은 더 많은 정보 전송의 융통성 및 즉시성을 제공하면서 관련된 소비자 요구를 처리해 왔다.
현재 및 미래의 네트워킹 기술은 계속해서 사용자에게 정보 전송의 용이함 및 편의를 촉진한다. 정보 전송의 용이함을 증가시키기 위한 요구가 존재하는 일 영역은 이동 단말기의 사용자로의 서비스의 전달과 관련된다. 서비스는 사용자가 원하는 특정 매체 또는 통신 애플리케이션, 예컨대, 음악 플레이어, 게임 플레이 어, 전자 책, 단문 메시지, 이메일 등의 형태일 수 있다. 서비스는 또한 사용자가 태스크를 수행하고, 게임을 하거나 목표를 달성하기 위해 네트워크 장치에 응답할 수 있는 양방향 애플리케이션의 형태일 수 있다. 서비스는 네트워크 서버 또는 다른 네트워크 장치로부터, 또는 이동 단말기, 예컨대, 이동 전화기, 이동 텔레비전, 이동 컴퓨터, 이동 게임 시스템 등으로부터도 제공될 수 있다.
다수의 애플리케이션에서, 사용자가 네트워크 또는 이동 단말기로부터 구두(oral) 피드백 또는 인스트럭션과 같은 오디오 정보를 수신하거나, 사용자가 네트워크 또는 이동 단말기에 구두 인스트럭션 또는 피드백을 주는 것이 필요하다. 이러한 애플리케이션은 실질적인 수동 사용자 활동에 의존하지 않는 사용자 인터페이스에 제공될 수 있다. 바꾸어 말하면, 사용자는 핸즈 프리 또는 반 핸즈 프리 환경에서 애플리케이션과 상호작용할 수 있다. 이러한 애플리케이션의 예는 요금 지불, 프로그램 순서화, 구동 인스트럭션 요청 및 수신 등일 수 있다. 다른 애플리케이션은 구두 음성을 텍스트로 변환하거나 인지된 음성에 기초하여 몇몇 다른 기능, 예컨대, SMS 또는 이메일 받아쓰기 등을 수행할 수 있다. 이들 및 다른 애플리케이션을 지원하기 위해, 음성 인식 애플리케이션, 텍스트로부터 음성을 산출하는 애플리케이션 및 다른 음성 처리 장치가 보다 일반화되고 있다.
컴퓨터 판독가능 텍스트로부터 음성을 산출하는 장치, 예컨대, 텍스트-음성(TTS) 장치는 전형적으로 텍스트를 분석하고 음성 및 운율 분석을 수행하여, 출력의 음소를 원문의 콘텐츠에 관한 합성 음성으로서 생성한다. 그러나, 이러한 장치가 전 세계적으로 사용되고 또한 다수의 지리적 위치는 로컬 주소에 의해 말해진 언어의 표현으로 점점 다양해질 수 있으므로, 다양한 언어를 포함하는 텍스트가 충돌될 수 있다. 이와 같이, 텍스트의 음소에서 합성 음성으로의 직접 변환은 부정확성으로 인해 나빠지거나 자연적으로 소리를 낼 수 없다. 이상의 결함을 해결하도록 지시된 현재의 메커니즘은 적절히 기능하기 위해 대량의 텍스트를 필요로 할 수 있으므로, 융통성이 없다.
따라서, 텍스트-음성 변환을 수행할 때 적합한 언어 모델이 이용됨을 보장하기 위해 입력 데이터에 플렉시블 언어 식별을 제공하는 것이 바람직할 수 있다.
따라서 플렉시블 텍스트 기반 언어 식별을 제공하는 방법, 장치 및 컴퓨터 프로그램 제품이 제공된다. 본 발명의 예시적인 실시예에 따르면, 단일 단어만큼 짧은 텍스트도 언어 식별을 위해 정확히 분석될 수 있다. 따라서, 크게 구성가능한 다언어 시스템을 지원하기 위해 플렉시블 언어 식별이 제공될 수 있다.
일 예시적인 실시예에서, 플렉시블 텍스트 기반 언어 식별을 제공하는 방법이 제공된다. 방법은 컴퓨터 판독가능 텍스트 포맷으로 엔트리를 수신하는 단계와, 복수의 언어 중 각각의 언어마다 엔트리의 알파벳 스코어를 결정하는 단계와, 복수의 언어 중 각각의 언어마다 엔트리의 n-그램 빈도 스코어를 결정하는 단계와, 알파벳 스코어와 n-그램 빈도 스코어의 조합에 기초하여 엔트리와 관련된 언어를 결정하는 단계를 포함한다.
다른 예시적인 실시예에서, 플렉시블 텍스트 기반 언어 식별을 제공하는 컴퓨터 프로그램 제품이 제공된다. 컴퓨터 프로그램 제품은 컴퓨터 판독가능 프로그램 코드 부분이 저장된 적어도 하나의 컴퓨터 판독가능 저장 매체를 포함한다. 컴퓨터 판독가능 프로그램 코드 부분은 제 1, 제 2, 제 3 및 제 4 실행가능 부분을 포함한다. 제 1 실행가능 부분은 컴퓨터 판독가능 텍스트 포맷으로 엔트리를 수신한다. 제 2 실행가능 부분은 복수의 언어 중 각각의 언어마다 엔트리의 알파벳 스코어를 결정한다. 제 3 실행가능 부분은 복수의 언어 중 각각의 언어마다 엔트리의 n-그램 빈도 스코어를 결정한다. 제 4 실행가능 부분은 알파벳 스코어와 n-그램 빈도 스코어의 조합에 기초하여 엔트리와 관련된 언어를 결정한다.
다른 예시적인 실시예에서, 플렉시블 텍스트 기반 언어 식별을 제공하는 장치가 제공된다. 장치는 알파벳 스코어링 구성요소, n-그램 빈도 구성요소 및 처리 구성요소를 포함할 수 있다. 알파벳 스코어링 구성요소는 컴퓨터 판독가능 텍스트 포맷으로 엔트리를 수신하고 복수의 언어 중 각각의 언어마다 엔트리의 알파벳 스코어를 계산하도록 구성될 수 있다. n-그램 빈도 구성요소는 복수의 언어 중 각각의 언어마다 엔트리의 n-그램 빈도 스코어를 계산하도록 구성될 수 있다. 처리 구성요소는 n-그램 빈도 구성요소 및 알파벳 스코어링 구성요소와 통신할 수 있다. 처리 구성요소는 또한 알파벳 스코어와 n-그램 빈도 스코어의 조합에 기초하여 엔트리와 관련된 언어를 결정하도록 구성될 수 있다.
다른 예시적인 실시예에서, 플렉시블 텍스트 기반 언어 식별을 제공하는 장치가 제공된다. 장치는 컴퓨터 판독가능 텍스트 포맷으로 엔트리를 수신하는 수단과, 복수의 언어 중 각각의 언어마다 엔트리의 알파벳 스코어를 결정하는 수단과, 복수의 언어 중 각각의 언어마다 엔트리의 n-그램 빈도 스코어를 결정하는 수단과, 알파벳 스코어와 n-그램 빈도 스코어의 조합에 기초하여 엔트리와 관련된 언어를 결정하는 수단을 포함한다.
본 발명의 실시예는 음성 처리를 강화하기 위해 시스템에서 이용할 방법, 장치 및 컴퓨터 프로그램 제품을 제공할 수 있다. 그 결과, 예컨대, 이동 단말기 및 다른 전자 장치는 정확히 그리고 분석할 대량의 텍스트 기반 데이터 없이 다수의 언어에 대해 음성 처리를 수행하는 능력으로부터 이익을 얻을 수 있다. 따라서, 비교적 소량의 리소스를 사용하여 정확한 단어 인식 및 재생이 수행될 수 있다.
따라서, 본 발명의 실시예는 일반적인 용어로 설명되었으며, 이제 반드시 실제 크기대로 도시된 것은 아닌 첨부 도면을 참조할 것이다.
도 1은 본 발명의 예시적인 실시예에 따른 이동 단말기의 개략적인 블록도이다.
도 2는 본 발명의 예시적인 실시예에 따른 무선 통신 시스템의 개략적인 블록도이다.
도 3은 본 발명의 예시적인 실시예에 따른 플렉시블 텍스트 기반 언어 식별을 제공하는 시스템의 블록도를 도시한다.
도 4는 본 발명의 예시적인 실시예에 따른 플렉시블 텍스트 기반 언어 식별을 제공하는 예시적인 방법에 따른 순서도이다.
이제 첨부 도면을 참조하여 본 발명의 실시예가 보다 완전히 후술될 것이되, 본 발명의 몇몇 실시예가 도시되지만 본 발명의 모든 실시예가 도시되는 것은 아니다. 게다가, 본 발명은 다수의 상이한 형태로 구현될 수 있고, 본 명세서에 전술된 실시예로 한정되도록 해석되어서는 안 되며, 오히려, 이들 실시예는 이 개시가 적용가능한 법적 요구를 충족시키도록 제공된다. 도면 전체에서 동일한 참조 번호는 동일한 구성요소를 지칭한다.
도 1은 본 발명의 실시예로 이익을 얻는 이동 단말기(10)의 블록도를 도시한다. 그러나, 도시되고 후술되는 이동 전화기는 본 발명의 실시예로 이익을 얻는 예시적인 일 유형의 이동 전화기일 뿐임을 알아야 하며, 따라서, 본 발명의 실시예의 범위를 제한하도록 해석되어서는 안 된다. 이동 단말기(10)의 일 실시예가 도시되고 예시를 위해 후술될 것이지만, 다른 유형의 이동 단말기, 예컨대, PDA, 페이저, 이동 컴퓨터, 이동 텔레비전, 게임 장치, 랩탑 컴퓨터, 카메라, 비디오 녹화기, GPS 장치 및 다른 유형의 음성 및 텍스트 통신 시스템이 본 발명의 실시예를 쉽게 이용할 수 있다. 또한, 이동할 수 없는 장치도 본 발명의 실시예를 쉽게 이용할 수 있다.
본 발명의 시스템 및 방법은 주로 이동 통신 애플리케이션에 관련하여 후술될 것이다. 그러나, 이동 통신 산업의 내부와 이동 통신 산업의 외부 양자 모두에서, 본 발명의 실시예의 시스템 및 방법이 여러 가지 다른 애플리케이션에 관련하여 이용될 수 있음을 알아야 한다.
이동 단말기(10)는 송신기(14) 및 수신기(16)와 동작가능하게 통신하는 안테나(12)(또는 다수의 안테나)를 포함한다. 이동 단말기(10)는 제어기(20) 또는 각각 송신기(14) 및 수신기(16)로 신호를 제공하고 이들로부터 신호를 수신하는 다른 처리 구성요소를 더 포함한다. 신호는 적용가능한 셀룰러 시스템의 무선 인터페이스 표준에 따라 시그널링 정보, 및 사용자 음성, 수신된 데이터 및/또는 사용자 생성 데이터도 포함한다. 이 점에 있어서, 이동 단말기(10)는 하나 이상의 무선 인터페이스 표준, 통신 프로토콜, 변조 유형 및 액세스 유형을 사용하여 작동할 수 있다. 예로써, 이동 단말기(10)는 다수의 제 1, 제 2, 제 3 및/또는 제 4 세대 통신 프로토콜 등 중 임의의 것에 따라 작동할 수 있다. 예컨대, 이동 단말기(10)는 제 2 세대(2G) 무선 통신 프로토콜 IS-136(TDMA), GSM, IS-95(CDMA) 및 제 3 세대 무선 통신 프로토콜, 예컨대, UMTS, CDMA2000, WCDMA 및 TD-SCDMA 및 제 4 세대(4G) 무선 통신 프로토콜 등에 따라 작동할 수 있다.
제어기(20)는 이동 단말기(10)의 오디오 및 로직 기능을 구현하기에 바람직한 회로를 포함함을 알아야 한다. 예컨대, 제어기(20)는 디지털 신호 프로세서 장치, 마이크로프로세서 장치 및 다양한 아날로그-디지털 변환기, 디지털-아날로그 변환기 및 다른 지원 회로로 구성될 수 있다. 이동 단말기(10)의 제어 및 신호 처리 기능은 저마다의 능력에 따라 이들 장치 사이에 할당된다. 따라서 제어기(20)는 컨볼루션 인코딩하고 변조 및 전송 이전에 메시지와 데이터를 인터리빙하는 기능도 포함할 수 있다. 제어기(20)는 부가적으로 내부 음성 코더를 포함할 수 있고, 내부 데이터 모뎀을 포함할 수 있다. 또한, 제어기(20)는 메모리에 저장될 수 있는 하나 이상의 소프트웨어 프로그램을 실행하는 기능을 포함할 수 있다. 예컨대, 제어기(20)는 종래의 웹 브라우저와 같은 접속성 프로그램을 실행할 수 있다. 이어서 접속성 프로그램은 이동 단말기(10)가 예컨대, 무선 애플리케이션 프로토콜(WAP), 하이퍼텍스트 전송 프로토콜(HTTP) 등에 따라, 위치 기반 콘텐츠 및/또는 다른 웹 페이지 콘텐츠와 같은 웹 콘덴츠를 송신하고 수신하게 할 수 있다.
이동 단말기(10)는 종래의 이어폰 또는 스피커(24), 링거(ringer)(22), 마이크로폰(26), 디스플레이(28)와 같은 출력 장치 및 사용자 입력 인터페이스를 포함하는 사용자 인터페이스도 포함할 수 있으며, 이들 모두 제어기(20)에 결합된다. 이동 단말기(10)가 데이터를 수신하게 하는 사용자 입력 인터페이스는 이동 단말기(10)가 데이터를 수신하게 하는 다수의 장치 중 임의의 것, 예컨대, 키패드(30), 터치 디스플레이(도시 생략) 또는 다른 입력 장치를 포함할 수 있다. 키패드(30)를 포함하는 실시예에서, 키패드(30)는 종래의 숫자(0 내지 9) 및 관련 키(#,*) 및 이동 단말기(10)를 작동시키기 위해 사용된 다른 키를 포함할 수 있다. 이와 달리, 키패드(30)는 종래의 QWERTY 키패드 구성을 포함할 수 있다. 키패드(30)는 관련 기능을 가진 다양한 소프트 키도 포함할 수 있다. 게다가 또는 그 대신에, 이동 단말기(10)는 조이스틱 또는 다른 사용자 입력 인터페이스와 같은 인터페이스 장치를 포함할 수 있다. 이동 단말기(10)는 이동 단말기(10)를 작동시키는 데 필요한 다양한 회로에 전력을 공급할 뿐만 아니라, 검출가능한 출력으로서 기계적 진동도 선택적으로 제공하는 진동 배터리 팩과 같은 배터리(34)를 더 포함한다.
이동 단말기(10)는 사용자 식별 모듈(UIM)(38)을 더 포함한다. UIM(318)은 전형적으로 프로세서가 내장된 메모리 장치이다. UIM(38)은 예컨대, 가입자 식별 모듈(SIM), 범용 집적 회로 카드(UICC), 범용 가입자 식별 모듈(USIM), 분리형 사용자 식별 모듈(R-UIM) 등을 포함할 수 있다. UIM(38)은 전형적으로 이동 가입자에 관련된 정보 요소를 저장한다. UIM(38) 외에, 이동 단말기(10)는 메모리를 구비할 수 있다. 예컨대, 이동 단말기(10)는 예컨대, 데이터의 임시 저장을 위한 캐시 영역을 포함하는 휘발성 RAM과 같은 휘발성 메모리(40)를 포함할 수 있다. 이동 단말기(10)는 내장 및/또는 분리될 수 있는 다른 비휘발성 메모리(42)도 포함할 수 있다. 비휘발성 메모리(42)는 부가적으로 또는 그 대신에 예컨대, 캘리포니아주 서니베일의 샌디스크사 또는 캘리포니아주 프리몬트의 렉사 미디어사로부터 이용가능한 EEPROM, 플래시 메모리 등을 포함할 수 있다. 메모리는 이동 단말기(10)의 기능을 구현하기 위해 이동 단말기(10)에 의해 사용된 다수의 정보 조각 및 데이터 중 임의의 것을 저장할 수 있다. 예컨대, 메모리는 이동 단말기(10)를 고유하게 식별할 수 있는 식별자, 예를 들어, 국제 이동 단말기 식별 번호(IMEI) 코드를 포함할 수 있다.
도 2는 본 발명의 예시적인 실시예에 따른 무선 통신 시스템의 블록도를 도시한다. 이제 도 2를 참조하면, 본 발명의 실시예로 이익을 얻는 일 유형의 시스템의 예시가 제공된다. 시스템은 복수의 네트워크 장치를 포함한다. 도시된 바와 같이, 하나 이상의 이동 단말기(10)는 각각 기지국(BS)(44)으로 신호를 송신하고 이로부터 신호를 수신하는 안테나(12)를 포함할 수 있다. 기지국(44)은 하나 이상의 셀룰러 또는 이동 네트워크의 일부일 수 있는데, 각각은 네트워크를 작동시키는 데 필요한 구성요소, 예컨대, 이동 전화 교환국(MSC)(46)을 포함한다. 당업자에게 잘 알려져 있는 바와 같이, 이동 네트워크는 기지국/MSC/상호작용 기능부(BMI)로도 지칭될 수 있다. 작동시에, MSC(46)는 이동 단말기(10)가 호출하고 호출을 수신할 때 이동 단말기(10)로 및 이동 단말기로부터 호출을 라우팅할 수 있다. MSC(46)는 또한 이동 단말기(10)가 호출에 수반될 때 랜드라인 트렁크(landline trunk)에 접속을 제공할 수 있다. 또한, MSC(46)는 이동 단말기(10)로 및 이동 단말기로부터 메시지의 전송을 제어할 수 있고, 메시징 센터로 및 메시징 센터로부터 이동 단말기를 향한 메시지의 전송도 제어할 수 있다. MSC(46)가 도 2의 시스템에 도시되었지만, MSC(46)는 예시적인 네트워크 장치일 뿐이며 본 발명의 실시예가 MSC를 이용하는 네트워크에서 사용하는 것으로 제한되지 않음을 알아야 한다.
MSC(46)는 데이터 네트워크, 예컨대, LAN, MAN 및/또는 WAN에 결합될 수 있다. MSC(46)는 데이터 네트워크에 직접 결합될 수 있다. 그러나, 전형적인 일 실시예에서, MSC(46)는 게이트웨이 장치(GTW)(48)에 결합되고, GTW(48)는 WAN, 예컨대, 인터넷(50)에 결합된다. 차례로, 처리 구성요소(예컨대, 개인용 컴퓨터, 서버 컴퓨터 등)와 같은 장치는 인터넷(50)을 통해 이동 단말기(10)에 결합될 수 있다. 후술되는 바와 같이, 예컨대, 처리 구성요소는 후술되는 컴퓨팅 시스템(52)(도 2에 도시된 2 개), 원 서버(54)(도 2에 도시된 1 개) 등과 결합된 하나 이상의 처리 구성요소를 포함할 수 있다.
BS(44)는 또한 시그널링 GPRS 지원 노드(SGSN)(56)에 결합될 수 있다. 당업자에게 알려진 바와 같이, SGSN(56)은 전형적으로 패킷 교환 서비스에 대해 MSC(46)와 유사한 기능을 수행할 수 있다. MSC(46)처럼, SGSN(56)은 인터넷(50)과 같은 데이터 네트워크에 결합될 수 있다. SGSN(56)은 데이터 네트워크에 직접 결합될 수 있다. 그러나, 보다 전형적인 실시예에서, SGSN(56)은 패킷 교환 코어 네트워크, 예컨대, GPRS 코어 네트워크(58)에 결합된다. 이어서 패킷 교환 코어 네트워크는 다른 GTW(48), 예컨대, GTW GPRS 지원 노드(GCSN)(60)에 결합되고, GGSN(60)은 인터넷(50)에 결합된다. GGSN(60) 외에, 패킷 교환 코어 네트워크도 GTW(48)에 결합될 수 있다. 또한, GGSN(60)은 메시징 센터에 결합될 수 있다. 이 점에 있어서, MSC(46)처럼, GGSN(60) 및 SGSN(56)은 메시지, 예컨대, MMS 메시지의 전송을 제어할 수 있다. GGSN(60) 및 SGSN(56)은 메시징 센터로 및 메시징 센터로부터 이동 단말기(10)를 향한 메시지의 전송도 제어할 수 있다.
또한, GPRS 코어 네트워크(58) 및 GGSN(60)에 SGSN(56)을 결합함으로써, 컴퓨팅 시스템(52) 및/또는 원 서버(54)와 같은 장치는 인터넷(50)을 통해 이동 단말기(10)에 결합될 수 있다. 이 점에 있어서, 컴퓨팅 시스템(52) 및/또는 원 서버(54)와 같은 장치는 SGSN(56), GPRS 코어 네트워크(58) 및 GGSN(60)을 통해 이동 단말기(10)와 통신할 수 있다. 이동 단말기(10) 및 다른 장치(예컨대, 컴퓨팅 시스템(52), 원 서버(54) 등)를 인터넷(50)에 직접 또는 간접적으로 접속함으로써, 이동 단말기(10)는 예컨대, 하이퍼텍스트 전송 프로토콜(HTTP) 등에 따라 다른 장치와 그리고 서로 통신할 수 있으며, 이로써 이동 단말기(10)의 다양한 기능을 수행할 수 있다.
가능한 모든 이동 네트워크의 모든 구성요소가 본 명세서에 도시되고 설명되 지는 않았지만, 이동 단말기(10)는 BS(44)를 통해 다수의 상이한 네트워크 중 하나 이상에 결합될 수 있음을 알아야 한다. 이 점에 있어서, 네트워크(들)는 다수의 제 1 세대(1G), 제 2 세대(2G), 2.5G, 제 3 세대(3G), 3.9G, 제 4 세대(4G) 이동 통신 프로토콜 등 중 어느 하나 또는 그 이상에 따라 통신을 지원할 수 있다. 예컨대, 하나 이상의 네트워크(들)는 2G 무선 통신 프로토콜 IS-136(TDMA), GSM 및 IS-95(CDMA)에 따라 통신을 지원할 수 있다. 또한, 예컨대, 하나 이상의 네트워크(들)는 2.5G 무선 통신 프로토콜(GPRS), EDGE 등에 따라 통신을 지원할 수 있다. 또한, 예컨대, 하나 이상의 네트워크(들)는 3G 무선 통신 프로토콜, 예컨대, WCDMA 무선 액세스 기술을 이용하는 UMTS 네트워크에 따라 통신을 지원할 수 있다. 듀얼 또는 고차 모드 이동국(예컨대, 디지털/아날로그 또는 TDMA/CDMA/아날로그 전화기)이어야 하는 몇몇 협대역 AMPS(NAMPS) 및 TACS 네트워크(들)도 본 발명의 실시예로 이익을 얻을 수 있다.
이동 단말기(10)는 또한 하나 이상의 무선 액세스 포인트(AP)(62)에 결합될 수 있다. AP(62)는 예컨대, 무선 주파수(RF), 블루투스(BT), 적외선(IrDA) 또는 IEEE 802.11(예컨대, 802.11a, 802.11b, 802.11g, 802.11n 등)과 같은 무선 LAN(WLAN) 기술, IEEE 802.16과 같은 WiMAX 기술, 및/또는 IEEE 802.15와 같은 UWB 기술을 포함하는 다수의 상이한 무선 네트워킹 기술 중 임의의 것과 같은 기술에 따라 이동 단말기(10)와 통신하도록 구성된 액세스 포인트를 포함할 수 있다. AP(62)는 인터넷(50)에 결합될 수 있다. MSC(46)와 마찬가지로, AP(62)는 인터넷(50)에 직접 결합될 수 있다. 그러나, 일 실시예에서, AP(62)는 GTW(48)를 통해 인터넷(50)에 간접적으로 결합된다. 또한, 일 실시예에서, BS(44)는 다른 AP(62)로 간주할 수 있다. 알 게 되듯이, 이동 단말기(10), 컴퓨팅 시스템(52), 원 서버(54) 및/또는 다수의 다른 장치 중 임의의 장치를 인터넷(50)에 직접 또는 간접적으로 접속함으로써, 이동 단말기(10)는 서로, 컴퓨팅 시스템 등과 통신할 수 있으며, 이로써 이동 단말기(10)의 다양한 기능을 수행하는데, 예컨대, 컴퓨팅 시스템(52)에 대해 데이터, 콘텐츠 등을 전송하고/하거나 콘텐츠, 데이터 등을 수신한다. 본 명세서에 사용된 바와 같이, 용어 "데이터", "콘텐츠", "정보" 및 유사한 용어는 본 발명의 실시예에 따라 전송, 수신 및/또는 저장될 수 있는 데이터를 지칭하는 데 상호교환적으로 사용될 수 있다. 따라서, 임의의 이러한 용어의 사용은 본 발명의 실시예의 사상 및 범위를 제한하도록 해석되어서는 안 된다.
도 2에 도시되지 않았지만, 인터넷(50)을 통해 컴퓨팅 시스템(52)에 이동 단말기(10)를 결합하는 것 외에 또는 대신에, 이동 단말기(10) 및 컴퓨팅 시스템(52)은 서로에 결합될 수 있고, 예컨대, RF, BT, IrDA 또는 LAN, WLAN, WiMAX, UWB 기술 및/또는 기타 등등을 포함하는 다수의 상이한 유선 또는 무선 통신 기술 중 임의의 기술에 따라 통신할 수 있다. 하나 이상의 컴퓨팅 시스템(52)은 이후에 이동 단말기(10)로 전송될 수 있는 콘텐츠를 저장할 수 있는 분리형 메모리를 부가적으로 또는 그 대신에 포함할 수 있다. 또한, 이동 단말기(10)는 프린터, 디지털 프로젝터 및/또는 다른 멀티미디어 캡처, 생성 및/또는 저장 장치(예컨대, 다른 단말기)와 같은 하나 이상의 전자 장치에 결합될 수 있다. 컴퓨팅 시스템(52)과 마찬가지로, 이동 단말기(10)는 예컨대, RF, BT, IrDA 또는 USB, LAN, WLAN, WiMAX, UWB 기술 및/또는 기타 등등을 포함하는 다수의 상이한 유선 또는 무선 통신 기술 중 임의의 기술에 따라 휴대용 전자 장치와 통신하도록 구성될 수 있다.
예시적인 실시예에서, 음성 언어 인터페이스와 관련된 데이터는 도 1의 이동 단말기(10)와 유사할 수 있는 이동 단말기와 도 2의 시스템의 네트워크 장치 사이의 또는 이동 단말기들 사이에서 도 2의 시스템을 통해 전달될 수 있다. 이와 같이, 서버와 이동 단말기 사이의 통신에 도 2의 시스템이 이용될 필요가 없으며, 오히려 도 2는 예시만을 위해 제공된 것임을 알아야 한다. 또한, 본 발명의 실시예는 이동 단말기(10)와 같은 통신 장치 상에 존재할 수 있고, 통신 장치에 액세스 가능한 네트워크 장치 또는 다른 장치 상에 존재할 수 있음을 알아야 한다.
도 3은 본 발명의 예시적인 실시예에 따른 플렉시블 언어 식별을 제공하는 시스템의 블록도를 도시한다. 이제 플렉시블 언어 식별을 제공하는 시스템의 특정 구성요소가 표시되는 도 3과 관련하여 본 발명의 예시적인 실시예가 설명될 것이다. 도 3의 시스템은 예시를 위해 도 1의 이동 단말기(10)와 관련하여 설명될 것이다. 그러나, 도 3의 시스템이 여러 가지 다른 장치 -이동식 및 고정식 양자 모두- 와 관련하여 이용될 수도 있음을 알아야 하며, 따라서 본 발명의 실시예는 도 1의 이동 단말기(10)와 같은 장치에 대한 응용으로 한정되어서는 안 된다. 도 3은 플렉시블 언어 식별을 제공하는 시스템의 구성의 일례를 도시하지만, 본 발명의 실시예를 구현하는 데 다수의 다른 구성도 사용될 수 있음을 또한 알아야 한다.
이제 도 3을 참조하면, 플렉시블 언어 식별을 제공하는 시스템(68)이 제공된다. 시스템(68)은 제 1 유형의 음성 처리 구성요소, 예컨대, 언어 식별(LID) 구성 요소(72)와 통신하는 텍스트-음성(TTS) 구성요소(70)를 포함한다. 도 3은 TTS 구성요소(72)를 포함하는 음성 처리 구성요소의 측면에서 설명될 것이지만, 그 대신에 또는 부가적으로 다른 음성 처리 구성요소가 이용될 수 있다. 예컨대, 자동 음성 인식(ASR) 구성요소는 텍스트 데이터를 인식에 사용될 일련의 음소로 변환하기 위해 정확한 언어에 대응하는 적합한 룰을 선택하도록 LID 구성요소(72)를 사용할 수 있다. 보통 텍스트-음소 변환용 룰 세트는 언어마다 다르다. 부가적으로, LID 구성요소(72)는 TTS 구성요소(70)보다 앞서는 것으로 도시되지만, 이러한 구성이 필수적인 것은 아니다. 오히려, 본 발명의 실시예에 따른 LID 구성요소(72)는 텍스트가 분석될 수 있는 시스템(68)의 임의의 위치에 배치될 수 있다. 바꾸어 말하면, LID 구성요소(72)는 음성 처리 구성요소와 관련하여 또는 음성 처리 구성요소의 조합과 관련하여 사용되어, 입력 데이터, 출력 데이터 또는 중간 데이터를 텍스트 형태로 처리할 수 있다. 또한, 도 3이 TTS 구성요소(70)에 입력 텍스트를 제공하는 LID 구성요소(72)를 사용하여 도시되지만, 이와 달리 TTS 구성요소(70)는 임의의 다른 소스로부터 입력 텍스트를 수신할 수 있다.
도 3에 도시된 바와 같이, 일 실시예에서, TTS 구성요소(70)는 컴퓨터 판독가능 텍스트로부터 합성 음성을 산출할 수 있는 하드웨어, 소프트웨어 또는 하드웨어와 소프트웨어의 조합으로 구현된 임의의 장치 또는 수단일 수 있다. 이와 같이, 도 3의 TTS 구성요소의 구성요소들은 예시적일 뿐이며 후술되는 설명은 명확성을 위해 TTS 구성요소(70)의 동작을 일반적인 용어로 설명하기 위한 것일 뿐이다. TTS 구성요소(70)는 예컨대, 텍스트 프로세서(76), 운율 프로세서(78) 및 음향 합 성기(80)를 포함할 수 있다.
텍스트 프로세서(76)는 처리된 텍스트를 운율 프로세서(78)로 전달하기 전에 입력 텍스트(82)와 같은 미디어 입력을 수신하고 입력 텍스트(82)를 처리하기 시작할 수 있다. 텍스트 프로세서(76)는 당해 기술에 알려져 있는 다수의 처리 동작 중 임의의 것을 수행하도록 구성될 수 있다. 텍스트 프로세서(76)는 특정 텍스트 단어 또는 문자열을 발음에 관한 특정 규격 또는 룰을 사용하여 상관시키는 표 또는 다른 메커니즘을 포함할 수 있다. 예시적인 실시예에서, 텍스트 프로세서(76)는 숫자 및 약어와 같은 비문자 표현에서 대응하는 문자 단어 표현으로 변환하도록 구성될 수 있다.
운율 프로세서(78)는 처리된 텍스트를 분석하여 텍스트가 어떻게 발음되어야 하는지, 강조할 음절이 무엇인지, 사용할 음조가 무엇인지, 얼마나 빨리 소리를 전달하는지 등에 대한 규격을 결정할 수 있다. 예시적인 실시예에서, 운율 프로세서(78)는 텍스트를 나누고 텍스트의 세그먼트를 구, 절 및 문장과 같은 다양한 운율 단위로 마킹하도록 구성될 수 있다. 운율 프로세서(78)는 입력 텍스트(82)의 발음 표기를 수행하는 텍스트-음소(TTP) 변환 모델 또는 맵도 이용할 수 있다. 발음 표기와 운율 정보의 조합은 음향 합성기(80)로 입력될 수 있는 음소의 기호 언어 표현을 구성한다.
음향 합성기(80)는 음소의 입력 시퀀스에 응답하여 합성적으로 생성된 오디오 출력을 컴퓨터 생성 음성의 형태로 산출하도록 구성될 수 있다. 음향 합성기(80)는 저장된 룰(rules) 또는 모델을 운율 프로세서(78)로부터의 입력에 적용하 여, 운율 프로세서(78)에 의해 결정된 규격을 따르는 방법으로 컴퓨터 텍스트를 들리도록 재생하는 합성 음성(84)을 생성할 수 있다. 이어서 합성 음성(84)은 출력 장치, 예컨대, 오디오 믹서 또는 다른 출력 장치, 예컨대, 스피커(22)로 전달될 수 있다.
TTS 구성요소(70)가 다언어 시스템에서 사용하기에 바람직한 예시적인 실시예에서, 각각 상이한 언어에 대응하는 다수의 모델은 음향 합성기(80)와 관련하여 저장될 수 있다. 따라서, 각각의 특정 언어 모델은 트레이닝되어, 특정 언어에 대응하는 일련의 음소에 응답하여 자연 소리 및 정확한 합성 음성을 생성할 수 있다. 따라서, 만일 TTS 구성요소(70)가 입력 텍스트(82)의 정확한 언어(또는 사리에 맞는 분석에 기초하여 가장 정확할 수 있는 언어)를 통지받으면, TTS 구성요소(70)는 대응하는 언어 모델을 선택하고 입력 텍스트(82)의 자연 및 정확한 소리 표현을 합성 음성(84)의 형태로 생성할 수 있다.
이점에 있어서, LID 구성요소(72)는 크기가 단일 단어만큼 작을 수 있는 입력 텍스트(82)를 분석하고 입력 텍스트(82)와 관련될 가능성이 가장 높은 언어(예컨대, 최상의 언어)의 정확한 추정을 생성하기 위해 동작하도록 구성될 수 있다. LID 구성요소(72)는 입력 텍스트(82)를 수신할 수 있고 입력 텍스트(82)와 관련될 가능성이 가장 높은 언어를 결정할 수 있는 하드웨어, 소프트웨어 또는 하드웨어와 소프트웨어의 조합으로 구현된 임의의 장치 또는 수단일 수 있다. 예시적인 실시예에서, LID 구성요소(72)는 LID 구성요소(72)의 동작을 제어하거나 다른 구성요소와 통신할 수 있는 처리 구성요소(90)를 포함할 수 있다. 처리 구성요소(90)는 다 수의 방법으로 구현될 수 있다. 예컨대, 처리 구성요소(90)는 집적 회로, 가령, ASIC을 포함하는 프로세서, 코프로세서, 제어기 또는 여러 가지 다른 처리 수단 또는 장치로서 구현될 수 있다. 후술되는 동작에 따라 가장 가능성이 있는 언어의 리스트를 결정한 후에, LID 구성요소(72)는 TTS 구성요소(70)로 언어 식별 정보(91)를 전달할 수 있다. 언어 식별 정보(91)는 최상의 언어의 식별 또는 입력 텍스트(82)와 관련된 n 개의 최상의 언어의 리스팅을 포함할 수 있다.
예시적인 실시예에서, LID 구성요소(72)의 다른 구성요소는 입력 텍스트(82) 내의 단어(또는 엔트리)마다 알파벳 스코어를 할당하도록 구성된 알파벳 스코어링 구성요소(92) 및 입력 텍스트(82) 내의 단어마다 n-그램(n-gram) 빈도 스코어를 제공하도록 구성된 n-그램 빈도 분석 구성요소(94)를 포함할 수 있다. 이와 달리, 처리 구성요소(90) 또는 다수의 처리 구성요소는 알파벳 스코어링 구성요소(92) 및/또는 n-그램 빈도 분석 구성요소(94)와 관련된 기능 전부를 수행할 수 있다. 예시적인 실시예에서, 처리 구성요소(90)는 단어마다 조합 스코어를 결정하도록 또한 구성될 수 있는데, 그 조합 스코어는 단어마다 알파벳 스코어와 n-그램 빈도를 포함한다. 예시적인 실시예에서, 처리 구성요소(90)는 또한 입력 텍스트(82) 내의 단어 중 각각의 조합 스코어에 기초하여 입력 텍스트(82)에 대한 누적 조합 스코어를 결정하도록 구성될 수 있다. 누적 조합 스코어에 기초하여, 처리 구성요소(90)는 입력 텍스트(82)와 관련된 최상의 언어(예컨대, 가장 가능성 있는 언어)를 결정하도록 구성될 수 있다. 일 실시예에서, 최저 스코어를 가진 특정 언어는 최상의 언어를 나타낼 수 있다. 그러나, 다른 실시예는 스코어 계산에 사용된 알고리즘 및 이용된 스코어링 패러다임에 따라 최고 스코어를 가진 언어를 선택할 수 있다.
일 실시예에서, LID 구성요소(72)는 조합 스코어 및/또는 누적 조합 스코어가 최상의 언어 결정에 관해서 명확한 결과를 제공하지 않는 경우에 사용하기 위해 최상의 언어 결정을 위한 사전정의된 언어 선호 정보를 가진 패키지 순서화 구성요소(96)를 포함할 수 있다. 조합 스코어의 각각을 조합함으로써 또는 우선 입력 텍스트(82) 내의 각각의 단어의 알파벳 스코어 전부를 조합하고 그 결과적인 조합 알파벳 스코어와 입력 텍스트(82) 내의 각각의 단어의 n-그램 빈도 스코어 전부를 조합한 결과를 조합함으로써 누적 조합 스코어가 결정될 수 있음을 알아야 한다.
알파벳 스코어링 구성요소(92)는 복수의 언어 중 각각의 언어에 대한 입력 텍스트(82)의 단어마다 알파벳 스코어를 제공하도록 구성될 수 있다. 알파벳 스코어링 구성요소(92)는 해독될 단어의 각각의 문자(또는 글자)를 시험할 수 있고, 단어의 각각의 문자(또는 글자)를 복수의 언어의 각각의 알파벳과 비교할 수 있는 하드웨어, 소프트웨어 또는 하드웨어와 소프트웨어의 조합으로 구현된 임의의 장치 또는 수단일 수 있다. 그 비교에 기초하여, 알파벳 스코어링 구성요소(92)는 복수의 언어 각각의 단어에 대한 알파벳 스코어를 생성하도록 구성될 수 있다. 복수의 언어 각각에 대한 알파벳 스코어는 스코어링되는 복수의 언어 중 각각의 언어의 대응하는 알파벳으로 표현될 단어의 문자들 중 하나 이상의 실패(failure)에 적어도 일부분 기초할 수 있다. 바꾸어 말하면, 만일 단어의 모든 문자가 특정 언어로 표현할 수 있으면, 특정 언어 내의 단어에 대한 알파벳 스코어는 최대 가능 스코어(선택된 스코어링 패러다임에 의존하는 높거나 낮은 숫자 값일 수 있음)일 수 있지 만, 일부 문자를 표현할 수 없는 다른 언어에 대한 알파벳 스코어는 다른 언어로 표현할 수 없는 문자의 수에 의해 결정된 양만큼 최대 가능 스코어보다 낮을 것이다.
예시적인 실시예에서, 알파벳 스코어링 구성요소(92)는 단어의 "알파벳 외(out-of-alphabet)" 문자의 수에 기초하여 단어마다 알파벳 스코어를 할당하도록 구성될 수 있다. 단어마다 알파벳 스코어를 계산하거나 결정한 후에, 알파벳 스코어링 구성요소(92)는 알파벳 스코어를 임계치와 비교하여 단어가 통과(passing) 또는 실패(failing) 알파벳 스코어를 갖는지 여부를 결정할 수 있다. 예시적인 실시예에서, 임계치는, 만일 만족되지 않으면, 단어가 알파벳 스코어가 계산되었던 언어와 관련되지 않을 가능성이 높음을 나타내는 사전결정된 값일 수 있다. 바꾸어 말하면, 실패 알파벳 스코어는 단어가 실패 알파벳 스코어가 계산되었던 언어로 표현할 수 없음을 나타낸다. 이와 달리, 실패 알파벳 스코어는 문자 중 어느 것도 알파벳 스코어가 계산되었던 언어로 표현할 수 없는 단어에 간단히 할당될 수 있다.
복수의 언어 각각의 단어마다 알파벳 스코어를 계산한 후에, 본 발명의 예시적인 일 실시예의 알파벳 스코어링 구성요소(92)는 n-그램 빈도 구성요소(94)에 의해 더 처리하기 위해 후보 언어로서 실패 알파벳 스코어를 가진 각각의 언어를 제거한다. 바꾸어 말하면, 만일 단어가 특정 언어에 대한 실패 알파벳 스코어를 수신하면, 단어는 특정 언어에 대한 n-그램 빈도 스코어를 수신하지 못할 수도 있다. 다른 예시적인 실시예에서, 단어가 실패 알파벳 스코어를 수신하는 언어의 단어에 대한 n-그램 빈도 스코어를 단순히 계산하지 않는 것 보다, 알파벳 스코어링 구성요소(92)는 나쁜(예컨대, 최저 비실패 알파벳 스코어보다 낮음) 또는 심지어 최저 가능 스코어를 단어에 할당하도록 구성될 수 있다. 이어서 n-그램 빈도 구성요소(94)는 단어가 실패 알파벳 스코어를 수신하였던 언어로 단어를 처리할 수 있다.
예시적인 실시예에서, 알파벳 스코어링 구성요소(92)는 복수의 언어마다 누적 알파벳 스코어를 계산하거나 결정하도록 또한 구성될 수 있다. 누적 알파벳 스코어는 복수의 언어 중 대응하는 언어의 입력 텍스트(82)의 각각의 단어의 알파벳 스코어의 조합을 나타낼 수 있다. 누적 알파벳 스코어는 또한 임계치와 비교될 수 있고 단일 단어에 관하여 전술한 바와 같이 처리될 수 있다.
n-그램 빈도 구성요소(94)는 복수의 언어 중 각각의 언어에 대한 입력 텍스트(82)의 단어마다 n-그램 빈도 스코어를 제공하도록 구성될 수 있다. n-그램 빈도 구성요소(94)는 복수의 언어 각각에 대한 알려진 정보에 기초하여 복수의 언어 중 각각의 언어에 대응하는 단어의 가능성과 관련된 확률 및 단어의 각각의 문자(또는 글자)를 시험할 수 있는 하드웨어, 소프트웨어 또는 하드웨어와 소프트웨어의 조합으로 구현된 임의의 장치 또는 수단일 수 있다. 이점에 있어서, 모델은 복수의 언어 중 각각에 대해 이용될 수 있다. 각 모델은 n-1 개의 문자가 선행한다는 가정하에 각 단어(또는 엔트리)의 n 번째 문자의 조건부 확률을 나타낼 수 있는 누적 n-그램 통계를 포함할 수 있다. 예컨대, 트라이그램(trigram) "abc"에 있어서, n-그램 확률은 이전 2 개의 문자가 "ab"라는 가정하에 문자 "c"의 조건부 확률을 나타낼 수 있다. 예시적인 실시예에서, n-그램 빈도 스코어는 단어와 관련된 n-그램의 n-그램 확률의 로그의 누적을 나타낼 수 있다. 본 명세서의 설명은 단어 레벨 분석에 기초하여 제공되었지만, 분석이 음절, 구, 문장 등의 레벨에 기초하여 임의의 문자에 대해 수행될 수 있음도 알아야 한다. 이와 달리, n-그램 빈도 구성요소(94)는 입력 텍스트(82)의 각 단어(또는 음절, 구, 문장 등)의 n-그램 빈도 스코어를 조합함으로써 누적 n-그램 빈도 스코어를 결정하도록 구성될 수 있다.
예시적인 실시예에서, 각 모델은 복수의 언어마다의 통계치를 수집함으로써 생성될 수 있다. 복수의 언어의 개수에 대해 어떠한 한계도 존재하지 않을 수 있다. 이와 같이, 복수의 언어를 구성하는 언어의 선택은 임의의 바람직한 요인에 기초하여 이루어질 수 있다. 각 모델은 복수의 언어 중 한 언어에 대응하고, 각 모델과 관련된 언어에 관하여 수집된 트레이닝 데이터에 기초하여 생성된다. 각 모델은 대응하는 모델과 관련된 언어에 대한 n-그램 빈도 및/또는 대응하는 n-그램 확률을 포함하는 파일로서 구현될 수 있다. 예시적인 실시예에서, 트레이닝 데이터의 각 단어는 시작 및 끝 문자에 할당될 수 있다. 이점에 있어서, 시작 문자(예컨대, [)는 각 단어보다 앞설 수 있고, 끝 문자(예컨대, ])는 각 단어의 다음에 올 수 있으며, 그 결과 시작 n-그램(예컨대, 시작 문자 바로 뒤에 오는 n-그램), 끝 n-그램(예컨대, 끝 문자 바로 앞에 있는 n-그램) 및 내부 n-그램(예컨대, 시작 문자 또는 끝 문자에 바로 가깝지 않은 그램)이 구별될 수 있다.
예시적인 실시예에서, 언어의 알파벳은 문자 또는 글자의 리스트로서 또는 알파벳이 점유하는 유니코드 범위로서 또는 양자 모두로서 설명될 수 있다. 따라서, 큰 알파벳(예컨대, Mandarin)은 콤팩트한 기계 판독가능 형태로 다른 알파벳과 함께 설명될 수 있다. 일 실시예에 따르면, 각 모델은 알파벳의 각 글자에 고유 인덱스를 할당하는 알파벳 기술 정보로 구성될 수 있다. n-그램 빈도 데이터는 인덱스로 표현될 수 있다. 따라서 n-그램 빈도 데이터는 모델의 파일 크기를 감소시키도록 간결한 방법으로 표현될 수 있다.
복수의 언어에 대응하는 모델 파일 각각을 이용하면, 모델 파일을 단일 2진 파일로 조합함으로써 LID 구성요소(72)와 관련된 패키지가 생성될 수 있다. 따라서 패키지는 단일 2진 파일에 어떤 모델이 포함되는지에 기초하여 지원된 언어를 정의할 수 있다(즉, 2진 파일의 모델은 어떤 특정 언어가 지원되는 지에 대응한다). 예시적인 일 실시예에서, 2진 파일의 크기를 감소시키기 위해, n-그램 빈도 데이터는 트리 구조에 저장될 수 있다. 트리 구조는, 노드가 너비 우선(breath-first) 순회 순서로 순차적으로 저장되므로 빠른 트리 파싱(parsing)을 가능하게 할 수 있다.
패키지 순서화 구성요소(96)는 조합 스코어 및/또는 누적 조합 스코어가 최상의 언어 결정에 관해서 명확한 결과를 제공하지 않는 경우에 최상의 언어 결정을 수행하도록 구성될 수 있다. 패키지 순서화 구성요소(96)는 최상의 언어 결정 시에 언어들 사이의 균형을 깨는 사전정의된 언어 선호 정보를 가질 수 있는 하드웨어, 소프트웨어, 또는 하드웨어와 소프트웨어의 조합으로 구현된 임의의 장치 또는 수단일 수 있다. 이점에 있어서, 전술한 바와 같이, 패키지는 지원된 언어를 정의할 수 있다. 따라서 패키지 순서화 구성요소(96)는 패키지를 저장할 수 있고/있거나 패키지에 의해 지원된 언어의 선호 또는 순서화에 관련된 정보를 저장할 수 있 다. 이점에 있어서, 선호 정보는 지리적 정보(예컨대, 보통 특정 지리적 위치에서 만난 언어) 또는 임의의 다른 적합한 정보에 기초하여 결정될 수 있다. 어떤 경우에 패키지 순서화 구성요소(96)는 단어 또는 입력 텍스트(82)가 실패한 알파벳 스코어링을 가지거나 n-그램 빈도 스코어를 생성할 수 없는 경우에만 이용될 수 있으므로, 이러한 결과를 생성할 것 같은 언어에 관한 정보 및 이러한 언어와 만날 빈도는 선호 정보를 결정할 때 이용될 수 있다.
동작 동안에, 엔트리(예컨대, 음절, 단어, 구, 문장 등)가 분석될 때, 엔트리는 알파벳 스코어링 구성요소(92)에서 스코어링된 알파벳일 수 있다. 이점에 있어서, 일 실시예에서, 엔트리는 현재 언어에 대한 알파벳의 인덱스의 어레이로 변환될 수 있다. 만일 엔트리가 그 언어에서 지원되지 않으면, 언어는 엔트리에 대한 알파벳 스코어링에 실패한다. 그 동안에, 언어의 문자와 상관하는 적어도 몇몇 문자를 가진 엔트리에 있어서, 알파벳 스코어는 언어에 할당된다. 언어마다 프로세스가 완료되고, 언어마다 알파벳 스코어가 할당된다. 실패 언어는 최저 통과 스코어보다 낮은 스코어로 주어지거나, 전술한 바와 같이 후보자로서 제거될 수 있다. 이어서 n-그램 빈도 구성요소(94)는 엔트리에 대한 n-그램 빈도 스코어를 계산할 수 있다. 엔트리는 각각 앞 및 뒤에 추가된 시작 및 끝 문자 인덱스를 가질 수 있다.
본 발명의 실시예는 다수의 방법으로 이용될 수 있다. 예컨대, 실시예는 주어진 단어, 이름 또는 엔트리에 대한 몇몇 후보 언어의 순서화 리스트를 생성하도록 이용될 수 있다. 따라서, 본 발명의 실시예는 정확한 언어에 대한 정밀한 정보 가 이용가능하지 않은 경우에 음성 인식에서 사용하기에 유용할 수 있다(예컨대, 스피커 독립 이름 다이얼링(speaker independent name dialing)). 실시예는 타깃 TTS 언어와 주어진 단어의 언어 사이에 스크립트 부정합이 관찰되는 경우에 TTS 합성에도 유용할 수 있다(예컨대, 중국어에서 영어로의 합성). 이와 같이, 언어 조합 또는 변환의 넓은 범위에 대해 언어 지원이 제공될 수 있다.
도 4는 본 발명의 예시적인 실시예에 따른 시스템, 방법 및 프로그램 제품의 순서도이다. 순서도의 각 블록 또는 단계 및 순서도 내의 블록의 조합이 다양한 수단, 예컨대, 하드웨어, 펌웨어 및/또는 하나 이상의 컴퓨터 프로그램 인스트럭션을 포함하는 소프트웨어에 의해 구현될 수 있음을 알아야 한다. 예컨대, 전술한 절차 중 하나 이상은 컴퓨터 프로그램 인스트럭션에 의해 실행될 수 있다. 이점에 있어서, 전술한 절차를 실행하는 컴퓨터 프로그램 인스트럭션은 이동 단말기의 메모리 장치에 의해 저장될 수 있고 이동 단말기 내의 내장형 프로세서에 의해 실행될 수 있다. 알게 되듯이, 임의의 이러한 컴퓨터 프로그램 인스트럭션은 컴퓨터 또는 다른 프로그램가능 장치(즉, 하드웨어)로 로딩되어 기계를 생성할 수 있으며, 그 결과 컴퓨터 또는 다른 프로그램가능 장치 상에서 실행하는 인스트럭션은 순서도 블록(들) 또는 단계(들) 내에 지정된 기능을 구현하는 수단을 생성한다. 이들 컴퓨터 프로그램 인스트럭션은 컴퓨터 또는 다른 프로그램가능 장치를 특정 방식으로 기능으로 지시할 수 있는 컴퓨터 판독가능 메모리에도 저장될 수 있으며, 그 결과 컴퓨터 판독가능 메모리에 저장된 인스트럭션은 순서도 블록(들) 또는 단계(들) 내에 지정된 기능을 구현하는 인스트럭션 수단을 포함하는 제조물을 생성할 수 있 다. 컴퓨터 프로그램 인스트럭션은 또한 컴퓨터 또는 다른 프로그램가능 장치로 로딩되어 컴퓨터 구현 프로세스를 생성하도록 일련의 동작 단계가 컴퓨터 또는 다른 프로그램가능 장치 상에서 수행되게 할 수 있으며, 그 결과 컴퓨터 또는 다른 프로그램가능 장치 상에서 실행하는 인스트럭션이 순서도 블록(들) 또는 단계(들) 내에 지정된 기능을 구현하는 단계를 제공한다.
따라서, 순서도의 블록 또는 단계는 지정된 기능을 수행하는 수단의 조합, 지정된 기능을 수행하는 단계의 조합 및 지정된 기능을 수행하는 프로그램 인스트럭션 수단을 지원한다. 또한 순서도의 하나 이상의 블록 또는 단계, 및 순서도 내의 블록 또는 단계의 조합이 지정된 기능 또는 단계를 수행하는 특정 용도의 하드웨어 기반 컴퓨터 시스템에 의해 또는 특정 용도의 하드웨어 및 컴퓨터 인스트럭션의 조합에 의해 구현될 수 있음을 알아야 한다.
이점에 있어서, 플렉시블 텍스트 기반 언어 식별을 제공하는 방법의 일 실시예는 동작(200)에서 컴퓨터 판독가능 텍스트 포맷으로 엔트리를 수신하는 단계를 포함할 수 있다. 동작(210)에서 엔트리의 알파벳 스코어가 계산되거나 결정될 수 있다. 동작(220)에서, 복수의 언어마다 엔트리의 n-그램 빈도 스코어가 계산되거나 결정될 수 있다. 방법은 동작(230)에서 알파벳 스코어와 n-그램 빈도 스코어의 조합에 기초하여 엔트리와 관련된 언어를 결정하는 단계도 포함할 수 있다.
전술한 기능은 다수의 방법으로 수행될 수 있다. 예컨대, 전술한 기능 각각을 수행하는 임의의 적합한 수단은 본 발명의 실시예를 수행하는 데 이용될 수 있다. 일 실시예에서, 본 발명의 구성요소의 전부 또는 일부는 일반적으로 컴퓨터 프로그램 제품의 제어 하에서 동작할 수 있다. 본 발명의 실시예의 방법을 수행하는 컴퓨터 프로그램 제품은 비휘발성 저장 매체와 같은 컴퓨터 판독가능 저장 매체 및 컴퓨터 판독가능 저장 매체 내에 구현된 일련의 컴퓨터 인스트럭션과 같은 컴퓨터 판독가능 프로그램 코드 부분을 포함한다.
전술한 기술 및 관련 도면에 나타난 교시의 이점을 가진 이들 발명이 속하는 당업자에게 본 명세서에 설명된 본 발명의 다수의 변경 및 다른 실시예가 발생할 것이다. 따라서, 본 발명의 실시예가 개시된 특정 실시예로 제한되지 않으며 변경 및 다른 실시예가 부가된 특허청구범위의 범주 내에 포함되도록 의도됨을 알아야 한다. 본 명세서에서 특정 용어가 이용되지만, 포괄적이고 기술적인 의미로만 사용되며 제한하기 위한 것은 아니다.

Claims (33)

  1. 컴퓨터 판독가능 텍스트 포맷으로 엔트리를 수신하는 단계와,
    복수의 언어 중 각각의 언어마다 상기 엔트리의 알파벳 스코어(alphabet score)를 결정하는 단계와,
    상기 복수의 언어 중 각각의 언어마다 상기 엔트리의 n-그램 빈도 스코어(n-gram frequency score)를 결정하는 단계와,
    상기 알파벳 스코어와 상기 n-그램 빈도 스코어의 조합에 기초하여 상기 엔트리와 관련된 언어를 결정하는 단계를 포함하는
    방법.
  2. 제 1 항에 있어서,
    상기 알파벳 스코어를 결정하는 단계는, 상기 엔트리와 관련된 문자를 상기 복수의 언어 각각의 알파벳과 비교하는 단계와 상기 복수의 언어 각각에 대한 스코어를 생성하는 단계를 포함하되,
    상기 복수의 언어 각각에 대한 스코어는 스코어링되는 복수의 언어 중 각각의 언어의 대응하는 알파벳으로 표현될 문자들 중 하나 이상의 실패에 적어도 일부분 기초하는
    방법.
  3. 제 1 항에 있어서,
    상기 n-그램 빈도 스코어를 결정하는 단계는, 상기 복수의 언어 중 각각의 언어마다, 상기 엔트리를 상기 복수의 언어 중 상기 언어에 대한 n-그램 통계치와 비교하는 단계를 포함하는
    방법.
  4. 제 3 항에 있어서,
    상기 엔트리는 n 개의 문자를 포함하고,
    상기 엔트리를 n-그램 통계치와 비교하는 단계는, n-1 개의 문자가 선행한다는 가정하에 상기 엔트리의 n 번째 문자의 조건부 확률을 결정하는 단계를 포함하는
    방법.
  5. 제 3 항에 있어서,
    상기 n-그램 통계치의 각각의 n-그램 확률과 관련된 대응하는 시작 문자 및 끝 문자와 상관하여 사용하기 위해, 상기 엔트리의 첫 번째 문자 및 마지막 문자에 시작 문자 및 끝 문자를 각각 할당하는 단계를 더 포함하는
    방법.
  6. 제 1 항에 있어서,
    상기 복수의 언어 중 각각의 언어마다 상기 알파벳 스코어를 임계치와 비교하는 단계를 더 포함하는
    방법.
  7. 제 6 항에 있어서,
    상기 n-그램 빈도 스코어를 결정하는 단계는 상기 알파벳 스코어가 상기 임계치를 만족시키는 상기 복수의 언어 중 몇몇 언어에 대해서만 수행되는
    방법.
  8. 제 6 항에 있어서,
    상기 알파벳 스코어가 상기 임계치를 만족시키지 못함에 응답하여 상기 엔트리를 사전결정된 알파벳 스코어에 할당하는 단계를 더 포함하는
    방법.
  9. 제 1 항에 있어서,
    상기 엔트리와 관련된 언어를 결정하는 단계는, 상기 엔트리와 관련된 언어에 관하여 불확정한 결과를 제공하면 상기 알파벳 스코어와 상기 n-그램 빈도 스코어의 조합에 응답하여 언어의 사전정의된 순서에 기초해서 상기 엔트리와 관련된 언어를 선택하는 단계를 포함하는
    방법.
  10. 제 1 항에 있어서,
    상기 엔트리는 입력 텍스트를 포함하는 복수의 세그먼트 중 하나이고,
    상기 언어를 결정하는 단계는, 상기 복수의 세그먼트 중 각각의 세그먼트의 알파벳 스코어와 n-그램 빈도 스코어의 누적 조합에 기초하여 상기 입력 텍스트와 관련된 언어를 결정하는 단계를 더 포함하는
    방법.
  11. 컴퓨터 판독가능 프로그램 코드 부분이 저장된 적어도 하나의 컴퓨터 판독가능 저장 매체를 포함하는 컴퓨터 프로그램 제품에 있어서,
    상기 컴퓨터 판독가능 프로그램 코드 부분은,
    컴퓨터 판독가능 텍스트 포맷으로 엔트리를 수신하는 제 1 실행가능 부분과,
    복수의 언어 중 각각의 언어마다 상기 엔트리의 알파벳 스코어를 결정하는 제 2 실행가능 부분과,
    상기 복수의 언어 중 각각의 언어마다 상기 엔트리의 n-그램 빈도 스코어를 결정하는 제 3 실행가능 부분과,
    상기 알파벳 스코어와 상기 n-그램 빈도 스코어의 조합에 기초하여 상기 엔트리와 관련된 언어를 결정하는 제 4 실행가능 부분을 포함하는
    컴퓨터 프로그램 제품.
  12. 제 11 항에 있어서,
    상기 제 2 실행가능 부분은 상기 엔트리와 관련된 문자를 상기 복수의 언어 각각의 알파벳과 비교하는 단계와 상기 복수의 언어 각각에 대한 스코어를 생성하는 인스트럭션을 포함하되,
    상기 복수의 언어 각각에 대한 스코어는 스코어링되는 복수의 언어 중 각각의 언어의 대응하는 알파벳으로 표현될 문자들 중 하나 이상의 실패에 적어도 일부분 기초하는
    컴퓨터 프로그램 제품.
  13. 제 11 항에 있어서,
    상기 제 3 실행가능 부분은 상기 복수의 언어 중 각각의 언어마다 상기 엔트리를 상기 복수의 언어 중 상기 언어에 대한 n-그램 통계치와 비교하는 인스트럭션을 포함하는
    컴퓨터 프로그램 제품.
  14. 제 13 항에 있어서,
    상기 엔트리는 n 개의 문자를 포함하고,
    상기 제 3 실행가능 부분은, n-1 개의 문자가 선행한다는 가정하에 상기 엔트리의 n 번째 문자의 조건부 확률을 결정하는 인스트럭션을 더 포함하는
    컴퓨터 프로그램 제품.
  15. 제 13 항에 있어서,
    상기 n-그램 통계치의 각각의 n-그램 확률과 관련된 대응하는 시작 문자 및 끝 문자와 상관하여 사용하기 위해, 상기 엔트리의 첫 번째 문자 및 마지막 문자에 시작 문자 및 끝 문자를 각각 할당하는 제 5 실행가능 부분을 더 포함하는
    컴퓨터 프로그램 제품.
  16. 제 11 항에 있어서,
    상기 복수의 언어 중 각각의 언어마다 상기 알파벳 스코어를 임계치와 비교하는 제 5 실행가능 부분을 더 포함하는
    컴퓨터 프로그램 제품.
  17. 제 16 항에 있어서,
    상기 제 3 실행가능 부분은 상기 알파벳 스코어가 상기 임계치를 만족시키는 상기 복수의 언어 중 몇몇 언어에 대해서만 실행되는
    컴퓨터 프로그램 제품.
  18. 제 16 항에 있어서,
    상기 알파벳 스코어가 상기 임계치를 만족시키지 못함에 응답하여 상기 엔트리를 사전결정된 알파벳 스코어에 할당하는 제 6 실행가능 부분을 더 포함하는
    컴퓨터 프로그램 제품.
  19. 제 11 항에 있어서,
    상기 제 4 실행가능 부분은, 상기 엔트리와 관련된 언어에 관하여 불확정한 결과를 제공하면 상기 알파벳 스코어와 상기 n-그램 빈도 스코어의 조합에 응답하여 언어의 사전정의된 순서에 기초해서 상기 엔트리와 관련된 언어를 선택하는 인스트럭션을 포함하는
    컴퓨터 프로그램 제품.
  20. 제 11 항에 있어서,
    상기 엔트리는 입력 텍스트를 포함하는 복수의 세그먼트 중 하나이고,
    상기 제 4 실행가능 부분은 상기 복수의 세그먼트 중 각각의 세그먼트의 알파벳 스코어와 n-그램 빈도 스코어의 누적 조합에 기초하여 상기 입력 텍스트와 관련된 언어를 결정하는 인스트럭션을 포함하는
    컴퓨터 프로그램 제품.
  21. 컴퓨터 판독가능 텍스트 포맷으로 엔트리를 수신하고 복수의 언어 중 각각의 언어마다 상기 엔트리의 알파벳 스코어를 계산하도록 구성된 알파벳 스코어링 구성요소와,
    상기 복수의 언어 중 각각의 언어마다 상기 엔트리의 n-그램 빈도 스코어를 계산하도록 구성된 n-그램 빈도 구성요소와,
    상기 n-그램 빈도 구성요소 및 상기 알파벳 스코어링 구성요소와 통신하는 처리 구성요소를 포함하되,
    상기 처리 구성요소는 상기 알파벳 스코어와 상기 n-그램 빈도 스코어의 조합에 기초하여 상기 엔트리와 관련된 언어를 결정하도록 구성되는
    장치.
  22. 제 21 항에 있어서,
    상기 알파벳 스코어링 구성요소는 또한, 상기 엔트리를 상기 복수의 언어 각각의 알파벳과 비교하고 상기 복수의 언어 각각에 대한 스코어를 생성하도록 구성되되,
    상기 복수의 언어 각각에 대한 스코어는 스코어링되는 복수의 언어 중 각각의 언어의 대응하는 알파벳으로 표현될 문자들 중 하나 이상의 실패에 적어도 일부분 기초하는
    장치.
  23. 제 21 항에 있어서,
    상기 n-그램 빈도 구성요소는 또한, 상기 복수의 언어 중 각각의 언어마다, 상기 엔트리를 상기 복수의 언어 중 상기 언어에 대한 n-그램 통계치와 비교하도록 구성되는
    장치.
  24. 제 23 항에 있어서,
    상기 엔트리는 n 개의 문자를 포함하고,
    상기 n-그램 빈도 구성요소는 또한, n-1 개의 문자가 선행한다는 가정하에 상기 엔트리의 n 번째 문자의 조건부 확률을 결정하도록 구성되는
    장치.
  25. 제 23 항에 있어서,
    상기 n-그램 빈도 구성요소는 또한, 상기 n-그램 통계치의 각각의 n-그램 확률과 관련된 대응하는 시작 문자 및 끝 문자와 상관하여 사용하기 위해, 상기 엔트리의 첫 번째 문자 및 마지막 문자에 시작 문자 및 끝 문자를 각각 할당하도록 구성되는
    장치.
  26. 제 21 항에 있어서,
    상기 알파벳 스코어링 구성요소는 또한, 상기 복수의 언어 중 각각의 언어마다 상기 알파벳 스코어를 임계치와 비교하도록 구성되는
    장치.
  27. 제 26 항에 있어서,
    상기 n-그램 빈도 구성요소는 또한, 상기 알파벳 스코어가 상기 임계치를 만족시키는 상기 복수의 언어 중 몇몇 언어에 대해서만 상기 n-그램 빈도 스코어를 계산하도록 구성되는
    장치.
  28. 제 26 항에 있어서,
    상기 n-그램 빈도 구성요소는 또한, 상기 알파벳 스코어가 상기 임계치를 만족시키지 못함에 응답하여 상기 엔트리를 사전결정된 알파벳 스코어에 할당하도록 구성되는
    장치.
  29. 제 21 항에 있어서,
    상기 엔트리와 관련된 언어에 관하여 불확정한 결과를 제공하면 상기 알파벳 스코어와 상기 n-그램 빈도 스코어의 조합에 응답하여 언어의 사전정의된 순서에 기초해서 상기 엔트리와 관련된 언어를 선택하도록 구성된 패키지 순서화 구성요소를 더 포함하는
    장치.
  30. 제 21 항에 있어서,
    상기 엔트리는 입력 텍스트를 포함하는 복수의 세그먼트 중 하나이고,
    상기 처리 구성요소는 또한, 상기 복수의 세그먼트 중 각각의 세그먼트의 알파벳 스코어와 n-그램 빈도 스코어의 누적 조합에 기초하여 상기 입력 텍스트와 관련된 언어를 결정하도록 구성되는
    장치.
  31. 제 21 항에 있어서,
    상기 장치는 이동 단말기로서 구현되는
    장치.
  32. 컴퓨터 판독가능 텍스트 포맷으로 엔트리를 수신하는 수단과,
    복수의 언어 중 각각의 언어마다 상기 엔트리의 알파벳 스코어를 결정하는 수단과,
    상기 복수의 언어 중 각각의 언어마다 상기 엔트리의 n-그램 빈도 스코어를 결정하는 수단과,
    상기 알파벳 스코어와 상기 n-그램 빈도 스코어의 조합에 기초하여 상기 엔트리와 관련된 언어를 결정하는 수단을 포함하는
    장치.
  33. 제 32 항에 있어서,
    상기 엔트리와 관련된 언어에 관하여 불확정한 결과를 제공하면 상기 알파벳 스코어와 상기 n-그램 빈도 스코어의 조합에 응답하여 언어의 사전정의된 순서에 기초해서 상기 엔트리와 관련된 언어를 선택하는 수단을 더 포함하는
    장치.
KR1020097014832A 2006-12-18 2007-12-12 플렉시블 텍스트 기반 언어 식별을 제공하는 방법, 장치 및 컴퓨터 판독가능 저장 매체 KR20090099069A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/611,964 US7552045B2 (en) 2006-12-18 2006-12-18 Method, apparatus and computer program product for providing flexible text based language identification
US11/611,964 2006-12-18

Publications (1)

Publication Number Publication Date
KR20090099069A true KR20090099069A (ko) 2009-09-21

Family

ID=39528593

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020097014832A KR20090099069A (ko) 2006-12-18 2007-12-12 플렉시블 텍스트 기반 언어 식별을 제공하는 방법, 장치 및 컴퓨터 판독가능 저장 매체

Country Status (6)

Country Link
US (1) US7552045B2 (ko)
EP (1) EP2095266A2 (ko)
KR (1) KR20090099069A (ko)
CN (1) CN101563683A (ko)
RU (1) RU2009127102A (ko)
WO (1) WO2008075161A2 (ko)

Families Citing this family (209)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US8185376B2 (en) * 2006-03-20 2012-05-22 Microsoft Corporation Identifying language origin of words
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
ITFI20070177A1 (it) * 2007-07-26 2009-01-27 Riccardo Vieri Sistema per la creazione e impostazione di una campagna pubblicitaria derivante dall'inserimento di messaggi pubblicitari all'interno di uno scambio di messaggi e metodo per il suo funzionamento.
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US8266514B2 (en) * 2008-06-26 2012-09-11 Microsoft Corporation Map service
US8107671B2 (en) * 2008-06-26 2012-01-31 Microsoft Corporation Script detection service
US8019596B2 (en) * 2008-06-26 2011-09-13 Microsoft Corporation Linguistic service platform
US8073680B2 (en) 2008-06-26 2011-12-06 Microsoft Corporation Language detection service
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8583418B2 (en) * 2008-09-29 2013-11-12 Apple Inc. Systems and methods of detecting language and natural language strings for text to speech synthesis
US8712776B2 (en) 2008-09-29 2014-04-29 Apple Inc. Systems and methods for selective text to speech synthesis
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US8224641B2 (en) * 2008-11-19 2012-07-17 Stratify, Inc. Language identification for documents containing multiple languages
US8224642B2 (en) * 2008-11-20 2012-07-17 Stratify, Inc. Automated identification of documents as not belonging to any language
WO2010067118A1 (en) 2008-12-11 2010-06-17 Novauris Technologies Limited Speech recognition involving a mobile device
US8380507B2 (en) 2009-03-09 2013-02-19 Apple Inc. Systems and methods for determining the language to use for speech generated by a text to speech engine
US8326602B2 (en) * 2009-06-05 2012-12-04 Google Inc. Detecting writing systems and languages
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US8468011B1 (en) * 2009-06-05 2013-06-18 Google Inc. Detecting writing systems and languages
US20120309363A1 (en) 2011-06-03 2012-12-06 Apple Inc. Triggering notifications associated with tasks items that represent tasks to perform
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US8190420B2 (en) * 2009-08-04 2012-05-29 Autonomy Corporation Ltd. Automatic spoken language identification based on phoneme sequence patterns
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
DE202011111062U1 (de) 2010-01-25 2019-02-19 Newvaluexchange Ltd. Vorrichtung und System für eine Digitalkonversationsmanagementplattform
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US9177333B2 (en) 2010-06-17 2015-11-03 Microsoft Technology Licensing, Llc Ad copy quality detection and scoring
US8442827B2 (en) * 2010-06-18 2013-05-14 At&T Intellectual Property I, L.P. System and method for customized voice response
CN101894548B (zh) * 2010-06-23 2012-07-04 清华大学 一种用于语种识别的建模方法及装置
US20120035905A1 (en) * 2010-08-09 2012-02-09 Xerox Corporation System and method for handling multiple languages in text
US8375035B2 (en) * 2010-08-17 2013-02-12 Oracle International Corporation Visual aid to assist making purchase by tracking key product characteristics
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US9535895B2 (en) * 2011-03-17 2017-01-03 Amazon Technologies, Inc. n-Gram-based language prediction
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US9164983B2 (en) 2011-05-27 2015-10-20 Robert Bosch Gmbh Broad-coverage normalization system for social media language
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
RU2500024C2 (ru) * 2011-12-27 2013-11-27 Общество С Ограниченной Ответственностью "Центр Инноваций Натальи Касперской" Способ автоматизированного определения языка и (или) кодировки текстового документа
CN103186522B (zh) * 2011-12-29 2018-01-26 富泰华工业(深圳)有限公司 电子设备及其自然语言分析方法
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
CN113470640B (zh) 2013-02-07 2022-04-26 苹果公司 数字助理的语音触发器
US9031829B2 (en) 2013-02-08 2015-05-12 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
US9298703B2 (en) 2013-02-08 2016-03-29 Machine Zone, Inc. Systems and methods for incentivizing user feedback for translation processing
US8996352B2 (en) 2013-02-08 2015-03-31 Machine Zone, Inc. Systems and methods for correcting translations in multi-user multi-lingual communications
US10650103B2 (en) 2013-02-08 2020-05-12 Mz Ip Holdings, Llc Systems and methods for incentivizing user feedback for translation processing
US9600473B2 (en) 2013-02-08 2017-03-21 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
US9977766B2 (en) * 2013-02-21 2018-05-22 Red Hat, Inc. Keyboard input corresponding to multiple languages
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
WO2014144949A2 (en) 2013-03-15 2014-09-18 Apple Inc. Training an at least partial voice command system
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
WO2014200728A1 (en) 2013-06-09 2014-12-18 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
AU2014278595B2 (en) 2013-06-13 2017-04-06 Apple Inc. System and method for emergency calls initiated by voice command
WO2015020942A1 (en) 2013-08-06 2015-02-12 Apple Inc. Auto-activating smart responses based on activities from remote devices
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
US20150178289A1 (en) * 2013-12-20 2015-06-25 Google Inc. Identifying Semantically-Meaningful Text Selections
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
EP3480811A1 (en) 2014-05-30 2019-05-08 Apple Inc. Multi-command single utterance input method
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9606986B2 (en) 2014-09-29 2017-03-28 Apple Inc. Integrated word N-gram and class M-gram language models
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
AU2014409115A1 (en) * 2014-10-17 2017-04-27 Mz Ip Holdings, Llc System and method for language detection
US10162811B2 (en) 2014-10-17 2018-12-25 Mz Ip Holdings, Llc Systems and methods for language detection
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10765956B2 (en) 2016-01-07 2020-09-08 Machine Zone Inc. Named entity recognition on chat data
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
AU2017339433A1 (en) * 2016-10-03 2019-05-02 Mz Ip Holdings, Llc Systems and methods for language detection
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770428A1 (en) 2017-05-12 2019-02-18 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US20180336275A1 (en) 2017-05-16 2018-11-22 Apple Inc. Intelligent automated assistant for media exploration
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
CN109145145A (zh) 2017-06-16 2019-01-04 阿里巴巴集团控股有限公司 一种数据更新方法、客户端及电子设备
US10769387B2 (en) 2017-09-21 2020-09-08 Mz Ip Holdings, Llc System and method for translating chat messages
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
US10944859B2 (en) 2018-06-03 2021-03-09 Apple Inc. Accelerated task performance
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
CN109376355B (zh) * 2018-10-08 2023-07-04 上海一起作业信息科技有限公司 英文单词和语句筛选方法、装置、存储介质及电子设备
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
CN110491375B (zh) * 2019-08-22 2022-02-01 新疆科大讯飞信息科技有限责任公司 一种目标语种检测的方法和装置
WO2021056255A1 (en) 2019-09-25 2021-04-01 Apple Inc. Text detection using global geometry estimators

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5062143A (en) 1990-02-23 1991-10-29 Harris Corporation Trigram-based method of language identification
US6415250B1 (en) 1997-06-18 2002-07-02 Novell, Inc. System and method for identifying language using morphologically-based techniques
US6272456B1 (en) * 1998-03-19 2001-08-07 Microsoft Corporation System and method for identifying the language of written text having a plurality of different length n-gram profiles
US6292772B1 (en) 1998-12-01 2001-09-18 Justsystem Corporation Method for identifying the language of individual words
US6167369A (en) * 1998-12-23 2000-12-26 Xerox Company Automatic language identification using both N-gram and word information
FI20010644A (fi) * 2001-03-28 2002-09-29 Nokia Corp Merkkisekvenssin kielen määrittäminen
US20040205675A1 (en) * 2002-01-11 2004-10-14 Thangaraj Veerappan System and method for determining a document language and refining the character set encoding based on the document language
US20040078191A1 (en) 2002-10-22 2004-04-22 Nokia Corporation Scalable neural network-based language identification from written text
FR2848688A1 (fr) 2002-12-17 2004-06-18 France Telecom Identification de langue d'un texte
EP1612695A1 (en) 2004-07-01 2006-01-04 Alcatel Method of language identification and language identifying module using short word lists and n-grams
US7865355B2 (en) * 2004-07-30 2011-01-04 Sap Aktiengesellschaft Fast text character set recognition
US8027832B2 (en) * 2005-02-11 2011-09-27 Microsoft Corporation Efficient language identification
GB0507036D0 (en) * 2005-04-07 2005-05-11 Ibm Method and system for language identification
US8185376B2 (en) * 2006-03-20 2012-05-22 Microsoft Corporation Identifying language origin of words

Also Published As

Publication number Publication date
CN101563683A (zh) 2009-10-21
RU2009127102A (ru) 2011-01-27
EP2095266A2 (en) 2009-09-02
WO2008075161A2 (en) 2008-06-26
US7552045B2 (en) 2009-06-23
WO2008075161A3 (en) 2008-11-13
US20080147380A1 (en) 2008-06-19

Similar Documents

Publication Publication Date Title
KR20090099069A (ko) 플렉시블 텍스트 기반 언어 식별을 제공하는 방법, 장치 및 컴퓨터 판독가능 저장 매체
US10210154B2 (en) Input method editor having a secondary language mode
CN101542590A (zh) 提供基于语言的交互式多媒体系统的方法、装置和计算机程序产品
US8862478B2 (en) Speech translation system, first terminal apparatus, speech recognition server, translation server, and speech synthesis server
US9779080B2 (en) Text auto-correction via N-grams
US20080154600A1 (en) System, Method, Apparatus and Computer Program Product for Providing Dynamic Vocabulary Prediction for Speech Recognition
US8275618B2 (en) Mobile dictation correction user interface
US8423351B2 (en) Speech correction for typed input
JP5706384B2 (ja) 音声認識装置、音声認識システム、音声認識方法および音声認識プログラム
JP6327848B2 (ja) コミュニケーション支援装置、コミュニケーション支援方法およびプログラム
US20090326945A1 (en) Methods, apparatuses, and computer program products for providing a mixed language entry speech dictation system
US20060106604A1 (en) Speech recognition dictionary creation device and speech recognition device
US8131550B2 (en) Method, apparatus and computer program product for providing improved voice conversion
US20120221321A1 (en) Speech translation system, control device, and control method
CN105117391A (zh) 翻译语言
CN101681365A (zh) 用于分布式语音搜索的方法和装置
CN112580335B (zh) 多音字消歧方法及装置
JPWO2012043168A1 (ja) 音声変換装置、携帯電話端末、音声変換方法およびプログラム
CN109326284B (zh) 语音搜索的方法、装置和存储介质
CN113225612B (zh) 字幕生成方法、装置、计算机可读存储介质及电子设备
CN105632500B (zh) 语音识别装置及其控制方法
JP5704686B2 (ja) 音声翻訳システム、音声翻訳装置、音声翻訳方法、およびプログラム
KR100724848B1 (ko) 휴대 단말에서 입력 문자 실시간 낭독방법
JP2015143866A (ja) 音声認識装置、音声認識システム、音声認識方法および音声認識プログラム
JP2007280137A (ja) 音声自動翻訳装置、音声自動翻訳方法、音声自動翻訳プログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application