KR20010100883A - 제한된 처리 능력을 갖는 장치들에 대체 입력 장치로서연속 스피치 인식을 제공하는 방법, 장치 및 제조품 - Google Patents
제한된 처리 능력을 갖는 장치들에 대체 입력 장치로서연속 스피치 인식을 제공하는 방법, 장치 및 제조품 Download PDFInfo
- Publication number
- KR20010100883A KR20010100883A KR1020010019131A KR20010019131A KR20010100883A KR 20010100883 A KR20010100883 A KR 20010100883A KR 1020010019131 A KR1020010019131 A KR 1020010019131A KR 20010019131 A KR20010019131 A KR 20010019131A KR 20010100883 A KR20010100883 A KR 20010100883A
- Authority
- KR
- South Korea
- Prior art keywords
- text
- translated text
- data
- instructions
- program
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 24
- 238000012545 processing Methods 0.000 title claims description 9
- 238000004519 manufacturing process Methods 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 10
- 238000013479 data entry Methods 0.000 abstract 1
- 229920001690 polydopamine Polymers 0.000 description 8
- 230000001413 cellular effect Effects 0.000 description 7
- 238000001914 filtration Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000015654 memory Effects 0.000 description 4
- 241001422033 Thestylus Species 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000000969 carrier Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 210000000707 wrist Anatomy 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
- Telephonic Communication Services (AREA)
- Information Transfer Between Computers (AREA)
- Communication Control (AREA)
Abstract
장치에서의 데이터 입력 기법이 제공된다. 초기에, 음성 데이터가 장치에 수신된다. 음성 데이터 및 장치 식별자는 컴퓨터에 전송된다. 컴퓨터에서, 음성 데이터는 텍스트로 번역된다. 다음에, 번역된 텍스트를 필터링할 지를 판단한다. 번역된 텍스트가 필터링될 것으로 판단되면, 번역된 텍스트에 필터가 적용된다.
Description
본원 발명은 일반적으로 컴퓨터 구현 시스템에 관한 것으로, 더욱 구체적으로는 개인용 디지털 어시스턴트(Personal Digital Assiatant:PDA)와 같이 제한된 처리능력을 갖는 장치에 대한 대체 입력 장치로서 연속적인 스피치 인식을 제공할 수 있는 컴퓨터 구현 시스템에 관한 것이다.
PDA는 계산처리와, 전화 및/또는 네트워크 접속과 같은 다른 특징을 결합시킨 휴대용 장치이다. 많은 PDA들이 개인 관리기로 이용되고 있으며, 달력, 전자메일 시스템 및 워드 프로세서를 포함하고 있다. 일반적으로, PDA로의 입력은 키보드 또는 마우스를 이용하기보다는 스틸러스(stylus)를 이용한다. 스틸러스는 디지털 타블렛(digital tablet)과 같은 스크린 상에 데이터를 기록하는데 이용되는 "펜-유사" 객체이다. 스틸러스는 디지털 타블렛을 터치하는데 쓰이는 전자 헤드를 갖고 있으며, 디지털 타블렛은 전자를 포함하고 있어서 스틸러스의 움직임을 감지하고 움직임을 컴퓨터용 디지털 신호로 변환한다.
몇몇 PDA는 "수기(handwriting) 인식" 특징을 포함하여서 사용자가 스틸러스를 이용하여 스크린에 데이터를 수기하는 것을 가능하게 해준다 그러나, 종래의 수기 인식 시스템은 수기록된 데이터를 때때로 잘못 번역하기 때문에, 사용자가 기록된 데이터를 주의 깊게 재검토하고 정정하여야 한다.
PDA는 다양한 범위의 사람들에게 점점 인기를 얻고 있으며 점차 많이 이용되고 있다. 그러나, 불행하게도, 이러한 작은 장치들은 제한된 메모리와 작은 디스플레이를 갖고 있으며, 동작 속도도 느리다. 또한, 데이터를 입력하기 위해 스틸러스를 사용하는 것은 어떠한 경우에는 장애인들이 PDA를 이용하지 못하게 하는 이유가 될 수 있다.
따라서, 제한된 리소스를 갖는 장치에 데이터를 입력하기 위한 보다 향상된 기술이 필요하게된 것이다.
전술한 종래 기술의 한계점을 극복하는 것과 함께, 이하의 설명을 읽고 이해하면 명백해질 그밖의 다른 한계점들을 극복하기 위해, 본원 발명은 PDA와 같은 제한된 처리능력을 갖는 장치에 대한 대체 입력 장치로서 연속적인 스피치 인식을 제공하는 방법, 장치, 및 제조품을 개시한다.
도 1은 본원 발명의 실시예의 하드웨어 환경을 도시한 개략도.
도 2는 본원 발명의 한 실시예의 CSR 시스템(212)과 그 환경을 도시한 개략도.
도 3은 본원 발명의 한 실시예에서 CSR 시스템(212)에 의해 수행되는 프로세스를 도시한 흐름도.
본원 발명의 실시예에 따르면, 장치에서 데이터를 입력하는 기법이 제공된다. 초기에, 음성 데이터가 장치에 수신된다. 음성 데이터 및 장치 식별자는 컴퓨터에 전송된다. 컴퓨터에서, 음성 데이터는 텍스트로 번역된다. 다음에, 번역된 텍스트를 필터링할 지를 결정한다. 번역된 텍스트를 필터링하는 것으로 결정되면, 번역된 텍스트에 필터가 적용된다.
본원 발명의 실시예에 대한 이하의 설명에서, 첨부 도면에 대한 참조가 이루어지고, 도면에는 본원 발명이 실시될 수 있는 특정 실시예를 예시하는 것으로서 도시되어 있다. 물론 다른 실시예도 이용될 수 있으며, 본원 발명의 범위를 벗어나지 않은 범위에서 구조적 변경이 이루어질 수 있음을 이해할 것이다.
하드웨어 구조
도 1은 본원 발명의 실시예의 하드웨어 환경을 도시한 개략도로서, 더욱 구체적으로는 네트워크(100)를 이용하는 전형적인 분산 컴퓨터 시스템을 도시하고 있으며, 네트워크(100)는 음성 데이터 입력 장치(102)("클라이언트")를 컴퓨터 프로그램을 실행시키는 서버 컴퓨터(104)에 접속시키고, 서버 시스템(104)을 데이터 소스(106)에 접속시킨다. 데이터 소스(106)는, 예를 들어, 음성 프린트(voice print) 레코드를 포함하는 사용자 프로파일을 저장한다. 리소스의 전형적인 조합은 음성 데이터 입력 장치(102)를 포함하며, 예를 들어, 개인용 컴퓨터 또는, 워크스테이션, 전화 또는 셀룰러 폰, 또는 PDA가 될 수 있다. 서버 컴퓨터(104)는, 예를 들어, 개인용 컴퓨터 워크스테이션, 미니컴퓨터, 또는 메인프레임이 될 수 있다. 이들 시스템은 다양한 네트워크(LAN, WAN, SNA 네트워크 및 인터넷 포함)를 통해 서로 연결될 수 있다. 몇몇 음성 데이터 입력 장치(102)(예를 들어, 개인용 컴퓨터 또는 PDA)와 서버 컴퓨터(104)는 부가적으로 운영체제와 하나 이상의 컴퓨터 프로그램을 포함한다.
서버 소프트웨어는 연속 스피치 인식(Continuous Speech Recognition:CSR) 시스템(110)을 포함하며, 이는 음성을 텍스트로 변환하고, 텍스트를 필터링하고, 텍스트를 적절한 포맷을 변환해주기 위한 하나 이상의 컴퓨터 프로그램을 포함한다. 서버 컴퓨터(104)는 또한 데이터 소스 인터페이스를 이용하고, 가능하게는, 데이터 소스(106)를 접속시키기 위한 다른 컴퓨터 프로그램을 포함한다. 음성 데이터 입력 장치(102)는 유선 또는 무선 시스템을 통해 서버 컴퓨터(104)에 양방향으로 연결된다. 그리고, 서버 컴퓨터(104)는 데이터 소스(106)와 양방향으로 연결된다.
운영 체제 및 컴퓨터 프로그램은, 음성 데이터 입력 장치(102) 및 서버 컴퓨터(104)에 의해 판독되고 실행될 때, 장치 및 서버 컴퓨터가 본원 발명을 실시하고/실시하거나 이용하는데 필요한 단계들을 수행하는 명령들을 포함한다. 일반적으로, 운영 체제 및 컴퓨터 프로그램은, 장치, 반송파, 또는 메모리와 같은 매체, 그밖의 데이터 저장소 및/또는 데이터 통신 장치에 실체적으로 구현되고/구현되거나 이들로부터 판독가능하다. 운영체제의 제어하에, 컴퓨터 프로그램들은, 실제 동작동안, 메모리, 그밖의 다른 저장장치 및/또는 데이터 통신장치로부터 컴퓨터의 메모리로 로딩된다.
따라서, 본원 발명은 표준 프로그래밍 및/또는 엔지니어링 기법을 이용하여 방법, 장치, 또는 제조품으로 구현되어, 소프트웨어, 펌웨어, 하드웨어 또는 기타 결합을 산출한다. 용어 "제조품"(또는 대안적으로, "컴퓨터 프로그램 제품")은 본 명세서에서 임의의 컴퓨터-판독가능 장치, 반송파, 또는 매체로부터 액세스 가능한 컴퓨터 프로그램을 포함하는 것으로 해석된다. 물론, 본 기술 분야의 당업자들은 본원 발명의 범주를 벗어남없이 다양한 변형이 본 구성에 이루어질 수 있음을 인식할 것이다.
본 기술 분야의 당업자라면 도 1에 예시된 예시적 구성은 본원 발명을 한정하려는 것은 아님을 이해할 수 있을 것이다. 다른 대안적인 하드웨어 구성도 본원발명의 범주를 벗어남없이 이용될 수 있음을 이해할 수 있을 것이다.
연속 스피치 인식 시스템
한 실시예에서, 본원 발명은 연속 스피치 인식(CSR) 시스템을 제공한다. CSR 시스템은 제한된 처리능력을 갖는 장치가 연속적인 스피치 인식을 제공하는 것을 가능하게 해준다. 즉, 대부분의 휴대용 장치(예, PDA 또는 셀룰러 폰)는 연속적인 스피치 인식을 수행할 수 있는 처리 능력을 가지고 있지 않다. 이는, 작은 사이즈와 결합되어, 사용자로 하여금 스틸러스로 입력 영역을 치도록 하게 만들며, 이로 인해, 장애가 있는 사람들은 이러한 장치를 이용하는 것이 매우 어렵게 된다.이는 또한 개인들이 신속하게 메모하거나, 달력을 갱신하거나, 전자메일을 전송하기 어렵게 한다.
CSR 시스템을 이용함으로써, 상기 장치에 정보를 입력하는 것은 말하기처럼 간단하게 된다. CSR 시스템은 접촉이 요구되는 입력 장치에 대한 필요성을 실질적으로 없앨 수 있다. CSR 시스템은 또한, 손목시계와 같이 입력 패드 또는 스크린을 갖기에는 너무 작은 장치도 입력 장치로 이용될 수 있도록 해준다.
도 2는 본원 발명의 한 실시예에서 CSR 시스템(212)과 그 환경을 개략적으로 도시한 것이다. CSR 시스템(212)은 음성 인식 서버(210)에 있다. CSR 시스템(212)은 하나 이상의 클라이언트 장치들( 제한된 처리 능력을 갖는 장치들)과 하나 이상의 음성 인식 서버들간의 공동 관계를 형성한다. 예시의 편의를 위해, 하나의 클라이언트 장치(200)와 하나의 음성 인식 서버(210)가 도시되어 있다. 클라이언트 장치(200)는 음성을 기록하고/기록하거나 중계할 수 있다. CSR 시스템(212)은 음성-텍스트 번역 소프트웨어(214)와 텍스트 필터링 및 변환 소프트웨어(216)를 포함한다.
일반적으로, 클라이언트 장치(200)는 스피치를 캡쳐하여 이를 음성 인식 서버(210)에 번역 및 변환을 위해 전송한다. 음성 인식 서버(210)는 변환된 정보를 다시 클라이언트 장치(200)에 전송하고, 클라이언트 장치(200)는 이를 타겟 어플리케이션(예, 달력, 전자메일, 또는 노트 어플리케이션)에 통합시킨다.
CSR 시스템(212)을 사용하기 이전에, 사용자는 음성 인식 서버(210)에 정보를 보낸다. 정보는 데이터 저장소에 저장되는 사용자 프로파일(218)을 포함한다.사용자 프로파일은, 사용자가 말하는 방식과 연관되어 이는 "음성 프린트(voice print)", 데이터를 수신할 하나 이상의 타겟 어플리케이션들에 대한 정보, 사용자에 의해 사용되는 특정 장치를 식별하는 하나 이상의 클라이언트 장치("유니트") 식별자(identifiers: "ids"), 그리고 사용자에 대한 연락 정보(전자메일 주소 포함)를 포함한다.
초기에, 사용자는 음성 인식 서버에서 음성 프린트로서 저장되는 스피치를 기록한다. 예를 들어, 각각의 사용자는 책의 패러그래프와 같이, 특정 텍스트를 말하도록 요청될 수 있다. 말하여진 텍스트가 음성 프린트이다. 각각의 사용자는 약간의 상이한 멈춤과 억양으로 약간씩 다르게 말한다. 따라서, 음성 프린트는 사용자를 식별하기 위해 이용될 수 있다. 부가적으로, 음성 프린트는 음성에서 텍스트로의 변환이 더 잘되기 위해, CSR 시스템(212)에 의해 이용될 수 있다.
일단 사용자 프로파일(218)이 음성 인식 서버(210)에 저장되면, 사용자는 클라이언트 장치(200)의 음성 기록기/중계기에 말함으로써 음성 데이터를 클라이언트 장치(200)에 입력할 수 있다. 사용자는 키워드 및 다른 스피치를 말한다. 키워드는 CSR 시스템(212)에 특정 유형의 정보가 이어짐을 나타낸다. 간단한 키워드로는, 캘린더 입력, 날짜, 시간, 노트 전송, 어드레스 입력, 노트패드 입력 등이 포함되며, 이에 한정되는 것은 아니다. 캘린더 어플리케이션에 미팅 날짜를 기록하기 위해, 사용자는 "캘린더 입력 날짜 20000년 12월 1일 시간 오전 10시 제목 프로젝트 x에 대한 미팅"이라고 클라이언트 장치(200)에 말할 수 있다.
클라이언트 장치(200)는 음성 데이터를 이용하여 음성 데이터(예, 구), 타겟어플리케이션(예, 캘린더 어플리케이션)에 적합한 데이터 및 유니트 식별자(클라이언트 장치 식별자)로 구성된 스피치 패킷을 생성한다. 클라이언트 장치(200)는 스피치 패킷을 셀룰러 모뎀 및/또는 인터넷 접속과 같이 임의의 이용가능한 통신 시스템을 통해 음성 인식 서버(210)에 전송한다.
음성 인식 서버(210)는 스피치 패킷을 수신하고, 유니트 식별자를 추출하고, 이를 이용하여 데이터 저장소로부터 사용자의 음성 프린트를 검색한다. 음성-텍스트 번역 소프트웨어(214)는 음성 프린트를 이용하여 스피치 패킷의 음성 데이터를 텍스트로 번역한다. 이의 결과물이 "번역된 텍스트"이다.
다음에, 텍스트 필터링 및 변환 소프트웨어(216)는 번역된 텍스트로부터 하나 이상의 키워드를 추출하고자 한다. 하나의 실시예에 의하면, 번역된 텍스트의 시작부에 하나 이상의 키워드가 있을 것으로 예측된다. 어떠한 키워드도 발견되지 않으면, CSR 시스템(212)은 번역된 텍스트를, 예를 들면, 전자메일을 이용해, 클라이언트 장치(200)로 리턴한다. 반면에, 하나 이상의 키워드가 추출되면, CSR 시스템(212)은 상기 번역된 텍스트를 특정 포맷(예를 들면, 특정 어플리케이션 및/또는 특정 장치에 지정된 포맷)으로 포맷팅하는데 이용될 변환 필터(필터, 220)를 식별하고 검색한다. 예를 들어, 하나 이상의 키워드가 음성 데이터는 캘린더 어플리케이션과 연관되어 있으며 "캘린더 입력"을 나타내고 있다면, 텍스트 필터링 및 변환 소프트웨어(216)는 변환 필터가 이용될지를 결정하고 변환 필터들(220)로부터 캘린더 필터를 검색하여 클라이언트 장치(200)에 전송될 데이터를 캘린더 입력으로서 포맷팅한다. 포맷팅은 특정 어플리케이션(예, 캘린더 어플리케이션)에 대해 번역된 텍스트를 포매팅할 뿐만 아니라, 특정 클라이언트 장치(200) (예를 들면, PDA의 특정 브랜드)에 대해서도 번역된 텍스트를 포맷팅한다. 그리고 나서, CSR 시스템(212)은 적절한 통신 채널을 통해 (예를 들면, 셀룰러 모뎀 및/또는 인터넷을 통한 전자메일을 통해) 클라이언트 장치(200)에 필터링된 텍스트를 리턴한다. 클라이언트 장치(200)는 번역되고 변환된 스피치 패킷을 수신하여 이를 타겟 어플리케이션(예, 캘린더 어플리케이션)에 처리를 위해 라우팅한다.
클라이언트 장치(200)가 셀룰러 폰이라면, 사용자는 셀룰러폰을 이용하여 스피치를 입력할 수 있다. 스피치 및 유니트 식별자는 음성 인식 서버(210)에 전송된다. 음성 인식 서버(210)에서의 CSR 시스템(212)은 음성 데이터를 번역된 텍스트로 변환하고, 필터링된 텍스트를 생성하는 것이 적절하면 필터를 적용하고, 사용자 프로파일에 지정된 대로, 전자메일을 통해 사용자 장치에 상기 번역된 텍스트 또는 필터링된 텍스트를 리턴한다.
따라서, 캘린더 어플리케이션에 미팅 날짜를 기록하기 위해, CSR 시스템(212)을 이용함으로써, 사용자는 클라이언트 장치(200)에 "캘린더 입력 날짜 20000년 12월 1일 시간 오전 10시 제목 프로젝트 x에 대한 미팅"이라고 말할 수 있다. 그 후에, CSR 시스템(212)은 음성 데이터를 캘린더 입력으로서 포맷하여, 캘린더에 통합시킬 준비를 한다. 반면에, 종래의 시스템에서는, 사용자가 캘린더 어플리케이션을 오픈하여, 날짜와 시간을 찾고, 제목 정보에 타이핑 또는 기록을 하여야만 할 것이다. PDA 상에서, 이러한 작업은 일반적으로 스틸러스의 이용을 요구하며, 이는 다수의 사람들이, 특히, 장애가 있는 사람들이 사용하기에 불편하게만든다. 또한, 종래의 시스템에서는 단지 셀룰러폰만을 이용해서 캘린더 입력을 생성하는 것이 불가능하다.
도 3은 본원 발명의 한 실시예에 따라 CSR 시스템(212)에 의해 수행되는 프로세스를 설명하는 흐름도이다. 한 실시예에 따르면, CSR 시스템(212)은 음성-텍스트 번역 소프트웨어(214)와 텍스트 필터링 및 변환 소프트웨어(216)를 함께 포함하고 있다.
블록(300)에서, CSR 시스템(212)은, 음성 프린트와 유니트 식별자를 포함하는 사용자 프로파일(218)를 수신하고 음성 인식 서버(210)에 사용자 프로파일(218)을 저장한다. 블록(302)에서, 클라이언트 장치(200)는 음성 데이터를 수신하고 음성 데이터와 유니트 식별자를 음성 인식 서버(210)에 포워딩한다. 블록(304)에서, 음성 인식 서버(210)의 CSR 시스템(212)은 유니트 식별자에 기해 사용자에 대한 음성 프린트를 검색한다. 블록(306)에서, CSR 시스템(212)은 음성 프린트를 이용하여 음성 데이터를 텍스트로 변환하여, 번역된 텍스트를 산출한다. 블록(308)에서, CSR 시스템(212)은 필터가 적용될지의 여부를 결정한다. 필터를 적용한다면, CSR 시스템(212)은 블록(312)로 진행하고, 그렇지 않으면, CSR 시스템(212)은 블록(310)으로 진행한다. 블록(310)에서, CSR 시스템(212)은 번역된 텍스트를 클라이언트 장치(200)에 리턴한다. 블록(312)에서, CSR 시스템(212)은 변환 필터(220)를 선택하고 검색한다. 블록(314)에서, CSR 시스템(212)은 변환 필터를 번역된 텍스트에 적용하여서, 필터링된 텍스트를 산출한다. 블록(316)에서, CSR 시스템(212)은 필터링된 텍스트를 클라이언트 장치(200)에 리턴한다. 한 실시예에따르면, CSR 시스템(212)은 필터링된 텍스트를 클라이언트 장치(200)의 어플리케이션에 리턴한다.
결론
이로써 본 발명의 실시예에 대한 설명을 끝낸다. 다음은 본원 발명을 달성하는 몇가지 대안적 실시예를 설명한다. 예를 들어, 메인프레임, 미니컴퓨터, 또는 개인용 컴퓨터와 같은 임의의 유형의 컴퓨터, 또는 타임쉐어링 메인프레임, 로컬 영역 네트워크, 또는 독립형 개인용 컴퓨터과 같은 임의의 컴퓨터 구성이 본 발명에 이용될 수 있다.
본원 발명의 실시예에 대한 전술한 설명은 예시 및 설명의 목적을 위한 것이다. 여기에 개시된 형태에 본원 발명을 한정하려는 의도는 아니다. 본원 발명의 범위는 상세한 설명에 의해서가 아니라 첨부된 청구항에 의해서 한정되는 것이다.
본원 발명에 따르면, PDA와 같이 제한된 처리능력을 갖는 장치에 대한 대체 입력으로서 연속적인 스피치 인식을 제공할 수 있는 방법, 장치 및 제조품이 제공된다.
Claims (39)
- 장치에서의 데이터 입력 방법에 있어서,상기 장치에서 음성 데이터를 수신하는 단계와,상기 음성 데이터와 장치 식별자를 컴퓨터에 전송하는 단계와,상기 컴퓨터에서,상기 음성 데이터를 텍스트로 번역하는 단계와,상기 번역된 텍스트를 필터링할지를 결정하는 단계와,상기 번역된 텍스트가 필터링될 것으로 결정되면, 상기 번역 된 텍스트에 필터를 적용하는 단계를 포함하는 데이터 입력 방법.
- 제1항에 있어서, 상기 컴퓨터에 연결된 데이터 저장소에 사용자 프로파일을 저장하는 단계를 더 포함하는 데이터 입력 방법.
- 제2항에 있어서, 상기 사용자 프로파일은 음성 프린트(voice print)를 포함하는 데이터 입력 방법.
- 제3항에 있어서, 상기 음성 프린트를 이용하여 상기 음성 데이터를 텍스트로 번역하는 단계를 더 포함하는 데이터 입력 방법.
- 제1항에 있어서, 상기 결정 단계는 상기 번역된 텍스트로부터 하나 이상의 키워드를 추출하는 단계를 포함하는 데이터 입력 방법.
- 제5항에 있어서, 하나 이상의 추출된 키워드에 기하여 필터가 선택되는 데이터 입력 방법.
- 제1항에 있어서, 상기 필터를 적용하는 단계는 상기 번역된 텍스트를 포맷팅하는 단계를 포함하는 데이터 입력 방법.
- 제7항에 있어서, 상기 포맷팅 단계는 상기 번역된 텍스트를 어플리케이션용으로 포맷팅하는 단계를 포함하는 데이터 입력 방법.
- 제7항에 있어서, 상기 포맷팅 단계는 상기 번역된 텍스트를 상기 장치용으로 포맷팅하는 단계를 포함하는 데이터 입력 방법,
- 제1항에 있어서, 상기 번역된 텍스트를 상기 장치에 리턴하는 단계를 더 포함하는 데이터 입력 방법.
- 제1항에 있어서, 상기 필터링된 텍스트를 상기 장치에 리턴하는 단계를 더포함하는 데이터 입력 방법.
- 제11항에 있어서, 상기 필터링된 텍스트를 전자 메일 메시지를 통해 리턴하는 단계를 더 포함하는 데이터 입력 방법.
- 제1항에 있어서, 음성 데이터가 수신된 장치이외의 장치에 데이터를 리턴하는 단계를 더 포함하는 데이터 입력 방법.
- 데이터를 수신하고 전송하기 위한 장치와,데이터 저장소가 연결된 컴퓨터 - 상기 데이터 저장소는 상기 장치에 연결되어 데이터를 저장함-와,상기 장치로부터 음성 데이터와 장치 식별자를 수신하고,상기 음성 데이터를 텍스트로 변환하고,상기 번역된 텍스트를 필터링할지를 결정하고,상기 번역된 텍스트가 필터링될 것으로 결정되면 상기 번역된 텍스트에 필터를 적용하기 위해, 상기 컴퓨터에 의해 수행되는 하나 이상의 컴퓨터 프로그램을 포함하는 장치.
- 제14항에 있어서, 상기 컴퓨터에 연결된 데이터 저장소에 사용자 프로파일을 저장하기 위한 프로그램을 더 포함하는 장치.
- 제15항에 있어서, 상기 사용자 프로파일은 음성 프린트(voice print)를 포함하는 장치.
- 제16항에 있어서, 상기 음성 프린트를 이용하여 상기 음성 데이터를 텍스트로 번역하기 위한 프로그램을 더 포함하는 장치.
- 제14항에 있어서, 상기 결정 프로그램은 상기 번역된 텍스트로부터 하나 이상의 키워드를 추출하기 위한 프로그램을 포함하는 장치.
- 제18항에 있어서, 하나 이상의 추출된 키워드에 기하여 필터가 선택되는 장치.
- 제14항에 있어서, 상기 필터를 적용하기 위한 프로그램은 상기 번역된 텍스트를 포맷팅하기 위한 프로그램을 포함하는 장치.
- 제20항에 있어서, 상기 포맷팅하기 위한 프로그램은 상기 번역된 텍스트를 어플리케이션용으로 포맷팅하기 위한 프로그램을 포함하는 장치.
- 제20항에 있어서, 상기 포맷팅하기 위한 프로그램은 상기 번역된 텍스트를상기 장치용으로 포맷팅하기 위한 프로그램를 포함하는 장치,
- 제14항에 있어서, 상기 번역된 텍스트를 상기 장치에 리턴하기 위한 프로그램을 더 포함하는 장치.
- 제14항에 있어서, 상기 필터링된 텍스트를 상기 장치에 리턴하기 위한 프로그램을 더 포함하는 장치.
- 제24항에 있어서, 상기 필터링된 텍스트를 전자 메일 메시지를 통해 리턴하기 위한 프로그램을 더 포함하는 장치.
- 제14항에 있어서, 음성 데이터가 수신된 장치이외의 장치에 데이터를 리턴하기 위한 프로그램을 더 포함하는 장치.
- 장치에서 입력된 데이터를 처리하기 위해, 컴퓨터에 의해 판독가능하고 실행 가능한 하나 이상의 명령어들을 구현한 프로그램 저장 매체를 포함하는 제조품에 있어서,상기 장치에서 음성 데이터를 수신하는 명령어와,상기 음성 데이터와 장치 식별자를 컴퓨터에 전송하는 명령어와,상기 컴퓨터에서,상기 음성 데이터를 텍스트로 번역하는 명령어와,상기 번역된 텍스트를 필터링할지를 결정하는 명령어와,상기 번역된 텍스트가 필터링될 것으로 결정되면, 상기 번 역된 텍스트에 필터를 적용하는 명령어를 포함하는 제조품.
- 제27항에 있어서, 상기 컴퓨터에 연결된 데이터 저장소에 사용자 프로파일을 저장하는 명령어를 더 포함하는 제조품.
- 제28항에 있어서, 상기 사용자 프로파일은 음성 프린트(voice print)를 포함하는 제조품.
- 제29항에 있어서, 상기 음성 프린트를 이용하여 상기 음성 데이터를 텍스트로 번역하는 명령어를 더 포함하는 제조품.
- 제27항에 있어서, 상기 결정 명령어는 상기 번역된 텍스트로부터 하나 이상의 키워드를 추출하는 명령어를 포함하는 제조품.
- 제31항에 있어서, 하나 이상의 추출된 키워드에 기하여 필터가 선택되는 제조품.
- 제27항에 있어서, 상기 필터를 적용하는 명령어는 상기 번역된 텍스트를 포맷팅하는 명령어를 포함하는 제조품.
- 제33항에 있어서, 상기 포맷팅 명령어는 상기 번역된 텍스트를 어플리케이션용으로 포맷팅하는 명령어를 포함하는 제조품.
- 제33항에 있어서, 상기 포맷팅 명령어는 상기 번역된 텍스트를 상기 장치용으로 포맷팅하는 명령어를 포함하는 제조품,
- 제27항에 있어서, 상기 번역된 텍스트를 상기 장치에 리턴하는 명령어를 더 포함하는 제조품.
- 제27항에 있어서, 상기 필터링된 텍스트를 상기 장치에 리턴하는 명령어를 더 포함하는 제조품.
- 제37항에 있어서, 상기 필터링된 텍스트를 전자 메일 메시지를 통해 리턴하는 명령어를 더 포함하는 제조품.
- 제27항에 있어서, 음성 데이터가 수신된 장치이외의 장치에 데이터를 리턴하는 명령어를 더 포함하는 제조품.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US20210100P | 2000-05-04 | 2000-05-04 | |
US60/202,101 | 2000-05-04 | ||
US09/690,313 US8355912B1 (en) | 2000-05-04 | 2000-10-17 | Technique for providing continuous speech recognition as an alternate input device to limited processing power devices |
US09/690,313 | 2000-10-17 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20010100883A true KR20010100883A (ko) | 2001-11-14 |
KR100451260B1 KR100451260B1 (ko) | 2004-10-06 |
Family
ID=26897352
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR10-2001-0019131A KR100451260B1 (ko) | 2000-05-04 | 2001-04-11 | 제한된 처리 능력을 갖는 장치들에 대체 입력 장치로서 연속 스피치 인식을 제공하는 방법, 장치 및 제조품 |
Country Status (6)
Country | Link |
---|---|
US (1) | US8355912B1 (ko) |
EP (1) | EP1152326A3 (ko) |
JP (1) | JP3689346B2 (ko) |
KR (1) | KR100451260B1 (ko) |
CN (1) | CN100555175C (ko) |
CA (1) | CA2343664A1 (ko) |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003055688A1 (en) * | 2001-12-21 | 2003-07-10 | Print Dreams Europe Ab | Portable printer application |
US7805307B2 (en) | 2003-09-30 | 2010-09-28 | Sharp Laboratories Of America, Inc. | Text to speech conversion system |
US7785197B2 (en) * | 2004-07-29 | 2010-08-31 | Nintendo Co., Ltd. | Voice-to-text chat conversion for remote video game play |
US7292198B2 (en) * | 2004-08-18 | 2007-11-06 | Ruckus Wireless, Inc. | System and method for an omnidirectional planar antenna apparatus with selectable elements |
US7193562B2 (en) | 2004-11-22 | 2007-03-20 | Ruckus Wireless, Inc. | Circuit board having a peripheral antenna apparatus with selectable antenna elements |
US7358912B1 (en) | 2005-06-24 | 2008-04-15 | Ruckus Wireless, Inc. | Coverage antenna apparatus with selectable horizontal and vertical polarization elements |
US7893882B2 (en) | 2007-01-08 | 2011-02-22 | Ruckus Wireless, Inc. | Pattern shaping of RF emission patterns |
US8009644B2 (en) | 2005-12-01 | 2011-08-30 | Ruckus Wireless, Inc. | On-demand services by wireless base station virtualization |
EP2013758B1 (en) | 2006-04-24 | 2016-08-03 | Ruckus Wireless, Inc. | Dynamic authentication in secured wireless networks |
US9071583B2 (en) | 2006-04-24 | 2015-06-30 | Ruckus Wireless, Inc. | Provisioned configuration for automatic wireless connection |
US9769655B2 (en) | 2006-04-24 | 2017-09-19 | Ruckus Wireless, Inc. | Sharing security keys with headless devices |
US9792188B2 (en) | 2011-05-01 | 2017-10-17 | Ruckus Wireless, Inc. | Remote cable access point reset |
US9021565B2 (en) | 2011-10-13 | 2015-04-28 | At&T Intellectual Property I, L.P. | Authentication techniques utilizing a computing device |
US8756668B2 (en) | 2012-02-09 | 2014-06-17 | Ruckus Wireless, Inc. | Dynamic PSK for hotspots |
US10186750B2 (en) | 2012-02-14 | 2019-01-22 | Arris Enterprises Llc | Radio frequency antenna array with spacing element |
US9634403B2 (en) | 2012-02-14 | 2017-04-25 | Ruckus Wireless, Inc. | Radio frequency emission pattern shaping |
US9092610B2 (en) * | 2012-04-04 | 2015-07-28 | Ruckus Wireless, Inc. | Key assignment for a brand |
CN102685151A (zh) * | 2012-06-05 | 2012-09-19 | 陈云昊 | 语音过滤及转发的方法 |
WO2014024751A1 (ja) * | 2012-08-10 | 2014-02-13 | エイディシーテクノロジー株式会社 | 音声応答装置 |
US10210885B1 (en) | 2014-05-20 | 2019-02-19 | Amazon Technologies, Inc. | Message and user profile indications in speech-based systems |
US9711146B1 (en) | 2014-06-05 | 2017-07-18 | ProSports Technologies, LLC | Wireless system for social media management |
US9343066B1 (en) | 2014-07-11 | 2016-05-17 | ProSports Technologies, LLC | Social network system |
US10121474B2 (en) * | 2016-02-17 | 2018-11-06 | Microsoft Technology Licensing, Llc | Contextual note taking |
KR102375800B1 (ko) * | 2017-04-28 | 2022-03-17 | 삼성전자주식회사 | 음성 인식 서비스를 제공하는 전자 장치 및 그 방법 |
CN107968817A (zh) * | 2017-11-13 | 2018-04-27 | 福州瑞芯微电子股份有限公司 | 一种普通设备与人工智能设备交互方法和系统 |
CN109584867A (zh) * | 2018-11-08 | 2019-04-05 | 江西国泰利民信息科技有限公司 | 一种基于语音识别和wifi双通道智能语音机器人的数据传输方法 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07222248A (ja) | 1994-02-08 | 1995-08-18 | Hitachi Ltd | 携帯型情報端末における音声情報の利用方式 |
US5774841A (en) * | 1995-09-20 | 1998-06-30 | The United States Of America As Represented By The Adminstrator Of The National Aeronautics And Space Administration | Real-time reconfigurable adaptive speech recognition command and control apparatus and method |
JPH10126852A (ja) | 1996-10-16 | 1998-05-15 | Casio Comput Co Ltd | 移動端末音声認識/データベース検索通信システム |
EP0938793A4 (en) * | 1996-11-22 | 2003-03-19 | T Netix Inc | VOICE RECOGNITION FOR ACCESS TO INFORMATION SYSTEMS AND PROCESSING OF TRANSACTIONS |
US5960399A (en) | 1996-12-24 | 1999-09-28 | Gte Internetworking Incorporated | Client/server speech processor/recognizer |
JP3402100B2 (ja) | 1996-12-27 | 2003-04-28 | カシオ計算機株式会社 | 音声制御ホスト装置 |
JP2002507298A (ja) | 1997-06-27 | 2002-03-05 | ルノー・アンド・オスピー・スピーチ・プロダクツ・ナームローゼ・ベンノートシャープ | 自動音声認識を有するアクセス制御コンピュータシステム |
JP2991178B2 (ja) * | 1997-12-26 | 1999-12-20 | 日本電気株式会社 | 音声ワープロ |
US6085160A (en) * | 1998-07-10 | 2000-07-04 | Lernout & Hauspie Speech Products N.V. | Language independent speech recognition |
EP1097447A1 (de) * | 1998-07-23 | 2001-05-09 | Siemens Aktiengesellschaft | Verfahren und vorrichtung zur erkennung vorgegebener schlüsselwörter in gesprochener sprache |
US6185535B1 (en) * | 1998-10-16 | 2001-02-06 | Telefonaktiebolaget Lm Ericsson (Publ) | Voice control of a user interface to service applications |
US6463413B1 (en) * | 1999-04-20 | 2002-10-08 | Matsushita Electrical Industrial Co., Ltd. | Speech recognition training for small hardware devices |
US7050977B1 (en) * | 1999-11-12 | 2006-05-23 | Phoenix Solutions, Inc. | Speech-enabled server for internet website and method |
US6532446B1 (en) * | 1999-11-24 | 2003-03-11 | Openwave Systems Inc. | Server based speech recognition user interface for wireless devices |
US6658389B1 (en) * | 2000-03-24 | 2003-12-02 | Ahmet Alpdemir | System, method, and business model for speech-interactive information system having business self-promotion, audio coupon and rating features |
-
2000
- 2000-10-17 US US09/690,313 patent/US8355912B1/en active Active
-
2001
- 2001-04-11 CA CA002343664A patent/CA2343664A1/en not_active Abandoned
- 2001-04-11 KR KR10-2001-0019131A patent/KR100451260B1/ko not_active IP Right Cessation
- 2001-04-20 JP JP2001122471A patent/JP3689346B2/ja not_active Expired - Lifetime
- 2001-04-30 EP EP01000133A patent/EP1152326A3/en not_active Withdrawn
- 2001-05-08 CN CNB011179457A patent/CN100555175C/zh not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
KR100451260B1 (ko) | 2004-10-06 |
CN100555175C (zh) | 2009-10-28 |
CN1322981A (zh) | 2001-11-21 |
JP2002132284A (ja) | 2002-05-09 |
EP1152326A3 (en) | 2004-02-11 |
JP3689346B2 (ja) | 2005-08-31 |
EP1152326A2 (en) | 2001-11-07 |
CA2343664A1 (en) | 2001-11-04 |
US8355912B1 (en) | 2013-01-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100451260B1 (ko) | 제한된 처리 능력을 갖는 장치들에 대체 입력 장치로서 연속 스피치 인식을 제공하는 방법, 장치 및 제조품 | |
US11049493B2 (en) | Spoken dialog device, spoken dialog method, and recording medium | |
WO2019214359A1 (zh) | 基于同声传译的数据处理方法、计算机设备和存储介质 | |
US6366882B1 (en) | Apparatus for converting speech to text | |
RU2352979C2 (ru) | Синхронное понимание семантических объектов для высокоинтерактивного интерфейса | |
CN205647778U (zh) | 一种智能会议系统 | |
US8326601B2 (en) | Queue based mechanism to support multi-language chat rooms | |
US7092496B1 (en) | Method and apparatus for processing information signals based on content | |
CN109986569B (zh) | 具有角色化和性格化的聊天机器人 | |
CN110149805A (zh) | 双向语音翻译系统、双向语音翻译方法和程序 | |
US20030187632A1 (en) | Multimedia conferencing system | |
GB2323694A (en) | Adaptation in speech to text conversion | |
CN106302933B (zh) | 通话语音信息处理方法及终端 | |
CN101334774A (zh) | 一种字符输入的方法和输入法系统 | |
CN111919249A (zh) | 词语的连续检测和相关的用户体验 | |
CN1934848A (zh) | 用于语音交互式消息传送的方法和设备 | |
US20060271365A1 (en) | Methods and apparatus for processing information signals based on content | |
CN106713111B (zh) | 一种添加好友的处理方法、终端及服务器 | |
EP4174849B1 (en) | Automatic generation of a contextual meeting summary | |
CN111063355A (zh) | 会议记录的生成方法及记录终端 | |
US20190121860A1 (en) | Conference And Call Center Speech To Text Machine Translation Engine | |
JP2015069102A (ja) | 情報処理装置、制御方法、及びプログラム | |
CN109559744B (zh) | 语音数据的处理方法、装置及可读存储介质 | |
US10803853B2 (en) | Audio transcription sentence tokenization system and method | |
JP6771251B1 (ja) | 音声解析システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
LAPS | Lapse due to unpaid annual fee |