KR20130114852A - 엠알씨피를 이용하여 음성처리 기능을 제공하는 장치 및 그 방법 - Google Patents
엠알씨피를 이용하여 음성처리 기능을 제공하는 장치 및 그 방법 Download PDFInfo
- Publication number
- KR20130114852A KR20130114852A KR1020120037207A KR20120037207A KR20130114852A KR 20130114852 A KR20130114852 A KR 20130114852A KR 1020120037207 A KR1020120037207 A KR 1020120037207A KR 20120037207 A KR20120037207 A KR 20120037207A KR 20130114852 A KR20130114852 A KR 20130114852A
- Authority
- KR
- South Korea
- Prior art keywords
- mrcp
- voice processing
- function
- voice
- server
- Prior art date
Links
- 238000012545 processing Methods 0.000 title claims abstract description 84
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000004891 communication Methods 0.000 claims abstract description 13
- 230000002452 interceptive effect Effects 0.000 claims abstract description 3
- 230000000977 initiatory effect Effects 0.000 claims description 4
- 230000010354 integration Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 6
- 239000011800 void material Substances 0.000 description 5
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
Abstract
본 발명은 음성 인식과 TTS 기능을 제공하지 않는 기존 IVR 및 VMS 시스템에 해당 기능을 제공하기 위하여 음성엔진 서버 연동의 사실상의 표준인 MRCP를 이용하여 음성 기능을 부가하는 것이 목적이다. 이를 위해서, 고객으로부터 음성처리를 요청을 받고 이를 처리하는 IVR(Interactive Voice Response) application 부;와 MRCP(Media Resource Control Protocol) 서버와 통신하여 상기 음성처리 결과를 제공받는 MRCP client 부; 및 통신 호를 처리하는 call control 모듈과 상기 음성 처리를 수행하는 Voice Processing 모듈을 포함하는 UC(Unified Communication) Platform SDK(Software Development Kit);를 포함하는 MRCP 를 이용하여 음성처리 기능을 제공하는 CTI(Computer Telephony Integration) 기반 장치가 제공된다.
Description
본 발명은 기존 서버 또는 PC에 PCI 방식 및 PCI Express방식으로 연결되는 CTI(Computer Telephony Integration)보드를 이용하여 구성된 IVR, 또는 VMS 시스템에 TTS(Text To Speech) 및 음성 인식 기능을 제공하기 방법과 장치에 관한 것이다.
종래의 IVR 및 VMS는 점점 더 유연하고 풍부한 사용자 interface를 제공하기 위하여 필수 요소가 되어 가고 있는 음성인식 및 TTS 기능을 포함하고 있지는 않다.
따라서, 종래의 IVR 및 VMS에 음성인식 및 TTS를 제공하기 위해서는 해당 기능을 제공하기 위하여 새로운 시스템을 설계 및 개발하거나 해당 기능을 위하여 해당 기능 각각을 위한 음성인식 엔진을 탑재 및 연동을 위한 상당한 개발 시간과 비용이 소요된다.
또한, 종래의 IVR 및 VMS는 음성인식, TTS 및 사용자에 대한 풍부하고 유연한 기능에 대한 확장 가능한 interface를 고려하지 않고 개발되어 향후 해당 기능을 추가하려면 해당 기능을 개별적으로 적용 및 개발하기 위하여 상당한 시간과 비용이 소요된다.
본 발명은 음성 인식과 TTS 기능을 제공하지 않는 기존 IVR 및 VMS 시스템에 해당 기능을 제공하기 위하여 음성엔진 서버 연동의 사실상의 표준인 MRCP를 이용하여 음성 기능을 부가하는 것이 목적이다.
본 발명의 다른 목적들은 이하의 실시예에 대한 설명을 통해 쉽게 이해될 수 있을 것이다.
본 발명은 고객으로부터 음성처리를 요청을 받고 이를 처리하는 IVR(Interactive Voice Response) application 부;와 MRCP(Media Resource Control Protocol) 서버와 통신하여 상기 음성처리 결과를 제공받는 MRCP client 부; 및 통신 호를 처리하는 call control 모듈과 상기 음성 처리를 수행하는 Voice Processing 모듈을 포함하는 UC(Unified Communication) Platform SDK(Software Development Kit);를 포함하는 MRCP 를 이용하여 음성처리 기능을 제공하는 CTI(Computer Telephony Integration) 기반 장치가 제공된다.
여기서, 상기 MRCP client 부는 상기 음성 인식과 상기 TTS 기능이 요구되는 경우에 상기 MRCP 서버로 상기 음성 인식과 상기 TTS 기능을 요구하고, 상기 MRCP 서버로부터 상기 음성 인식과 상기 TTS 기능을 제공받는 것을 특징으로 할 수 있다.
여기서, 아날로그 방식, 디지털 방식 중 어느 하나 이상의 방식으로 상기 고객과 통신을 수행하는 CTI 보드를 더 포함하는 것을 특징으로 할 수 있다.
여기서, 상기 음성처리는 음성 인식 또는 TTS(Text to Speech) 기능인 것을 특징으로 할 수 있다.
또한, 고객으로부터 음성처리 기능을 요청받는 단계;와 MRCP client 부가 활성화되는 단계;와 상기 MRCP client 부가 MRCP 서버로 상기 음성처리 기능을 요청하는 단계;와 상기 MRCP 서버에서 상기 음성처리 기능을 수행하고 이에 대한 처리 결과를 상기 MRCP client 부로 제공하는 단계; 및 상기 고객으로 상기 음성처리 결과를 제공하는 단계; 를 포함하는 MRCP 를 이용하여 음성처리 기능을 제공하는 CTI 기반 방법이 제공된다.
여기서, MRCP client 부는 SIP(Session Initiation Protocol), MRCP(Media Resource Control Protocol), RTSP(Real Time Streaming Protocol), SDP(Session Description Protocol), RTP(Real Time Protocol), RTCP(Real Time Control Protocol) 중 어느 하나 이상의 통신 방식을 이용할 수 있는 것을 특징으로 할 수 있다.
여기서, MRCP client 를 초기화하는 단계;와 MRCP client 를 오픈 및 롤백 함수를 등록하는 단계;와 MRCP 명령어를 MRCP 서버로 전송하는 단계;와 MRCP 서버에서 상기 명령어를 처리하는 단계; 및 상기 MRCP 서버로부터 상기 처리 결과를 수신하는 단계;를 더 포함하는 것을 특징으로 할 수 있다.
여기서, 상기 음성처리는 음성 인식 또는 TTS(Text to Speech) 기능인 것을 특징으로 할 수 있다.
본 발명은 기존 VMS 시스템에 MRCP Client를 통해 해당 서비스를 제공하여 기존 IVR 시스템 그대로 사용함으로써 비용이 저렴하다.
또한, 주요 음성인식 엔진 업체들이 사용하고 있는 표준인 MRCP를 이용함으로써 상황에 따라 음성엔진 선정과 교환이 용이하다.
도 1은 본 발명의 일 실시예로 MRCP 를 이용하여 음성처리 기능을 제공하는 CTI 기반 장치의 구성도이다.
도 2는 본 발명의 일 실시예로 MRCP 를 이용하여 음성처리 기능을 제공하는 CTI 기반 방법을 도시한 도면이다.
도 3은 본 발명의 일 실시예로 MRCP 를 이용하여 음성처리 기능을 제공하는 소프트웨어 인터페이스 과정을 도시한 도면이다.
도 2는 본 발명의 일 실시예로 MRCP 를 이용하여 음성처리 기능을 제공하는 CTI 기반 방법을 도시한 도면이다.
도 3은 본 발명의 일 실시예로 MRCP 를 이용하여 음성처리 기능을 제공하는 소프트웨어 인터페이스 과정을 도시한 도면이다.
본 발명은 다양한 변환을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변환, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
본 발명에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다.
이하, 본 발명의 실시예를 첨부한 도면들을 참조하여 상세히 설명하기로 한다.
도 1은 본 발명의 일 실시예로 MRCP 를 이용하여 음성처리 기능을 제공하는 CTI 기반 장치의 구성도이다.
본 발명의 MRCP 를 이용하여 음성처리 기능을 제공하는 CTI 기반 장치(100)는 IVR Application부(110), MRCP Client부(120), UC Platform SDK(130), CTI 보드(140)를 포함한다.
IVR Application부(110)는 고객으로부터 음성처리를 요청을 받고 이를 처리하는 기능을 수행한다. 이를 위해서 IVR 관련 응용 프로그램이 저장되어 있다.
MRCP Client부(120)는 MRCP 서버(200)와 통신하여 고객으로부터 요청받은 음성처리 기능을 MRCP 서버(200)로 요청하고 전송하고, MRCP 서버(200)에서 처리한 음성처리 결과를 수신한다.
이를 위해서 MRCP client 부(120)는 SIP(Session Initiation Protocol), MRCP(Media Resource Control Protocol), RTSP(Real Time Streaming Protocol), SDP(Session Description Protocol), RTP(Real Time Protocol), RTCP(Real Time Control Protocol) 중 어느 하나 이상의 통신 방식을 이용하여 MRCP 서버(200)와 통신한다.
여기서 MRCP 서버(200)와 MRCP client 부(120)는 같은 호스트내에 존재할 수도 있고 다른 호스트에 각각 존재할 수도 있다. 서로 다른 호스트에 존재하는 경우에는 TCP/IP와 같은 통신 방식을 이용하여 원격 통신을 할 수 있다.
UC Platform SDK(130)는 call control 모듈(131)과 Voice Processing 모듈(132)을 포함한다.
call control 모듈(131)은 통신 호를 처리하는 기능을 수행한다.
Voice Processing 모듈(132)은 MRCP Client부(120)와 연결되어 고객으로부터 수신한 음성처리 관련 명령어를 전달하고 MRCP 서버(200)로부터 수신한 음성처리 기능 결과를 CTI 보드(140)와 연결되어 고객으로 제공한다.
CTI 보드(140)는 PSTN 과 같은 아날로그 방식, E1, T1, PRI 과 같은 디지털 방식 중 어느 하나 이상의 방식으로 상기 고객과 통신을 수행할 수 있다.
도 2는 본 발명의 일 실시예로 MRCP 를 이용하여 음성처리 기능을 제공하는 CTI 기반 방법을 도시한 도면이다.
S100 단계는 고객이 음성처리 기능을 요청하는 단계이다.
본 발명의 MRCP 를 이용하여 음성처리 기능을 제공하는 CTI 기반 장치(100)는 CTI 보드(140)를 통해서 고객과 연결되어 있고, 상기 고객으로부터 음성처리에 대한 요청을 수신한다.
S110 단계는 MRCP client(120)의 기능을 활성화하는 단계이다.
본 발명의 MRCP 를 이용하여 음성처리 기능을 제공하는 CTI 기반 장치(100)는 고객으로부터 음성처리에 대한 기능을 요청받으면 음성 처리 기능을 수행하는 MRCP 서버(200)와 통신하여 음성처리 기능을 요청하기 위해서 MRCP client(120)가 활성화된다.
S120 단계는 MRCP 서버(200)로 음성 처리 기능을 요청하는 단계이다.
활성화된 MRCP client(120)는 음성처리를 수행하는 MRCP 서버(200)로 해당 음성처리에 대한 기능을 수행하고 이에 대한 결과를 요청한다.
S130 단계는 MRCP 서버(200)에서 음성 처리 기능을 수행하는 단계이다.
MRCP 서버(200)는 MRCP client(120)로부터 음성처리 요청을 수신하고 이에 대한 음성처리 기능을 수행한다.
여기서 음성처리 기능은 음성 인식 또는 TTS(Text to Speech) 기능을 의미한다.
S140 단계는 MRCP 서버(200)에서 처리한 처리 결과를 MRCP client(120)로 제공하는 단계이다.
MRCP 서버(200)는 음성처리 기능을 수행하고 이에 대한 결과를 MRCP client(120)로 제공한다.
이를 위해서 MRCP client 부(120)와 MRCP 서버(200)는 상술한 바와 같이 SIP, MRCP, RTSP, SDP, RTP, RTCP 중 어느 하나 이상의 통신 방식을 이용하여 서로 통신하므로 MRCP 서버(200)에서 처리하는 음성처리 기능이 실시간으로 고객으로 제공될 수 있다.
S150 단계는 MRCP 서버(200)에서 처리한 음성처리 결과를 고객에게 제공하는 단계이다.
상술한 바와 같이 MRCP client 부(120)는 MRCP 서버(200)로부터 음성처리 결과를 제공받아 이를 CTI 보드(140)를 통해 고객으로 전달한다.
도 3은 본 발명의 일 실시예로 MRCP 를 이용하여 음성처리 기능을 제공하는 소프트웨어 인터페이스 과정을 도시한 도면이다.
S200 단계는 MRCP client 를 초기화하는 단계이다.
즉, 다음과 같은 ScommMrcpInit()함수 호출을 통하여 라이브러리 형태로 제공되는 MRCP Client 부(120)의 사용을 위해 필요한 자원을 할당하고 관련된 데이터를 초기화하는 단계이다.
int
ScommMrcpInit(
void
)
parameter
:
Remarks
:
MRCP Clinet와 연동하기 위한 초기화를 수행한다.
Success : 1
S210 단계는 MRCP client 를 오픈 및 롤백 함수를 등록하는 단계이다.
S200 단계 이후에, 다음으로 서비스에 이용되는 ScommMrcpOpen()함수 호출을 통하여 MRCP Channel을 open 및 추후 전송된 명령의 결과값을 받기 위한 콜백함수를 등록하는 단계이다.
typedef
void
(*
mrcp
_
callback
)(
mrcp
_
evp
evt
,
void
*
data
)
Remarks
:
Used in ScommMrcpOpen Function parameter. 해당 event가 발생했을 때 MRCP Client로부터 수행될 CallBack 함수를 등록
int
ScommMrcpOpen(*
mrcp
_
callback
cb
)
Parameter
:
cb : MRCP Channel을 Open하기 위해 사용된다. 이때 CallBack 함수도 함께 등록한다.
Remarks
:
Success : Channel id값을 return한다.
failure : -1
S220 단계는 MRCP 명령어를 MRCP 서버로 전송하는 단계이다.
필요한 서비스 요청을 하는 단계로 ScommMrcpSend()호출을 통해 음성인식 및 TTS관련 mrcp_cmd type의 명령이 전송된다.
int
ScommMrcp
_send(
mrcp
_
cmd
cmd
,
void
*
data
)
Parameter
:
cmd : command
data : 해당 cmd값과 관련된 data
Remarks
:
MRCP Client에 mrcp_cmd 에 해당하는 command를 전송한다.
S230 단계는 MRCP 서버에서 MRCP 명령어를 처리하는 단계이다. 즉, 음성 처리 기능을 수행하는 단계이다.
예를 들어 MRCP 명령어는 다음과 같다.
mrcp
_
cmd
enumeration command and events
typedef enum
{
/* Speech Resouce Cmd and Event */
SET-PARAMS,
GET-PARAMS,
SPEAK,
STOP,
BARGE-IN-OCCURED,
PAUSE,
RESUME,
CONTROL,
SPEAK-COMPLETE,
DEFINE-LEXICON,
/* Recognize Resouce Cmd and Event */
DEFINE-GRAMMAR,
RECOGNIZE,
STOP-R,
GET-RESULT,
START-OF-INPUT-TIMERS,
RECOGNITION-COMPLETE,
START-PRASE-ENROLLMENT,
ENROLLMENT-ROLLBACK,
END-PRASE-ENROLMENT,
MODIFY-PRASE,
DELETE-PRASE,
INTERPRET,
INTERPRETATION-COMPLETE,
DEFINE-LEXICON,
} mrcp_cmd;
Parameter
:
Remarks:
MRCP COMMANDS and EVENT
S240 단계는 MRCP channel 을 닫는 단계이다.
int
ScommMrcpClose(
int
id
)
id값에 해당하는 Channel을 close한다.
Parameter
:
id : Close할 channel id.
Remarks
:
Success : 1
failure : -1
S250 단계는 MRCP client 를 해제하는 단계이다.
int
ScommMrcpDestroy(
void
)
Parameter
:
Remarks
:
MRCP Client와 관련된 해제를 수행한다.
Success : 1
failure : -1
상기에서는 본 발명의 실시예를 참조하여 설명하였지만, 해당 기술 분야에서 통상의 지식을 가진 자라면 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.
100 : MRCP 를 이용하여 음성처리 기능을 제공하는 CTI 기반 장치
110 : IVR application 부
120 : MRCP client 부
130 : UC(Unified Communicaton) Platform SDK
131 : call control 모듈
132 : Voice Processing 모듈
140 : CTI 보드
200 : MRCP 서버
110 : IVR application 부
120 : MRCP client 부
130 : UC(Unified Communicaton) Platform SDK
131 : call control 모듈
132 : Voice Processing 모듈
140 : CTI 보드
200 : MRCP 서버
Claims (8)
- 고객으로부터 음성처리를 요청을 받고 이를 처리하는 IVR(Interactive Voice Response) application 부;
MRCP(Media Resource Control Protocol) 서버와 통신하여 상기 음성처리 결과를 제공받는 MRCP client 부; 및
통신 호를 처리하는 call control 모듈과 상기 음성 처리를 수행하는 Voice Processing 모듈을 포함하는 UC(Unified Communication) Platform SDK(Software Development Kit);를 포함하는 MRCP 를 이용하여 음성처리 기능을 제공하는 CTI(Computer Telephony Integration) 기반 장치. - 제1항에 있어서,
상기 MRCP client 부는 상기 음성 인식과 상기 TTS 기능이 요구되는 경우에 상기 MRCP 서버로 상기 음성 인식과 상기 TTS 기능을 요구하고, 상기 MRCP 서버로부터 상기 음성 인식과 상기 TTS 기능을 제공받는 것을 특징으로 하는 MRCP 를 이용하여 음성처리 기능을 제공하는 CTI 기반 장치. - 제1항에 있어서,
아날로그 방식, 디지털 방식 중 어느 하나 이상의 방식으로 상기 고객과 통신을 수행하는 CTI 보드를 더 포함하는 것을 특징으로 하는 MRCP 를 이용하여 음성처리 기능을 제공하는 CTI 기반 장치. - 제1항에 있어서,
상기 음성처리는 음성 인식 또는 TTS(Text to Speech) 기능인 것을 특징으로 하는 MRCP 를 이용하여 음성처리 기능을 제공하는 CTI 기반 장치. - 고객으로부터 음성처리 기능을 요청받는 단계;
MRCP client 부가 활성화되는 단계;
상기 MRCP client 부가 MRCP 서버로 상기 음성처리 기능을 요청하는 단계;
상기 MRCP 서버에서 상기 음성처리 기능을 수행하고 이에 대한 처리 결과를 상기 MRCP client 부로 제공하는 단계;
상기 고객으로 상기 음성처리 결과를 제공하는 단계; 를 포함하는 MRCP를 이용하여 음성처리 기능을 제공하는 CTI 기반 방법. - 제5항에 있어서,
MRCP client 부는 SIP(Session Initiation Protocol), MRCP(Media Resource Control Protocol), RTSP(Real Time Streaming Protocol), SDP(Session Description Protocol), RTP(Real Time Protocol), RTCP(Real Time Control Protocol) 중 어느 하나 이상의 통신 방식을 이용할 수 있는 것을 특징으로 하는 MRCP 를 이용하여 음성처리 기능을 제공하는 CTI 기반 방법. - 제5항에 있어서,
MRCP client 를 초기화하는 단계;
MRCP client 를 오픈 및 롤백 함수를 등록하는 단계;
MRCP 명령어를 MRCP 서버로 전송하는 단계;
MRCP 서버에서 상기 명령어를 처리하는 단계; 및
상기 MRCP 서버로부터 상기 처리 결과를 수신하는 단계;를 더 포함하는 것을 특징으로 하는 MRCP 를 이용하여 음성처리 기능을 제공하는 CTI 기반 방법. - 제5항에 있어서,
상기 음성처리는 음성 인식 또는 TTS(Text to Speech) 기능인 것을 특징으로 하는 MRCP 를 이용하여 음성처리 기능을 제공하는 CTI 기반 장치.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020120037207A KR20130114852A (ko) | 2012-04-10 | 2012-04-10 | 엠알씨피를 이용하여 음성처리 기능을 제공하는 장치 및 그 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020120037207A KR20130114852A (ko) | 2012-04-10 | 2012-04-10 | 엠알씨피를 이용하여 음성처리 기능을 제공하는 장치 및 그 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20130114852A true KR20130114852A (ko) | 2013-10-21 |
Family
ID=49634659
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020120037207A KR20130114852A (ko) | 2012-04-10 | 2012-04-10 | 엠알씨피를 이용하여 음성처리 기능을 제공하는 장치 및 그 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20130114852A (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11532305B2 (en) | 2019-06-26 | 2022-12-20 | Samsung Electronics Co., Ltd. | Electronic apparatus and control method thereof |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20050060456A (ko) * | 2003-12-16 | 2005-06-22 | 에스케이 주식회사 | 상담원과 음성 인식 엔진을 이용한 품질보장형 콜라우팅시스템 및 그 방법 |
KR20060009771A (ko) * | 2004-07-26 | 2006-02-01 | 삼성전자주식회사 | 예측 다이얼링 장치 및 방법 |
US20070133518A1 (en) * | 2005-12-13 | 2007-06-14 | International Business Machines Corporation | Distributed off-line voice services |
-
2012
- 2012-04-10 KR KR1020120037207A patent/KR20130114852A/ko not_active Application Discontinuation
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20050060456A (ko) * | 2003-12-16 | 2005-06-22 | 에스케이 주식회사 | 상담원과 음성 인식 엔진을 이용한 품질보장형 콜라우팅시스템 및 그 방법 |
KR20060009771A (ko) * | 2004-07-26 | 2006-02-01 | 삼성전자주식회사 | 예측 다이얼링 장치 및 방법 |
US20070133518A1 (en) * | 2005-12-13 | 2007-06-14 | International Business Machines Corporation | Distributed off-line voice services |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11532305B2 (en) | 2019-06-26 | 2022-12-20 | Samsung Electronics Co., Ltd. | Electronic apparatus and control method thereof |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6801604B2 (en) | Universal IP-based and scalable architectures across conversational applications using web services for speech and audio processing resources | |
CN107004411B (zh) | 话音应用架构 | |
US20090119408A1 (en) | Method for managing execution by a server of an application providing at least one interactive multimedia service to at least one terminal, corresponding computer program product and server | |
US8838459B2 (en) | Virtual participant-based real-time translation and transcription system for audio and video teleconferences | |
EP3084633B1 (en) | Attribute-based audio channel arbitration | |
US9210266B2 (en) | System and method for web-based real time communication with optimized transcoding | |
US8239204B2 (en) | Inferring switching conditions for switching between modalities in a speech application environment extended for interactive text exchanges | |
JP2023158002A5 (ja) | システム、方法及びプログラム | |
US8171493B2 (en) | VXML browser control channel | |
US20120059655A1 (en) | Methods and apparatus for providing input to a speech-enabled application program | |
US8867534B2 (en) | Data device to speech service bridge | |
KR20110008211A (ko) | 도메인이 상이한 실시간 다중 언어 통신 서비스 기반형 개방 아키텍처 | |
WO2013143310A1 (zh) | 呼叫处理方法和控制装置、自动呼叫分配装置和座席终端 | |
JP2015535414A5 (ko) | ||
KR102331793B1 (ko) | 구조화된 오디오 출력을 사용하여 재생 감지 및/또는 무선 스피커에서 비정렬된 재생에 적응 | |
US20140211669A1 (en) | Terminal to communicate data using voice command, and method and system thereof | |
EP3028239A1 (en) | System and method for web-based real time communication with optimized transcoding | |
JP2010217628A (ja) | 音声によってテキストを入力する音声認識処理方法及びシステム | |
CN105206273B (zh) | 语音传输控制方法及系统 | |
CN111629110A (zh) | 一种语音交互方法和语音交互系统 | |
CN113905023B (zh) | 基于网页即时通信技术的外呼系统及方法 | |
US20050243981A1 (en) | Enhanced media resource protocol messages | |
KR20130114852A (ko) | 엠알씨피를 이용하여 음성처리 기능을 제공하는 장치 및 그 방법 | |
US9961209B2 (en) | Codec selection optimization | |
WO2012174908A1 (zh) | 实现从文本到语音的音频转码方法、装置及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
N231 | Notification of change of applicant | ||
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |