KR20230064303A - 통화중 배경음 서비스 방법 및 그 시스템 - Google Patents

통화중 배경음 서비스 방법 및 그 시스템 Download PDF

Info

Publication number
KR20230064303A
KR20230064303A KR1020210149748A KR20210149748A KR20230064303A KR 20230064303 A KR20230064303 A KR 20230064303A KR 1020210149748 A KR1020210149748 A KR 1020210149748A KR 20210149748 A KR20210149748 A KR 20210149748A KR 20230064303 A KR20230064303 A KR 20230064303A
Authority
KR
South Korea
Prior art keywords
call
background sound
application server
during
received
Prior art date
Application number
KR1020210149748A
Other languages
English (en)
Inventor
허희수
이은동
전준용
정성택
Original Assignee
주식회사 케이티
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 케이티 filed Critical 주식회사 케이티
Priority to KR1020210149748A priority Critical patent/KR20230064303A/ko
Publication of KR20230064303A publication Critical patent/KR20230064303A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/428Arrangements for placing incoming calls on hold
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/16Communication-related supplementary services, e.g. call-transfer or call-hold
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2215/00Metering arrangements; Time controlling arrangements; Time indicating arrangements
    • H04M2215/81Notifying aspects, e.g. notifications or displays to the user
    • H04M2215/8129Type of notification
    • H04M2215/8137Message, e.g. alphanumeric text, SMS, MMS, EMS or www-based messaging service
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/60Details of telephonic subscriber devices logging of communication history, e.g. outgoing or incoming calls, missed calls, messages or URLs

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Telephonic Communication Services (AREA)

Abstract

통화중 배경음 서비스 방법 및 그 시스템이 개시된다. 이 방법은 적어도 하나의 프로세서에 의해 동작하는 지능형 커뮤니케이션 플랫폼 장치의 동작 방법으로서, 발신 단말과 착신 단말 간에 통화 연결시, 상기 발신 단말이 통화중 배경음 서비스 가입자이면, 써드파티 응용 서버와 통화중 배경음 송출을 위한 세션을 셋업하는 단계, 상기 발신 단말로부터 통화중 배경음 제어 요청을 수신하는 단계, 상기 통화중 배경음 제어 요청에 따른 배경음을 상기 써드파티 응용 서버로부터 수신하는 단계, 그리고 상기 착신 단말로부터 수신한 착신자 음성에 상기 배경음을 합성하여 상기 발신 단말로 전송하고 상기 발신 단말로부터 수신한 발신자 음성에 상기 배경음을 합성하여 상기 착신 단말로 전송하는 단계를 포함한다.

Description

통화중 배경음 서비스 방법 및 그 시스템{METHOD AND SYSTEM FOR BACKGROUND SOUND SERVICE DURING CALL}
본 발명은 5G 이동통신 가입자에게 음성 통화 중에 이동통신망외 음원 서비스와 결합하여 배경음 서비스를 제공하는 방법 및 그 시스템에 관한 것이다.
이동통신망은 4G를 거쳐서 초고속, 초지연, 초연결을 목표로 5G로 진화하게 되었다. 이를 위해 라디오에서는 3.5GHz, 28Ghz와 같은 고주파수와 MIMO(Multiple-input and Mutiple-Output) 기술을 도입하게 되었고 인프라는 사용량에 따라 유연성을 높이기 위해 NFV(Network Function Virtualization) 기술을 적용하였다.
5G 통화 측면에서는 4G의 IMS(IP Multimedia Subsystem) 구조를 유지하고 늘어난 5G 대역폭에 따라 통화할 때 미디어는 이전 세대 보다 큰 용량인 H.264와 H.265까지 지원 확대하였다.
5G가 상용화되고 이동통신을 통한 미디어 사용이 본격적으로 늘어나고 있다. 이동통신을 통한 Youtube와 같은 동영상 시청이 일상화되었고 많은 사람이 이동 중에는 음악 서비스를 끊김없이 이용하고 있다.
국내 음원 시장은 958만명('19년 뉴스)이며 이는 전체 국민의 20%로서 시장규모가 크다. 이렇게 큰 사용자 규모로 인해 이동통신사는 이전부터 통화연결음 서비스를 개시하여 사용자 니즈를 충족시키고 있으며 전체 음원 사용자의 20% 정도가 유료로 서비스에 가입하고 있다.
5G 이전부터 남들과 다른 개성을 표출하고 싶은 전화 고객 니즈를 충족하기 위해서 통화연결음 서비스로 통화 연결 전에 통화 상대방에게 음원을 들려주는 컬러링 혹은 링투유 서비스가 이동통신 사업자를 통해 고객에게 제공하고 있었다.
4G 보다 초고속, 고용량 데이터 전송이 가능한 5G가 확산되면서 자신의 개성을 음성에서 영상으로 표출하고자 하는 고객의 니즈를 충족하기 위해 이동통신 사업자는 통화 연결 전에 동영상을 상대방 대기 화면에 보여주는 V컬러링 서비스를 2020년에 출시하여 고객 욕구를 충족시키고 새로운 수익 창출을 모색하고 있다.
하지만 컬러링에서 V컬러링 서비스로 서비스가 추가되어 통화 연결 전에 음원송출되는 것이 동영상 변경이 되었으나 여전히 통화 연결 후에는 모바일 전화는 사용자의 목소리만 이동통신 망을 통해 전달하는 것에 한정되어 있기 때문에 사용자가 통화 중에 고객의 개성을 표현하거나 색다른 경험을 위해 선택할 수 있는 음원 서비스는 전무한 상태이다.
또한, V컬러링 서비스를 받기 위해서는 V컬러링 서비스 기능이 탑재된 제조사의새로운 이동통신 단말을 구입하거나 제조사가 V컬러링 서비스를 받을 수 있게 핸드폰 전화 앱(App)을 업그레이드해야 서비스를 받을 수 있어서 고객이 새로운 서비스를 이용할 수 있는 단말은 제약적이다.
해결하고자 하는 과제는 통화중에 통화 음성과 함께 배경음으로 제공할 음원을 선택하여 재생하는 방법 및 그 시스템을 제공하는 것이다.
해결하고자 다른 과제는 5G 이동통신망 외 위치한 써드파티(3rd Party) 응용 서버와 연동하여 통화중 배경음을 제공하는 방법 및 그 시스템을 제공하는 것이다.
한 특징에 따르면, 적어도 하나의 프로세서에 의해 동작하는 지능형 커뮤니케이션 플랫폼 장치의 동작 방법으로서, 발신 단말과 착신 단말 간에 통화 연결시, 상기 발신 단말이 통화중 배경음 서비스 가입자이면, 써드파티 응용 서버와 통화중 배경음 송출을 위한 세션을 셋업하는 단계, 상기 발신 단말로부터 통화중 배경음 제어 요청을 수신하는 단계, 상기 통화중 배경음 제어 요청에 따른 배경음을 상기 써드파티 응용 서버로부터 수신하는 단계, 그리고 상기 착신 단말로부터 수신한 착신자 음성에 상기 배경음을 합성하여 상기 발신 단말로 전송하고 상기 발신 단말로부터 수신한 발신자 음성에 상기 배경음을 합성하여 상기 착신 단말로 전송하는 단계를 포함한다.
상기 통화중 배경음 제어 요청은, DTMF(Dual Tone Multiple Frequency) 신호 또는 사용자 음성에 포함될 수 있다.
상기 DTMF 신호는, 전화 단말의 다이얼 패드에 각각 매핑되어, 음원 종류, 볼륨 제어, 배경음 온/오프 중 적어도 하나를 설정하는데 사용될 수 있다.
상기 통화중 배경음 제어 요청을 수신하는 단계는, 발신자로부터 수신한 통화 음성을 응용 서버로 전송하고, 상기 응용 서버로부터 상기 통화 음성에 대한 인식율이 포함된 음성 인식 결과를 수신하며, 기 설정된 명령어 별 통화중 배경음 제어 명령어와 상기 음성 인식 결과 간의 음소 차이값 그리고 상기 인식율을 토대로 음성 인식 평가값을 산출하고, 상기 음성 인식 평가값이 임계치를 초과하는 통화중 배경음 제어 명령어에 따라 응용 서버로 음원을 요청하거나 또는 통화중 배경음 제어를 결정할 수 있다.
상기 응용 서버로부터 수신하는 단계는, 상기 응용 서버와 통화중 배경음 제어를 위해 사전 약정한 미디어 제어 API를 호출하여 상기 배경음을 수신할 수 있다.
상기 응용 서버로부터 수신하는 단계는, 통화 상태를 통보받을 URL(Uniform Resource Locator)과 배경음의 위치를 URL로 수신할 수 있다.
다른 특징에 따르면, 통화중 배경음 서비스 시스템은 CSCF(Call Session Control Function)로부터 발신 단말과 착신 단말 간에 통화 채널을 설정하기 위한 통화 메시지를 수신하여 부가서비스 처리를 수행한 후, 상기 통화 메시지를 상기 CSCF에게 전달하는 TAS(Telephony Application Server), 그리고 상기 CSCF로부터 수신한 통화 메시지에 자신을 미디어 경로로 추가하는 지능형 커뮤니케이션 플랫폼 장치를 포함하고, 상기 지능형 커뮤니케이션 플랫폼 장치는, 발신 단말과 착신 단말 간에 통화 연결이 된 이후, 상기 발신 단말로부터 통화중 배경음 제어 요청이 수신되면, 상기 통화중 배경음 제어 요청에 따른 배경음을 상기 응용 서버로부터터 수신하여 통화 음성에 합성하여 제공한다.
상기 통화 메시지는, 상기 발신 단말로부터 수신한 인바이트(INVITE) 메시지와 상기 착신 단말로부터 수신한 응답(200 OK) 메시지를 포함할 수 있다.
상기 지능형 커뮤니케이션 플랫폼 장치는, 상기 CSCF로부터 상기 응답(200 OK) 메시지가 수신되면, 써드파티 응용 서버와 통화중 배경음 제공을 위한 채널을 설정할 수 있다.
상기 지능형 커뮤니케이션 플랫폼 장치는, 상기 CSCF로부터 ACK 메시지가 수신되면, 상기 응용 서버에게 통화 시작 알림을 전송할 수 있다.
또 다른 특징에 따르면, 통화중 배경음 서비스 시스템은 응용 서버와 연동하여 상기 응용 서버로부터 수신한 음원을 통화중 배경음으로 송출하는 지능형 커뮤니케이션 플랫폼 장치, 그리고 CSCF(Call Session Control Function)로부터 수신한 통화 메시지에 상기 지능형 커뮤니케이션 플랫폼 장치로부터 수신한 채널 정보를 이용하여 상기 지능형 커뮤니케이션 플랫폼 장치를 미디어 경로로 추가하고, 추가한 통화 메시지를 상기 CSCF로 전송하는 TAS(Telephony Application Server)를 포함하고, 상기 지능형 커뮤니케이션 플랫폼 장치는, 발신 단말과 착신 단말 간에 통화 연결이 된 이후, 상기 발신 단말로부터 통화중 배경음 제어 요청이 수신되면, 상기 통화중 배경음 제어 요청에 따른 배경음을 상기 응용 서버로부터터 수신하여 통화 음성에 합성하여 제공한다.
상기 지능형 커뮤니케이션 플랫폼 장치는, 상기 TAS로부터 채널 설정 완료가 수신되면, 상기 응용 서버에게 음원을 요청하여 수신하고, 상기 채널 설정 완료는, 상기 TAS가 상기 CSCF로부터 응답(200 OK) 메시지를 수신한 경우에 상기 지능형 커뮤니케이션 플랫폼 장치로 전달될 수 있다.
상기 지능형 커뮤니케이션 플랫폼 장치는, 상기 TAS로부터 통화 시작 알림을 수신하여 상기 응용 서버로 전송하고, 상기 통화 시작 알림은, 상기 TAS가 상기 CSCF로부터 ACK 메시지를 수신한 경우에, 상기 TAS로부터 상기 지능형 커뮤니케이션 플랫폼 장치로 전송될 수 있다.
실시예에 따르면, 5G 이동통신 가입자 중에 음원을 통해 개성을 표출하고자 하는 고객은 전화 연결 전 뿐만 아니라 통화 상대방과 전화가 연결된 후에서도 사용자가 원하는 음원을 배경음으로 재생하여 통화중에서도 개성을 표출할 수 있게 된다.
또한, 5G 망 내에 지능형 커뮤니케이션 플랫폼을 통한 배경음 통화 특정 제조사가 기능을 탑재한 이동통신 전화기 혹은 단말의 전화 기능 업그레이드가 필요 없이 이동통신 가입자 모두에게 평준화된 서비스를 제공할 수 있어서 가입자의 단말 교체가 필요없고 이동통신사는 모든 5G 가입자에게 서비스가 가능하여 가입자 제약없이 서비스를 제공할 수 있다.
또한, 음원 사업자는 5G 이동통신 망 외에서 유료 음원을 활용화여 5G 가입자를 대상으로 통화중 음원사업이 가능하여 사업 영역을 넓힐 수 있으며 망 사업자와 독립적인 서비스 운영이 가능한 이점이 있다.
도 1은 한 실시예에 따른 통화중 배경음 제공 시스템을 도시한다.
도 2는 실시예에 따른 다이얼러를 활용한 BGM 통화 이용 방식을 나타낸 예시도이다.
도 3은 한 실시예에 따른 BGM 통화 호 처리 흐름도이다.
도 4는 다른 실시예에 따른 BGM 통화 호 처리 흐름도이다.
도 5는 한 실시예에 따른 DTMF 신호 기반의 BGM 통화 배경음 제어 방법을 설명하는 흐름도이다.
도 6은 다른 실시예에 따른 DTMF 신호 기반의 BGM 통화 배경음 제어 방법을 설명하는 흐름도이다.
도 7은 한 실시예에 따른 음성 인식 기반의 BGM 통화 배경음 제어 방법을 설명하는 흐름도이다.
도 8은 실시예에 따른 BGM 통화 제공을 위한 iCAS와 3rd Party 음원 서버 간 연동 절차를 나타낸다.
도 9는 실시예에 따른 BGM 통화를 위한 API 호출 흐름에 따른 상태 변화도이다.
아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.
또한, 명세서에 기재된 "…부", "…기", "…모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다.
본 발명에서 설명하는 장치들은 적어도 하나의 프로세서, 메모리 장치, 통신 장치 등을 포함하는 하드웨어로 구성되고, 지정된 장소에 하드웨어와 결합되어 실행되는 프로그램이 저장된다. 하드웨어는 본 발명의 방법을 실행할 수 있는 구성과 성능을 가진다. 프로그램은 도면들을 참고로 설명한 본 발명의 동작 방법을 구현한 명령어(instructions)를 포함하고, 프로세서와 메모리 장치 등의 하드웨어와 결합하여 본 발명을 실행한다.
본 명세서에서 "전송 또는 제공"은 직접적인 전송 또는 제공하는 것 뿐만 아니라 다른 장치를 통해 또는 우회 경로를 이용하여 간접적으로 전송 또는 제공도 포함할 수 있다.
본 명세서에서 단수로 기재된 표현은 "하나" 또는 "단일" 등의 명시적인 표현을 사용하지 않은 이상, 단수 또는 복수로 해석될 수 있다.
본 명세서에서 도면에 관계없이 동일한 도면번호는 동일한 구성요소를 지칭하며, "및/또는" 은 언급된 구성 요소들의 각각 및 하나 이상의 모든 조합을 포함한다.
본 명세서에서, 제1, 제2 등과 같이 서수를 포함하는 용어들은 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되지는 않는다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를들어, 본 개시의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다.
본 명세서에서 도면을 참고하여 설명한 흐름도에서, 동작 순서는 변경될 수 있고, 여러 동작들이 병합되거나, 어느 동작이 분할될 수 있고, 특정 동작은 수행되지 않을 수 있다.
도 1은 한 실시예에 따른 통화중 배경음 제공 시스템을 도시하고, 도 2는 한실시예에 따른 다이얼러를 활용한 통화중 배경음 제어 방식을 나타낸 예시도이다.
도 1을 참조하면, 통화중 배경음 제공 시스템(100)은 발신 단말(101), 착신 단말(102), 발신 CSCF(Call Session Control Function)(103), 착신 CSCF(104), TAS(Telephony Application Server)(105), 지능형 커뮤니케이션 플랫폼 장치(intelligent Communication Application Server, 이하, 'iCAS'라 통칭함)(106) 및 음응용 서버(107)를 포함한다.
발신 단말(101) 및 착신 단말(102)은 통화 채널 및 미디어 채널을 설정할 수 있는 전화 단말이다. 발신 단말(101) 및 착신 단말(102)은 이동통신 서비스 가입자의 단말로서, 4G 단말 또는 5G 단말일 수 있다.
발신 CSCF(103), 착신 CSCF(104)는 발신 단말(101) 및 착신 단말(102) 간에통화 채널 및 미디어 채널을 설정하기 위한 호 처리를 담당한다.
TAS(105)는 발신번호 표시 등과 같은 멀티미디어 부가서비스를 처리한다. 이때, TAS(105)는 발신 단말(101) 및 착신 단말(102)과 연결된다. TAS(105)는 발신측 TAS와 착신측 TAS로 구분되지만, 도면에서는 발신측과 착신측을 구분하지 않고 통합하여 나타내었다.
응용 서버(106)는 써드파티(3rd party) 응용 서버로서, 다양한 배경음으로 출력될 음원을 제공하고, 통화중 배경음 제어를 위한 음성 인식을 수행할 수 있다. 여기서, 통화중 배경음을 BGM(BackGround Music)이라 호칭할 수 있다.
이때, 응용 서버(106)는 통화중 배경음으로 사용할 음원을 전송하는 음원 서버와 음성 인식을 수행하는 음성 인식 서버를 포함할 수 있다. 혹은 하나의 서버 내에서 음원 서버와 음성 인식 서버로서 두가지 기능을 수행할 수 있다.
이하, 명세서에서, 음원은 통화중 배경음으로 사용되므로, 음원과 통화중 배경음, 배경음, BGM은 서로 동일한 의미의 용어로 혼용될 수 있다.
iCAS(107)는 통화중 배경음 제어를 위한 호 처리 및 미디어 처리를 수행할 수 있다. iCAS(107)는 이동통신망 외 써드파티(3rd party) 응용 서버(106)로부터 음원을 수신하여 재생한다. iCAS(107)는 응용 서버(106)로부터 음성 인식 결과를 수신하고, 음성 인식 결과에 따라 통화중 배경음 제어를 수행할 수 있다.
iCAS(107)는 BGM 통화 부가 서비스 가입자인 단말(101, 102)로부터 수신한 DTMF(Dual Tone Multi Frequency) 신호에 따라 통화중 배경음 제어를 수행할 수 있다.
사용자가 이동통신사 고객 채널, 예를들어, 웹(Web), 앱(App), 고객센터 전화 등을 통해서 BGM 통화 부가서비스에 가입한다. 사용자의 BGM 통화 부가서비스 가입 정보는 통신사 청약 체계를 통해서 입력되어 내부 전산망을 통해 iCAS(107)에 전달 및 저장된다. 이후, iCAS(107)에 저장된 BGM 통화 부가서비스 가입 정보는 해당 사용자의 통화 이용시, 즉, 발신시 또는 착신시에 참조되어 BGM 통화 부가서비스를 제공하는데 사용된다.
BGM 통화 부가서비스에 가입한 사용자가 용무가 있는 상대방에게 발신한다. BGM 통화 부가서비스 가입자인 발신 단말(101)의 발신호는 5G 코어망의 IMS(Internet Protocol Multimedia Subsystem)를 통해 iCAS(107)를 경유하여 상대방인 착신 단말(102)과 연결된다. 혹은 BGM 통화 부가서비스 가입자인 착신 단말(102)은 iCAS(107)를 경유하여 상대방인 발신 단말(102)과 연결될 수 있다.
이하, 설명의 편의를 위하여 BGM 통화 부가서비스 가입자인 발신 단말(101)의 발신 호 처리를 기준으로 설명하기로 한다.
BGM 통화 부가서비스는 iCAS(107)에 의해 통화 참가자들의 목소리(Voice)에 BGM으로 특정 음원이 합성된 미디어를 상호 교환하도록 한다. 이때, BGM 통화 부가서비스는 가입자가 통화하는 상대방이 동일 이동통신 가입자이거나 타 이동통신 가입자이거나, PSTN(Public Switched Telephone Network) 전화 이용자 혹은 인터넷 전화 이용자이더라도 서로 상대방의 목소리에 배경음이 합성되어 청취될 수 있도록 한다.
한 실시예에 따르면, iCAS(107)는 미디어 채널을 통해 통화 호를 처리한다. iCAS(107)는 5G 망 내에 있는 iCAS(107)를 경유하여 통화가 이루어질 때, 5G 망외에 있는 응용 서버(106)와 연동하여 통화 대상자의 목소리에 망외 응용 서버(106)가 제공한 배경음을 합성하여 제공할 수 있다.
다른 실시예에 따르면, iCAS(107)는 5G 통화 가입자에게 iCAS(107)를 통해 BGM 통화 부가서비스를 제공할 때에 발신 CSCF(103)에서 직접 트리거 되지 않고 TAS(104)를 통해서 미디어 채널을 생성하고 5G 가입자의 통화 미디어를 수신/전송하여 BGM 통화 부가서비스를 제공할 수 있다.
iCAS(107)는 5G 통화 가입자의 단말(101, 102)이 동일 5G망 혹은 다른 망에 연결된 통화 상대방 단말(101, 102)에게 발신하거나 착신할 경우에 통화 음성에 BGM을 합성하여 출력할 수 있다.
iCAS(107)는 5G 이동통신망 가입자가 특정 상대방과 전화가 연결된 후에 모바일 어플리케이션이나 웹의 도움을 받지 않고 사용자 음성에 추가로 배경음을 합성하여 BGM 통화 부가 서비스를 제공할 수 있다.
iCAS(107)는 발신 단말(101) 및 착신 단말(102)과 각각 RTP(Real-time Transport Protocol) 채널을 통해 연결될 수 있다. RTP 채널은 통화 호 셋업 과정에서 INVITE 메시지 및 200 OK 메시지의 SDP들에 각각 iCAS(107)가 미디어 경로로 추가됨으로써, 설정될 수 있다.
iCAS(107)는 음원을 재생하여 단말(101, 102)과 연결된 RTP 채널을 통해 가입자의 단말(101, 102)에서 상대방 단말(101, 102)에게 전송하는 오디오(Outbound Media, 가입자 음성)에 통화중 배경음을 합성하여 전송할 수 있다. iCAS(107)는 상대방 단말(101, 102)에서 가입자의 단말(101, 102)에게 전송하는 오디오(Inbound Media, 상대방 음성)에 통화중 배경음을 합성하여 전송할 수 있다. 따라서, 가입자와 상대방 모두가 통화 목소리와 함께 통화중 배경음이 합성된 오디오를 들을 수 있도록 제공한다.
iCAS(107)는 통화중 배경음을 가입자의 인바운드(inboud)와 아웃바운드(outbound) 미디어(Media) 코덱에 맞게 변환하여 합성할 수 있다. BGM 통화로 제공되는 음원은 다양한 방식으로 정해질 수 있다.
iCAS(107)는 5G 통화 가입자가 통화 연결 후에 단말(101, 102)의 다이얼러(Dialer)를 통해 통화중 배경음 서비스를 제어할 수 있다. 가입자가 일상적인 인사를 하고 감성적인 커뮤니케이션을 하고자 다이얼러(Dialer)의 번호를 입력하면, iCAS(107)를 경유하여 단말(101, 102)과 형성된 통화 미디어 경로를 통해 iCAS(107)로 DTMF 신호가 수집된다. iCAS(107)는 DTMF 신호를 해석하고, 해석에 따른 통화중 배경음 제어를 수행할 수 있다. 즉, BGM 통화 부가 서비스 가입자는 이동통신 단말의 전화 다이얼러(Dialer)에서 특정 번호를 입력하여 BGM 통화를 활성화하고 음원을 제어할 수 있다. 예컨대, DTMF 신호는 특정 배경음 선택 신호일 수 있다. DTMF 신호는 볼륨 업/다운 신호일 수 있다.
예를들어, BGM 통화 부가 서비스 가입자가 발신하여 착신자와 연결되면 배경음이 없는 일반 통화를 하다가 가입자가 다이얼러에 번호를 선택하면 다이얼러에서 DTMF 신호가 발생되어 iCAS(107)로 전송된다. iCAS(107)는 해당 DTMF 신호를 감지하여 DTMF 신호에 상응하는 음원을 재생, 변환을 수행하고, 가입자의 인바운드미디어(inbound media), 아웃바운드 미디어(outbound media)에 각각 합성하여 전송할 수 있다.
도 2를 참조하면, 1번에서 9번까지는 각각 특정 음원으로 배경음을 맵핑하여 사용자가 교체하기 위한 제어 버튼이고, 별표(*), 샵(#), 0번은 통화중 배경음을 제어하기 위한 버튼으로 지정될 수 있다.
다이얼러의 9개 번호(1~9)는 각 번호 별로 2개의 클래식 음원, 2개의 가요(K-POP) 음원, 2개의 자연 소리(Nature Sound) 음원, 1개의 국악 음원, 2개의 종교 음악 음원과 맵핑될 수 있다. BGM 통화 부가 서비스 가입자가 특정 번호, 예를들어, 3번을 선택하면, iCAS(107)는 가요 음원을 인바운드 미디어 및 아웃바운드 미디어에 합성하여 전송할 수 있다.
별표(*) 버튼은 볼륨 증가를 위한 제어 버튼으로 지정될 수 있다. 샵(#) 버튼은 볼륨 감소를 위한 제어 버튼으로 지정될 수 있다. 0번은 배경음 중지를 위한 제어 버튼으로 지정될 수 있다.
BGM 통화 부가 서비스 가입자가 통화중 배경음을 듣다가 다른 번호를 입력하면 iCAS(107)는 입력된 번호에 상응하는 배경음으로 변경하여 합성할 수 있다.
사용자가 배경음을 감상하다가 대화에 방해될 때는 별표(*) 버튼을 입력하여 볼륨을 줄이거나 0번 버튼을 선택하여 배경음 재생을 중지할 수도 있다. 이와 반대로 배경음으로 재생되는 음원의 소리가 작으면 샵(#) 버튼을 반복 선택하여 소리 크기를 높일 수 있다.
DTMF 신호는 가입자의 단말(101, 102)로부터 RTP 패킷의 페이로드에 수록되어 iCAS(107)로 전달된다. 예를들어, 가입자가 #버튼을 3회 입력하면, RTP 패킷의 페이로드에 "###"가 수록되어 iCAS(107)로 전송된다. 그러면, iCAS(107)는 해당 DTMF 신호("###")를 감지하여 가입자 측으로 전송되는 BGM 음원의 소리 크기를 3 dB단위로 3회 줄여서 상대방의 목소리와 합성하여 오디오 RTP로 발송할 수 있다. 이때, 가입자가 상대방 측 방향으로 전송되는 배경음도 3 dB단위로 3회 줄여 발송할 수도 있고, 그대로 유지하여 소리 크기 변화 없이 전송할 수도 있다.
한 실시예 따르면, 가입자의 단말(101, 102)로부터 수집된 DTMF 신호에 따른 통화중 배경음 제어를 상대방 단말(101, 102)에도 동시에 적용할 수 있다. 예컨대, 가입자의 단말(101, 102)이 별표(*) 버튼을 입력하여 볼륨을 줄이면, 가입자의 단말(101, 102)로 전송할 통화중 배경음 및 상대방 통화 음성을 줄임과 동시에 상대방 단말(101, 102)로 전송할 통화중 배경음 및 가입자 통화 음성도 줄일 수 있다.
다른 실시예에 따르면, iCAS(107)는 가입자의 단말(101, 102)로부터 수집된 DTMF 신호에 따른 통화중 배경음 제어를 상대방 단말(101, 102)과 분리하여 적용할 수 있다.
iCAS(107)는 통화중 사용자의 음성을 실시간 녹취하고, 응용 서버(106)와 연동하여 녹취 음성에 대한 음성 인식(Speech to Text, STT) 결과를 수신할 수 있다. iCAS(107)는 STT 결과에 따른 통화중 배경음 제어를 수행할 수 있다. iCAS(107)는 음원 제어 음성명령을 검출할 때, 가입자의 음성을 응용 서버(106)로 전송하여 STT 처리된 결과로 음성 명령인지, 그리고 어떤 음성 명령인지를 판단할 수 있다.
또한, iCAS(107)가 응용 서버(106)와 연동하여 BGM 통화 서비스를 제공할 때, 응용 서버(106)가 iCAS(107)의 미디어 제어 API(Application Program Interface)를 호출하여 특정 가입자의 통화 음성에 배경음을 합성하여 제공할 수 있다.
iCAS(107)는 5G 망외 응용 서버(106)가 iCAS(107)의 미디어 제어 API를 호출하여 BGM 서비스를 제공할 때, API 입력으로 통화 상태를 통보받을 URL(Uniform Resource Locator)과 음원의 위치를 URL로 수신하는 방법과 수신한 URL로 iCAS(107)가 통화 상태를 5G 망외에 있는 응용 서버(106)로 통보하여 가입자의 통화와 동기하여 음원을 연동하여 서비스할 수 있다.
iCAS(107)는 발신 호 혹은 착신 호가 인입되면, 인입된 호에서 식별 정보를 추출하고 가입자 정보를 참조하여 가입자와 상대방 통화시에 음성 RTP가 iCAS(107)를 경유하도록 호처리를 수행한다. 통화가 최종 수락되면 ACK 메시지가 iCAS(107)로 수신되고 이후에 상대방과 가입자 간의 음성 미디어 RTP는 iCAS(107)로 수신될 수 있다.
iCAS(107)는 최초 수신된 음성 RTP를 협상된 SDP(Session Description Protocol)에 따라 정해진 코덱(Codec)으로 상대방 혹은 가입자에게 쌍방향으로 전송하면서 수신된 미디어에 DTMF가 있는지 확인할 수 있다. 또한, 통화 음성을 응용 서버(106)로 전송하여 통화 음성의 STT 결과를 수신하고, STT 결과로부터 음성 명령이 포함되어 있는지 확인할 수 있다. 예를들어, iCAS(107)는 사용자가 다이얼러(Dialer)의 키 패드(Key Pad)에서 특정 음원에 상응하는 번호를 입력하였는지 또는 가입자의 목소리에 '음악 재생' 명령이 포함됨을 확인하면, 해당하는 음원을 응용 서버(106)로 요청하여 재생할 수 있다. 재생된 통화중 배경음은 iCAS(107)에 의해 가입자의 단말(101, 102)로부터 수신한 통화 음성과 합성하여 상대방의 단말(101, 102)에게 전송된다.
iCAS(107)는 가입자간 통화가 종료 상태인지를 판단하기 위해 BYE 메시지가 수신되는지 모니터링한다. 통화 종료가 아니면, 가입자의 단말(101, 102) 또는 상대방의 단말(101, 102)로부터 수신된 통화 음성에서 검출된 DTMF 신호 또는 통화 음성의 STT 결과에 따라 통화중 배경음을 제어할 수 있다.
도 3은 한 실시예에 따른 BGM 통화 호 처리 흐름도로서, iCAS(107)가 발신CSCF(103)로부터 직접 트리거되는 실시예를 설명한다.
도 3을 참조하면, 발신 단말(101)의 가입자가 통화할 상대방 번호를 입력하고 통화 버튼을 누르면, 발신 단말(101)에서 통화 요청 메시지, 즉, SIP(Session Initiation Protocol) INVITE 메시지가 5G 코어망의 발신 CSCF(103)로 발송된다(S101).
발신 CSCF(103)는 발신자의 통화 부가 서비스 제공을 위해 TAS(105)에 INVITE 메시지를 전송한다(S102).
TAS(105)는 발신번호 표시 등과 같은 발신 부가서비스를 처리한 후, INVITE 메시지를 발신 CSCF(103)에게 전송한다(S103). 이후, 발신 CSCF(103)는 TAS(105)로부터 수신한 INVITE 메시지를 iCAS(107)에게 전송한다(S104).
iCAS(107)는 수신한 INVITE 메시지에서 가입자 번호를 추출하고 내부 가입자정보 데이터베이스를 조회하여 BGM 통화 부가서비스 가입자인지 여부와 가입자의 서비스 프로파일을 조회한다. 예를들어, 발신 단말(101)의 가입자가 "숲속 소리" BGM 통화 서비스로 조회되면 iCAS(107)는 통화가 시작할 때 숲속 새소리와 바람소리 음원을 제공하기 위한 시나리오를 실행할 수 있다.
iCAS(107)는 발신 단말(101)이 BGM 통화 부가서비스 가입자로 판단되면, 통화 연결 후에 미디어 경로에 iCAS(107)가 위치하도록 INVITE의 SDP에 미디어 경로를 추가할 수 있다(S105). iCAS(107)는 SDP에 단말 연결 정보(IP/PORT/Codec)를 iCAS(107)와의 채널 연결 정보로 변경할 수 있다.
iCAS(107)는 SDP에 iCAS(107)가 미디어 경로로 추가된 INVITE를 발신 CSCF(103)에게 전송할 수 있다(S106).
이후, 기존 호 흐름과 동일하게 발신 CSCF(103)는 INVITE를 착신 CSCF(104)를 통해 착신자 단말(102)로 전송한다(S107, S108).
착신자가 통화를 수락하면, 착신자 단말(102)에서 통화 요청 메시지에 대한 응답 메시지인 200 OK 메시지가 착신 CSCF(104)로 전송된다(S109).
착신 CSCF(104)는 200 OK 메시지를 발신 CSCF(103)에게 전송한다(S110).
발신 CSCF(103)는 미디어 경로로 추가된 iCAS(107)에게 200 OK 메시지를 전송한다(S111).
iCAS(107)는 가입자의 서비스 프로파일에 지정된 응용 서버(106)에게 음원 요청을 전송(S112)하고 음원 응답을 수신(S113)함으로써, 응용 서버(106)와 통화중 배경음으로 사용할 음원을 제공받기 위한 세션을 설정 또는 셋업(setup)한다.
iCAS(107)는 S105와 마찬가지로 200 OK 메시지의 SDP에 미디어 경로를 추가하여 착신자 음성이 iCAS(107)를 거쳐가도록 설정한 후, 설정된 200 OK 메시지를 발신 CSCF(103)로 전송한다(S114).
발신 CSCF(103)는 S114에서 수신한 200 OK 메시지를 TAS(105)로 전송(S115)하고 TAS(105)로부터 200 OK 메시지를 수신한다(S116).
발신 CSCF(103)는 발신 단말(101)에게 S116에서 수신한 200 OK 메시지를 전달한다(S117).
이후, 발신자 단말(101)로부터 발신 CSCF(103)에게 ACK 메시지가 전송(S118)되면 ACK 메시지는 TAS(105)를 거쳐(S119, S120), iCAS(107)로 전달된다(S121).
iCAS(107)는 응용 서버(106)에게 통화 시작 알림을 전송(S122)하고, ACK 메시지를 발신 CSCF(103)에게 전달한다(S123).
발신 CSCF(103)는 ACK 메시지를 착신 CSCF(104)에게 전달한다(S124).
착신 CSCF(104)는 ACK 메시지를 착신 단말(102)에게 전달한다(S125). 이로써, 발신 단말(101)과 착신 단말(102) 간에 통화 채널/RTP 채널이 연결되어 통화가 시작된다.
이때, 호 성립 과정에 iCAS(107)가 통화 미디어 경로상에 위치하도록 되어 있기 때문에 발신자의 음성은 iCAS(107)의 RTP 채널을 거쳐 착신 단말(102)에게 전송되고 착신자의 음성은 iCAS(107)의 RTP 채널을 거쳐 발신 단말(101)에게 전송된다.
도 4는 다른 실시예에 따른 BGM 통화 호 처리 흐름도로서, iCAS(107)가 발신CSCF(103)로부터 직접 트리거되지 않는 실시예를 설명한다.
도 4를 참조하면, 발신 단말(101)의 가입자가 통화할 상대방 번호를 입력하고 통화 버튼을 누르면, 발신 단말(101)에서 SIP INVITE 메시지가 5G 코어망의 발신 CSCF(103)로 발송된다(S201).
발신 CSCF(103)는 발신자의 통화 부가 서비스 제공을 위해 TAS(105)에 INVITE 메시지를 전송한다(S202).
TAS(105)는 발신번호 표시 등과 같은 발신 부가서비스를 처리한 후, INVITE 메시지를 발신 CSCF(103)에게 전송한다(S203).
발신 CSCF(103)는 TAS(105)에게 INVITE 메시지를 전송한다(S204).
TAS(105)는 발신 단말(101) 또는 착신 단말(102)이 지능형 통화 서비스에 가입되어 있으면, iCAS(107)에게 채널 정보를 요청(S205)하여 수신한다(S206).
TAS(105)는 S206에서 수신한 채널 정보를 토대로 INVITE 메시지의 SDP에 iCAS(107)를 미디어 경로로 추가한다(S207). 이때, S207은 도 1의 S105와 동일한 동작이나, 다만 TAS(105)에 의해 수행되는 점이 다르다. S207에서 TAS(105)는 발신 단말(101)이 BGM 통화 부가서비스 가입자로 판단되면, 통화 연결 후에 미디어 경로에 iCAS(107)가 위치하도록 INVITE의 SDP에 단말 연결 정보(IP/PORT/Codec)를 iCAS(107)와의 채널 연결 정보로 변경할 수 있다.
TAS(105)는 SDP에 iCAS(107)가 미디어 경로로 추가된 INVITE를 발신 CSCF(103)에게 전송할 수 있다(S208).
이후, 기존 호 흐름과 동일하게 발신 CSCF(103)는 INVITE를 착신 CSCF(104)를 통해 착신자 단말(102)로 전송한다(S209, S210).
착신자가 통화를 수락하면, 착신자 단말(102)에서 200 OK 메시지가 착신 CSCF(104)로 전송된다(S211).
착신 CSCF(104)는 200 OK 메시지를 발신 CSCF(103)에게 전송한다(S212).
발신 CSCF(103)는 TAS(105)에게 200 OK 메시지를 전송한다(S213).
TAS(105)는 미디어 경로로 추가된 iCAS(107)에게 채널 설정 완료 메시지를 전송(S214)한다. 그러면, iCAS(107)는 가입자의 서비스 프로파일에 지정된 응용 서버(106)에게 음원 요청을 전송(S215)하여 음원 응답을 수신(S216)함으로써, 응용 서버(106)와 통화중 배경음으로 사용할 음원을 제공받기 위한 세션을 설정 또는 셋업(setup)한다.
iCAS(107)는 채널 설정 완료 응답 메시지를 TAS(105)에게 전송한다(S217).
TAS(105)는 200 OK 메시지의 SDP에 미디어 경로를 추가하여 착신자 음성이 iCAS(107)를 거쳐가도록 설정한 후, 설정된 200 OK 메시지를 발신 CSCF(103)로 전송한다(S218).
발신 CSCF(103)는 200 OK 메시지를 TAS(105)에게 전송(S219)한다.
TAS(105)는 착신자의 착신 부가 서비스 처리를 수행한 후, 200 OK 메시지를 발신 CSCF(103)에게 전송한다(S220).
발신 CSCF(103)는 S220에서 수신한 200 OK 메시지를 발신 단말(101)에게 전송한다(S221).
이후, 발신자 단말(101)로부터 발신 CSCF(103)에게 ACK 메시지가 전송(S222)되면 ACK 메시지는 TAS(105)로 전달된다(S223).
TAS(105)는 iCAS(107)에게 통화 시작 알림을 전송(S224)하고, iCAS(107)는 응용 서버(106)에게 통화 시작 알림을 전송한다(S225).
TAS(105)는 ACK 메시지를 발신 CSCF(103)에게 전송한다(S226). 발신 CSCF(103)는 착신 CSCF(104)에게 ACK 메시지를 전달한다(S227).
착신 CSCF(104)는 ACK 메시지를 착신 단말(102)에게 전달한다(S228). 이로써, 발신 단말(101)과 착신 단말(102) 간에 통화 채널/RTP 채널이 연결되어 통화가 시작된다.
도 3 및 도 4에서 설명한 바와 같이, 호 성립 과정에서 iCAS(107)가 통화 미디어 경로 상에 위치하도록 되어 있기 때문에 발신자의 음성은 iCAS(107)의 RTP 채널을 거쳐 착신 단말(102)에게 전송되고 착신자의 음성은 iCAS(107)의 RTP 채널을 거쳐 발신 단말(101)에게 전송된다.
도 5는 한 실시예에 따른 DTMF 신호 기반의 BGM 통화 배경음 제어 방법을 설명하는 흐름도이다.
도 5를 참조하면, 발신 단말(101)과 착신 단말(102) 간에 통화가 이루어지다가 발신 단말(101)이 다이얼러의 특정 번호를 입력(S301)하면, 입력한 특정 번호에 해당하는 DTMF 신호가 iCAS(107)로 전송된다(S302).
iCAS(107)는 수신한 DTMF 신호를 해석하고 DTMF 해석에 따른 음원을 응용 서버(106)에 요청하여 수신하고, 수신한 음원을 재생한다(S303).
iCAS(107)는 발신 단말(101)로부터 발신자 음성이 수신(S304)되면, 발신자 음성과 S303의 음원을 합성(S305)하여 오디오 신호를 생성하고, 생성한 오디오 신호를 착신 단말(102)로 전송한다(S306).
또한, iCAS(107)는 착신 단말(102)로부터 착신자 음성이 수신(S307)되면, 착신자 음성 및 S303의 음원을 합성(S308)하여 오디오 신호를 생성하고, 생성한 오디오 신호를 발신 단말(101)로 전송한다(S309). 따라서, iCAS(107)를 통해 발신 단말(101)과 착신 단말(102) 간에는 발신 단말(101)에서 전송한 DTMF 신호에 따른 음원이 통화중 배경음으로 송출된다.
이후, iCAS(107)는 발신 단말(101)로부터 통화를 종료하는 BYE 메시지가 수신(S310)되면, 응용 서버(106)에게 통화 종료 알림을 전송(S311)하고, BYE 메시지를 착신 CSCF(104)를 거쳐 착신 단말(102)로 전송할 수 있다(S312, S313).
도 6은 다른 실시예에 따른 DTMF 신호 기반의 BGM 통화 배경음 제어 방법을 설명하는 흐름도로서, 도 5에서 음원을 선택하였다면, 도 6은 음원을 제어하는 실시예를 설명한다. 도 6의 실시예는 도 5와 독립적으로 혹은 도 5와 함께 진행될 수 있다.
도 6을 참조하면, 발신 단말(101)이 볼륨 업 또는 볼륨 다운 등과 같은 음원 제어에 해당하는 특정 버튼을 클릭하여 클릭한 버튼에 대응하는 DTMF 신호를 iCAS(107)로 전송할 수 있다(S401).
iCAS(107)는 DTMF 신호를 해석(S402)하고, DTMF 신호 해석에 따른 미디어 제어 신호를 생성할 수 있다(S403).
iCAS(107)는 착신 단말(102)로부터 착신자 음성이 수신(S404)되면, 착신자 음성에 미디어 제어 신호를 적용하여 이를 발신 단말(101)로 전송할 수 있다(S405). 예를들어, 미디어 제어 신호가 볼륨 다운이면, 착신자 음성의 볼륨과 배경음의 볼륨을 다운시킨 후, 이를 전송할 수 있다.
또한, S405는 발신 단말(101)에만 적용되었으나, 착신 단말(102)에도 동시 적용될 수 있다.
도 7은 한 실시예에 따른 음성 인식 기반의 BGM 통화 배경음 제어 방법을 설명하는 흐름도이다.
도 7을 참조하면, iCAS(107)는 발신 단말(101)로부터 수신(S501)된 발신자 음성을 복제하여 하나는 응용 서버(106)로 전송(S502)하고, 다른 하나는 착신 단말(102)에 전송한다(S503).
응용 서버(106)는 발신자 음성을 인식(S504)한 결과, 즉, STT 결과를 지속적으로 응답한다(S505). 음성 인식 결과에는 오디오(Audio)에 상응하는 텍스트와 정확도가 포함될 수 있다.
iCAS(107)는 음성 인식 결과에 따른 음원을 응용 서버(106)에 요청하여 수신하고 이를 재생하거나 또는 미디어 제어 신호를 생성한다(S506).
iCAS(107)는 착신 단말(102)로부터 착신자 음성이 수신(S507)되면, S506에 따른 제어된 미디어를 합성하여 발신 단말(101)로 전송한다(S508).
이때, S508은 발신 단말(101)에만 적용되었으나, 착신 단말(102)에도 동시 적용될 수 있다.
한편, S502에서 iCAS(107)는 발신 단말(101)로부터 수신되는 발신자 음성을 정해진 시간 단위로 저장하고 이를 응용 서버(106)에서 수신 가능한 포맷으로 변환할 수 있다. 예를들어, iCAS(107)는 샘플링 주기 16K Hz인 PCM(Pulse-code modulation)으로 변환하여 응용 서버(106)에 한국어로 STT를 요청할 수 있다.
표 1은 iCAS(107)가 응용 서버(106)에게 전송하는 BGM 통화 STT 호출 메시지의 코드 예시도이다.
POST https://speech...api...server.../v1/speechtotext

Content-Type: application/json;charset=utf-8

{
'config': {
'encoding': 'LINEAR16',
'sampleRateHertz': 16000,
'languageCode': 'ko'
},
'audio':{
'uri': '...VOICE...MEDRA_NAME'
}
}
BGM 통화 STT 호출 메시지는 REST API 요청 메시지이다. 표 1에서 'POST https://speech...api...server.../v1/speechtotext'은 HTTP POST로 호출할 API URL이다. 표 2에서 'Content-Type: application/json;charset=utf-8'은 메시지 포맷 라인이다. 표 2에서 '{ }'안의 코드는 HTTP Body에 포함된 REST API 요청 메시지의 파라메터이다.
또한, 표 2는 응용 서버(106)가 수신한 음성을 인식 처리하여 텍스트(Text)로 변환한 결과를 응답한 코드 예시도이다.
{
"results":[
{
"transcript":"BGM 소리 크기를 크게 변경해줘",
"confidence": 0.98267895
}
]
}
표 2는 응용 서버(106)가 제공하는 BGM 통화 STT 결과 응답 메시지의 코드 예시도이다. 표 2에서 'transcript'는 텍스트 변환 결과를 담고 있는 응답 필드이고, 'confidence'는 음성 인식률에 대한 필드이다.
STT 결과는 이를 제공하는 다양한 음성 인식 솔루션에 따라 차이가 있을 수 있다. iCAS(107)는 발신 단말(101)부터 수신된 음성 미디어를 음성 인식 솔루션에 연동하는 것과 별개로 iCAS(107)에서 착신 단말(102)로 전송하는 미디어는 음원과 합성하여 미디어를 전송할 수 있다.
iCAS(107)는 응용 서버(106)로부터 수신된 STT 결과를 파싱하여 미디어 제어 관련 텍스트가 포함되어 있으면, 발신 단말(101) 측으로 발송되는 인바운드(inbound) 미디어의 BGM 음성의 볼륨을 조정하고 미디어 제어가 제어가 되었다는 안내 멘트('Volume Up')를 합성할 수 있다.
번호(n) 1 2 3 4 5 6 7 8
명령어 음악 재생 음악 중지 볼륨 증가 볼륨 감소 소리 높여 소리 작게 볼륨 업 볼륨 다운
표 1은 사용자가 통화중에 음성으로 BGM을 제어할 수 있는 명령어 목록이다.
iCAS(107)는 응용 서버(106)로부터 음성 인식 결과를 수신하면, 음성 인식 결과와 표 1을 이용하여 음성 인식 평가값(E)을 계산하고, 음성 인식 평가값(E)이 임계치보다 크면, 해당 명령어로 판단하여 제어할 수 있다. 음성 인식 평가값(E)은 수학식 1을 이용하여 계산될 수 있다.
[수학식 1]
Figure pat00001
수학식 1에서 음소는 음성 인식의 최소 단위로서, 자음(ㄱ,ㄲ,ㄴ,ㄷ,ㄸ,ㄹ,ㅁ,ㅂ,ㅃ,ㅅ,ㅆ,ㅇ,ㅈ,ㅉ,ㅊ,ㅋ,ㅌ,ㅍ,ㅎ) 또는 모음(ㅏ,ㅐ,ㅑ,ㅒ,ㅓ,ㅔ,ㅕ,ㅖ,ㅗ,ㅘ,ㅙ,ㅚ,ㅛ,ㅜ,ㅝ,ㅞ,ㅟ,ㅠ,ㅡ,ㅢ,ㅣ)과 같은 단위를 의미한다.
음성 인식 결과의 음소는 transcript에서 분리된다. 가중치는 이론적으로 도출되는 값은 아니고, 반복 테스트를 통해 조정 및 설정되는 값이다.
즉, iCAS(107)는 음성 인식 결과에서 얻은 텍스트의 음소와 표 3의 각 명령어 별 음소 간의 차이값중 최소인 차이값, 즉, 최소 차이값을 산출한다. iCAS(107)는 최소 차이값에 기 설정된 상수들, 즉, 가중치를 곱한 후 1을 더하고, 이 값으로 인식율을 나누어 음성 인식 평가값(E)을 산출한다. iCAS(107)는 음성 인식 평가값(E)이 사전에 정해진 임계치보다 크면, 최소 차이값이 산출된 명령어에 해당하는 배경음 제어를 수행할 수 있다.
도 8은 실시예에 따른 이동통신망 내 iCAS와 이동통신망 외 써드파티 응용 서버가 BGM 통화 부가 서비스를 위해 연동하는 절차를 나타낸다.
도 8을 참조하면, 응용 서버(106)는 웹 인터페이스를 통해 iCAS(107)에게 연동 기본 정보 등록과 사용 API 신청을 전송할 수 있다(S701). 즉, S701에서, 응용 서버(106)는 iCAS(107)와 연동을 위한 정보를 등록하고 연동을 위한 인증정보를 발급받는다.
S701에서 연동 기본 정보의 등록 항목은 iCAS API를 호출할 써드파티 사업자정보로서, 사업자명, 서버명, 서비스명, 서버 IP, 관리자 연락처, 호출하고자 하는 API 명, 제어하고자 하는 미디어 채널, 연동 만료일, 응용 서버 연동 포인트(IP), 코덱 등을 포함할 수 있다.
API 키는 임의의 사업자(서버)가 API 사용을 하면 안되기 때문에 사용 권한을 부여하기 위한 용도로 사용된다.
해당 정보가 등록되면, S701는 등록된 항목이 적절한지 체크하여 관리자에 의해 iCAS 미디어 제어 API를 호출할 때 권한이 있는 피어(Peer)인지를 검증할 수 있는 인증 정보, 즉, API Key를 발급한다(S702).
iCAS(107)와 응용 서버(106) 간에는 실시예에 따른 통화중 배경음 제어를 위하여 새로 정의된 전용 API, 즉, iCAS 미디어 제어 API를 사용할 수 있다.
API 호출 대기 상태(S703)에서, 응용 서버(106)는 S702에서 발급받은 인증 정보를 활용하여 iCAS(107)의 미디어 제어 API 또는 통화 미디어 요청 API를 호출(S704)하고, iCAS(107)로부터 통화 미디어 요청 API 호출 응답을 수신(S705)하면, 미디어 전송 대기 상태가 된다(S706). 즉, 응용 서버(106)는 통화 미디어 요청 API를 호출(S704)하면, 서비스 대상 가입자와 연동 음원 정보를 전달하고 해당 가입자가 통화할 때 음원 미디어를 연동할 수 있게 준비한다. 여기서, 통화 미디어 요청 API 호출은 통화중에 외부 음원을 합성하기 위한 제공된 API이다.
응용 서버(106)가 iCAS(107)에게 제공하는 미디어 제어 API에 관한 정보는 iCAS API 호출 테이블에 저장될 수 있다. iCAS API 호출 테이블은 표 4와 같을 수 있다. 표 4는 단지 iCAS API 호출 테이블의 한 예시로서, 다양한 정보들이 포함될 수 있다.
테이블명 필드명 설명 Value
API_Calling











API_Caller_Idx 응용 App 구분값
API_Key API Key
Cust_Num 가입자 번호
Cust_API_subs 호출된 API API
Caller_NotifyURL 응용 서버 상태 전송 URL
Caller_Rx_IP_Port 음원 URL
Status 연동 상태 0:API 호출, 1: 통화 대기, 2: 통화중, 3: 통화 완료
CreateDate 생성일
UpdateDate 변경일
iCAS 미디어 제어 API는 REST API로서 가입자 정보, API Key, NotifyURL, Play URL, 만료시간과 호출 시점을 입력으로 수신할 수 있다.
통화 미디어 요청 API 호출될 때, iCAS(107)는 통화 미디어 요청 API의 수신 정보를 체크하여 규격 오류, API Key 유효성, 연동 시간, 가입자 유효성을 체크하여 오류를 처리하거나 해당 정보에 이상이 없으면 표 4의 API 호출 테이블에 저장하고 정상 응답한다. 정상 응답은 HTTP 응답코드, API 호출 결과, 수신한 정보인 NotifyURL, 음원 URL, PlayURL를 포함시키고, 현재 통화대기 상태임을 State 항목으로, API 호출 유효시간을 validate 항목으로 포함할 수 있다.
이후, 응용 서버(106)가 요청한 가입자가 실제로 통화를 하게 되면 iCAS(107)는 해당 가입자가 통화를 발신 혹은 착신했음을 알리는 통화 미디어 연동 시작을 위한 NotifyURL을 호출하여 이를 응용 서버(106)에게 통보한다(S707). 일례로 BGM 통화 가입자가 통화를 시작했고 DTMF로 5번을 선택했을 때, 통화 및 DTMF 5번 선택함을 알리는 이벤트를 NotifyURL를 호출하여 응용 서버(106)에게 통보할 수 있다. 그러면, 응용 서버(106)는 호출된 내용에 따라 음원을 제공하는 통화 미디어 연동 응답을 iCAS(107)에게 전송할 수 있다(S708).
이와 같이, BGM 통화 가입자가 통화를 시작하면 iCAS(107)는 응용 서버(106)에게 사용자가 선택한 음원 미디어를 요청하여 수신한다. 수신된 미디어는 가입자의 인바운드(inbound), 아웃바운드(outbound) 코덱에 맞게 iCAS(107)가 변환하고 통화 음성에 합성(Mix)하여 가입자와 상대방의 RTP로 송출한다. 여기서, 아웃바운드는 발신자 기준으로, 발신자가 착신자에게 전송하는 방향을 나타내고 인바운드는 착신자로부터 발신자에게 수신되는 방향을 나타낸다.
도 9는 실시예에 따른 BGM 통화를 위한 API 호출 흐름에 따른 상태 변화도이다.
도 9를 참조하면, iCAS(107)의 API 호출 상태 변화를 설명한다. iCAS(107)가 응용 서버(106)로부터 미등록된 iCAS API를 호출(Call)받은 상태(S1)에서 규격 오류, 미등록 응용 서버, 요청/유효시간 오류, 미가입자, 중복 요청 등과 같은 다양한 오류 사유에 해당하면 API Call Error 상태(S2)가 된다. 그러나, 미등록된 iCAS API를 호출(Call)받은 상태(S1)에서 정상적인 API 호출 등록이 이루어지면, 통화 대기 상태(S3)가 된다.
통화 대기 상태(S3)에서 통화 시작 상태(S4)로 전환된 이후, DTMF 신호가 수신되면 DTMF 이벤트 상태(S5)로 전환된다. DTMF 신호를 해석하여 그에 따른 음원 선택을 위하여 응용 서버(106)로부터 음원 파일을 수신하는 파일 전송 상태(S6)로 전환될 수 있다. iCAS(107)가 이러한 음원 파일을 통화 음성에 합성하여 제공하는 통화 시작 상태(S4)로 전환된 후, 통화 종료를 위한 BYE 메시지가 수신되면, 통화 종료 상태(S7), 이어서 API 호출 종료 상태(S8)로 전환된다. 그리고 iCAS(107)는 API 호출 종료를 위한 NotifyURL Call을 응용 서버(106)로 전달할 수 있다.
이상 설명한 바와 같이, 실시예에 따르면, 이동통신망, 5G 서비스에 가입한 고객이 통화 연결된 이후에 통화 상대방과 음성 교환에 더해 감성적이고 특색있는 대화를 위해 특정 음원을 선택하고 이를 재생하여 통화중 배경음을 이용할 수 있다. 또한, 5G 망 외 서비스의 음원을 제공할 수 있으므로, 이동통신 사업자에 의존하지 않고 음원 서비스를 확장하여 제공할 수 있다.
이상에서 설명한 본 발명의 실시예는 장치 및 방법을 통해서만 구현이 되는 것은 아니며, 본 발명의 실시예의 구성에 대응하는 기능을 실현하는 프로그램 또는 그 프로그램이 기록된 기록 매체를 통해 구현될 수도 있다.
이상에서 본 발명의 실시예에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속하는 것이다.

Claims (13)

  1. 적어도 하나의 프로세서에 의해 동작하는 지능형 커뮤니케이션 플랫폼 장치의 동작 방법으로서,
    발신 단말과 착신 단말 간에 통화 연결시, 상기 발신 단말이 통화중 배경음 서비스 가입자이면, 써드파티 응용 서버와 통화중 배경음 송출을 위한 세션을 셋업하는 단계,
    상기 발신 단말로부터 통화중 배경음 제어 요청을 수신하는 단계,
    상기 통화중 배경음 제어 요청에 따른 배경음을 상기 써드파티 응용 서버로부터 수신하는 단계, 그리고
    상기 착신 단말로부터 수신한 착신자 음성에 상기 배경음을 합성하여 상기 발신 단말로 전송하고 상기 발신 단말로부터 수신한 발신자 음성에 상기 배경음을 합성하여 상기 착신 단말로 전송하는 단계
    를 포함하는, 방법.
  2. 제1항에서,
    상기 통화중 배경음 제어 요청은,
    DTMF(Dual Tone Multiple Frequency) 신호 또는 사용자 음성에 포함되는, 방법.
  3. 제2항에서,
    상기 DTMF 신호는,
    전화 단말의 다이얼 패드에 각각 매핑되어, 음원 종류, 볼륨 제어, 배경음 온/오프 중 적어도 하나를 설정하는데 사용되는, 방법.
  4. 제1항에서,
    상기 통화중 배경음 제어 요청을 수신하는 단계는,
    발신자로부터 수신한 통화 음성을 응용 서버로 전송하고, 상기 응용 서버로부터 상기 통화 음성에 대한 인식율이 포함된 음성 인식 결과를 수신하며,
    기 설정된 명령어 별 통화중 배경음 제어 명령어와 상기 음성 인식 결과 간의 음소 차이값 그리고 상기 인식율을 토대로 음성 인식 평가값을 산출하고, 상기 음성 인식 평가값이 임계치를 초과하는 통화중 배경음 제어 명령어에 따라 응용 서버로 음원을 요청하거나 또는 통화중 배경음 제어를 결정하는, 방법.
  5. 제1항에서,
    상기 응용 서버로부터 수신하는 단계는,
    상기 응용 서버와 통화중 배경음 제어를 위해 사전 약정한 미디어 제어 API(Application Program Interface)를 호출하여 상기 배경음을 수신하는, 방법.
  6. 제5항에서,
    상기 응용 서버로부터 수신하는 단계는,
    통화 상태를 통보받을 URL(Uniform Resource Locator)과 배경음의 위치를 URL로 수신하는, 방법.
  7. CSCF(Call Session Control Function)로부터 발신 단말과 착신 단말 간에 통화 채널을 설정하기 위한 통화 메시지를 수신하여 부가서비스 처리를 수행한 후, 상기 통화 메시지를 상기 CSCF에게 전달하는 TAS(Telephony Application Server), 그리고
    상기 CSCF로부터 수신한 통화 메시지에 자신을 미디어 경로로 추가하는 지능형 커뮤니케이션 플랫폼 장치를 포함하고,
    상기 지능형 커뮤니케이션 플랫폼 장치는,
    발신 단말과 착신 단말 간에 통화 연결이 된 이후, 상기 발신 단말로부터 통화중 배경음 제어 요청이 수신되면, 상기 통화중 배경음 제어 요청에 따른 배경음을 상기 응용 서버로부터터 수신하여 통화 음성에 합성하여 제공하는, 통화중 배경음 서비스 시스템.
  8. 제7항에서,
    상기 통화 메시지는,
    상기 발신 단말로부터 수신한 인바이트(INVITE) 메시지와 상기 착신 단말로부터 수신한 응답(200 OK) 메시지를 포함하는, 통화중 배경음 서비스 시스템.
  9. 제8항에서,
    상기 지능형 커뮤니케이션 플랫폼 장치는,
    상기 CSCF로부터 상기 응답(200 OK) 메시지가 수신되면, 써드파티 응용 서버와 통화중 배경음 제공을 위한 채널을 설정하는, 통화중 배경음 서비스 시스템.
  10. 제8항에서,
    상기 지능형 커뮤니케이션 플랫폼 장치는,
    상기 CSCF로부터 ACK 메시지가 수신되면, 상기 응용 서버에게 통화 시작 알림을 전송하는, 통화중 배경음 서비스 시스템.
  11. 응용 서버와 연동하여 상기 응용 서버로부터 수신한 음원을 통화중 배경음으로 송출하는 지능형 커뮤니케이션 플랫폼 장치, 그리고
    CSCF(Call Session Control Function)로부터 수신한 통화 메시지에 상기 지능형 커뮤니케이션 플랫폼 장치로부터 수신한 채널 정보를 이용하여 상기 지능형 커뮤니케이션 플랫폼 장치를 미디어 경로로 추가하고, 추가한 통화 메시지를 상기 CSCF로 전송하는 TAS(Telephony Application Server)를 포함하고,
    상기 지능형 커뮤니케이션 플랫폼 장치는,
    발신 단말과 착신 단말 간에 통화 연결이 된 이후, 상기 발신 단말로부터 통화중 배경음 제어 요청이 수신되면, 상기 통화중 배경음 제어 요청에 따른 배경음을 상기 응용 서버로부터터 수신하여 통화 음성에 합성하여 제공하는, 통화중 배경음 서비스 시스템.
  12. 제11항에서,
    상기 지능형 커뮤니케이션 플랫폼 장치는,
    상기 TAS로부터 채널 설정 완료가 수신되면, 상기 응용 서버에게 음원을 요청하여 수신하고,
    상기 채널 설정 완료는,
    상기 TAS가 상기 CSCF로부터 응답(200 OK) 메시지를 수신한 경우에 상기 지능형 커뮤니케이션 플랫폼 장치로 전달되는, 통화중 배경음 서비스 시스템.
  13. 제12항에서,
    상기 지능형 커뮤니케이션 플랫폼 장치는,
    상기 TAS로부터 통화 시작 알림을 수신하여 상기 응용 서버로 전송하고,
    상기 통화 시작 알림은,
    상기 TAS가 상기 CSCF로부터 ACK 메시지를 수신한 경우에, 상기 TAS로부터 상기 지능형 커뮤니케이션 플랫폼 장치로 전송되는, 통화중 배경음 서비스 시스템.
KR1020210149748A 2021-11-03 2021-11-03 통화중 배경음 서비스 방법 및 그 시스템 KR20230064303A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210149748A KR20230064303A (ko) 2021-11-03 2021-11-03 통화중 배경음 서비스 방법 및 그 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210149748A KR20230064303A (ko) 2021-11-03 2021-11-03 통화중 배경음 서비스 방법 및 그 시스템

Publications (1)

Publication Number Publication Date
KR20230064303A true KR20230064303A (ko) 2023-05-10

Family

ID=86386568

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210149748A KR20230064303A (ko) 2021-11-03 2021-11-03 통화중 배경음 서비스 방법 및 그 시스템

Country Status (1)

Country Link
KR (1) KR20230064303A (ko)

Similar Documents

Publication Publication Date Title
US9319528B2 (en) Method for announcing a calling party from a communication device
EP1890471B1 (en) A system and method for selecting ring-back tone in real time
US6546082B1 (en) Method and apparatus for assisting speech and hearing impaired subscribers using the telephone and central office
US8270957B2 (en) Method for managing a conference call in a telephone network
CN100524280C (zh) 参与通信会话的方法和装置
US20030112947A1 (en) Telecommunications and conference calling device, system and method
EP2306694B1 (en) Method, system and apparatus for controlling play of customized ring back tones
US20050206721A1 (en) Method and apparatus for disseminating information associated with an active conference participant to other conference participants
CN100531273C (zh) 用于提供复合服务的方法和系统
EP1175074A2 (en) IP-based Interactive Voice Response system for servicing calls from a PSTN
US20080232559A1 (en) Method for voice response and voice server
US20070004384A1 (en) Method and apparatus for providing personalized audio content delivery during telephony hold
US9020621B1 (en) Network based media enhancement function based on an identifier
EP2704340B1 (en) Time-shifting distribution of high definition audio data
US20140278402A1 (en) Automatic Channel Selective Transcription Engine
CN108347337A (zh) 会议通信方法和装置
US20140280991A1 (en) Dynamic Personalization of a Communication Session in Heterogeneous Environments
US20090299735A1 (en) Method for Transferring an Audio Stream Between a Plurality of Terminals
CN102077559A (zh) 用于在ims网络中实现定制化视频服务的方法和网络单元
KR20230064303A (ko) 통화중 배경음 서비스 방법 및 그 시스템
EP2249554B1 (en) A method for realizing characteristic ring back tone in multi-party session
CN101803357A (zh) 用于多媒体通信的方法、装置和系统
EP2087674B1 (en) Method to stream compressed digital audio over circuit switched, voice networks
EP2890097B1 (en) A system for and a method of presenting media data to communication clients in the course of a communication data exchange
WO2020031177A1 (en) A method and a system for controlling ringback tones