JP2007526699A - Method for reducing waiting time in push-to-talk service - Google Patents

Method for reducing waiting time in push-to-talk service Download PDF

Info

Publication number
JP2007526699A
JP2007526699A JP2007501131A JP2007501131A JP2007526699A JP 2007526699 A JP2007526699 A JP 2007526699A JP 2007501131 A JP2007501131 A JP 2007501131A JP 2007501131 A JP2007501131 A JP 2007501131A JP 2007526699 A JP2007526699 A JP 2007526699A
Authority
JP
Japan
Prior art keywords
audio data
push
communication network
participant
initial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007501131A
Other languages
Japanese (ja)
Inventor
マーティン ベッグストレーム,
アンデルス ラーション,
Original Assignee
テレフオンアクチーボラゲット エル エム エリクソン(パブル)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テレフオンアクチーボラゲット エル エム エリクソン(パブル) filed Critical テレフオンアクチーボラゲット エル エム エリクソン(パブル)
Publication of JP2007526699A publication Critical patent/JP2007526699A/en
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/06Selective distribution of broadcast services, e.g. multimedia broadcast multicast service [MBMS]; Services to user groups; One-way selective calling services
    • H04W4/10Push-to-Talk [PTT] or Push-On-Call services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/40Support for services or applications
    • H04L65/4061Push-to services, e.g. push-to-talk or push-to-video
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/80Responding to QoS
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W76/00Connection management
    • H04W76/40Connection management for selective distribution or broadcast
    • H04W76/45Connection management for selective distribution or broadcast for Push-to-Talk [PTT] or Push-to-Talk over cellular [PoC] services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/10Architectures or entities
    • H04L65/1016IP multimedia subsystem [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Transceivers (AREA)
  • Alarm Systems (AREA)

Abstract

A method of processing user speech data for transmission to a participant or participants in a Push to talk Over Cellular (PoC) session over a cellular telephone network. The method comprises, detecting an initial period of silence in the initial talk burst of the session, and removing that period of silence from the speech data prior to replaying of the speech data to the or each other participant. These signal processing steps may be carried out at one of the initiating terminal, the receiving terminal, or the IMS core.

Description

本発明は、プッシュツートークサービスにおける待ち時間を低減させる方法に関する。特に、本発明は、いわゆるセルを介するプッシュツートークサービスにおける待ち時間を低減する方法に関する。   The present invention relates to a method for reducing latency in a push-to-talk service. In particular, the present invention relates to a method for reducing latency in a so-called push-to-talk service via a cell.

プッシュツートークは、移動無線ハンドセットのユーザが1つのボタンを押して、或いは少なくとも少数のボタンを押して、ほぼ瞬間的に互いに通信することができるサービスの一般名称である。産業界では、パケットデータサービスを伴うGSMと3Gとを含む現行及び次世代セルラーネットワークに導入するためのプッシュツートークサービスを標準化する過程にある。上記サービスは、「セルを介するプッシュツートーク」(PoC)として知られている。   Push-to-talk is the general name for a service that allows mobile radio handset users to communicate with each other almost instantaneously by pressing one button or at least a few buttons. The industry is in the process of standardizing push-to-talk services for introduction into current and next generation cellular networks, including GSM with packet data services and 3G. The service is known as “Push-to-Talk over cells” (PoC).

PoCは、セルラーネットワークへの高度データサービス、特にリアルタイムマルチメディアサービスの導入を促進するために第3世代パートナーシッププロジェクトによって標準化されたIPマルチメディアサブシステム(IMS)を使用する。IMSは、マルチメディアIPベースセッションの設定及び制御のためにインターネット技術標準化委員会(IETF)によって規定されたセッション開始プロトコル(SIP)に従う。図1は、幾つかのユーザ端末、或いは3Gでいうところのユーザ装置(UE)1の間でPoCサービスを提供するセルラーネットワークの構成を概要的に示す図である。UE1は、それぞれの無線アクセスネットワーク2に接続される。無線アクセスネットワーク2は、同様にIMSコア3に接続される。IMSコア3内には、幾つかのサーバが存在する。サーバには、IMSサービスのセッション状態を維持する主SIPサーバである在圏呼セッション制御機能(S−CSCF)サーバ4が含まれる。また、IMSコア3内には、UE1にとって第1のコンタクトポイントであって、S−CSCFにSIPメッセージを転送するプロキシ呼セッション制御機能(P−CSCF)サーバ5が含まれる。IMSコア3内のサーバは、運用会社のネットワーク内及び複数のネットワーク間に分散される。さらに、PoCサーバ6は、IMS内に位置するか、又はIMSに接続される。PoCサーバ6は、3GPPによって規定されるようにメディアリソース機能(MRF)を組み込むようにしてもよい。   PoC uses the IP Multimedia Subsystem (IMS) standardized by the 3rd Generation Partnership Project to facilitate the introduction of advanced data services, especially real-time multimedia services, into cellular networks. IMS follows the Session Initiation Protocol (SIP) defined by the Internet Engineering Task Force (IETF) for setting up and controlling multimedia IP-based sessions. FIG. 1 is a diagram schematically showing a configuration of a cellular network that provides a PoC service among several user terminals or user equipment (UE) 1 in 3G. The UE 1 is connected to each radio access network 2. The radio access network 2 is similarly connected to the IMS core 3. There are several servers in the IMS core 3. The server includes a visited call session control function (S-CSCF) server 4 that is a main SIP server that maintains the session state of the IMS service. In addition, the IMS core 3 includes a proxy call session control function (P-CSCF) server 5 that is a first contact point for the UE 1 and transfers a SIP message to the S-CSCF. Servers in the IMS core 3 are distributed within the network of the operating company and among a plurality of networks. Furthermore, the PoC server 6 is located in the IMS or connected to the IMS. The PoC server 6 may incorporate a media resource function (MRF) as defined by 3GPP.

図2は、図1のネットワークを介するPoCセッションの設定に関連する一定の信号制御を示す図である(図示していないが、種々のノード間で追加メッセージが伝送されるようにしてもよい。)。加入者は、自身の端末UE#1の適当なボタンを押すことによりセッションを開始する。これによりSIP要求(SIP_INVITE)メッセージがIMSコアのPoCサーバを介して相手側の端末UE#2に送信される。その後、端末とIMSとの間で信号の伝送がさらに続けられる。上述したように、PoCの主要な課題は、端末同士の瞬時に近い接続である。したがって、送信する音声の大きな遅延は、回避されるべきである。   FIG. 2 is a diagram illustrating certain signal control associated with setting up a PoC session over the network of FIG. 1 (not shown, but additional messages may be transmitted between various nodes). ). The subscriber starts a session by pressing the appropriate button on his terminal UE # 1. As a result, a SIP request (SIP_INVITE) message is transmitted to the other terminal UE # 2 via the PoC server of the IMS core. Thereafter, signal transmission is further continued between the terminal and the IMS. As described above, the main problem of PoC is the connection between terminals that is almost instantaneous. Thus, large delays in the transmitted voice should be avoided.

SIP要求メッセージが送信され、IMSが着呼側から応答を受信する間の時間は、ネットワーク確立の本質的な特性(例えば、ページング、一時的ブロックの流れ(TBF)の確立など)により3秒程度となりうる。初期接続プロセスを高速化するために、着呼側がセッションを未だ受諾していなくとも、IMSからのSIP202受諾メッセージを端末により受信すると、開始(発呼側の)加入者は、通話を開始できる。受諾メッセージの受信は、通常、当該端末で音又は「ビープ音」を再生することによって開始加入者に伝達される。ネットワーク内のPoCサーバが相手側(着呼側)の端末からSIP200_OKメッセージを受信するまでの間、初期音声バーストは、当該PoCサーバによってバッファされてもよい。当該メッセージが受信されると、音声バーストは、相手側の端末に直ちに送信される。それにもかかわらず、着呼側により感じられる遅延は、かなり残っており、遅延をさらに減じることが望まれている。   The time between when the SIP request message is sent and the IMS receives the response from the callee is about 3 seconds due to the intrinsic characteristics of network establishment (eg, paging, establishment of temporary block flow (TBF), etc.) It can be. In order to speed up the initial connection process, the originating (calling) subscriber can initiate a call when the terminal receives a SIP 202 accept message from IMS, even though the called party has not yet accepted the session. The receipt of the acceptance message is usually communicated to the initiating subscriber by playing a sound or “beep” at the terminal. The initial voice burst may be buffered by the PoC server until the PoC server in the network receives the SIP 200_OK message from the partner (calling) terminal. When the message is received, the voice burst is immediately transmitted to the partner terminal. Nevertheless, the delay felt by the called party remains significant and it is desired to further reduce the delay.

本発明の発明者は、開始加入者が加入者の反応時間及びその「思考時間」の両方のため、音が再生された直後であっても通話を始めそうにないということを認識している。図2に例示するように、この遅延は、0.8秒の計算となる。   The inventor of the present invention recognizes that the initiating subscriber is unlikely to initiate a call even immediately after the sound is played, due to both the subscriber's reaction time and its “think time”. . As illustrated in FIG. 2, this delay is calculated as 0.8 seconds.

本発明の第1の形態は、通信ネットワークを介するプッシュツートークセッションの一人又は複数の参加者に送信するためのユーザの音声データを処理する方法である。本方法は、参加者又は他の各参加者に音声データを再生するのに先立って、音声データから初期沈黙期間を除去するステップを含む。   A first aspect of the present invention is a method of processing user voice data for transmission to one or more participants in a push-to-talk session over a communication network. The method includes removing an initial silence period from the audio data prior to playing the audio data to the participant or each other participant.

本発明は、プッシュツートークセッションの開始側によって提供される初期音声バーストから初期沈黙期間を除去することに、特に適している。これには、開始加入者による音声バーストの生成と参加者或いは他の各参加者への音声バーストの再生との間の遅延を低減させる効果がある。   The present invention is particularly suitable for removing the initial silence period from the initial speech burst provided by the initiator of a push-to-talk session. This has the effect of reducing the delay between the generation of the audio burst by the initiating subscriber and the playback of the audio burst to the participant or each other participant.

通信ネットワークは、セルラー電の話ネットワークであり、プッシュツートークサービスは、セルを介するプッシュツートーク(PoC)サービスであることが望ましい。   The communication network is a cellular telephony network, and the push-to-talk service is preferably a push-to-talk (PoC) service via a cell.

本発明の実施形態は、音声データを分析し、初期沈黙期間を特定するステップを含んでもよい。このステップは、開始側の端末、通信ネットワーク内のノード、又は受信端末において実行されてもよい。同様に、送信された音声データから検出される沈黙期間を除去するステップは、開始側の端末、通信ネットワーク内のノード、或いは受信端末において実行されてもよい。通信ネットワークがセルラー電話のネットワークであり、プッシュツートークサービスがPoCサービスである場合、ネットワークノードは、IPマルチメディアサブシステム(IMS)内に存在することが望ましい。   Embodiments of the invention may include analyzing audio data and identifying an initial silence period. This step may be performed at the initiating terminal, the node in the communication network, or the receiving terminal. Similarly, the step of removing the silence period detected from the transmitted voice data may be performed at the initiating terminal, the node in the communication network, or the receiving terminal. If the communication network is a cellular telephone network and the push-to-talk service is a PoC service, the network node is preferably present in the IP Multimedia Subsystem (IMS).

検出及び除去のステップが開始側の端末において実行される場合、検出のステップは、開始側の端末でのデータの記録の途中、又はその後に、音声データを分析するステップを含むようにしてもよい。   If the detection and removal steps are performed at the initiating terminal, the detecting step may include analyzing audio data during or after data recording at the initiating terminal.

本発明の実施形態は、音響レベルを監視するステップと、及びその音響レベルがある予め定められた閾値を超えるときのみに、音声の記録を開始するステップとを含むようにしてもよい。このステップは開始側の端末、又は通信ネットワーク内のサーバノードにおいて実行されてもよい。本発明の他の実施形態では、沈黙を含むと思われる初期期間が予め定められ、音声データの始めの部分は予め定められた期間を除去するために切り取られる。予め定められた期間は、固定であっても、またユーザの通話/使用パターンに基づいて適応されるようにしてもよい。   Embodiments of the present invention may include monitoring the sound level and starting recording audio only when the sound level exceeds a predetermined threshold. This step may be performed at the initiating terminal or a server node in the communication network. In another embodiment of the present invention, an initial period that is believed to include silence is predetermined, and the beginning portion of the audio data is clipped to remove the predetermined period. The predetermined period may be fixed or may be adapted based on the user's call / use pattern.

音声データから初期沈黙期間を除去するステップは、音声データが受信されるときにリアルタイムで実行されるか、又は格納若しくはバッファされた音声データを後に処理することにより実行されてもよい。   The step of removing the initial silence period from the audio data may be performed in real time as the audio data is received, or may be performed by later processing the stored or buffered audio data.

本発明の第2の形態は、加入者にプッシュツートークサービスを提供する通信ネットワークにおいて使用するサーバノードである。本ノードは、プッシュツートークセッションの参加者から音声データバーストを受信する受信機を含む。また、本ノードは、音声データバーストの初期沈黙期間を検出し、セッションの参加者、又は他の各参加者への送信に先立って、音声データから検出される沈黙期間を除去するプロセッサを含む。   A second aspect of the present invention is a server node used in a communication network that provides a push-to-talk service to subscribers. The node includes a receiver that receives a burst of audio data from a participant in a push-to-talk session. The node also includes a processor that detects an initial silence period of the audio data burst and removes the silence period detected from the audio data prior to transmission to a session participant or each other participant.

本サーバノードは、セルラー電話の通信ネットワークにおけるIPマルチメディアサブシステム内に配置されることが望ましい。さらに、本サーバノードは、在圏呼セッション制御機能(S−CSCF)サーバを有する1つ又はそれ以上のセッション開始プロトコル(SIP)サーバへのインタフェースを含むことが望ましい。   The server node is preferably located in an IP multimedia subsystem in a cellular telephone communication network. Further, the server node preferably includes an interface to one or more Session Initiation Protocol (SIP) servers having a Visited Call Session Control Function (S-CSCF) server.

本発明の第3の形態は、加入者にプッシュツートークサービスを提供する通信ネットワークにおいて使用する移動端末である。本移動端末は、端末のユーザから音声データを受信する受信機と、セッションの参加者、又は他の各参加者への送信に先立って、音声データから沈黙期間を除去するプロセッサとを含む。   A third aspect of the present invention is a mobile terminal used in a communication network that provides a push-to-talk service to a subscriber. The mobile terminal includes a receiver that receives audio data from a user of the terminal and a processor that removes a silence period from the audio data prior to transmission to a session participant or each other participant.

移動端末は、無線端末であり、通信ネットワークはセルを介するプッシュツートークサービスを提供するセルラー電話ネットワークであることが望ましい。   The mobile terminal is preferably a wireless terminal, and the communication network is preferably a cellular telephone network that provides a push-to-talk service over a cell.

移動端末は、端末のユーザにより使用される端末、又はセッションに参加する他の端末であってもよい。   The mobile terminal may be a terminal used by a user of the terminal or another terminal participating in the session.

セルを介するプッシュツートーク(PoC)セッションの確立に特有の遅延については、図1及び図2を参照して上述した。以下では、これらの遅延を十分に低減する機構について、幾つかの可能な実施形態を参照して記載する。本実施形態は、音を鳴らすか、或いは他の手段によってPoCセッションの参加者が通話を始めてよいことをその端末が指示した後に、しばらく時間が経過するまで、通話を始めないという事実に基づいている。   Delays specific to establishing a push-to-talk (PoC) session over a cell have been described above with reference to FIGS. In the following, a mechanism for sufficiently reducing these delays will be described with reference to some possible embodiments. This embodiment is based on the fact that it does not start a call until some time has passed after the terminal indicates that the PoC session participant may start the call by sounding or by other means. Yes.

本発明の第1の実施形態において、PoCサーバのメディアリソース機能(MRF)は、PoCセッションの開始に続いて開始加入者の移動端末(UE#1)から送信される初期音声バーストの受信を開始する。このバーストは、例えば0.8秒継続する可能性のある初期沈黙期間、又は背景雑音を含み、UE#1からPoCサーバへ幾つかのリアルタイムプロトコル(RTP)フレームで伝送される。PoCサーバは、受信した音声データをバッファし、セッションの他の参加者からSIP200_OKメッセージの受信(他の参加者からの受諾)を待つ。これは、数ミリ秒から数秒を要する可能性がある。この時間の間に、PoCサーバは、初期沈黙期間の長さを決定するためにバッファされたデータを分析し、一度識別されたその期間を除去するためにデータを切り取る。SIP200_OKメッセージの受信に続いて、PoCサーバは、バッファの先頭から切り取った音声の送信を開始する。   In the first embodiment of the present invention, the media resource function (MRF) of the PoC server starts receiving the initial voice burst transmitted from the initiating subscriber's mobile terminal (UE # 1) following the start of the PoC session. To do. This burst includes an initial silence period, which may last for example 0.8 seconds, or background noise, and is transmitted in several real-time protocol (RTP) frames from UE # 1 to the PoC server. The PoC server buffers the received voice data and waits for reception of a SIP 200_OK message (acceptance from other participants) from other participants in the session. This can take from a few milliseconds to a few seconds. During this time, the PoC server analyzes the buffered data to determine the length of the initial silence period and cuts the data to remove that period once identified. Following the reception of the SIP 200_OK message, the PoC server starts transmitting the voice cut from the head of the buffer.

図3は、セッションの手順に関連する信号制御を示す図である。上述したように、IMSコアのPoCサーバは、着呼側を呼び出す(ここでは、参加者が2人のみである場合を例示する。)。一方、PoCサーバは、同時に「発言権」をUE#1(MS#1)に与える。音声バーストから初期沈黙期間を除去することによって、音声は、UE#2(MS#2)によってその他の場合より0.8秒早く受信される。全体のセッションは、同じ時間だけ早められる。したがって、参加者におけるリアルタイム性の実感を高めることが理解されるであろう。   FIG. 3 is a diagram illustrating signal control related to a session procedure. As described above, the PoC server of the IMS core calls the called party (here, a case where there are only two participants is illustrated). On the other hand, the PoC server simultaneously gives the “speaking right” to UE # 1 (MS # 1). By removing the initial silence period from the voice burst, the voice is received by UE # 2 (MS # 2) 0.8 seconds earlier than otherwise. The entire session is advanced by the same amount of time. Therefore, it will be understood that the real feeling of the participants is enhanced.

初期沈黙期間の存在及び持続時間の決定プロセスは、PoCサーバにおいて受信した音声信号の音量を分析することによって行われる。音量が予め定められた閾値を超えると、通話が始まり、かつ、沈黙期間が終わったと想定される。もちろん、さらに高度なアルゴリズムが使用されてもよい。例えば、音声信号は、通話に特有のパターンの存在によって分析されてもよい。これにより、誤った通話指示を行うことから背景雑音の存在が抑制される。他の手法では、音声が鳴った後のある固定期間、例えば、0.8秒の間通話は始まりえないと想定し、その期間を音声バーストの始まりから除去する。開始側(発呼側)の振る舞い、或いは加入者グループの統計的に分析された振る舞いに応じて、この期間の長さは動的に適応されてもよい。   The process of determining the existence and duration of the initial silence period is performed by analyzing the volume of the audio signal received at the PoC server. When the volume exceeds a predetermined threshold, it is assumed that the call has started and the silence period has ended. Of course, more sophisticated algorithms may be used. For example, the audio signal may be analyzed by the presence of a call specific pattern. As a result, the presence of background noise is suppressed because an incorrect call instruction is given. Another approach assumes that the call cannot begin for a fixed period after the sound is heard, for example 0.8 seconds, and removes that period from the beginning of the speech burst. Depending on the initiator (calling party) behavior or the statistically analyzed behavior of the subscriber group, the length of this period may be dynamically adapted.

上述した手法は、IMSコア内において実行される音声分析手順及び沈黙期間の除去に基づいている。この手法を達成するために十分な処理能力を提供することは問題にならない。しかしながら、開始側の端末において、十分な処理能力が利用可能であれば、これらのステップは開始側の端末で実行されてもよい。即ち、開始側の端末における適当な音声の鳴動に続いて、直ちに、開始側の端末は、ユーザの音声を分析し、初期沈黙期間の長さを決定する。また、開始側の端末において、IMSコアからの「通話指示」メッセージが受信されるのに先立って、音声が鳴らされてもよい。   The approach described above is based on speech analysis procedures performed within the IMS core and silence period elimination. Providing sufficient processing power to achieve this approach is not a problem. However, these steps may be performed at the initiating terminal as long as sufficient processing power is available at the initiating terminal. That is, immediately after appropriate sounding at the initiating terminal, the initiating terminal analyzes the user's voice and determines the length of the initial silence period. In addition, at the initiating terminal, a sound may be played prior to receiving the “call instruction” message from the IMS core.

初期音声バーストの分析及び修正は、代わりに受信端末(又は、セッションに3人以上の参加者が含まれれば、複数の受信端末)において実行されてもよい。しかしながら、受信端末とIMSコアとの間のインタフェースを介するデータ伝送速度が通話速度より十分に速く、再生に先立って、受信音声の「展開」が間に合うことが必要である。このような場合、上述した他の解決手法により達成されるほどの効果がなくとも、初期沈黙期間の検出と除去によってセッションの遅延は、十分に低減されるであろう。   Analysis and modification of the initial speech burst may instead be performed at the receiving terminal (or multiple receiving terminals if the session includes more than two participants). However, it is necessary that the data transmission rate via the interface between the receiving terminal and the IMS core is sufficiently faster than the call rate, and that the “development” of the received voice is in time before playback. In such a case, the session delay will be sufficiently reduced by the detection and removal of the initial silence period, even if not as effective as achieved by the other solutions described above.

セルを介するプッシュツートークサービスを加入者に提供するセルラー電話における通信ネットワークの概要を示す図である。It is a figure which shows the outline | summary of the communication network in the cellular telephone which provides the subscriber with the push-to-talk service via a cell. セルを介するプッシュツートークセッションの設定フェーズ及び初期音声バーストに関連する信号制御を示す図である。FIG. 7 illustrates signal control associated with a setup phase of a push-to-talk session over a cell and an initial voice burst. セルを介するプッシュツートークセッションの改善された設定フェーズ及び初期音声バーストに関連する信号制御を示す図である。FIG. 6 illustrates the improved setup phase of a push-to-talk session over a cell and signal control associated with an initial voice burst.

Claims (18)

通信ネットワークを介するプッシュツートークのセッションにおいて、一人又は複数の参加者に送信するためのユーザの音声データを処理するための方法であって、
前記参加者又は他の各参加者へ前記音声データを再生するのに先立って、該音声データから初期沈黙期間を除去するステップを
含むことを特徴とする方法。
A method for processing user voice data for transmission to one or more participants in a push-to-talk session over a communication network comprising:
Removing the initial silence period from the audio data prior to playing the audio data to the participant or each of the other participants.
前記音声データは、
前記プッシュツートークの開始側によって提供される初期音声バーストである
ことを特徴とする請求項1に記載の方法。
The audio data is
The method of claim 1, wherein the initial speech burst provided by the push-to-talk initiator.
前記通信ネットワークは、セルラー電話ネットワークであり、
前記プッシュツートークは、セルを介するプッシュツートークサービスである
ことを特徴とする請求項1又は2に記載の方法。
The communication network is a cellular telephone network;
The method according to claim 1 or 2, wherein the push-to-talk is a push-to-talk service via a cell.
前記初期沈黙期間を特定するために、前記音声データを分析するステップを
さらに含むことを特徴とする1乃至3の何れかに記載の方法。
4. A method according to any of claims 1 to 3, further comprising analyzing the audio data to identify the initial silence period.
前記初期沈黙期間を特定するために、前記音声データを分析するステップと、除去するステップとは、
前記参加者又は他の各参加者からの受諾を、セッションの前記通信ネットワークで受理されるのに先立って実行される
ことを特徴とする請求項2及び3に従属する請求項4に記載の方法。
Analyzing and removing the audio data to identify the initial silence period;
5. A method according to claim 2 when dependent on claims 2 and 3, characterized in that an acceptance from the participant or each other participant is performed prior to being accepted in the communication network of a session. .
前記初期沈黙期間を特定するために、前記音声データを分析するステップは、
前記開始側の端末、前記通信ネットワーク内のノード、又は受信側の端末の1つで実行される
ことを特徴とする請求項4又は5に記載の方法。
Analyzing the audio data to identify the initial silence period;
The method according to claim 4 or 5, wherein the method is executed at one of the initiating terminal, a node in the communication network, or a receiving terminal.
送信された前記音声データから前記初期沈黙期間を除去するステップは、
前記開始側の端末、前記通信ネットワーク内のノード、又は受信側の端末で実行される
ことを特徴とする請求項1乃至6の何れかに記載の方法。
Removing the initial silence period from the transmitted audio data;
7. The method according to claim 1, wherein the method is executed by the initiating terminal, a node in the communication network, or a receiving terminal.
前記ネットワーク内のノードは、メディアリソース機能を有するノードである
ことを特徴とする請求項3に従属する請求項7に記載の方法。
The method according to claim 7, when dependent on claim 3, wherein the node in the network is a node having a media resource function.
前記ネットワーク内のノードは、IPマルチメディアサブシステム(IMS)内に配置される
ことを特徴とする請求項3に従属する請求項7に記載の方法。
8. A method according to claim 7, when dependent on claim 3, wherein the nodes in the network are located in an IP multimedia subsystem (IMS).
通話が開始されたことを判断するために、音響レベルを監視するステップを
さらに含むことを特徴とする請求項1乃至9の何れかに記載の方法。
10. A method as claimed in any preceding claim, further comprising the step of monitoring the sound level to determine that a call has been initiated.
沈黙を含むことを予期して、初期期間を予め定義するステップと、
前記予め定められた初期期間を除く前記音声データの始めの部分を切り取るステップと
をさらに含むことを特徴とする請求項1乃至9の何れかに記載の方法。
Pre-defining an initial period in anticipation of including silence;
10. The method according to claim 1, further comprising a step of cutting off a beginning portion of the audio data excluding the predetermined initial period.
前記予め定められた初期期間は、固定されるか、或いは加入者の振る舞いに従って適応される
ことを特徴とする請求項11に記載の方法。
12. The method of claim 11, wherein the predetermined initial period is fixed or adapted according to subscriber behavior.
加入者にプッシュツートークサービスを提供する通信ネットワークにおけるユーザのためのサーバノードであって、
プッシュツートークセッションにおける参加者から音声データバーストを受信する受信機と、
前記音声データバーストにおける初期沈黙期間を検知し、前記プッシュツートークセッションにおける参加者又は他の各参加者に前記音声データバーストを送信するのに先立って、該音声データバーストから前記検知された初期沈黙期間を除去するプロセッサと
を含むことを特徴とするサーバノード。
A server node for a user in a communication network providing a push-to-talk service to a subscriber,
A receiver for receiving a burst of audio data from a participant in a push-to-talk session;
Detecting an initial silence period in the audio data burst and prior to transmitting the audio data burst to a participant or each other participant in the push-to-talk session, the detected initial silence from the audio data burst. A server node comprising a processor for removing a period.
セルラー電話の通信ネットワークにおけるIPマルチメディアシステム内に配置され、
在圏呼セッション制御機能(S−CSCF)サーバを有する1つ又はそれ以上のセッション開始プロトコル(SIP)へのインタフェースを
さらに含むことを特徴とする請求項13に記載のサーバノード。
Located in an IP multimedia system in a cellular telephone communication network,
14. The server node of claim 13, further comprising an interface to one or more session initiation protocols (SIP) having a visited call session control function (S-CSCF) server.
加入者にプッシュツートークサービスを提供する通信ネットワークにおけるユーザのための移動端末であって、
端末のユーザから音声データを受信する受信機と、
セッションにおける参加者又は他の各参加者に前記音声データを送信するのに先立って、該音声データから沈黙期間を除去するプロセッサと
を含むことを特徴とする移動端末。
A mobile terminal for a user in a communication network that provides a push-to-talk service to a subscriber,
A receiver for receiving voice data from a user of the terminal;
A mobile terminal comprising: a processor for removing a silence period from audio data prior to transmitting the audio data to a participant in a session or each other participant.
前記移動端末は、無線端末であり、
前記通信ネットワークは、セルを介するプッシュツートークサービスを提供するセルラー電話のネットワークである
ことを特徴とする請求項15に記載の移動端末。
The mobile terminal is a wireless terminal;
The mobile terminal according to claim 15, wherein the communication network is a cellular telephone network that provides a push-to-talk service via a cell.
前記受信機は、
アナログ又はデジタル電気信号に音声を変換するための手段を
含むことを特徴とする請求項15又は16に記載の移動端末。
The receiver
17. A mobile terminal according to claim 15 or 16, comprising means for converting speech into an analog or digital electrical signal.
前記受信機は、
前記通信ネットワークのようなインタフェースを介して相手側の移動端末で生成された音声データを受信するための手段を
含むことを特徴とする請求項15又は16に記載の移動端末。
The receiver
17. The mobile terminal according to claim 15 or 16, further comprising means for receiving voice data generated by a counterpart mobile terminal via an interface such as the communication network.
JP2007501131A 2004-03-04 2004-03-04 Method for reducing waiting time in push-to-talk service Pending JP2007526699A (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2004/050253 WO2005096646A1 (en) 2004-03-04 2004-03-04 Reducing latency in push to talk services

Publications (1)

Publication Number Publication Date
JP2007526699A true JP2007526699A (en) 2007-09-13

Family

ID=34957215

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007501131A Pending JP2007526699A (en) 2004-03-04 2004-03-04 Method for reducing waiting time in push-to-talk service

Country Status (7)

Country Link
US (1) US7953396B2 (en)
EP (1) EP1749410B1 (en)
JP (1) JP2007526699A (en)
CN (1) CN100539724C (en)
AT (1) ATE438271T1 (en)
DE (1) DE602004022340D1 (en)
WO (1) WO2005096646A1 (en)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8503355B2 (en) * 2004-03-17 2013-08-06 France Telecom Method, server, and system for managing “push-to-talk” session
JP4890002B2 (en) * 2005-10-28 2012-03-07 京セラ株式会社 COMMUNICATION DEVICE, COMMUNICATION SYSTEM, AND COMMUNICATION METHOD
CN100456885C (en) * 2005-12-15 2009-01-28 华为技术有限公司 Method and system for establishing dialed user connection
US20090313010A1 (en) * 2008-06-11 2009-12-17 International Business Machines Corporation Automatic playback of a speech segment for media devices capable of pausing a media stream in response to environmental cues
CN101640849A (en) * 2008-07-31 2010-02-03 华为技术有限公司 Communication time control method and device
CN106912030B (en) * 2015-12-22 2021-03-12 大唐移动通信设备有限公司 Group calling method and device
WO2021142018A1 (en) * 2020-01-06 2021-07-15 Cubic Corporation Chirp signal filtering for digital gateway

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5157728A (en) * 1990-10-01 1992-10-20 Motorola, Inc. Automatic length-reducing audio delay line
US5568511A (en) * 1992-08-26 1996-10-22 Ericsson Ge Mobile Communications Inc. System and method for radio disconnect and channel access for digitized speech trunked radio systems
US6725053B2 (en) * 2001-05-15 2004-04-20 Qualcomm Incorporated Method and apparatus for reducing latency in waking up a group of dormant communication devices
US6999921B2 (en) * 2001-12-13 2006-02-14 Motorola, Inc. Audio overhang reduction by silent frame deletion in wireless calls
US8576878B2 (en) * 2002-06-04 2013-11-05 Nokia Corporation Method for controlling parties in real-time data communication
US20040121812A1 (en) * 2002-12-20 2004-06-24 Doran Patrick J. Method of performing speech recognition in a mobile title line communication device
US9015338B2 (en) * 2003-07-23 2015-04-21 Qualcomm Incorporated Method and apparatus for suppressing silence in media communications

Also Published As

Publication number Publication date
CN1926894A (en) 2007-03-07
EP1749410B1 (en) 2009-07-29
WO2005096646A1 (en) 2005-10-13
US20070281672A1 (en) 2007-12-06
CN100539724C (en) 2009-09-09
ATE438271T1 (en) 2009-08-15
DE602004022340D1 (en) 2009-09-10
EP1749410A1 (en) 2007-02-07
US7953396B2 (en) 2011-05-31

Similar Documents

Publication Publication Date Title
JP4653585B2 (en) PTT service system and method for synchronization in service shaded areas
KR101083913B1 (en) Buffering initial talk burst
EP1271973B1 (en) Dispatch call origination and set up in a cdma mobile communication system
US8406801B1 (en) Communication systems and methods
JP5335930B2 (en) Reduce the occurrence of on-hold VOIP calls so that they are not interrupted in the EV-DO system
JP4542157B2 (en) How to compensate for delay
JP2006512017A (en) How to reduce call setup delay
JP4728251B2 (en) Method for reducing or compensating for delays associated with PTT and other real-time interactive communication exchange processes
EP2262322A1 (en) Method, system and equipment for shifting call based on a mobile terminal with the same number and a soft terminal
JP5038141B2 (en) Apparatus and method for providing push-to-talk over cellular (PoC) dynamic service options
KR100640362B1 (en) Method for serving in the push to talk portable terminal
JP2007518373A (en) Method and apparatus for facilitating initiation of a PTT session using an IP-based protocol
KR20080094099A (en) System and method for providing an early notification when paging a wireless device
JP2009500925A (en) System and method for resolving conflicts in many simultaneous communications in a wireless system
JP2008516538A (en) Push-talk voice buffering system and method in wireless communication calls
US20040151158A1 (en) Method and apparatus for exchanging voice over data channels in near real time
KR20050035049A (en) Call setup method for push-to-talk service in cellular mobile telecommunications system
JP2007526699A (en) Method for reducing waiting time in push-to-talk service
KR100823863B1 (en) Cellular communication system messaging
EP1649379B1 (en) Method and apparatus for point to multi-point communications
JP4644813B2 (en) Multi-party call system, call terminal and call server in multi-party call system, multi-party call method
US7426379B1 (en) Method and system for sound mitigation during initiation of a packet-based real-time media session
CN110691333A (en) Public network talkback method
RU2370910C2 (en) Reply modes in push-to-talk mobile communication services
JP2004032296A (en) Communication unit

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090731

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090814

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100129