JP2006042345A - Pttサービスのための移動通信端末機の発言権管理装置及び方法 - Google Patents

Pttサービスのための移動通信端末機の発言権管理装置及び方法 Download PDF

Info

Publication number
JP2006042345A
JP2006042345A JP2005213514A JP2005213514A JP2006042345A JP 2006042345 A JP2006042345 A JP 2006042345A JP 2005213514 A JP2005213514 A JP 2005213514A JP 2005213514 A JP2005213514 A JP 2005213514A JP 2006042345 A JP2006042345 A JP 2006042345A
Authority
JP
Japan
Prior art keywords
voice
speak
input
ptt
main processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005213514A
Other languages
English (en)
Inventor
Guk-Chan Lim
グク−チャン リン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of JP2006042345A publication Critical patent/JP2006042345A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W88/00Devices specially adapted for wireless communication networks, e.g. terminals, base stations or access point devices
    • H04W88/02Terminal devices
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/38Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
    • H04B1/40Circuits
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/02Details
    • H04L12/16Arrangements for providing special services to substations
    • H04L12/18Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/725Cordless telephones
    • H04M1/72502Cordless telephones with one base station connected to a single line
    • H04M1/72505Radio link set-up procedures
    • H04M1/72513On hold, intercom or transfer communication modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/74Details of telephonic subscriber devices with voice recognition means
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/06Selective distribution of broadcast services, e.g. multimedia broadcast multicast service [MBMS]; Services to user groups; One-way selective calling services
    • H04W4/10Push-to-Talk [PTT] or Push-On-Call services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W76/00Connection management
    • H04W76/40Connection management for selective distribution or broadcast
    • H04W76/45Connection management for selective distribution or broadcast for Push-to-Talk [PTT] or Push-to-Talk over cellular [PoC] services

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Transmitters (AREA)

Abstract

【課題】 使用者により入力される音声を認識するためにPTT端末が使用する資源を最小化できる、PTTサービスのための移動通信端末機の発言権管理装置及び方法を提供する。
【解決手段】 音声認識プロセッサを有するPTT端末に、マイクから音声が入力されるとトリガ信号を発生する音声活性検出器を含ませて、音声認識プロセッサを、入力される音声によりトリガ信号が発生する時点から所定時間駆動して、入力される音声を確認する。ここで、入力される音声が発言権の要求又は解除に関する音声であると、PTT端末のメインプロセッサ部が発言権要求メッセージ又は発言権解除メッセージをPTTサーバーに転送する。
【選択図】 図1

Description

本発明は、移動通信端末機に関し、特に、PTT(Push To Talk)サービスのための移動通信端末機において、音声の検出及び認識を利用して発言権を管理する装置及び方法に関する。
PTTサービスとは、一人の使用者のみに発言権が与えられる半二重通信であって、使用者の選択によって一対一又は一対グループ通話を提供する。
前記一対グループ通話は、多数の通話相手を対象にPTTサービスを実現するもので、特定の使用者が多数の使用者又はグループを選択してPTTキーを押すと、PTTサーバーにより、PTTサービスのための移動通信端末機(以下、PTT端末という)間にセッションが作成され、前記選択された全ての使用者はセッションに参加して音声データを送受信できるようになる。
前記セッションが設定された全てのPTT端末は、PTT通信が可能であるが、音声データを転送するためには発言権を獲得しなければならず、前記PTTサーバーは、前記セッションに参加した使用者のうち一人の使用者のみが音声データを転送できるように発言権を管理する。
従来、使用者が発言権を要求するか、又は自分に与えられた発言権を解除するためには、前記PTT端末に設定されたPTTキーを押したり放したりする一連の動作を行わなければならないため、使用者が手を使用できない場合や前記の動作を数回行う場合に手間がかかるという問題があった。
前記の問題は、前記発言権を要求及び解除する過程を、前記PTTキーの操作ではなく、音声認識を利用して行うことにより解決することができる。即ち、発言権を要求する場合と発言権を解除する場合に使用するために予め設定した単語を、使用者がPTT端末に音声で入力すると、PTT端末は、入力された音声を認識して発言権を要求する音声であるか解除する音声であるかを確認し、確認結果によって、発言権要求メッセージ又は発言権解除メッセージをPTTサーバーに転送する。
しかしながら、このように音声認識を利用して発言権を管理する場合、PTT端末は、使用者から入力される音声を正確に認識するために、電源を含む多くの資源を必要とする。即ち、限られた資源を使用するPTT端末において、マイクからの音声入力を持続的に監視するために電源が必要であり、前記マイクから入力される音声を正確に認識するために音声認識のための各種ソフトウェア又はハードウェア的なプロセッサが必要であるため、多くの資源を浪費して非効率的であるという問題があった。
本発明は、このような従来技術の問題を解決するためになされたもので、使用者により入力される音声を認識するためにPTT端末が使用する資源を最小化できる、PTTサービスのための移動通信端末機の発言権管理装置及び方法を提供することを目的とする。
このような目的を達成するために、本発明によるPTTサービスのための移動通信端末機の発言権管理装置は、マイクから音声が入力されるとトリガ信号を発生する音声活性検出器と、前記トリガ信号を検出して音声認識プロセッサの動作を制御し、音声認識結果によって発言権及び音声通話を制御するメインプロセッサ部と、前記マイクから入力される音声を一時的に保存するバッファとを含むことを特徴とする。
さらに、本発明によるPTTサービスのための移動通信端末機の発言権管理方法は、メインプロセッサ部がマイクから入力される音声により発生したトリガ信号を検出する過程と、前記メインプロセッサ部が音声認識プロセッサを動作させて前記入力された音声を確認する過程と、前記入力された音声が発言権に関する音声であると、前記メインプロセッサ部が該当発言権に関するメッセージをPTTサーバーに転送する過程とを含むことを特徴とする。
また、本発明によるPTTサービスのための移動通信端末機の発言権管理方法は、マイクから音声が入力されると、音声活性検出器がトリガ信号を発生する過程と、前記トリガ信号を検出したメインプロセッサ部が、音声認識プロセッサを所定時間駆動して前記入力された音声を確認する過程と、前記音声が発言権を要求する音声であると、前記メインプロセッサ部が発言権要求メッセージをPTTサーバーに転送する過程と、前記音声が発言権を解除する音声であると、前記メインプロセッサ部が発言権解除メッセージを前記PTTサーバーに転送する過程とを含むことを他の特徴とする。
また、本発明によるPTTサービスのための移動通信端末機の発言権管理方法は、メインプロセッサ部が入力された音声により音声活性検出器から発生したトリガ信号を検出する過程と、前記メインプロセッサ部が音声認識プロセッサを駆動して前記入力された音声を確認した後、前記音声認識プロセッサを終了する過程と、前記入力された音声が発言権を要求するための音声であると、前記メインプロセッサ部が発言権要求メッセージをPTTサーバーに転送する過程と、発言権が獲得されると、前記メインプロセッサ部が前記入力された音声を前記PTTサーバーに転送しバッファに保存する過程と、前記音声活性検出器からトリガ信号が発生すると、前記メインプロセッサ部が前記音声認識プロセッサを駆動して前記入力された音声を確認した後、前記音声認識プロセッサを終了する過程と、前記入力された音声が発言権を解除するための音声であると、前記メインプロセッサが発言権解除メッセージを前記PTTサーバーに転送する過程とを含むことをさらに他の特徴とする。
上記目的を達成するために、本発明は、例えば、以下の手段を提供する。
(項目1)
PTT(Push To Talk)サービスのための移動通信端末機において、
マイクから音声が入力されるとトリガ信号を発生する音声活性検出器と、
前記トリガ信号を検出して音声認識プロセッサの動作を制御し、音声認識結果によって発言権及び音声通話を制御するメインプロセッサ部と、
前記マイクから入力される音声を一時的に保存するバッファと、
を含むことを特徴とする発言権管理装置。
(項目2)
前記音声活性検出器は、音声が入力されると、ローからハイ又はハイからローにトリガされる信号を発生することを特徴とする項目1に記載の発言権管理装置。
(項目3)
前記メインプロセッサ部は、前記入力された音声が発言権を要求するために設定された音声であると、発言権要求メッセージをPTTサーバーに転送し、前記入力された音声が発言権を解除するために設定された音声であると、発言権解除メッセージをPTTサーバーに転送することを特徴とする項目1に記載の発言権管理装置。
(項目4)
前記バッファが、先入れ先出し(First In First Out;FIFO)方式で動作することを特徴とする項目1に記載の発言権管理装置。
(項目5)
メインプロセッサ部がマイクから入力される音声により発生したトリガ信号を検出する過程と、
前記メインプロセッサ部が音声認識プロセッサを動作させて前記入力された音声を確認する過程と、
前記入力された音声が発言権に関する音声であると、前記メインプロセッサ部が該当発言権に関するメッセージをPTTサーバーに転送する過程と、
を含むことを特徴とするPTTサービスのための移動通信端末機の発言権管理方法。
(項目6)
前記入力された音声を確認する過程は、
前記メインプロセッサ部が、前記音声認識プロセッサを前記トリガ信号の発生時点から所定時間動作させて前記音声を確認した後、前記音声認識プロセッサを終了する過程をさらに含むことを特徴とする項目5に記載のPTTサービスのための移動通信端末機の発言権管理方法。
(項目7)
前記発言権に関するメッセージを転送する過程は、
前記入力された音声が発言権を要求するために設定された音声であると、前記メインプロセッサ部が発言権要求メッセージを前記PTTサーバーに転送する過程と、
前記入力された音声が発言権を解除するために設定された音声であると、前記メインプロセッサ部が発言権解除メッセージを前記PTTサーバーに転送する過程と、
を含むことを特徴とする項目5に記載のPTTサービスのための移動通信端末機の発言権管理方法。
(項目8)
前記トリガ信号が、ローからハイ又はハイからローにトリガされることを特徴とする項目5に記載のPTTサービスのための移動通信端末機の発言権管理方法。
(項目9)
マイクから音声が入力されると、音声活性検出器がトリガ信号を発生する過程と、
前記トリガ信号を検出したメインプロセッサ部が、音声認識プロセッサを所定時間駆動して前記入力された音声を確認する過程と、
前記音声が発言権を要求する音声であると、前記メインプロセッサ部が発言権要求メッセージをPTTサーバーに転送する過程と、
前記音声が発言権を解除する音声であると、前記メインプロセッサ部が発言権解除メッセージを前記PTTサーバーに転送する過程と、
を含むことを特徴とするPTTサービスのための移動通信端末機の発言権管理方法。
(項目10)
前記トリガ信号が、ローからハイ又はハイからローにトリガされることを特徴とする項目9に記載のPTTサービスのための移動通信端末機の発言権管理方法。
(項目11)
前記音声認識プロセッサを駆動する時間が、前記発言権を要求する音声又は前記発言権を解除する音声を発音するに十分な時間であることを特徴とする項目9に記載のPTTサービスのための移動通信端末機の発言権管理方法。
(項目12)
前記発言権を要求する音声が、「要求」、「開始」、又は使用者により設定される他の音声の少なくとも1つであることを特徴とする項目9に記載のPTTサービスのための移動通信端末機の発言権管理方法。
(項目13)
前記発言権を解除する音声が、「解除」、「終了」、又は使用者により設定される他の音声の少なくとも1つであることを特徴とする項目9に記載のPTTサービスのための移動通信端末機の発言権管理方法。
(項目14)
発言権が獲得されると、前記メインプロセッサ部が、前記マイクから入力される使用者の音声を前記PTTサーバーに転送すると共にバッファに保存する過程をさらに含むことを特徴とする項目9に記載のPTTサービスのための移動通信端末機の発言権管理方法。
(項目15)
前記バッファが、先入れ先出し(FIFO)方式で動作することを特徴とする項目14に記載のPTTサービスのための移動通信端末機の発言権管理方法。
(項目16)
メインプロセッサ部が入力された音声により音声活性検出器から発生したトリガ信号を検出する過程と、
前記メインプロセッサ部が音声認識プロセッサを駆動して前記入力された音声を確認した後、前記音声認識プロセッサを終了する過程と、
前記入力された音声が発言権を要求するための音声であると、前記メインプロセッサ部が発言権要求メッセージをPTTサーバーに転送する過程と、
発言権が獲得されると、前記メインプロセッサ部が前記入力された音声を前記PTTサーバーに転送しバッファに保存する過程と、
前記音声活性検出器からトリガ信号が発生すると、前記メインプロセッサ部が前記音声認識プロセッサを駆動して前記入力された音声を確認した後、前記音声認識プロセッサを終了する過程と、
前記入力された音声が発言権を解除するための音声であると、前記メインプロセッサが発言権解除メッセージを前記PTTサーバーに転送する過程と、
を含むことを特徴とするPTTサービスのための移動通信端末機の発言権管理方法。
(項目17)
前記入力された音声により発生したトリガ信号が、ローからハイにトリガされる信号であることを特徴とする項目16に記載のPTTサービスのための移動通信端末機の発言権管理方法。
(項目18)
前記発言権が獲得された場合、発生するトリガ信号は、使用者が音声の入力を所定時間停止すると、ハイからローにトリガされる信号であることを特徴とする項目16に記載のPTTサービスのための移動通信端末機の発言権管理方法。
(項目19)
前記バッファが、先入れ先出し(FIFO)方式で動作することを特徴とする項目16に記載のPTTサービスのための移動通信端末機の発言権管理方法。
(項目20)
前記バッファが、前記発言権を解除するための音声を保存できる程度のサイズを有することを特徴とする項目16に記載のPTTサービスのための移動通信端末機の発言権管理方法。
本発明によるPTTサービスのための移動通信端末機の発言権管理装置及び方法においては、音声認識を利用して発言権を要求及び解除する場合、音声認識プロセッサの動作を開始及び終了する時点を定義することにより、持続的に音声を認識するためのプロセッサにより、電源及び不要なハードウェア資源の浪費を最小化するという効果がある。
以下、添付の図面を参照して、発明によるPTTサービスのための移動通信端末機の発言権管理装置及び方法の好ましい実施形態を説明する。
本発明によるPTT端末は、使用者によりマイクから音声が入力されるとトリガ信号を発生する音声活性検出器をさらに含む。即ち、本発明によるPTT端末においては、使用者により特定の音声が入力されると、前記音声活性検出器は、トリガ信号を発生し、メインプロセッサ部は、前記トリガ信号を検出した時点から前記入力された音声を認識するための一連の過程を行う。
本発明による発言権を要求及び解除する過程を使用者の音声で実現する方法において、使用者の音声を認識する音声認識プロセッサの開始又は終了時点、及び音声認識結果によって、PTT端末がPTTサーバーに発言権要求メッセージ又は発言権解除メッセージを転送する過程について説明する。
図1は、本発明によるPTT端末の構成を示すブロック図で、PTT端末100のマイク101から音声が入力されるとトリガ信号を発生する音声活性検出器102と、マイク101から入力された音声を符号化するか、又は通話相手の音声を復号化してスピーカー104に出力する音声変換部103と、高周波音声信号を送受信する高周波処理部106と、高周波処理部106を利用して通話及び音声認識を処理するメインプロセッサ部105と、メインプロセッサ部105の動作のための各種プログラム及びデータを保存するメモリ部107とを含む。
また、マイク101から入力される使用者の音声を認識するために一時的に保存するバッファ(図示せず)をさらに含む。このとき、前記バッファは、メインプロセッサ部105に含むこともでき、別個に存在することもでき、先に入力された音声が先に出力される先入れ先出し(First In First Out;以下、FIFOという)方式で動作する。
図2A及び図2Bは、本発明による発言権管理方法のフローを示す図で、PTT端末が使用者の音声を認識して発言権を要求又は解除する方法を示す。
まず、音声認識を利用して発言権を要求及び解除するためには、使用者は、発言権を要求するために使用する所定の単語又は文章、及び発言権を解除するために使用する所定の単語又は文章を、PTT端末に予め設定しなければならない。例えば、使用者は、発言権を要求するための単語又は文章を「要求」又は「開始」に設定し、発言権を解除するための単語又は文章を「解除」又は「終了」に設定する。
以下では、前記発言権を要求するための単語が「要求」又は「開始」に設定され、前記発言権を解除するための単語が「解除」又は「終了」に設定されたと仮定して説明する。
図2A及び図2Bに示すように、PTT端末100のマイク101に使用者の音声が入力されると(S11)、PTT端末100内の音声活性検出器102からトリガ信号が発生する(S13)。このとき、音声認識プロセッサが動作していないPTT端末100に使用者の音声が入力されると、音声活性検出器102はローからハイにトリガされた信号を発生する。
音声活性検出器102がローからハイにトリガされた信号を発生すると、メインプロセッサ部105は、音声認識プロセッサを動作させて、前記音声認識プロセッサによりマイク101から入力された使用者の音声を確認して終了する(S15)。このとき、前記音声認識プロセッサは、使用者が特定の時間、即ち、使用者が「要求」又は「開始」の発音に要する時間だけ動作した後に終了する。
前記音声認識プロセッサにより確認された音声が「要求」、「開始」、又は使用者が発言権を要求するために設定した他の音声であると(S17)、メインプロセッサ部105は、発言権要求メッセージをPTTサーバー(図示せず)に転送する(S19)。しかしながら、前記音声認識プロセッサにより確認された音声が「要求」、「開始」、又は使用者が発言権を要求するために設定した他の音声ではないと、メインプロセッサ部105は、発言権要求メッセージを転送しない。
PTT端末100がPTTサーバーから発言権を獲得すると(S21)、使用者によりマイク101から入力された音声は、メインプロセッサ部105により前記PTTサーバーに転送されると共に、バッファ(図示せず)に保存される(S23)。ここで、前記バッファは、音声が入力されると、以前に入力された音声を削除して常に入力された最新の音声を保存するFIFO方式で動作し、「解除」又は「終了」のように発言権を解除するために使用者が設定した音声を保存できる程度のサイズを有する。
即ち、PTT端末100が発言権を獲得した後、使用者の音声がマイク101から入力されると、音声活性検出器102は、ローからハイにトリガされる信号を発生し、メインプロセッサ部105は、音声認識プロセッサを動作させて前記入力された音声を確認する。また、前記入力された音声が「要求」、「開始」、「解除」、又は「終了」などではないと、前記音声認識プロセッサが所定時間動作するが、発言権要求メッセージ又は発言権解除メッセージは前記PTTサーバーに転送しない。これと同時に、PTT端末100のメインプロセッサ部105は、使用者の音声を前記PTTサーバーに転送し、前記バッファに保存する。
発言権を有する使用者が所定時間に音声を入力しないと、音声活性検出器102は、ハイからローにトリガされた信号を発生し(S25)、メインプロセッサ部105は、音声認識プロセッサを動作させて前記バッファに保存されている最新の音声を確認して終了する(S27)。
即ち、使用者が発言権を解除するために、「解除」、「終了」、又は使用者が発言権を解除するために設定した他の音声を入力し、所定時間に音声を入力しないと、音声活性検出器102は、ハイからローにトリガされた信号を発生する。メインプロセッサ部105は、前記トリガ信号の発生を感知し、前記音声認識プロセッサを動作させて前記バッファに保存された最新の音声を確認した後に終了する。このとき、前記音声認識プロセッサは、「解除」、「終了」、又は使用者が発言権を解除するために設定した他の音声の発音に要する時間だけ動作した後に終了する。
前記音声認識プロセッサにより確認された音声が「解除」、「終了」、又は使用者が発言権を解除するために設定した他の音声であると(S29)、メインプロセッサ部105は、発言権解除メッセージを前記PTTサーバーに転送する(S31)。しかしながら、前記音声認識プロセッサにより確認された音声が「解除」、「終了」、又は使用者が発言権を解除するために設定した他の音声ではないと、メインプロセッサ部105は、使用者が音声の入力を一時的に停止したと認識して、発言権解除メッセージを転送しない。また、発言権獲得状態を維持し、使用者により入力される音声を前記PTTサーバーに転送し、前記バッファに保存する過程を繰り返す。
本発明の特徴をまとめると次のとおりである。
第1に、発言権を要求する過程において、前記音声活性検出器がローからハイにトリガされる場合、前記音声認識プロセッサが動作し、マイクから入力された音声の認識結果が使用者が発言権を要求するために設定した音声であると、前記PTT端末のメインプロセッサ部は、発言権要求メッセージを前記PTTサーバーに転送する。
第2に、発言権を獲得したPTT端末が使用者の音声をPTTサーバーに転送する過程において、前記マイクから入力される使用者の音声は、前記PTTサーバーに転送されると共に前記PTT端末のバッファに保存される。ここで、前記バッファは、使用者が発言権を解除するために設定した音声を前記音声認識プロセッサが確認できるように、前記発言権を解除するために設定した音声を保存できる程度のサイズを有し、入力された最新の音声を保存する。
第3に、発言権を解除する過程において、使用者が発言権を解除するために設定した音声を入力し、所定時間以上他の音声を入力しない場合、前記音声活性検出器がハイからローにトリガされ、前記音声認識プロセッサが動作する。前記音声認識プロセッサは、前記バッファに保存された最新の音声を確認して、前記バッファに保存された音声が前記使用者が発言権を解除するために設定した音声であると、前記PTT端末のメインプロセッサ部は、発言権解除メッセージを前記PTTサーバーに転送する。
本発明において、前記音声認識プロセッサは、前記音声活性検出器がローからハイに、又はハイからローにトリガされる時点で動作を開始し、動作を開始した時点から所定時間、即ち、発言権を要求又は解除するために設定した音声の認識に要する時間だけ動作した後に終了する。
以上のように、本発明の好ましい実施形態を用いて本発明を例示してきたが、本発明は、この実施形態に限定して解釈されるべきものではない。本発明は、特許請求の範囲によってのみその範囲が解釈されるべきであることが理解される。当業者は、本発明の具体的な好ましい実施形態の記載から、本発明の記載および技術常識に基づいて等価な範囲を実施することができることが理解される。
使用者により入力される音声を認識するためにPTT端末が使用する資源を最小化できる、PTTサービスのための移動通信端末機の発言権管理装置及び方法を提供する。
音声認識プロセッサを有するPTT端末に、マイクから音声が入力されるとトリガ信号を発生する音声活性検出器を含ませて、音声認識プロセッサを、入力される音声によりトリガ信号が発生する時点から所定時間駆動して、入力される音声を確認する。ここで、入力される音声が発言権の要求又は解除に関する音声であると、PTT端末のメインプロセッサ部が発言権要求メッセージ又は発言権解除メッセージをPTTサーバーに転送する。
本発明によるPTT端末の構成を示すブロック図である。 本発明による発言権管理方法のフローを示す図である。 本発明による発言権管理方法のフローを示す図である。

Claims (20)

  1. PTT(Push To Talk)サービスのための移動通信端末機において、
    マイクから音声が入力されるとトリガ信号を発生する音声活性検出器と、
    前記トリガ信号を検出して音声認識プロセッサの動作を制御し、音声認識結果によって発言権及び音声通話を制御するメインプロセッサ部と、
    前記マイクから入力される音声を一時的に保存するバッファと、
    を含むことを特徴とする発言権管理装置。
  2. 前記音声活性検出器は、音声が入力されると、ローからハイ又はハイからローにトリガされる信号を発生することを特徴とする請求項1に記載の発言権管理装置。
  3. 前記メインプロセッサ部は、前記入力された音声が発言権を要求するために設定された音声であると、発言権要求メッセージをPTTサーバーに転送し、前記入力された音声が発言権を解除するために設定された音声であると、発言権解除メッセージをPTTサーバーに転送することを特徴とする請求項1に記載の発言権管理装置。
  4. 前記バッファが、先入れ先出し(First In First Out;FIFO)方式で動作することを特徴とする請求項1に記載の発言権管理装置。
  5. メインプロセッサ部がマイクから入力される音声により発生したトリガ信号を検出する過程と、
    前記メインプロセッサ部が音声認識プロセッサを動作させて前記入力された音声を確認する過程と、
    前記入力された音声が発言権に関する音声であると、前記メインプロセッサ部が該当発言権に関するメッセージをPTTサーバーに転送する過程と、
    を含むことを特徴とするPTTサービスのための移動通信端末機の発言権管理方法。
  6. 前記入力された音声を確認する過程は、
    前記メインプロセッサ部が、前記音声認識プロセッサを前記トリガ信号の発生時点から所定時間動作させて前記音声を確認した後、前記音声認識プロセッサを終了する過程をさらに含むことを特徴とする請求項5に記載のPTTサービスのための移動通信端末機の発言権管理方法。
  7. 前記発言権に関するメッセージを転送する過程は、
    前記入力された音声が発言権を要求するために設定された音声であると、前記メインプロセッサ部が発言権要求メッセージを前記PTTサーバーに転送する過程と、
    前記入力された音声が発言権を解除するために設定された音声であると、前記メインプロセッサ部が発言権解除メッセージを前記PTTサーバーに転送する過程と、
    を含むことを特徴とする請求項5に記載のPTTサービスのための移動通信端末機の発言権管理方法。
  8. 前記トリガ信号が、ローからハイ又はハイからローにトリガされることを特徴とする請求項5に記載のPTTサービスのための移動通信端末機の発言権管理方法。
  9. マイクから音声が入力されると、音声活性検出器がトリガ信号を発生する過程と、
    前記トリガ信号を検出したメインプロセッサ部が、音声認識プロセッサを所定時間駆動して前記入力された音声を確認する過程と、
    前記音声が発言権を要求する音声であると、前記メインプロセッサ部が発言権要求メッセージをPTTサーバーに転送する過程と、
    前記音声が発言権を解除する音声であると、前記メインプロセッサ部が発言権解除メッセージを前記PTTサーバーに転送する過程と、
    を含むことを特徴とするPTTサービスのための移動通信端末機の発言権管理方法。
  10. 前記トリガ信号が、ローからハイ又はハイからローにトリガされることを特徴とする請求項9に記載のPTTサービスのための移動通信端末機の発言権管理方法。
  11. 前記音声認識プロセッサを駆動する時間が、前記発言権を要求する音声又は前記発言権を解除する音声を発音するに十分な時間であることを特徴とする請求項9に記載のPTTサービスのための移動通信端末機の発言権管理方法。
  12. 前記発言権を要求する音声が、「要求」、「開始」、又は使用者により設定される他の音声の少なくとも1つであることを特徴とする請求項9に記載のPTTサービスのための移動通信端末機の発言権管理方法。
  13. 前記発言権を解除する音声が、「解除」、「終了」、又は使用者により設定される他の音声の少なくとも1つであることを特徴とする請求項9に記載のPTTサービスのための移動通信端末機の発言権管理方法。
  14. 発言権が獲得されると、前記メインプロセッサ部が、前記マイクから入力される使用者の音声を前記PTTサーバーに転送すると共にバッファに保存する過程をさらに含むことを特徴とする請求項9に記載のPTTサービスのための移動通信端末機の発言権管理方法。
  15. 前記バッファが、先入れ先出し(FIFO)方式で動作することを特徴とする請求項14に記載のPTTサービスのための移動通信端末機の発言権管理方法。
  16. メインプロセッサ部が入力された音声により音声活性検出器から発生したトリガ信号を検出する過程と、
    前記メインプロセッサ部が音声認識プロセッサを駆動して前記入力された音声を確認した後、前記音声認識プロセッサを終了する過程と、
    前記入力された音声が発言権を要求するための音声であると、前記メインプロセッサ部が発言権要求メッセージをPTTサーバーに転送する過程と、
    発言権が獲得されると、前記メインプロセッサ部が前記入力された音声を前記PTTサーバーに転送しバッファに保存する過程と、
    前記音声活性検出器からトリガ信号が発生すると、前記メインプロセッサ部が前記音声認識プロセッサを駆動して前記入力された音声を確認した後、前記音声認識プロセッサを終了する過程と、
    前記入力された音声が発言権を解除するための音声であると、前記メインプロセッサが発言権解除メッセージを前記PTTサーバーに転送する過程と、
    を含むことを特徴とするPTTサービスのための移動通信端末機の発言権管理方法。
  17. 前記入力された音声により発生したトリガ信号が、ローからハイにトリガされる信号であることを特徴とする請求項16に記載のPTTサービスのための移動通信端末機の発言権管理方法。
  18. 前記発言権が獲得された場合、発生するトリガ信号は、使用者が音声の入力を所定時間停止すると、ハイからローにトリガされる信号であることを特徴とする請求項16に記載のPTTサービスのための移動通信端末機の発言権管理方法。
  19. 前記バッファが、先入れ先出し(FIFO)方式で動作することを特徴とする請求項16に記載のPTTサービスのための移動通信端末機の発言権管理方法。
  20. 前記バッファが、前記発言権を解除するための音声を保存できる程度のサイズを有することを特徴とする請求項16に記載のPTTサービスのための移動通信端末機の発言権管理方法。
JP2005213514A 2004-07-23 2005-07-22 Pttサービスのための移動通信端末機の発言権管理装置及び方法 Pending JP2006042345A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020040057716A KR100652645B1 (ko) 2004-07-23 2004-07-23 푸시 투 토크형 이동 통신 단말기의 음성 검출 및 인식을이용한 발언권 관리 장치와 방법

Publications (1)

Publication Number Publication Date
JP2006042345A true JP2006042345A (ja) 2006-02-09

Family

ID=35045190

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005213514A Pending JP2006042345A (ja) 2004-07-23 2005-07-22 Pttサービスのための移動通信端末機の発言権管理装置及び方法

Country Status (7)

Country Link
US (1) US7684766B2 (ja)
EP (1) EP1619863B1 (ja)
JP (1) JP2006042345A (ja)
KR (1) KR100652645B1 (ja)
CN (1) CN100369499C (ja)
AT (1) ATE460808T1 (ja)
DE (1) DE602005019815D1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006101048A (ja) * 2004-09-29 2006-04-13 Nec Corp Ptt通信システム、携帯端末装置及びそれらに用いる会話開始方法並びにそのプログラム

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101177948B1 (ko) * 2006-01-13 2012-08-28 삼성전자주식회사 PoC 시스템에서 미디어 전송 시간 정보 제공을 위한단말 장치 및 방법과 미디어 전송 시간 정보 제공을 위한PoC 시스템
CN100562041C (zh) * 2006-02-06 2009-11-18 华为技术有限公司 一种在半双工通话中实现语音记录的方法及系统
WO2008074350A1 (en) * 2006-12-20 2008-06-26 Phonak Ag Wireless communication system
US20080153432A1 (en) * 2006-12-20 2008-06-26 Motorola, Inc. Method and system for conversation break-in based on user context
CN101159930B (zh) * 2007-10-23 2010-06-23 中兴通讯股份有限公司 数字集群通讯系统中用户释放起呼键的处理方法
JP2013019958A (ja) * 2011-07-07 2013-01-31 Denso Corp 音声認識装置
US8452597B2 (en) * 2011-09-30 2013-05-28 Google Inc. Systems and methods for continual speech recognition and detection in mobile computing devices
KR101590332B1 (ko) * 2012-01-09 2016-02-18 삼성전자주식회사 영상장치 및 그 제어방법
CN103220630B (zh) * 2012-01-18 2016-04-13 鼎桥通信技术有限公司 话权分配方法及网络设备
US9560099B2 (en) 2012-05-23 2017-01-31 Qualcomm Incorporated Systems and methods for group communication using a mobile device using motion and voice activate controls
US9392421B2 (en) 2012-05-23 2016-07-12 Qualcomm Incorporated Systems and methods for group communication using a mobile device with mode depending on user proximity or device position
US9674694B2 (en) 2012-05-23 2017-06-06 Qualcomm Incorporated Systems and methods for group communication using a mobile device with mode transition based on motion
US9204263B2 (en) 2012-05-23 2015-12-01 Mark A. Lindner Systems and methods for establishing a group communication based on motion of a mobile device
KR20130133629A (ko) 2012-05-29 2013-12-09 삼성전자주식회사 전자장치에서 음성명령을 실행시키기 위한 장치 및 방법
US20140184796A1 (en) * 2012-12-27 2014-07-03 Motorola Solutions, Inc. Method and apparatus for remotely controlling a microphone
US9585563B2 (en) 2012-12-31 2017-03-07 Dexcom, Inc. Remote monitoring of analyte measurements
CN103200311A (zh) * 2013-02-25 2013-07-10 华为终端有限公司 一种通讯终端通话音频通路的控制方法、装置及通讯终端
US9807495B2 (en) * 2013-02-25 2017-10-31 Microsoft Technology Licensing, Llc Wearable audio accessories for computing devices
US20140357248A1 (en) * 2013-06-03 2014-12-04 Ford Global Technologies, Llc Apparatus and System for Interacting with a Vehicle and a Device in a Vehicle
US9992317B2 (en) 2015-02-16 2018-06-05 Ford Global Technologies, Llc System and method of facilitating communication between a mobile device and vehicle computer system
CN105988581B (zh) * 2015-06-16 2019-03-08 恒大法拉第未来智能汽车(广东)有限公司 一种语音输入方法及装置
WO2017116692A1 (en) 2015-12-28 2017-07-06 Dexcom, Inc. Systems and methods for remote and host monitoring communications
US10283117B2 (en) * 2017-06-19 2019-05-07 Lenovo (Singapore) Pte. Ltd. Systems and methods for identification of response cue at peripheral device
US10278034B1 (en) * 2018-03-20 2019-04-30 Honeywell International Inc. Audio processing system and method using push to talk (PTT) audio attributes
US11862189B2 (en) 2020-04-01 2024-01-02 Qualcomm Incorporated Method and apparatus for target sound detection
CN114363835A (zh) * 2021-12-16 2022-04-15 四川腾盾科技有限公司 一种基于无人机数据链声码化话音的自动ptt方法
CN115103319A (zh) * 2022-06-15 2022-09-23 成都零壹众科技有限公司 一种特种作业环境下的对讲呼叫方法及装置

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6083431A (ja) 1983-10-14 1985-05-11 Fujitsu Ten Ltd 音声プレスト−ク装置
WO1993001664A1 (en) * 1991-07-08 1993-01-21 Motorola, Inc. Remote voice control system
JP3526911B2 (ja) 1993-04-20 2004-05-17 クラリオン株式会社 音声認識装置及び音声認識方法
US5594784A (en) * 1993-04-27 1997-01-14 Southwestern Bell Technology Resources, Inc. Apparatus and method for transparent telephony utilizing speech-based signaling for initiating and handling calls
US5649307A (en) * 1995-07-28 1997-07-15 Motorola, Inc. Method and apparatus for option control in a radio accessory
US5722086A (en) * 1996-02-20 1998-02-24 Motorola, Inc. Method and apparatus for reducing power consumption in a communications system
GB2322044A (en) * 1997-02-07 1998-08-12 Jack Yu Voice-controlled Hands-free Portable Telephone
US6223154B1 (en) 1998-07-31 2001-04-24 Motorola, Inc. Using vocoded parameters in a staggered average to provide speakerphone operation based on enhanced speech activity thresholds
US6522894B1 (en) * 1999-07-27 2003-02-18 Ericsson Inc. Simplified speaker mode selection for wireless communications device
US6446042B1 (en) * 1999-11-15 2002-09-03 Sharp Laboratories Of America, Inc. Method and apparatus for encoding speech in a communications network
AU1624101A (en) * 1999-11-19 2001-05-30 Qualcomm Incorporated System and method for providing push-to-talk feature for wireless communication systems
KR20010054608A (ko) * 1999-12-07 2001-07-02 박종섭 이동통신 단말기의 음성신호 송/수신상태 제어장치 및 그방법
EP1182895A1 (en) 2000-08-15 2002-02-27 Lucent Technologies Inc. Method and apparatus for performing a voice dispatch call in a digital communication system
JP2002281145A (ja) * 2001-03-15 2002-09-27 Denso Corp 電話番号入力装置
US6970909B2 (en) * 2001-10-11 2005-11-29 The Trustees Of Columbia University In The City Of New York Multi-protocol data communication system supporting wireless telephony and content delivery
JP2003152860A (ja) 2001-11-08 2003-05-23 Nec Saitama Ltd 音声検出回路及び電話機
US7421390B2 (en) * 2002-09-13 2008-09-02 Sun Microsystems, Inc. Method and system for voice control of software applications

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006101048A (ja) * 2004-09-29 2006-04-13 Nec Corp Ptt通信システム、携帯端末装置及びそれらに用いる会話開始方法並びにそのプログラム

Also Published As

Publication number Publication date
EP1619863B1 (en) 2010-03-10
US7684766B2 (en) 2010-03-23
US20060019613A1 (en) 2006-01-26
ATE460808T1 (de) 2010-03-15
DE602005019815D1 (de) 2010-04-22
EP1619863A1 (en) 2006-01-25
CN100369499C (zh) 2008-02-13
KR20060008061A (ko) 2006-01-26
CN1725881A (zh) 2006-01-25
KR100652645B1 (ko) 2006-12-06

Similar Documents

Publication Publication Date Title
JP2006042345A (ja) Pttサービスのための移動通信端末機の発言権管理装置及び方法
US7769142B2 (en) Asynchronous discrete manageable instant voice messages
CN105191252B (zh) 用于电子通信的输出管理
JP4718140B2 (ja) 初期発話音声バースト(initialtalkburst)のバッファリング
JP2013146085A (ja) 電話での会話をテキストに書き起こすための方法及びシステム
KR20190075800A (ko) 지능형 개인 보조 인터페이스 시스템
US11032675B2 (en) Electronic accessory incorporating dynamic user-controlled audio muting capabilities, related methods and communications terminal
US7333803B2 (en) Network support for voice-to-text memo service
US9143903B2 (en) Requesting and providing acknowledgements to specific PTT talk spurts
CN112313657A (zh) 用于检测自动会话的方法、系统和计算机程序产品
EP1928189A1 (en) Signalling for push-to-translate-speech (PTTS) service
CN102984672A (zh) 移动终端及其通信方法
US20070117581A1 (en) Systems and methods for providing push-to-talk to full-duplex voice internetworking
KR100566284B1 (ko) 체감 지연이 없이 음성메시지를 전송할 수 있는 PoC이동단말기, 서버, 및 그 방법
JP2007201906A (ja) 携帯端末装置及び画像表示方法
WO2021025074A1 (ja) グループ通話システム、グループ通話方法及びプログラム
JP2015011651A (ja) 情報処理装置、情報処理方法およびプログラム
JP2007311920A (ja) 通信制御装置および通信制御方法
JP2016144024A (ja) 音声メモ保存機能を有する電話装置
JP2008009693A (ja) 聞き起こしシステム、そのサーバ及びサーバ用プログラム
JP5026052B2 (ja) 通信制御装置及び通信制御方法
EP3697069A1 (en) Method for providing a digital assistant in a communication session and associated communication network
JP2004080573A (ja) 通信端末、通信端末制御方法およびこの方法の実行プログラム並びにそのプログラムを記録した記録媒体
JP3982307B2 (ja) 文字入力装置
CN111193896A (zh) 一种终端角色切换方法、装置、终端设备和存储介质

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070111

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070126

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070424

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20071126