JP2005101709A - 情報マルチプレクサ、音声処理デバイス、情報デマルチプレクサ、受信処理デバイス、電話端末、ノード、電話システム、情報多重化方法、情報分離方法、情報多重化プログラム、情報分離プログラム、および該プログラムを記録した記録媒体 - Google Patents

情報マルチプレクサ、音声処理デバイス、情報デマルチプレクサ、受信処理デバイス、電話端末、ノード、電話システム、情報多重化方法、情報分離方法、情報多重化プログラム、情報分離プログラム、および該プログラムを記録した記録媒体 Download PDF

Info

Publication number
JP2005101709A
JP2005101709A JP2003329682A JP2003329682A JP2005101709A JP 2005101709 A JP2005101709 A JP 2005101709A JP 2003329682 A JP2003329682 A JP 2003329682A JP 2003329682 A JP2003329682 A JP 2003329682A JP 2005101709 A JP2005101709 A JP 2005101709A
Authority
JP
Japan
Prior art keywords
data
silence
information
voice
information data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003329682A
Other languages
English (en)
Other versions
JP4188190B2 (ja
Inventor
Masahiko Kishino
雅彦 岸野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2003329682A priority Critical patent/JP4188190B2/ja
Publication of JP2005101709A publication Critical patent/JP2005101709A/ja
Application granted granted Critical
Publication of JP4188190B2 publication Critical patent/JP4188190B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Abstract

【課題】 無音圧縮処理を行う電話システムにおいても、他の情報データの多重化・分離を実現する。
【解決手段】 AMR処理部10は、音声データを無音圧縮した無音圧縮データと、上記音声データとは異なる情報データとを多重化する。無音圧縮データは、声を出していない無音状態の音声データ部分である無音データ部分を、無音状態を示すSIDフレームを所定の間隔ごとに含む無音圧縮データ部分に変換したものである。情報データ多重部18は、SIDフレームを検出し、検出結果に基づいて、無音圧縮データ部分におけるSIDフレーム同士の間に、情報データを組み込む。
【選択図】 図1

Description

本発明は、音声データと、音声データとは異なる情報データとの通信を行う電話システムに関するものである。特に、本発明は、音声データを無音圧縮した無音圧縮データと上記情報データとにおける多重化および分離に関するものである。
従来の電話システムは、モデム等のデータ通信アダプタを利用することにより、音声データ通信だけでなく非音声データ通信を行うことができる。しかしながら、通常、1つの通信回線において、音声データ通信と非音声データ通信とを同時に行うことはできない。そこで、下記の特許文献1・2に記載のように、有音か無音かを検出し、有音時に音声データ通信を、無音時に非音声データ通信をそれぞれ切り替えて行うことが提案されている。
一方、現在普及し始めている第3世代携帯電話システムでは、W−CDMA(Wideband Code Division Multiple Access)等のデジタル無線通信方式が利用されており、その音声コーデック処理として、高圧縮率と高音質とを兼ね備えた音声アルゴリズムが実装されている。上記音声コーデック処理では、音声の情報量を可能な限り削減するために、無音時に無音圧縮処理を実施しており、これにより、通常の音声処理よりも少ない情報量となる音声処理を実現している。
上記音声コーデック処理を、W−CDMA方式の音声通話を例として示す。W−CDMA方式の音声通話では、音声コーデック処理としてAMR(Adaptive Multi Rate:適応可変レート)処理の実装が必須であり、無音圧縮処理の実装も必須となっている。図14は符号器側(送信側)のAMR処理部の概略構成を示しており、図15は、復号器側(受信側)のAMR処理部の概略構成を示している。なお、図中の実線は音声データの流れを示し、破線はその他の各種情報の流れを示している。
図14に示すように、符号器側のAMR処理部100は、音声入力部101、AMR符号部102、無音検出部103、SID(Silence Descriptor)フレーム作成部104、符号化ビット列生成部105、および音声符号データ出力部106を備える構成である。音声入力部101は、AMR処理部100の外部から入力される音声データを受信し、AMR符号部102に送信する。
AMR符号部102は、音声入力部101からの音声データを無音検出部103およびSIDフレーム作成部104に送信する。また、AMR符号部102は、無音検出部103から無音状態の検出を通知する無音検出データを受信し、受信した無音検出データに基づいて、有音状態の音声データを符号化し、符号化された音声データを符号化ビット列生成部105に送信する。
無音検出部103は、音声入力部101からAMR符号部102を介して音声データを受信し、受信した音声データが無音状態であるか否かを検出する。無音状態であることを検出した場合には、上記無音検出データをAMR符号部102およびSIDフレーム作成部104に送信する。
SIDフレーム作成部104は、音声入力部101からAMR符号部102を介して音声データを受信するとともに、無音検出部103から上記無音検出データを受信する。受信した無音検出データに基づいて、無音状態の音声データに対して無音時のデータを作成する。作成された無音時のデータを符号化ビット列生成部105に送信する。なお、無音時のデータの詳細に関しては後述する。
符号化ビット列生成部105は、AMR符号部102から有音時の符号化された音声データを受信するとともに、SIDフレーム作成部104から無音時のデータを受信して、AMRフォーマットに従ったデータ列であるAMR音声データを生成する。生成したAMR音声データを音声符号データ出力部106に送信する。音声符号データ出力部106は、符号化ビット列生成部105からAMR音声データを受信して、AMR処理部100の外部へ出力する。
図15に示すように、復号器側のAMR処理部110は、音声符号データ入力部111、データ列解析部112、AMR復号部113、エラーフレーム・ロストフレーム処理部114、CNG(Comfort Noise Generation)生成部115、および復号音声出力部116を備える構成である。音声符号データ入力部111は、AMR処理部110の外部から入力されるAMR音声データを受信し、データ列解析部112に送信する。
データ列解析部112は、音声符号データ入力部部111からのAMR音声データのフレーム構成を解析する。解析の結果、有音時のデータである場合には、AMR復号部113に対し有音であることを通知すると共にAMR音声データを送信する。一方、無音時のデータである場合には、CNG生成部115に対し無音であることを通知すると共にAMR音声データを送信する。その他、エラーフレームである場合またはデータを含んでいない場合には、それぞれの場合である旨をエラーフレーム・ロストフレーム処理部114に通知する。
エラーフレーム・ロストフレーム処理部114は、データ列解析部112からの通知を受け取ると、エラーフレーム処理またはロストフレーム処理を行って、対応する音声データの生成をAMR復号部113に指示する。CNG生成部115は、データ列解析部112から通知およびAMR音声データを受け取ると、無音状態の音声データを生成してAMR復号部113に送信する。
AMR復号部113は、データ列解析部112から通知およびAMR音声データを受け取ると、有音状態のAMR音声データを復号化して、有音状態の音声データを生成する。また、AMR復号部113は、CNG生成部115から無音状態の音声データを受信する。また、AMR復号部113は、エラーフレーム・ロストフレーム処理部114からの指示に基づき音声データを生成する。これらの音声データを復号音声出力部116に送信する。復号音声出力部116は、AMR復号部113から音声データを受信して、AMR処理部110の外部へ出力する。
次に、AMR処理における無音処理の詳細について図16〜図19に基づいて説明する。なお、AMR処理における無音処理に関しては、下記の非特許文献1に詳細に記載されている。
図16は、AMR処理において、有音状態から無音状態になったときのフレーム構成を示している。同図において、1つのアルファベットは、1フレームのAMR音声データを表しており、各アルファベットS・F・U・Nで示されるフレームは、それぞれ下記の情報を有している。
S(有音フレーム):音声情報、
F(SID_FIRSTフレーム):無音時情報(連続無音状態の先頭一回目で送る情報)、
U(SID_UPDATEフレーム):無音時情報(連続無音状態の二回目以降で送る情報)、
N(NO_DATAフレーム):データ無し。
AMR処理の仕様では、図16に示されるように、有音判定から無音判定に切り替って連続的な無音状態と判断した場合には、下記のフレームを順番に送出する。なお、無音判定から有音判定に切り替る場合には、直ちに有音処理に復帰して音声フレームSを送出する。
1)7個の音声フレームS、
2)1個のSID_FIRSTフレームF、
3)3個のNO_DATAフレームN、
4)1個のSID_UPDATEフレームU、
5)7個のNO_DATAフレームN、
6)以下、有音判定になるまで、4)から繰り返す。
このように、SIDフレームF・Uは、所定の間隔で送信されることになる。なお、この間隔は音声コーデックに依存し、等間隔であるとは限らない。
図17は、各種フレームのビット数を表形式で示している。同図では、左側から順番に、フレームタイプ(Frame Type)、AMRコーデックモード(AMR codec mode)、ビット総数(Total number of bits)、およびクラス(Class)A〜Cの欄がそれぞれ設けられている。また、フレームタイプ(Frame Type)0〜7は、種々の伝送速度(4.75kbps〜12.2kbps)で伝送される音声フレームにそれぞれ対応しており、フレームタイプ8は、SIDフレームF・Uに対応しており、フレームタイプ15は、NO_DATAフレームNに対応している。
図17に示されるように、AMR処理では、AMRコーデックモードごとに、1フレーム当りのデータ量(ビット長)が異なっている。したがって、1フレーム当りのデータ量を検出することにより、AMRコーデックモードを判別することができる。
また、図17に示されるように、例えば、12.2kbpsモードにおける音声フレームSはビット長が244ビットであり、無音時におけるSIDフレームF・Uはビット長が39ビットであり、無音時におけるNO_DATAフレームNはビット長が0ビットである。
このため、有音状態から無音状態に切り替わるときには、図16に示されるように、伝送されるデータ量が著しく減少する、すなわち無音圧縮されることになる。なお、同図において伝送データ量に記載の数値は、1フレームあたりのビット数である。
例えば、音声フレームSのデータ伝送速度を12.2kpbsとすると、無音状態が継続する場合には、1個のSID_UPDATEフレームUと7個のNO_DATAフレームNとが伝送されるから、データ伝送速度は平均0.24kbps(=12.2×(39×1+0×7)/(244×8))となる。
なお、図18は、SIDフレームに関して、SID_FIRSTフレームFおよびSID_UPDATEフレームUのフォーマットをそれぞれ示している。図示のように、SID_FIRSTフレームFおよびSID_UPDATEフレームUにおける最初のビットが、SIDのタイプを示す識別子であるSTI(SID Type Indicator)であるので、最初のビットを参照することにより、SID_FIRSTフレームFおよびSID_UPDATEフレームUの何れであるかを判別することができる。
なお、図17に示されるように、各フレーム内のデータ構造は、ビットの重要度に応じてクラスA〜Cにクラス分けされている。図19は、各クラスに対応して行われるエラー訂正用コーディングおよびCRC(巡回冗長検査)をそれぞれ示している。図示のように、各クラスで誤り訂正および誤り検出の処理が異なっている。
また、携帯電話端末の無線送信処理部においては、AMR音声データに対応する無線送信処理が行われる。具体的には、音声フレームSに関しては、クラスA〜Cのそれぞれに分割し、各クラスに応じたチャネルコーディング処理が行われる。また、SIDフレームF・Uに関しては、クラスAに応じたチャネルコーディング処理が行われる。また、携帯電話端末の無線受信処理部においては、無線データの復号時におけるデータ量の判定がそのまま有音・無音の判定として使用される。
特開平7−15408号公報(1995年1月17日公開) 特開平8−84201号公報(1996年3月26日公開) E. Ekudden, 'AMR speech Codec; Source Controlled Rate operation', [online], 3GPP TS 26.093 V6.0.0, Mar. 24, 2003. [検索日 2003.07.22], インターネット<URL:http://www.3gpp.org/ftp/Specs/archive/26_series/26.093/26093-600.zip>
上述のように、最近の第3世代携帯電話システム等では、無音圧縮処理により、電話システムの提供するデータ伝送速度に比較し、音声データの平均データ伝送速度を低減する効果がある。一方、音声コーデック処理において、このデータ伝送速度の差を利用して他の情報データを送信する手順は、現在のところ想定されていない。このため、他の情報データを送信するには、音声コーデック処理を行う手段とは別に、例えば上記特許文献1・2に記載されたデータ多重化手段を定義する必要がある。
しかしながら、上記特許文献1・2に記載されたデータ多重化手段では、無音状態であるときに所定の間隔ごとに無音識別子(SIDフレーム)を送信することができず、無音圧縮処理に対応することができない。このため、無音圧縮処理を行う電話システムに利用することができない。
本発明は、上記の問題点に鑑みてなされたものであり、その目的は、無音圧縮処理を行う電話システムにおいても、他の情報データの多重化・分離を行うことができる情報マルチプレクサ・情報デマルチプレクサ等を提供することにある。
上記課題を解決するために、本発明に係る情報マルチプレクサは、音声データを無音圧縮した無音圧縮データと、上記音声データとは異なる情報データとを多重化する情報マルチプレクサであって、上記無音圧縮データは、声を出していない無音状態の音声データ部分である無音データ部分を、上記無音状態を示す無音識別子を所定の間隔ごとに含む無音圧縮データ部分に変換したものであり、上記無音識別子を検出する検出手段と、該検出手段の検出結果に基づいて、上記無音圧縮データ部分における上記無音識別子同士の間に、上記情報データを組み込む組込み手段を備えることを特徴としている。
さらに、本発明に係る情報マルチプレクサは、上記の構成において、上記組込み手段にて上記情報データが組み込まれた無音圧縮データ部分は、複数のフレームからなり、上記無音識別子を含むフレームは、上記情報データの一部を含むフレームと比べて、データ構造が異なることを特徴としている。
さらに、本発明に係る情報マルチプレクサは、上記の構成において、上記組込み手段は、同じ情報データを繰返し組み込むことを特徴としている。
さらに、本発明に係る情報マルチプレクサは、上記の構成において、上記組込み手段による上記無音圧縮データと上記情報データとの多重化を制御する多重化制御手段をさらに備えることを特徴としている。
また、本発明に係る音声処理デバイスは、入力された音声データを無音圧縮する無音圧縮手段と、該無音圧縮手段にて無音圧縮された音声データである無音圧縮データと、上記音声データとは異なる情報データとを多重化する多重化手段とを備える音声処理デバイスであって、上記無音圧縮手段は、入力された音声データ部分が、声を出していない無音状態の音声データ部分である無音データ部分であることを検出する無音検出手段と、上記音声データにおいて、上記無音検出手段にて検出された無音データ部分を、上記無音状態を示す無音識別子を所定の間隔ごとに含む無音圧縮データ部分に置き換える置換え手段とを備えており、上記多重化手段は、上記置換え手段から、上記無音圧縮データ部分における上記無音識別子の位置情報を取得し、取得された位置情報に基づいて、上記無音圧縮データ部分における上記無音識別子同士の間に、上記情報データを組み込む組込み手段とを備えることを特徴としている。
さらに、本発明に係る音声処理デバイスは、上記の構成において、上記無音圧縮手段は、入力された音声データの符号化を行う音声符号化手段をさらに備えることを特徴としている。
また、本発明に係る情報デマルチプレクサは、音声データを無音圧縮した無音圧縮データと、上記音声データとは異なる情報データとを多重化した多重化データを各々のデータに分離する情報デマルチプレクサであって、上記無音圧縮データは、声を出していない無音状態の音声データ部分である無音データ部分を、上記無音状態を示す無音識別子を所定の間隔ごとに含む無音圧縮データ部分に変換したものであり、上記多重化データは、上記無音識別データ部分における上記無音識別子同士の間に、上記情報データを組み込んだものであり、上記多重化データから上記無音識別子を検出する検出手段と、該検出手段の検出結果に基づいて、上記無音識別データ同士の間から上記情報データを分離する分離手段とを備えることを特徴としている。
さらに、本発明に係る情報デマルチプレクサは、上記の構成において、上記多重化データは複数のフレームからなり、上記無音識別子を含むフレームと、上記情報データの一部を含むフレームとのデータ構造が異なることを利用して、上記検出手段は上記無音識別子を含むフレームを検出し、上記分離手段は上記情報データの一部を含むフレームを分離することを特徴としている。
さらに、本発明に係る情報デマルチプレクサは、上記の構成において、上記多重化データは、同じ情報データを繰返し組み込んだデータであり、上記分離手段にて分離された情報データの繰返し部分を照合する照合手段をさらに備えることを特徴としている。
さらに、本発明に係る情報デマルチプレクサは、上記の構成において、上記多重化データから分離された上記情報データの出力を制御する情報データ出力制御手段を備えることを特徴としている。
また、本発明に係る受信処理デバイスは、音声データを無音圧縮した無音圧縮データと、上記音声データとは異なる情報データとを多重化した多重化データの受信処理を行う受信処理手段と、該受信処理手段にて受信処理された多重化データを各々のデータに分離する分離手段とを備える受信処理デバイスであって、上記無音圧縮データは、声を出していない無音状態の音声データ部分である無音データ部分を、上記無音状態を示す無音識別子を所定の間隔ごとに含む無音圧縮データ部分に変換したものであり、上記多重化データは、上記無音識別データ部分における上記無音識別子同士の間に、上記情報データを組み込んだものであり、上記受信処理手段は、上記多重化データの各部の受信レートを判定する受信レート判定手段をさらに備えており、上記分離手段は、上記受信レート判定手段にて判定された受信レートの相違に基づいて、上記無音圧縮データおよび上記情報データに分離するものであることを特徴としている。
また、本発明に係る電話端末は、音声データを無音圧縮する無音圧縮手段と、該無音圧縮手段にて無音圧縮された無音圧縮データと、上記音声データとは異なる情報データとを多重化する上記構成の情報マルチプレクサと、該情報マルチプレクサにて多重化された多重化データを送信する送信手段と、多重化データを受信する受信手段と、該受信手段にて受信した多重化データを上記無音圧縮データおよび上記情報データに分離する上記構成の情報デマルチプレクサまたは上記構成の受信処理デバイスと、該情報デマルチプレクサにて分離された無音圧縮データを元の音声データに復元する音声復元手段とを備えることを特徴としている。
さらに、本発明に係る電話端末は、上記の構成において、上記無音圧縮手段および上記情報マルチプレクサに代えて、上記構成の音声処理デバイスを備えることを特徴としている。
また、本発明に係るノードは、上記構成の電話端末と通信可能なノードであって、上記電話端末から多重化データを受信する受信手段と、該受信手段にて受信した多重化データを上記無音圧縮データおよび上記情報データに分離する上記構成の情報デマルチプレクサまたは上記構成の受信処理デバイスと、上記無音圧縮データと、上記音声データとは異なる情報データとを多重化する上記構成の情報マルチプレクサと、該情報マルチプレクサにて多重化された多重化データを上記電話端末に送信する送信手段とを備えることを特徴としている。
また、本発明に係る電話システムは、上記構成の電話端末を、通信ネットワークを介して接続していることを特徴としている。
さらに、本発明に係る電話システムは、上記の構成において、上記通信ネットワークは、上記構成のノードを含むことを特徴としている。
また、本発明に係る情報多重化方法は、音声データを無音圧縮した無音圧縮データと、上記音声データとは異なる情報データとを多重化する情報多重化方法であって、上記無音圧縮データは、声を出していない無音状態の音声データ部分である無音データ部分を、上記無音状態を示す無音識別子を所定の間隔ごとに含む無音圧縮データ部分に変換したものであり、上記無音圧縮データ部分から上記無音識別子を検出する検出ステップと、該検出ステップの検出結果に基づき、上記無音圧縮データ部分における上記無音識別子同士の間に、上記情報データを組み込む組込みステップとを含むことを特徴としている。
また、本発明に係る情報分離方法は、音声データを無音圧縮した無音圧縮データと、上記音声データとは異なる情報データとを多重化した多重化データを各々のデータに分離する情報分離方法であって、上記無音圧縮データは、声を出していない無音状態の音声データ部分である無音データ部分を、上記無音状態を示す無音識別子を所定の間隔ごとに含む無音圧縮データ部分に変換したものであり、上記多重化データは、上記無音識別データ部分における上記無音識別子同士の間に、上記情報データを組み込んだものであり、上記多重化データから上記無音識別子を検出する検出ステップと、該検出ステップによる検出結果に基づいて、上記無音識別データ同士の間から上記情報データを分離する分離ステップとを含むことを特徴としている。
また、本発明に係る情報多重化プログラムは、上記構成の情報マルチプレクサを動作させるための情報多重化プログラムであって、コンピュータを上記各手段として機能させるための情報多重化プログラムであることを特徴としている。
また、本発明に係る情報分離プログラムは、上記構成の情報デマルチプレクサを動作させるための情報分離プログラムであって、コンピュータを上記各手段として機能させるための情報分離プログラムであることを特徴としている。
また、本発明に係るコンピュータ読取り可能な記録媒体は、上記情報多重化プログラム、または上記情報分離プログラムが記録されていることを特徴としている。
上記のように、本発明に係る情報マルチプレクサは、上記無音識別子を検出する検出手段と、該検出手段の検出結果に基づいて、上記無音圧縮データ部分における上記無音識別子同士の間に、上記情報データを組み込む組込み手段を備える構成である。
上記の構成によると、組込み手段は、検出手段が検出した無音識別子同士の間に情報データを組み込んでいる。これにより、情報データを多重化しても所定の間隔毎に無音識別子が含まれるから、無音圧縮処理を行う電話システムにおいても、情報データの多重化を実現できるという効果を奏する。
なお、組込み手段は、有音状態から無音状態に切り替わる最初の無音識別子から情報データを組み込んでも良いし、上記最初の無音識別子から所定回数または所定時間経過後の無音識別子から情報データを組み込んでも良い。
また、上記情報マルチプレクサは、無音圧縮処理を含む音声符号化処理を行う音声符号化手段に設けても良いし、データを送信用データに変換する送信処理手段に設けても良い。
さらに、本発明に係る情報マルチプレクサは、上記の構成において、上記組込み手段にて上記情報データが組み込まれた無音圧縮データ部分は、複数のフレームからなり、上記無音識別子を含むフレームは、上記情報データの一部を含むフレームと比べて、データ構造が異なる構成である。
ここで、データ構造が異なる例としては、フレームのビット長が異なることや、CRCが異なることが挙げられる。
上記の構成によると、データ構造から、無音識別子を含むフレームであるか情報データの一部を含むフレームであるかを容易に識別することができる。したがって、情報データが多重化された多重化データから情報データを容易に分離できるという効果を奏する。
さらに、本発明に係る情報マルチプレクサは、上記の構成において、上記組込み手段は、同じ情報データを繰返し組み込む構成である。
上記の構成によると、同じ情報データを繰返し組み込むことにより、情報データを確実に伝送できるという効果を奏する。なお、情報データを繰返し組み込んでも良いし、情報データの一部を繰返し組み込んでも良い。
さらに、本発明に係る情報マルチプレクサは、上記の構成において、上記組込み手段による上記無音圧縮データと上記情報データとの多重化を制御する多重化制御手段をさらに備える構成である。
この多重化を制御する具体例としては、上記組込み手段に上記情報データを提供するか否かを制御したり、上記組込み手段が上記無音圧縮データに上記情報データを組み込むか否かを制御したりすることが挙げられる。
上記の構成によると、多重化制御手段は、情報データが多重化されて出力されるか否かを制御できるので、情報が勝手に出力されることを防止できる。
また、本発明に係る音声処理デバイスは、入力された音声データ部分が、声を出していない無音状態の音声データ部分である無音データ部分であることを検出する無音検出手段と、上記音声データにおいて、上記無音検出手段にて検出された無音データ部分を、上記無音状態を示す無音識別子を所定の間隔ごとに含む無音圧縮データ部分に置き換える置換え手段とを上記無音圧縮手段が備えており、上記多重化手段が、上記置換え手段から、上記無音圧縮データ部分における上記無音識別子の位置情報を取得し、取得された位置情報に基づいて、上記無音圧縮データ部分における上記無音識別子同士の間に、上記情報データを組み込む組込み手段とを備える構成である。
上記の構成によると、組込み手段は、置換え手段から取得した、無音圧縮データ部分における無音識別子の位置情報に基づいて、無音識別子同士の間に情報データを組み込んでいる。これにより、情報データを多重化しても所定の間隔毎に無音識別子が含まれるから、無音圧縮処理を行う音声処理デバイスで、情報データの多重化を実現できるという効果を奏する。
さらに、本発明に係る音声処理デバイスは、上記の構成において、上記無音圧縮手段は、入力された音声データの符号化を行う音声符号化手段をさらに備える構成である。
上記の構成によると、音声符号化手段が音声データの符号化を行うので、音声データを効率よくかつ確実に伝送するという効果を奏する。
なお、音声符号化手段は、無音圧縮された音声データの符号化を行ってもよい。また、音声符号化手段は、有音状態の音声データ部分に対してのみ符号化を行うこともできる。
また、本発明に係る情報デマルチプレクサは、上記多重化データから上記無音識別子を検出する検出手段と、該検出手段の検出結果に基づいて、上記無音識別データ同士の間から上記情報データを分離する分離手段とを備える構成である。
上記の構成によると、分離手段は、検出手段が検出した無音識別子同士の間に組み込まれた情報データを多重化データから分離するので、多重化データから情報データの分離を実現できるという効果を奏する。
なお、上記情報デマルチプレクサは、音声復号処理を行う音声復号手段に設けても良いし、送信用データを元のデータに変換する受信処理手段に設けても良い。
さらに、本発明に係る情報デマルチプレクサは、上記の構成において、上記多重化データは複数のフレームからなり、上記無音識別子を含むフレームと、上記情報データの一部を含むフレームとのデータ構造が異なることを利用して、上記検出手段は上記無音識別子を含むフレームを検出し、上記分離手段は上記情報データの一部を含むフレームを分離する構成である。
上記の構成によると、データ構造から、無音識別子を含むフレームであるか情報データの一部を含むフレームであるかを容易に識別することができる。したがって、情報データが多重化された多重化データから情報データを容易に分離できるという効果を奏する。
さらに、本発明に係る情報デマルチプレクサは、上記の構成において、上記多重化データは、同じ情報データを繰返し組み込んだデータであり、上記分離手段にて分離された情報データの繰返し部分を照合する照合手段をさらに備える構成である。
上記の構成によると、照合手段により情報データの繰返し部分を判別することができる。したがって、送信側が、情報データを確実に伝えるために情報データを繰返し送信した場合にも対処できるという効果を奏する。
さらに、本発明に係る情報デマルチプレクサは、上記の構成において、上記多重化データから分離された上記情報データの出力を制御する情報データ出力制御手段を備える構成である。
この情報データの出力を制御する具体例としては、分離手段が情報データを分離するか否かを制御したり、分離した情報データを出力するか否かを制御したり、情報データが符号化されていれば、分離した情報データを復号するか否かを制御したりすることが挙げられる。
上記の構成によると、情報データ出力制御手段が情報データを出力するか否かを制御できるので、例えばコンピュータウィルスなどのような所望しない情報データの取得を制御することができる。
また、本発明に係る受信処理デバイスは、上記受信処理手段が、上記多重化データの各部の受信レートを判定する受信レート判定手段をさらに備えており、上記分離手段は、上記受信レート判定手段にて判定された受信レートの相違に基づいて、上記無音圧縮データおよび上記情報データに分離するものである構成である。
上記の構成によると、分離手段は、受信レートの相違に基づいて、無音圧縮データおよび情報データに分離している。これにより、無音圧縮された音声データに情報データが多重化された多重化データの分離を実現できるという効果を奏する。
また、本発明に係る電話端末は、上記無音圧縮手段にて無音圧縮された無音圧縮データと情報データとを多重化する上記構成の情報マルチプレクサと、該情報マルチプレクサにて多重化された多重化データを送信する送信手段と、多重化データを受信する受信手段と、該受信手段にて受信した多重化データを上記無音圧縮データおよび上記情報データに分離する上記構成の情報デマルチプレクサまたは上記構成の受信処理デバイスと、該情報デマルチプレクサにて分離された無音圧縮データを元の音声データに復元する音声復元手段とを備える構成である。
上記の構成によると、電話端末は、無音圧縮データおよび情報データを多重化して送信するとともに、多重化データを無音圧縮データおよび情報データに分離することができるので、通話中に情報データを送受できるという効果を奏する。
なお、上記無音圧縮手段および上記情報マルチプレクサに代えて、上記構成の音声処理デバイスを備えることもできる。
また、本発明に係るノードは、上記電話端末から多重化データを受信する受信手段と、該受信手段にて受信した多重化データを上記無音圧縮データおよび上記情報データに分離する上記構成の情報デマルチプレクサまたは上記構成の受信処理デバイスと、上記無音圧縮データおよび上記情報データを多重化する上記構成の情報マルチプレクサと、該情報マルチプレクサにて多重化された多重化データを上記電話端末に送信する送信手段とを備える構成である。
上記の構成によると、ノードは、電話端末からの多重化データを無音圧縮データおよび情報データに分離するとともに、無音圧縮データおよび情報データを多重化して電話端末送信することができる。したがって、電話端末間で通話中に、電話端末とノードとの間で情報データを送受できるという効果を奏する。
同様に、本発明に係る電話システムは、上記構成の複数の電話端末を通信ネットワークを介して接続することにより、通話中に情報データを送受できるという効果を奏する。
また、上記構成の電話システムに上記構成のノードを含むことにより、電話端末間で通話中に、電話端末とノードとの間で情報データを送受できるという効果を奏する。
また、本発明に係る情報多重化方法は、上記無音圧縮データ部分から上記無音識別子を検出する検出ステップと、該検出ステップの検出結果に基づき、上記無音圧縮データ部分における上記無音識別子同士の間に、上記情報データを組み込む組込みステップとを含む方法である。
上記の方法によると、組込みステップにより、検出手段が検出した無音識別子同士の間に情報データが組み込まれる。これにより、情報データを多重化しても所定の間隔毎に無音識別子が含まれるから、無音圧縮処理を行う電話システムにおいても、情報データの多重化を実現できるという効果を奏する。
また、本発明に係る情報分離方法は、上記多重化データから上記無音識別子を検出する検出ステップと、該検出ステップによる検出結果に基づいて、上記無音識別データ同士の間から上記情報データを分離する分離ステップとを含む方法である。
上記の方法によると、検出ステップによって検出された無音識別子同士の間に組み込まれた情報データが、分離ステップによって多重化データから分離されるので、多重化データから情報データの分離を実現できるという効果を奏する。
なお、上記情報マルチプレクサにおける各手段を、情報多重化プログラムによりコンピュータ上で実行させることができる。また、上記情報デマルチプレクサにおける各手段を、情報分離プログラムによりコンピュータ上で実行させることができる。さらに、上記情報多重化プログラムまたは上記情報分離プログラムをコンピュータ読取り可能な記録媒体に記憶させることにより、任意のコンピュータ上で上記情報多重化プログラムまたは上記情報分離プログラムを実行させることができる。
〔実施の形態1〕
本発明の一実施形態について図1〜図3に基づいて以下に説明する。図1は、本実施形態における送信側のAMR処理部の概略構成を示しており、図2は、受信側のAMR処理部の概略構成を示している。なお、図中の実線は音声データおよび情報データの流れを示し、破線はその他各種情報の流れを示している。送信側および受信側のAMR処理部10・20は、携帯電話端末などの電話端末に設けることもできるし、携帯電話端末と無線通信を行う基地局やメールサーバなどのように、通信ネットワーク上のノードに設けることもできる。
図1に示すように、送信側のAMR処理部(情報マルチプレクサ、音声処理デバイス)10は、音声入力部11、AMR符号部(検出手段、無音圧縮手段、音声符号化手段)12、無音検出部(無音検出手段)13、SIDフレーム作成部(置換え手段)14、符号化ビット列生成部(無音圧縮手段)15、情報データ入力部16、情報データ変換処理部17、情報データ多重部(組込み手段)18、および音声符号データ出力部19を備える構成である。なお、音声入力部11、無音検出部13、SIDフレーム作成部14、符号化ビット列生成部15、および音声符号データ出力部19は、図14に示される従来の音声入力部101、無音検出部103、SIDフレーム作成部104、符号化ビット列生成部105、音声符号データ出力部106とそれぞれ同様に機能するので、その説明を省略する。
AMR符号部12は、音声入力部11からの音声データを無音検出部13およびSIDフレーム作成部14に送信する。また、AMR符号部12は、無音検出部13から無音状態の検出を通知する無音検出データを受信し、受信した無音検出データに基づいて、有音状態の音声データを符号化し、符号化された音声データを符号化ビット列生成部105に送信する。さらに、AMR符号部12は、受信した無音検出データに基づいて、SIDフレーム(無音識別子)の位置やSIDの種類などのSID情報を情報データ変換処理部17および情報データ多重部18に通知する。
情報データ入力部16は、AMR処理部10の外部から入力される情報データを受信し、情報データ変換処理部17に送信する。ここで、情報データには、音声データとは別に伝えるべきデータであれば、任意のデータを利用することができる。例えば、携帯電話端末間では、電子メール、ファイル転送用データ、メッセージ交換用テキストデータなどが挙げられる。また、携帯電話端末と基地局との間では、他の端末からまたは他の端末への電子メール、テレビジョン(TV)放送における文字放送(Teletext)のような、登録ユーザのための報知データ、端末の位置情報などのようなキャリア側の制御データなどが挙げられる。
情報データ変換処理部17は、情報データ入力部16から情報データを受信して所定のフォーマットに変換する。また、情報データ変換処理部17は、AMR符号部12からSID情報を受け取り、受け取ったSID情報に基づいて、変換された情報データを分割して情報データ多重部18に送信する。
情報データ多重部18は、AMR符号部12からSID情報を受け取らない場合、またはAMR符号部12からSID情報を受け取っても情報データ変換処理部17から情報データを受信していない場合には、符号化ビット列生成部15からAMR音声データを受信して音声符号データ出力部19に送信する。また、情報データ多重部18は、AMR符号部12からSID情報を受け取るとともに、情報データ変換処理部17から情報データを受信する場合には、受け取ったSID情報に基づいて、SIDフレームF・Uの間に情報データを組み込むことにより、AMR音声データおよび情報データを多重化して、多重化データを音声符号データ出力部19に送信する。
上記の構成において、音声入力部11に入力された音声データは、無音検出部13にて無音状態であるか有音状態であるかが検出される。有音状態であれば、AMR符号部12にて符号化され、符号化ビット列生成部15にて音声フレームSに変換される。一方、無音状態であれば、SIDフレーム生成部14にて生成されたSIDフレームF・UとNO_DATAフレームNとに変換される。符号化ビット列生成部15にて変換されたフレームS・F・U・Nは、情報データ多重部18に送信される。
一方、情報データ入力部16に入力された情報データは、情報データ変換処理部17にて所定のフォーマットに変換された後、SID情報の通知に基づいて情報データ多重部18に送信される。情報データ多重部18にて、SID情報に基づいて、NO_DATAフレームNを情報データフレームIに置換し、音声符号データ出力部19を介してAMR処理部10の外部に出力される。
図3は、多重化データのフレーム構成を示している。同図において、フレームS・F・Uは従来と同様であり、フレームIが情報データを含むものである。図示のように、本実施形態における多重化データは、SIDフレームF・Uの間に、情報データフレームIが組み込まれている。
なお、情報データフレームIのビット長は、図3に示される伝送データ量例1のように、SIDフレームF・Uと同じ39ビットであってもよい。この場合でも、SIDフレームF・Uの位置が定まっているので、情報データフレームIの検出および分離が可能である。また、情報データフレームIのビット長は、同図に示される伝送データ量例2のように、音声フレームSおよびSIDフレームF・Uとは異なるビット長k・m・nであってもよい。この場合、1フレームのビット数を検出することにより、情報データフレームIの検出および分離が可能である。
図16に示されるように、AMRによる音声コーデック処理では、SID_FIRSTフレームF以降、SID_UPDATEフレームUの間隔は、最初が3フレーム、その次以降が7フレームと定められており、データが正しく伝送されている限りはSIDフレームの位置が保証されている。したがって、情報データ多重部18は、受け取ったSID情報からSIDフレームの位置を把握することにより、SIDフレームF・Uの間に情報データフレームIを組み込むことができ、AMR音声データおよび情報データの多重化を実現することができる。
なお、図3に示される伝送データ量例1の場合では、音声フレームSのデータ伝送速度を12.2kpbsとすると、無音状態が継続する場合には、1個のSID_UPDATEフレームUと7個の情報データフレームIとが伝送されるから、データ伝送速度は平均1.95kbps(=12.2×(39×8)/(244×8))となる。
次に、受信側のAMR処理部(情報デマルチプレクサ)20について説明する。図2に示すように、受信側のAMR処理部20は、音声符号データ入力部21、情報データ検出部(検出手段、分離手段、照合手段)22、情報データ復号処理部23、情報データ出力部24、データ列解析部25、AMR復号部26、エラーフレーム・ロストフレーム処理部27、CNG生成部28、および復号音声出力部29を備える構成である。なお、音声符号データ入力部21、データ列解析部25、AMR復号部26、エラーフレーム・ロストフレーム処理部27、CNG生成部28、および復号音声出力部29は、図15に示される従来の音声符号データ入力部111、データ列解析部112、AMR復号部113、エラーフレーム・ロストフレーム処理部114、CNG生成部115、および復号音声出力部116とそれぞれ同様に機能するので、その説明を省略する。
情報データ検出部22は、音声符号データ入力部21から受信した多重化データから情報データを検出して分離する。具体的には、SIDフレームF・Uを検出することにより、情報データフレームIを検出して分離したり、1フレーム当りのビット長を検出することにより情報データフレームIを検出して分離したりすることができる。また、情報データ検出部22は、分離した情報データフレームIを情報データ復号処理部23に送信するとともに、多重化データ、または多重化データから情報データフレームIを分離したデータをデータ列解析部25に送信する。
情報データ復号処理部23は、情報データ検出部22から受信した情報データフレームIを復号し、復号した情報データを情報データ出力部24に送信する。情報データ出力部24は、受信した情報データをAMR処理部20の外部に出力する。
上記の構成において、音声符号データ入力部21に入力された多重化データは、情報データ検出部22にて情報データフレームIが検出されて分離され、分離された情報データフレームIは、情報データ復号処理部23にて復号されて、情報データ出力部24を介して出力される。
一方、多重化データから情報データフレームIが分離されたAMR音声データは、データ列解析部25にて各フレームが解析される。フレームがエラーフレームやロストフレームであれば、エラーフレーム・ロストフレーム処理部27にて適当に処理され、AMR復号部26に指示し、AMR復号部26にて対応する音声データを生成する。一方、フレームがSIDフレームF・Uであれば、CNG生成部28にて無音状態の音声データを生成してAMR復号部26に送信する。その他、フレームが音声フレームFであれば、AMR復号部26にて通常の音声復号処理が行われて音声データが生成される。これらの音声データが、AMR復号部26から復号音声出力部29を介して外部に出力される。
したがって、情報データ検出部22が、SIDフレームF・Uを検出したり、1フレームのビット長を検出したりすることにより、情報データフレームIを検出できるので、多重化データから情報データの分離を実現することができる。
〔実施の形態2〕
次に、本発明の別の実施形態について、図4〜図9に基づいて説明する。本実施形態の携帯電話端末は、図1および図2に示されるAMR処理部10・20を組み込んだものである。図4は、携帯電話端末の要部の概略構成を示している。図示のように、携帯電話端末の送信側ブロック30は、音声コーデック処理ブロック(無音圧縮手段)31、情報データ入力部32、無線送信処理部33、および無線データ送信部(送信手段)34を備える構成である。また、無線送信処理部33は、情報データ変換処理部35、情報データ多重部(情報マルチプレクサ)36、チャネルコーディング処理部37、およびデータ変調部38を備える構成である。
音声コーデック処理ブロック31は、図1に示される音声入力部11、AMR符号部12、無音検出部13、SIDフレーム生成部14、および符号化ビット列生成部15と同様に機能する。また、情報データ入力部32、情報データ変換処理部35、および情報データ多重部36は、図1に示される情報データ入力部16、情報データ変換処理部17、および情報データ多重部18としてそれぞれ機能する。
したがって、送信側ブロック30の外部から入力される音声データおよび情報データは、図1に示されるAMR処理部10と同様に、音声コーデック処理ブロック31、情報データ入力部32、情報データ変換処理部35、および情報データ多重部36によって多重化される。多重化データは、チャネルコーディング処理部37およびデータ変調部38にて、無線送信に適した形式に変換され、無線データ送信部34にて無線送信されて、電話回線網39を伝送することになる。なお、チャネルコーディング処理部37では、CRCの付加処理、多段インタリーブ処理、畳み込み処理、レートマッチング処理、他無線とのマルチプレクス処理などが行われる。
一方、図4に示されるように、携帯電話端末の受信側ブロック(受信処理デバイス)40は、無線データ受信部(受信手段)41、無線受信処理部(受信処理手段)42、音声コーデック処理ブロック(音声復元手段)43、および情報データ出力部44を備える構成である。また、無線受信処理部42は、データ復調部45、チャネルコーディング処理部46、受信レート判定部(受信レート判定手段)47、情報データ検出部(分離手段、情報デマルチプレクサ)48、および情報データ復号処理部49を備える構成である。
電話回線網39を伝送した多重化データは、無線データ受信部41にて無線受信され、データ復調部45およびチャネルコーディング処理部46にて元の形式に変換されて、受信レート判定部47に送信される。受信レート判定部47は、受信した各フレームの伝送速度を判定し、判定した伝送速度に基づいて、受信したフレームが適切なフレームであるか否かを判断する。適切なフレームであると判断した場合には、受信にしたフレームを情報データ検出部48に送信する。一方、不適切な(NG)フレームであると判定した場合には、受信したフレームを破棄する。なお、フレームを破棄した場合、アプリケーション側で再送要求を行うようにすることもできる。
したがって、情報データフレームIのビット長が、図17に記載の各フレームのビット長に該当しない場合には、受信レート判定部47がNGフレームと判定することになる。これを防止するため、本実施形態では、受信レート判定部47は、情報データフレームIも適切なフレームであると判定するように変更する必要がある。なお、図3に示される伝送データ量例1のように、情報データのビット長がSIDフレームF・Uのビット長と同じ39ビットであれば、受信レート判定部47の変更は不要である。
情報データ検出部48、情報データ復号処理部49、および情報データ出力部44は、図2に示される情報データ検出部22、情報データ復号処理部23、および情報データ出力部24と同様に機能する。また、音声コーデック処理ブロック43は、図2に示されるデータ列解析部25、AMR復号部26、エラーフレーム・ロストフレーム処理部27、CNG生成部28、および復号音声出力部29と同様に機能する。
したがって、受信レート判定部47が送信した多重化データは、情報データ検出部48にて情報データフレームIが分離され、分離された情報データフレームIは、情報データ復号処理部23にて復号され、復号された情報データが情報データ出力部24を介して出力される。一方、多重化データから情報データフレームIが分離されたAMR音声データは、音声コーデック処理ブロック43にて音声データに変換されて出力される。
したがって、本実施形態の携帯電話端末は、通話中に音声データおよび情報データを多重化して送信できるとともに、受信した多重化データを音声データおよび情報データに分離することができる。したがって、1つの電話回線で音声データと情報データとを同時に通信することができる。
なお、本実施形態では、受信レート判定部47および情報データ検出部48が分離しているが、情報データフレームIのビット長が他のフレームとは異なる場合には、伝送速度により情報データフレームIを検出して分離できるので、受信レート判定部47および情報データ検出部48を1つにまとめることができる。
また、情報データの多重化に関する機能を、音声データの符号化処理を行う音声コーデック処理ブロックにて実行することもできる。具体的には、図4に示される送信側ブロック30の音声コーデック処理ブロック31、情報データ入力部32、情報データ変換処理部35、および情報データ多重部36を、図5に示される送信側ブロック50の音声コーデック処理ブロック(音声処理デバイス)51にまとめることができる。この場合、無線送信処理部52は、情報データの多重化に関する機能が不要となるから、従来の無線送信処理部を利用することができる。
同様に、情報データの分離に関する機能を、音声データの復号処理を行う音声コーデック処理ブロックにて実行することもできる。具体的には、図4に示される受信側ブロック40の情報データ検出部48、情報データ復号処理部49、情報データ出力部44、および音声コーデック処理ブロック43を、図5に示される受信側ブロック55の音声コーデック処理ブロック57にまとめることができる。この場合、無線受信処理部56は、受信レート判定部47が情報データフレームIをNGフレームと判定すること無いように、受信レート判定部47を変更するのみで、従来の無線受信処理部を利用することができる。
また、情報データフレームを検出する方法としては、以下の方法が考えられる。図6は、CRCを含むデータ構造を示している。通常の処理では、同図(a)に示されるように、データ部のデータ全て(例えば、39ビット)が無線処理部33・42のCRC処理対象となっている。したがって、同図(b)に示されるように、CRC処理対象としてダミーのデータを例えば1ビット追加することにより、CRC演算が変更される。したがって、情報データフレームにダミーのデータを追加することにより、多重化データの中から情報データフレームの検出を無線処理部42にて行うことができる。
なお、CRC演算を変更する方法としては、他にも逆方向の使用や、反転するなど、種々の方法が考えられ、これらの方法で情報データフレームの検出を実行することもできる。
図7は、CRC判定処理を変更して情報データフレーム等を検出する処理の流れを示している。受信レート判定部47は、レート判定のためにCRC判定を実施する。まず、通常のCRC判定を行い、CRCが一致した場合には(S1でYES)、音声フレームと判断して、音声処理系での処理を行う。
一方、CRCが一致しない場合には(S1でNO)、情報データフレームに関するCRC判定を行い、CRCが一致した場合には(S2でYES)、情報データフレームと判断して情報データ処理を行う。一方、CRCが一致しない場合には(S2でNO)、エラーフレームと判断してエラー処理を行う。
図8は、CRC判定処理を変更すること無く情報データフレーム等を検出する処理の流れを示している。まず、CRC判定を行い、CRCが一致しない場合には(S3でNO)、エラーフレームと判断してエラー処理を行う。一方、CRCが一致する場合には(S3でYES)、SIDデータが正常であり、かつSIDタイミングが正常であるか否かを判断し、正常である場合には(S4でYES)、音声データフレームと判断して音声処理系での処理を行い、正常ではない場合には(S4でNO)、情報データフレームと判断して情報データ処理を行う。
図9(a)(b)は、同一の情報データを繰返し組み込む例を示している。このように、同一の情報データを繰り返すことを予め定義しておくことにより、同一の情報データが繰返し転送されるから、情報データを確実に転送することができる。
〔実施の形態3〕
次に、本発明のさらに別の実施形態について、図10に基づいて説明する。本実施形態の携帯電話システムは、図4または図5に示される携帯電話端末(移動端末)を含むものである。図10は、携帯電話システムの要部の概略構成を示している。図示のように、本実施形態の携帯電話システムは、2つの移動端末60・63と、各移動端末60・63と無線通信を行う基地局61・62を備える構成である。基地局61・62同士の通信は既存の電話回線網を介して行われる。
本実施形態では、一方の移動端末60は、図4または図5に示される移動端末であり、情報データの多重化および分離が可能となっている。なお、他方の移動端末63は、従来と同様の移動端末である。また、本実施形態では、移動端末60と無線通信を行う基地局61(ノード)は、図1および図2に示されるAMR処理部10・20を備えており、移動端末60と同様に情報データの多重化および分離が可能となっている。なお、移動端末63と無線通信を行う基地局62は、従来と同様の基地局である。
上記の構成によると、移動端末60・63の間で音声通話を行う場合には、移動端末および基地局60〜63の間では音声データが送受信されている。このとき、移動端末60および基地局61は、互いに情報データの多重化および分離が可能であるから、情報データを組み込んだ音声データの送受信が可能である。
したがって、移動端末60・63同士の通話中に、移動端末60および基地局61との間で情報データの送受信が可能である。これにより、例えば、基地局61から移動端末60への報知情報やサービス情報の通知、メールの送信などを行うことができ、また、移動端末60から基地局61へのサービス要望発生の通知などを行うことができ、音声通話のみでは実現できないサービスが可能となる。
〔実施の形態4〕
次に、本発明のさらに別の実施形態について、図11に基づいて説明する。本実施形態の携帯電話システムは、図10に示す携帯電話システムに比べて、基地局61に代えて、従来と同様の基地局65としている点と、従来の移動端末63に代えて、図4または図5に示される移動端末66としている点とが異なり、その他の構成は同様である。なお、上記実施形態で説明した構成と同様の機能を有する構成には、同一の符号を付して、その説明を省略する。
上記の構成によると、両方の移動端末60・66は、情報データの多重化および分離が可能となっている。したがって、移動端末60・66の間で音声通話を行う場合に、移動端末60・66は、それぞれ情報データを組み込んだ音声データの送受信が可能である。なお、基地局62・65では、音声データと認識して、従来と同様に送受信を行うことになる。
したがって、移動端末60・66同士の通話中に、移動端末60・66同士の間で情報データの送受信が可能である。これにより、例えば、移動端末から移動端末への報知情報やサービス情報の通知、サービス要望発生の通知、メールの送受信、ファイルの転送など、音声通話のみでは実現できないサービスが可能となる。
〔実施の形態5〕
次に、本発明の他の実施形態について、図12および図13に基づいて説明する。本実施形態のAMR処理部は、図1および図2に示されるAMR処理部10・20に比べて、情報データの多重化および分離に関する処理の実行を制御する構成が設けられている点が異なり、その他の構成は同様である。なお、上記実施形態で説明した構成と同様の機能を有する構成には、同一の符号を付して、その説明を省略する。
図12は、本実施形態のAMR処理部70の概略構成を示している。AMR処理部70は、図1に示されるAMR処理部10に比べて、情報データ対応制御部(多重化制御手段)71が、情報データ変換処理部72の実行と、情報データ多重部73における情報データの多重化の実行とが制御されている点が異なり、その他の構成は同様である。
これにより、本実施形態のAMR処理部70を備えた端末やノードでは、情報データ対応制御部71が情報データを送信するか否かを制御することができ、情報データが勝手に送信されることを防止できる。また、本実施形態のAMR処理部70をキャリア側に設けることにより、キャリア側の資源が端末で勝手に利用されることを防止できる。
図13は、本実施形態のAMR処理部80の概略構成を示している。AMR処理部80は、図2に示されるAMR処理部20に比べて、情報データ対応制御部(情報データ出力制御手段)81が、情報データ検出部82における情報データの分離の実行と、情報データ復号処理部83の実行とが制御されている点が異なり、その他の構成は同様である。
これにより、本実施形態のAMR処理部80を備えた端末やノードでは、情報データ対応制御部81が情報データを受信するか否かを制御することができる。これにより、例えばコンピュータウィルスなどのような所望しない情報データの受け取りを拒否することができる。
なお、電話端末やノードに設けられるAMR処理部10・20・70・80、送信側処理ブロック30・50、および受信側処理ブロック40・55は、ハードウェアロジックによって構成してもよいし、次のようにCPUを用いてソフトウェアによって実現してもよい。
すなわち、電話端末やノードは、各機能を実現する制御プログラムの命令を実行するCPU(central processing unit )、上記プログラムを格納したROM(read only memory)、上記プログラムを展開するRAM(random access memory)、上記プログラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)などを備えている。そして、本発明の目的は、上述した機能を実現するソフトウェアであるデータ記録装置10の制御プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を、上記データ記録装置10に供給し、そのコンピュータ(またはCPUやMPU)が記録媒体に記録されているプログラムコードを読み出し実行することによっても、達成可能である。
上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ系、フレキシブルディスク/ハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVD/CD−R等の光ディスクを含むディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM/EPROM/EEPROM/フラッシュROM等の半導体メモリ系などを用いることができる。
また、電話端末やノードを通信ネットワークと接続可能に構成し、上記プログラムコードを通信ネットワークを介して供給してもよい。この通信ネットワークとしては、特に限定されず、例えば、インターネット、イントラネット、エキストラネット、LAN、ISDN、VAN、CATV通信網、仮想専用網(virtual private network)、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、通信ネットワークを構成する伝送媒体としては、特に限定されず、例えば、IEEE1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL回線等の有線でも、IrDAやリモコンのような赤外線、Bluetooth、802.11無線、HDR、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された搬送波あるいはデータ信号列の形態でも実現され得る。
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、さらに、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
本発明により、現行の音声コーデック処理、あるいは電話システムそのものに変更を加えず、すなわち大きな改変コストをかけることなく、情報データの授受が可能となる。これにより、デジタル無線端末あるいは無音圧縮処理を搭載する他の携帯端末における新たなサービス提供が可能となる。
本発明の一実施形態における送信側のAMR処理部の概略構成を示すブロック図である。 上記実施形態における受信側のAMR処理部の概略構成を示すブロック図である。 上記送信側のAMR処理部から出力される多重データの時間推移を示すタイムチャートである。 本発明の別の実施形態である携帯電話端末の要部の概略構成を示すブロック図である。 上記携帯電話端末の変形例を示すブロック図である。 フレームにおいてCRCを含むデータ構造を示す図であり、同図(a)は、通常のデータ構造を示しており、同図(b)は、情報データを識別するために、ダミーデータを追加したデータ構造を示している。 CRC判定処理を変更して情報データフレーム等を検出する処理の流れを示すフローチャートである。 CRC判定処理を変更すること無く情報データフレーム等を検出する処理の流れを示すフローチャートである。 情報データフレームのデータ内容を示す図であり、同図(a)は1つの情報データフレームが繰り返される例を示しており、同図(b)は複数の情報データごとに繰り返される例を示している。 本発明のさらに別の実施形態である携帯電話システムの概略構成を示すブロック図である。 本発明のさらに別の実施形態である携帯電話システムの概略構成を示すブロック図である。 本発明のさらに別の実施形態における送信側のAMR処理部の概略構成を示すブロック図である。 本発明のさらに別の実施形態における受信側のAMR処理部の概略構成を示すブロック図である。 従来技術における送信側のAMR処理部の概略構成を示すブロック図である。 従来技術における受信側のAMR処理部の概略構成を示すブロック図である。 上記送信側のAMR処理部から出力されるAMR音声データの時間推移を示すタイムチャートである。 AMR音声コーデックにおいて各種フレームのビット数を表形式で示す図である。 SIDフレームのデータ構成を表形式で示す図である。 クラスとエラー訂正用コーディングおよびCRCとの対応関係を表形式で示す図である。
符号の説明
51 音声コーデック処理ブロック(音声処理デバイス)
61 基地局(ノード)
71 情報データ対応制御部(多重化制御手段)
81 情報データ対応制御部(情報データ出力制御手段)
F・U SIDフレーム(無音識別子)

Claims (21)

  1. 音声データを無音圧縮した無音圧縮データと、上記音声データとは異なる情報データとを多重化する情報マルチプレクサであって、
    上記無音圧縮データは、声を出していない無音状態の音声データ部分である無音データ部分を、上記無音状態を示す無音識別子を所定の間隔ごとに含む無音圧縮データ部分に変換したものであり、
    上記無音識別子を検出する検出手段と、
    該検出手段の検出結果に基づいて、上記無音圧縮データ部分における上記無音識別子同士の間に、上記情報データを組み込む組込み手段を備えることを特徴とする情報マルチプレクサ。
  2. 上記組込み手段にて上記情報データが組み込まれた無音圧縮データ部分は、複数のフレームからなり、
    上記無音識別子を含むフレームは、上記情報データの一部を含むフレームと比べて、データ構造が異なることを特徴とする請求項1に記載の情報マルチプレクサ。
  3. 上記組込み手段は、同じ情報データを繰返し組み込むことを特徴とする請求項1に記載の情報マルチプレクサ。
  4. 上記組込み手段による上記無音圧縮データと上記情報データとの多重化を制御する多重化制御手段をさらに備えることを特徴とする請求項1に記載の情報マルチプレクサ。
  5. 入力された音声データを無音圧縮する無音圧縮手段と、該無音圧縮手段にて無音圧縮された音声データである無音圧縮データと、上記音声データとは異なる情報データとを多重化する多重化手段とを備える音声処理デバイスであって、
    上記無音圧縮手段は、
    入力された音声データ部分が、声を出していない無音状態の音声データ部分である無音データ部分であることを検出する無音検出手段と、
    上記音声データにおいて、上記無音検出手段にて検出された無音データ部分を、上記無音状態を示す無音識別子を所定の間隔ごとに含む無音圧縮データ部分に置き換える置換え手段とを備えており、
    上記多重化手段は、
    上記置換え手段から、上記無音圧縮データ部分における上記無音識別子の位置情報を取得し、取得された位置情報に基づいて、上記無音圧縮データ部分における上記無音識別子同士の間に、上記情報データを組み込む組込み手段とを備えることを特徴とする音声処理デバイス。
  6. 上記無音圧縮手段は、入力された音声データの符号化を行う音声符号化手段をさらに備えることを特徴とする請求項5に記載の音声処理デバイス。
  7. 音声データを無音圧縮した無音圧縮データと、上記音声データとは異なる情報データとを多重化した多重化データを各々のデータに分離する情報デマルチプレクサであって、
    上記無音圧縮データは、声を出していない無音状態の音声データ部分である無音データ部分を、上記無音状態を示す無音識別子を所定の間隔ごとに含む無音圧縮データ部分に変換したものであり、
    上記多重化データは、上記無音識別データ部分における上記無音識別子同士の間に、上記情報データを組み込んだものであり、
    上記多重化データから上記無音識別子を検出する検出手段と、
    該検出手段の検出結果に基づいて、上記無音識別データ同士の間から上記情報データを分離する分離手段とを備えることを特徴とする情報デマルチプレクサ。
  8. 上記多重化データは複数のフレームからなり、
    上記無音識別子を含むフレームと、上記情報データの一部を含むフレームとのデータ構造が異なることを利用して、上記検出手段は上記無音識別子を含むフレームを検出し、上記分離手段は上記情報データの一部を含むフレームを分離することを特徴とする請求項7に記載の情報デマルチプレクサ。
  9. 上記多重化データは、同じ情報データを繰返し組み込んだデータであり、
    上記分離手段にて分離された情報データの繰返し部分を照合する照合手段をさらに備えることを特徴とする請求項7に記載の情報デマルチプレクサ。
  10. 上記多重化データから分離された上記情報データの出力を制御する情報データ出力制御手段を備えることを特徴とする請求項7に記載の情報デマルチプレクサ。
  11. 音声データを無音圧縮した無音圧縮データと、上記音声データとは異なる情報データとを多重化した多重化データの受信処理を行う受信処理手段と、該受信処理手段にて受信処理された多重化データを各々のデータに分離する分離手段とを備える受信処理デバイスであって、
    上記無音圧縮データは、声を出していない無音状態の音声データ部分である無音データ部分を、上記無音状態を示す無音識別子を所定の間隔ごとに含む無音圧縮データ部分に変換したものであり、
    上記多重化データは、上記無音識別データ部分における上記無音識別子同士の間に、上記情報データを組み込んだものであり、
    上記受信処理手段は、上記多重化データの各部の受信レートを判定する受信レート判定手段をさらに備えており、
    上記分離手段は、上記受信レート判定手段にて判定された受信レートの相違に基づいて、上記無音圧縮データおよび上記情報データに分離するものであることを特徴とする受信処理デバイス。
  12. 音声データを無音圧縮する無音圧縮手段と、
    該無音圧縮手段にて無音圧縮された無音圧縮データと、上記音声データとは異なる情報データとを多重化する請求項1に記載の情報マルチプレクサと、
    該情報マルチプレクサにて多重化された多重化データを送信する送信手段と、
    多重化データを受信する受信手段と、
    該受信手段にて受信した多重化データを上記無音圧縮データおよび上記情報データに分離する請求項7に記載の情報デマルチプレクサまたは請求項11に記載の受信処理デバイスと、
    該情報デマルチプレクサにて分離された無音圧縮データを元の音声データに復元する音声復元手段とを備える電話端末。
  13. 上記無音圧縮手段および上記情報マルチプレクサに代えて、請求項4に記載の音声処理デバイスを備えることを特徴とする請求項12に記載の電話端末。
  14. 請求項12または13に記載の電話端末と通信可能なノードであって、
    上記電話端末から多重化データを受信する受信手段と、
    該受信手段にて受信した多重化データを上記無音圧縮データおよび上記情報データに分離する請求項7に記載の情報デマルチプレクサまたは請求項11に記載の受信処理デバイスと、
    上記無音圧縮データと、上記音声データとは異なる情報データとを多重化する請求項1に記載の情報マルチプレクサと、
    該情報マルチプレクサにて多重化された多重化データを上記電話端末に送信する送信手段とを備えることを特徴とするノード。
  15. 請求項12または13に記載の複数の電話端末を、通信ネットワークを介して接続した電話システム。
  16. 上記通信ネットワークは、請求項14に記載のノードを含むことを特徴とする請求項15に記載の電話システム。
  17. 音声データを無音圧縮した無音圧縮データと、上記音声データとは異なる情報データとを多重化する情報多重化方法であって、
    上記無音圧縮データは、声を出していない無音状態の音声データ部分である無音データ部分を、上記無音状態を示す無音識別子を所定の間隔ごとに含む無音圧縮データ部分に変換したものであり、
    上記無音圧縮データ部分から上記無音識別子を検出する検出ステップと、
    該検出ステップの検出結果に基づき、上記無音圧縮データ部分における上記無音識別子同士の間に、上記情報データを組み込む組込みステップとを含むことを特徴とする情報多重化方法。
  18. 音声データを無音圧縮した無音圧縮データと、上記音声データとは異なる情報データとを多重化した多重化データを各々のデータに分離する情報分離方法であって、
    上記無音圧縮データは、声を出していない無音状態の音声データ部分である無音データ部分を、上記無音状態を示す無音識別子を所定の間隔ごとに含む無音圧縮データ部分に変換したものであり、
    上記多重化データは、上記無音識別データ部分における上記無音識別子同士の間に、上記情報データを組み込んだものであり、
    上記多重化データから上記無音識別子を検出する検出ステップと、
    該検出ステップによる検出結果に基づいて、上記無音識別データ同士の間から上記情報データを分離する分離ステップとを含むことを特徴とする情報分離方法。
  19. 請求項1ないし4の何れか1項に記載の情報マルチプレクサを動作させるための情報多重化プログラムであって、コンピュータを上記各手段として機能させるための情報多重化プログラム。
  20. 請求項7ないし10の何れか1項に記載の情報デマルチプレクサを動作させるための情報分離プログラムであって、コンピュータを上記各手段として機能させるための情報分離プログラム。
  21. 請求項19に記載の情報多重化プログラム、または請求項20に記載の情報分離プログラムが記録されたコンピュータ読取り可能な記録媒体。
JP2003329682A 2003-09-22 2003-09-22 情報マルチプレクサ、音声処理デバイス、情報デマルチプレクサ、受信処理デバイス、電話端末、ノード、電話システム、情報多重化方法、情報分離方法、情報多重化プログラム、情報分離プログラム、および該プログラムを記録した記録媒体 Expired - Fee Related JP4188190B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003329682A JP4188190B2 (ja) 2003-09-22 2003-09-22 情報マルチプレクサ、音声処理デバイス、情報デマルチプレクサ、受信処理デバイス、電話端末、ノード、電話システム、情報多重化方法、情報分離方法、情報多重化プログラム、情報分離プログラム、および該プログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003329682A JP4188190B2 (ja) 2003-09-22 2003-09-22 情報マルチプレクサ、音声処理デバイス、情報デマルチプレクサ、受信処理デバイス、電話端末、ノード、電話システム、情報多重化方法、情報分離方法、情報多重化プログラム、情報分離プログラム、および該プログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
JP2005101709A true JP2005101709A (ja) 2005-04-14
JP4188190B2 JP4188190B2 (ja) 2008-11-26

Family

ID=34458866

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003329682A Expired - Fee Related JP4188190B2 (ja) 2003-09-22 2003-09-22 情報マルチプレクサ、音声処理デバイス、情報デマルチプレクサ、受信処理デバイス、電話端末、ノード、電話システム、情報多重化方法、情報分離方法、情報多重化プログラム、情報分離プログラム、および該プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP4188190B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008023649A1 (fr) * 2006-08-22 2008-02-28 Ntt Docomo, Inc. Procédé d'ouverture/commande de ressource radio, station de base radio et station mobile
JP2008521331A (ja) * 2004-11-23 2008-06-19 ミラコム テクノロジー カンパニー リミテッド 通信システムの送受信装置及び方法
JP2010537594A (ja) * 2007-08-24 2010-12-02 アルカテル−ルーセント リソース、ネットワーク・エレメントおよびユーザ機器をスケジューリングする方法
JP2010537593A (ja) * 2007-08-24 2010-12-02 アルカテル−ルーセント リソース、ネットワーク要素及びユーザ機器をスケジューリングするための方法
JP2012510784A (ja) * 2008-12-02 2012-05-10 クゥアルコム・インコーポレイテッド ワイヤレスネットワークにおける非連続送信

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008521331A (ja) * 2004-11-23 2008-06-19 ミラコム テクノロジー カンパニー リミテッド 通信システムの送受信装置及び方法
WO2008023649A1 (fr) * 2006-08-22 2008-02-28 Ntt Docomo, Inc. Procédé d'ouverture/commande de ressource radio, station de base radio et station mobile
JP4773521B2 (ja) * 2006-08-22 2011-09-14 株式会社エヌ・ティ・ティ・ドコモ 無線リソース開放制御方法、無線基地局および移動局
US8537666B2 (en) 2006-08-22 2013-09-17 Ntt Docomo, Inc. Radio resource release controlling method, radio base station, and mobile station
JP2010537594A (ja) * 2007-08-24 2010-12-02 アルカテル−ルーセント リソース、ネットワーク・エレメントおよびユーザ機器をスケジューリングする方法
JP2010537593A (ja) * 2007-08-24 2010-12-02 アルカテル−ルーセント リソース、ネットワーク要素及びユーザ機器をスケジューリングするための方法
JP2012510784A (ja) * 2008-12-02 2012-05-10 クゥアルコム・インコーポレイテッド ワイヤレスネットワークにおける非連続送信
US8483130B2 (en) 2008-12-02 2013-07-09 Qualcomm Incorporated Discontinuous transmission in a wireless network

Also Published As

Publication number Publication date
JP4188190B2 (ja) 2008-11-26

Similar Documents

Publication Publication Date Title
TW423237B (en) Unequal error protection for perceptual audio coders
TWI295532B (en) Method and apparatus for re-formatting and supporting variable-rate vocoder frames
TWI335146B (en) Audio data packet format, method for decoding audio data packet format, method for correcting codec setup error, and mobile communication terminal adapted to correct codec setup error
CN1154285C (zh) 灵活的通信差错保护方法
JP3675480B2 (ja) 移動通信システムにおいてスピーチ送信する方法及び装置
US9123328B2 (en) Apparatus and method for audio frame loss recovery
JP2007279761A (ja) スケーラブル無損失オーディオ符号化/復号化装置及びその方法
JP3532476B2 (ja) ビデオデータ送受信装置及びその方法
JP2005534955A (ja) 記憶した音声を圧縮する方法及びシステム
JPWO2003021905A1 (ja) Cdma通信システムにおける受信装置及び受信方法
TWI297987B (en) The apparatus for providing data service between mobile and mobile in wireless communication system
CN100536587C (zh) 重传语音编码数据的方法
JP4188190B2 (ja) 情報マルチプレクサ、音声処理デバイス、情報デマルチプレクサ、受信処理デバイス、電話端末、ノード、電話システム、情報多重化方法、情報分離方法、情報多重化プログラム、情報分離プログラム、および該プログラムを記録した記録媒体
KR20060037195A (ko) 이동 통신 시스템에서 영상 데이터를 송수신하기 위한장치 및 방법
CN1265352C (zh) 一种在声音信道上进行语音识别的方法和装置
JPH1056480A (ja) マルチメディア多重化通信システム
KR20090029088A (ko) 계층적 부호화 및 복호화 방법 및 장치
JPH1065655A (ja) マルチメディア通信方法及びシステム
EP1387351B1 (en) Speech encoding device and method having TFO (Tandem Free Operation) function
JP4065383B2 (ja) 音声信号送信装置、音声信号受信装置及び音声信号伝送システム
JPH1155226A (ja) データ伝送装置
JP2002077109A (ja) ディジタル信号伝送システム及びその信号伝送装置
JP2008016981A (ja) データ通信装置
JP2004328035A (ja) 畳み込み符号を用いて信号を送受信する送信装置および受信装置ならびに通信システム
JP2000244460A (ja) 伝送路誤り符号付加・検出装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050810

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071022

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080108

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080304

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20080304

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080909

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080910

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110919

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120919

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130919

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees