JP3244014B2 - マルチメディア変換装置および変換方式 - Google Patents
マルチメディア変換装置および変換方式Info
- Publication number
- JP3244014B2 JP3244014B2 JP03039897A JP3039897A JP3244014B2 JP 3244014 B2 JP3244014 B2 JP 3244014B2 JP 03039897 A JP03039897 A JP 03039897A JP 3039897 A JP3039897 A JP 3039897A JP 3244014 B2 JP3244014 B2 JP 3244014B2
- Authority
- JP
- Japan
- Prior art keywords
- conversion
- media
- multimedia
- data
- media conversion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
- H04M3/53—Centralised arrangements for recording incoming messages, i.e. mailbox systems
- H04M3/5307—Centralised arrangements for recording incoming messages, i.e. mailbox systems for recording messages comprising any combination of audio and non-audio components
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/40—Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/60—Medium conversion
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Communication Control (AREA)
- Telephonic Communication Services (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Information Transfer Between Computers (AREA)
Description
画像など多様な情報媒体(メディア)を統合するマルチ
メディア通信において、異なるメディアに情報形式を変
換するメディア変換装置に関するものである。
ア間で通信をかわすには、情報形式等を変換するメディ
ア変換が必要となる。従来より、この種のメディア変換
装置として、例えば特開平4−302561号公報に開
示されたマルチメディア通信システムは、音声端末、テ
キスト端末、画像通信端末の各種メディアを接続した通
信システムに、音声−テキスト等、異種メディア間のメ
ディア変換をおこなう信号処置装置と、相手端末のメデ
ィアに対応した信号に変換すべく上記信号処理装置を制
御し変換された信号を受信対象の端末装置に送る交換手
段とを備えたものである。従来のメディア変換装置は、
メディア変換をおこなう信号処理装置を介することによ
り異なるメディア相互間通信を可能としていた。
ディア変換装置は、メディア変換の品質、詳しくはメデ
ィア変換の処理時間や精度を意識することなくマルチメ
ディア変換が行われていたために次のような問題があっ
た。第1の問題点は、従来のメディア変換装置では、必
ずしも受信者の期待する処理時間または精度でメディア
変換の結果が得られるとは限らないことである。これ
は、従来のメディア変換装置においてはメディア変換手
段たる信号処理装置の処理時間と精度が固定的であるの
に対し、メディア変換の処理時間と精度に対する受信者
の要求は通信の内容やその情報によって異なるからであ
る。処理時間を優先させるメディア変換装置では精度が
落ち、精度を優先させるメディア変換装置では処理時間
が増大してしまうが、従来はこのような処理時間と精度
とのトレードオフを受信者は決定することができなかっ
た。
のアルゴリズムの特徴が反映されることにより、メディ
ア変換装置に入力するデータによってはメディア変換の
結果の精度が落ちてしまうことである。例えば理想的環
境において精度の高いアルゴリズムを用いたとしても、
ノイズに頑健でなかったりする場合がある。このような
場合にはマルチメディア通信を行う上で十分な品質のメ
ディア変換をおこなうことが困難となる場合がある。ま
た、第3の問題点として、特に処理時間を優先してリア
ルタイムでメディア変換を行う装置では、1つのメディ
ア変換処理でメディア変換装置が専有されてしまうため
にその間は他の送信者からのデータを受付ないことであ
る。したがって、従来のメディア変換装置を複数のユー
ザで使用することができなかった。
待する品質でメディア変換を行うメディア変換装置を提
供することにある。また、本発明の他の目的は、様々な
入力データに対しても、メディア変換の特定のアルゴリ
ズムの特性に左右されないメディア変換を行うことであ
る。本発明はさらに、複数のユーザにより使用すること
ができるメディア変換装置を提供することを目的とす
る。
めに、本発明にかかるマルチメディア変換装置は、異種
メディア間で通信を行う際にメディア変換を行うマルチ
メディア変換装置において、それぞれ異なるアルゴリズ
ムによって前記データを他の情報形式に異なる品質でメ
ディア変換する複数の信号処理部を備え、前記複数の信
号処理部による複数のメディア変換結果の一部を選択し
前記受信者に送信するようにしたものである。ここで信
号処理部において行われるメディア変換は、マルチメデ
ィア通信において必要となるメディア変換のすべてを含
むものとし、例えば音声信号をテキストデータに変換す
る音声認識処理や、テキストデータを音声データに変換
する音声合成処理、画像データからテキストデータに情
報形式を変換する文字認識処理などを含むものとする。
また、メディア変換結果の品質とは、主に処理時間と精
度とによって評価されるものとする。ここで精度とは、
受信したデータの意味する内容を正確に含む度合をいう
ものとする。
アルゴリズムに基づいて処理時間優先のメディア変換結
果や精度優先のメディア変換結果を出力する。したがっ
て本発明に係るマルチメディア変換装置は、例えば処理
時間を優先する結果、精度を優先する結果といった複数
の結果を導き出し、その中からユーザ、特に受信者が希
望するメディア変換結果を選択し提供するものである。
これによって処理時間を要求する受信者には短時間で結
果を提供することができ、精度を要求する受信者にはよ
り正確な結果を提供することができる。なお、メディア
変換処理を行う信号処理部は、上記受信部から直接デー
タを入力するようにしても良いが、このデータを一時的
に蓄積するバッファを設け、このバッファからデータを
読み込むようにしても良いことは言うまでもない。特に
精度を優先したアルゴリズムを持った信号処理部はメデ
ィア変換処理の速度が異なる場合があるので、バッファ
を介してデータを入力するのが好ましい。
おいては、異なるアルゴリズムによって得られた複数の
メディア変換結果を受信者に送信するものであるが、請
求項2に記載されたマルチメディア変換装置は、送信部
において受信者からメディア変換の品質に関する指示を
受信し、前記指示に基づいて適当な品質のメディア変換
結果を受信者に送信するものである。このように送信部
がいわば受信者との通信機能を有することによって、受
信者は自分が要求する品質に関する指示を与え、期待す
る品質のメディア変換結果の提供をよりスムーズにする
ことができる。
装置のうち、特に請求項3に記載された発明は、上記複
数のメディア変換結果の中から処理時間優先のメディア
変換結果を選択し送信することを特徴とするものであ
る。また、請求項4に記載されたマルチメディア変換装
置は特に上記複数のメディア変換結果の中から精度優先
のメディア変換結果を選択し送信することを特徴とす
る。また、送信部が受信者からの指示を受け付ける場合
は、受信者の要求に応じてそれぞれ受信者の期待する処
理時間または精度のメディア変換結果を選択する。
おいては、精度優先のメディア変換結果を送信する際
に、送信部が複数のメディア変換結果から精度優先のア
ルゴリズムにより得たものを単に選択するようにしても
良いが、請求項5に記載されたマルチメディア変換装置
は、上記複数のメディア変換結果から総合的に判断し、
より精度の高いメディア変換結果を導出する判定部を備
えたものである。このように複数の異なったアルゴリズ
ムから導き出された結果から総合的に判断することによ
って、特定のアルゴリズムの特性の影響を排除し、いか
なる入力データに対してもアルゴリズムに左右されない
メディア変換結果を提供することができる。
マルチメディア変換装置は、上記複数の信号処理部が、
受信部で受信したデータを他の情報形式にリアルタイム
でメディア変換する処理時間優先信号処理部と、前記デ
ータを前記他の情報形式に異なるアルゴリズムによって
それぞれ精度優先でメディア変換する複数の精度優先信
号処理部とからなり、前記判定部は、前記精度優先信号
処理部より得られた複数のメディア変換結果に基づき精
度の高いメディア変換結果を導出するものであり、その
送信部は、まず前記高速信号処理部より得られるメディ
ア変換結果を前記受信者に送信し、前記受信者から精度
を優先する旨の指示に基づいて前記判定部が導出した精
度の高いメディア変換結果を送信し直すことを特徴とす
る。本発明においては、受信者は最初に処理時間優先の
メディア変換結果を受信する。この処理時間優先のメデ
ィア変換結果が受信者を満足させるだけの品質、特に精
度を満たしていない場合には、受信者は精度優先のメデ
ィア変換結果を要求すべくマルチメディア変換装置に指
示を出す。マルチメディア変換装置はこの指示を送信部
において受信することにより判定部が出力する精度優先
のメディア変換結果を受信者に送信する。
ア変換装置は、上記判定部が、受信部で受信されたデー
タを参照し、複数のメディア変換結果の中から前記受信
データに適したアルゴリズムを有する信号処理部のメデ
ィア変換結果を選択するものである。すなわち、本発明
はメディア変換結果の選択に際してその受信データの性
質や状態とメディア変換のアルゴリズムの関係を考慮す
ることにより、適切なアルゴリズムでメディア変換され
た結果を選択するものである。これによって、例えば受
信データに重畳したノイズを考慮することによりノイズ
に頑健なメディア変換ができる。
において受信されたデータを一時蓄積するバッファを備
え、上記複数の信号処理部は前記バッファに蓄積された
データを他の情報形式にメディア変換する一方、前記受
信部は複数のユーザを収容したマルチメディア変換装置
であって、このマルチメディア変換装置が一のユーザに
より使用されているときに他のユーザからのデータの着
信があった場合、前記データを一時的にバッファに蓄積
し、前記一のユーザによる使用が終了した後に前記バッ
ファに蓄積された前記他のユーザからのデータについて
メディア変換を行うことを特徴とする。これによって一
つのメディア変換装置を複数のユーザで使用することが
できるとともに、他のユーザはデータの再送出をする必
要がなくなる。
上述したマルチメディア変換装置から構成されるマルチ
メディア変換システムである。すなわち、これら複数の
マルチメディア変換装置は複数のユーザを収容したネッ
トワークに接続されており、各マルチメディア変換装置
の前記受信部は、そのマルチメディア変換装置が一のユ
ーザにより使用されているときに他のユーザ(送信者)
からのデータの着信があった場合、そのデータを上記ネ
ットワークを介して使用されていない他のマルチメディ
ア変換装置へ転送する。これによって一つのメディア変
換装置が使用中であっても、使用されていない他のチャ
ネルに送信者からのデータを自動的に転送することによ
ってこれを受け付け、メディア変換を行うことができ
る。したがって、送信者はデータの再送出をする必要が
ない。
て図面を参照して説明する。図1は、本発明の第1の実
施の形態であって、ネットワーク20,50に接続され
た二つのマルチメディア変換装置30,40を示し、こ
れら二つのマルチメディア変換装置は、マルチメディア
変換システムを構成している。ここでマルチメディア変
換装置30は、ネットワーク20を介して入力データを
受信する受信部31、データを一時蓄積するデータ蓄積
バッファ32、異なるアルゴリズムによってメディア変
換を行う3つの信号処理部33,34,35、これら信
号処理部33,34,35におけるメディア変換結果か
ら精度優先のメディア変換結果を導出する判定部36、
および信号処理部33のメディア変換結果または判定部
36が導出したメディア変換結果のいずれかをネットワ
ーク50に送出する送信部37から構成されている。も
う一つのマルチメディア変換装置40もこれと同様の構
成を持つ。以下、マルチメディア変換装置30を例にそ
の動作を説明する。
の受信部31は、送信端末10より送信された入力デー
タをネットワーク20を介して受信する。受信部31で
受信された入力データは、信号処理部33に送られると
同時にデータ蓄積バッファ32にも送られる。信号処理
部33は高速アルゴリズムにより上記画像データをリア
ルタイムで他のデータ形式にメディア変換した後、その
結果を送信部37へ送る。なお、高速アルゴリズムは、
精度よりも処理時間を優先したメディア変換アルゴリズ
ムである。送信部37は、信号処理部33より受け取っ
たメディア変換結果を受信装置60に宛ててネットワー
ク50に送出する。
された入力データは、信号処理部34,35に送られ
る。信号処理部34,35は、それぞれアルゴリズム
A,アルゴリズムBといった異なるメディア変換アルゴ
リズムにより入力データを上記他のデータ形式にメディ
ア変換する。信号処理部33,34,35の各々が出力
するメディア変換結果は判定部36に渡される。判定部
36は3種類のアルゴリズムによるメディア変換結果を
総合して精度優先のメディア変換結果を導出するもので
ある。この精度優先のメディア変換結果の導出に際して
は、例えば、信号処理部33,34,35が文字画像デ
ータをテキストデータに変換する文字認識処理を行う場
合を考えると、異なるアルゴリズムによって得た複数の
テキストデータを比較し、結果の異なる部分を並列表記
したものを精度優先のメディア変換結果として導出する
ことなどが考えられる。このように導出された精度優先
のメディア変換結果は前述の送信部37に送られ、送信
部37はこの精度優先のメディア変換結果を、先に送出
した処理時間優先のメディア変換結果に続けて受信装置
60に宛ててネットワーク50に送出する。これによっ
て受信者は、高速アルゴリズムによるメディア変換結果
をリアルタイムで得られるとともに、精度優先のメディ
ア変換結果を得ることもでき、受信者は自分の期待する
品質に近いものを選択することができる。
の結果と精度優先の結果の両方を受信者に提供する場合
について説明したが、送信部37は「処理時間優先のメ
ディア変換結果のみを送信」、「精度優先のメディア変
換結果のみを送信」、「処理時間優先のメディア変換結
果を受信した受信者からの要求があった場合に精度優先
のメディア変換結果を送信」などのモードでメディア変
換結果を送信するようにしても良い。また、本実施の形
態では、精度を優先する結果を出す際に高遠アルゴリズ
ムと2つのアルゴリズムA,Bを用いる場合について説
明したが、アルゴリズムの数はこれに制限されるもので
はない。したがって、マルチメディア変換装置が持つ信
号処理部の数は特に3に限定されるものではない。
が複数のユーザを収容した場合の動作は次のようなもの
である。例として高速アルゴリズムをもった信号処理部
33が送信端末10と受信装置60の間で使用中である
ときに送信端末11と受信装置61との間でメディア変
換通信を行う場合を考える。このような場合には、送信
端末11からのデータはデータ蓄積バッファ32へ一時
的に蓄積される。そして高速アルゴリズム33で送信端
末10と受信装置60の間の処理が終わったときに、デ
ータ蓄積バッファ32に蓄積された送信端末11からの
データが信号処理部33に読み込まれ、送信端末11と
受信端末61との間のメディア変換処理が開始される。
ィア変換装置30,40からなる2チャンネルのマルチ
メディア変換システムにおいて複数のユーザを収容した
場合の動作は次のようなものである。同様に信号処理部
33が送信端末10と受信装置60の間で使用中である
ときに送信端末11と受信装置61との間でメディア変
換通信を行う場合を考えると、送信端末11からのデー
タは受信部30から処理を行っていない他のメディア変
換装置40へ転送される。転送されたデータは、マルチ
メディア変換装置40において同様にメディア変換処理
をうける。
1の通信と、送信端末11と受信装置61の1対1の通
信の競合を例に説明を行ったが、本発明においては、送
信端末および受信装置の数には制限はなく、また「1対
1通信」だけでなく、「1対n通信」、「n対1通
信」、「n対n通信」についても同様に行われる。ま
た、メディア変換システムのチャネル数についても2チ
ャネルで説明しているが、チャネル数がこれに限定され
るものではないことは言うまでもない。
2,図3および図4を参照して説明する。本実施の形態
は、本発明を音声認識に適応した場合であって、ボイス
メールを電子メールに変換するサービスを提供するメデ
ィア変換装置である。図2にその構成を示す。マルチメ
ディア変換装置130の電話受信部131は、電話機1
10から入力された音声信号を電話網120を介して受
信する。音声蓄積バッファ132は受信された音声信号
を一時蓄積するものである。マルチメディア変換装置1
30は、3つの信号処理部133,134,135を備
えている。そのうち音声認識部133は処理時間を優先
した音声認識アルゴリズム(高速)を有し、電話受信部
131で受信した音声信号をリアルタイムでテキストデ
ータにメディア変換し、このメディア変換結果を判定部
136と電子メール送信部137に出力している。電子
メール送信部137は、音声認識部133において処理
時間優先のメディア変換結果をインターネット150を
介してメールサーバ160に送信する。一方、他の二つ
の音声認識部134,135はそれぞれ精度優先の異な
る音声認識アルゴリズムA,Bによってテキストデータ
を判定部136に入力している。
3,図4に示すフローチャートを参照して説明する。送
信者は電話機110により電話網120を介して発信を
行い(ステップ300)、電話受信部131が呼を受け
取ることによりメディア変換装置130と接続される
(ステップ301)。送信者が電話網を介して宛先の電
子メールアドレスを音声で入力すると(ステップ30
2)、その音声データは電話受信部131から音声認織
部133へ送られると同時に音声蓄積バッファ132へ
送られ蓄積される(ステップ304)。
力された電子メールアドレスを音声認識することによっ
てテキストデータに変換する(ステップ303)。その
変換結果として得られた電子メールアドレスは電子メー
ル送信部137に送られる。電子メール送信部137は
音声認識の結果で得られた電子メールアドレス、が存在
するか否かをインターネット150を介してメールサー
バ160に問い合わせる(ステップ306)。メールア
ドレスが存在する場合には電子メールのヘッダを形成し
(ステップ308)、存在しない場合は認識誤りがあっ
たものとして、ステップ309に進み精度優先の方法で
再度音声認識を行う。
のである。音声蓄積バッファに蓄積されている電子メー
ルアドレスの音声データ(ステップ309)を音声認識
部134および音声認識部135に入力し、音声認識ア
ルゴリズムAおよびBの異なる複数のアルゴリズムで音
声認識を行う(ステップ310およびステップ31
1)。その結果得られたテキストデータは判定部136
へ送られ、これら二つの異なるアルゴリズムによって得
られた音声認識結果から総合的に判断して一つの電子メ
ールアドレスを導出する(ステップ312)。上記ステ
ップ312において二つの音声認識結果から総合的に判
断する場合、判定部136はまず音声認識部134,1
35から得られたテキストデータを単語ごとに比較す
る。その結果、同一のメディア変換結果が得られた場合
にはそのテキストデータが精度優先の音声認識結果とな
る。また、結果が一致しない場合には、電話回線120
を介して受信した音声データの音声特徴パラメータとあ
らかじめ用意された参照データの音声特徴パラメータと
のベクトル距離が算出され、このベクトル距離に基づい
てより精度の高いメディア変換結果が導出される。
メディア変換結果を導出する手順を図5を参照してより
詳しく説明すると次のようになる。一般的に、音声認識
アルゴリズムは、音声データの入力と同時に入力音声の
音声特徴パラメータを算出し、これをあらかじめ記憶装
置に蓄積された複数の単語または音韻の参照データの音
声特徴パラメータと比較して入力音声データと各上記参
照データとの間の音声特徴パラメータに関するベクトル
距離を算出している。図5(a)は、例として5個の参
照データと、ある音声入力に対して音声認識アルゴリズ
ムA,Bがそれぞれ導き出した各参照データとのベクト
ル距離を表している。この音声特徴パラメータ空間にお
けるベクトル距離は二つのデータ間の類似度を示してい
ると考えることができる。各アルゴリズムは最もベクト
ル距離の小さい参照データ、詳しくは音声特徴パラメー
タ空間内で入力音声データに最も近い参照データを認識
結果として出力している。これによれば、アルゴリズム
A,Bは図5(a)に示すようにそれぞれ「あかい」、
「あおい」を認識結果としている。上述の認識結果およ
びベクトル距離は判定部136に送られる。本実施の形
態において判定部136は、このベクトル距離(類似
度)の積を各参照データ毎に計算し、その値に基づいて
精度優先のメディア変換結果を導出する。図5(b)
は、図5(a)に示したベクトル距離の積とそれに基づ
く総合的な判定結果を示している。すなわち図5(b)
によれば、各参照データに対してアルゴリズムA,Bに
よって得られたベクトル距離(類似度)の積が算出さ
れ、判定部136からはその値が最も小さい「あおい」
が認識結果として出力される。このようにして二つのア
ルゴリズムより得られた認識結果を総合的に判断し、精
度優先の認識結果を導出している。
結果は電子メール送信部137に送られ(ステップ31
3)、再度、判定部136で得られた電子メールアドレ
スが存在するか、インターネット150を介してメール
サーバ160に問い合わせる(ステップ314)。メー
ルアドレスが存在する場合には電子メールのヘッダを形
成し(ステップ308)、存在しない場合は送信者へ音
声による電子メールアドレスの再入力を促す(ステップ
316)。
存在し、電子メールのヘッダが形成されると、次にメッ
セージの送信である。送信者は電話網120を介してメ
ッセージを音声で入力する(ステップ400、図4参
照)。その音声データは電話受信部131から音声認識
部133へ送られると同時に音声蓄積バッファ132へ
送られ蓄積される(ステップ402)。音声認識部13
3では音声によって入力されたメッセージを高速の音声
認識アルゴリズムを用いて音声認識し(ステップ40
1)、その結果は電子メール送信部137に送られる
(ステップ403)。電子メール送信部137は音声認
識部133における音声認識の結果で得られたテキスト
データ(メッセージ)を、インターネット150を介し
てメールサーバ160に電子メールで送信する(ステッ
プ404)。
りのために意味があいまいであったり、正確な内容を知
りたい場合には、インターネット150を介して電子メ
ール送信部へ精度優先結果の要求を行うことができる
(ステップ405)。受信者より精度優先結果の要求を
受信すると、音声蓄積バッファ132に蓄積されている
音声のメッセージを二つの音声認識部134および13
5に入力する(ステップ406)。音声認識部134お
よび135は精度優先の音声認識アルゴリズムAおよび
音声認識アルゴリズムBでそれぞれ音声認識を行い(ス
テップ407およびステップ408)、その結果を判定
部136へ入力する。判定部136は上述したようにこ
れら二つの結果を総合的に判断することで精度優先のテ
キストデータを導出する(ステップ409)。判定部1
36で得られた精度優先の音声認識結果は電子メール送
信部137に送られ(ステップ410)、再度、電子メ
ールとして送信される(ステップ411)。
6および図7を参照して説明する。本実施の形態は、上
述した第2の実施の形態にかかる複数のマルチメディア
変換装置から構成され、複数のユーザ間で競合する場合
に適応することができるマルチメディア変換システムで
ある。具体的には、図6に示すように、図2に示した音
声認識装置130と同一の構成を有する音声認識装置1
40を備え、ボイスメールを電子メールに変換するサー
ビスを2チャンネルで行うものである。
おいて、特に複数のユーザ間で競合した場合の動作につ
いて図7のフローチャートを参照して説明する。たとえ
ば、電話機110とメールサーバ160間でメディア変
換通信が行われているときに、電話機111とメールサ
ーバ161間でメデイア変換通信を行う場合を考える。
電話機110とメールサーバ160間でメディア変換通
信が行われている最中に電話機111からの呼が電話網
120を介して着信すると(ステップ600)、その呼
は電話受信部131で受け取られる(ステップ60
1)。続いて電話機111からメールアドレス(または
メッセージ)が音声により入力されると(ステップ60
2)、電話受信部131は音声認識部133が使用中で
あるかどうかを確認する(ステップ603)。音声認識
部133が使用中でなければ音声認識部133において
通常の音声認識を行う(ステップ608)。
0とメールサーバ160間で使用中である場合には、電
話受信部131は他のチャネルの音声認識装置140が
使用中かどうか確認する。他のチャネルの音声認識装置
140が使用されていなかったら、電話機111からの
音声データを音声認識装置140へ転送する(スッテブ
605)。音声認識装置140も使用中であった場合に
は、電話機111からの音声データを音声蓄積バッファ
132に蓄積し(ステップ606)、音声認識部133
が電話機110とメールサーバ160間の音声認識が終
了してから(ステップ607)、電話機111からの音
声データを音声蓄積バッファ132から受け取り音声認
識部133において音声認識を行う(ステップ60
8)。
ディア変換システムは、複数のユーザからのメディア変
換通信が競合する場合でも扱うことができる。なお、音
声認識部133や他の音声認識装置140が使用中であ
るか否かを確認したり、他のチャンネルにデータを転送
する電話受信部131の機能は、図示はしないが、通信
プログラムを記憶したメモリとそのプログラムに基づく
制御を行うCPUとI/Fを備えたMPUを備えること
で実現することができる。
アルゴリズムを持った信号処理部33,34,35およ
び音声認識部133,134,135は、それぞれ、ア
ルゴリズムを実現するプログラムと汎用のコンピュータ
によって構成することもできるが、専用ハードウェアに
よって構成してもよい。複数のメディア変換結果を総合
し精度優先のメディア変換結果を導出する判定部36,
136も同様にソフトウェアまたは専用ハードウェアの
いずれでもその機能を実現しても良い。また、上述した
実施の形態においては、マルチメディア変換の例として
音声認識によるボイスメール(音声データ)から電子メ
ール(テキストデータ)へのメディア変換をあげたが、
その他にも音声合成、文字認識などがメディア変換とし
て考えられることは言うまでもない。
理時間優先のメディア変換と精度優先のメディア変換を
行うことにより、ユーザ、特に受信者が期待する品質の
メディア変換結果を提供することが可能となる。特に、
請求項2に記載された発明によれば、受信者の指示によ
り受け取るデータを選択することができるため、受信者
の意志により処理時間優先の結果を選択すればメディア
変換の結果をスピーディーに得ることができ、精度優先
の結果を選択すれば正確なメディア変換の結果が得るこ
とがきるようになる。
た発明によれば、判定部が精度優先信号処理部より得ら
れた複数のメディア変換結果に基づき精度の高いメディ
ア変換結果を導出する。さらに請求項7に記載された発
明によれば、上記判定部が受信データの状態に適したア
ルゴリズムを有する信号処理部のメディア変換結果を選
択する。したがって、特定のアルゴリズムの特徴のみが
反映されメディア変換結果の精度が低下することを防止
し、様々な入力データに対しても、メディア変換の特定
のアルゴリズムの特性に左右されないメディア変換を行
うことができる。
た発明によれば、メディア変換装置が他のユーザに占有
されていた場合も、一時的にバッファに蓄積するか、リ
ソースの空いている他のチャネルに転送することによっ
てデータを受け付けることができる。したがって、複数
のユーザで一台のマルチメディア変換装置または変換シ
ステムを使用することができ、ユーザ、特に送信者がリ
ソースが開放されるまで待たされたり、送信者が再度デ
ータを送る必要がなくなる。
ディア変換装置の構成を説明する図である。
成を説明する図である。
の動作を説明するフローチャートである。
音声変換装置の動作を説明するフローチャートである。
を説明するための図である。
換システムの構成を説明する図である。
ア変換システムの動作を説明するフローチャートであ
る。
ク、30…メディア変換装置、31…受信部、32…デ
ータ蓄積バッファ、33、34、35…信号処理部、3
6…判定部、37…送信部、40…メディア変換装置、
50…ネットワーク、60…受信装置、61…受信装
置、110、111…電話機、120…電話網、130
…メディア変換装置(音声認織装置)、131…電話受
信部、132…音声蓄積バッファ、133、134、1
35…音声認識部、136…判定部、137…電子メー
ル送信部、140…メディア変換装置(音声認織装
置)、150…インターネット、160、161…メー
ルサーバ。
Claims (9)
- 【請求項1】 異種メディア間で通信を行う際にメディ
ア変換を行うマルチメディア変換装置において、 通信回線を介してデータを受信する受信部と、 それぞれ異なるアルゴリズムによって前記データを他の
情報形式に異なる品質でメディア変換する複数の信号処
理部と、 前 記複数の信号処理部による複数のメディア変換結果の
中から受信者により選択されたメディア変換結果を前記
受信者に送信する送信部と、 を備えたことを特徴とするマルチメディア変換装置。 - 【請求項2】 請求項1に記載されたマルチメディア変
換装置において、 前記送信部は、 受信者からメディア変換の品質に関する指示を受信し、
前記指示に基づいて適当な品質のメディア変換結果を選
択し前記受信者に送信することを特徴とするマルチメデ
ィア変換装置。 - 【請求項3】 請求項1または請求項2に記載されたマ
ルチメディア変換装置において、 前記送信部は、 前記複数のメディア変換結果の中から前記受信者の期待
する処理時間のメディア変換結果を選択し送信すること
を特徴とするマルチメディア変換装置。 - 【請求項4】 請求項1または請求項2に記載されたマ
ルチメディア変換装置において、 前記送信部は、 前記複数のメディア変換結果の中から前記受信者の期待
する精度のメディア変換結果を選択し送信することを特
徴とするマルチメディア変換装置。 - 【請求項5】 異種メディア間で通信を行う際にメディ
ア変換を行うマルチメディア変換装置において、 通信回線を介してデータを受信する受信部と、 それぞれ異なるアルゴリズムによって前記データを他の
情報形式に異なる品質でメディア変換する複数の信号処
理部と、 前記複数のメディア変換結果の品質を判定し、品質の高
いメディア変換結果を導出する判定部と、 前記判定部において導出された前記メディア変換結果を
選択して前記受信者に送信する送信部とを備えたことを
特徴とするマルチメディア変換装置。 - 【請求項6】 請求項5に記載されたマルチメディア変
換装置において、 前記複数の信号処理部は、 前記受信部で受信したデータを他の情報形式にリアルタ
イムでメディア変換する処理時間優先信号処理部と、 前記データを前記他の情報形式に異なるアルゴリズムに
よってそれぞれ精度優先でメディア変換する複数の精度
優先信号処理部とからなり、 前記判定部は、 前記精度優先信号処理部より得られた複数のメディア変
換結果に基づき精度の高いメディア変換結果を導出し、 前記送信部は、 前記高速信号処理部より得られるメディア変換結果を前
記受信者に送信し、前記受信者から精度を優先する旨の
指示に基づいて前記判定部が導出した精度の高いメディ
ア変換結果を送信し直すことを特徴とするマルチメディ
ア変換装置。 - 【請求項7】 請求項5または請求項6に記載されたマ
ルチメディア変換装置において、 前記判定部は、 前記受信部で受信されたデータを参照し、前記複数のメ
ディア変換結果の中から前記受信データに適したアルゴ
リズムを有する信号処理部のメディア変換結果を選択す
ることを特徴とするマルチメディア変換装置。 - 【請求項8】 請求項1乃至請求項7のいずれかに記載
されたマルチメディア変換装置において、 前記受信部において受信された前記データを一時蓄積す
るバッファを備え、 前記受信部は、 複数のユーザを収容し、 前記マルチメディア変換装置が一のユーザにより使用さ
れているときに他のユーザからのデータの着信があった
場合、前記データを一時的にバッファに蓄積し、前記ユ
ーザによる使用が終了した後に前記バッファに蓄積され
た前記他のユーザからのデータについてメディア変換を
行うことを特徴とするマルチメディア変換装置。 - 【請求項9】 複数のユーザを収容したネットワーク内
に設置された複数のマルチメディア変換装置から構成さ
れるマルチメディア変換方式において、 前記複数のマルチメディア変換装置は、 請求項1乃至請求項8のいずれかに記載されたマルチメ
ディア変換装置であり、 前記各マルチメディア変換装置の前記受信部は、 前記マルチメディア変換装置が一のユーザにより使用さ
れているときに他のユーザからのデータの着信があった
場合、前記ネットワークを介して前記他のユーザからの
データを使用されていない他のマルチメディア変換装置
へ転送することを特徴とするマルチメディア変換方式。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP03039897A JP3244014B2 (ja) | 1997-02-14 | 1997-02-14 | マルチメディア変換装置および変換方式 |
US09/024,110 US6122290A (en) | 1997-02-14 | 1998-02-17 | Multimedia conversion apparatus and conversion system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP03039897A JP3244014B2 (ja) | 1997-02-14 | 1997-02-14 | マルチメディア変換装置および変換方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH10229426A JPH10229426A (ja) | 1998-08-25 |
JP3244014B2 true JP3244014B2 (ja) | 2002-01-07 |
Family
ID=12302837
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP03039897A Expired - Fee Related JP3244014B2 (ja) | 1997-02-14 | 1997-02-14 | マルチメディア変換装置および変換方式 |
Country Status (2)
Country | Link |
---|---|
US (1) | US6122290A (ja) |
JP (1) | JP3244014B2 (ja) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3782867B2 (ja) * | 1997-06-25 | 2006-06-07 | 株式会社日立製作所 | 情報受信処理方法およびコンピュータ・テレフォニイインテグレーションシステム |
US6292554B1 (en) * | 1999-10-07 | 2001-09-18 | Simplified Telesys | System and method for communicating with and controlling disparate telecommunications devices in a telecommunications network |
US7116765B2 (en) | 1999-12-16 | 2006-10-03 | Intellisync Corporation | Mapping an internet document to be accessed over a telephone system |
US7242324B2 (en) * | 2000-12-22 | 2007-07-10 | Sony Corporation | Distributed on-demand media transcoding system and method |
US6407680B1 (en) | 2000-12-22 | 2002-06-18 | Generic Media, Inc. | Distributed on-demand media transcoding system and method |
US8108509B2 (en) * | 2001-04-30 | 2012-01-31 | Sony Computer Entertainment America Llc | Altering network transmitted content data based upon user specified characteristics |
US7730165B2 (en) * | 2001-11-09 | 2010-06-01 | Sony Corporation | System, method, and computer program product for remotely determining the configuration of a multi-media content user |
US7356575B1 (en) | 2001-11-09 | 2008-04-08 | Sony Corporation | System, method, and computer program product for remotely determining the configuration of a multi-media content user |
US7480703B2 (en) * | 2001-11-09 | 2009-01-20 | Sony Corporation | System, method, and computer program product for remotely determining the configuration of a multi-media content user based on response of the user |
US7155475B2 (en) * | 2002-02-15 | 2006-12-26 | Sony Corporation | System, method, and computer program product for media publishing request processing |
KR100473116B1 (ko) * | 2002-07-22 | 2005-03-10 | 한국전자통신연구원 | 컨텐츠 변환 장치 및 그 방법 |
US20040128136A1 (en) * | 2002-09-20 | 2004-07-01 | Irani Pourang Polad | Internet voice browser |
US8233592B2 (en) | 2003-11-10 | 2012-07-31 | Nuance Communications, Inc. | Personal home voice portal |
US20070058730A1 (en) * | 2005-09-09 | 2007-03-15 | Microsoft Corporation | Media stream error correction |
US8862733B2 (en) * | 2010-07-30 | 2014-10-14 | Verizon Patent And Licensing Inc. | User-based prioritization for content transcoding |
US8949258B2 (en) * | 2011-03-28 | 2015-02-03 | Microsoft Corporation | Techniques to manage file conversions |
US9521176B2 (en) | 2014-05-21 | 2016-12-13 | Sony Corporation | System, method, and computer program product for media publishing request processing |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE68928298T2 (de) * | 1988-06-14 | 1998-01-29 | Fujitsu Ltd | Antwortregelungssystem |
JPH04302561A (ja) * | 1991-03-29 | 1992-10-26 | Toshiba Corp | マルチメディア通信システム |
US5276731A (en) * | 1991-04-26 | 1994-01-04 | Rolm Company | Method and apparatus for handling incoming telephone calls |
US5737395A (en) * | 1991-10-28 | 1998-04-07 | Centigram Communications Corporation | System and method for integrating voice, facsimile and electronic mail data through a personal computer |
US5289523A (en) * | 1992-07-31 | 1994-02-22 | At&T Bell Laboratories | Telecommunications relay service method and apparatus |
JPH077532A (ja) * | 1993-01-19 | 1995-01-10 | Canon Inf Syst Inc | 制御基板、コントローラ、及び、通信制御装置 |
US5479411A (en) * | 1993-03-10 | 1995-12-26 | At&T Corp. | Multi-media integrated message arrangement |
US5524137A (en) * | 1993-10-04 | 1996-06-04 | At&T Corp. | Multi-media messaging system |
US5953392A (en) * | 1996-03-01 | 1999-09-14 | Netphonic Communications, Inc. | Method and apparatus for telephonically accessing and navigating the internet |
US5661783A (en) * | 1996-05-22 | 1997-08-26 | Assis; Offer | Electronic secretary |
US5712901A (en) * | 1996-06-26 | 1998-01-27 | Mci Communications Corporation | Automatic voice/text translation of phone mail messages |
-
1997
- 1997-02-14 JP JP03039897A patent/JP3244014B2/ja not_active Expired - Fee Related
-
1998
- 1998-02-17 US US09/024,110 patent/US6122290A/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
US6122290A (en) | 2000-09-19 |
JPH10229426A (ja) | 1998-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3244014B2 (ja) | マルチメディア変換装置および変換方式 | |
JP5089598B2 (ja) | 異なる通信モードを有する装置に関わる通信 | |
US7120577B2 (en) | Virtual presence | |
US5604737A (en) | Voice communication system and voice communication method | |
US6175569B1 (en) | Extending asynchronous transfer mode ATM QoS across local area networks | |
US6005851A (en) | Adaptive channel control for data service delivery | |
KR101465292B1 (ko) | 인터모덜리티 브리지를 통한 비동기 다국적 대화형 통신 | |
EP1488409A1 (en) | Controlling home entertainment systems using a natural language server | |
CA2644931A1 (en) | System and method for voice-enabled instant messaging | |
US7043561B2 (en) | System and method for prioritizing requests for server services | |
JP2002077303A (ja) | 通信接続装置およびその通信速度調整方法 | |
US20020027923A1 (en) | IP gateway apparatus | |
US20070192330A1 (en) | Information processing apparatus and method and program | |
JPH10327190A (ja) | ネットワークトラフィック優先順位決定方法 | |
US7711856B1 (en) | Method and apparatus for providing an interface for a messaging mailbox | |
US20070220432A1 (en) | Isochronous Audio Network Software Interface | |
KR100785112B1 (ko) | SIP(Session InitiationProtocol)기반 MoIP(Multimediaover Internet Protocol)서비스를수용하는 무선 접속 지점에 QoS를 제공하기 위한 장치및 방법 | |
JPH0662050A (ja) | 電子メールの宛先別ボディ自動変換方式 | |
JPH10289170A (ja) | マルチメディア通信網 | |
JP2000278312A (ja) | 電子メール変換方法及びシステム | |
JPH0325978B2 (ja) | ||
JPH10136093A (ja) | ボイスメールサーバ | |
JPH06284146A (ja) | 電子メール交換システムの宛先別ボディ形式自動変換方式 | |
KR20030073408A (ko) | 로봇 메일 서비스 방법 | |
CN109150408A (zh) | 一种信息处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071026 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081026 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091026 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091026 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101026 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111026 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121026 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131026 Year of fee payment: 12 |
|
LAPS | Cancellation because of no payment of annual fees |