JP3244014B2 - マルチメディア変換装置および変換方式 - Google Patents

マルチメディア変換装置および変換方式

Info

Publication number
JP3244014B2
JP3244014B2 JP03039897A JP3039897A JP3244014B2 JP 3244014 B2 JP3244014 B2 JP 3244014B2 JP 03039897 A JP03039897 A JP 03039897A JP 3039897 A JP3039897 A JP 3039897A JP 3244014 B2 JP3244014 B2 JP 3244014B2
Authority
JP
Japan
Prior art keywords
conversion
media
multimedia
data
media conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP03039897A
Other languages
English (en)
Other versions
JPH10229426A (ja
Inventor
二郎 川俣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP03039897A priority Critical patent/JP3244014B2/ja
Priority to US09/024,110 priority patent/US6122290A/en
Publication of JPH10229426A publication Critical patent/JPH10229426A/ja
Application granted granted Critical
Publication of JP3244014B2 publication Critical patent/JP3244014B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/53Centralised arrangements for recording incoming messages, i.e. mailbox systems
    • H04M3/5307Centralised arrangements for recording incoming messages, i.e. mailbox systems for recording messages comprising any combination of audio and non-audio components
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/60Medium conversion

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Communication Control (AREA)
  • Telephonic Communication Services (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Information Transfer Between Computers (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声やテキスト、
画像など多様な情報媒体(メディア)を統合するマルチ
メディア通信において、異なるメディアに情報形式を変
換するメデア変換装置に関するものである。
【0002】
【従来の技術】マルチメディア通信において異種メディ
ア間で通信をかわすには、情報形式等を変換するメディ
ア変換が必要となる。従来より、この種のメディア変換
装置として、例えば特開平4−302561号公報に開
示されたマルチメディア通信システムは、音声端末、テ
キスト端末、画像通信端末の各種メディアを接続した通
信システムに、音声−テキスト等、異種メディア間のメ
ディア変換をおこなう信号処置装置と、相手端末のメデ
ィアに対応した信号に変換すべく上記信号処理装置を制
御し変換された信号を受信対象の端末装置に送る交換手
段とを備えたものである。従来のメディア変換装置は、
メディア変換をおこなう信号処理装置を介することによ
り異なるメディア相互間通信を可能としていた。
【0003】
【発明が解決しようとする課題】しかしながら従来のメ
ディア変換装置は、メディア変換の品質、詳しくはメデ
ィア変換の処理時間や精度を意識することなくマルチメ
ディア変換が行われていたために次のような問題があっ
た。第1の問題点は、従来のメディア変換装置では、必
ずしも受信者の期待する処理時間または精度でメディア
変換の結果が得られるとは限らないことである。これ
は、従来のメディア変換装置においてはメディア変換手
段たる信号処理装置の処理時間と精度が固定的であるの
に対し、メディア変換の処理時間と精度に対する受信者
の要求は通信の内容やその情報によって異なるからであ
る。処理時間を優先させるメディア変換装置では精度が
落ち、精度を優先させるメディア変換装置では処理時間
が増大してしまうが、従来はこのような処理時間と精度
とのトレードオフを受信者は決定することができなかっ
た。
【0004】第2の問題点は、メディア変換を行う特定
のアルゴリズムの特徴が反映されることにより、メディ
ア変換装置に入力するデータによってはメディア変換の
結果の精度が落ちてしまうことである。例えば理想的環
境において精度の高いアルゴリズムを用いたとしても、
ノイズに頑健でなかったりする場合がある。このような
場合にはマルチメディア通信を行う上で十分な品質のメ
ディア変換をおこなうことが困難となる場合がある。ま
た、第3の問題点として、特に処理時間を優先してリア
ルタイムでメディア変換を行う装置では、1つのメディ
ア変換処理でメディア変換装置が専有されてしまうため
にその間は他の送信者からのデータを受付ないことであ
る。したがって、従来のメディア変換装置を複数のユー
ザで使用することができなかった。
【0005】本発明の目的は、ユーザ、特に受信者が期
待する品質でメディア変換を行うメディア変換装置を提
供することにある。また、本発明の他の目的は、様々な
入力データに対しても、メディア変換の特定のアルゴリ
ズムの特性に左右されないメディア変換を行うことであ
る。本発明はさらに、複数のユーザにより使用すること
ができるメディア変換装置を提供することを目的とす
る。
【0006】
【課題を解決するための手段】上述の目的を達成するた
めに、本発明にかかるマルチメディア変換装置は、異種
メディア間で通信を行う際にメディア変換を行うマルチ
メディア変換装置において、それぞれ異なるアルゴリズ
ムによって前記データを他の情報形式に異なる品質でメ
ディア変換する複数の信号処理部を備え、前記複数の信
号処理部による複数のメディア変換結果の一部を選択し
前記受信者に送信するようにしたものである。ここで信
号処理部において行われるメディア変換は、マルチメデ
ィア通信において必要となるメディア変換のすべてを含
むものとし、例えば音声信号をテキストデータに変換す
る音声認識処理や、テキストデータを音声データに変換
する音声合成処理、画像データからテキストデータに情
報形式を変換する文字認識処理などを含むものとする。
また、メディア変換結果の品質とは、主に処理時間と精
度とによって評価されるものとする。ここで精度とは、
受信したデータの意味する内容を正確に含む度合をいう
ものとする。
【0007】本発明において各信号処理部はそれぞれの
アルゴリズムに基づいて処理時間優先のメディア変換結
果や精度優先のメディア変換結果を出力する。したがっ
て本発明に係るマルチメディア変換装置は、例えば処理
時間を優先する結果、精度を優先する結果といった複数
の結果を導き出し、その中からユーザ、特に受信者が希
望するメディア変換結果を選択し提供するものである。
これによって処理時間を要求する受信者には短時間で結
果を提供することができ、精度を要求する受信者にはよ
り正確な結果を提供することができる。なお、メディア
変換処理を行う信号処理部は、上記受信部から直接デー
タを入力するようにしても良いが、このデータを一時的
に蓄積するバッファを設け、このバッファからデータを
読み込むようにしても良いことは言うまでもない。特に
精度を優先したアルゴリズムを持った信号処理部はメデ
ィア変換処理の速度が異なる場合があるので、バッファ
を介してデータを入力するのが好ましい。
【0008】本発明にかかるマルチメディア変換装置に
おいては、異なるアルゴリズムによって得られた複数の
メディア変換結果を受信者に送信するものであるが、請
求項2に記載されたマルチメディア変換装置は、送信部
において受信者からメディア変換の品質に関する指示を
受信し、前記指示に基づいて適当な品質のメディア変換
結果を受信者に送信するものである。このように送信部
がいわば受信者との通信機能を有することによって、受
信者は自分が要求する品質に関する指示を与え、期待す
る品質のメディア変換結果の提供をよりスムーズにする
ことができる。
【0009】また、本発明にかかるマルチメディア変換
装置のうち、特に請求項3に記載された発明は、上記複
数のメディア変換結果の中から処理時間優先のメディア
変換結果を選択し送信することを特徴とするものであ
る。また、請求項4に記載されたマルチメディア変換装
置は特に上記複数のメディア変換結果の中から精度優先
のメディア変換結果を選択し送信することを特徴とす
る。また、送信部が受信者からの指示を受け付ける場合
は、受信者の要求に応じてそれぞれ受信者の期待する処
理時間または精度のメディア変換結果を選択する。
【0010】本発明にかかるマルチメディア変換装置に
おいては、精度優先のメディア変換結果を送信する際
に、送信部が複数のメディア変換結果から精度優先のア
ルゴリズムにより得たものを単に選択するようにしても
良いが、請求項5に記載されたマルチメディア変換装置
は、上記複数のメディア変換結果から総合的に判断し、
より精度の高いメディア変換結果を導出する判定部を備
えたものである。このように複数の異なったアルゴリズ
ムから導き出された結果から総合的に判断することによ
って、特定のアルゴリズムの特性の影響を排除し、いか
なる入力データに対してもアルゴリズムに左右されない
メディア変換結果を提供することができる。
【0011】また、本発明のうち請求項6に記載された
マルチメディア変換装置は、上記複数の信号処理部が、
受信部で受信したデータを他の情報形式にリアルタイム
でメディア変換する処理時間優先信号処理部と、前記デ
ータを前記他の情報形式に異なるアルゴリズムによって
それぞれ精度優先でメディア変換する複数の精度優先信
号処理部とからなり、前記判定部は、前記精度優先信号
処理部より得られた複数のメディア変換結果に基づき精
度の高いメディア変換結果を導出するものであり、その
送信部は、まず前記高速信号処理部より得られるメディ
ア変換結果を前記受信者に送信し、前記受信者から精度
を優先する旨の指示に基づいて前記判定部が導出した精
度の高いメディア変換結果を送信し直すことを特徴とす
る。本発明においては、受信者は最初に処理時間優先の
メディア変換結果を受信する。この処理時間優先のメデ
ィア変換結果が受信者を満足させるだけの品質、特に精
度を満たしていない場合には、受信者は精度優先のメデ
ィア変換結果を要求すべくマルチメディア変換装置に指
示を出す。マルチメディア変換装置はこの指示を送信部
において受信することにより判定部が出力する精度優先
のメディア変換結果を受信者に送信する。
【0012】また、請求項7に記載されたマルチメディ
ア変換装置は、上記判定部が、受信部で受信されたデー
タを参照し、複数のメディア変換結果の中から前記受信
データに適したアルゴリズムを有する信号処理部のメデ
ィア変換結果を選択するものである。すなわち、本発明
はメディア変換結果の選択に際してその受信データの性
質や状態とメディア変換のアルゴリズムの関係を考慮す
ることにより、適切なアルゴリズムでメディア変換され
た結果を選択するものである。これによって、例えば受
信データに重畳したノイズを考慮することによりノイズ
に頑健なメディア変換ができる。
【0013】また請求項8に記載された発明は、受信部
において受信されたデータを一時蓄積するバッファを備
え、上記複数の信号処理部は前記バッファに蓄積された
データを他の情報形式にメディア変換する一方、前記受
信部は複数のユーザを収容したマルチメディア変換装置
であって、このマルチメディア変換装置が一のユーザに
より使用されているときに他のユーザからのデータの着
信があった場合、前記データを一時的にバッファに蓄積
し、前記一のユーザによる使用が終了した後に前記バッ
ファに蓄積された前記他のユーザからのデータについて
メディア変換を行うことを特徴とする。これによって一
つのメディア変換装置を複数のユーザで使用することが
できるとともに、他のユーザはデータの再送出をする必
要がなくなる。
【0014】また請求項9に記載された発明は、複数の
上述したマルチメディア変換装置から構成されるマルチ
メディア変換システムである。すなわち、これら複数の
マルチメディア変換装置は複数のユーザを収容したネッ
トワークに接続されており、各マルチメディア変換装置
の前記受信部は、そのマルチメディア変換装置が一のユ
ーザにより使用されているときに他のユーザ(送信者)
からのデータの着信があった場合、そのデータを上記ネ
ットワークを介して使用されていない他のマルチメディ
ア変換装置へ転送する。これによって一つのメディア変
換装置が使用中であっても、使用されていない他のチャ
ネルに送信者からのデータを自動的に転送することによ
ってこれを受け付け、メディア変換を行うことができ
る。したがって、送信者はデータの再送出をする必要が
ない。
【0015】
【発明の実施の形態】以下、本発明の実施の形態につい
て図面を参照して説明する。図1は、本発明の第1の実
施の形態であって、ネットワーク20,50に接続され
た二つのマルチメディア変換装置30,40を示し、こ
れら二つのマルチメディア変換装置は、マルチメディア
変換システムを構成している。ここでマルチメディア変
換装置30は、ネットワーク20を介して入力データを
受信する受信部31、データを一時蓄積するデータ蓄積
バッファ32、異なるアルゴリズムによってメディア変
換を行う3つの信号処理部33,34,35、これら信
号処理部33,34,35におけるメディア変換結果か
ら精度優先のメディア変換結果を導出する判定部36、
および信号処理部33のメディア変換結果または判定部
36が導出したメディア変換結果のいずれかをネットワ
ーク50に送出する送信部37から構成されている。も
う一つのマルチメディア変換装置40もこれと同様の構
成を持つ。以下、マルチメディア変換装置30を例にそ
の動作を説明する。
【0016】図1においてマルチメディア変換装置30
の受信部31は、送信端末10より送信された入力デー
タをネットワーク20を介して受信する。受信部31で
受信された入力データは、信号処理部33に送られると
同時にデータ蓄積バッファ32にも送られる。信号処理
部33は高速アルゴリズムにより上記画像データをリア
ルタイムで他のデータ形式にメディア変換した後、その
結果を送信部37へ送る。なお、高速アルゴリズムは、
精度よりも処理時間を優先したメディア変換アルゴリズ
ムである。送信部37は、信号処理部33より受け取っ
たメディア変換結果を受信装置60に宛ててネットワー
ク50に送出する。
【0017】一方前述のデータ蓄積バッファ32に蓄積
された入力データは、信号処理部34,35に送られ
る。信号処理部34,35は、それぞれアルゴリズム
A,アルゴリズムBといった異なるメディア変換アルゴ
リズムにより入力データを上記他のデータ形式にメディ
ア変換する。信号処理部33,34,35の各々が出力
するメディア変換結果は判定部36に渡される。判定部
36は3種類のアルゴリズムによるメディア変換結果を
総合して精度優先のメディア変換結果を導出するもので
ある。この精度優先のメディア変換結果の導出に際して
は、例えば、信号処理部33,34,35が文字画像デ
ータをテキストデータに変換する文字認識処理を行う場
合を考えると、異なるアルゴリズムによって得た複数の
テキストデータを比較し、結果の異なる部分を並列表記
したものを精度優先のメディア変換結果として導出する
ことなどが考えられる。このように導出された精度優先
のメディア変換結果は前述の送信部37に送られ、送信
部37はこの精度優先のメディア変換結果を、先に送出
した処理時間優先のメディア変換結果に続けて受信装置
60に宛ててネットワーク50に送出する。これによっ
て受信者は、高速アルゴリズムによるメディア変換結果
をリアルタイムで得られるとともに、精度優先のメディ
ア変換結果を得ることもでき、受信者は自分の期待する
品質に近いものを選択することができる。
【0018】上記第1の実施の形態では、処理時間優先
の結果と精度優先の結果の両方を受信者に提供する場合
について説明したが、送信部37は「処理時間優先のメ
ディア変換結果のみを送信」、「精度優先のメディア変
換結果のみを送信」、「処理時間優先のメディア変換結
果を受信した受信者からの要求があった場合に精度優先
のメディア変換結果を送信」などのモードでメディア変
換結果を送信するようにしても良い。また、本実施の形
態では、精度を優先する結果を出す際に高遠アルゴリズ
ムと2つのアルゴリズムA,Bを用いる場合について説
明したが、アルゴリズムの数はこれに制限されるもので
はない。したがって、マルチメディア変換装置が持つ信
号処理部の数は特に3に限定されるものではない。
【0019】上述のようなマルチメディア変換装置30
が複数のユーザを収容した場合の動作は次のようなもの
である。例として高速アルゴリズムをもった信号処理部
33が送信端末10と受信装置60の間で使用中である
ときに送信端末11と受信装置61との間でメディア変
換通信を行う場合を考える。このような場合には、送信
端末11からのデータはデータ蓄積バッファ32へ一時
的に蓄積される。そして高速アルゴリズム33で送信端
末10と受信装置60の間の処理が終わったときに、デ
ータ蓄積バッファ32に蓄積された送信端末11からの
データが信号処理部33に読み込まれ、送信端末11と
受信端末61との間のメディア変換処理が開始される。
【0020】また、図1に示すような2つのマルチメデ
ィア変換装置30,40からなる2チャンネルのマルチ
メディア変換システムにおいて複数のユーザを収容した
場合の動作は次のようなものである。同様に信号処理部
33が送信端末10と受信装置60の間で使用中である
ときに送信端末11と受信装置61との間でメディア変
換通信を行う場合を考えると、送信端末11からのデー
タは受信部30から処理を行っていない他のメディア変
換装置40へ転送される。転送されたデータは、マルチ
メディア変換装置40において同様にメディア変換処理
をうける。
【0021】以上、送信端末10と受信装置60の1対
1の通信と、送信端末11と受信装置61の1対1の通
信の競合を例に説明を行ったが、本発明においては、送
信端末および受信装置の数には制限はなく、また「1対
1通信」だけでなく、「1対n通信」、「n対1通
信」、「n対n通信」についても同様に行われる。ま
た、メディア変換システムのチャネル数についても2チ
ャネルで説明しているが、チャネル数がこれに限定され
るものではないことは言うまでもない。
【0022】次に本発明の第2の実施の形態について図
2,図3および図4を参照して説明する。本実施の形態
は、本発明を音声認識に適応した場合であって、ボイス
メールを電子メールに変換するサービスを提供するメデ
ィア変換装置である。図2にその構成を示す。マルチメ
ディア変換装置130の電話受信部131は、電話機1
10から入力された音声信号を話網120を介して受
信する。音声蓄積バッファ132は受信された音声信号
を一時蓄積するものである。マルチメディア変換装置1
30は、3つの信号処理部133,134,135を備
えている。そのうち音声認識部133は処理時間を優先
した音声認識アルゴリズム(高速)を有し、電話受信部
131で受信した音声信号をリアルタイムでテキストデ
ータにメディア変換し、このメディア変換結果を判定部
136と電子メール送信部137に出力している。電子
メール送信部137は、音声認識部133において処理
時間優先のメディア変換結果をインターネット150を
介してメールサーバ160に送信する。一方、他の二つ
の音声認識部134,135はそれぞれ精度優先の異な
る音声認識アルゴリズムA,Bによってテキストデータ
を判定部136に入力している。
【0023】このようなメディア変換装置の動作を図
3,図4に示すフローチャートを参照して説明する。送
信者は電話機10により電話網20を介して発信を
行い(ステップ300)、電話受信部31が呼を受け
取ることによりメディア変換装置130と接続される
(ステップ301)。送信者が電話網を介して宛先の電
子メールアドレスを音声で入力すると(ステップ30
2)、その音声データは電話受信部131から音声認織
部133へ送られると同時に音声蓄積バッファ12へ
送られ蓄積される(ステップ304)。
【0024】音声認識部133では音声データとして入
力された電子メールアドレスを音声認識することによっ
てテキストデータに変換する(ステップ303)。その
変換結果として得られた電子メールアドレスは電子メー
ル送信部137に送られる。電子メール送信部137は
音声認識の結果で得られた電子メールアドレス、が存在
するか否かをインターネット150を介してメールサー
バ160に問い合わせる(ステップ306)。メールア
ドレスが存在する場合には電子メールのヘッダを形成し
(ステップ308)、存在しない場合は認識誤りがあっ
たものとして、ステップ309に進み精度優先の方法で
再度音声認識を行う。
【0025】精度優先の音声認識の方法は次のようなも
のである。音声蓄積バッファに蓄積されている電子メー
ルアドレスの音声データ(ステップ309)を音声認識
部134および音声認識部135に入力し、音声認識ア
ルゴリズムAおよびBの異なる複数のアルゴリズムで音
声認識を行う(ステップ310およびステップ31
1)。その結果得られたテキストデータは判定部136
へ送られ、これら二つの異なるアルゴリズムによって得
られた音声認識結果から総合的に判断して一つの電子メ
ールアドレスを導出する(ステップ312)。上記ステ
ップ312において二つの音声認識結果から総合的に判
断する場合、判定部136はまず音声認識部134,1
35から得られたテキストデータを単語ごとに比較す
る。その結果、同一のメディア変換結果が得られた場合
にはそのテキストデータが精度優先の音声認識結果とな
る。また、結果が一致しない場合には、電話回線120
を介して受信した音声データの音声特徴パラメータとあ
らかじめ用意された参照データの音声特徴パラメータと
のベクトル距離が算出され、このベクトル距離に基づい
てより精度の高いメディア変換結果が導出される。
【0026】ここでベクトル距離に基づいて精度優先の
メディア変換結果を導出する手順を図5を参照してより
詳しく説明すると次のようになる。一般的に、音声認識
アルゴリズムは、音声データの入力と同時に入力音声の
音声特徴パラメータを算出し、これをあらかじめ記憶装
置に蓄積された複数の単語または音韻の参照データの音
声特徴パラメータと比較して入力音声データと各上記参
照データとの間の音声特徴パラメータに関するベクトル
距離を算出している。図5(a)は、例として5個の参
照データと、ある音声入力に対して音声認識アルゴリズ
ムA,Bがそれぞれ導き出した各参照データとのベクト
ル距離を表している。この音声特徴パラメータ空間にお
けるベクトル距離は二つのデータ間の類似度を示してい
ると考えることができる。各アルゴリズムは最もベクト
ル距離の小さい参照データ、詳しくは音声特徴パラメー
タ空間内で入力音声データに最も近い参照データを認識
結果として出力している。これによれば、アルゴリズム
A,Bは図5(a)に示すようにそれぞれ「あかい」、
「あおい」を認識結果としている。上述の認識結果およ
びベクトル距離は判定部136に送られる。本実施の形
態において判定部136は、このベクトル距離(類似
度)の積を各参照データ毎に計算し、その値に基づいて
精度優先のメディア変換結果を導出する。図5(b)
は、図5(a)に示したベクトル距離の積とそれに基づ
く総合的な判定結果を示している。すなわち図5(b)
によれば、各参照データに対してアルゴリズムA,Bに
よって得られたベクトル距離(類似度)の積が算出さ
れ、判定部136からはその値が最も小さい「あおい」
が認識結果として出力される。このようにして二つのア
ルゴリズムより得られた認識結果を総合的に判断し、精
度優先の認識結果を導出している。
【0027】上述のようにして判定部136で得られた
結果は電子メール送信部137に送られ(ステップ31
3)、再度、判定部136で得られた電子メールアドレ
スが存在するか、インターネット150を介してメール
サーバ160に問い合わせる(ステップ314)。メー
ルアドレスが存在する場合には電子メールのヘッダを形
成し(ステップ308)、存在しない場合は送信者へ音
声による電子メールアドレスの再入力を促す(ステップ
316)。
【0028】音声認識の結果得られたメールアドレスが
存在し、電子メールのヘッダが形成されると、次にメッ
セージの送信である。送信者は電話網120を介してメ
ッセージを音声で入力する(ステップ400、図4参
照)。その音声データは電話受信部131から音声認識
部133へ送られると同時に音声蓄積バッファ132へ
送られ蓄積される(ステップ402)。音声認識部13
3では音声によって入力されたメッセージを高速の音声
認識アルゴリズムを用いて音声認識し(ステップ40
1)、その結果は電子メール送信部137に送られる
(ステップ403)。電子メール送信部137は音声認
識部133における音声認識の結果で得られたテキスト
データ(メッセージ)を、インターネット150を介し
てメールサーバ160に電子メールで送信する(ステッ
プ404)。
【0029】受信者は電子メールの内容を読み、認識誤
りのために意味があいまいであったり、正確な内容を知
りたい場合には、インターネット150を介して電子メ
ール送信部へ精度優先結果の要求を行うことができる
(ステップ405)。受信者より精度優先結果の要求を
受信すると、音声蓄積バッファ132に蓄積されている
音声のメッセージを二つの音声認識部134および13
5に入力する(ステップ406)。音声認識部134お
よび135は精度優先の音声認識アルゴリズムAおよび
音声認識アルゴリズムBでそれぞれ音声認識を行い(ス
テップ407およびステップ408)、その結果を判定
部136へ入力する。判定部136は上述したようにこ
れら二つの結果を総合的に判断することで精度優先のテ
キストデータを導出する(ステップ409)。判定部1
36で得られた精度優先の音声認識結果は電子メール送
信部137に送られ(ステップ410)、再度、電子メ
ールとして送信される(ステップ411)。
【0030】次に本発明の第3の実施の形態について図
6および図7を参照して説明する。本実施の形態は、上
述した第2の実施の形態にかかる複数のマルチメディア
変換装置から構成され、複数のユーザ間で競合する場合
に適応することができるマルチメディア変換システムで
ある。具体的には、図6に示すように、図2に示した音
声認識装置130と同一の構成を有する音声認識装置1
40を備え、ボイスメールを電子メールに変換するサー
ビスを2チャンネルで行うものである。
【0031】このようなマルチメディア変換システムに
おいて、特に複数のユーザ間で競合した場合の動作につ
いて図7のフローチャートを参照して説明する。たとえ
ば、電話機110とメールサーバ160間でメディア変
換通信が行われているときに、電話機111とメールサ
ーバ161間でメデイア変換通信を行う場合を考える。
電話機110とメールサーバ160間でメディア変換通
信が行われている最中に電話機111からの呼が電話網
120を介して着信すると(ステップ600)、その呼
は電話受信部131で受け取られる(ステップ60
1)。続いて電話機111からメールアドレス(または
メッセージ)が音声により入力されると(ステップ60
2)、電話受信部131は音声認識部133が使用中で
あるかどうかを確認する(ステップ603)。音声認識
部133が使用中でなければ音声認識部133において
通常の音声認識を行う(ステップ608)。
【0032】これに対し音声認識部133が電話機11
0とメールサーバ160間で使用中である場合には、電
話受信部131は他のチャネルの音声認識装置140が
使用中かどうか確認する。他のチャネルの音声認識装置
140が使用されていなかったら、電話機111からの
音声データを音声認識装置140へ転送する(スッテブ
605)。音声認識装置140も使用中であった場合に
は、電話機111からの音声データを音声蓄積バッファ
132に蓄積し(ステップ606)、音声認識部133
が電話機110とメールサーバ160間の音声認識が終
了してから(ステップ607)、電話機111からの音
声データを音声蓄積バッファ132から受け取り音声認
識部133において音声認識を行う(ステップ60
8)。
【0033】以上のように本実施の形態に係るマルチメ
ディア変換システムは、複数のユーザからのメディア変
換通信が競合する場合でも扱うことができる。なお、音
声認識部133や他の音声認識装置140が使用中であ
るか否かを確認したり、他のチャンネルにデータを転送
する電話受信部131の機能は、図示はしないが、通信
プログラムを記憶したメモリとそのプログラムに基づく
制御を行うCPUとI/Fを備えたMPUを備えること
で実現することができる。
【0034】以上の実施の形態において、メディア変換
アルゴリズムを持った信号処理部33,34,35およ
び音声認識部133,134,135は、それぞれ、ア
ルゴリズムを実現するプログラムと汎用のコンピュータ
によって構成することもできるが、専用ハードウェアに
よって構成してもよい。複数のメディア変換結果を総合
し精度優先のメディア変換結果を導出する判定部36,
136も同様にソフトウェアまたは専用ハードウェアの
いずれでもその機能を実現しても良い。また、上述した
実施の形態においては、マルチメディア変換の例として
音声認識によるボイスメール(音声データ)から電子メ
ール(テキストデータ)へのメディア変換をあげたが、
その他にも音声合成、文字認識などがメディア変換とし
て考えられることは言うまでもない。
【0035】
【発明の効果】本発明のマルチメディア変換装置は、処
理時間優先のメディア変換と精度優先のメディア変換を
行うことにより、ユーザ、特に受信者が期待する品質の
メディア変換結果を提供することが可能となる。特に、
請求項2に記載された発明によれば、受信者の指示によ
り受け取るデータを選択することができるため、受信者
の意志により処理時間優先の結果を選択すればメディア
変換の結果をスピーディーに得ることができ、精度優先
の結果を選択すれば正確なメディア変換の結果が得るこ
とがきるようになる。
【0036】また、本発明のうち特に請求項6に記載し
た発明によれば、判定部が精度優先信号処理部より得ら
れた複数のメディア変換結果に基づき精度の高いメディ
ア変換結果を導出する。さらに請求項7に記載された発
明によれば、上記判定部が受信データの状態に適したア
ルゴリズムを有する信号処理部のメディア変換結果を選
択する。したがって、特定のアルゴリズムの特徴のみが
反映されメディア変換結果の精度が低下することを防止
し、様々な入力データに対しても、メディア変換の特定
のアルゴリズムの特性に左右されないメディア変換を行
うことができる。
【0037】また、請求項8または請求項9に記載され
た発明によれば、メディア変換装置が他のユーザに占有
されていた場合も、一時的にバッファに蓄積するか、リ
ソースの空いている他のチャネルに転送することによっ
てデータを受け付けることができる。したがって、複数
のユーザで一台のマルチメディア変換装置または変換シ
ステムを使用することができ、ユーザ、特に送信者がリ
ソースが開放されるまで待たされたり、送信者が再度デ
ータを送る必要がなくなる。
【図面の簡単な説明】
【図1】 本発明の第1の実施の形態にかかるマルチメ
ディア変換装置の構成を説明する図である。
【図2】 第2の実施の形態にかかる音声変換装置の構
成を説明する図である。
【図3】 上記第2の実施の形態にかかる音声変換装置
の動作を説明するフローチャートである。
【図4】 図3とともに上記第2の実施の形態にかかる
音声変換装置の動作を説明するフローチャートである。
【図5】 精度優先のメディア変換結果を導出する方法
を説明するための図である。
【図6】 第3の実施の形態にかかるマルチメディア変
換システムの構成を説明する図である。
【図7】 上記第3の実施の形態にかかるマルチメディ
ア変換システムの動作を説明するフローチャートであ
る。
【符号の説明】
10…送信装置、11…送信装置、20…ネットワー
ク、30…メディア変換装置、31…受信部、32…デ
ータ蓄積バッファ、33、34、35…信号処理部、3
6…判定部、37…送信部、40…メディア変換装置、
50…ネットワーク、60…受信装置、61…受信装
置、110、111…電話機、120…電話網、130
…メディア変換装置(音声認織装置)、131…電話受
信部、132…音声蓄積バッファ、133、134、1
35…音声認識部、136…判定部、137…電子メー
ル送信部、140…メディア変換装置(音声認織装
置)、150…インターネット、160、161…メー
ルサーバ。

Claims (9)

    (57)【特許請求の範囲】
  1. 【請求項1】 異種メディア間で通信を行う際にメディ
    ア変換を行うマルチメディア変換装置において、 通信回線を介してデータを受信する受信部と、 それぞれ異なるアルゴリズムによって前記データを他の
    情報形式に異なる品質でメディア変換する複数の信号処
    理部と 記複数の信号処理部による複数のメディア変換結果
    中から受信者により選択されたメディア変換結果を前記
    受信者に送信する送信部と、 を備えたことを特徴とするマルチメディア変換装置。
  2. 【請求項2】 請求項1に記載されたマルチメディア変
    換装置において、 前記送信部は、 受信者からメディア変換の品質に関する指示を受信し、
    前記指示に基づいて適当な品質のメディア変換結果を選
    択し前記受信者に送信することを特徴とするマルチメデ
    ィア変換装置。
  3. 【請求項3】 請求項1または請求項2に記載されたマ
    ルチメディア変換装置において、 前記送信部は、 前記複数のメディア変換結果の中から前記受信者の期待
    する処理時間のメディア変換結果を選択し送信すること
    を特徴とするマルチメディア変換装置。
  4. 【請求項4】 請求項1または請求項2に記載されたマ
    ルチメディア変換装置において、 前記送信部は、 前記複数のメディア変換結果の中から前記受信者の期待
    する精度のメディア変換結果を選択し送信することを特
    徴とするマルチメディア変換装置。
  5. 【請求項5】 異種メディア間で通信を行う際にメディ
    ア変換を行うマルチメディア変換装置において、 通信回線を介してデータを受信する受信部と、 それぞれ異なるアルゴリズムによって前記データを他の
    情報形式に異なる品質でメディア変換する複数の信号処
    理部と、 前記複数のメディア変換結果の品質を判定し、品質の高
    いメディア変換結果を導出する判定部と、 前記判定部において導出された前記メディア変換結果を
    選択して前記受信者に送信する送信部とを備えたことを
    特徴とするマルチメディア変換装置。
  6. 【請求項6】 請求項5に記載されたマルチメディア変
    換装置において、 前記複数の信号処理部は、 前記受信部で受信したデータを他の情報形式にリアルタ
    イムでメディア変換する処理時間優先信号処理部と、 前記データを前記他の情報形式に異なるアルゴリズムに
    よってそれぞれ精度優先でメディア変換する複数の精度
    優先信号処理部とからなり、 前記判定部は、 前記精度優先信号処理部より得られた複数のメディア変
    換結果に基づき精度の高いメディア変換結果を導出し、 前記送信部は、 前記高速信号処理部より得られるメディア変換結果を前
    記受信者に送信し、前記受信者から精度を優先する旨の
    指示に基づいて前記判定部が導出した精度の高いメディ
    ア変換結果を送信し直すことを特徴とするマルチメディ
    ア変換装置。
  7. 【請求項7】 請求項5または請求項6に記載されたマ
    ルチメディア変換装置において、 前記判定部は、 前記受信部で受信されたデータを参照し、前記複数のメ
    ディア変換結果の中から前記受信データに適したアルゴ
    リズムを有する信号処理部のメディア変換結果を選択す
    ることを特徴とするマルチメディア変換装置。
  8. 【請求項8】 請求項1乃至請求項7のいずれかに記載
    されたマルチメディア変換装置において、 前記受信部において受信された前記データを一時蓄積す
    るバッファを備え、 前記受信部は、 複数のユーザを収容し、 前記マルチメディア変換装置が一のユーザにより使用さ
    れているときに他のユーザからのデータの着信があった
    場合、前記データを一時的にバッファに蓄積し、前記ユ
    ーザによる使用が終了した後に前記バッファに蓄積され
    た前記他のユーザからのデータについてメディア変換を
    行うことを特徴とするマルチメディア変換装置。
  9. 【請求項9】 複数のユーザを収容したネットワーク内
    に設置された複数のマルチメディア変換装置から構成さ
    れるマルチメディア変換方式において、 前記複数のマルチメディア変換装置は、 請求項1乃至請求項8のいずれかに記載されたマルチメ
    ディア変換装置であり、 前記各マルチメディア変換装置の前記受信部は、 前記マルチメディア変換装置が一のユーザにより使用さ
    れているときに他のユーザからのデータの着信があった
    場合、前記ネットワークを介して前記他のユーザからの
    データを使用されていない他のマルチメディア変換装置
    へ転送することを特徴とするマルチメディア変換方式。
JP03039897A 1997-02-14 1997-02-14 マルチメディア変換装置および変換方式 Expired - Fee Related JP3244014B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP03039897A JP3244014B2 (ja) 1997-02-14 1997-02-14 マルチメディア変換装置および変換方式
US09/024,110 US6122290A (en) 1997-02-14 1998-02-17 Multimedia conversion apparatus and conversion system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03039897A JP3244014B2 (ja) 1997-02-14 1997-02-14 マルチメディア変換装置および変換方式

Publications (2)

Publication Number Publication Date
JPH10229426A JPH10229426A (ja) 1998-08-25
JP3244014B2 true JP3244014B2 (ja) 2002-01-07

Family

ID=12302837

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03039897A Expired - Fee Related JP3244014B2 (ja) 1997-02-14 1997-02-14 マルチメディア変換装置および変換方式

Country Status (2)

Country Link
US (1) US6122290A (ja)
JP (1) JP3244014B2 (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3782867B2 (ja) * 1997-06-25 2006-06-07 株式会社日立製作所 情報受信処理方法およびコンピュータ・テレフォニイインテグレーションシステム
US6292554B1 (en) * 1999-10-07 2001-09-18 Simplified Telesys System and method for communicating with and controlling disparate telecommunications devices in a telecommunications network
US7116765B2 (en) 1999-12-16 2006-10-03 Intellisync Corporation Mapping an internet document to be accessed over a telephone system
US7242324B2 (en) * 2000-12-22 2007-07-10 Sony Corporation Distributed on-demand media transcoding system and method
US6407680B1 (en) 2000-12-22 2002-06-18 Generic Media, Inc. Distributed on-demand media transcoding system and method
US8108509B2 (en) * 2001-04-30 2012-01-31 Sony Computer Entertainment America Llc Altering network transmitted content data based upon user specified characteristics
US7730165B2 (en) * 2001-11-09 2010-06-01 Sony Corporation System, method, and computer program product for remotely determining the configuration of a multi-media content user
US7356575B1 (en) 2001-11-09 2008-04-08 Sony Corporation System, method, and computer program product for remotely determining the configuration of a multi-media content user
US7480703B2 (en) * 2001-11-09 2009-01-20 Sony Corporation System, method, and computer program product for remotely determining the configuration of a multi-media content user based on response of the user
US7155475B2 (en) * 2002-02-15 2006-12-26 Sony Corporation System, method, and computer program product for media publishing request processing
KR100473116B1 (ko) * 2002-07-22 2005-03-10 한국전자통신연구원 컨텐츠 변환 장치 및 그 방법
US20040128136A1 (en) * 2002-09-20 2004-07-01 Irani Pourang Polad Internet voice browser
US8233592B2 (en) 2003-11-10 2012-07-31 Nuance Communications, Inc. Personal home voice portal
US20070058730A1 (en) * 2005-09-09 2007-03-15 Microsoft Corporation Media stream error correction
US8862733B2 (en) * 2010-07-30 2014-10-14 Verizon Patent And Licensing Inc. User-based prioritization for content transcoding
US8949258B2 (en) * 2011-03-28 2015-02-03 Microsoft Corporation Techniques to manage file conversions
US9521176B2 (en) 2014-05-21 2016-12-13 Sony Corporation System, method, and computer program product for media publishing request processing

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE68928298T2 (de) * 1988-06-14 1998-01-29 Fujitsu Ltd Antwortregelungssystem
JPH04302561A (ja) * 1991-03-29 1992-10-26 Toshiba Corp マルチメディア通信システム
US5276731A (en) * 1991-04-26 1994-01-04 Rolm Company Method and apparatus for handling incoming telephone calls
US5737395A (en) * 1991-10-28 1998-04-07 Centigram Communications Corporation System and method for integrating voice, facsimile and electronic mail data through a personal computer
US5289523A (en) * 1992-07-31 1994-02-22 At&T Bell Laboratories Telecommunications relay service method and apparatus
JPH077532A (ja) * 1993-01-19 1995-01-10 Canon Inf Syst Inc 制御基板、コントローラ、及び、通信制御装置
US5479411A (en) * 1993-03-10 1995-12-26 At&T Corp. Multi-media integrated message arrangement
US5524137A (en) * 1993-10-04 1996-06-04 At&T Corp. Multi-media messaging system
US5953392A (en) * 1996-03-01 1999-09-14 Netphonic Communications, Inc. Method and apparatus for telephonically accessing and navigating the internet
US5661783A (en) * 1996-05-22 1997-08-26 Assis; Offer Electronic secretary
US5712901A (en) * 1996-06-26 1998-01-27 Mci Communications Corporation Automatic voice/text translation of phone mail messages

Also Published As

Publication number Publication date
US6122290A (en) 2000-09-19
JPH10229426A (ja) 1998-08-25

Similar Documents

Publication Publication Date Title
JP3244014B2 (ja) マルチメディア変換装置および変換方式
JP5089598B2 (ja) 異なる通信モードを有する装置に関わる通信
US7120577B2 (en) Virtual presence
US5604737A (en) Voice communication system and voice communication method
US6175569B1 (en) Extending asynchronous transfer mode ATM QoS across local area networks
US6005851A (en) Adaptive channel control for data service delivery
KR101465292B1 (ko) 인터모덜리티 브리지를 통한 비동기 다국적 대화형 통신
EP1488409A1 (en) Controlling home entertainment systems using a natural language server
CA2644931A1 (en) System and method for voice-enabled instant messaging
US7043561B2 (en) System and method for prioritizing requests for server services
JP2002077303A (ja) 通信接続装置およびその通信速度調整方法
US20020027923A1 (en) IP gateway apparatus
US20070192330A1 (en) Information processing apparatus and method and program
JPH10327190A (ja) ネットワークトラフィック優先順位決定方法
US7711856B1 (en) Method and apparatus for providing an interface for a messaging mailbox
US20070220432A1 (en) Isochronous Audio Network Software Interface
KR100785112B1 (ko) SIP(Session InitiationProtocol)기반 MoIP(Multimediaover Internet Protocol)서비스를수용하는 무선 접속 지점에 QoS를 제공하기 위한 장치및 방법
JPH0662050A (ja) 電子メールの宛先別ボディ自動変換方式
JPH10289170A (ja) マルチメディア通信網
JP2000278312A (ja) 電子メール変換方法及びシステム
JPH0325978B2 (ja)
JPH10136093A (ja) ボイスメールサーバ
JPH06284146A (ja) 電子メール交換システムの宛先別ボディ形式自動変換方式
KR20030073408A (ko) 로봇 메일 서비스 방법
CN109150408A (zh) 一种信息处理方法及装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071026

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081026

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091026

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091026

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101026

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111026

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121026

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131026

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees