JPH09326886A - マルチメディア情報内容の伝送装置或は蓄積装置 - Google Patents

マルチメディア情報内容の伝送装置或は蓄積装置

Info

Publication number
JPH09326886A
JPH09326886A JP8139861A JP13986196A JPH09326886A JP H09326886 A JPH09326886 A JP H09326886A JP 8139861 A JP8139861 A JP 8139861A JP 13986196 A JP13986196 A JP 13986196A JP H09326886 A JPH09326886 A JP H09326886A
Authority
JP
Japan
Prior art keywords
information
text
voice
attribute
multimedia
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8139861A
Other languages
English (en)
Inventor
Takeshi Tono
豪 東野
Tomohiko Arikawa
知彦 有川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP8139861A priority Critical patent/JPH09326886A/ja
Publication of JPH09326886A publication Critical patent/JPH09326886A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Computer And Data Communications (AREA)
  • Telephonic Communication Services (AREA)

Abstract

(57)【要約】 【課題】 音声情報の付随したマルチメディア情報内容
を効率良く伝送し、蓄積し、音声情報以外のマルチメデ
ィア情報内容の検索を高速、正確に実施する。 【解決手段】 音声情報の付随するマルチメディア情報
内容の伝送装置において、音声情報をテキスト情報に変
換する音声テキスト変換部3、テキスト情報に他のメデ
ィアの情報との間の同期情報を付加する同期情報付加部
6、テキスト情報および他のメディアの情報を入力して
伝送する送信処理部7、テキスト情報および他のメディ
アの情報を受信する受信処理部8、受信されたテキスト
情報から同期情報を読み取る同期情報読み取り部11、
同期情報に基づいて他のメディアの情報と同期してテキ
スト情報を音声信号に変換するテキスト音声変換部12
を具備するマルチメディア情報内容の伝送蓄積装置。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、マルチメディア
情報内容の伝送装置或は蓄積装置に関し、特に、音声情
報の付随するマルチメディア情報内容の伝送装置或は蓄
積装置に関する。
【0002】
【従来の技術】音声情報については、これを伝送するに
際して何らかの形式の音声波形情報として伝送し、或は
これを蓄積することが行なわれてる。この際の音声波形
情報量についてみると、例えば8KHzサンプリング、
8bit量子化の場合、1秒間に64Kbitになる。
ところで、情報量を符号化により削減した場合は、8K
bit/sec〜32Kbit/secとすることがで
きる。
【0003】ここで、音声の付随するマルチメディア情
報内容をISDNその他の伝送帯域が数10Kbit/
sec〜数100Kbit/secという狭い伝送路を
介して伝送する場合、伝送帯域は情報内容によらず一定
量とされているところから、音声波形情報の情報量が多
くなると、音声情報以外の他のメディアに割り当てられ
るべき帯域はそれだけ圧迫されることとなる。他のメデ
ィアが映像である場合は、その画像の品質は低下するに
到る。
【0004】そして、音声の付随するマルチメディア情
報内容を蓄積する場合、上述した通り、音声の波形情報
量は比較的に多いところから、長時間に亘ってこれを蓄
積することは困難である。また、ニュース番組その他の
番組において、アナウンサーが話をしていない無音の状
態も存在するが、これらの情報は無音の状態においても
データを伝送し或は蓄積し続ける必要がある。無音状態
においても音声波形情報を伝送する帯域は確保していな
ければならないので、その分だけ伝送効率は悪化する。
【0005】更に、マルチメディア情報内容について検
索を実施する場合、映像のブラウジングにおける高速正
確な検索は一般に困難である。このブラウジングにおい
て、ラベル情報を付加して検索する方法は予め手動によ
りラベルを付加しておく必要があり、能率的とはいい難
い。
【0006】
【発明が解決しようとする課題】この発明は、上述の通
りの問題を解消したマルチメディア情報伝送装置或は蓄
積装置を提供するものである。
【0007】
【課題を解決するための手段】音声情報の付随するマル
チメディア情報内容の伝送装置において、音声情報をテ
キスト情報に変換する音声テキスト変換部3を具備し、
テキスト情報に他のメディアの情報との間の同期情報を
付加する同期情報付加部6を具備し、テキスト情報およ
び他のメディアの情報を入力して伝送する送信処理部7
を具備し、テキスト情報および他のメディアの情報を受
信する受信処理部8を具備し、受信されたテキスト情報
から同期情報を読み取る同期情報読み取り部11を具備
し、同期情報に基づいて他のメディアの情報と同期して
テキスト情報を音声信号に変換するテキスト音声変換部
12を具備するマルチメディア情報内容の伝送装置を構
成した。
【0008】そして、音声テキスト変換部3はテキスト
情報に属性情報を付加する属性付加部を有し、テキスト
音声変換部12は、テキスト情報に付加されている属性
情報を読み取る属性情報読み取り部を有し、属性情報に
基づいてテキスト情報を音声信号に変換するマルチメデ
ィア情報内容の伝送装置を構成した。ここで、音声情報
をテキスト情報に変換する音声テキスト変換部3を具備
し、テキスト情報に他のメディアの情報との間の同期情
報を付加する同期情報付加部6を具備し、テキスト情報
および他のメディアの情報を入力処理して蓄積媒体16
に蓄積する蓄積処理部15を具備し、テキスト情報およ
び他のメディアの情報を蓄積処理部15から読み出し処
理する読み出し処理部17を具備し、読み出されたテキ
スト情報から同期情報を読み取る同期情報読み取り部1
1を具備し、同期情報に基づいて他のメディアの情報と
同期してテキスト情報を音声信号に変換するテキスト音
声変換部12を具備するマルチメディア情報内容の蓄積
装置を構成した。
【0009】そして、音声テキスト変換部3はテキスト
情報に属性情報を付加する属性付加部を有し、テキスト
音声変換部12は、テキスト情報に付加されている属性
情報を読み取る属性情報読み取り部を有し、属性情報に
基づいてテキスト情報を音声信号に変換するマルチメデ
ィア情報内容の蓄積装置を構成した。また、音声情報か
ら変換されたテキスト情報或は付随する属性情報に対し
て検索処理を施してマルチメディア情報内容を検索する
構成を具備するマルチメディア情報内容の蓄積装置を構
成した。
【0010】更に、マルチメディア情報内容を検索する
構成は、検索条件を入力すると共にテキスト情報或は付
随する属性情報を蓄積媒体16から入力検索し、検索結
果に基づいてマルチメディア情報内容の提示位置を読み
出し処理部17に出力する検索処理部20より成るマル
チメディア情報内容の蓄積装置を構成した。
【0011】
【発明の実施の形態】人間が1秒間に話す語数であるデ
ータ発生速度は約2.5〜4語であり、これをテキスト
情報に換算すると、1語当り2byteとして5〜8b
yte/secとなる(参考文献:新美康永著「音声認
識」、共立出版 発行)。これをbitにより表現する
と、40〜64bit/secとなり、音声の波形情報
量と比較して極めて少ない。
【0012】この発明は、この点に着目し、8Kbit
/sec〜64Kbit/secの音声波形情報を数1
0byte/secのテキスト情報に変換して伝送し或
は蓄積することにより、伝送においては音声波形情報用
の伝送帯域を削減して音声情報以外のマルチメディア情
報例えば映像情報に割り当てる伝送帯域を増加させ、狭
い伝送帯域において音声情報の付随したマルチメディア
情報内容の伝送品質を向上させると共に、蓄積において
は音声波形情報の蓄積容量を削減してより長時間のマル
チメディア情報内容の蓄積をすることができるものと
し、更に、検索においては音声波形情報をテキスト情報
に変換すると共に付随する属性情報をこのテキスト情報
に付加することにより、高速正確な検索を実施するもの
である。
【0013】
【実施例】この発明はこれを要約するに、話者である送
信者の音声が発生した時のみ当該音声をテキスト情報に
変換し、送信者の性別その他の送信者の特徴を示す属性
情報および付随する他メディアと同期を取る同期情報を
テキスト情報に付加して他のメディアと共に送信し或は
蓄積し、読み出し或は受信したテキスト情報をその属性
情報を使用して音声に変換し、当該音声を付加されてい
た同期情報に基づいて他のメディアと同期をとって表示
する。そして、検索においては、音声情報から変換され
たテキスト情報および付随する属性情報を使用してマル
チメディア情報内容に対する検索を行なう。
【0014】以下、この発明の実施例を図1を参照して
具体的に説明する。図1はこの発明を映像および音声よ
り成るマルチメディア情報内容の伝送に適用した場合の
実施例を説明するブロック図である。アナウンサーその
他の送信者1の発声する音声は、マイクロフォン2を介
して音声信号に変換される。この音声信号は音声テキス
ト変換および属性付加部3に入力され、音声テキスト変
換されると共に話者の特徴を示す性別、年齢その他の属
性情報が付加されたテキスト情報とされる。ここで、音
声が発生していない間はテキスト情報は発生しない。
【0015】一方、カメラ4により撮像された映像信号
はビデオエンコーダ5に入力され、MPEGその他の適
当な符号化方法により符号化される。そして、映像信号
とテキスト情報に変換された音声信号の間の同期をとる
同期情報がビデオエンコーダ5から同期情報付加部6に
通知され、同期情報付加部6において音声信号に対して
同期情報が付加される。ここで、同期情報とは、映像情
報のフレーム番号或は映像情報の最初から計測された相
対的時刻である。
【0016】送信処理部7は、ビデオエンコーダ5から
入力される符号化された映像情報および同期情報付加部
6を介して入力される同期情報が付加されたテキスト情
報を送信する。受信処理部8は、送信処理部7から送信
された映像情報およびテキスト情報を受信し、これら受
信情報はビデオデコーダ9或はテキスト情報の同期情報
読み取り部11に転送される。
【0017】ビデオデコーダ9は、転送された映像情報
を復号化すると共に、同期情報読み取り部11に映像信
号と音声信号の同期をとる同期情報を通知する。復号化
された映像情報はディスプレイ10を介して映像に変換
表示される。同期情報読み取り部11は、テキスト情報
から同期情報を読み取ると共にビデオデコーダ9から通
知された同期情報と当該テキスト情報から読み取った同
期情報に基づくタイミングにおいてテキスト情報を属性
情報読み取りおよびテキスト音声変換部12に転送す
る。
【0018】属性情報読み取りおよびテキスト音声変換
部12は、転送されたテキスト情報に付加されている属
性情報に基づいて音声信号に変換する。この音声信号は
スピーカ13を介して音声に変換される。ここで、音声
テキスト変換された音声信号に付加される属性情報は、
ユーザの好みに応じて適宜に変更することができる。例
えば、男性の音声から女性の音声への変更、或は音声を
発声する際の抑揚の度合いを強調することその他の変更
をすることができる。
【0019】以上の実施例は、話者の音声をリアルタイ
ムにテキスト変換する例であるが、話者の発声内容を予
めテキスト化しておいて、送信時にこのテキスト情報を
送信する場合もある。そして、属性情報は話者が適宜の
方法により入力し、或は入力された音声に基づいて自動
的に判断して入力するものとすることができる。図2は
図1を参照して図示説明した技術内容を蓄積に適用する
場合を説明する図である。図2における蓄積処理部15
の直前までの構成は図1の送信処理部7の直前までの構
成と同様である。そして、読み出し処理部17より後の
構成は図1の受信処理部8より後の構成と同様である。
【0020】図2において、図1の送信処理部7の直前
までになされた処理と同様の処理のなされた映像情報お
よびテキスト情報は、蓄積処理部15に入力され、これ
を介して蓄積媒体16に蓄積される。読み出し処理部1
7は蓄積媒体16に蓄積される映像情報およびテキスト
情報を読み出し、これらの情報はビデオデコーダ9或は
テキスト情報の同期情報読み取り部11に転送される。
以降、図1の場合と同様の処理がなされる。
【0021】図3はこの発明に使用されるテキスト化さ
れた音声情報の情報形式を説明する図である。テキスト
は、任意のサイズ毎に区切られたテキスト情報19とな
り、ヘッダ18が付加される。ヘッダ18には、テキス
ト情報であることを示す識別子、情報サイズ、映像との
間の同期をとる同期情報、テキストの属性を示す属性情
報その他の情報が記録されている。ここで、同期情報
は、対応する映像のフレーム番号、当該テキスト情報が
音声として発生される継続時間その他の情報より成る。
属性情報は、元の音声の話者性別、抑揚の度合いその
他、音声化時に使用される情報より成る。
【0022】図4はこの発明によるマルチメディア情報
内容の検索の仕方を説明する図である。ユーザ14は検
索処理部20に対して検索条件を入力する。ここで、検
索条件とは、通常のテキスト検索と同様に、検索したい
テキスト情報或は属性情報および必要とされるAND或
はORその他の条件である。
【0023】検索処理部20は、蓄積媒体16から音声
信号よりテキスト化されたテキスト情報が入力され、ユ
ーザ14により入力された検索条件に従って検索処理を
行なう。この検索処理の結果に基づいて、ユーザ14に
提示すべきマルチメディア情報内容の提示位置を読み出
し処理部17に通知する。読み出し処理部17以降の情
報内容の表示の仕方は、図1において説明された仕方と
同様であり、ユーザ14は検索条件に合致したマルチメ
ディア情報内容の視聴をすることができる。
【0024】以上の通り、この発明に依れば、音声情報
の付随したマルチメディア情報内容を数10Kbit/
sec〜数100Kbit/secという狭い帯域の伝
送路を介して効率良く伝送することができると共に、こ
の情報内容を蓄積媒体へ蓄積するに際して蓄積時間を増
加させることができる。更に、音声情報をテキスト化す
ると共にこれに属性情報を付加したことにより、テキス
ト検索と同様の仕方を採用して音声情報以外のマルチメ
ディア情報内容の検索をも高速、正確に実施することが
できる。
【0025】
【発明の効果】以上の通りであって、この発明は、音声
情報の付随するマルチメディア情報内容を取り扱うマル
チメディア情報伝送および蓄積装置において、音報情報
をテキスト情報に変換して送信或は蓄積し、受信したテ
キスト情報或は蓄積媒体から読み出したテキスト情報を
音声に変換して表示することにより、情報内容を損なう
ことなくしてより多くの伝送帯域を音声以外の他のメデ
ィアに割り当てることができることとなり、或は蓄積可
能な時間を増加することができるに到る。特に、音声以
外の他のメディアが映像である場合、より高画質な映像
の伝送および蓄積をすることができるという効果を奏
す。
【0026】そして、マルチメディア情報内容に対する
検索については、音声情報をテキスト化すると共にこれ
に属性情報を付加したことにより、テキスト検索と同様
の仕方を採用して音声情報以外のマルチメディア情報内
容の検索をも高速、正確に実施することができる。
【図面の簡単な説明】
【図1】実施例を説明するブロック図。
【図2】他の実施例を説明するブロック図。
【図3】テキスト化された音声情報の情報形式を説明す
る図。
【図4】マルチメディア情報内容の検索の仕方を説明す
る図。
【符号の説明】
1 送信者 2 マイクロフォン 3 音声テキスト変換および属性付加部 4 カメラ 5 ビデオエンコーダ 6 同期情報付加部 7 送信処理部 8 受信処理部 9 ビデオデコーダ 10 ディスプレイ 11 同期情報読み取り部 12 属性情報読み取りおよびテキスト音声変換部 13 スピーカ 14 ユーザ 15 蓄積処理部 16 蓄積媒体 17 読み出し処理部 18 ヘッダ 19 テキスト情報 20 検索処理部

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 音声情報の付随するマルチメディア情報
    内容の伝送装置において、 音声情報をテキスト情報に変換する音声テキスト変換部
    を具備し、 テキスト情報に他のメディアの情報との間の同期情報を
    付加する同期情報付加部を具備し、 テキスト情報および他のメディアの情報を入力して伝送
    する送信処理部を具備し、 テキスト情報および他のメディアの情報を受信する受信
    処理部を具備し、 受信されたテキスト情報から同期情報を読み取る同期情
    報読み取り部を具備し、 同期情報に基づいて他のメディアの情報と同期してテキ
    スト情報を音声信号に変換するテキスト音声変換部を具
    備する、 ことを特徴とするマルチメディア情報内容の伝送装置。
  2. 【請求項2】 請求項1に記載されるマルチメディア情
    報内容の伝送装置において、 音声テキスト変換部はテキスト情報に属性情報を付加す
    る属性付加部を有し、 テキスト音声変換部は、テキスト情報に付加されている
    属性情報を読み取る属性情報読み取り部を有し、属性情
    報に基づいてテキスト情報を音声信号に変換する、 ことを特徴とするマルチメディア情報内容の伝送装置。
  3. 【請求項3】 音声情報の付随するマルチメディア情報
    内容の蓄積装置において、 音声情報をテキスト情報に変換する音声テキスト変換部
    を具備し、 テキスト情報に他のメディアの情報との間の同期情報を
    付加する同期情報付加部を具備し、 テキスト情報および他のメディアの情報を入力処理して
    蓄積媒体に蓄積する蓄積処理部を具備し、 テキスト情報および他のメディアの情報を蓄積処理部か
    ら読み出し処理する読み出し処理部を具備し、 読み出されたテキスト情報から同期情報を読み取る同期
    情報読み取り部を具備し、 同期情報に基づいて他のメディアの情報と同期してテキ
    スト情報を音声信号に変換するテキスト音声変換部を具
    備する、 ことを特徴とするマルチメディア情報内容の蓄積装置。
  4. 【請求項4】 請求項3に記載されるマルチメディア情
    報内容の蓄積装置において、 音声テキスト変換部はテキスト情報に属性情報を付加す
    る属性付加部を有し、 テキスト音声変換部は、テキスト情報に付加されている
    属性情報を読み取る属性情報読み取り部を有し、属性情
    報に基づいてテキスト情報を音声信号に変換する、 ことを特徴とするマルチメディア情報内容の蓄積装置。
  5. 【請求項5】 請求項3および請求項4の内の何れかに
    記載されるマルチメディア情報内容の蓄積装置におい
    て、 音声情報から変換されたテキスト情報或は付随する属性
    情報に対して検索処理を施してマルチメディア情報内容
    を検索する構成を具備することを特徴とするマルチメデ
    ィア情報内容の蓄積装置。
  6. 【請求項6】 請求項5に記載されるマルチメディア情
    報内容の蓄積装置において、 マルチメディア情報内容を検索する構成は、検索条件を
    入力すると共にテキスト情報或は付随する属性情報を蓄
    積媒体から入力して検索し、検索結果に基づいてマルチ
    メディア情報内容の提示位置を読み出し処理部に出力す
    る検索処理部より成ることを特徴とするマルチメディア
    情報内容の蓄積装置。
JP8139861A 1996-06-03 1996-06-03 マルチメディア情報内容の伝送装置或は蓄積装置 Pending JPH09326886A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8139861A JPH09326886A (ja) 1996-06-03 1996-06-03 マルチメディア情報内容の伝送装置或は蓄積装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8139861A JPH09326886A (ja) 1996-06-03 1996-06-03 マルチメディア情報内容の伝送装置或は蓄積装置

Publications (1)

Publication Number Publication Date
JPH09326886A true JPH09326886A (ja) 1997-12-16

Family

ID=15255256

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8139861A Pending JPH09326886A (ja) 1996-06-03 1996-06-03 マルチメディア情報内容の伝送装置或は蓄積装置

Country Status (1)

Country Link
JP (1) JPH09326886A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004509427A (ja) * 2000-09-14 2004-03-25 アルカテル マルチメディアファイルの同期方法
JP2007228114A (ja) * 2006-02-22 2007-09-06 Fujitsu Support & Service Kk 電話システム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004509427A (ja) * 2000-09-14 2004-03-25 アルカテル マルチメディアファイルの同期方法
JP2007228114A (ja) * 2006-02-22 2007-09-06 Fujitsu Support & Service Kk 電話システム
JP4607028B2 (ja) * 2006-02-22 2011-01-05 株式会社富士通エフサス 電話システム

Similar Documents

Publication Publication Date Title
US6119086A (en) Speech coding via speech recognition and synthesis based on pre-enrolled phonetic tokens
US5943648A (en) Speech signal distribution system providing supplemental parameter associated data
US6810379B1 (en) Client/server architecture for text-to-speech synthesis
US9318100B2 (en) Supplementing audio recorded in a media file
US6370504B1 (en) Speech recognition on MPEG/Audio encoded files
AU2005200340B2 (en) Database annotation and retrieval
JP4344658B2 (ja) 音声合成機
JPH10260692A (ja) 音声の認識合成符号化/復号化方法及び音声符号化/復号化システム
US6683993B1 (en) Encoding and decoding with super compression a via a priori generic objects
JPS5919358B2 (ja) 音声内容伝送方式
US20060106597A1 (en) System and method for low bit-rate compression of combined speech and music
US7177801B2 (en) Speech transfer over packet networks using very low digital data bandwidths
JPH08194493A (ja) 低いビット速度のスピーチエンコーダおよびデコーダ
WO2007044816A1 (en) Method and system for bandwidth efficient and enhanced concatenative synthesis based communication
JP3473204B2 (ja) 翻訳装置及び携帯端末装置
JP4513165B2 (ja) 番組記録方法及び番組記録装置及び番組記録再生装置及び番組記録再生方法
JPH09326886A (ja) マルチメディア情報内容の伝送装置或は蓄積装置
KR101618777B1 (ko) 파일 업로드 후 텍스트를 추출하여 영상 또는 음성간 동기화시키는 서버 및 그 방법
JP2006319598A (ja) 音声通信システム
US20030105640A1 (en) Digital audio with parameters for real-time time scaling
RU2654126C2 (ru) Способ и устройство высокоэффективного сжатия мультимедийной информации большого объема по критериям ее ценности для запоминания в системах хранения данных
JP2822940B2 (ja) 動画像音声データ編集装置
US20030154082A1 (en) Information retrieving method and apparatus
US20030065512A1 (en) Communication device and a method for transmitting and receiving of natural speech
JP2003029774A (ja) 音声波形辞書配信システム、音声波形辞書作成装置、及び音声合成端末装置