JP2002189728A - マルチメディア情報編集装置、その方法および記録媒体並びにマルチメディア情報配信システム - Google Patents

マルチメディア情報編集装置、その方法および記録媒体並びにマルチメディア情報配信システム

Info

Publication number
JP2002189728A
JP2002189728A JP2000389348A JP2000389348A JP2002189728A JP 2002189728 A JP2002189728 A JP 2002189728A JP 2000389348 A JP2000389348 A JP 2000389348A JP 2000389348 A JP2000389348 A JP 2000389348A JP 2002189728 A JP2002189728 A JP 2002189728A
Authority
JP
Japan
Prior art keywords
information
multimedia
multimedia information
document
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000389348A
Other languages
English (en)
Inventor
Hiroko Ida
裕子 井田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2000389348A priority Critical patent/JP2002189728A/ja
Publication of JP2002189728A publication Critical patent/JP2002189728A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 動画像に付加された音声を用いて、意味的に
シーンを区切るようにマルチメディア情報を構造化する
ことによって、マルチメディア情報の編集効率を向上さ
せるマルチメディア情報編集装置を提供する。 【解決手段】 本発明のマルチメディア情報編集装置1
10は、音声、動画像などのマルチメディア情報を記憶
する記憶手段118と、記憶手段118に記憶されたマ
ルチメディア情報に対して音声が付加されているか判別
を行う音声判別手段112と、音声判別手段112によ
って音声が付加されていた場合その音声情報を文書情報
に変換する文書変換手段113と、文書変換手段113
で変換された文書を言語解析して、文書とマルチメディ
ア情報とを構造化して、対応付けるマルチメディア構造
化手段114とを備え、マルチメディア情報を編集す
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、マルチメディア情
報編集装置、その方法および記録媒体並びにマルチメデ
ィア情報配信システムに関し、特に、音声、動画像等を
含むマルチメディア情報を記録管理し、これらの情報の
検索や編集を行う技術、並びにその編集されたマルチメ
ディア情報の配信技術に関する。
【0002】
【従来の技術】最近では、記録メディア技術、メディア
の通信技術の向上により、動画像や音声を統合したデジ
タルデータが多く流通するようになっている。これに伴
い、マルチメディア情報を処理するシステムは、単にデ
ータを時系列的に表示するだけでなく、必要とする部分
のみを取り出し閲覧したり、編集できるようなシステム
の開発が望まれている。
【0003】
【発明が解決しようとする課題】従来、動画像を編集す
る場合には編集者は、動画像を最初から再生することに
より、所望の位置情報(フレームの番号)を記録しなけ
ればならず、編集するのに多大な時間と労力を要してい
る。これを改善するため、画像の特徴量を抽出しその特
徴量の変化に応じてシーンの切り替わりを検出し、自動
的に編集する方法が考案されている。しかしこのような
場合、単にシーン変化で切り分けるため、必ずしも意味
上での区切りと一致するとは限らず、上手く区切りをと
らえることができない等の問題点がある。また、意味内
容でマルチメディア情報を区切る場合、特に音声内容に
より切る場合は、意味内容を把握するために何度も動画
の再生巻き戻しを行うことになり、労を要している。特
開平9−81590号公報の技術では、映像と文字情報
とを統合したマルチメディア情報を対象とし、この文字
情報を言語解析して意味情報を抽出し、この意味情報を
用いて、複数のマルチメディア情報の中から所望の情報
を検索するようにしている。しかしながら、従来の技術
では、マルチメディア情報を意味ベースで区切る場合、
人手による方法では、多大な時間とコストを要し、また
画像の特徴量を利用して自動的に区切る場合では、必ず
しも区切りが意味内容と一致するとは限らないという問
題があった。また、意味内容の把握に関しても動画上に
付加された音声を人が聞いて内容を把握するのは容易な
ことではなかった。本発明は、上記問題点を解決するた
めになされたものであって、第1の目的は、動画像に付
加された音声を用いて、意味的にシーンを区切るように
マルチメディア情報を構造化することによって、マルチ
メディア情報の編集効率を向上させるマルチメディア情
報編集装置、その方法および記録媒体を提案することに
ある。また、第2の目的は、上記のような音声、動画像
を時系列でもつマルチメディア情報の編集サービスおよ
びその編集蓄積されたマルチメディア情報の検索サービ
スを行うマルチメディア情報配信システムを提案するこ
とにある。
【0004】
【課題を解決するための手段】上記の問題を解決するた
めに、請求項1の発明のマルチメディア情報編集装置
は、マルチメディア情報を編集するマルチメディア情報
編集装置において、音声、動画像などのマルチメディア
情報を記憶する記憶手段と、前記記憶手段に記憶された
マルチメディア情報に対して音声が付加されているか判
別を行う音声判別手段と、前記音声判別手段によって音
声が付加されていた場合その音声情報を文書情報に変換
する文書変換手段と、前記文書変換手段で変換された文
書を言語解析して、文書とマルチメディア情報とを構造
化して、対応付けるマルチメディア構造化手段とを備え
たことを特徴とする。また、請求項2の発明のマルチメ
ディア情報編集装置は、請求項1に記載のマルチメディ
ア情報編集装置において、前記文書変換手段によって変
換された文書または前記マルチメディア構造化手段で構
造化された文書に対して、メモまたは要約文を作成して
付加する付随情報作成手段を備えたことを特徴とする。
また、請求項3の発明のマルチメディア情報編集装置
は、請求項2に記載のマルチメディア情報編集装置にお
いて、前記付随情報作成手段によって作成されたメモま
たは要約文の音声データを作成して付加する音声変換手
段を備えたことを特徴とする。また、請求項4の発明の
マルチメディア情報編集装置は、請求項1、2または3
に記載のマルチメディア情報編集装置において、前記マ
ルチメディア構造手段によって作成されたマルチメディ
ア情報と文書の対応付けられた構造化情報と、それに付
随する情報とを出力する情報出力手段を備えることを特
徴とする。
【0005】また、請求項5の発明のマルチメディア情
報編集方法は、記憶手段に記憶された音声、動画像など
のマルチメディア情報に音声が付加されているか判別
し、音声が付加されていた場合、その音声情報を文書情
報に変換し、その文書情報を言語解析して、文書とマル
チメディア情報とを構造化して、対応付けるることによ
ってマルチメディア情報を構造化することを特徴とす
る。また、請求項6の発明の記憶媒体は、コンピュータ
にマルチメディア情報を編集する機能を持たせるための
プログラムを記録したコンピュータ読み取り可能な記録
媒体であって、コンピュータを、マルチメディア情報を
編集する機能を持つプログラムを記録したコンピュータ
に読み取り可能な記録媒体であって、音声、動画像など
のマルチメディア情報を記憶する記憶手段と、前記記憶
手段に記憶されたマルチメディア情報に対して音声が付
加されているか判別を行う音声判別手段と、前記音声判
別手段によって音声が付加されていた場合その音声情報
を文書情報に変換する文書変換手段と、前記文書変換手
段で変換された文書を言語解析して、文書とマルチメデ
ィア情報とを構造化して、対応付けるマルチメディア構
造化手段とを備え、マルチメディア情報編集装置として
機能させるプログラムを記録したことを特徴とする。ま
た、請求項7の発明のマルチメディア配信システムは、
動画像や音声などのマルチメディア情報を蓄積したマル
チメディア情報蓄積装置とマルチメディア情報の配信を
受ける複数の端末とをネットワークを介して接続したマ
ルチメディア配信システムにおいて、前記マルチメディ
ア情報蓄積装置は、前記端末からのマルチメディア情報
要求を受信する要求受信手段と、請求項1乃至請求項4
のいずれか1つに記載のマルチメディア情報編集装置に
よって作成された構造化されたマルチメディア情報を蓄
積する情報蓄積手段と、前記情報蓄積手段から情報を抽
出する情報抽出手段と、前記情報抽出手段で抽出された
マルチメディア情報を送信する情報送信手段とを備え、
前記要求受信手段で受信した端末からのマルチメディア
情報要求に対し、前記情報抽出手段によって抽出された
構造化されたマルチメディア情報を前記情報送信手段で
要求元へ送信するようにしたことを特徴とする。また、
請求項8の発明のマルチメディア配信システムは、動画
像や音声などのマルチメディア情報を編集するマルチメ
ディア情報編集装置とマルチメディア情報の構造化を要
求する複数の端末とをネットワークを介して接続したマ
ルチメディア配信システムにおいて、前記マルチメディ
ア情報編集装置は、請求項1乃至請求項4のいずれか1
つに記載のマルチメディア情報編集装置であって、前記
端末からの情報を受信する情報受信手段と、前記マルチ
メディア情報編集装置によって作成された情報を送信す
る情報送信手段とを設け、前記端末からの構造化されて
いないマルチメディア情報を前記情報受信手段で受信
し、構造化したマルチメディア情報を前記情報送信手段
で要求元の前記端末へ送信するようにしたことを特徴と
する。
【0006】
【発明の実施の形態】以下に、図面を用いて本発明の実
施の形態の構成および動作を詳細に述べる。 (1)第1の実施の形態 図1は本発明に係るマルチメディア情報編集装置110
の実施の形態の一例を示す機能ブロック図である。マル
チメディア情報編集装置110は、制御手段111、音
声判別手段112、文書変換手段113、マルチメディ
ア構造化手段114、付随情報作成手段115、音声変
換手段116、情報出力手段117、記憶手段118か
ら構成される。制御手段111は、音声と動画像を含む
マルチメディア情報の入出力およびその情報に対する編
集やその編集に際して付随する情報の作成・編集等に関
し、全体的な制御を行う。音声判別手段112は、記憶
手段118に記憶されたマルチメディア情報に音声情報
が含まれるかを判別する。この判断には、たとえば、記
憶手段118のうち音の情報が記録されている部分に対
して、その音を音声情報と見なして音声認識してみる。
その認識の時に音声パターン辞書でパターン認識できな
いものは音声とは見なさず、パターン認識できるものを
音声情報を含んでいると判断する。この記憶手段118
には、予めユーザが用意した音声を含んだ動画像を、た
とえば、MPEG等の形式により記録している。文書変
換手段113は、音声判別手段112で音声情報である
と判断されると、そのマルチメディア情報中の音声部分
を既知の音声認識技術によって文書に変換する。文書化
を行った際には、音声認識を行ってパターン認識された
単語等に対しては、文書上の単語と音声情報上の単語の
最初のフレーム番号とを対応付けて記憶しておく。この
とき音声認識技術によって文書化されるが、現在の水準
では認識率が100%とはいえず、誤った内容を記述する
可能性があるから、音声認識された文書を一旦ディスプ
レイ等の表示装置上に表示し、ユーザは表示された文書
を見ながら較正、修正などの編集を行って、認識結果を
修正し、正しく変換された文書を作成する。この編集で
は、キーボードまたは既存の音声認識技術等によって入
力を行う。
【0007】マルチメディア構造化手段114は、文書
変換手段113で作成された文書を言語解析し、文書構
成をもとに文書の構造化を行う。この言語解析では、文
書中の表題、段落等の文書の区切りを単語間の間(フレ
ーム情報をもとに判断する)や接続詞等を解析すること
によって文書を構造化する。この文書の構造化した結果
は、文書中の表題、段落や文書の区切り等がわかるよう
に識別子を付加する。また、文書を構造化した結果、た
とえば、表題についてもその表題の最初の単語に関して
は、音声情報のフレーム番号が対応付けられていること
から、音声情報も自動的に構造化されたものとなる。さ
らに、音声情報は、動画像とも同期していることから当
然に構造化されたものとなっている。したがって、この
文書の構造化を終わった時点で、記憶手段118に記憶
されたマルチメディア情報が構造化されたことになる。
付随情報作成手段115は、マルチメディア構造化手段
114で作成された構造化情報をもとに、付随情報とし
て要約文やメモ情報を追加する。これらの情報は、キー
ボードまたは音声認識技術を利用して入力される。マル
チメディア構造化手段114で作成された構造化情報
は、ディスプレイ等の表示装置上に、文書の構造化で生
成された、たとえば、文章の段落のような区切り(セグ
メント)位置がわかるように表示する。この表示には、
アイコンや区切り位置の文字の色、フォント、大きさ、
装飾、点滅など、文書中の区切りを際立たせるような表
示方法を用いる。このように表示された文書に対して、
次のような種々の付随情報を付加することによってユー
ザは、後でマルチメディア情報を検索・閲覧するときの
理解の指標とすることができる。これらの付随情報は、
文書構造の対応位置に保持される。
【0008】・文書全体または各段落(セグメント)に
対する要約文 この要約文は、既知の要約文作成技術によって作成す
る。 ・文書全体または任意の場所に、メモ情報の付加 このメモは、フリー、複数の指定されたまたはユーザが
作成した入力フォーマットのいずれかを選択してメモ情
報を記入する。さらに、その他の付随情報として、動画
像の撮影者や撮影日、このマルチメディア情報の構造化
を行った編集日、データ量等の情報が付加される。その
他の付随情報は、ユーザが指定した項目や、予め項目を
まとめて分類わけして用意されたものからユーザが選択
することによって決める。音声変換手段116は、付随
情報作成手段115で作成された文章情報(要約文やメ
モ情報)を既知の音声合成技術または人手によって音声
収録を行って、音声に変換する。この音声データも文章
情報と同様に文書の構造化情報に対応付けて保持させ
る。情報出力手段117は、制御手段111、マルチメ
ディア構造化手段114または付随情報作成手段115
から呼び出され、要約文やメモ情報のリストを表示す
る。このリストは、文書中の任意の位置やセグメントに
対して作成された要約文やメモ情報を文書ファイル毎に
一覧表示する。この一覧表は、すべての要約文やメモ、
またはユーザが指定したもののみ等に対して、表示内容
をユーザによって作成された任意の書式に出力したり、
予め用意された複数の書式から選択して出力することが
できる。また、動画像や音声の構造化情報、それに対応
する文書の構造化情報を対応付けて記録された情報、お
よび、付随情報をまとめたエディタシートを出力する。
また、このエディタシートに記録される情報を付随情報
としてマルチメディア情報として保持するように構成し
てもよい。
【0009】この実施の形態のように構成することによ
り、次のような効果がある。 ・マルチメディア情報の音声情報を文書化し、それを言
語解析することにより、意味内容による構造化を自動的
に行うことができる。 ・従来、マルチメディア情報を聴覚的に捉らえて理解し
ていた意味内容が視覚的捉えられるので、内容を容易に
把握できる。 ・この構造化された文書を表示装置へ表示することによ
り、マルチメディア情報の構造が把握しやすくなる。 ・要約文やメモ情報を文章や音声情報として任意の場所
に付随情報を追加することによって、内容をさらに容易
に把握することができる。また、大量のデータの中から
所望のデータを検索しやすくすることができる。 ・マルチメディア情報の音声情報を文書化し、その文書
を構造化するときに一緒に、音声情報と同期している動
画像の方も構造化されるため、意味内容により動画像を
区切ることも容易になる。 ・マルチメディア情報の構造化情報および付随する情報
を記載したエディタシートを作成することにより、マル
チメディア情報を一元的管理することができ、これを参
照することにより内容の把握や所望の情報の検索を行う
ことができる。
【0010】(2)第2の実施の形態 図2は本発明に係るマルチメディア配信システムの構成
および運用環境を例示する機能ブロック図である。すな
わち、第2の実施の形態のマルチメディア配信システム
は、ユーザの端末100と、マルチメディア情報の管理
とユーザの管理を行うマルチメディア蓄積装置120を
ネットワーク10を介して接続している。端末100お
よびマルチメディア蓄積装置120とは、必要であれば
それぞれ複数台が接続されていてよい。このネットワー
ク10は、これらの端末100およびマルチメディア蓄
積装置120とを結合するための伝送路であって、一般
には、ケーブルで実現され、通信プロトコルにはTCP
/IPが使われる。但し、伝送路としてはケーブルだけ
ではなく、それらの間の通信プロトコルが一致するもの
であれば無線LANや放送波を使ったものであってもよ
い。このようなネットワーク環境において、音声付の動
画像のマルチメディア情報を構造化してマルチメディア
蓄積装置120へ蓄積する。次に、ユーザが端末100
から利用の初期登録を行うと、その登録内容はマルチメ
ディア蓄積装置120へ送られ、ユーザに対する課金管
理等に用いられる。初期登録を終えたユーザは、端末1
00から所望のマルチメディア情報を得るために、たと
えば、そのマルチメディア情報を表すキーワードを送信
することによって、マルチメディア蓄積装置120は検
索し、その結果を端末100は受信する。このときに、
ユーザの課金情報は、マルティメディア蓄積装置120
で管理する。ただし、社内や個人で使う場合には、上記
のようなユーザ登録や課金管理をする必要がないので省
略することができる。
【0011】この第2の実施の形態のマルチメディア蓄
積装置120は、制御手段121、情報受信手段12
2、抽出手段123、情報送信手段124、ユーザ登録
手段125、課金管理手段126、情報蓄積手段12
7、ユーザ管理手段128からなっている。制御手段1
21は、ユーザの端末100との通信結果の制御および
ユーザ管理のための課金管理やユーザーからの要求に対
応するための各機能を制御する。情報受信手段122
は、ユーザの端末100からの種々の要求を受信し、そ
の内容を制御手段121を経由して適当な処理機能を実
行させる。情報送信手段124は、各機能で処理した結
果をネットワークを介して要求元の端末100へ送信す
ると同時に課金が必要なときには課金管理手段126を
起動する。抽出手段123は、ユーザの端末100から
の検索要求を情報受信手段123を通じて受け取る。そ
の要求がキーワード検索であれば、情報蓄積手段127
の各マルチメディア情報のテキスト部分(文書、要約、
メモ、その他の付随情報のテキスト部分)をキーワード
検索する。この検索結果(マルチメディア情報の識別
子、情報名、要約、データ量、利用料金等のリスト)を
要求元へ送信し、ユーザが最終的に選択したマルチメデ
ィア情報の識別子を受け取り、情報蓄積手段127から
該当するマルティメディア情報を抽出して、情報送信手
段124を介して要求元のユーザの端末100へ送信す
る。
【0012】情報蓄積手段127は、実施の形態1のマ
ルチメディア情報編集装置110で作成されるかまたは
他の手段で構造化されたマルチメディア情報を集積する
データベースである。ここには、マルチメディア情報ご
とに次の情報が管理される。マルチメディア情報の識別
子、情報名、情報の内容(または、情報へのポインタで
あってもよい)、登録者、データ量、利用料金(無料か
有料かの区別と有料のときの金額) ユーザ登録手段125は、ユーザがこのマルチメディア
蓄積装置をはじめて使うときに、ユーザに関する課金管
理のための情報をユーザ管理手段128へ登録する。こ
の登録によってこのマルチメディア情報の利用ができる
ようになる。課金管理手段126は、ユーザからマルチ
メディア情報を検索し、その情報をユーザへ送信したと
きに、その情報ごとに課金されて、ユーザ管理記憶手段
128へ登録される。ここに登録された課金情報は、月
決めで集計しユーザに請求したり、送信する都度、払う
ようにしてもよい。ユーザ管理記憶手段128は、次の
ような情報をユーザごとに保持する。ユーザ識別子、ユ
ーザ名、ユーザに関する書誌事項(住所、電話番号
等)、登録日、課金情報(この課金情報には、マルチメ
ディア情報の識別子、利用日と利用料との3組を参照の
つど登録する)等である。第2の実施の形態のように構
成することによって、ユーザはマルチメディア蓄積装置
120へ接続する環境さえあれば、どこからでも所望す
るマルチメディア情報を入手することができる。また、
ユーザの要望に応じて検索したり、データやユーザの管
理をマルチメディア蓄積装置120が行うため、動画像
を記録するためのメモリ容量等のマシン環境を比較的心
配をせずにマルチメディアデータを扱うことができる。
【0013】(3)第3の実施の形態 図3は、本発明に係るマルチメディア配信システムの別
の実施の形態での運用環境を示す図である。すなわち、
この実施の形態のマルチメディア配信システムは、ユー
ザの端末100と、ユーザから構造化されていないマル
チメディア情報を編集するマルチメディア情報編集装置
120をネットワーク10(実施の形態2と同様の構成
で実現する)を介して接続している。端末100および
マルチメディア情報編集装置120とは、必要であれば
それぞれ複数台が接続されていてよい。マルチメディア
情報編集装置110は、第1の実施の形態と同様の機能
を持つので、その説明を省略する。ユーザは、マルチメ
ディア情報編集装置110へログイン等を行って端末1
00から接続する。接続後、ユーザは、構造化したいマ
ルチメディア情報をネットワーク10を介してへ送信
し、記憶手段118へ記憶させる。次に、ユーザは端末
100からマルチメディア情報編集装置110の各機能
を用いて、記憶手段118に記憶された情報のうち音声
情報を文書化して、それを構造化することによって、動
画像等の構造化を行う。このようにして作成された構造
化されたマルチメディア情報をユーザが端末100へ取
り込み、ログアウトすることによってマルチメディア情
報編集装置110との接続を切断する。この第3の実施
の形態のように構成することによって、ユーザはマルチ
メディア情報編集装置110へ接続する環境さえあれ
ば、どこからでも構造化されていないマルチメディア情
報を構造化することができる。また、ユーザの要望に応
じて編集するための編集ソフト等およびマシン環境を比
較的心配をせずにマルチメディアデータを扱うことがで
きる。
【0014】(4)各実施の形態の稼動するコンピュー
タの構成 図4は、端末100、マルチメディア情報編集装置11
0、マルチメディア蓄積装置120のハードウェアの構
成を示している。すなわち、入力装置1、出力装置2、
CPU(Central Processing Unit;中央処理ユニッ
ト)3、メモリ4、記憶装置5、媒体駆動装置6、ネッ
トワーク接続装置7とをバス8で接続する。入力装置1
は、キーボード、マウス、タッチパネル、スキャナ等に
より構成され、情報の入力に使用される。出力装置2
は、種々の出力情報や入力装置1からの入力された情報
などを出力させるディスプレイやプリンタ装置で構成さ
れる。CPU3は、種々のプログラムを動作させる。メ
モリ4は、プログラム自身を保持し、またそのプログラ
ムがCPU3によって実行されるときに一時的に作成さ
れる情報等を保持する。記憶装置5は、データ、プログ
ラムやプログラム実行時の一時的な情報等を保持する。
媒体駆動装置6は、プログラムやデータ等を記憶した記
録媒体を装着してそれらを読み込み、メモリ4または記
憶装置5へ格納するのに用いられる。また、直接データ
の入出力やプログラム実行するのに使ってもよい。ネッ
トワーク接続装置7は、端末100、マルチメディア情
報編集装置110および130、マルチメディア蓄積装
置120をネットワーク10へ接続するためのインタフ
ェースである。
【0015】このようなコンピュータ装置において、端
末100、マルチメディア情報編集装置110、マルチ
メディア蓄積装置120を構成する各機能をそれぞれプ
ログラム化し、予めCD−ROM等の記録媒体に書き込
んでおき、このCD−ROMを各サイトのCD−ROM
ドライブのような媒体駆動装置6を搭載したコンピュー
タに装着して、プログラムをメモリ4あるいは記憶装置
5に格納し、それらを実行することによって、本マルチ
メディア情報配信システムの機能を実現することができ
る。なお、記録媒体としては半導体媒体(たとえば、R
OM、ICメモリカード等)、光媒体(たとえば、DV
D−ROM,MO,MD,CD−R等)、磁気媒体(た
とえば、磁気テープ、フレキシブルディスク等)のいず
れであってもよい。また、本発明のマルチメディア情報
配信システムの機能を実現する各プログラムは、媒体の
形で頒布することができる。また、本発明のマルチメデ
ィア情報配信システムの機能を実現する各プログラムを
磁気ディスク等の記憶装置に格納しておき、有線又は無
線の通信ネットワークによりダウンロード等の形式で頒
布することも可能である。さらに、本発明のマルチメデ
ィア情報配信システムの機能を実現する各プログラムを
放送波によって配布することで提供するようにしてもよ
い。
【0016】
【発明の効果】以上説明したように、本発明によれば、
動画像に付加された音声を用いて、意味的にシーンを区
切るようにマルチメディア情報を構造化することによっ
て、マルチメディア情報の編集効率を向上させることが
できる。また、音声、動画像を時系列でもつマルチメデ
ィア情報の編集サービスおよびその編集された構造化さ
れたマルチメディア情報を蓄積し、その蓄積された情報
に対する検索サービスを行うことができる。
【図面の簡単な説明】
【図1】第1の実施の形態の構成と運用環境を示す機能
ブロック図である。
【図2】第2の実施の形態の構成と運用環境を示す機能
ブロック図である。
【図3】第3の実施の形態の運用環境を示す機能ブロッ
ク図である。
【図4】各実施の形態の端末、マルチメディア情報編集
装置、マルチメディア蓄積装置を実現するためのコンピ
ュータハードウェアの構成図である。
【符号の説明】
1 …… 入力装置 2 …… 出力装置 3 …… CPU 4 …… メモリ 5 …… 記憶装置 6 …… 媒体駆動装置 7 …… ネットワーク接続装置 8 …… バス 10 …… ネットワーク 100 …… 端末 110 …… マルチメディア情報編集装置 111 …… 制御手段 112 …… 音声判別手段 113 …… 文書変換手段 114 …… マルチメディア構造化手段 115 …… 付随情報作成手段 116 …… 音声変換手段 117 …… 情報出力手段 118 …… 記憶手段 120 …… マルチメディア蓄積装置 121 …… 制御手段 122 …… 情報受信手段 123 …… 抽出手段 124 …… 情報送信手段 125 …… ユーザ登録手段 126 …… 課金管理手段 127 …… 情報蓄積手段 128 …… ユーザ管理記憶手段
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06F 12/00 520 G06F 12/00 520E G10K 15/02 G10K 15/02 G10L 15/00 H04N 7/173 610A H04N 5/91 G10L 3/00 551G 5/928 H04N 5/91 N 7/173 610 C 5/92 E

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 マルチメディア情報を編集するマルチメ
    ディア情報編集装置において、音声、動画像などのマル
    チメディア情報を記憶する記憶手段と、前記記憶手段に
    記憶されたマルチメディア情報に対して音声が付加され
    ているか判別を行う音声判別手段と、前記音声判別手段
    によって音声が付加されていた場合その音声情報を文書
    情報に変換する文書変換手段と、前記文書変換手段で変
    換された文書を言語解析して、文書とマルチメディア情
    報とを構造化して、対応付けるマルチメディア構造化手
    段とを備えたことを特徴とするマルチメディア情報編集
    装置。
  2. 【請求項2】 請求項1に記載のマルチメディア情報編
    集装置において、前記文書変換手段によって変換された
    文書または前記マルチメディア構造化手段で構造化され
    た文書に対して、メモまたは要約文を作成して付加する
    付随情報作成手段を備えたことを特徴とするマルチメデ
    ィア情報編集装置。
  3. 【請求項3】 請求項2に記載のマルチメディア情報編
    集装置において、前記付随情報作成手段によって作成さ
    れたメモまたは要約文の音声データを作成して付加する
    音声変換手段を備えたことを特徴とするマルチメディア
    情報編集装置。
  4. 【請求項4】 請求項1、2または3に記載のマルチメ
    ディア情報編集装置において、前記マルチメディア構造
    手段によって作成されたマルチメディア情報と文書の対
    応付けられた構造化情報と、それに付随する情報とを出
    力する情報出力手段を備えることを特徴とするマルチメ
    ディア情報編集装置。
  5. 【請求項5】 記憶手段に記憶された音声、動画像など
    のマルチメディア情報に音声が付加されているか判別
    し、音声が付加されていた場合、その音声情報を文書情
    報に変換し、その文書情報を言語解析して、文書とマル
    チメディア情報とを構造化して、対応付けることによっ
    てマルチメディア情報を構造化することを特徴とするマ
    ルチメディア情報編集方法。
  6. 【請求項6】 コンピュータにマルチメディア情報を編
    集する機能を持たせるためのプログラムを記録したコン
    ピュータ読み取り可能な記録媒体であって、コンピュー
    タを、音声、動画像などのマルチメディア情報を記憶す
    る記憶手段と、前記記憶手段に記憶されたマルチメディ
    ア情報に対して音声が付加されているか判別を行う音声
    判別手段と、前記音声判別手段によって音声が付加され
    ていた場合その音声情報を文書情報に変換する文書変換
    手段と、前記文書変換手段で変換された文書を言語解析
    して、文書とマルチメディア情報とを構造化して、対応
    付けるマルチメディア構造化手段とを備えたマルチメデ
    ィア情報編集装置として機能させるためのプログラムを
    記録したことを特徴とする記録媒体。
  7. 【請求項7】 動画像や音声などのマルチメディア情報
    を蓄積したマルチメディア情報蓄積装置とマルチメディ
    ア情報の配信を受ける複数の端末とをネットワークを介
    して接続したマルチメディア配信システムにおいて、前
    記マルチメディア情報蓄積装置は、前記端末からのマル
    チメディア情報要求を受信する要求受信手段と、請求項
    1乃至請求項4のいずれか1つに記載のマルチメディア
    情報編集装置によって作成された構造化されたマルチメ
    ディア情報を蓄積する情報蓄積手段と、前記情報蓄積手
    段から情報を抽出する情報抽出手段と、前記情報抽出手
    段で抽出されたマルチメディア情報を送信する情報送信
    手段とを備え、前記要求受信手段で受信した端末からの
    マルチメディア情報要求に対し、前記情報抽出手段によ
    って抽出された構造化されたマルチメディア情報を前記
    情報送信手段で要求元へ送信するようにしたことを特徴
    とするマルチメディア情報配信システム。
  8. 【請求項8】 動画像や音声などのマルチメディア情報
    を編集するマルチメディア情報編集装置とマルチメディ
    ア情報の構造化を要求する複数の端末とをネットワーク
    を介して接続したマルチメディア配信システムにおい
    て、前記マルチメディア情報編集装置は、請求項1乃至
    請求項4のいずれか1つに記載のマルチメディア情報編
    集装置であって、前記端末からの情報を受信する情報受
    信手段と、前記マルチメディア情報編集装置によって作
    成された情報を送信する情報送信手段とを設け、前記端
    末からの構造化されていないマルチメディア情報を前記
    情報受信手段で受信し、構造化したマルチメディア情報
    を前記情報送信手段で要求元の前記端末へ送信するよう
    にしたことを特徴とするマルチメディア情報配信システ
    ム。
JP2000389348A 2000-12-21 2000-12-21 マルチメディア情報編集装置、その方法および記録媒体並びにマルチメディア情報配信システム Pending JP2002189728A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000389348A JP2002189728A (ja) 2000-12-21 2000-12-21 マルチメディア情報編集装置、その方法および記録媒体並びにマルチメディア情報配信システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000389348A JP2002189728A (ja) 2000-12-21 2000-12-21 マルチメディア情報編集装置、その方法および記録媒体並びにマルチメディア情報配信システム

Publications (1)

Publication Number Publication Date
JP2002189728A true JP2002189728A (ja) 2002-07-05

Family

ID=18855920

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000389348A Pending JP2002189728A (ja) 2000-12-21 2000-12-21 マルチメディア情報編集装置、その方法および記録媒体並びにマルチメディア情報配信システム

Country Status (1)

Country Link
JP (1) JP2002189728A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007511854A (ja) * 2003-05-26 2007-05-10 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 視聴覚番組コンテンツの視聴覚要約を生成するシステム及び方法
WO2008050649A1 (fr) * 2006-10-23 2008-05-02 Nec Corporation Système, procédé et programme de récapitulation de contenu
JP6382423B1 (ja) * 2017-10-05 2018-08-29 株式会社リクルートホールディングス 情報処理装置、画面出力方法及びプログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007511854A (ja) * 2003-05-26 2007-05-10 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 視聴覚番組コンテンツの視聴覚要約を生成するシステム及び方法
WO2008050649A1 (fr) * 2006-10-23 2008-05-02 Nec Corporation Système, procédé et programme de récapitulation de contenu
JP6382423B1 (ja) * 2017-10-05 2018-08-29 株式会社リクルートホールディングス 情報処理装置、画面出力方法及びプログラム
WO2019069997A1 (ja) * 2017-10-05 2019-04-11 株式会社リクルート 情報処理装置、画面出力方法及びプログラム
JP2019066785A (ja) * 2017-10-05 2019-04-25 株式会社リクルートホールディングス 情報処理装置、画面出力方法及びプログラム

Similar Documents

Publication Publication Date Title
US7324943B2 (en) Voice tagging, voice annotation, and speech recognition for portable devices with optional post processing
US7215436B2 (en) Device for generating a multimedia paper document
KR100838950B1 (ko) 이동 전화 시스템의 멀티미디어 데이터 및 관련 주석데이터의 저장 및 검색
US7979786B1 (en) Techniques for retrieving multimedia information using a paper-based interface
US8819533B2 (en) Interactive multimedia diary
US8539344B2 (en) Paper-based interface for multimedia information stored by multiple multimedia documents
US20140161356A1 (en) Multimedia message from text based images including emoticons and acronyms
US20040128308A1 (en) Scalably presenting a collection of media objects
US7743347B2 (en) Paper-based interface for specifying ranges
US20030191776A1 (en) Media object management
US20140164371A1 (en) Extraction of media portions in association with correlated input
JP3955726B2 (ja) 文書への注釈付与方法、システム及びコンピュータ読み取り可能な記録媒体
KR20080004772A (ko) 메타 데이터를 생성하는 데이터 기록 및 재생 장치 및 방법
US7889967B2 (en) Information editing and displaying device, information editing and displaying method, information editing and displaying program, recording medium, server, and information processing system
US7103842B2 (en) System, method and program for handling temporally related presentation data
JP2001092838A (ja) マルチメディア情報収集管理装置およびプログラムを格納した記憶媒体
US20130094697A1 (en) Capturing, annotating, and sharing multimedia tips
US20140161423A1 (en) Message composition of media portions in association with image content
US20140163956A1 (en) Message composition of media portions in association with correlated text
WO2021167238A1 (ko) 내용 기반 동영상 목차 자동생성 방법 및 시스템
KR20060100646A (ko) 영상물의 특정 위치를 검색하는 방법 및 영상 검색 시스템
JP2019220098A (ja) 動画編集サーバおよびプログラム
JP2002189728A (ja) マルチメディア情報編集装置、その方法および記録媒体並びにマルチメディア情報配信システム
JP2008523759A (ja) 映像メッセージを合成する方法及びシステム
CN113761113A (zh) 用于看图讲故事的用户交互方法和装置