JP2003099435A - Multimedia document preparing method, device and storage medium - Google Patents
Multimedia document preparing method, device and storage mediumInfo
- Publication number
- JP2003099435A JP2003099435A JP2001292899A JP2001292899A JP2003099435A JP 2003099435 A JP2003099435 A JP 2003099435A JP 2001292899 A JP2001292899 A JP 2001292899A JP 2001292899 A JP2001292899 A JP 2001292899A JP 2003099435 A JP2003099435 A JP 2003099435A
- Authority
- JP
- Japan
- Prior art keywords
- multimedia document
- data
- description language
- template
- audio data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
Description
【0001】[0001]
【発明の属する技術分野】本発明は、データ検索技術を
利用したマルチメディアドキュメント作成方法、装置、
およびメディアに関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a multimedia document creation method, apparatus,
And about the media.
【0002】[0002]
【従来の技術】CDなどの普及によって、音声データの
デジタル化が進んでおり、デジタル録音・再生が可能な
MDを用いた音楽編集も行われるようになった。また、
近年においては、MP3などの音声データ圧縮方式の普
及によって、高品質・高圧縮なデジタル音声データを用
いた音声データ編集が可能になった。2. Description of the Related Art With the widespread use of CDs and the like, the digitization of voice data is progressing, and music editing using an MD capable of digital recording / playback has also been performed. Also,
In recent years, the spread of audio data compression methods such as MP3 has enabled audio data editing using high-quality and highly-compressed digital audio data.
【0003】その結果、メモリーカードに音声データを
保存し、軽量な携帯音声プレイヤーで、その音声データ
を再生することなども行われている。そのような中で、
ユーザーは、自分の欲しい音声データを編集して、MD
やメモリーカードに保存し、携帯プレイヤーや、カース
テレオで再生している。As a result, it has been practiced to store voice data in a memory card and reproduce the voice data with a lightweight portable voice player. In such a situation
The user edits the voice data he wants and MD
Or save it to a memory card and play it on a mobile player or car stereo.
【0004】[0004]
【発明が解決しようとする課題】しかしながら、実際に
ユーザーが自分の欲しい音声データを編集し、MDやメ
モリーカードに保存するのには煩雑な作業が必要であ
る。なぜなら、ユーザーが所有する大量の音声データの
中から目的の音声データを検索し、それらをMDやメモ
リーカードに保存するのには、多くの労力を要するから
である。また、従来は例えば、特開2000−0785
30号公報のように、音声でメタデータをつけて動画の
好きなシーンを検出する技術や、特開2000−057
753号公報のように、大量の曲データの中からユーザ
ーの好みの曲データについてのみの再生を定義できる技
術などが存在するが、音声データ編集そのものを簡易化
する技術はなかった。However, it is troublesome for the user to actually edit the desired voice data and save it in the MD or the memory card. This is because it takes a lot of work to search for desired voice data from a large amount of voice data owned by the user and store them in the MD or the memory card. Further, conventionally, for example, Japanese Patent Laid-Open No. 2000-0785.
Japanese Patent Laid-Open No. 2000-057, a technique of adding metadata by voice to detect a favorite scene of a moving image as disclosed in Japanese Patent Laid-Open No.
As disclosed in Japanese Patent No. 753, there is a technique capable of defining reproduction of only song data desired by a user from a large amount of song data, but there is no technique for simplifying audio data editing itself.
【0005】本発明は、音声データ編集に関する上記の
問題について鑑みてなされたものであり、検索用キーワ
ードを持つテンプレートの利用によって、音声データ編
集を容易にすることを目的とする。また、音声データ検
索技術を利用して、音声データ編集を自動化し、その結
果としてマルチメディアドキュメントを作成することを
目的とする。The present invention has been made in view of the above problems relating to voice data editing, and an object thereof is to facilitate voice data editing by using a template having a search keyword. It also aims at automating audio data editing using audio data retrieval technology and, as a result, creating multimedia documents.
【0006】[0006]
【課題を解決するための手段】上記の目的を達成するた
めに、本発明の一態様による音声データ編集装置は、以
下の構成を備える。すなわち、音声データの再生記述が
行える、音声データ編集用テンプレートを用いた音声デ
ータ編集装置であり、ユーザーによって指定されたテー
マから、そのテーマに沿ったテンプレート群を選び出
す、テンプレート群選択工程と、テンプレートに設定さ
れたキーワードから、テンプレートに再生記述する音声
データを検索する、音声データ検索工程と、検索された
音声データを、テンプレートに再生記述し、その再生用
データを作成する再生用データ作成工程と、作成した再
生用データを、記録用メディアに書き込む、メディア記
録工程と、を備えることを特徴とする、音声データ編集
装置である。In order to achieve the above object, an audio data editing apparatus according to one aspect of the present invention has the following configuration. That is, a voice data editing device using a voice data editing template capable of reproducing and describing voice data, and selecting a template group according to the theme from a theme designated by a user, a template group selecting step, and a template A voice data search step of searching the voice data to be reproduced and described in the template from the keyword set in step 1, and a reproduction data creation step of reproducing and describing the searched voice data in the template and creating the reproduction data. And a media recording step of writing the created reproduction data into a recording medium, the audio data editing device.
【0007】[0007]
【発明の実施の形態】ここでは、実際にパソコンや専用
機器を用いて音声データ編集成を行う、実施形態につい
て説明する。BEST MODE FOR CARRYING OUT THE INVENTION Here, an embodiment in which voice data editing is actually performed using a personal computer or a dedicated device will be described.
【0008】図1は、実施形態における、システム構成
を示すブロック図である。図1において、データ入出力
装置100は、データの入出力を行う装置である。入力
装置101は、ユーザーからの指示や、データを入力す
る装置で、キーボードや、マウスなどのポインティング
装置を含む。蓄積装置102は、バイナリデータや、メ
タデータを蓄積する装置で、通常は、ハードディスクな
どが用いられる。表示装置103は、GUIや、画像を
表示する装置で、一般的に、CRTや、液晶ディスプレ
イなどが用いられる。FIG. 1 is a block diagram showing a system configuration in the embodiment. In FIG. 1, a data input / output device 100 is a device that inputs and outputs data. The input device 101 is a device for inputting instructions and data from a user, and includes a keyboard and a pointing device such as a mouse. The storage device 102 is a device that stores binary data and metadata, and a hard disk or the like is usually used. The display device 103 is a device that displays a GUI or an image, and a CRT, a liquid crystal display, or the like is generally used.
【0009】104は、CPUで、上述した各構成の処
理の全てに関わる。ROM105と、RAM106は、
その処理に必要なプログラム、データ、作業領域などを
CPU104に提供する。また、図4以降のフローチャ
ートの処理に必要な制御プログラムは、蓄積装置102
に格納されているか、ROM105に格納されているも
のとする。蓄積装置102に格納されている場合は、一
旦RAM106に読み込まれてから実行される。Reference numeral 104 denotes a CPU, which is involved in all the processes of the above-described components. The ROM 105 and the RAM 106 are
The CPU 104 is provided with a program, data, a work area and the like necessary for the processing. Further, the control program necessary for the processing of the flowcharts of FIG.
Or stored in the ROM 105. If it is stored in the storage device 102, it is once read into the RAM 106 and then executed.
【0010】なお、システム構成については、上記以外
にも、様々な構成要素が存在するが、本発明の主眼では
ないので、その説明は省略する。Regarding the system configuration, there are various components other than those described above, but since they are not the main subject of the present invention, the description thereof will be omitted.
【0011】音声データ編集とは、大量にある音声デー
タの中から、自分の好みの音声データを複数選び出し、
それらを好きな順に並び替えて、再生できる状態にする
こと(マルチメディアドキュメントの作成)を意味す
る。また、編集後には、記録用ディスクメディアなどに
保存される場合が多い。本発明による音声データ編集で
は、音声データ編集用のテンプレートを用意し、そのテ
ンプレートを用いて、自動的にマルチメディアドキュメ
ントを作成し、かつ、記録用メディアへの保存を行うこ
とが可能である。Voice data editing means selecting a plurality of voice data of one's liking from a large amount of voice data,
It means rearranging them in any order and making them playable (creation of multimedia documents). After editing, it is often saved in a recording disk medium or the like. In the audio data editing according to the present invention, it is possible to prepare a template for audio data editing, use the template to automatically create a multimedia document, and save it in a recording medium.
【0012】図2は、テンプレートの概要を示した図で
ある。テンプレートは主に、SMILなどのマルチメデ
ィア記述言語によって記述され、音声データの再生順
や、部分再生、などの再生用記述が行える。テンプレー
ト201は、音声データ検索用キーワード202を持っ
ている。そして、キーワードにマッチした音声データへ
のリンクを、テンプレート自身に記述できるようになっ
ている。FIG. 2 is a diagram showing an outline of the template. The template is mainly described in a multimedia description language such as SMIL, and reproduction description such as reproduction order of audio data or partial reproduction can be performed. The template 201 has a voice data search keyword 202. Then, the link to the voice data matching the keyword can be described in the template itself.
【0013】具体的には、例えば、テンプレートのキー
ワードに「朝」という単語があり、音声データのキーワ
ードにも同じ「朝」という単語があった場合、この音声
データはテンプレートと、マッチしたと判断され、その
リンク先をテンプレートに記述される。その結果、テン
プレート201は、マルチメディアドキュメント204
となる。Specifically, for example, when the template keyword includes the word "morning" and the voice data keyword also includes the same word "morning", it is determined that the voice data matches the template. The link destination is described in the template. As a result, the template 201 becomes the multimedia document 204.
Becomes
【0014】図3は、複数のテンプレートが集合して、
1つの大きなテーマを作り上げている様子を示した図で
ある。このように通常は複数のテンプレートを利用する
場合が多い。In FIG. 3, a plurality of templates are collected,
It is a figure showing how one big theme is being created. As described above, usually, a plurality of templates are often used.
【0015】(実施例1)この実施例では、パソコン上
のアプリケーションや専用機器を用いた、メタデータに
よる音声データ検索と、その音声データ編集方法およ
び、マルチメディアドキュメント作成方法について記述
する。また、音声データ編集後の記録メディアへの保存
方法についても記述する。メタデータとは、データに関
するデータの意味であり、この実施例においては、音声
データに対してのキーワードや、作曲者、歌手名などの
情報を意味する。(Embodiment 1) This embodiment describes a voice data search by metadata using an application on a personal computer or a dedicated device, a voice data editing method therefor, and a multimedia document creating method. It also describes how to save the audio data on the recording medium after editing. The term "metadata" means data relating to data, and in this embodiment, it means information such as a keyword for audio data, a composer name, and a singer name.
【0016】図4は、音声データに付加されているメタ
データの内容を示した図である。例えば本実施例では、
メタデータはXML言語で記述され、「タイトル」、
「作曲者」、「作詞者」、「歌手」、「歌詞」、「ジャ
ンル」、「キーワード」などの情報を含んでいる。もち
ろん、これよりも多くの情報を持っても構わないことは
言うまでもない。メタデータは、図4のように音声デー
タの末尾に付加される。もちろん、これ以外にも、ヘッ
ダー部分にメタデータを記入しても良いし、メタデータ
を別ファイルとして持っていても良い。FIG. 4 is a diagram showing the contents of the metadata added to the audio data. For example, in this embodiment,
The metadata is described in the XML language and includes a "title",
It includes information such as "composer", "lyricist", "singer", "lyrics", "genre", and "keyword". Of course, it goes without saying that you can have more information than this. The metadata is added to the end of the audio data as shown in FIG. Of course, other than this, metadata may be written in the header part, or the metadata may be held as a separate file.
【0017】また、図5のように、1つの音声データフ
ァイルを「前奏」、「フレーズ1」などのように分割し
て、それぞれにメタデータを持たせることも可能であ
る。このとき、音声データファイルの分割は時間単位で
行われ、それぞれのメタデータには、分割された時間が
記されている(例えば、メタデータ502では、<Ti
me>0:20〜3:11</Time>などのように
記される)。Further, as shown in FIG. 5, it is also possible to divide one audio data file into "prelude", "phrase 1", etc., and give each of them metadata. At this time, the audio data file is divided in units of time, and the divided time is described in each metadata (for example, in the metadata 502, <Ti
me> 0: 20-3: 11 </ Time> etc.).
【0018】図6は、実際に音声データ編集、およびマ
ルチメディアドキュメント作成方法を行う様子を説明し
たフローチャート図である。FIG. 6 is a flow chart for explaining how to actually perform the audio data editing and the multimedia document creating method.
【0019】S601において、ユーザーはアプリケー
ション側で用意されている複数あるテーマの内から、編
集したいテーマを選択する。S602では、選択された
テーマを基に、アプリケーション側が図1の蓄積装置1
04より、図3のようなテンプレート群を読み出す。S
603では、読み込んだテンプレート群中の一枚のテン
プレートよりキーワードを読み出し、RAM106に記
憶させる。In step S601, the user selects a theme to be edited from a plurality of themes prepared by the application. In S602, the application side sets the storage device 1 of FIG. 1 based on the selected theme.
From 04, the template group as shown in FIG. 3 is read out. S
In 603, the keyword is read from one template in the read template group and stored in the RAM 106.
【0020】S604では、蓄積装置104に保存され
ている音声データの1つを読み出し、音声データに付属
しているメタデータを読み出し、RAM106に記憶さ
せる。そして、RAM106に読み込んだテンプレート
のキーワードと、音声データのメタデータを比較する。
この際、テンプレートのキーワードと、歌詞の内容も比
較する。In step S604, one of the audio data stored in the storage device 104 is read out, the metadata attached to the audio data is read out and stored in the RAM 106. Then, the keyword of the template read in the RAM 106 is compared with the metadata of the audio data.
At this time, the keyword of the template and the content of the lyrics are also compared.
【0021】S605では、S604で比較した結果を
判断するステップで、もし、テンプレートのキーワード
と、音声データのメタデータが一致するならば、S60
6に進み、一致しないならば、S607に進む。In step S605, in the step of judging the result of comparison in step S604, if the keyword of the template and the metadata of the audio data match, step S60.
If not, the process proceeds to S607.
【0022】S606では、一致した音声データを、再
生できるように、テンプレートに再生用の記述(音声デ
ータへの参照を記述)を行う。S607では、蓄積装置
104中の全ての音声データに関して、S604の操作
を実行したかを判断するプロセスで、もし全ての音声デ
ータに関して、操作を実行したならば、S608に進
み、実行していないならば、新たな音声データを読み込
み、S604に戻る。In step S606, a description for reproduction (a reference to the sound data is described) is written in the template so that the matched sound data can be reproduced. In S607, in the process of determining whether the operation of S604 has been executed for all the audio data in the storage device 104, if the operation has been executed for all the audio data, the process proceeds to S608, and if not executed. For example, new voice data is read, and the process returns to S604.
【0023】S608は、テーマ中の全てのテンプレー
トに、音声データの組み込みが終了したかどうかを判断
するプロセスである。もし、全てのテンプレートに対し
て、音声データの組み込みが終了しているならば、全て
のテンプレートを1つにまとめ、それをマルチメディア
ドキュメントとして出力し、音声データ編集を終了す
る。もし、まだ音声データの組み込みの終了していない
テンプレートが存在するならば、S603に戻り、新た
なテンプレートを読み出す。Step S608 is a process for judging whether or not the incorporation of the audio data into all the templates in the theme has been completed. If the incorporation of the audio data has been completed for all the templates, all the templates are combined into one, which is output as a multimedia document, and the audio data editing is completed. If there is a template for which voice data has not yet been incorporated, the process returns to S603 to read a new template.
【0024】図7は、編集後のマルチメディアドキュメ
ントと、そこで参照されている音声データを、記憶メデ
ィアに保存する方法を説明したフローチャート図であ
る。FIG. 7 is a flow chart for explaining a method of saving the edited multimedia document and the audio data referred to in the edited multimedia document in a storage medium.
【0025】S701では、編集したマルチメディアド
キュメントと音声データを保存する記録メディアを選択
する。記録メディアとは、例えばMDやメモリーカード
のようなものである。メモリーカードである場合は、そ
の容量も指定する。In step S701, a recording medium for storing the edited multimedia document and audio data is selected. The recording medium is, for example, an MD or a memory card. If it is a memory card, also specify its capacity.
【0026】S702では、編集したマルチメディアド
キュメントと音声データの容量と、記録メディアの容量
とを比較して、どちらが大きいかを判断する。もし、編
集したマルチメディアドキュメントと音声データの容量
のほうが大きい場合は、S703に進む。もし、記録メ
ディアの容量のほうが大きい場合はS705に進む。S
703はマルチメディアドキュメントと音声データを、
複数の記憶メディアに分割して保存するかどうかを判断
するステップである。もし、複数に分割する場合は、S
705に進む。もし、分割せず一枚のメディアに保存す
る場合は、S704に進む。In step S702, the capacities of the edited multimedia document and audio data are compared with the capacities of the recording media to determine which is larger. If the volumes of the edited multimedia document and audio data are larger, the process proceeds to S703. If the recording medium has a larger capacity, the process proceeds to S705. S
703 is a multimedia document and audio data,
This is a step of determining whether to divide and save the data in a plurality of storage media. If you want to divide into multiple
Proceed to 705. If the data is not divided and stored in one medium, the process proceeds to S704.
【0027】S704は、記録メディアの容量を越えた
分の、音声データと、その再生用記述を削除するステッ
プである。例えば、64MBのメモリーカードに70M
Bのマルチメディアドキュメントと音声データを保存す
る場合は、差分である6MBに一番近い音声データを検
出し、その音声データと、マルチメディアドキュメント
における、その再生用記述を削除する。S705では、
マルチメディアドキュメントと音声データを記録メディ
アに書き込む。Step S704 is a step of deleting the audio data and the reproduction description thereof for the amount exceeding the capacity of the recording medium. For example, 70M on a 64MB memory card
When the multimedia document B and the voice data are stored, the voice data closest to the difference of 6 MB is detected, and the voice data and the reproduction description in the multimedia document are deleted. In S705,
Write multimedia documents and audio data to recording media.
【0028】このように、ユーザーはテーマを選択する
のみで、音声データの編集を行うことができ、MDやメ
モリーカードなどの記録用メディアへの保存も可能であ
る。もちろん、「ドライブ」のようなテーマの代わり
に、歌手名を指定して編集を行っても良い。本実施例で
は、蓄積装置より音声データを検索したが、Web上か
ら音声データを検索するような場合であっても構わな
い。また、図5のような、音声データの一部分に付加さ
れたメタデータを用いることによって、曲のワンフレー
ズのみを集めたダイジェスト版をつくることも可能であ
る。As described above, the user can edit the audio data only by selecting the theme, and can save the data in a recording medium such as an MD or a memory card. Of course, the singer name may be designated and edited instead of the theme such as "drive". In this embodiment, the voice data is retrieved from the storage device, but the voice data may be retrieved from the Web. Further, by using the metadata added to a part of the voice data as shown in FIG. 5, it is possible to create a digest version in which only one phrase of the music is collected.
【0029】(実施例2)この実施例では、記録用メデ
ィアをパソコンや、専用機器に差し込むだけで、音声デ
ータ編集を自動的に実行する方法を説明する。(Embodiment 2) In this embodiment, a method for automatically executing audio data editing by simply inserting a recording medium into a personal computer or a dedicated device will be described.
【0030】図8は、メモリーカードやMDなどのディ
スクメディアに、テンプレートを選択するためのテーマ
(「ドライブ」などの単語)が保存されている様子を示
している。もちろん、テーマのみでなく、テンプレート
そのものを保存していても良い。FIG. 8 shows a state in which a theme (word such as “drive”) for selecting a template is stored in a disk medium such as a memory card or MD. Of course, you may store not only the theme but the template itself.
【0031】図9は、実際にメモリーカードを挿入し
て、自動的に音声データ編集と、記録メディアへの保存
が行われる様子を説明したフローチャート図である。FIG. 9 is a flow chart for explaining a state in which a memory card is actually inserted and audio data is automatically edited and stored in a recording medium.
【0032】S901では、メモリーカードを図1の入
出力装置100に挿入する。S902では、メモリーカ
ードの容量を調べて、メモリーカード内のテーマを読み
込む。S903では、テーマに沿ったテンプレート群を
読み込む。S904では、実施例1と同様に、音声デー
タを検索して、テンプレートに再生用の記述を行う。S
905では作成したマルチメディアドキュメントと、そ
こで参照している音声データをメモリーカードに書き込
む。In step S901, the memory card is inserted into the input / output device 100 shown in FIG. In S902, the capacity of the memory card is checked and the theme in the memory card is read. In S903, a template group according to the theme is read. In S904, as in the first embodiment, the audio data is searched and the description for reproduction is written in the template. S
At 905, the created multimedia document and the audio data referred to therein are written in the memory card.
【0033】このように、メモリーカードをパソコンや
専用機器に差し込むのみで、マルチメディアドキュメン
トと、そこで参照している音声データを、自動的にメモ
リーカードに保存することができる。この実施例では、
メモリーカードを用いたが、もちろん、MDなどのディ
スクメディアであっても構わない。As described above, by simply inserting the memory card into the personal computer or the dedicated device, the multimedia document and the audio data referred to therein can be automatically stored in the memory card. In this example,
Although a memory card is used, it goes without saying that a disc medium such as an MD may be used.
【0034】(実施例3)この実施例では、音声データ
の検索方法として、音声認識や曲調を利用した方法につ
いて説明する。(Embodiment 3) In this embodiment, as a method for searching voice data, a method using voice recognition or music tone will be described.
【0035】図10は、音声認識を利用した音声データ
検索方法について説明したフローチャート図である。検
索方法以外の部分は実施例1と全く同様であるので、説
明を簡略化する。FIG. 10 is a flow chart for explaining a voice data search method using voice recognition. Since the parts other than the search method are exactly the same as those in the first embodiment, the description will be simplified.
【0036】S1001では、テーマを選択する。S1
002では、テーマに沿ったテンプレート群を読み込
む。S1003では、蓄積装置104内の音声データの
1つを読み込む。S1004において、読み込んだ音声
データの歌詞を音声認識し、テキスト化する。In S1001, a theme is selected. S1
In 002, a template group according to the theme is read. In S1003, one of the audio data in the storage device 104 is read. In step S1004, the lyrics of the read voice data are voice-recognized and converted into text.
【0037】S1005では、テンプレートのキーワー
ドと、音声認識した歌詞とを比較する。S1006で
は、S1005で比較した結果が一致するかどうかを判
断する。もし、一致するならば、S1007に進む。も
し、一致しないのであれば作業を終了する。S1007
では、テンプレートと一致した音声データを、テンプレ
ートに組み込み、マルチメディアドキュメントを作成す
る。In step S1005, the keyword of the template is compared with the voice-recognized lyrics. In S1006, it is determined whether the results of the comparison in S1005 match. If they match, the process proceeds to S1007. If they do not match, the work ends. S1007
Then, the audio data that matches the template is incorporated into the template to create a multimedia document.
【0038】このように、音声データを音声認識するこ
とによって、音声データを検索することが可能である。
また、音声データの曲調などから、似たような曲調の音
声データを検索することなども可能である。As described above, the voice data can be searched by recognizing the voice data.
It is also possible to search for voice data having a similar tone based on the tone of the voice data.
【0039】[0039]
【発明の効果】以上のように、本発明を用いると、テー
マ設定を行うか、記録メディアを挿入するのみで、後は
自動的に音声データ編集を行い、マルチメディアドキュ
メントを作成することが可能である。これにより、従来
煩雑であった音声データ編集作業を、容易に行うことが
でき、マルチメディアドキュメントを作成できる。As described above, according to the present invention, it is possible to create a multimedia document by automatically editing voice data after setting a theme or inserting a recording medium. Is. As a result, it is possible to easily perform the audio data editing work that has been conventionally complicated, and to create a multimedia document.
【図1】 実施形態におけるマルチメディアドキュメン
ト作成装置のシステム構成を示すブロック図である。FIG. 1 is a block diagram showing a system configuration of a multimedia document creation device according to an embodiment.
【図2】 実施形態におけるマルチメディアドキュメン
ト作成に用いるテンプレートの概略図である。FIG. 2 is a schematic diagram of a template used for creating a multimedia document in the embodiment.
【図3】 実施形態におけるマルチメディアドキュメン
ト作成に用いるテーマ(テンプレート群)の概略図であ
る。FIG. 3 is a schematic diagram of a theme (group of templates) used for creating a multimedia document in the embodiment.
【図4】 実施形態の実施例1における音声データに付
加されたメタデータを説明した図FIG. 4 is a diagram illustrating metadata added to audio data according to Example 1 of the embodiment.
【図5】 実施形態の実施例1における分割音声データ
に、メタデータが付加されている様子を説明した図FIG. 5 is a diagram illustrating that metadata is added to the divided audio data according to the first example of the embodiment.
【図6】 実施形態の実施例1における音声データ編集
について説明したフローチャート図FIG. 6 is a flowchart for explaining audio data editing in the first example of the embodiment.
【図7】 実施形態の実施例1における記録メディアへ
の保存について説明したフローチャート図FIG. 7 is a flowchart for explaining saving to a recording medium in Example 1 of the exemplary embodiment.
【図8】 実施形態の実施例2における記録メディアに
テーマが保存されている様子を示した図FIG. 8 is a diagram showing how a theme is stored in a recording medium according to Example 2 of the embodiment.
【図9】 実施形態の実施例2における音声データ編集
について説明したフローチャート図FIG. 9 is a flowchart illustrating the audio data editing in the second example of the embodiment.
【図10】 実施形態の実施例3における音声データ編
集について説明したフローチャート図FIG. 10 is a flow chart diagram explaining audio data editing in Example 3 of the embodiment.
100 データ入出力装置 101 入力装置 102 蓄積装置 103 表示装置 104 CPU 105 ROM 106 RAM 100 data input / output device 101 Input device 102 storage device 103 display device 104 CPU 105 ROM 106 RAM
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 15/00 G10L 3/00 551G G11B 27/034 G11B 27/02 K Fターム(参考) 5B058 CA23 KA04 KA08 KA11 YA16 5B075 ND14 ND16 ND36 NK02 NK04 PP13 PQ05 UU36 UU37 5B082 GA08 5D015 KK02 5D110 AA08 AA19 AA27 BB01 BB20 CA06 CA07 CB04 CB06 CC04 CJ06 DA02 DB05 DC05 DE01 EA12 ─────────────────────────────────────────────────── ─── Continuation of front page (51) Int.Cl. 7 Identification code FI theme code (reference) G10L 15/00 G10L 3/00 551G G11B 27/034 G11B 27/02 K F term (reference) 5B058 CA23 KA04 KA08 KA11 YA16 5B075 ND14 ND16 ND36 NK02 NK04 PP13 PQ05 UU36 UU37 5B082 GA08 5D015 KK02 5D110 AA08 AA19 AA27 BB01 BB20 CA06 CA07 CB04 CB06 CC04 CJ06 DA02 DB05 DC05 DE01 EA12
Claims (31)
メディアドキュメントの作成を支援するための方法にお
いて、 この方法では、曲順・再生時間などのドキュメント記述
が行えるマルチメディアドキュメント作成のための雛型
であるテンプレートと、そのテンプレートの集合である
テーマを用いる工程と、テンプレートは、音声データへ
の参照を記述することでマルチメディアドキュメントと
なる工程と、 テーマ中のテンプレートにはそれぞれ1つ以上のキーワ
ードが設定されており、システムはそのキーワードを用
いて、そのテーマに該当する音声データを検索する工程
と、 それぞれのテンプレートに、検索結果より得られた音声
データへの参照を記述し、マルチメディアドキュメント
を作成することを特徴とするマルチメディアドキュメン
ト作成方法。1. A method for supporting the creation of a multimedia document to be played back by a music player or the like, which is a template for creating a multimedia document in which document description such as song order and playback time can be described. A template and the process of using a theme, which is a set of templates, a process of becoming a multimedia document by describing a reference to audio data, and a template in a theme has one or more keywords each. It is set, and the system uses the keyword to search the audio data that corresponds to the theme, and in each template, describe the reference to the audio data obtained from the search results, and create a multimedia document. Multimedia doki characterized by creating Instrument creation method.
意されており、ユーザーはその中から任意のテーマを選
択することができることを特徴とする請求項1記載のマ
ルチメディアドキュメント作成方法。2. The multimedia document creating method according to claim 1, wherein a plurality of themes are prepared by the system, and the user can select an arbitrary theme from the plurality of themes.
もしくは未完成な形態のデータ記述言語で記述されてい
ることを特徴とする請求項1記載のマルチメディアドキ
ュメント作成方法。3. The template is a data description language,
Alternatively, the multimedia document creating method according to claim 1, wherein the method is described in an incomplete data description language.
れていることを特徴とする請求項3記載のマルチメディ
アドキュメント作成方法。4. The multimedia document creating method according to claim 3, wherein the data description language is described in XML.
されていることを特徴とする請求項3記載のマルチメデ
ィアドキュメント作成方法。5. The multimedia document creation method according to claim 3, wherein the data description language is described in SMIL.
述されていることを特徴とする請求項3記載のマルチメ
ディアドキュメント作成方法。6. The multimedia document creating method according to claim 3, wherein the data description language is described in XHTML.
されていることを特徴とする請求項3記載のマルチメデ
ィアドキュメント作成方法。7. The multimedia document creating method according to claim 3, wherein the data description language is described in HTML.
されていることを特徴とする請求項3記載のマルチメデ
ィアドキュメント作成方法。8. The multimedia document creation method according to claim 3, wherein the data description language is described in SGML.
に利用される一つ以上のキーワードが設定されているこ
とを特徴とする請求項1記載のマルチメディアドキュメ
ント作成方法。9. The multimedia document creation method according to claim 1, wherein one or more keywords to be used when searching voice data are set in the template.
にあらかじめ保存されていることを特徴とする請求項1
記載のマルチメディアドキュメント作成方法。10. The template is stored in advance in a recording medium.
How to create the described multimedia document.
かじめ保存されていることを特徴とする請求項1記載の
マルチメディアドキュメント作成方法。11. The multimedia document creating method according to claim 1, wherein the theme is stored in advance in a recording medium.
方法は、記録用メディアに保存されているテンプレート
及び、テーマを利用することによって、記録用メディア
の挿入後、全ての工程を自動的に行うことを特徴とする
請求項1記載のマルチメディアドキュメント作成方法。12. The method for creating a multimedia document according to claim 1, wherein all the steps are automatically performed after inserting the recording medium by using a template and a theme stored in the recording medium. The multimedia document creating method according to claim 1.
声データ検索にはメタデータを利用することを特徴とす
る請求項1記載のマルチメディアドキュメント作成方
法。13. The multimedia document creation method according to claim 1, wherein metadata is used for voice data search in the voice data search step.
記述されていることを特徴とする請求項13記載のマル
チメディアドキュメント作成方法。14. The multimedia document creation method according to claim 13, wherein the metadata is described in a data description language.
されていることを特徴とする請求項14記載のマルチメ
ディアドキュメント作成方法。15. The multimedia document creating method according to claim 14, wherein the data description language is described in XML.
述されていることを特徴とする請求項14記載のマルチ
メディアドキュメント作成方法。16. The multimedia document creation method according to claim 14, wherein the data description language is described in HTML.
述されていることを特徴とする請求項14記載のマルチ
メディアドキュメント作成方法。17. The multimedia document creating method according to claim 14, wherein the data description language is described in SGML.
ルの末尾に付加されていることを特徴とする請求項13
記載のマルチメディアドキュメント作成方法。18. The metadata is added to the end of the audio data file.
How to create the described multimedia document.
別のファイルで保存されていることを特徴とする請求項
13記載のマルチメディアドキュメント作成方法。19. The metadata is audio data,
14. The method of claim 13, wherein the multimedia document is stored in another file.
ダー部分に記述されることを特徴とする請求項13記載
のマルチメディアドキュメント作成方法。20. The multimedia document creation method according to claim 13, wherein the metadata is described in a header portion of audio data.
ルを時間単位で分割した、分割データにも付加されるこ
とを特徴とする請求項13記載のマルチメディアドキュ
メント作成方法。21. The multimedia document creating method according to claim 13, wherein the metadata is also added to divided data obtained by dividing an audio data file by a time unit.
声検索には音声認識を利用することを特徴とする請求項
1記載のマルチメディアドキュメント作成方法。22. The multimedia document creating method according to claim 1, wherein voice recognition is used for voice retrieval in the voice data retrieval step.
工程における再生用音声データは、音声データであるこ
とを特徴とする請求項1記載のマルチメディアドキュメ
ント作成方法。23. The multimedia document creating method according to claim 1, wherein the reproduction audio data in the multimedia document output step is audio data.
工程における再生用音声データは、データ記述言語で記
述されていることを特徴とする請求項1記載のマルチメ
ディアドキュメント作成方法。24. The multimedia document creating method according to claim 1, wherein the reproduction audio data in the multimedia document output step is described in a data description language.
されていることを特徴とする請求項23記載のマルチメ
ディアドキュメント作成方法。25. The multimedia document creation method according to claim 23, wherein the data description language is described in XML.
述されていることを特徴とする請求項23記載のマルチ
メディアドキュメント作成方法。26. The multimedia document creating method according to claim 23, wherein the data description language is described in SMIL.
記述されていることを特徴とする請求項23記載のマル
チメディアドキュメント作成方法。27. The multimedia document creation method according to claim 23, wherein the data description language is described in XHTML.
述されていることを特徴とする請求項23記載のマルチ
メディアドキュメント作成方法。28. The multimedia document creating method according to claim 23, wherein the data description language is described in HTML.
述されていることを特徴とする請求項23記載のマルチ
メディアドキュメント作成方法。29. The multimedia document creation method according to claim 23, wherein the data description language is described in SGML.
載のマルチメディアドキュメント作成方法を利用したこ
とを特徴とする装置。30. An apparatus using the method for creating a multimedia document according to any one of claims 1 to 29.
載のマルチメディアドキュメント作成方法を利用したこ
とを特徴とする記憶媒体。31. A storage medium using the multimedia document creation method according to claim 1. Description:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001292899A JP2003099435A (en) | 2001-09-26 | 2001-09-26 | Multimedia document preparing method, device and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001292899A JP2003099435A (en) | 2001-09-26 | 2001-09-26 | Multimedia document preparing method, device and storage medium |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2003099435A true JP2003099435A (en) | 2003-04-04 |
Family
ID=19114781
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001292899A Pending JP2003099435A (en) | 2001-09-26 | 2001-09-26 | Multimedia document preparing method, device and storage medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2003099435A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102004045111A1 (en) * | 2004-09-17 | 2006-04-06 | Daimlerchrysler Ag | Method for the selective saving and retrieval of list elements in a speech dialogue system |
-
2001
- 2001-09-26 JP JP2001292899A patent/JP2003099435A/en active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102004045111A1 (en) * | 2004-09-17 | 2006-04-06 | Daimlerchrysler Ag | Method for the selective saving and retrieval of list elements in a speech dialogue system |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH06110945A (en) | Music data base preparing device and retrieving device for the same | |
US20050216257A1 (en) | Sound information reproducing apparatus and method of preparing keywords of music data | |
US20040010415A1 (en) | Apparatus and method for searching digital audio data file from media where digital audio data files are recorded | |
JP2003330777A (en) | Data file reproduction device, recording medium, data file recording device, data file recording program | |
US6573444B1 (en) | Music data compression apparatus and method | |
US20030147628A1 (en) | Apparatus and method for recording digital audio data file | |
JP2005044391A (en) | Audio recording and reproducing apparatus using play list and play list creation method | |
JP2004246936A (en) | Audio playback unit | |
KR100925875B1 (en) | Recording/reproduction device and recording/reproduction method | |
JP2003099435A (en) | Multimedia document preparing method, device and storage medium | |
KR100408128B1 (en) | Apparatus and method for searching digital audio data file from media where digital audio data files are recorded | |
JP4244011B2 (en) | Data reproduction apparatus and reproduction data management method in data reproduction apparatus | |
JP2004227285A (en) | Audio reproduction device | |
JP2009042265A (en) | Digital audio player and selection method for karaoke musical piece | |
KR100401228B1 (en) | Apparatus and method for recording digital audio data file | |
JP2004241095A (en) | Audio playback unit | |
JP4587014B2 (en) | Audio playback system | |
JPH08306124A (en) | Automatic identification device of storage medium, method and device for automatic identification of music cd and method and device for reproducing storage medium | |
JP4004932B2 (en) | Music playback apparatus and system | |
JPH11296543A (en) | Retrieval method, retrieval device and record medium | |
JP4004971B2 (en) | Audio playback device | |
JP2009204872A (en) | Creation system of dictionary for speech recognition | |
JP2002041527A (en) | Method and device for music information management | |
JP4252525B2 (en) | Music player | |
JP2001052004A (en) | Method and device for music data retrieval |