JP2007087267A

JP2007087267A - 音声ファイル生成装置、音声ファイル生成方法およびプログラム

Info

Publication number: JP2007087267A
Application number: JP2005277639A
Authority: JP
Inventors: Masahiro Watanabe; 昌洋渡辺; Aya Okano; 紋岡野; Daisuke Asai; 大介朝井; Yoko Asano; 陽子浅野
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2005-09-26
Filing date: 2005-09-26
Publication date: 2007-04-05

Abstract

【課題】複雑な構造をしているブログの記事等を音声化する際に、説明音声を聞くことができ、ブログの記事等を音声で聞いたときに、その記事等の判別やその記事の属性を、容易に知ることができる音声ファイル生成装置、音声ファイル生成方法およびプログラムを提供することを目的とする。

【解決手段】音声として聞きたいデータである再生対象データを説明するデータである説明データを生成し、上記再生対象データと上記説明データとを互いに連続した順番で再生する音声ファイル生成装置である。

【選択図】図１

Description

本発明は、ウェブコンテンツをはじめとする文字による情報や、音声による情報に対して、その情報の構造を示すデータを解釈し、説明文を生成し、音声ファイルを生成する音声ファイル生成装置に関する。

情報機器の発達に従って、ディジタルデータは、コンピュータ以外の機器において、様々な場所で使われている。アナログデータを使っている機器も、ディジタル化が進んでいる。たとえば、音楽を記録再生する場合、以前はアナログデータを使ったレコードが使用され、近年は、ディジタルデータを使ったコンパクトディスク（ＣＤ）が開発され、普及している。

ディジタルデータを使い、各曲がディジタル化されているＣＤでは、アナログデータを使っているレコードと比較すると、いくつかの利点がある。音質の高品質化という点以外にも、少なくとも１曲を飛ばし易い点や、ランダムに選曲できる点等、アナログのレコードでは実現し難い機能を、ディジタル化されているＣＤでは、実現することができる。

一方、音楽等の音声ディジタルデータを、ＰＣでも扱うことができ、録音した音を、ｍｐ３やｗａｖ等の形式を使った音声ファイルに変換することができ、これによって、さらに簡単に扱うことができる。

これらの音声ファイルを、携帯型のＣＤやハードディスクに保存し、携帯型のハードディスクプレーヤ等の再生装置を使い、屋外で音声ファイルを再生して聞くことが普通になった。さらに、音声合成技術を使えば、テキストファイルを音声ファイルに変換することができる（たとえば、特許文献１、特許文献２参照）。

ところで、インターネットの普及によって、テレビやラジオ等の放送以外でも、様々な情報を得ることができる。インターネットの利用方法のうちの１つに、ウェブコンテンツの閲覧がある。様々なユーザが、ウェブコンテンツを介して、情報を得ている。ウェブコンテンツを表示する装置がブラウザである。全盲のユーザは、ウェブコンテンツ中のテキストデータを、合成音声に変換し、読み上げる音声ブラウザを使用している。音声ブラウザを使えば、ウェブコンテンツを音声で聞くことができる。

音声ブラウザは、全盲のユーザだけでなく、晴眼のユーザにとっても、情報を得るためには、有効な手段である。さらに、ウェブコンテンツを音声に変換し、ＣＤに記録し、音楽のように携帯型の再生装置で聞くことも便利であると考えられる。
特許第２７６１５５２号公報特許第３３４４４８７号公報

ウェブコンテンツは、一般に構造が複雑であり、それらを音声化して聞いたときに、理解し難い。特に、最近普及してきたブログコンテンツは、構造が複雑である。上記「ブログ」は、フォーマットの決まったウェブコンテンツであり、日記のウェブページの作成等に使われている。

従来、あまり技術のないウェブコンテンツ製作者にとって、ウェブページを製作することは難しく、自分の持っている情報を発信したくても、製作が大変であるという欠点がある。

しかし、最近では、ブログサービスが普及し、自分の情報を簡単に発信することができる。上記「ブログサービス」は、サービスの運営元のウェブサイト（以下、単に、「ブログサイト」という）上で、本文と写真等とを登録するだけで、ＨＴＭＬの知識がなくても、所定の決められたフォーマットに従って、ブログサイト上にウェブページを作成することができるサービスである。

図２４は、一般的なブログページを示す図である。

ブログサイト内のウェブページ（以下、単に「ブログページ」という）は、図２４に示すように、ナビゲーションのための様々なメニュー、たとえば、カレンダー、最近の記事へのリンク、記事とそれに対するコメント等によって構成されている。

このようなブログサイトでは、情報が構造化されている。たとえば、１つのブログサイトには、一般にはブログのタイトルと複数の記事とが含まれている。記事には、記事のタイトルと記事の本文とが含まれている。

このブログの記事を、音声合成技術を使って音声ファイルに変換すると、音声ファイルが生成される。しかし、音声合成してできた音声ファイルについての構造を表わす情報が失われるという問題がある。

すなわち、ブログの記事部分だけを音声ファイルに変換し、その音声ファイルを再生して聞いただけでは、それがどのブログの記事であるのか、作者は誰なのか等という情報（、その元のテキスト文書の情報）が分からなくなるという問題がある。特に、合成音声では、声の種類が数種類に限られているので、楽曲と異なり、音声を聞いただけでは、誰のブログであるかということが分かり難いという問題がある。

また、楽曲である場合、曲名、アーティスト名、作曲者名等、様々な属性を、楽曲ファイルとともに保存することができる。このような複雑な構造を、視覚的に表示する方法が知られている。

つまり、音声ファイルについて考えると、ＣＤやＭＤ、ハードディスクでも、曲名やアーティスト名をディスプレイに表示する。

ブログの構造で、記事と作者等との対応を取るためには、その記事の説明（作者等）を視覚的に表示し、目で見て参照する方法が考えられる。

しかし、音だけで情報を得るユーザ（すなわち、視覚障害者等、音声しか情報を得られないユーザ）にとっては、音声ファイルの説明を視覚的に参照することはできない。さらに、晴眼者であっても、自動車を運転しながら音声ファイルを再生して聞いているユーザを考えると、音声ファイルの説明を表示する方法には大きな問題がある。

本発明は、複雑な構造をしているブログの記事等を音声化する際に、説明音声を聞くことができ、ブログの記事等を音声で聞いたときに、その記事等の判別やその記事の属性を、容易に知ることができる音声ファイル生成装置、音声ファイル生成方法およびプログラムを提供することを目的とする。

また、本発明は、楽曲についての説明を音声で付加し、その説明を音声で伝えることができ、ディスプレイなしの再生装置を実現することができる音声ファイル生成装置、音声ファイル生成方法およびプログラムを提供することを目的とする。

本発明は、音声として聞きたいデータである再生対象データを説明するデータである説明データを生成し、上記再生対象データと上記説明データとを互いに連続した順番で再生する音声ファイル生成装置である。

本発明によれば、複雑な構造をしているブログの記事等を音声化する際に、説明音声を聞くことができるので、その説明音声で聞いたときにも、上記記事等を容易に判別することができ、また、その記事の属性を容易に知ることができるという効果を奏する。

発明を実施するための最良の形態は、以下の実施例である。

図１は、本発明の実施例１である音声ファイル生成装置１００を示す図である。

音声ファイル生成装置１００は、情報入力部１１と、情報出力部１２と、情報受信部１３と、情報解析部１４と、制御部１５と、情報蓄積部１６と、情報生成部１７と、音声ファイル記録部１９とを有する。

情報入力部１１は、ユーザが所定情報を入力する手段である。

情報出力部１２は、エラーメッセージ等を出力するモニタ、スピーカである。

情報受信部１３は、ネットワークＮＷを介して、ウェブサーバＷＳから、ＨＴＭＬ文書やＲＳＳフィード等、ブログに関する情報を受信する。

情報解析部１４は、受信したブログの情報を解析する。

制御部１５を含む音声ファイル生成装置１００の全体は、上記所定のデータの属性を説明する属性説明データを読み出し、記憶装置に記憶する属性説明データ読み出し手段の例であり、また、上記属性説明データに基づいて、説明部分のテキストデータを生成し、記憶装置に記憶する手段の例であり、さらに、上記説明部分のテキストデータを音声合成し、説明用音声ファイルを生成し、記憶装置に記憶する手段の例であり、また、上記所定のデータを示す音声ファイルと、上記説明用音声ファイルとが、隣り合った順番で再生されるように、上記音声ファイルを説明する上記説明用音声ファイルと、上記所定のデータを示す音声ファイルとを出力する出力制御手段の例である。

情報蓄積部１６は、同じブログ運営者のブログサイトの複数のＨＴＭＬ文書を比較し、共通の部分を、テンプレートとして蓄積し、また、説明文の雛型を蓄積する。

情報生成部１７は、説明文を生成する。

音声ファイル記録部１９は、音声ファイルを記録する。

実施例１を、パーソナルコンピュータ（ＰＣ）で実現する場合、情報入力部１１は、キーボード、マウス等の入力装置に対応し、情報出力部１２は、モニタやスピーカに対応し、情報受信部１３、情報解析部１４、制御部１５、情報蓄積部１６、情報生成部１７、音声ファイル記録部１９は、ＰＣ本体に対応している。

音声ファイル生成装置１００は、ネットワークＮＷを介して、ウェブサーバＷＳと通信し、ウェブコンテンツを受信する。ＣＤ等の取り外し可能なメディアに記録する際には、音声ファイル記録部１９は、ＣＤである。または、ＰＣ内のハードディスクに記録する際には、音声ファイル記録部１９は、ＰＣ内のハードディスクである。または、持ち運び可能なハードディスクプレーヤであってもよい。

実施例１は、説明部分のテキストデータ（再生対象データを説明する説明データ）を生成し、音声合成技術によって音声ファイル化し、この音声ファイルを、上記再生対象データと同一のファイルとし、上記再生対象データと上記音声ファイルとを互いに連続した順番で再生するように保存する実施例である。

ここでは、複雑なウェブコンテンツを代表するものとして、ブログの記事を扱い、このブログの記事を音声ファイル化する方法について説明する。この場合、ブログにおける記事本文、コメント、トラックバックが１つの記事であるとし、同一音声ファイルとして生成する。

なお、上記「トラックバック」は、記事の投稿者であるユーザ１以外のユーザが作ったブログの記事を閲覧できるようにリンクする設定である。

まず、ブログの情報構造について説明する。

ブログの記事は、情報発信したいユーザが文章を書き、時には写真を添えて投稿した記事である。投稿された文章と写真とは、ＨＴＭＬの雛型を適用し、自動的にウェブページになる。ブログページは、図２４に示すように、ブログタイトル、ブログサブタイトル、ユーザ名、記事タイトル、カテゴリ、投稿日時、記事本文、写真等によって構成されている。

記事本文に対して、投稿ユーザ以外のユーザからコメント、トラックバックがあれば、図２４に示すブログページと同じブログページに掲載される（図示せず）。

一般に、ブログには、ユーザ１が書いた記事１本文を読んだ他のユーザが、上記記事１本文にコメント投稿できる仕組みが実装されている。

図２は、ブログ全体の構造を示す図である。

図２において、ユーザ１のブログ１は、ブログ種類１に属している。上記「ブログ種類」は、たとえば、ｇｏｏブログ等、どのブログサービスであるかを示すものである。

同じブログ種類には、複数のユーザが登録されている。各ユーザは、少なくとも１つのブログを公開している。図２に示す例では、ユーザ１は、ブログ１のみを公開しているが、複数公開することも可能である。

ブログ１は、カテゴリ１とカテゴリ２とに分けられている。記事の内容に基づいて、記事を複数のカテゴリに分けることによって、他のユーザが好きな記事を選択することが容易であるようにしている。

カテゴリ１の中には、記事１と記事２とが存在する。これら２つの記事は、同じカテゴリ１の中にあるので、同じような話題である。記事１は、記事１本文と記事１コメント１、記事１コメント２、記事１トラックバック１によって構成されている。

ここで、「記事本文」は、文章と写真等からなり、ユーザが投稿した内容である。コメントやトラックバックは、特定の記事に対するものであるので、記事の一部であると考え、図２４に示す構造になる。

図２４に示す例では、記事１本文に対して、コメントとトラックバックとは、１つづつであるが、０件であることもあり、また、多数であることもある。このように、ブログは、非常に複雑な階層構造によって構成されている。

ユーザが投稿する単位は、ブログの記事本文単位である。このために、ブログの記事本文毎に、異なる話題が書かれ、投稿日時が、記事本文毎に異なる。

図２に示すブログの記事１に着目して整理すると、ブログ種類、ブログタイトル、ユーザ名、カテゴリ名、投稿日時等、様々な属性を持っている。これらの属性は、記事を説明するデータであるので、「メタデータ」とも呼ばれる。

実施例１では、これらのメタデータの情報を説明する説明音声ファイルを生成する。なお、実施例１では、図２に示すように、記事１は、記事１本文、記事１に対するコメント１（記事１コメント１）、記事１に対するコメント２（記事１コメント２）、記事１に対するトラックバック１（記事１トラックバック１）によって構成されている。つまり、記事本文、コメント、トラックバックを合わせたものが、記事である。したがって、記事本文を音声化する際、記事の本文、コメント、トラックバックをまとめて、１つの文章とした後に、音声化する。

次に、説明音声ファイルを生成する過程について説明する。

図３は、実施例１において、説明音声ファイルを生成する過程を示すフローチャートである。

まず、ウェブサーバＷＳから、ネットワークＮＷを介して、ＨＴＭＬ文書やＲＳＳフィード等、ブログに関する情報を情報受信部１３が受信する（Ｓ１）。受信したブログの情報を、情報解析部１４が解析する（Ｓ２）。

図４は、受信したＲＳＳフィードの例を示す図である。

上記「ＲＳＳフィード」は、記事のタイトルや更新日時等が記述されているデータである。なお、「ＲＳＳ」は、Rich Site Summaryの略である。

データからＨＴＭＬ文書を自動的に生成し、ブログを作るので、そのブログの構造を解析することができる。同じブログ運営者の生成するブログサイトは、自動的に生成されるので、基本的な構造が共通である。したがって、同じブログ運営者のブログサイトの複数のＨＴＭＬ文書を比較し、共通の部分を、テンプレートとして、情報蓄積部１６に記録する。共通でない部分が、データ部分である。これらのデータが、記事タイトルであるのか、記事本文であるのか等を、予めテンプレートし、情報蓄積部１６に記録すれば、ＨＴＭＬ文書が何を表わしているかが分かる。

図５は、情報受信部１３が受信したＨＴＭＬ文書の例を示す図である。

たとえば、受信したブログが、図５に示すＨＴＭＬ文書であるとする。予め、その構造を情報蓄積部１６に記録し、この記録されているデータに基づいて、受信したブログを情報解析部１４が解析する。

図６は、情報解析部１４が解析した結果例を示す図である。

つまり、図６に示す「タグ等付加データ（セパレータ）」を、情報蓄積部１６に予め記録し、情報解析部１４が解析する。

また、ブログに関するデータは、ＲＳＳのデータであるＲＳＳフィードで提供されることがあり、ＲＳＳフィードでは、さらに解析が容易である。

「ＲＳＳフィード」は、上記のように、記事のタイトルや更新日時等が記述されているデータであるので、どこが記事タイトルであるのか等を、容易に判断することができる。たとえば、各ユーザのブログを示すＲＳＳフィードが提供されている。このＲＳＳフィードには、ブログのタイトル、サブタイトル、各記事のＵＲＬを示すｃｈａｎｎｅｌ要素１つと、各記事のタイトルや要約等を示す記事の個数分のｉｔｅｍを示す図である。

ｔｉｔｌｅタグに、記事のタイトル、ｌｉｎｋタグに、記事の本文のあるＵＲＬ、ｄｅｓｃｒｉｐｔｉｏｎタグに、記事の要約、ｄｃ：ｓｕｂｊｅｃｔタグに、カテゴリ、ｄｃ：ｃｒｅａｔｏｒタグに、ユーザ名、ｄｃ：ｄａｔｅタグに、投稿日時が書かれている。

したがって、受信したブログのＲＳＳフィードを解析すれば、記事のメタデータを容易に取得することができる。

図５に示すブログのデータを解析した結果である図６に示す要素番号２がブログタイトルであり、要素番号３が記事タイトルであり、要素番号４が投稿日時であり、要素番号７〜１０が記事本文である。

図７は、情報解析部１４が解析した結果の例を示す図である。

図７に示すデータを、情報蓄積部１６に記録する。

次に、予め記録しておいた説明文の雛型を、情報蓄積部１６から読み出す（Ｓ３）。

図８は、情報蓄積部１６が蓄積されている説明文の雛形の例を示す図である。

この説明文の雛形は、「次の記事は、（Ａ）の、（Ｂ）さんのブログで、ブログのタイトルは（Ｃ）です。（Ｅ）に投稿されたカテゴリ（Ｄ）の（Ｆ）という記事です。」である。

図９は、情報蓄積部１６に蓄積されている説明文の雛形の例を示す図である。

または、図９に示すように、「次にお聞きいただく記事は（Ｅ）に投稿された（Ｂ）さんの（Ｆ）という記事です。」という情報の一部を使って、説明文を構成するようにしてもよい。

続いて、情報生成部１７が、説明文を生成する（Ｓ４）。図８に示す説明文の（Ａ）〜（Ｆ）に、図７に示すデータを挿入すれば、『次にお聞き頂く記事は、「ｇｏｏブログ」の、「ユーザ１」さんのブログで、ブログのタイトルは「ブログ日記」です。「２００５年７月１日１３時２０分」に投稿されたカテゴリ「Ｗｅｂｌｏｇ」の「ある夏の日」という記事です。』という説明文を生成することができる。

そして、上記生成された説明文を、情報蓄積部１６に記録する（Ｓ５）。

図１０は、記事本文の直後に再生されるべき説明文の雛形であり、情報蓄積部１６に蓄積されている説明文の雛形の例を示す図である。

これらの説明文と記事本文とを音声化し、この音声化された説明文と記事本文とを連続して再生することによって、音声を聞いただけで、記事を理解することができる。

次に、ユーザ１が、複数の記事を投稿した場合について考える。

図２に示す例では、記事は、記事１、記事２、記事３の３つがある。記事本文１に対する説明文である説明文１、記事本文２に対する説明文である説明文２、記事本文３に対する説明文である説明文３を考えると、それぞれの記事本文が対応する説明文と連続して再生されなければ、記事本文の意味を理解することができない。

ここで、説明文は、記事本文の直前に再生されるべき説明文であるとして説明する。たとえば、「説明文２、記事本文１、説明文３、記事本文２、説明文１、記事本文３」の順に再生すると、説明文２が、記事本文１の説明であるとして聞こえるので、内容を誤解する。

聞いた人が内容を誤解せずに理解するためには、記事本文とこの記事本文に対応する説明文とが連続して聞こえるようにする必要があり、このためには、記事本文とこの記事本文に対応する説明文とを、同じ音声ファイルとして音声ファイル化すればよい。

このように、記事本文とこの記事本文に対応する説明文とを同じ音声ファイルとして音声ファイル化するためには、説明文１、記事本文１、説明文２、記事本文２、説明文３、記事本文３の順で、情報蓄積部１６から読み出す（Ｓ６）。そして、「説明文１、記事本文１、説明文２、記事本文２、説明文３、記事本文３」を、この順番で再生されるように記録することを決定する（Ｓ７）。

そして、音声ファイルの記録条件を決定する（Ｓ８）。この場合、説明文１、記事本文１、説明文２、記事本文２、説明文３、記事本文３の順番で記録することを決める。

次に,説明文と記事本文とを１つの文章として、情報生成部１７が、音声化対象文を生成する（Ｓ９）。

そして、音声ファイル生成部１８が、音声化対象文を音声合成し、この合成音声を音声ファイル化し（Ｓ１０）、音声ファイル記録部１９に記録する（Ｓ１１）。記録媒体として、ＣＤかハードディスクかを選択する場合、情報入力部１１を介して、ユーザが記録媒体の種類を入力することによって、記録媒体を選択すればよい。または、ＰＣ内のハードディスクに蓄積した後に、ＣＤやハードディスクプレーヤに、コピーまたは移動するようにしてもよい。

本発明の実施例２は、説明部分のテキストデータ（説明文）を生成し、音声合成技術によって音声ファイル化し、この説明文の音声ファイルを、再生対象データとは別ファイルとして、保存する実施例である。

ここで、複雑なウェブコンテンツを代表するものとして、ブログの記事を採用し、このブログの記事を、音声ファイル化する方法について説明する。記事本文、コメント、トラックバックを、別々の音声ファイルとして生成する方法について説明する。

次に、実施例２において、説明音声ファイルを生成する過程について説明する。

図１１は、実施例２において、説明音声ファイルを生成する過程を示すフローチャートである。

まず、ウェブサーバから、ネットワークを介して、ＨＴＭＬ文書やＲＳＳフィード等のブログに関する情報を、情報受信部１３が受信する（Ｓ２１）。受信したブログの情報を、情報解析部１４が解析する（Ｓ２２）。

図１２は、情報受信部１３が解析した結果を示す図であり、記事本文と、記事本文に対するコメントと、トラックバックとを示す図である。

図１２において、Ａ〜Ｆの欄は、記事１の属性を示す欄である。コメント、トラックバックも、記事１に対するものであるので、これらの欄は、同一の記事についての属性である。投稿日時（Ｅ）は、記事本文、コメント、トラックバックが投稿された日時を示す欄である。

種類（Ｉ）は、その文章が記事本文であるのか、コメントであるのか、トラックバックであるのかを示す欄である。タイトル（Ｆ）は、種類が記事本文であれば、記事本文のタイトルを示し、種類がコメントであれば、コメントのタイトルを示し、種類がトラックバックであれば、トラックバック先の記事のタイトルを示す欄である。

投稿者（Ｈ）は、それらの記事本文、コメント、トラックバックの投稿者を示す欄である。ユーザ１が投稿した記事本文に対して、ユーザ２、ユーザ３がコメントを投稿し、ユーザ４がトラックバックを設定したことが示されている。

本文（Ｇ）は、種類が記事本文であれば、記事の本文を示し、種類がコメントであれば、コメントの本文を示し、種類がトラックバックであれば、トラックバック先の記事の本文を示す欄である。

実施例２では、記事本文、コメント、トラックバックを、互いに異なる音声ファイルであるとするために、説明文を、それぞれ生成する必要がある。

図１３は、情報蓄積部１６に蓄積されている説明文の雛形の例を示す図である。

したがって、説明文の雛形を、図１３に示すように、３種類用意する必要がある。これらを、図１２に示す種類（Ｉ）に応じて、使い分ける必要がある。

そこで、解析データを１行読み出し、種類（Ｉ）が記事本文であるかどうかを判別する（Ｓ２３）。記事本文であれば、Ｓ２６に進み、記事本文用の説明文の雛形を、情報蓄積部１６から読み出す（Ｓ２６）。記事本文でなければ、Ｓ２４に進む。

Ｓ２４では、種類（Ｉ）がコメントであるかどうかを判別する（Ｓ２４）。コメントであれば、Ｓ２７に進み、コメント用の説明文の雛形を、情報蓄積部１６から読み出す（Ｓ２７）。コメントでなければ、Ｓ２５に進む。

Ｓ２５では、種類（Ｉ）が、トラックバックであるかどうかを判別する（Ｓ２５）。トラックバックであれば、Ｓ２８に進み、トラックバック用の説明文の雛形を、情報蓄積部１６から読み出す。トラックバックでなければ、Ｓ２９に進む。

Ｓ２９では、種類（Ｉ）が記事本文、コメント、トラックバックのいずれでもないので、「解析結果に誤りがあります」等というエラーメッセージを、情報出力部１２に表示し、処理を終了する（Ｓ２９）。

続いて、情報生成部１７が、説明文を生成する（Ｓ３０）。

図１３に示す説明文の雛形に、図１２に示すデータを挿入すれば、説明文を生成することができる。そして、この生成された説明文を情報蓄積部１６に記録する（Ｓ３１）。

図１３に示す説明文の雛形は、記事本文の直前に再生されるべき説明文の雛形であり、本実施例２は、記事本文の直前に再生されるべき説明文を生成する実施例であるが、図１０に示すように、記事本文の直後に、再生されるべき説明文の雛形を用いてもよい。

以下では、図１２のデータにおいて、２行目の記事本文に対する説明文を、「説明文１」と呼び、３行目のコメントを、「コメント１」と呼び、コメント１に対する説明文を、「説明文２」、４行目のコメントを「コメント２」と呼び、コメント２に対する説明文を「説明文３」と呼び、５行目のトラックバックに対する説明文を、「説明文４」と呼ぶ。

まず、説明文、記事本文、コメント、トラックバックを再生する順番を決定する（Ｓ３２）。

この再生順番を決定する場合、図１２に示す解析結果の順番で決定すると分かり易い。

図１４は、情報蓄積部１６に蓄積されている再生順番データの例を示す図である。

説明文は、記事本文の直前に再生される説明文であるので、この記事本文の直前に挿入すると、図１４に示す順番になる。図１４に示す順番で再生できるように、音声ファイルを記録すればよい。

そして、図１４に示すよう順番で再生されるように、記録の条件を決定する（Ｓ３３）。たとえば、ＣＤに記録する場合、ＣＤでは、記録された順番に再生される。つまり、ＣＤにおいて、再生の順番は、記録された順番である。そこで、図１４に示す順番で、ＣＤに記録すればよい。

また、ハードディスクに記録する場合を考える。ハードディスクに記録されている内容を、図１４に示す順番で再生する場合、まず、時間順に再生することが考えられる。この場合、ＣＤと同様に、図１４に示す順番でハードディスクに記録すればよい。

また、ファイル名の順番で再生することも考えられる。この場合、ファイル名をアルファベット順や五十音順等で、図１４に示す順番になるように、ファイル名をつける。ファイル名で並び替える場合、ファイル名の数字、アルファベット、ひらがなの五十音順、漢字のコード順等が考えられる。

たとえば、記録した時間をファイル名として使用することが考えられる。ファイル名を数字で表し、数字の順番に並べることであり、再生順序を制御する。図１４に示す１行目の説明文１が、２００５年７月２４日１３時２０分３２秒に記録されたと、２００５０７２４１３２０３２．ｍｐ３等というファイル名になる。２行目の記事本文が、その１０秒後に記録されると、２００５０７２４１３２０４２．ｍｐ３等というファイル名になり、ファイル名の順番に再生すれば、図１４に示す順番に再生することができる。

図１５は、情報蓄積部１６に蓄積されている再生順番データの例を示す図である。

または、ファイル名として、先頭に数字を付加し、「０１ある夏の日の説明文．ｍｐ３」等としてもよい。または、ファイル名として、図１５に示すように、「ある夏の日の説明文．ｍｐ３」等とし、メタデータに順番をつけるようにしてもよい。

または、ファイル名として、図１５に示すように、「ある夏の日の説明文．ｍｐ３」等とし、メタデータに順番をつけるようにしてもよい。

一般に、ＣＤに記録されているコンテンツをハードディスクに記録し、ＣＤと同じ曲順で再生するためには、メタデータにその順番を記録する。または、ファイル名等で、並び替えができるようにしておく必要がある。図１５に示すように、説明文を含めて再生の順番をつけ、メタデータにその順番を記録しておけばよい。

また、ｍｐ３形式等のファイルは、そのファイルの示す楽曲のデータ（つまり、メタデータ）を格納することができる。

図１６は、情報蓄積部１６に蓄積されている楽曲データのメタデータの例を示す図である。

図１６に示すように、楽曲データにおけるメタデータの種類は、楽曲に特化したものであり、つまり、アーティスト名、ジャンル、アルバム名、作曲者名、トラック番号等である。このうちで、「トラック番号」は、同じアルバム内の曲について順番に与えられ、再生の順番を決めるものである。

したがって、音声ファイルのメタデータのトラック番号を、図１４に示す順に与えるようにしてもよい。また、上記の方法に限らず、再生装置の機能を使って、図１４に示す順に再生できるようにすればよい。

Ｓ３４では、説明文と記事本文等のそれぞれが、音声化対象文であるので、それらの音声化対象文を、情報蓄積部１６から読み出す（Ｓ３４）。

そして、音声ファイル生成部１８が、音声化対象文を音声ファイル化し（Ｓ３５）、音声ファイル記録部１９に記録する（Ｓ３６）。ＣＤに記録するのか、ハードディスクに記録するのかを選択するには、情報入力部１１を介して、ユーザが記録媒体の種類を入力し、記録媒体を選択すればよい。

本発明の第３の実施例は、説明部分のテキストデータは、文章数を含めたテキストデータである実施例である。

ここでは、記事本文、コメント、トラックバックのそれぞれを、１つの音声ファイルとして生成する。たとえば、コメントが複数ある場合に、そのうちのいくつ目のコメントであるのかを、説明文で示す。コメントが１００個あれば、次に読み上げるコメントが、いくつ目であるのか、全部でいくつあるのか等は、重要な情報である。

また、コメントが複数ある場合、コメントの始まりと終わりとを音声で説明し、このようにすれば、ユーザにとって便利である。同じ記事についてコメントする場合、記事名をその都度、説明するよりも、コメントの始まりであることと終わりであることとを説明すれば、説明が簡素である。

ここでは、始まりと終わりとの両方で、説明するが、どちらか一方だけ、説明するようにしてもよい。

実施例３は、ある階層に着目したときに、その下の階層の数を数え、この数えた下の階層の数を説明する説明文を生成する方法の実施例であり、あるグループの最初と最後とに関する説明文を生成する方法の実施例である。

実施例３では、記事本文、コメント、トラックバックという順番で再生される音声について、記事の始まりであることを示す説明文、記事本文についての説明文、記事本文、記事本文の終わりであることを示す説明文、コメントの始まりであることを示す説明文、コメントの１件目であることを示す説明文、コメント１、コメント２件目であることを示す説明文、コメント２、コメントの終わりであることを示す説明文、トラックバックの始まりであることを示す説明文、トラックバック、トラックバックの終わりであることを示す説明文、記事の終わりであることを示す説明文という順序で、再生されるように、説明文を生成する。

図１７は、説明音声ファイルを生成する過程を示すフローチャートである。

まず、ウェブサーバＷＳから、ネットワークＮＷを介して、ＨＴＭＬ文書やＲＳＳフィード等のブログに関する情報を、情報受信部１３が受信する（Ｓ４１）。

受信したブログの情報を、情報解析部１４が解析し、記憶装置に記憶する（Ｓ４２）。

図１８は、情報解析部１４が解析した結果の例を示す図である。

図１８の２行目には、記事本文が記載され、記事本文が１つ存在しているので、個数の欄に「１」が記載され、種類別番号（同一種類のうちで出現した順番）の欄には、「１」が記載されている。

図１８の３行目には、コメントが記載され、コメントが２つ存在しているので、その個数の欄には、「２」が記載され、コメントの１つ目であるので、種類別番号の欄には、「１」が記載されている。

図１８の４行目には、コメントが記載され、コメントが２つ存在しているので、その個数の欄には、「２」が記載され、コメントの２つ目であるので、種類別番号の欄には、「２」が記載されている。

図１８において、コメントの個数の欄をつくるときに、記事本文からコメントに変わったときに、「１」とし、コメント行が出てくる度に、コメントの個数に１を加算し、コメント行から、それ以外の行に代わったときに、コメントの個数の加算を終了し、その数を、図１８に追記すればよい。

図１８の５行目には、トラックバックが記載され、トラックバックが１つ存在しているので、トラックバックの個数の欄には、「１」が記載され、種類別番号の欄には、「１」が記載されている。

図１８には、備考の欄が設けられている。ブログサービス業者が発表している付加情報があれば、その付加情報を、上記備考の欄に分類する。たとえぱ、ｇｏｏブログのサービスでは、アクセス数の多いものをランキングとして発表している。また、著名人のブログである特設ブログや、業者がお勧めするブログであるピックアップや、ブログサービス業者が作成している公式ブログ等の多くのカテゴリが、ブログサービスのトップページに表示され、それらから選択することによって、記事を選び易くする。

上記ランキング、特設ブログ、ピックアップ、公式ブログ等は、記事やブログの属性であると考えられる。これらの属性は、ＲＳＳフィード等によっても提供されている。この付加情報の属性がある記事、ない記事が存在する。そこで、図１８に示すようにまとめたが、備考（Ｊ）の欄に、内容が記載されていても、記載されていなくてもよい。

図１９は、情報蓄積部１６に蓄積されている説明文の雛形の例を示す図である。

これらの解析結果に対して、図１９に示す説明文の雛形を使う。コメントがいくつあり、そのうちのいくつ目であるかを説明文で示すことができる。たとえば、図１８の１行目に示すデータに基づいて、「次はｇｏｏブログの、ユーザ１さんのブログで、ブログのタイトルはブログ日記、アクセスランキング１位です。２００５年７月１日１３時２０分に投稿されたカテゴリＷｅｂｌｏｇのある夏の日という記事です。」という説明文を作ることができる。

以下では、図１８の２行目に示す記事本文に対する説明文を、説明文１と呼び、同３行目のコメントを、コメント１と呼び、コメント１に対する説明文を、説明文２と呼び、４行目のコメントを、コメント２と呼び、コメント２に対する説明文を、説明文３と呼び、５行目のトラックバックに対する説明文を、説明文４と呼ぶ。

また、記事の始まりと記事の終わりとを示す説明文を、それぞれ、記事開始説明文、記事終了説明文と呼ぶ。

図２０は、情報蓄積部１６に蓄積され、生成された説明文の例を示す図である。

なお、実施例３では、記事の開始と終了とに、説明文を加えているが、ブログの開始と終了、コメントの開始と終了、トラックバックの開始と終了等、所定の単位の開始と終了を説明する説明文を、つけることが有効である。

実施例３でも、図１８に示すように、コメントが２つあるので、コメントの開始の説明文を付加し、その中に「全コメントは２件です」等という説明文を加えるようにしてもよい。このようにすれば、全体でどれくらいの数のコメントが読み上げられようとしているのかがわかる。

次に、図１８に示す種類（Ｉ）別に、音声ファイルと作る。

ＣＤ等では、音声ファイル単位で、聞き飛ばしや聞き直しが可能であるので、複数のコメントがある場合、同じファイルとして記録すれば、コメントを聞いている途中で、コメントを聞き飛ばすことができる。

次に、その過程について説明する。

まず、解析データを１行読み出し、その種類（Ｉ）が、記事本文であるかどうかを判別する（Ｓ４３）。記事本文であれば、Ｓ４６に進み、記事本文用の説明文の雛形を、情報蓄積部１６から読み出す（Ｓ４６）。記事本文でなければ、Ｓ４４に進み、種類（Ｉ）が、コメントであるかどうかを判別する（Ｓ４４）。

コメントであれば、Ｓ４７に進み、コメント用の説明文の雛形を、情報蓄積部１６から読み出す（Ｓ４７）。コメントでなければ、Ｓ４５に進む。Ｓ４５において、種類（Ｉ）が、全てトラックバックであるかどうかを判別する（Ｓ４５）。

トラックバックであれば、Ｓ４８に進み、トラックバック用の説明文の雛形を、情報蓄積部１６から読み出す（Ｓ４８）。トラックバックでなければ、Ｓ４９に進む。Ｓ４９では、種類（Ｉ）が、記事本文、コメント、トラックバックのいずれでもないので、「解析結果に誤りがあります」等というエラーメッセージを、情報出力部１２に表示し、処理を終了する（Ｓ４９）。

続いて、情報生成部１７で説明文を生成する（Ｓ５０）。図１９に示す説明文の雛形に、図１８に示すデータを挿入すれば、説明文を生成することができる。そして、この生成された説明文を、情報蓄積部１６に記録する（Ｓ５１）。

再生されるべき説明文の雛形を、図１０に示すように、記事本文の直後に用いるようにしてもよい。

そして、説明文、記事本文、コメント、トラックバックを再生する順番を決定する（Ｓ５２）。再生する順番は、図１８に示す解析結果の順番に再生すると分かり易い。さらに、説明文は、記事本文の直前に再生される説明文であるので、その直前に挿入すると、図２０に示す順番になる。図２０に示す順番で再生できるように、音声ファイルを記録すればよい。

次に、図２０に示す順番で再生されるように、記録の条件を決定する（Ｓ５３）。ＣＤでは、記録された順番に再生されるので、ＣＤにおいて再生の順番を決める要素は、記録の順番である。そこで、図２０に示す順番に、ＣＤに記録すればよい。

また、ハードディスクに記録する場合、実施例１のように、図２０に示す順番に再生されるように、ハードディスクに記録すればよい。つまり、ファイル名が、図２０に示す順番に並び替えられるように、ハードディスクに記録すればよい。または、メタデータに順番を記録すればよい。

さて、説明文と記事本文等のそれぞれが、音声化対象文であるので、それらの音声化対象文を、情報蓄積部１６から読み出し（Ｓ５４）、音声化対象文を生成する（Ｓ５５）。ただし、実施例３では、説明文と記事本文とを、同一ファイルに記録し、また、複数存在しているコメントを、１つのファイルに記録する。よって、生成されるファイルは、図２０に示す順番で再生すると、番号１〜３、４〜７、８〜１０の３つの音声化対象文ができる。

そして、音声ファイル生成部１８が、音声化対象文を音声ファイル化し（Ｓ５６）、音声ファイル記録部１９に記録する（Ｓ５７）。ＣＤに記録するのか、ハードディスクに記録するのかを選択する場合、情報入力部１１を介して、ユーザが入力し、選択する。

実施例３は、ある階層に着目したときに、その階層の下の階層の数を数え、説明文を生成する実施例である。実施例３では、記事本文１つに対して、コメントとトラックバックとが複数あるので、コメントとトラックバックとの数を数え、説明文を生成する。記事の１つ上の階層（すなわち、ブログ）を考えると、ブログ１つに対して、記事は複数ある場合、記事の数を数えて説明文を生成するようにしてもよい。

実施例４は、ブログのようなテキストデータに説明を付けるのではなく、音声データに説明を付ける実施例である。

図１６に示すように、楽曲が収められているｍｐ３等の形式の音声ファイルには、メタデータが記録されている。実施例４は、ｍｐ３等の形式の音声からメタデータを読み込む実施例である。この場合のメタデータの種類は、楽曲に特化したものであり、アーティスト名、ジャンル、アルバム名、作曲者名、トラック番号等である。これらの情報も音声で聞くことができれば便利である。

図２１は、実施例４（音声ファイル生成装置）の動作を示すフローチャートである。

まず、楽曲ファイルを読み込み、楽曲に関する情報を、情報受信部１３が読み込む（Ｓ６１）。この読み込んだ楽曲の情報を、情報解析部１４が解析する（Ｓ６２）。

実施例４は、図１６に示すように、５曲で構成されているアルバムについての実施例である。図１６の１行のデータは、１つの楽曲ファイルに対応している。これら５つの楽曲ファイルを順次読み込み、メタデータを解析し、図１６に示す形にまとめる。

次に、予め記録した説明文の雛形を、情報蓄積部１６から読み出す（Ｓ６３）。続いて、情報生成部１７が説明文を生成する（Ｓ６４）。これらの手順は、実施例１における手順と同様である。

そして、これら生成された説明文と楽曲との再生順を決定し（Ｓ６５）、再生の順番を示すプレイリストを生成する（Ｓ６６）。

図２２は、情報蓄積部１６に蓄積されている説明文の雛形の例を示す図である。

図２３は、情報蓄積部１６に蓄積されているプレイリストの例を示す図である。

図２２に示すように、アルバムの開始、終了を示す説明文と、曲の直前での説明文とを生成したので、説明文を含んだ曲順は、図２３に示すようになる。

ハードディスクを使った再生機には、プレイリストの曲順に従って再生することができるものがあるので、プレイリストを作れば、Ｓ６５で決めた順序で再生することができる。

説明文を音声化対象文とし、音声ファイル生成部１８が音声ファイルを生成する（Ｓ６７）。なお、実施例１〜３とは異なり、記事本文にあたる楽曲は、音声ファイルである。したがって、楽曲を音声化する必要はなく、説明文のみが音声化対象文である。

音声、楽曲、プレイリストの各ファイルを、音声ファイル記録部１９に記録する（Ｓ６８）。ＣＤに記録するのか、ハードディスクに記録するのかを選択するには、情報入力部１１を介して、ユーザが入力し、選択すればよい。

上記実施例では、複雑な構造をしているブログの記事等を音声化する際に、説明音声を聞くことができるので、音声で聞いたときにも、その記事等の判別やその記事の属性を、容易に知ることができ、ディスプレイ等に表示することなしに、その記事等の属性を知ることができる。

また、上記実施例では、楽曲についても同様に、説明を音声で付加するので、説明を音声で伝えることができ、ディスプレイを具備しない再生装置を実現することができる。

そして、上記実施例では、ディスプレイを具備しない再生装置では、ディスプレイで消費する電力を必要としないので、再生時間の長い再生装置を作ることができる。

つまり、上記実施例は、所定のデータを説明するための音声ファイルを生成する音声ファイル生成装置において、上記所定のデータの属性を説明する属性説明データを読み出し、記憶装置に記憶する属性説明データ読み出し手段と、上記属性説明データに基づいて、説明部分のテキストデータを生成し、記憶装置に記憶する手段と、上記説明部分のテキストデータを音声合成し、説明用音声ファイルを生成し、記憶装置に記憶する手段と、上記所定のデータを示す音声ファイルと、上記所定のデータを説明する説明用音声ファイルとが、隣り合った順番で再生されるように、上記所定のデータを示す音声ファイルと、上記音声ファイルを説明する上記説明用音声ファイルとを出力する出力制御手段とを有することを特徴とする音声ファイル生成装置の例である。

なお、上記実施例における「説明部」は、上記「説明部分のテキストデータ」の一例である。

この場合、上記出力制御手段は、上記所定のデータを示す音声ファイルと、上記所定のデータを説明する説明用音声ファイルとを、同一のファイルとして記録する手段である。また、上記出力制御手段は、記録時刻、ファイル名、メタデータのトラック番号のうちの少なくとも１つに基づいて、上記順番を決め、この決められた順番を記録する手段である。さらに、上記出力制御手段は、再生の順番を示すプレイリストを出力する手段である。

そして、同一のカテゴリに属する少なくとも１つのデータの再生が始まる前と、上記同一のカテゴリに属する少なくとも１つのデータの再生が終わった後とにおいて、上記カテゴリの始まり、または上記カテゴリの終わりを示す説明部分のテキストデータのうちで、少なくとも一方を生成する。また、同一のカテゴリに属するデータの数の情報と、何番目に再生されるかを示す情報とが入っている説明のためのテキストデータを生成する。

なお、上記実施例をプログラムの実施例として把握することができる。つまり、上記実施例は、所定のデータを説明するための音声ファイルを生成するプログラムにおいて、上記所定のデータの属性を説明する属性説明データを読み出し、記憶装置に記憶する属性説明データ読み出し手順と、上記属性説明データに基づいて、説明部分のテキストデータを生成し、記憶装置に記憶する手順と、上記説明部分のテキストデータを音声合成し、説明用音声ファイルを生成し、記憶装置に記憶する手順と、上記所定のデータを示す音声ファイルと、上記所定のデータを説明する説明用音声ファイルとが、隣り合った順番で再生されるように、上記所定のデータを示す音声ファイルと、上記音声ファイルを説明する上記説明用音声ファイルとを出力する出力制御手順とをコンピュータに実行させるプログラムの例である。

さらに、上記実施例は、音声で出力されるデータである再生対象データを、音声で説明するデータである音声説明データを生成する音声説明データ生成手段と、上記再生対象データと、上記再生対象データを説明する上記音声説明データとを互いに連続した順番で再生する再生手段とを有することを特徴とする音声ファイル生成装置の例である。なお、上記「音声で出力されるデータである再生対象データ」は、テキストデータ、または、音声として再生できるデータである。

本発明の実施例１である音声ファイル生成装置１００を示す図である。ブログ全体の構造を示す図である。実施例１において、説明音声ファイルを生成する過程を示すフローチャートである。受信したＲＳＳフィードの例を示す図である。情報受信部１３が受信したＨＴＭＬ文書の例を示す図である。情報解析部１４が解析した結果例を示す図である。情報解析部１４が解析した結果の例を示す図である。情報蓄積部１６が蓄積されている説明文の雛形の例を示す図である。情報蓄積部１６に蓄積されている説明文の雛形の例を示す図である。記事本文の直後に再生されるべき説明文の雛形であり、情報蓄積部１６に蓄積されている説明文の雛形の例を示す図である。実施例２において、説明音声ファイルを生成する過程を示すフローチャートである。情報受信部１３が解析した結果を示す図であり、記事本文と、記事本文に対するコメントと、トラックバックとを示す図である。情報蓄積部１６に蓄積されている説明文の雛形の例を示す図である。情報蓄積部１６に蓄積されている再生順番データの例を示す図である。情報蓄積部１６に蓄積されている再生順番データの例を示す図である。情報蓄積部１６に蓄積されている楽曲データのメタデータの例を示す図である。説明音声ファイルを生成する過程を示すフローチャートである。情報解析部１４が解析した結果の例を示す図である。情報蓄積部１６に蓄積されている説明文の雛形の例を示す図である。情報蓄積部１６に蓄積されている生成された説明文の例を示す図である。実施例４（音声ファイル生成装置）の動作を示すフローチャートである。情報蓄積部１６に蓄積されている説明文の雛形の例を示す図である。情報蓄積部１６に蓄積されているプレイリストの例を示す図である。一般的なブログページを示す図である。

符号の説明

１００…音声ファイル生成装置、
１１…情報入力部、
１２…情報出力部、
１３…情報受信部、
１４…情報解析部、
１５…制御部、
１６…情報蓄積部、
１７…情報生成部、
１８…音声ファイル生成部、
１９…音声ファイル記録部、
ＷＳ…ウェブサーバ、
ＮＷ…ネットワーク。

Claims

所定のデータを説明するための音声ファイルを生成する音声ファイル生成装置において、
上記所定のデータの属性を説明する属性説明データを読み出し、記憶装置に記憶する属性説明データ読み出し手段と；
上記属性説明データに基づいて、説明部分のテキストデータ（実施例の「説明部」と同じ）を生成し、記憶装置に記憶する手段と；
上記説明部分のテキストデータを音声合成し、説明用音声ファイルを生成し、記憶装置に記憶する手段と；
上記所定のデータを示す音声ファイルと、上記所定のデータを説明する説明用音声ファイルとが、隣り合った順番で再生されるように、上記所定のデータを示す音声ファイルと、上記音声ファイルを説明する上記説明用音声ファイルとを出力する出力制御手段と；
を有することを特徴とする音声ファイル生成装置。
請求項１において、
上記出力制御手段は、上記所定のデータを示す音声ファイルと、上記所定のデータを説明する説明用音声ファイルとを、同一のファイルとして記録する手段であることを特徴とする音声ファイル生成装置。
請求項１において、
上記出力制御手段は、記録時刻、ファイル名、メタデータのトラック番号のうちの少なくとも１つに基づいて、上記順番を決め、この決められた順番を記録する手段であることを特徴とする音声ファイル生成装置。
請求項１において、
上記出力制御手段は、再生の順番を示すプレイリストを出力する手段であることを特徴とする音声ファイル生成装置。
請求項２〜請求項４のいずれか１項において、
同一のカテゴリに属する少なくとも１つのデータの再生が始まる前と、上記同一のカテゴリに属する少なくとも１つのデータの再生が終わった後とにおいて、上記カテゴリの始まり、または上記カテゴリの終わりを示す説明部分のテキストデータのうちで、少なくとも一方を生成することを特徴とする音声ファイル生成装置。
請求項２〜請求項４のいずれか１項において、
同一のカテゴリに属するデータの数の情報と、何番目に再生されるかを示す情報とが入っている説明のためのテキストデータを生成することを特徴とする音声ファイル生成装置。
所定のデータを説明するための音声ファイルを生成する音声ファイル生成方法において、
上記所定のデータの属性を説明する属性説明データを読み出し、記憶装置に記憶する属性説明データ読み出し段階と；
上記属性説明データに基づいて、説明部分のテキストデータを生成し、記憶装置に記憶する段階と；
上記説明部分のテキストデータを音声合成し、説明用音声ファイルを生成し、記憶装置に記憶する段階と；
上記所定のデータを示す音声ファイルと、上記所定のデータを説明する説明用音声ファイルとが、隣り合った順番で再生されるように、上記所定のデータを示す音声ファイルと、上記音声ファイルを説明する上記説明用音声ファイルとを出力する出力制御段階と；
を有することを特徴とする音声ファイル生成方法。
所定のデータを説明するための音声ファイルを生成するプログラムにおいて、
上記所定のデータの属性を説明する属性説明データを読み出し、記憶装置に記憶する属性説明データ読み出し手順と；
上記属性説明データに基づいて、説明部分のテキストデータを生成し、記憶装置に記憶する手順と；
上記説明部分のテキストデータを音声合成し、説明用音声ファイルを生成し、記憶装置に記憶する手順と；
上記所定のデータを示す音声ファイルと、上記所定のデータを説明する説明用音声ファイルとが、隣り合った順番で再生されるように、上記所定のデータを示す音声ファイルと、上記音声ファイルを説明する上記説明用音声ファイルとを出力する出力制御手順と；
をコンピュータに実行させるプログラム。
音声で出力されるデータである再生対象データを、音声で説明するデータである音声説明データを生成する音声説明データ生成手段と；
上記再生対象データと、上記再生対象データを説明する上記音声説明データとを互いに連続した順番で再生する再生手段と；
を有することを特徴とする音声ファイル生成装置。