JP2010066675A - 音声情報処理システム及び音声情報処理プログラム - Google Patents
音声情報処理システム及び音声情報処理プログラム Download PDFInfo
- Publication number
- JP2010066675A JP2010066675A JP2008234807A JP2008234807A JP2010066675A JP 2010066675 A JP2010066675 A JP 2010066675A JP 2008234807 A JP2008234807 A JP 2008234807A JP 2008234807 A JP2008234807 A JP 2008234807A JP 2010066675 A JP2010066675 A JP 2010066675A
- Authority
- JP
- Japan
- Prior art keywords
- audio
- information
- audio information
- document
- reproduction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】音声情報処理システムの受付手段は、再生対象である第1の音声情報と第2の音声情報を受け付け、分割手段は、予め定められた再生間隔に基づいて、前記受付手段によって受け付けられた音声情報を分割し、生成手段は、前記第1の音声情報を前記分割手段によって分割された第1の分割音声情報と前記第2の音声情報を前記分割手段によって分割された第2の分割音声情報を結合して、再生する音声情報を生成し、再生手段は、前記生成手段によって生成された音声情報を再生する。
【選択図】図1
Description
請求項1の発明は、再生対象である第1の音声情報と第2の音声情報を受け付ける受付手段と、予め定められた再生間隔に基づいて、前記受付手段によって受け付けられた音声情報を分割する分割手段と、前記第1の音声情報を前記分割手段によって分割された第1の分割音声情報と前記第2の音声情報を前記分割手段によって分割された第2の分割音声情報を結合して、再生する音声情報を生成する生成手段と、前記生成手段によって生成された音声情報を再生する再生手段を具備することを特徴とする音声情報処理システムである。
図1は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、コンピュータ・プログラム、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能にほぼ一対一に対応しているが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。
音声生成制御モジュール113は、再生対象である複数の音声情報、つまり第1の音声情報と第2の音声情報を受け付ける。例えば、ドキュメント番組表管理モジュール114によって管理されているドキュメント番組表にしたがって、再生ドキュメント管理モジュール115が管理しているドキュメントを複数抽出する。なお、第2の音声情報は、第1の音声情報とは異なる音声情報である。音声生成制御モジュール113が受け付ける音声情報は、3つ以上の音声情報であってもよい。
次に、音声生成制御モジュール113は、分割した音声情報(第1の音声情報を分割した第1の分割音声情報と第2の音声情報を分割した第2の分割音声情報)を複数音声ライン生成モジュール112又はシリアル合成モジュール116に渡して、その分割音声情報を結合させ、再生する音声情報を生成する。そして、複数の音声出力モジュール131に音声情報を再生させる場合には、各音声出力モジュール131に対応させて音声情報を再生させる。つまり、第1の音声出力モジュール131で前記第1の分割音声情報を再生し、第2の音声出力モジュール131で前記第2の音声情報を再生する。
また、音声生成制御モジュール113は、結合対象として、分割音声情報の一部を抽出して、再生する音声情報を生成するようにしてもよい。つまり、抽出されなかった分割音声情報は省略(スキップ)されることになる。
また、音声生成制御モジュール113は、再生する時間帯によって、属性情報に対応した音声情報を再生するようにしてもよい。
複数音声ライン生成モジュール112は、音声生成制御モジュール113から分割音声情報を受け取って、1つの音声出力モジュール131(音声出力モジュール131が1つだけ音声生成制御モジュール113に接続されている場合、又は複数の音声出力モジュール131が音声生成制御モジュール113に接続されているが、そのうちの1つの音声出力モジュール131)で再生する音声情報を生成する。
シリアル合成モジュール116は、音声生成制御モジュール113から分割音声情報を受け取って、複数の音声出力モジュール131で再生する音声情報を生成する。つまり、各音声出力モジュール131で再生する音声情報を生成する。
ユーザインタフェース132は、ドキュメント番組指定・制御モジュール117と接続されている。例えば、マウス、キーボード等の入力装置から利用者の操作を受け付け、ドキュメント番組指定・制御モジュール117に渡す。又は、ドキュメント番組指定・制御モジュール117から受け付けた電子データをディスプレイ等の出力装置に出力する。
通信モジュール118は、ドキュメント管理サーバー120の通信モジュール121と通信回線を介して接続されている。再生ドキュメント管理モジュール115からの指示に基づいて、ドキュメント管理サーバー120と通信を行って、再生すべきドキュメントの受け取りを行う。
ドキュメント管理モジュール122は、通信モジュール121、ドキュメントDB123と接続されている。通信モジュール121を介してドキュメント音声生成システム110からの指示を受け取って、ドキュメントDB123内に記憶されているドキュメントにアクセスして、その指示されているドキュメントを通信モジュール121を介してドキュメント音声生成システム110に渡す。
ドキュメントDB123は、ドキュメント管理モジュール122からアクセスされる。ドキュメントを記憶しており、ドキュメント管理モジュール122からのアクセスに応じて、そのドキュメントを渡す。
例えば、プロジェクトA(再生インタバルの長さ順)表210は、ドキュメント名欄211、重要度欄212、所要見積欄213、最近再生欄214を有している。ドキュメント名欄211は、再生すべきドキュメントのリストを記憶しており、また、ドキュメントの種類として、例えば、電子メール、HTML(Hyper Text Mark‐up Language)、文書ファイル等があり、重要度欄212は、属性情報である重要度を記憶しており、所要見積欄213は、そのドキュメントを再生するにかかる時間を記憶しており、最近再生欄214は、再生された時からの経過時間(分、秒等であってもよい)を記憶している。そして、プロジェクトA(再生インタバルの長さ順)表210のドキュメント名欄211内の順で、分割されたドキュメントを音声生成制御モジュール113が再生することとなる。
ステップS302では、音声生成制御モジュール113が、変数Nに再生すべきドキュメントの対象総数を、変数Sに再生させる音声出力モジュール131であるスピーカ数を代入する。対象総数は、ドキュメント番組表管理モジュール114からの指示である番組表にしたがう。例えば、図2に示したプロジェクトA(再生インタバルの長さ順)表210内のドキュメント名欄211にあるドキュメントの数である。また、スピーカ数は、音声生成制御モジュール113に接続されている音声出力モジュール131の個数を検知してもよいし、利用者が指定する数(つまり、利用したい音声出力モジュール131の数)を用いてもよい。
ステップS304では、音声生成制御モジュール113が、スピーカ数からシリアル再生か空間再生かを判断する。かかる判断において、スピーカ数が1であるならば(Y)ステップS310へ進み、それ以外の場合(N)はステップS350へ進む。なお、ここで、空間再生とは、複数のスピーカを空間的(前方の左右上下、後方の左右上下等)に配置しておき、それらの配置されたスピーカから再生させるものである。
ステップS312では、音声生成制御モジュール113が、ステップS310で生成された音声情報を音声出力モジュール131で再生する。
ステップS352では、音声生成制御モジュール113が、NをS以下になるように調整を要求する。この要求は、ドキュメント番組指定・制御モジュール117、ユーザインタフェース132を介して、利用者に要求するものであるが、音声生成制御モジュール113が、NをS以下の数に変更してもよい。つまり、再生するドキュメントを限定すること、又はドキュメントをS以下になるようにグループ分けすること等がある。グループ分けとは、そのグループ内にあるドキュメントを1つの対象とすることである。そして、ステップS304の処理に戻る。
ステップS356では、複数音声ライン生成モジュール112が、ステップS354で生成された音声情報をN個の独立ライン(各音声出力モジュール131で再生する音声情報)に分割する。なお、この処理の詳細については、図13を用いて後述する。
ステップS358では、音声生成制御モジュール113が、ステップS356で分割されたそれぞれの音声情報を複数の音声出力モジュール131で再生する。
再生対象ドキュメント(ファイル)数がNだった場合、これを上から順に1つずつ再生して完了したら次のドキュメントを再生する方式ではなく、指定の再生インタバルT(例えば、ここではT=3秒が指定されたとする)の時間で、分割し、N個の各3秒ずつを、順番に結合していく。N個の結合が終わったら、各4秒から6秒までを、次に同じように結合していく。このようにして、図4の例に示したように、N個の対象を1本の音声ラインにシリアライズ(複数のドキュメントを合成して1つの音声情報を生成)して、これを再生させる。
ステップS404では、音声生成制御モジュール113が、再生すべき対象となるドキュメントを特定する。そして、そのドキュメントを再生ドキュメント管理モジュール115から取得する。図4中のD1、D2、D3、・・・、DNは、対象となっているそれぞれのドキュメントを示す符号である。
ステップS408では、シリアル合成モジュール116が、ステップS406で分割された音声情報を合成する。つまり、各ドキュメントの分割音声情報をドキュメントの順に沿って合成して、これを繰り返す。例えば、図4に示すように、D11、D21、D31、・・・、DN1を合成して、これを1サイクルとし、さらに、その後にD12、D22、D32、・・・、DN2を合成して最後まで繰り返す。
そして、音声生成制御モジュール113は、ステップS408で合成された音声情報を音声出力モジュール131で再生する。
ドキュメントによっては、他のドキュメントより先に再生が終了してしまう場合ある。したがって、例えば、図5の場合(N=7を想定)では、7コマ(コマとは、分割された音声情報)存在するのは3サイクル目までで、4サイクル目は6コマ(D3のコマがない)、5サイクル目は4コマ(D2、D4、D6、D7)というように、減少していくことになる。再生するコマ数が予め定められた数(例えば、7コマ)になるように、再生が終了したドキュメントが発生した場合は、別のドキュメントの再生を開始するようにしてもよい。また、再生が終了したドキュメントが発生した場合は、未だ再生が終了していないドキュメントの分割音声情報を再生するようにしてもよい。つまり、ドキュメント数を減らしながら、空いたコマに再生しているドキュメントのコマを入れて、無くなるまで続けるものである。
対象ドキュメント数N=7個、再生インタバルT=3秒で、音声生成制御モジュール113は、最も早く終了するドキュメントD3を特定する。そして、再生が終了するサイクル数(ここでは、3サイクルとなる)に合わせて、その他のドキュメント(D1、D2、D4からD7)を、分割(3分割)する。その後、その分割した1つのコマの再生時間を再生インタバルT(3秒)になるように、圧縮処理(例えば、再生時に早送り再生させるように指定する等)する。これによって、N個の全てのドキュメントが3巡目後に全て終了することになる。また、圧縮率の高い(高速再生される)コマを持つドキュメントは、そのドキュメント自体のサイズが大きいということが、利用者にとって感覚的に捉え得ることとなる。
なお、ドキュメント再生時間の見積もりは、コンピュータが空いているとき又はバックグラウンド処理を使って、実際に再生して時間を計るようにしてもよい。また、オリジナルドキュメントとは別に、ドキュメントを複製した再生用のドキュメントで、再生、計測を行うようにしてもよい。
N(再生する対象の総数)の大きさについては、N=7までは巡回した実験の実績がある。また、短期記憶は7つまでという説もあるので、Nの値は2から10程度での運用が適している。
図7の例は、同じ対象ドキュメントに対して、再生時間の長さに関わらず、他の対象ドキュメントと同じ分割数(インタバル数)Kに揃えるケースを表したものである。この場合、1コマの長さは、全体の再生時間Pに対して、P/Kで表される。つまり、図7(a)は3分割の例、図7(b)は4分割の例、図7(c)は5分割の例、図7(d)は6分割の例、図7(e)は8分割の例を示している。
この分割音声情報を合成処理(シリアライズ処理)する際に、各ドキュメント間で再生間隔を揃えないでそのまま巡回的に結合する場合と、再生間隔を揃える場合がある。後者の場合、最も再生時間が短いドキュメントに合わせるために、その他のドキュメントではコマごとに圧縮処理を行うことになる。
対象全体の圧縮(再生スピードを上げる)として、例えば、1コマ(ここでは3秒)を、1.5秒、1秒、すなわち再生スピードを2倍、3倍とすることによって、さらに高速把握をし得るようにする。これには、全体を均等に圧縮再生する場合、N個の対象のうち、重要度が低いものだけを、圧縮再生する場合がある。
図8は、早送りの再生処理例(全体を均等に圧縮再生する処理)を示す説明図である。つまり、D11、D21、D31、・・・、DN1、D12、D22、D32、・・・、DN2の再生を行う場合、圧縮処理して倍速再生すると、圧縮処理していない普通再生の半分の時間(普通再生でD11からDN1までの再生時間)で全体を再生してしまう。
対象となるドキュメントを予め分析し、短縮した上で、音声情報群に変換する。短縮方法としては、例えば、(1)重要度の高いもの又は関心の強さを表すキーワードが含まれる文のみを抽出する、(2)各文を自立語のみで構成することで、全体を短縮する、などがある。全体での圧縮効果があれば、どのような方法でもよい。ただし、復習に用いられる場面であって、意味がある程度確認され得ることが前提となる。
また、再生時に圧縮する方法(早送り再生)、早送り再生したものを記録しておき、それを再生する方法、という2つ方法があるが、どちらでもよい。後者の場合は、事前の処理(前処理)で、前述の圧縮処理(分割後に圧縮、サマリー処理した短縮テキストを音声情報に変換した後に分割等)を選択できるようにしてもよい。
図10の例に示すように、サンプリング数S=2の場合、1つおきに、1番目、3番目、5番目、というように奇数番目のサイクルを抽出する。つまり、最初のコマの後は、1コマスキップして、3つ目のコマ(1つのコマが3秒の場合は、7秒から9秒までの間)を2つ目のコマとして抽出するというサンプリングを行う。これによって、音声は途切れることとなるが、ドキュメントの内容やそれまでの復習の頻度によっては、人間の補完能力によって内容をほぼ復元し得るものである。また、S=2の場合には、ほぼ2倍のスピードでの把握実現を目指すことになる。
図11は、音声コマ属性表1100のデータ構造例を示す説明図である。音声コマ属性表1100は、No.欄1101、長さ欄1102、音量欄1103、圧縮度欄1104、ドキュメント重要度欄1105、単位重要度欄1106、再生回数欄1107、最近再生日時欄1108、含有キーワード欄1109を有している。
No.欄1101は、そのコマを一意に識別する識別子を記憶する。長さ欄1102は、そのコマの再生時間を記憶する。音量欄1103は、そのコマを再生する場合の音量を記憶する。圧縮度欄1104は、そのコマの圧縮度(早送りの速度)を記憶する。ドキュメント重要度欄1105は、そのコマが属しているドキュメントの重要度を記憶する。単位重要度欄1106は、そのコマの重要度を記憶する。再生回数欄1107は、そのコマが過去に再生された回数を記憶する。最近再生日時欄1108は、そのコマが再生された最近の日時を記憶する。含有キーワード欄1109は、そのコマに含まれているキーワードを記憶する。音声コマ属性表1100内のデータは、予め又は音声生成制御モジュール113によって記憶される。
ステップS1202では、音声生成制御モジュール113が再生ドキュメント管理モジュール115に対して、対象とするドキュメントを指定する。
ステップS1204では、再生ドキュメント管理モジュール115が、そのドキュメントには要約があるか否かを判断する。かかる判断において、要約がある場合(Y)はステップS1212へ進み、それ以外の場合(N)はステップS1206へ進む。
ステップS1206では、再生ドキュメント管理モジュール115が、そのドキュメントは、会議ビデオ又は音声ファイルを含んでいるか否かを判断する。かかる判断において、含んでいる場合(Y)はステップS1214へ進み、それ以外の場合(N)はステップS1208へ進む。
ステップS1210では、再生ドキュメント管理モジュール115が、そのテキストデータを音声情報に変換し、音声生成制御モジュール113が予め定められた再生間隔で分割する。なお、予め定められた再生間隔は、複数あってもよい。
ステップS1212では、再生ドキュメント管理モジュール115が、アブストラクト部分のテキストデータを音声情報に変換し、音声生成制御モジュール113が予め定められた再生間隔で分割する。
ステップS1214では、音声生成制御モジュール113が、会議ビデオ等のドキュメントを予め定められた再生間隔で分割して、音量が予め定められた閾値よりも小さいコマを削除する。
ステップS1216では、音声生成制御モジュール113が、コマ内に含まれているキーワード等のコマ毎の属性を抽出する。
複数の音声情報を、空間配置したスピーカから独立に聞けるようにすると、この音を聞きながら他の仕事をしやすくなるので、複数の仕事をこなす場合に利用し得るものである。
N=2の場合は、前方右側と前方左側にある音声出力モジュール131での音量(片方が大でもう一方が小)を、T秒間隔で入れ替える。
N=3の場合は、前方右側と前方左側と、前方上側又は前方下側のいずれか一方を用いる。この3つの間で、音量をT秒間隔で入れ替える。
N=4の場合は、前方右側と前方左側と前方上側と前方下側を用いる。この4つの間で、音量をT秒間隔で入れ替える。
N=5の場合は、N=4の場合に加えて、後方右側又は後方左側のいずれか一方を用いる。この5つの間で、音量をT秒間隔で入れ替える。
N=6の場合は、N=4の場合に加えて、後方右側と後方左側を用いる。この6つの間で、音量をT秒間隔で入れ替える。
N=7の場合は、N=6の場合に加えて、後方上側又は後方下側のいずれか一方を用いる。この7つの間で、音量をT秒間隔で入れ替える。
N=8の場合は、8つの音声出力モジュール131を用いる。この8つの間で、音量をT秒間隔で入れ替える。
もちろん、N(再生に利用する音声出力モジュール131の数)は8以上であってもよい。
(1)図2の例に示した再生対象ドキュメント管理表を複数提示して、何が再生されるのかを見渡すことができるようにし、複数の再生対象ドキュメント管理表をまたがって、ドキュメントを選択し、それを再生対象群とする。
(2)仕事中心の番組表、趣味中心の番組表、コミュニティ活動中心の番組表のように、いくつかの区分で、番組表を編成し、予め定められた周期(例えば、毎日)毎に、変更した編成を行うようにする。例えば、一週間先の編成まで作成し、まるで新聞のラジオ番組欄を確認するように、再生するドキュメントをチェックして指定するようにしてもよい。
また、前記(1)と(2)とを組み合わせてもよい。
仕事関係番組(チャンネルA)表1410は、放送時刻欄1411、ドキュメント名欄1412、最近再生欄1413を有している。放送時刻欄1411は、そのドキュメントを再生する時刻を記憶しており、ドキュメント名欄1412は、再生すべきドキュメントのリストを記憶しており、最近再生欄1413は、再生された時からの経過時間(分、秒等であってもよい)を記憶している。
利用者にとってより適正な再生ドキュメントリスト(番組表)を作成する必要がある。そのためには、(A)予め与えられた情報から利用者による操作なしで構築する方法と、(B)利用者の操作に応じて、任意のドキュメントを選択することで構築する方法との2つがある。ここでは、主に「仕事関係」の番組表の作成を主に説明する。
番組表1600を番組表の基本的な枠組みとして予め用意する。図16は、番組表1600のデータ構造例を示す説明図である。番組表1600は、時間帯欄1601、ドキュメントの軽重欄1602、ドキュメント欄1603を有している。
時間帯欄1601は、一日の時間帯を記憶している。ドキュメントの軽重欄1602は、利用者のドキュメントを理解するにあたっての、その時間帯における適切な理解の困難性(ドキュメントの軽重ともいう)を記憶している。ドキュメント欄1603は、その時間帯における再生されるべき具体的なドキュメントを記憶している。そのドキュメントは、ドキュメントの軽重欄1602の理解の困難性に適しているものである。
これは時間帯ごとに、個人のリズムがあることを前提としている。つまり、その時間帯に重い(理解の困難性が高い)内容のドキュメントを再生してもいいのか、それとも軽い(理解の困難性が低い)内容のドキュメントを再生した方がいいのかを示す「重」、「軽」の属性が付与されている。そして、ドキュメントにも「重」、「軽」の属性が付与されている。なお、メール又はニュースには「軽」の属性が付与されているとする。
図16に示す例は、次のことを示している。朝の最初の頃は、調子を出すためにまず「軽」から再生し、次に昼休みまでは「重」を再生する。昼休みは、仕事のドキュメントではなく音楽を再生する。これも個人で指定してよい。午後の最初は利用者によって効率が落ちる時間帯でもあるので「軽」を再生し、その後は「重」とする。このような時間帯ごとの性質に合わせてドキュメントを配置する。
さらに、もしドキュメントが仕事の納期に絡み、その納期が予め定めた日数(例えば、2日)以内に迫っている場合には、同じ「軽」「重」の性質の時間帯に、納期に関係するドキュメントを優先的に設定する。
最終的に再生によって時間帯が埋まらずに隙間の時間ができたら、「非重要」ドキュメントを、「軽」「重」の分類にしたがって挿入するようにしてもよい。さらに、まだ隙間の時間がある場合には、その時間帯のリストの最初の方から順番に再度設定するようにしてもよい。このようにして、利用者に合わせた番組表が構築される。
図15は、ドキュメント番組表管理モジュール114が行う番組表の生成処理例を示すフローチャートである。
ステップS1502では、利用者による時間帯毎の気分を配慮した基本方針を設定する。つまり、番組表1600のドキュメントの軽重欄1602内を設定するものであり、利用者の操作に応じて予め行っておく。
ステップS1504では、重要なドキュメントであり、かつ利用者の関心・嗜好のキーワードで検索したドキュメントのリストを作成する。
ステップS1508では、軽い内容を配置したい時間帯「軽」に、そのドキュメントを配置する。つまり、番組表1600の対応するドキュメント欄1603にそのドキュメントを記憶させる。
ステップS1510では、重い思考も可能である時間帯「重」に、そのドキュメントを配置する。つまり、番組表1600の対応するドキュメント欄1603にそのドキュメントを記憶させる。
ステップS1514では、軽重が合致する時間帯に、そのドキュメントを優先的に配置する。
ステップS1516では、時間帯内で空いている時間がある場合(ドキュメントの再生時間の合計が各時間帯の時間より少ない場合)は、非重要ドキュメントを再生するように設定する。つまり、ステップS1504で検索されなかったドキュメントを対象とすることになる。
これによって、仕事関係の1日分の番組表が完成する(ステップS1599)。
これは、例えば、図14の例に示すような番組表をドキュメント番組指定・制御モジュール117がユーザインタフェース132を介して提示する。そして、利用者の選択指示をユーザインタフェース132が受け付けて、ドキュメントを選択し、図16の例に示す番組表1600のドキュメント欄1603中に記載していくものである。番組表の提示の仕方は、納期順、重要度順、関心度順、嗜好順など複数あってもよい。利用者による選択は、「仕事」「趣味」等のカテゴリーの指定であってもよく、さらにその組み合わせであってもよい。また、別の日にも同じリストを再生したいという要求に対応し得るように、お気に入りの番組表1600として、それを登録しておき、その番組表1600を別の日の番組表1600として設定するようにしてもよい。
しかし、もし2倍速での再生を行う音声出力モジュール131等がある場合は、そこにはさらにもう1つのカテゴリーの番組表を設定するようにしてもよい。例えば、1つの音声出力モジュール131しか有効でなかった場合でも、2倍速の再生が行われることを条件に、時間帯ごとに2つの番組表にあるドキュメントを交互に再生するようにしてもよい。つまり、再生する場合の圧縮率に応じて、番組表の設定数を決定してもよい。
また、逆に、音声出力モジュール131の接続数よりも多い数の番組表を設定したいとする利用者からの指示がある場合は、例えば、1つ多い場合は、2倍速で再生するものを2つ選択するようにしてもよい。つまり、音声出力モジュール131の接続数を超えた数の番組表を設定する場合は、再生する場合の圧縮率に変更するようにしてもよい。
そして、再生頻度が低いドキュメント群を再生したい場合には、利用者の操作によってその指定を行うようしてもよい。図17は、再生頻度の提示例と選択処理例を示す説明図である。これは、ユーザインタフェース132を用いて、再生頻度が低かった領域1701を利用者が選択する例である。また、ドキュメント番組表管理モジュール114は、再生頻度が予め定められた回数以上になるまでは、再生頻度の低い項目を優先的に番組表に割り当てるようにしてもよい。
なお、図18に示すハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図18に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えばASIC等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図18に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、特に、パーソナルコンピュータの他、情報家電、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)などに組み込まれていてもよい。
また、提示としたものについては、ディスプレイ等の出力装置に出力すること以外に、プリンタ等の印刷装置によって印刷すること、スピーカ等の音声出力装置による音声出力等、これらの組み合わせを含む。
また、前述した実施の形態では、音声情報の再生について説明したが、この再生のときに、映像を提示するようにしてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blue−ray Disk)、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM)、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
111…キーワード管理モジュール
112…複数音声ライン生成モジュール
113…音声生成制御モジュール
114…ドキュメント番組表管理モジュール
115…再生ドキュメント管理モジュール
116…シリアル合成モジュール
117…ドキュメント番組指定・制御モジュール
118…通信モジュール
120…ドキュメント管理サーバー
121…通信モジュール
122…ドキュメント管理モジュール
123…ドキュメントDB
131…音声出力モジュール
132…ユーザインタフェース
Claims (11)
- 再生対象である第1の音声情報と第2の音声情報を受け付ける受付手段と、
予め定められた再生間隔に基づいて、前記受付手段によって受け付けられた音声情報を分割する分割手段と、
前記第1の音声情報を前記分割手段によって分割された第1の分割音声情報と前記第2の音声情報を前記分割手段によって分割された第2の分割音声情報を結合して、再生する音声情報を生成する生成手段と、
前記生成手段によって生成された音声情報を再生する再生手段
を具備することを特徴とする音声情報処理システム。 - 前記分割手段は、予め定められた分割数に基づいて、前記音声情報を分割する
ことを特徴とする請求項1に記載の音声情報処理システム。 - 前記再生手段は、前記生成手段によって生成された音声情報内の分割音声情報を早送りで再生する
ことを特徴とする請求項1又は2に記載の音声情報処理システム。 - 前記生成手段は、結合対象として、前記分割手段によって生成された分割音声情報の一部を抽出して、再生する音声情報を生成する
ことを特徴とする請求項1から3のいずれか一項に記載の音声情報処理システム。 - 文字情報から要約を抽出し、該要約に基づいて音声情報を生成する文字音声情報生成手段
をさらに具備し、
前記受付手段は、前記文字音声情報生成手段によって生成された音声情報を受け付ける
ことを特徴とする請求項1から4のいずれか一項に記載の音声情報処理システム。 - 前記分割手段は、分割音声情報のうち音量が予め定められた値よりも小さいものを削除する
ことを特徴とする請求項1から5のいずれか一項に記載の音声情報処理システム。 - 前記再生手段は、第1の音声出力部で前記第1の分割音声情報を再生し、第2の音声出力部で前記第2の音声情報を再生する
ことを特徴とする請求項1から6のいずれか一項に記載の音声情報処理システム。 - 前記再生手段によって、再生される音声情報の予定を提示する予定提示手段
をさらに具備することを特徴とする請求項1から7のいずれか一項に記載の音声情報処理システム。 - 前記音声情報には、理解の困難さに関する属性情報が付されており、
前記再生手段は、再生する時間帯によって、属性情報に対応した音声情報を再生する
ことを特徴とする請求項1から8のいずれか一項に記載の音声情報処理システム。 - 前記予定提示手段は、前記再生手段による再生の回数に基づいて、前記再生手段によって、再生される音声情報の予定を決定する
ことを特徴とする請求項8又は9に記載の音声情報処理システム。 - コンピュータを、
再生対象である第1の音声情報と第2の音声情報を受け付ける受付手段と、
予め定められた再生間隔に基づいて、前記受付手段によって受け付けられた音声情報を分割する分割手段と、
前記第1の音声情報を前記分割手段によって分割された第1の分割音声情報と前記第2の音声情報を前記分割手段によって分割された第2の分割音声情報を結合して、再生する音声情報を生成する生成手段と、
前記生成手段によって生成された音声情報を再生する再生手段
として機能させることを特徴とする音声情報処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008234807A JP2010066675A (ja) | 2008-09-12 | 2008-09-12 | 音声情報処理システム及び音声情報処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008234807A JP2010066675A (ja) | 2008-09-12 | 2008-09-12 | 音声情報処理システム及び音声情報処理プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010066675A true JP2010066675A (ja) | 2010-03-25 |
Family
ID=42192290
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008234807A Pending JP2010066675A (ja) | 2008-09-12 | 2008-09-12 | 音声情報処理システム及び音声情報処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010066675A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014063054A (ja) * | 2012-09-21 | 2014-04-10 | Toshiba Corp | 再生データ生成装置および再生データ生成方法 |
US9472181B2 (en) | 2011-02-03 | 2016-10-18 | Panasonic Intellectual Property Management Co., Ltd. | Text-to-speech device, speech output device, speech output system, text-to-speech methods, and speech output method |
CN112133279A (zh) * | 2019-06-06 | 2020-12-25 | Tcl集团股份有限公司 | 车载信息播报方法、装置及终端设备 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004104590A (ja) * | 2002-09-11 | 2004-04-02 | Matsushita Electric Ind Co Ltd | 音声伝送システム及び音声伝送方法 |
-
2008
- 2008-09-12 JP JP2008234807A patent/JP2010066675A/ja active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004104590A (ja) * | 2002-09-11 | 2004-04-02 | Matsushita Electric Ind Co Ltd | 音声伝送システム及び音声伝送方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9472181B2 (en) | 2011-02-03 | 2016-10-18 | Panasonic Intellectual Property Management Co., Ltd. | Text-to-speech device, speech output device, speech output system, text-to-speech methods, and speech output method |
JP2014063054A (ja) * | 2012-09-21 | 2014-04-10 | Toshiba Corp | 再生データ生成装置および再生データ生成方法 |
CN112133279A (zh) * | 2019-06-06 | 2020-12-25 | Tcl集团股份有限公司 | 车载信息播报方法、装置及终端设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4127668B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
KR101513888B1 (ko) | 멀티미디어 이메일 합성 장치 및 방법 | |
US20090204399A1 (en) | Speech data summarizing and reproducing apparatus, speech data summarizing and reproducing method, and speech data summarizing and reproducing program | |
JPWO2008001500A1 (ja) | 音声コンテンツ生成システム、情報交換システム、プログラム、音声コンテンツ生成方法及び情報交換方法 | |
KR20070093434A (ko) | 휴대용 오디오 재생 장치 및 그 동작 방법 | |
WO2016202176A1 (zh) | 一种媒体文件合成方法、装置和设备 | |
JP4320673B2 (ja) | 情報処理装置および方法、並びにプログラム | |
US9666211B2 (en) | Information processing apparatus, information processing method, display control apparatus, and display control method | |
KR20140132209A (ko) | 멀티 트랙 미디어 파일이 기록된 기록 매체, 멀티 트랙 미디어 파일 편집 방법, 및 멀티 트랙 미디어 파일 편집 장치 | |
JP6641045B1 (ja) | コンテンツ生成システム、及びコンテンツ生成方法 | |
JP2010066675A (ja) | 音声情報処理システム及び音声情報処理プログラム | |
EP1649459A1 (en) | Information storage medium storing scenario, apparatus and method of recording the scenario | |
KR20050012101A (ko) | 시나리오를 기록한 정보저장매체, 기록장치 및 기록방법,그 정보저장매체의 재생장치 및 시나리오의 검색방법 | |
JP2002008052A (ja) | プレゼンテーションシステムおよび記録媒体 | |
JP2008146057A (ja) | 音楽・映像再生装置 | |
JP2009069449A (ja) | オーディオ装置及び曲再生プログラム | |
JP7179387B1 (ja) | ハイライト動画生成システム、ハイライト動画生成方法、およびプログラム | |
JP2017033376A (ja) | 情報処理装置、情報処理方法、および制御プログラム | |
JP2009152782A (ja) | コンテンツ再生装置及びコンテンツ再生方法 | |
JP4353084B2 (ja) | 映像再生方法及び装置及びプログラム | |
JP2002304420A (ja) | 視聴覚コンテンツ配信システム | |
JP7335175B2 (ja) | カラオケ装置 | |
JP6646172B1 (ja) | 多言語コンテンツの教育用再生方法、そのためのデータ構造及びプログラム | |
JP2002197488A (ja) | リップシンクデータ生成装置並びに方法、情報記憶媒体、及び情報記憶媒体の製造方法 | |
JP4188138B2 (ja) | 指定された楽曲の演奏期間中の指定された一部区間の映像を指定された映像に差し替えるカラオケ装置の映像システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110822 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120706 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120717 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120817 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130219 |