JP2010140278A - 音声情報可視化装置及び音声情報可視化プログラム - Google Patents
音声情報可視化装置及び音声情報可視化プログラム Download PDFInfo
- Publication number
- JP2010140278A JP2010140278A JP2008316254A JP2008316254A JP2010140278A JP 2010140278 A JP2010140278 A JP 2010140278A JP 2008316254 A JP2008316254 A JP 2008316254A JP 2008316254 A JP2008316254 A JP 2008316254A JP 2010140278 A JP2010140278 A JP 2010140278A
- Authority
- JP
- Japan
- Prior art keywords
- information
- script
- program
- emotion
- behavior
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
【解決手段】入力される音声情報から予め設定された演出対象物を可視化させ、所定の演出を行わせる音声情報可視化装置において、少なくとも1つの音声情報から感情推定を行う感情推定手段と、前記感情推定手段により得られる感情の種別及び強さからなる感情情報に対応して予め設定された前記演出対象物に対する振る舞いを決定する振る舞い決定手段と、前記振る舞い決定手段により得られる振る舞い情報に基づいて生成されたスクリプトを生成するスクリプト生成手段と、前記スクリプト生成手段により得られるスクリプトと前記音声情報とを同期させて合成させる合成手段とを有することにより、上記課題を解決する。
【選択図】図1
Description
コンピュータを、少なくとも1つの音声情報から感情推定を行う感情推定手段、前記感情推定手段により得られる感情の種別及び強さからなる感情情報に対応して予め設定された前記演出対象物に対する振る舞いを決定する振る舞い決定手段、前記振る舞い決定手段により得られる振る舞い情報に基づいて生成されたスクリプトを生成するスクリプト生成手段、及び、前記スクリプト生成手段により得られるスクリプトと前記音声情報とを同期させて合成させる合成手段として機能させる。
本発明では、例えば音声情報等を用いたラジオ番組の制作において、番組出演者の音声が持つ感情情報を用いて、ラジオ番組をCG等で可視化する際に演出を自動的に付加するものである。
図1は、第1の実施形態におけるラジオ番組システムの概略構成例を示す図である。なお、図1に示すラジオ番組システム1は、放送局側と聴取者側とを含むシステム全体の概略を示すものである。なお、第1の実施形態では、演出パターンを聴取者側で設定する場合の例を示している。
スタジオ10には、音声入力手段として少なくとも1つのマイク21(図1においては、マイク21−1,21−2)を有するよう構成されている。また、音声情報可視化装置12は、感情推定手段31と、振る舞い決定手段32と、CGキャラクタ振る舞いDB(DB:データベース)33と、スクリプト置換・付加手段34と、番組パターンDB35と、合成手段36と、変調手段37とを有するよう構成されている。
ここで、上述した感情推定手段31における感情推定処理について説明する。感情推定処理では、例えば入力される肉声等の音声データから、その音声の強度やテンポ、抑揚等を検出し、その検出された強度、テンポ、及び抑揚等の時間軸方向の変化量のパターンと、そのパターンに関連付けて予め蓄積されている感情状態とに基づいて、対応する感情状態を出力する。
ここで、上述した感情推定手段31により得られる感情を基づいて付加されるCGキャラクタのジェスチャー例について図を用いて説明する。図2は、演出項目とその内容について説明するための図である。図2には、CGキャラクタに対して行うことができる演出項目とその内容が設定されている。図2に示すように、演出項目としては、例えば「表情」、「表情の程度」、「顔の向き(角度)」、「うなづき」、「首を横に振る」、「立ち上がる」、「座っているときの姿勢」、「相手を見る時間の長さ」、「腕のジェスチャ」等がある。
次に、ラジオ番組出演者の音声情報から、CGキャラクタのジェスチャーを決定する処理について図を用いて具体的に説明する。図3は、CGキャラクタのジェスチャー決定処理を具体的に説明するための図である。図3に示すように、番組出演者の肉声を感情推定手段31に入力する。感情推定手段31は、推定した感情データを出力する。図3の例では、感情は「喜び」で、その強さは「7」としている。これらの情報を、振る舞い推定情報として、振る舞い決定手段32に出力する。
次に、図1に示すラジオ番組システム1の聴取者側の処理について説明する。聴取者端末13は、復調手段41と、分離手段42と、演出設定手段43と、TVMLスクリプト生成手段44と、番組パターンDB45と、TVMLスクリプトコントローラ46と、TVMLプレイヤー47と、表示手段48とを有するよう構成されている。
ここで、上述した演出設定手段における設定内容の一例について図を用いて説明する。図4は、演出設定内容の一例を示す図である。図4に示すように、演出設定内容では、演出設定手段43において、対談形式(男女)、一人解析(男)、一人喋り(女)等、予め設定された演出条件から、何れかを選択する。これにより、番組パターンDB45から対応するデータを抽出して、番組パターン、初期設定TVMLスクリプトを生成し、TVMLスクリプト生成手段44によりTVMLスクリプト生成し、TVMLスクリプトコントローラ46により目的とするラジオ番組用のTVMLスクリプトデータを生成し、TVMLプレイヤー47によりラジオ番組信号を再生して音声情報を可視化して、表示手段48によりラジオ番組を出力することができる。
次に、本発明におけるラジオ番組システムの第2の実施形態について図を用いて説明する。第2の実施形態では、演出パターンを放送局側(音声情報可視化装置12)で設定する場合の例を示す。
ここで、上述した音声情報可視化装置12及び聴取者端末13は、上述した専用の装置構成により本発明における音声情報の可視化を行うこともできるが、上述した各装置の各構成における処理をコンピュータに実行させるための実行プログラム(音声情報可視化プログラム)を生成し、例えば、汎用のパーソナルコンピュータやサーバ等にプログラムをインストールすることにより、音声情報可視化処理を実現することができる。
次に、本発明における実行プログラムによる音声情報可視化処理手順についてフローチャートを用いて説明する。なお、以下の処理の説明では、コンテンツの一例として「ラジオ番組」を用いているが本発明においては特に限定されるものではない。また、以下に示す予め生成されたTVMLスクリプトには、合成音声を出力するスクリプトを含むものとする。
まず、放送局側における音声情報可視化処理手順について説明する。図6は、本実施形態における音声情報可視化処理手順の一例を示すフローチャートである。図6において、まず音声を入力し(S01)、感情推定処理を行う(S02)。次に、S02の処理により得られた推定された感情データとしての振る舞い推定情報に対応させてCGキャラクタの振る舞いを決定する(S03)。また、S03の処理により得られた振る舞い決定情報に対応するTVMLスクリプトを生成する(S04)。
次に、聴取者側における聴取処理手順について説明する。図7は、聴取処理手順の一例を示す図である。図7に示す聴取処理は、まず、放送波を入力し(S11)、復調処理を行い(S12)、音声情報と、TVMLスクリプトとに分離する(S13)。
10 スタジオ
11 音声ミキサー
12 音声情報可視化装置
13 聴取者端末
21 マイク
31 感情推定手段
32 振る舞い決定手段
33 CGキャラクタ振る舞いDB
34 スクリプト置換・付加手段
35 番組パターンDB
36 合成手段
37 変調手段
41 復調手段
42 分離手段
43 演出設定手段
44 TVMLスクリプト生成手段
45 番組パターンDB
46 TVMLスクリプトコントローラ
47 TVMLプレイヤー
48 表示手段
51 番組全体スクリプト生成手段
Claims (5)
- 入力される音声情報から予め設定された演出対象物を可視化させ、所定の演出を行わせる音声情報可視化装置において、
少なくとも1つの音声情報から感情推定を行う感情推定手段と、
前記感情推定手段により得られる感情の種別及び強さからなる感情情報に対応して予め設定された前記演出対象物に対する振る舞いを決定する振る舞い決定手段と、
前記振る舞い決定手段により得られる振る舞い情報に基づいて生成されたスクリプトを生成するスクリプト生成手段と、
前記スクリプト生成手段により得られるスクリプトと前記音声情報とを同期させて合成させる合成手段とを有することを特徴とする音声情報可視化装置。 - 前記振る舞い決定手段は、
前記演出情報として、前記演出対象物の表情又は動作に関する情報を含むことを特徴とする請求項1に記載の音声情報可視化装置。 - 前記振る舞い決定手段は、
前記演出対象物に応じて前記表情又は動作に対して重み付けさせた演出情報を生成することを特徴とする請求項2に記載の音声情報可視化装置。 - 前記スクリプトを生成手段は、
前記音声情報を再生する際のコンテンツ全体に対する演出用スクリプトを生成することを特徴とする請求項1乃至3の何れか1項に記載の音声情報可視化装置。 - 入力される音声情報から予め設定された演出対象物を可視化させ、所定の演出を行わせる音声情報可視化プログラムにおいて、
コンピュータを、
少なくとも1つの音声情報から感情推定を行う感情推定手段、
前記感情推定手段により得られる感情の種別及び強さからなる感情情報に対応して予め設定された前記演出対象物に対する振る舞いを決定する振る舞い決定手段、
前記振る舞い決定手段により得られる振る舞い情報に基づいて生成されたスクリプトを生成するスクリプト生成手段、及び、
前記スクリプト生成手段により得られるスクリプトと前記音声情報とを同期させて合成させる合成手段として機能させることを特徴とする音声情報可視化プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008316254A JP2010140278A (ja) | 2008-12-11 | 2008-12-11 | 音声情報可視化装置及び音声情報可視化プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008316254A JP2010140278A (ja) | 2008-12-11 | 2008-12-11 | 音声情報可視化装置及び音声情報可視化プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010140278A true JP2010140278A (ja) | 2010-06-24 |
Family
ID=42350367
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008316254A Pending JP2010140278A (ja) | 2008-12-11 | 2008-12-11 | 音声情報可視化装置及び音声情報可視化プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010140278A (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012039280A (ja) * | 2010-08-05 | 2012-02-23 | Nippon Hoso Kyokai <Nhk> | 解説放送文作成支援装置及びプログラム |
US8948893B2 (en) | 2011-06-06 | 2015-02-03 | International Business Machines Corporation | Audio media mood visualization method and system |
US9435643B2 (en) | 2012-01-30 | 2016-09-06 | Sony Corporation | Presumably defective portion decision apparatus, presumably defective portion decision method, fabrication method for semiconductor device and program |
JP2019024748A (ja) * | 2017-07-27 | 2019-02-21 | 株式会社バンダイナムコエンターテインメント | 画像生成装置及びプログラム |
JPWO2019026397A1 (ja) * | 2017-07-31 | 2020-05-28 | ソニー株式会社 | 情報処理装置、情報処理方法およびプログラム |
WO2022264203A1 (ja) * | 2021-06-14 | 2022-12-22 | 三菱電機株式会社 | 信号生成装置、信号処理システムおよび信号生成方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003348525A (ja) * | 2002-05-27 | 2003-12-05 | Hitachi Kokusai Electric Inc | 番組蓄積送出装置及びその装置を用いた送受信システム |
WO2006059570A1 (ja) * | 2004-11-30 | 2006-06-08 | Matsushita Electric Industrial Co., Ltd. | 場面修飾表現生成装置および場面修飾表現生成方法 |
JP2008217447A (ja) * | 2007-03-05 | 2008-09-18 | Nippon Hoso Kyokai <Nhk> | コンテンツ生成装置及びコンテンツ生成プログラム |
-
2008
- 2008-12-11 JP JP2008316254A patent/JP2010140278A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003348525A (ja) * | 2002-05-27 | 2003-12-05 | Hitachi Kokusai Electric Inc | 番組蓄積送出装置及びその装置を用いた送受信システム |
WO2006059570A1 (ja) * | 2004-11-30 | 2006-06-08 | Matsushita Electric Industrial Co., Ltd. | 場面修飾表現生成装置および場面修飾表現生成方法 |
JP2008217447A (ja) * | 2007-03-05 | 2008-09-18 | Nippon Hoso Kyokai <Nhk> | コンテンツ生成装置及びコンテンツ生成プログラム |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012039280A (ja) * | 2010-08-05 | 2012-02-23 | Nippon Hoso Kyokai <Nhk> | 解説放送文作成支援装置及びプログラム |
US8948893B2 (en) | 2011-06-06 | 2015-02-03 | International Business Machines Corporation | Audio media mood visualization method and system |
US9235918B2 (en) | 2011-06-06 | 2016-01-12 | International Business Machines Corporation | Audio media mood visualization |
US9953451B2 (en) | 2011-06-06 | 2018-04-24 | International Business Machines Corporation | Audio media mood visualization |
US10255710B2 (en) | 2011-06-06 | 2019-04-09 | International Business Machines Corporation | Audio media mood visualization |
US9435643B2 (en) | 2012-01-30 | 2016-09-06 | Sony Corporation | Presumably defective portion decision apparatus, presumably defective portion decision method, fabrication method for semiconductor device and program |
JP2019024748A (ja) * | 2017-07-27 | 2019-02-21 | 株式会社バンダイナムコエンターテインメント | 画像生成装置及びプログラム |
JPWO2019026397A1 (ja) * | 2017-07-31 | 2020-05-28 | ソニー株式会社 | 情報処理装置、情報処理方法およびプログラム |
JP7176519B2 (ja) | 2017-07-31 | 2022-11-22 | ソニーグループ株式会社 | 情報処理装置、情報処理方法およびプログラム |
WO2022264203A1 (ja) * | 2021-06-14 | 2022-12-22 | 三菱電機株式会社 | 信号生成装置、信号処理システムおよび信号生成方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7283496B2 (ja) | 情報処理方法、情報処理装置およびプログラム | |
WO2010075634A1 (en) | Method and system for visual representation of sound | |
JP2010140278A (ja) | 音声情報可視化装置及び音声情報可視化プログラム | |
US20170092253A1 (en) | Karaoke system | |
CN113302945A (zh) | 用于捕获的视听表演的增强现实过滤器 | |
CN106028119A (zh) | 多媒体特效的自定义方法和装置 | |
CN107977184A (zh) | 一种基于虚拟现实技术的音乐播放方法和装置 | |
JP2021101252A (ja) | 情報処理方法、情報処理装置およびプログラム | |
JP4917920B2 (ja) | コンテンツ生成装置及びコンテンツ生成プログラム | |
WO2020039702A1 (ja) | 情報処理装置、情報処理システム、情報処理方法及びプログラム | |
JP5041853B2 (ja) | コンテンツ生成装置及びコンテンツ生成プログラム | |
JP4865469B2 (ja) | コンテンツ制作サーバ、コンテンツ提示装置、コンテンツ制作プログラム、及びコンテンツ提示プログラム | |
JP6170604B1 (ja) | 音声生成装置 | |
JP7117228B2 (ja) | カラオケシステム、カラオケ装置 | |
CN113821189A (zh) | 音频播放方法、装置、终端设备及存储介质 | |
CN111696566A (zh) | 语音处理方法、装置和介质 | |
JP2008032788A (ja) | 語学教材データ作成用プログラム | |
JP7281386B2 (ja) | カラオケ装置 | |
JP4027840B2 (ja) | 情報発信方法および装置およびプログラム | |
WO2022163023A1 (ja) | コンテンツ修正装置、コンテンツ配信サーバ、コンテンツ修正方法、および、記録媒体 | |
JP6190030B1 (ja) | 音声生成プログラム | |
JP6185136B1 (ja) | 音声生成プログラムおよびゲーム装置 | |
JP2008217226A (ja) | コンテンツ生成装置及びコンテンツ生成プログラム | |
JP2002300434A (ja) | 番組送出システム及びこれに用いる番組送出装置 | |
JP4796466B2 (ja) | コンテンツ管理サーバ、コンテンツ提示装置、コンテンツ管理プログラム、及びコンテンツ提示プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20110822 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110824 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20110822 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120626 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120703 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20121030 |