JP4027840B2 - 情報発信方法および装置およびプログラム - Google Patents
情報発信方法および装置およびプログラム Download PDFInfo
- Publication number
- JP4027840B2 JP4027840B2 JP2003137354A JP2003137354A JP4027840B2 JP 4027840 B2 JP4027840 B2 JP 4027840B2 JP 2003137354 A JP2003137354 A JP 2003137354A JP 2003137354 A JP2003137354 A JP 2003137354A JP 4027840 B2 JP4027840 B2 JP 4027840B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- information
- sentence
- genre
- selecting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- User Interface Of Digital Computer (AREA)
Description
【発明の属する技術分野】
本発明は情報を表示する装置に利用する。特に、情報の視聴者に対する情報への注意喚起および情報を印象付ける技術に関する。
【0002】
【従来の技術】
テレビ、ラジオ、街頭広告等のメディアでは、情報への注意の喚起や、情報を印象付けるための方法として、人気の高い芸能人を起用する、人気の高いデザイナーによるデザインを用いる、効果音を付加する、定評のある制作者・編集者によりコンテンツを制作する、等の方法を用いている。
【0003】
パソコンを用いて情報を得ようとする場合は、ユーザはアクティブに情報を検索する必要がある。しかし一部、インターネット上の情報を閲覧する際に用いるブラウザとして、エージェントとして合成音声によりキャラクタが喋ったり、ユーザが音声入力をする等の、音声インタフェースを提供する技術が知られている。
【0004】
合成音声の生成法として、例えば、特許文献1の音声合成方法等が開示されている。しかし、従来の合成音声では、人間に近い自然な音声とは必ずしもいえないという問題があり、その問題を解決するためのインタフェースとして、画面にエージェントを表示する方法が行われている。
【0005】
音声合成の一つの応用例として、歌声を合成する歌声メッセージ生成・配信方法およびその装置(例えば、特許文献2参照)があり、利用者が希望する声質の歌声を希望する曲に希望する歌詞で合成し、配信する方法が行われている。
【0006】
注目を集める表示装置として、例えば、特許文献3の壁面移動パフォーマンス装置があり、これは壁面を自在に動き回り、衆目をひきつける効果が高い壁面移動パフォーマンス装置を提供している。
【0007】
広告配信方法として、例えば、特許文献4の電子広告システムがあり、広告端末に表示された広告を実際目にしている広告閲覧者のみが、広告表示端末に表示される広告データを変更可能にすることで広告閲覧者の広告への関心を高めるために有効な電子広告システムを提供している。
【0008】
【特許文献1】
特開平6−308997号公報
【特許文献2】
特開2002−132281号公報
【特許文献3】
特開平7−140919号公報
【特許文献4】
特開2002−150130号公報
【特許文献5】
特開平11−202884号公報
【特許文献6】
特開平10−139323号公報
【0009】
【発明が解決しようとする課題】
テレビ、ラジオ、街頭広告、パソコン等の情報発信装置および方法において、視聴者に対して、情報への注意を喚起し、さらにその情報を印象付けるという効果の向上は、これまで人手をかけてコンテンツの制作者や編集者の経験に頼り、行われてきた。そのため、時間やコスト等がかかるという問題があった。
【0010】
本発明では観点を変え、コンテンツの制作や編集そのものではなく、キャラクタの動作により情報への喚起や情報を印象付ける等の効果を向上させ、新規に作成されたコンテンツはもちろん、これまであったコンテンツにおいても適応の範囲を広げ、情報配信等の付加価値の高いサービスを提供することを目的とする。
【0011】
また、パソコンを用いて情報を得ようとする場合は、ユーザはアクティブに情報を検索する必要があり、受動的に情報を受け取ることは難しい。そのため、本技術では情報の配信媒体を問わず、受動的に情報を受け取ることを可能にすることを目的とする。
【0012】
さらに、これまで不自然であるとされてきた合成音声に関して、実体のあるキャラクタから音声を出力し、あたかも実体キャラクタそのものが喋っているかのようにみせることによって、より自然にみせることを目的とする。
【0013】
【課題を解決するための手段】
テレビ、ラジオ、街頭広告、パソコン等、情報を発信する装置や、そこでの情報発信方法は幅広く知られている。このような情報発信装置および方法において、視聴者に対して、情報への注意を喚起し、さらにその情報を印象付けることは重要な課題となる。また、パソコンを用いて情報を得ようとする場合は、ユーザはアクティブに情報を検索する必要がある。
【0014】
本発明は、このような情報発信装置および方法における、視聴者への注目喚起効果の向上および印象の残存性の向上または情報の受動的な取得を可能にする配信の充実を図った情報発信の装置および方法に関する。
【0015】
上記目的を達成するための手段として、実体キャラクタと画像キャラクタとを用いる。実体キャラクタが登場や退場の動作をしたり、画像キャラクタが登場や退場の動作を行う。
【0016】
実体キャラクタが登場退場する際、コンテンツのテキスト情報を歌にしたものを歌ったり、喋ったり、手を振る等の動作をする。登場動作終了後は、実体キャラクタと画像キャラクタとを連携させコミュニケーションをとったりしながら情報を発信する。
【0017】
これまで不自然であるとされてきた合成音声に関して、実体のあるキャラクタから音声を出力し、あたかも実体キャラクタそのものが喋っているかのように見せ、その実体キャラクタと画像キャラクタとを連携させることによって、これまであった画像キャラクタによる合成音声の読み上げ方法を、より自然に見せる。
【0018】
すなわち、これまでエージェントが行って来た情報の発信方法に加え、実体キャラクタが登場退場の動作を行い、その際、歌ったり喋ったり、手を振る等の動作をすることにより、視覚的効果を高め、情報への注意を喚起することが可能となる。
【0019】
実体キャラクタが登場退場する際、コンテンツのテキスト情報を歌にしたものを歌ったり、喋ったり、手を振る等の動作をすることにより、さらに聴覚・視覚的効果を高め、注意を喚起すると同時に情報の内容を印象付けることが可能となる。また、歌ったり喋ったりする方法を用いることにより、音声で情報が発信されるため、視聴者は、テキスト情報を目で追う必要が無くなり、受動的に情報を受け取ることが可能となる。さらに、登場動作終了後は、実体キャラクタと画像キャラクタとを連携させ、より面白い内容となるようにし、情報の内容を印象付けることが可能となる。
【0020】
これまで不自然であるとされてきた合成音声に関して、実体のあるキャラクタから音声を出力し、あたかも実体キャラクタそのものが喋っているかのように見せ、その実体キャラクタと画像キャラクタとを連携させることによって、これまであった画像キャラクタによる合成音声の読み上げ方法を、より自然に見せることが可能となる。
【0021】
本発明は情報管理装置からの通知により新着情報を検知した実体キャラクタ制御装置からの信号によって登場し、さらに情報を発信した後退場するという情報の配信方法であり、このように各情報毎に登場したり退場したりすることによって、一件一件の情報への注意を引きつけるという作用を有する。
【0022】
本発明は、キャラクタが情報を読み上げる情報発信手段であるが、このように情報を発信することにより、例えば、Webブラウザを用いた場合のように、これまでアクティブに収集し取得してきた情報でも、受動的に受け取ることが出来る環境を提供するという作用を有する。
【0023】
本発明はキャラクタが情報を歌として歌う情報発信手段であるが、その発信する情報の内容によって、スポーツニュースのように歌にするとより楽しめるものもあれば、歌にするのは適切ではないと思われる事故のニュースなどがあり、それらの情報の特徴に合わせて情報発信の手段を選択し、情報をより的確に伝えるという効果を有する。
【0024】
すなわち、本発明の第一の観点は、情報発信方法であって、本発明の特徴とするところは、情報を収集するステップと、この収集した情報から当該情報のタイトルおよび内容を表す単語または文章を選択するステップと、この選択された単語または文章に基づき当該情報のジャンルを決定するステップと、この決定されたジャンルに基づきテキスト原稿作成用文章例を選択するステップと、この選択された前記テキスト原稿作成用文章例に基づき前記単語または文章を選択するステップにより選択された前記単語または文章の並べ替えを行うステップと、この並べ替えられた前記単語または文章を連結してテキスト原稿を作成するステップと、この作成されたテキスト原稿を音声により読み上げるステップと、この読み上げに反応してキャラクタを動作させるステップとを実行するところにある(請求項1)。
【0025】
また、前記キャラクタを動作させるステップは、前記ジャンルを決定するステップにより決定されたジャンルに応じて前記キャラクタの動作パターンを選択するステップを実行し、前記読み上げるステップは、前記ジャンルを決定するステップにより決定されたジャンルに応じて読み上げ時の発話パターンを選択するステップを実行することができる(請求項2)。
【0026】
また、前記キャラクタは複数設けられ、前記読み上げるステップは、前記テキスト原稿の内容を分割し当該複数のキャラクタにそれぞれ割り当てそれぞれ異なる音声により読み上げるステップを実行し、前記キャラクタを動作させるステップは、前記読み上げの内容に応じて当該複数のキャラクタを連携して動作させるステップを実行することができる(請求項3)。
【0027】
また、複数の前記キャラクタのいずれかはモータにより駆動される人形であり、その他はディスプレイに表示された画像であることができる(請求項4)。
【0028】
前記文章の並べ替えを行うステップは、前記単語または文章を選択するステップにより選択された前記単語または文章をその属性に基づき分類するステップと、前記単語または文章をその属性に応じてあらかじめ定められた所定の配置位置に挿入するステップとを実行することができる(請求項5)。
【0029】
また、前記連携して動作させるステップは、前記人形によるキャラクタが前記画像によるキャラクタとなって前記ディスプレイに入り込んだように、あるいは、前記画像によるキャラクタが前記人形によるキャラクタとなって前記ディスプレイから飛び出したように見えるように動作させるステップを実行することができる(請求項6)。
【0030】
あるいは、前記連携して動作させるステップは、前記複数のキャラクタが互いに対話しているように見えるように動作させるステップを実行することができる(請求項7)。このときに、対話の相手は、人形によるキャラクタ同士であったり、あるはい、画像によるキャラクタ同士であったり、あるいは、画像によるキャラクタと人形によるキャラクタとであったりすることができる。
【0031】
また、前記読み上げるステップは、旋律を生成するステップと、この旋律にしたがって前記テキスト原稿を歌として読み上げるステップとを実行することができる(請求項8)。
【0032】
本発明の第二の観点は、情報発信装置であって、本発明の特徴とするところは、情報を収集する手段と、この収集する手段により収集した情報から当該情報のタイトルおよび内容を表す単語または文章を選択する手段と、この選択する手段により選択された単語または文章に基づき当該情報のジャンルを決定する手段と、この決定する手段により決定されたジャンルに基づきテキスト原稿作成用文章例を選択する手段と、この選択する手段により選択された前記テキスト原稿作成用文章例に基づき前記単語または文章を選択する手段により選択された前記単語または文章の並べ替えを行う手段と、この並べ替えを行う手段により並べ替えられた前記単語または文章を連結してテキスト原稿を作成する手段と、この作成する手段により作成されたテキスト原稿を音声により読み上げる手段と、この読み上げる手段の読み上げに反応してキャラクタを動作させる手段とを備えたところにある(請求項9)。
【0033】
また、前記キャラクタを動作させる手段は、前記ジャンルを決定する手段により決定されたジャンルに応じて前記キャラクタの動作パターンを選択する手段を備え、前記読み上げる手段は、前記ジャンルを決定する手段により決定されたジャンルに応じて読み上げ時の発話パターンを選択する手段を備えることができる(請求項10)。
【0034】
また、前記キャラクタは複数設けられ、前記読み上げる手段は、前記テキスト原稿の内容を分割し当該複数のキャラクタにそれぞれ割り当てそれぞれ異なる音声により読み上げる手段を備え、前記キャラクタを動作させる手段は、前記読み上げの内容に応じて当該複数のキャラクタを連携して動作させる手段を備えることができる(請求項11)。
【0035】
また、前記文章の並べ替えを行う手段は、前記単語または文章を選択する手段により選択された前記単語または文章をその属性に基づき分類する手段と、前記単語または文章をその属性に応じてあらかじめ定められた所定の配置位置に挿入する手段とを備えることができる(請求項12)。
【0036】
また、前記読み上げる手段は、旋律を生成する手段と、この旋律にしたがって前記テキスト原稿を歌として読み上げる手段とを備えることができる(請求項13)。
【0037】
本発明の第三の観点は、プログラムであって、本発明の特徴とするところは、情報処理装置にインストールすることにより、その情報処理装置に、本発明の情報発信方法の各ステップを実行させるところにある。あるいは、情報処理装置にインストールすることにより、その情報処理装置に、本発明の情報発信装置の各手段に相応する機能を実現させるところにある(請求項14、15)。
【0038】
本発明のプログラムは記録媒体に記録されることにより、前記情報処理装置は、この記録媒体を用いて本発明のプログラムをインストールすることができる。あるいは、本発明のプログラムを保持するサーバからネットワークを介して直接前記情報処理装置に本発明のプログラムをインストールすることもできる。
【0039】
これにより、情報処理装置を用いて、コンテンツの制作や編集そのものではなく、キャラクタの動作により情報への喚起や情報を印象付ける等の効果を向上させ、新規に作成されたコンテンツはもちろん、これまであったコンテンツにおいても適応の範囲を広げ、情報配信等の付加価値の高いサービスを提供し、また、情報の配信媒体を問わず、受動的に情報を受け取ることを可能にし、さらに、これまで不自然であるとされてきた合成音声に関して、実体のあるキャラクタから音声を出力し、あたかも実体キャラクタそのものが喋っているかのようにみせることによって、より自然にみせることができる情報発信方法および装置を実現することができる。
【0040】
【発明の実施の形態】
本発明実施形態の情報発信装置を図1〜図9を参照して説明する。図1は本実施形態のキャラクタによる情報発信装置を示す図である。図2は本実施形態のキャラクタによる情報発信方法の基本手順を示す流れ図である。図3は本実施形態のキャラクタによる情報発信方法の基本手順のうち情報処理手順の詳細を示す流れ図である。図4は本実施形態のキャラクタによる情報発信方法の基本手順のうち情報のジャンルを決定するための辞書を示す図である。図5は本実施形態のキャラクタによる情報発信方法の基本手順のうち並べ替えによる読み上げ用テキスト生成の手順を示す流れ図である。図6は本実施形態のキャラクタによる情報発信方法の基本手順のうち読み上げ用テキストのフラグに埋め込む文章を示す図である。図7は本実施形態のキャラクタによる情報発信方法の基本手順のうちキャラクタ動作決定の詳細な流れを示す図である。図8は本実施形態のキャラクタによる情報発信方法の基本手順のうちキャラクタ動作決定の詳細を各ジャンル毎に示した図である。図9は本実施形態のキャラクタによる情報発信方法のうち実体キャラクタ動作を示した図である。
【0041】
本実施形態の情報発信装置は、図1に示すように、情報を収集する情報処理部10と、この情報処理部10により収集した情報から当該情報のタイトルおよび内容を表す単語または文章を選択する情報選択部11と、この情報選択部11により選択された単語または文章に基づき当該情報のジャンルを決定するジャンル決定部12と、このジャンル決定部12により決定されたジャンルに基づきテキスト原稿作成用文章例を選択する文章例選択部13と、この文章例選択部13により選択された前記テキスト原稿作成用文章例に基づき情報選択部11により選択された前記単語または文章の並べ替えを行う情報並べ替え部14と、この情報並べ替え部14により並べ替えられた前記単語または文章を連結してテキスト原稿を作成するテキスト原稿作成部15と、このテキスト原稿作成部15により作成されたテキスト原稿を音声により読み上げるテキスト読み上げ部16と、このテキスト読み上げ部16の読み上げに反応してキャラクタを動作させるキャラクタ制御部2とを備えたところにある(請求項9)。
【0042】
キャラクタ制御部2は、ジャンル決定部12により決定されたジャンルに応じて前記キャラクタの動作パターンを選択するキャラクタ動作決定部20を備え、テキスト読み上げ部16は、ジャンル決定部12により決定されたジャンルに応じて読み上げ時の発話パターンを選択する発話パターン選択部17を備える(請求項10)。
【0043】
前記キャラクタは複数設けられ、図1の例では、一つは実体キャラクタであり、他の一つは画像キャラクタである。テキスト読み上げ部16は、前記テキスト原稿の内容を分割し当該複数のキャラクタにそれぞれ割り当てそれぞれ異なる音声により読み上げる読み上げキャラクタ割当部18を備え、キャラクタ制御部2は、前記読み上げの内容に応じて当該複数のキャラクタを連携して動作させる(請求項11)。
【0044】
また、情報並べ替え部14は、図6に示すように、情報選択部11により選択された前記単語または文章をその属性に基づき分類し、前記単語または文章をその属性に応じてあらかじめ定められた所定の配置位置に挿入する(請求項12)。
【0045】
また、テキスト読み上げ部16は、旋律を生成する旋律生成部19を備え、この旋律にしたがって前記テキスト原稿を歌として読み上げることもできる(請求項13)。
【0046】
本発明は、汎用の情報処理装置にインストールすることにより、上述の情報発信装置として機能させるプログラムとして実現することができる(請求項14、15)。このプログラムは、記録媒体に記録されて情報処理装置にインストールされ、あるいは通信回線を介して情報処理装置にインストールされることにより当該情報処理装置を本実施形態の情報発信装置として機能させることができる。
【0047】
以下に本発明実施形態を、図面を参照して詳細に説明する。図2に本発明実施形態の基本手順を示す。ステップS1の情報処理部で情報を検知し、情報処理し、ステップS2のキャラクタ動作決定部でキャラクタ動作を決定し、ステップS3の情報発信動作部で情報発信のための動作を行う。なお、図1に示した情報発信装置において、ステップS1は情報処理部1で実施され、ステップ2はキャラクタ制御部2で実施され、ステップS3は表示部3で実施される。表示部3は画像キャラクタ、実体キャラクタおよびスピーカを備え、ここから情報を発信する。
【0048】
図2のステップS1の情報処理では、情報から必要な箇所を選択し、情報のタイトル、ジャンル、キーワード等を抽出し、抽出したデータを基に情報を並べ替えることにより読み上げ用のテキスト原稿を作成する。図3に図2のステップS1の処理手順の詳細を示す。まず、ステップS101である程度広範囲に情報を収集する。その情報の中から、ステップS102では必要なものを選択する。ステップS103では、選択した情報に基づき情報のジャンルを決定する。選択した情報をステップS104で並べ替えて、ステップS105で読み上げ用の原稿とする(請求項1)。
【0049】
ここではステップS102での必要な情報の選択、ステップS103でのジャンル決定、ステップS104での情報の並べ替え、ステップS105の読み上げ用テキスト原稿の作成を行う例として、インターネット上のニュースサイトの内容を挙げてこの手順を説明する。例えば、代表的なニュースサイトであるアサヒ・コム(http://www.asahi.com)を閲覧すると、各ニュースはタイトルと本文および場合によって画像とその画像を説明する短いテキストにより構成されている。タイトルは平均23.7文字で構成され、本文はおよそ250〜450文字、2〜3のパラグラフで構成されている(発明者が無作為に選んだアサヒ・コム内の10個のサイトを調査)。
【0050】
ステップS1では、このような読み物として作られた情報を、例えば読み上げる場合に、読み上げに適した長さのテキストを再構成するための手順を示しているのが図3である。ステップS102では、このタイトルと本文、また画像の周りのテキストのうち、タイトルからはタイトル全文、本文からは各パラグラフの第一文、画像の周りのテキスト全文を選択する。次にステップS103では、ステップS102で選択した文章において、あらかじめ準備した辞書内のキーワードの有無により、この情報のジャンルをスポーツ、お天気、特例である等とそれぞれ決定する。図4に辞書の例を示す。
【0051】
例えば、スポーツ用辞書の場合、スポーツ、野球、ゴルフ、…等があり、これらに相当する単語があれば情報のジャンルはスポーツであると決定する。いずれの辞書のキーワードも含まれていない場合は、その他としてジャンルを決定する。次にステップS104ではステップS103で図5に示す手順でステップS102で選択した文章を並べ替える。
【0052】
ステップS104−01でテキストファイルを作成し、ステップS104−02で冒頭用フラグを書き込み、ステップS104−03でタイトル書き込みを行う。ステップS104−04では画像の有無を判定する。画像が有る場合はステップS104−05に進み画像用フラグを書き込み、ステップS104−06で画像付近のテキスト書き込みを行う。画像が無い場合はステップS104−07へ進み、パラグラフの有無を判定する。パラグラフが有る場合はステップS104−08に進み本文用フラグを書き込み、ステップS104−09でパラグラフ中の第一文の書き込みを行う。パラグラフが無い場合は終了処理を行う。以上の手順をフローチャートに示すとおり順次行う。最後にステップS105で読み上げ用のテキスト原稿を完成する(請求項5)。
【0053】
ここでは、ステップS103で決定したこの情報のジャンルごとに、スポーツにはスポーツ用文章、お天気にはお天気用文章、特例とそれ以外のジャンルにはその他用文章を図6に示す文章例を基に各フラグ毎に書き込む。以上の手順で読み上げ用のテキスト原稿を作成する。この手順を用いて例えばスポーツ用の読み上げ用のテキスト原稿を作成すると以下のようになる。
【0054】
「スポーツのニュースがあるよ。今日はどんなスポーツがあったのかな?」「ヤンキーズ松本、トロントスカイドームで練習」「見てみて、この写真はね、開幕を翌日に控え、チームメートと談笑しながらストレッチで汗を流す松本だよ」「このニュースの内容はね、ヤンキーズの松本は30日、開幕戦を翌日に控えて、カナダ・トロントのスカイドームで練習試合をした」「それからね、正午から2時間、打撃練習などをしてドームの感触を確かめたんだって」
図7に図2のステップS2の処理手順の詳細を示す。ステップS202では発信する情報の種類に応じてキャラクタの動作を決定し、ステップS203では発信する情報の種類に応じてキャラクタの喋り方、歌うないし読み上げる等の発話方法を決定する(請求項2)。ステップS204では発信する情報の種類に応じて掛け合いの方法を決定する。その際、ステップS201では、ステップS103で決定した情報のジャンルによって、内容を変化させる。このジャンルと内容の対応例を図8に示し、以下に詳細に述べる。
【0055】
情報がスポーツである場合、キャラクタの動作は大きくかつ頻度も高く設定し、喋り方は話し言葉とする。歌も併用しテキストの内容を歌にしたものをキャラクタが歌う。掛け合いはボケと突っ込み等コミカルなものとする。情報が天気である場合、キャラクタの動作は中程度とする。喋り方は話し言葉とする。掛け合いは質問形式にし、視聴者がより情報を記憶に残りやすいようにする。情報が特例およびその他のジャンルである場合、キャラクタの動作は小さくし、頻度も低くする。喋り方はアナウンサーのようにし、内容を伝えることに主眼を置く。掛け合いも少なくし、特に特例の場合は掛け合いは全く使わず、交互に内容を読み上げるだけにとどめる。
【0056】
ここでは、実体キャラクタおよび画像キャラクタの両者に関する処理手順を示している(請求項4)。実体キャラクタ同士による動作、実体キャラクタと画像キャラクタとの組み合わせによる動作、画像キャラクタ同士の動作がそれぞれある。実体キャラクタおよび画像キャラクタのうち、互いに同種類のキャラクタ同士は連動し、実体キャラクタが退場するなどして隠れたことを受けて画像キャラクタが画面の中に登場したり、逆に画像キャラクタが画面に表示されなくなるなどして隠れたことを受けて実体キャラクタが登場したりすることにより、あたかもキャラクタが実世界と画面上を行き来しているかのような動作を行う(請求項6)。
【0057】
情報を発信する際、キャラクタは登場・退場の動作を行うが、このときキャラクタは手を振ったり、喋ったり、歌を歌ったりしながら登場・退場の動作を行うことにより、情報に対する注意を喚起する。
【0058】
図9に実体キャラクタの動きを示す。矢印で示されたとおり、キャラクタ本体中の動きM1は首、動きM2は顔、動きM3は口、動きM4は手、動きM5は胴体、動きM6足、および動きM7キャラクタの台座の動きを示し、これらの動きを複合的に行い、登場や退場または発話時の発話らしい動作を行い視聴者への情報の注意を喚起する。例えば、ステップS103で発信する情報がスポーツであると決定された場合、登場時に台座の動きM7は速く、手の動きM7は手を上げた状態且つ手を振る。登場が終わり、コンテンツを発信する際には、足の動きM6で歩いているように見せながら、胴体の動きM5で画面の方を向き、同時に腕の動きM4でコンテンツを指し示すように手を上げ、首および顔の動きM1、M2を用いてコンテンツを見るようにする。
【0059】
口の動きM3を伴いながらコンテンツの内容を発話し、発話中は首および顔の動きM1、M2により、視聴者の方を見たり、コンテンツの方を向いたりを頻繁に繰り返し、手の動きM4胴の動きM5足の動きM6を加えて身振り手振りをしているような動作を行う。退場時には登場時同様、手の動きM7により手を上げた状態且つ手を振ったり、足の動きM6で飛び跳ねているように見せたりする。
【0060】
読み上げまたは歌を歌う際、合成音を用いる場合と、人間が実際に発声した物を使う場合の両者を用いることにより、そのコンテンツの内容にあった形で、より質の高い情報の配信を実現する。
【0061】
発信する情報の内容が特にマニュアルや、Q&A(質疑応答)の形である場合、キャラクタ同士に掛け合いをさせる(請求項3、7)。例えば「どうしてそうなるの?」「それはね、〇〇だからだよ」のように話し言葉による会話の形をとることによって、ただ文章のままのマニュアルやQ&Aよりも、分かり易く且つ印象深い内容で情報を提供する。
【0062】
発信する情報の内容が特に対談である場合、各キャラクタに役割分担をさせることによって、その対談形式の情報を実際の対談と同じ様に受け取ることを可能にする。
【0063】
動作の決定方法は以下に3点示す。
【0064】
1)歌の音階の種類により、動作を決定する。情報処理部1で生成された音楽や、あらかじめ準備してあった音楽のうち、キャラクタ制御部2が、選択した音楽の音階の種類によって、動作方法を決定する。
【0065】
2)テキストから情報を収集し動作の種類を決定する。その際、例えば、特許文献5に示されている合成音声メッセージ編集作成方法を用いて、テキストから情報を収集し動作の種類を決定する。
【0066】
3)例えば、特許文献5を応用し、動作を決定する。キャラクタの種類を想定し、キャラクタごとに適した辞書を用意し、辞書内の決められた単語の種類によって楽しく、悲しく等の動作を決定する。
【0067】
例えば、特許文献5や特許文献6の合成音声メッセージ編集作成方法、その装置およびその方法を記録した記録媒体等による合成音声は、その音質から、人間の発声を模したものとしての違和感があり、自然に聞こえないという問題点があった。しかし本発明のキャラクタによる情報発信方法を適用することにより、音を聞く際の注意がキャラクタに向けられることにより分散されたり、もともと作り物であるキャラクタが喋っているように見えるために自然に見えたりする場合がある。
【0068】
例えば、特許文献2の音声メッセージ生成・配信方法およびその装置を用いて情報処理部1によって準備された読み上げ用テキストに対し、音楽をつけて、歌を生成する(請求項8)。
【0069】
本発明は、もともとテキストや画像といった、見て認識する視聴情報に対して、それを基に読み上げ用のテキスト原稿を作り、キャラクタに読み上げさせたり、歌わせたりする視聴情報を加えるため、例えば他の事をしているときなどでも、なんとなく音を聞いているだけで受動的に情報を得ることができる。
【0070】
【発明の効果】
以上述べたように、本発明によれば、情報への喚起や情報を印象付ける等の効果を向上させ、受動的に情報を受け取ることを可能にし、これまで不自然であるとされてきた合成音声を、より自然なものとして提供できる。
【図面の簡単な説明】
【図1】本実施形態のキャラクタによる情報発信装置を示す図。
【図2】本実施形態のキャラクタによる情報発信方法の基本手順を示す流れ図。
【図3】本実施形態のキャラクタによる情報発信方法の基本手順のうち情報処理手順の詳細を示す流れ図。
【図4】本実施形態のキャラクタによる情報発信方法の基本手順のうち情報のジャンルを決定するための辞書を示す図。
【図5】本実施形態のキャラクタによる情報発信方法の基本手順のうち並べ替えによる読み上げ用テキスト生成の手順を示す流れ図。
【図6】本実施形態のキャラクタによる情報発信方法の基本手順のうち読み上げ用テキストのフラグに埋め込む文章を示す図。
【図7】本実施形態のキャラクタによる情報発信方法の基本手順のうちキャラクタ動作決定の詳細な流れを示す図。
【図8】本実施形態のキャラクタによる情報発信方法の基本手順のうちキャラクタ動作決定の詳細を各ジャンル毎に示した図。
【図9】本実施形態のキャラクタによる情報発信方法のうち実体キャラクタ動作を示した図。
【符号の説明】
1 情報処理部
2 キャラクタ制御部
3 表示部
10 情報収集部
11 情報選択部
12 ジャンル決定部
13 文章例選択部
14 情報並べ替え部
15 テキスト原稿作成部
16 テキスト読み上げ部
17 発話パターン選択部
18 読み上げキャラクタ割当部
19 旋律生成部
20 キャラクタ動作決定部
Claims (7)
- 情報を収集するステップと、
この収集した情報から当該情報のタイトルおよび内容を表す単語または文章を選択するステップと、
この選択された単語または文章に基づき当該情報のジャンルを決定するステップと、
この決定されたジャンルに基づきテキスト原稿作成用文章例を選択するステップと、
この選択された前記テキスト原稿作成用文章例に基づき前記単語または文章を選択するステップにより選択された前記単語または文章の並べ替えを行うステップと、
この並べ替えられた前記単語または文章を連結してテキスト原稿を作成するステップと、
この作成されたテキスト原稿を音声により読み上げるステップと、
この読み上げに反応してキャラクタを動作させるステップと
からなり、
前記キャラクタは、モータによって駆動される人形である実体キャラクタと、ディスプレイに表示される画像キャラクタとからなり、
前記読み上げるステップは、前記テキスト原稿の内容を分割して前記複数のキャラクタにそれぞれ割り当てそれぞれ異なる音声により読み上げるステップを実行し、
前記キャラクタを動作させるステップは、前記実体キャラクタが隠れたことを受けて前記画像キャラクタをディスプレイに登場させ、あるいは画像キャラクタがディスプレイに表示されなくなったことを受けて前記実体キャラクタを登場させるステップを実行する
ことを特徴とする情報発信方法。 - 前記キャラクタを動作させるステップは、前記ジャンルを決定するステップにより決定されたジャンルに応じて前記キャラクタの動作パターンを選択するステップを実行し、
前記読み上げるステップは、前記ジャンルを決定するステップにより決定されたジャンルに応じて読み上げ時の発話パターンを選択するステップを実行する
請求項1記載の情報発信方法。 - 前記文章の並べ替えを行うステップは、
前記単語または文章を選択するステップにより選択された前記単語または文章をその属性に基づき分類するステップと、
前記単語または文章をその属性に応じてあらかじめ定められた所定の配置位置に挿入するステップと
を実行する請求項1記載の情報発信方法。 - 情報を収集する手段と、
この収集する手段により収集した情報から当該情報のタイトルおよび内容を表す単語または文章を選択する手段と、
この選択する手段により選択された単語または文章に基づき当該情報のジャンルを決定する手段と、
この決定する手段により決定されたジャンルに基づきテキスト原稿作成用文章例を選択する手段と、
この選択する手段により選択された前記テキスト原稿作成用文章例に基づき前記単語または文章を選択する手段により選択された前記単語または文章の並べ替えを行う手段と、
この並べ替えを行う手段により並べ替えられた前記単語または文章を連結してテキスト原稿を作成する手段と、
この作成する手段により作成されたテキスト原稿を音声により読み上げる手段と、
この読み上げる手段の読み上げに反応してキャラクタを動作させる手段と
を備え、
前記キャラクタは、モータによって駆動される人形である実体キャラクタと、ディスプレイに表示される画像キャラクタとからなり、
前記読み上げる手段は、前記テキスト原稿の内容を分割して前記複数のキャラクタにそれぞれ割り当てそれぞれ異なる音声により読み上げる手段を備え、
前記キャラクタを動作させる手段は、前記実体キャラクタが隠れたことを受けて前記画像キャラクタをディスプレイに登場させ、あるいは画像キャラクタがディスプレイに表示されなくなったことを受けて前記実体キャラクタを登場させる手段を含む
ことを特徴とする情報発信装置。 - 前記キャラクタを動作させる手段は、前記ジャンルを決定する手段により決定されたジャンルに応じて前記キャラクタの動作パターンを選択する手段を備え、
前記読み上げる手段は、前記ジャンルを決定する手段により決定されたジャンルに応じて読み上げ時の発話パターンを選択する手段を備えた
請求項4記載の情報発信装置。 - 前記文章の並べ替えを行う手段は、
前記単語または文章を選択する手段により選択された前記単語または文章をその属性に基づき分類する手段と、
前記単語または文章をその属性に応じてあらかじめ定められた所定の配置位置に挿入する手段と
を備えた請求項4記載の情報発信装置。 - 情報処理装置にインストールすることにより、その情報処理装置に、請求項4ないし6のいずれかに記載の情報発信装置の各手段に相応する機能を実現させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003137354A JP4027840B2 (ja) | 2003-05-15 | 2003-05-15 | 情報発信方法および装置およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003137354A JP4027840B2 (ja) | 2003-05-15 | 2003-05-15 | 情報発信方法および装置およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004341811A JP2004341811A (ja) | 2004-12-02 |
JP4027840B2 true JP4027840B2 (ja) | 2007-12-26 |
Family
ID=33527039
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003137354A Expired - Fee Related JP4027840B2 (ja) | 2003-05-15 | 2003-05-15 | 情報発信方法および装置およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4027840B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013164793A (ja) * | 2012-02-13 | 2013-08-22 | Future Tech Lab Co Ltd | 現代の電子機器の操作に於いて、利用者毎に同期した操作システムを構成して、異種の電子機器間で利用者個々に同一操作を実現するエージェントシステム |
JP7481174B2 (ja) | 2020-06-25 | 2024-05-10 | セコム株式会社 | 表示装置 |
-
2003
- 2003-05-15 JP JP2003137354A patent/JP4027840B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2004341811A (ja) | 2004-12-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020024582A1 (zh) | 语音合成方法及相关设备 | |
Heidemann | A System for Describing Vocal Timbre in Popular Song. | |
Altman | Sound theory, sound practice | |
Landy | Understanding the art of sound organization | |
Waters | Performance Ecosystems: Ecological approaches to musical interaction | |
Emmerson et al. | Expanding the Horizon of Electroacoustic Music Analysis | |
JP2003521750A (ja) | スピーチシステム | |
CN109147800A (zh) | 应答方法和装置 | |
Taylor | Music in the world: Selected essays | |
JP2011528879A (ja) | テレビジョンシーケンスを提供するための装置および方法 | |
Bell | The dB in the. db: Vocaloid software as posthuman instrument | |
CN110570841A (zh) | 多媒体播放界面的处理方法、装置、客户端及介质 | |
CN113538628A (zh) | 表情包生成方法、装置、电子设备及计算机可读存储介质 | |
Caquard et al. | Designing sound in cybercartography: from structured cinematic narratives to unpredictable sound/image interactions | |
Taylor et al. | Using music to interact with a virtual character | |
Morris | Multimedia systems: Delivering, generating and interacting with multimedia | |
JP2010140278A (ja) | 音声情報可視化装置及び音声情報可視化プログラム | |
James | Representing structured information in audio interfaces: A framework for selecting audio marking techniques to represent document structures | |
JP4027840B2 (ja) | 情報発信方法および装置およびプログラム | |
Adkins et al. | Music beyond Airports: Appraising ambient music | |
CN105976802A (zh) | 基于机器学习技术的音乐自动生成系统 | |
Heidemann | Hearing Women's Voices in Popular Song: Analyzing Sound and Identity in Country and Soul | |
Levy-Landesberg | Sound and the city: Rethinking spatial epistemologies with urban sound maps | |
Jude | Vocal processing in transnational music performances, from phonograph to Vocaloid | |
Liu | Language, identity and unintelligibility: A case study of the rap group Higher Brothers |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050708 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070614 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070619 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070806 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20071009 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20071010 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101019 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101019 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101019 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111019 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111019 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121019 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121019 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131019 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |