JP2005266671A - ロボット及び音声再生方法 - Google Patents
ロボット及び音声再生方法 Download PDFInfo
- Publication number
- JP2005266671A JP2005266671A JP2004082504A JP2004082504A JP2005266671A JP 2005266671 A JP2005266671 A JP 2005266671A JP 2004082504 A JP2004082504 A JP 2004082504A JP 2004082504 A JP2004082504 A JP 2004082504A JP 2005266671 A JP2005266671 A JP 2005266671A
- Authority
- JP
- Japan
- Prior art keywords
- data
- voice
- robot
- display
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Toys (AREA)
- Manipulator (AREA)
Abstract
【課題】 読み上げる音声に抑揚等を付けて再生することができるとともに、メッセージに合わせた動作を行うことができるロボットを提供する。
【解決手段】 発音する文字を示す発声文字列と該発声文字の抑揚や発音長を制御する制御記号を発音する時間順にテキストで記述した発音文字列とからなる音声合成用データと、動作を指示する動作データとを一括して受信するデータ受信手段と、音声合成用データを解釈して音声再生する音声再生手段と、動作データを解釈して、音声再生手段によって再生した音声に同期して動作を行う動作制御手段とを備える。
【選択図】 図1
【解決手段】 発音する文字を示す発声文字列と該発声文字の抑揚や発音長を制御する制御記号を発音する時間順にテキストで記述した発音文字列とからなる音声合成用データと、動作を指示する動作データとを一括して受信するデータ受信手段と、音声合成用データを解釈して音声再生する音声再生手段と、動作データを解釈して、音声再生手段によって再生した音声に同期して動作を行う動作制御手段とを備える。
【選択図】 図1
Description
本発明は、通信手段を介して受信したメッセージの内容を読み上げるとともに、メッセージの音声に合わせて行動を起こすロボットに関する。
従来から、電子メールにてメッセージが送られると、送られたメッセージの文字列に埋め込まれている動作制御情報を抽出し、この制御情報に合致する動作制御データをテーブルから読み込み、その動作をロボットに動作せるとともに、同時に送られたメッセージを音声で読み上げるメッセージ処理システムが知られている(例えば、特許文献1参照)。
特開2003−308142号公報
しかしながら、特許文献1に示すシステムにあっては、音声に抑揚の変化を与えることができないために、読み上げたメッセージの音声が単調になってしまうという問題がある。また、メッセージの文字列中に埋め込まれている動作制御情報に基づいて、ロボットの動作の制御を行っていたため、メッセージに合わせたより細かい動作の制御を行うことが困難であるという問題もある。
本発明は、このような事情に鑑みてなされたもので、読み上げる音声に抑揚等を付けて再生することができるとともに、メッセージに合わせた動作を行うことができるロボット及び音声再生方法を提供することを目的とする。
請求項1に記載の発明は、発音する文字を示す発声文字列と該発声文字の抑揚や発音長を制御する制御記号を発音する時間順にテキストで記述した発音文字列とからなる音声合成用データと、動作を指示する動作データとを一括して受信するデータ受信手段と、前記音声合成用データを解釈して音声再生する音声再生手段と、前記動作データを解釈して、前記音声再生手段によって再生した音声に同期して動作を行う動作制御手段とを備えたことを特徴とする。
請求項2に記載の発明は、前記動作データは、ロボットの各部の動作を指示する動作イベントと、該動作イベントを実行するタイミングを表す時間データからなることを特徴とする。
請求項3に記載の発明は、前記動作データは、ロボットの各部の動作を指示する動作イベントであり、該動作イベントが動作させるタイミングに合わせて発音文字列間に記述されていることを特徴とする。
請求項4に記載の発明は、前記データ受信手段は、前記音声合成用データと前記動作データに加え、さらに声色データを受信し、前記音声再生手段は、受信した声色データに基づいて、発音させる音声の声色を変化させて再生することを特徴とする。
請求項5に記載の発明は、前記データ受信手段は、前記音声合成用データと前記動作データに加え、さらに表示手段に表示する表示データを受信し、前記表示データを解釈して、前記音声再生手段によって再生した音声に同期して表示データを表示する表示手段をさらに備えたことを特徴とする。
請求項6に記載の発明は、音声合成用データとロボットの動作データとを作成するデータ作成手段と、前記音声合成用データと前記動作データを送信する送信手段と、前記音声合成用データと前記動作データとを受信する受信手段を備え、受信したデータに基づいてメッセージを再生するロボットとからなる装置における音声再生方法であって、前記データ作成手段により、発音する文字を示す発声文字と該発声文字の抑揚や発音長を制御する制御記号を発音する時間順にテキストで記述した発音文字列とからなる音声合成用データ及び前記ロボットの各部の動作を指示する動作データを作成する過程と、前記送信手段により、前記音声合成用データ及び動作データを一括して前記ロボットへ送信する過程と、前記受信手段により、前記音声合成用データ及び動作データを受信する過程と、前記ロボットが、受信した前記音声合成用データを解釈して音声再生するとともに、前記動作データを並行して解釈し、音声再生した音声に同期して各部の動作を行う過程と有することを特徴とする。
本発明によれば、読み上げる文字列に抑揚やテンポをつけることができ、より人間に近い音声によって、メッセージを読み上げることができるという効果が得られる。
また、再生音声に同期させて、動作を行うようにしたため、より表現力の高いメッセージ再生を実現することができるという効果が得られる。
また、発音させる音声の声色を変化させて再生するようにしたため、メッセージの表現力をより高めることができるという効果が得られる。
また、再生した音声に同期して表示データを表示するようにしたため、メッセージの表現力をより高めることができるという効果が得られる。
また、再生音声に同期させて、動作を行うようにしたため、より表現力の高いメッセージ再生を実現することができるという効果が得られる。
また、発音させる音声の声色を変化させて再生するようにしたため、メッセージの表現力をより高めることができるという効果が得られる。
また、再生した音声に同期して表示データを表示するようにしたため、メッセージの表現力をより高めることができるという効果が得られる。
以下、本発明の一実施形態によるペット型ロボットを図面を参照して説明する。図1は同実施形態の構成を示すブロック図である。この図において、符号1は、動作部を有する犬や猫の姿をしたペット型ロボット(以下、ロボットと称する)である。符号2は、ロボット1との間で無線通信を確立して情報通信を行う基地局である。符号3は、基地局2との間で通信を確立したロボット1をインターネット4に接続するためのインターネット接続サーバである。符号5は、パソコン8や基地局6を介した携帯電話端末7をインターネット4へ接続するためのインターネット接続サーバである。
符号10は、基地局2との間で無線通信を確立し、インターネット4に接続可能なパソコン8や携帯電話端末7とロボット1との間で情報通信を行う通信部である。符号11は、ロボットの動作及び通信処理を統括するCPUである。符号12は、ロボットの動作を制御するプログラムや通信プログラムが予め記憶されたROMである。符号13は、パソコン8や携帯電話端末7から受信した情報を一時的に記憶するRAMである。符号14は、入力操作を行う操作部である。符号15は、液晶のディスプレイ等からなる表示部である。符号16は、文字情報に基づいて発生させる音声信号を合成して出力する音声再生部である。符号17は、音声再生部16から出力される音声信号に基づいて、音声を発音させるスピーカである。符号18は、ロボット1の動作部である足や頭部の動作を制御する動作制御部である。符号19は、ロボット1に備えられている足(図示せず)を動作制御部18から出力される制御情報に基づいて駆動する足駆動部であり、回転数や回転速度が制御可能なモータ等で構成される。符号20は、ロボット1に備えられている頭部(図示せず)を動作制御部18から出力される制御情報に基づいて駆動する頭駆動部であり、回転数や回転速度が制御可能なモータ等で構成される。ここでは、足と頭の駆動部のみを図示したが、動作部として尾、首、耳、目等を動作させることが可能なペット型ロボットである場合は、それぞれに対応する駆動部が動作制御部18に接続され、動作制御部18から出力される制御情報に基づいて各駆動部により、尾、首、耳、目等の各動作部が動作する。
次に、図2、図3を参照して、パソコン8や携帯電話端末7からロボット1へメッセージを送る場合に使用するHVデータについて説明する。HVデータは、図2に示すように、HVデータコンテナというデータチャンクの集合体(符号D1)であり、HV−scriptデータチャンクD2、HVボイスデータチャンクD3及びキャラクタデータチャンクD4から構成される。キャラクタデータチャンクD4は、さらに動作データチャンクD5と表示データチャンクD6とから構成される。
HVとは「Humanoid Voice」の略で、人の声をシミュレートする音声合成機能のことであり、サイン波などの波形からフォルマント周波数を作り出して音声合成を行なうものである。HV−scriptデータは、テキストで記述され、このテキストデータをフォルマント辞書を元に音声合成用のデータを生成し、スピーカから発音させるためのデータである。HVボイスデータは、声質(声色)を変更するためのデータであり、フォルマントのパラメータを基準値からシフトする量などである。フォルマントのパラメータは、ピッチ、8個のフォルマントの周波数、レベル、フォルマント波形などがあり、これらを規定量シフトすることで声質を変えることが可能である。動作データは、ロボット1が備えている前述の各動作部に対応する各駆動部を動作させるためのデータである。表示データは、表示部15(ディスプレイ)に画像やテキストを表示するためのデータである。パソコン8や携帯端末7には、このようなHVデータを制作し、このHVデータを電子メールに添付してロボット1へ送信するためのソフトウェアを備えている。
ここで、図3を参照して、HV−scriptデータと動作データの一例を説明する。
図3に示すように、HV−scriptデータは、メッセージとして発声させる文字列(この例では、「K0@たんじょ_2うび*お‘めでS52とお〜*」)からなる。これからROM12内のフォルマント辞書を元に音声合成用のデータを生成し、スピーカから「たんじょうびおめでとう」と発音させるためのものである。このとき、HVボイスデータを参照して、声質を決定して、音声合成用データを生成する。
図3に示すように、HV−scriptデータは、メッセージとして発声させる文字列(この例では、「K0@たんじょ_2うび*お‘めでS52とお〜*」)からなる。これからROM12内のフォルマント辞書を元に音声合成用のデータを生成し、スピーカから「たんじょうびおめでとう」と発音させるためのものである。このとき、HVボイスデータを参照して、声質を決定して、音声合成用データを生成する。
ここで、上記HV−scriptに使われている各種記号について説明する。「K0」は、HVボイスデータを参照して、声質を決定するための記号であり、デフォルトとして決められている標準の男性の声であることを意味している。「@」は、文節の先頭に記述してその文節に韻律を与えるための記号であり、文節中の発声する文字の二つ目でピッチを高くし、最後の文字で下げるという意味である。つまり、「*」が文節区切りを示す記号であるため、「たんじょうび」という文節に対して、「ん」でピッチを高くし、「び」で下げることを表している。「_」はこの記号の後の文字(この記号の直後に数値がある場合は、この数値に続く文字)に対して、その文字の語頭でピッチを下げるという意味である。また、次の数字「2」は「_」の記号の変化量を表すものであり、数字が大きくなるほどピッチを下げる量を増大することを意味している。「‘」はこの記号の後の文字に対して、その文字の語頭でピッチを上げるという意味である。「S52」は1文字の発話速度を変化させる記号であり、この記号以降の文字における速度を指定している。Sの次に続く数字が大きいほど速く発音される。「〜」はピッチの揺れを持った長音であることを表す。このように、発声させる文字に各種記号を付けることにより、発声させたい文字に様々な抑揚を持たせるように記述することが可能となっている。
また、動作データは、時間データ(この例では、「3」)と動作イベント(この例では、「U1」)とからなるシーケンスデータである。この動作データは、再生を開始してから「3」秒後に「U1」に対応する動作を行い、さらに、その動作を開始してから「5」秒後に「U2」に対応する動作を行うことを意味している。「U1」は、例えば、「足を上げる」という動作制御データであり、「U2」は、「足を下げる」という動作制御データが予めROM12内に定義されている。すなわち、動作制御データとは、動作部に対応する駆動部の動作を規定するデータであり、動作イベントに対して設定されるものである。したがって、図3に示す例のデータを再生すると、音声で「たんじょうびおめでとう」と発音しながら、ロボット1の足が3秒後に上がり、その5秒後に足が下がるように、メッセージ再生が実行される。
なお、表示データも動作データと同様に、時間データと表示イベントからなるデータであり、表示イベントは表示させるための画像(テキスト)データを示すデータである。画像(テキスト)データは、HVデータに付加してもよいし、ロボット1のRAM13等に予め記憶されていてもよい。
なお、表示データも動作データと同様に、時間データと表示イベントからなるデータであり、表示イベントは表示させるための画像(テキスト)データを示すデータである。画像(テキスト)データは、HVデータに付加してもよいし、ロボット1のRAM13等に予め記憶されていてもよい。
次に、図4を参照して、図1に示す装置の基本動作を説明する。ここでは、パソコン8において作成したメッセージをロボット1において再生するものとして動作を説明する。まず、ロボット1のユーザは、ロボット1を留守番再生モードに設定するか、リアルタイム再生モードに設定するかを決定し、操作部14から留守番再生モード、リアルタイム再生モードのいずれかに設定をしておく。留守番再生モードは、受信したHVデータをRAM13内に記憶しておき、ユーザからの指示に基づいて再生を始めるモードである。また、リアルタイム再生モードは、HVデータを受信するとただちに再生を始めるモードである。ここで設定した内容は、CPU11が読み取り、RAM13へ記憶する。
次に、メッセージを送る者(以下、送信者と称する)は、パソコン8のHVデータ制作用ソフトウェアを使用してロボット1へ送信するメッセージを含むHVデータを作成する(ステップS1)。このとき、文字列に対して付与したい抑揚を指定するとともに、必要であればHVボイスデータを付加する。さらに、表示部15へ表示する画像データとロボット1の動作指示を指定する。例えば、「たんじょうびおめでとう」というメッセージを作成する場合は、元気な抑揚で明るい声色になるようにHV−Scriptを記述する。また、キャラクタがケーキを差し出すような画像データを付与するとともに、メッセージの読み上げに合わせたロボットの動作を指定するように記述することによりHVデータを作成する。そして、送信者は、作成したHVデータを添付した電子メールをロボット1に割り当てられた電子メールアドレスに対して送信する(ステップS2)。
この電子メールは、通信部10が受信し、添付されていたHVデータをRAM13へ記憶する(ステップS3)。これを受けて、CPU11は、RAM13から再生モードの設定を読み込み、現時点の設定が留守番再生モードであるか否かを判定する(ステップS4)。現時点で留守番再生モードが設定されていれば、CPU11は、操作部14からの再生指示待ちとなる。そして、操作部14から再生指示が入力された場合(ステップS5)、または、リアルタイム再生モードが設定されている場合、CPU11は、RAM13からHVデータを読み込み、先頭から順に解釈する(ステップS6)。続いて、CPU11は、HVデータを解釈して得られたデータを、表示部15、音声再生部16、動作制御部18へ出力することによって、HVデータを再生する(ステップS7)。
次に、図5を参照して、図4に示すステップS3〜S7の詳細を説明する。図5は、ロボット1において、メッセージを含むHVデータを再生する動作を示すフローチャートである。まず、CPU11は、操作部14から入力される情報を読み取り、入力された情報が再生指示であるか否かを判定し、再生指示があるまで待機する(ステップS11)。ここでいう再生指示とは、リアルタイム再生モードであるときにHVデータを受信した場合を含む。そして、再生指示があった場合、CPU11は、HVデータ処理(ステップS121〜S123)、動作データ処理(ステップS131〜S132)、表示データ処理(ステップS141〜142)をそれぞれスタートさせ、それぞれの処理を並行して処理する。
ここで、並行して処理する各処理動作を説明する。まず、CPU11は、RAM13からHVデータ中のHV−Scriptデータを抽出し、抽出したHV−Scriptデータを先頭から順に解釈し、フォルマントフレーム列データに変換する(ステップS121、S122)。そして、CPU11は、HV−Scriptデータを変換して得られたフォルマントフレーム列データを音声再生部16へ出力する(ステップS123)。これを受けて、音声再生部16は、フォルマントフレーム列データを再生することにより、メッセージを読み上げる音声信号を生成して、スピーカ17へ出力する。これにより、メッセージを読み上げる音声がスピーカ17から発音する。
HVデータ処理と並行して、CPU11は、RAM13からHVデータ中のシーケンスデータである動作データを抽出し、抽出した動作データを先頭から順に解釈し、時間データに基づくタイミングで動作イベントして設定されている動作制御データを動作制御部18へ出力する(ステップS131、S132)。動作制御部18は、これを受けたタイミングで、動作制御データに基づいて、足駆動部19及び頭駆動部20へ制御情報を出力する。これにより、ロボット1の足や頭が動作する。
また、HVデータ処理と並行して、CPU11は、RAM13からHVデータ中の表示データを抽出し、抽出した表示データを先頭から順に解釈し、この表示データを表示部15へ出力する(ステップS141、S142)。これを受けて、表示部15は、表示データに基づいて画像もしくはテキストのデータをディスプレイに出力する。これにより、表示部15のディスプレイに画像もしくはテキストが表示される。
そして、CPU11は、この3つの処理を並行して処理し、全てのHVデータについて処理が終了した時点でHVデータ再生処理を終了する(ステップS15)。
次に、図6〜図8を参照して、他の実施形態を説明する。この実施形態におけるHV
データの構造を図6を参照して説明する。このHVデータコンテナD1は、HV−ScriptデータチャンクD2、HVボイスデータチャンクD3及びキャラクタデータチャンクとから構成される。そして、キャラクタデータチャンクD4は、複数の動作それぞれに対応した動作制御データD50からなる。また、HV−Scriptデータ内には、読み上げる文字列中に、動作を起こす動作イベントが埋め込まれている。
データの構造を図6を参照して説明する。このHVデータコンテナD1は、HV−ScriptデータチャンクD2、HVボイスデータチャンクD3及びキャラクタデータチャンクとから構成される。そして、キャラクタデータチャンクD4は、複数の動作それぞれに対応した動作制御データD50からなる。また、HV−Scriptデータ内には、読み上げる文字列中に、動作を起こす動作イベントが埋め込まれている。
ここで、図7を参照して、HV−scriptデータの一例を説明する。図7に示すように、HV−scriptデータは、図3のHV−Scriptと同様の文字列が記述されているが、「た」と「ん」の間に「U1」という動作イベントが埋め込まれている。また、「び」の後の記号「*」と「お」の間に「U2」という動作イベントが埋め込まれている。これは、「た」を発音した後に「U1」という動作を起こし、「び」を発音した後に「U2」という動作を起こすことを意味する。そして、「U1」、「U2」に対応する動作制御データが、キャラクタデータチャンクD4内に定義されている。
次に、図8を参照して、他の実施形態における図1に示すロボット1の動作を説明する。まず、CPU11は、操作部14から入力される情報を読み取り、入力された情報が再生指示であるか否かを判定し、再生指示があるまで待機する(ステップS21)。ここでいう再生指示とは、リアルタイム再生モードであるときにHVデータを受信した場合を含む。そして、再生指示があった場合、CPU11は、RAM13からHVデータ中のHV−Scriptデータを抽出し、抽出したHV−Scriptデータを先頭から順に解釈する(ステップS22)。この解釈した結果、得られた内容が動作イベントであるか否かを判定する(ステップS23)。そして、動作イベントであれば、この動作イベントに対応する動作制御データに変換し、この動作制御データを動作制御部18へ出力する(ステップS24)。これを受けて、動作制御部18は、動作制御データに基づいて、足駆動部19及び頭駆動部20へ制御情報を出力する。これにより、ロボット1の足や頭が動作する。
一方、動作イベントでない場合、CPU11は、解釈した結果、得られたHV−Scriptをフォルマントフレーム列データに変換する(ステップS25)。そして、CPU11は、HV−Scriptデータを変換して得られたフォルマントフレーム列データを音声再生部16へ出力する(ステップS26)。これを受けて、音声再生部16は、フォルマントフレーム列データを再生することにより、メッセージを読み上げる音声信号を生成して、スピーカ17へ出力する。これにより、メッセージを読み上げる音声がスピーカ17から発音する。
そして、CPU11は、全てのHVデータについて処理が終了した時点でHVデータ再生処理を終了する(ステップS27)。
なお、動作イベントに対応する動作制御データは、それ自体が図3のキャラクタデータのような時間情報を含むシーケンスデータであってもよい。このようにすることで、一つの動作イベントで複雑な動作をさせることが可能となる。
なお、動作イベントに対応する動作制御データは、それ自体が図3のキャラクタデータのような時間情報を含むシーケンスデータであってもよい。このようにすることで、一つの動作イベントで複雑な動作をさせることが可能となる。
このように、読み上げる文字列に抑揚やテンポをつけることができ、より人間に近い音声によって、メッセージを読み上げることができるとともに、再生音声に同期させて、動作を行うようにしたため、より表現力の高いメッセージ再生を実現することができる。また、発音させる音声の声色を変化させたり、表示データを表示するようにしたため、メッセージの表現力をより高めることができるという効果が得られる。
なお、図1における処理部の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより音声再生処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、ホームページ提供環境(あるいは表示環境)を備えたWWWシステムも含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
1・・・ペット型ロボット、10・・・通信部、11・・・CPU、12・・・ROM、13・・・RAM、14・・・操作部、15・・・表示部、16・・・音声再生部、17・・・スピーカ、18・・・動作制御部、19・・・足駆動部、20・・・頭駆動部、2、6・・・基地局、3、5・・・インターネット接続サーバ、4・・・インターネット、7・・・携帯電話端末、8・・・パソコン
Claims (6)
- 発音する文字を示す発声文字列と該発声文字の抑揚や発音長を制御する制御記号を発音する時間順にテキストで記述した発音文字列とからなる音声合成用データと、動作を指示する動作データとを一括して受信するデータ受信手段と、
前記音声合成用データを解釈して音声再生する音声再生手段と、
前記動作データを解釈して、前記音声再生手段によって再生した音声に同期して動作を行う動作制御手段と
を備えたことを特徴とするロボット。 - 前記動作データは、ロボットの各部の動作を指示する動作イベントと、該動作イベントを実行するタイミングを表す時間データからなることを特徴とする請求項1に記載のロボット。
- 前記動作データは、ロボットの各部の動作を指示する動作イベントであり、該動作イベントが動作させるタイミングに合わせて発音文字列間に記述されていることを特徴とする請求項1に記載のロボット。
- 前記データ受信手段は、前記音声合成用データと前記動作データに加え、さらに声色データを受信し、
前記音声再生手段は、受信した声色データに基づいて、発音させる音声の声色を変化させて再生することを特徴とする請求項1に記載のロボット。 - 前記データ受信手段は、前記音声合成用データと前記動作データに加え、さらに表示手段に表示する表示データを受信し、
前記表示データを解釈して、前記音声再生手段によって再生した音声に同期して表示データを表示する表示手段をさらに備えたことを特徴とする請求項1に記載のロボット。 - 音声合成用データとロボットの動作データとを作成するデータ作成手段と、前記音声合成用データと前記動作データを送信する送信手段と、前記音声合成用データと前記動作データとを受信する受信手段を備え、受信したデータに基づいてメッセージを再生するロボットとからなる装置における音声再生方法であって、
前記データ作成手段により、発音する文字を示す発声文字と該発声文字の抑揚や発音長を制御する制御記号を発音する時間順にテキストで記述した発音文字列とからなる音声合成用データ及び前記ロボットの各部の動作を指示する動作データを作成する過程と、
前記送信手段により、前記音声合成用データ及び動作データを一括して前記ロボットへ送信する過程と、
前記受信手段により、前記音声合成用データ及び動作データを受信する過程と、
前記ロボットが、受信した前記音声合成用データを解釈して音声再生するとともに、前記動作データを並行して解釈し、音声再生した音声に同期して各部の動作を行う過程と
有することを特徴とする音声再生方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004082504A JP2005266671A (ja) | 2004-03-22 | 2004-03-22 | ロボット及び音声再生方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004082504A JP2005266671A (ja) | 2004-03-22 | 2004-03-22 | ロボット及び音声再生方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005266671A true JP2005266671A (ja) | 2005-09-29 |
Family
ID=35091238
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004082504A Pending JP2005266671A (ja) | 2004-03-22 | 2004-03-22 | ロボット及び音声再生方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005266671A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008026485A (ja) * | 2006-07-19 | 2008-02-07 | Advanced Telecommunication Research Institute International | 遠隔操作アンドロイドの発話動作制御システム |
JP2011189439A (ja) * | 2010-03-12 | 2011-09-29 | Honda Motor Co Ltd | ロボット、ロボット制御方法およびプログラム |
JP2012532390A (ja) * | 2009-07-10 | 2012-12-13 | オルドウバラン、ロボティクス エス、ア | 移動ロボットのコンテキスト動作を生成するためのシステムおよび方法 |
-
2004
- 2004-03-22 JP JP2004082504A patent/JP2005266671A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008026485A (ja) * | 2006-07-19 | 2008-02-07 | Advanced Telecommunication Research Institute International | 遠隔操作アンドロイドの発話動作制御システム |
JP2012532390A (ja) * | 2009-07-10 | 2012-12-13 | オルドウバラン、ロボティクス エス、ア | 移動ロボットのコンテキスト動作を生成するためのシステムおよび方法 |
JP2011189439A (ja) * | 2010-03-12 | 2011-09-29 | Honda Motor Co Ltd | ロボット、ロボット制御方法およびプログラム |
US8639511B2 (en) | 2010-03-12 | 2014-01-28 | Honda Motor Co., Ltd. | Robot, method and program of correcting a robot voice in accordance with head movement |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109949783B (zh) | 歌曲合成方法及系统 | |
US7487093B2 (en) | Text structure for voice synthesis, voice synthesis method, voice synthesis apparatus, and computer program thereof | |
EP1618558B1 (en) | System and method for text-to-speech processing in a portable device | |
KR20020055398A (ko) | 전자 서적 송출장치, 전자 서적 장치 및 기록매체 | |
JP2002041411A (ja) | テキスト読み上げロボット、その制御方法及びテキスト読み上げロボット制御プログラムを記録した記録媒体 | |
US20180047374A1 (en) | Musical piece reproducing system, data outputting apparatus, and musical piece reproducing method | |
JP4729171B2 (ja) | 電子書籍装置および音声再生システム | |
JP4075349B2 (ja) | 電子書籍装置および電子書籍データ表示制御方法 | |
EP1381027A1 (en) | Language processor | |
JP2005266671A (ja) | ロボット及び音声再生方法 | |
JP6474518B1 (ja) | 簡易操作声質変換システム | |
KR20180078197A (ko) | 이 보이스북 편집장치 및 재생장치 | |
JP2005062420A (ja) | コンテンツ生成システム、コンテンツ生成方法およびコンテンツ生成プログラム | |
JP2009271315A (ja) | 音声二次元コードから音声を再生可能な携帯電話機および音声二次元コードを含む二次元コードが表示された印刷物 | |
JP2005249880A (ja) | 携帯式通信端末によるディジタル絵本システム | |
JP6289950B2 (ja) | 読み上げ装置、読み上げ方法及びプログラム | |
KR20200085433A (ko) | 탈부착형 스피커를 포함한 음성합성 시스템 및 방법 | |
JP2020204683A (ja) | 電子出版物視聴覚システム、視聴覚用電子出版物作成プログラム、及び利用者端末用プログラム | |
JP5164041B2 (ja) | 音声合成装置、音声合成方法、及びプログラム | |
KR102025903B1 (ko) | 언어 학습을 위한 장치 및 그 제어방법 | |
JP2007256502A (ja) | 演奏データ遠隔通信システムおよびその制御方法を実現するためのプログラム | |
KR20170018281A (ko) | 이 보이스북 편집장치 및 재생장치 | |
JP6922306B2 (ja) | 音声再生装置、および音声再生プログラム | |
JP2004364341A (ja) | 携帯電話および画像表示装置 | |
JP2021117762A (ja) | 情報処理システム、端末装置、端末装置の制御方法、及びプログラム |