JP2005283788A - 表示制御装置およびプログラム - Google Patents

表示制御装置およびプログラム Download PDF

Info

Publication number
JP2005283788A
JP2005283788A JP2004095370A JP2004095370A JP2005283788A JP 2005283788 A JP2005283788 A JP 2005283788A JP 2004095370 A JP2004095370 A JP 2004095370A JP 2004095370 A JP2004095370 A JP 2004095370A JP 2005283788 A JP2005283788 A JP 2005283788A
Authority
JP
Japan
Prior art keywords
data
syllable
display
pitch
utterance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004095370A
Other languages
English (en)
Inventor
桂 ▲高▼橋
Katsura Takahashi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2004095370A priority Critical patent/JP2005283788A/ja
Publication of JP2005283788A publication Critical patent/JP2005283788A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】 発話データのデータ形式を知らなくても、その編集を可能にするとともに、その発話データにしたがって発話処理を行うことなく、その話速やピッチ、音量の変化を把握することを可能にする。
【解決手段】 音声出力される文言の発声を音節毎に表す音節データのデータ列が入力された場合に、該音節データの各々に基づいて各音節の話速とピッチ又は音量とを決定し、各音節の発声を表す文字をその話速に応じた間隔で並べて表示するように表示装置を制御する一方、その音節のピッチ又は音量を表すデータを上記文字の近傍に表示するようにその表示装置を制御する表示制御装置に、上記文字の間隔又は上記データをユーザの指示に応じて編集させる一方、上記表示装置の表示内容を所定のデータ形式に変換させ、その表示内容で示される音声を電子機器に出力させるための発話データを生成させる。
【選択図】 図1

Description

電子機器に発話処理を行わせるためのデータを作成する技術に関する。
電子機器にその利用を促すためのメッセージやガイダンスなどを音声で出力させること(以下、「発話処理」)が一般に行われている。このような発話処理は、上記音声の抑揚やアクセントを表す韻律記号や各音節のピッチや音量を表す制御文字などを所定の書式にしたがって書き込んだデータ(以下、「発話データ」)を上記電子機器に記憶させておき、この発話データにしたがって音声を出力させることによって実現される。このため、上記韻律記号や制御文字およびその記述書式など発話データのデータ形式を熟知していなければ、発話データを作成したり、既存の発話データを編集したりすることが困難であるといった問題点があった。このような問題点を解決するための技術としては、特許文献1に開示された技術が挙げられる。
特許文献1に開示された技術では、以下のようにして発話データの編集が行われる。まず、電子機器に出力させる音声の発声を表す文字列をディスプレイ装置などの表示装置に表示させる。次いで、上記文字列のうちで話速や音量を変更したい部分(文節又は文字)をマウスなどのポインティングデバイスによりユーザに指定させ、例えば、縦軸が話速を表し横軸が音量を表す2次元座標にその部分の話速と音量とに応じた点をプロットさせる。そして、ユーザによって上記2次元座標にプロットされた内容を所定のデータ形式に変換して発話データを生成する。
特開平06−266382号公報
しかしながら、特許文献1に開示された技術では、文節又は文字単位で話速やピッチ、音量の編集を行うため、編集中の発話データにしたがって出力される音声全体を通しての話速やピッチ、音量の変化を把握するには、その発話データにしたがって音声を逐一出力させなければならず、不便であった。
本発明は、上記課題に鑑みて為されたものであり、発話データのデータ形式を知らなくても、発話データを編集することを可能にするとともに、その発話データにしたがって音声を出力させることなく、その話速やピッチ、音量の変化を把握することを可能にする技術を提供することを目的としている。
上記課題を解決するため、本発明は、音声出力される文言の発声を音節毎に表す音節データのデータ列が入力された場合に、該音節データの各々について各音節のピッチ又は音量と話速とを決定する決定手段と、前記音節データに対応する音節の発声を表す文字を該音節の話速に応じた間隔でその発声順に並べて表示するように表示装置を制御する一方、該音節のピッチ又は音量を表すデータを該文字の近傍に表示するように該表示装置を制御する制御手段と、ユーザの操作に応じた操作信号を出力する操作信号出力手段と、前記操作信号出力手段から出力された前記操作信号に応じて、前記表示装置に表示されている前記文字の間隔又は前記文字の近傍に表示されている前記データを変化させる編集手段と、前記表示装置の表示内容を所定のデータ形式に変換して、該表示内容で表される音声を電子機器に出力させるための発話データを生成する生成手段と、を有する表示制御装置を提供する。
また、上記課題を解決するため、本発明は、コンピュータ装置に、音声出力される文言の発声を音節毎に表す音節データのデータ列が入力された場合に、該音節データの各々について各音節のピッチ又は音量と話速とを決定する決定機能と、前記音節データに対応する音節の発声を表す文字を該音節の話速に応じた間隔でその発声順に並べて表示するように表示装置を制御する一方、該音節のピッチ又は音量を表すデータを該文字の近傍に表示するように該表示装置を制御する制御機能と、ユーザの操作に応じた操作信号を出力する操作信号出力機能と、前記操作信号出力機能により出力された前記操作信号に応じて、前記表示装置に表示されている前記文字の間隔又は前記文字の近傍に表示されている前記データを変化させる編集機能と、前記表示装置の表示内容を所定のデータ形式に変換して、該表示内容で表される音声を電子機器に出力させるための発話データを生成する生成機能とを実現させるプログラムを提供する。
本発明に係る表示制御装置およびプログラムによれば、音声出力される文言の音節毎の発声を表す音節データのデータ列が入力された場合に、該音節データの各々について各音節のピッチ又は音量と話速とが決定され、上記各音節の発声を表す文字がその話速に応じた間隔でその発声順に並べられて表示装置に表示されるとともに、各文字の近傍にその音節のピッチ又は音量を表すデータが表示される。この表示装置に表示されている文字の間隔やその文字の近傍に表示されているデータを編集する旨の操作をユーザが行うと、その操作内容に応じて上記表示装置の表示内容が変更される。そして、上記表示装置の表示内容は所定のデータ形式に変換されて上記発話データが生成される。
本発明によれば、各音節のピッチや音量を表すデータがその話速に応じた間隔で発声順に並べられて表示装置に表示されるため、その発話データにしたがって出力される音声全体を通してのピッチや音量、話速の変化を目視確認することが可能になる。これにより、上記発話データにしたがって音声を出力させなくても、そのピッチや音量、話速の変化を把握することが可能になり、発話データを編集する際の作業効率が向上するといった効果を奏する。
また、本発明によれば、上記データを編集したり、その表示間隔を編集したりすることによって、各音節のピッチや音量、話速を編集することが可能であることに加えて、上記表示装置の表示内容が所定のデータ形式に変換されて上記発話データが生成されるため、その発話データのデータ形式を知らなくても、その発話データを編集したり生成したりすることが可能になるといった効果を奏する。
以下、本発明を実施するための最良の形態について図面を参照しつつ説明する。
[A.構成]
(A−1:システム構成)
図1は、本発明の1実施形態に係る表示制御装置10を有する発話データ編集システムの構成例を示すブロック図である。図1に示されているように、この発話データ編集システムは、表示制御装置10と、この表示制御装置10に接続された表示装置20、外部記憶装置30およびサウンドシステム40とを有している。
表示装置20は、例えばディスプレイ装置であり、表示制御装置10から引渡されたデータに応じた画像を表示するものである。外部記憶装置30は、例えばCD−ROM(Compact Disk-Read Only Memory)などコンピュータ装置読み取り可能な記録媒体がセットされた場合に、その記録媒体に記録されているデータを読み出し表示制御装置10へ引渡すものである。例えば、図2に示すデータ形式を有する発話データが記録された記録媒体が外部記憶装置30にセットされると、外部記憶装置30は、この発話データを読み出して表示制御装置10へ入力する。そして、サウンドシステム40は、図示せぬスピーカやアンプなどを備えており、表示制御装置10から引渡された音声信号に応じた音声を出力するものである。
表示制御装置10は、所定のデータ形式を有する発話データ(例えば、図2に示す発話データ)が入力された場合に、その発話データをユーザに編集させるための編集画面を表示装置20に表示させるものである。以下では、まず、表示制御装置10へ入力される発話データと、この発話データをユーザに編集させるために表示制御装置10が表示装置20に表示させる編集画面について詳細に説明する。
図2は、表示制御装置10へ入力される発話データの一例を示す図である。図2に示されているように、この発話データは、ヘッダ部210とボディ部220とを有しており、すべてテキストで記述されている。ヘッダ部210には、発話データの先頭を表す識別子(図2では“HV#”)と、上記ボディ部220の記述に用いられている文字コード(例えば、シフトJIS)を示す識別子(図2では、“J”)とが書き込まれている。一方、ボディ部220には、電子機器に出力させる音声の発声を音節毎に表す音節データのデータ列がその発声順に記述されている。具体的には、図2に示す発話データのボディ部220には、「げんきー」という音声の発声を音節毎に表す4つの音節データが記述されている。この音節データの各々には、該当する音節の発声を表す文字コード(本実施形態では、平仮名のシフトJISコード)が含まれている。また、この音節データには、基本的に、該当する音節のピッチ、音量および話速を表す属性データが含まれているが、直前の音節とピッチ、音量および話速が同一である場合や、予め定められた値のピッチ、音量および話速である場合には、これら属性データは省略されている。
例えば、図2に示す音節データにおいては、第1音節(発声が“げ”である音節)に対応する音節データに含まれている制御文字“S50”は、その第1音節の発話速度(話速)を示す属性データであり、数字が大きい程発話長は短くなる。制御文字“^”はその第1音節のピッチを予め定められピッチ(以下、「基準ピッチ」)よりも1単位ピッチだけ上げて出力することを示す属性データである。なお、第1音節に対応する音節データには、音量を指定する属性データは含まれていないため、この第1音節は予め定められた音量(以下、「基準音量」)で出力されることになる。同様に、ピッチを指定する制御文字が省略されている場合には、第1音節は上記基準ピッチで出力され、話速を指定する制御文字が省略されている場合には、第1音節は予め定められた話速(以下、「基準話速」)で出力される。また、図2に示す発話データにおいて、第2音節(発声が“ん”である音節)に対応する音節データに含まれている制御文字“_2”は、その第2音節のピッチをその1つ前の音節(すなわち、第1音節)のピッチから2単位ピッチ下げて出力することを示す属性データである。なお、図2に示す発話データでは、第2音節の話速および音量は上記第1音節の話速および音量と同一であるため、第2音節についてこれらを規定する属性データは省略されている。また、第3音節(発声が“き”である音節)については、話速、ピッチおよび音量の全てが第2音節と同一であるため、これらを規定する属性データは全て省略されている。そして、図2に示す発話データにおいて、第4音節(長音「ー」に対応する音節)の直前にある制御文字S45は、その第4音節の話速を表しており、また、制御文字“?”は、その第4音節を疑問形で出力すること(本実施形態では、ピッチを直前のピッチから所定量上げつつ音量を直前の音量から所定量だけ上げて出力すること)を表す属性データである。
次いで、図2に示す発話データが入力された場合に、表示制御装置10が表示装置20に表示させる編集画面について図3を参照しつつ説明する。図3は、上記編集画面の画面フォーマットの一例を示す図であり、図3に示されているように、この編集画面には、テキストボックス310−1、310−2、310−3および310−4と、縦軸が音量およびピッチを表し横軸が時間軸であるグラフ領域320と、再生ボタンB1、保存ボタンB2、終了ボタンB3および挿入ボタンB4とが設けられている。なお、以下では、テキストボックス310−1、310−2、310−3および310−4の各々を区別する必要がない場合には、「テキストボックス310―n」と表記する。
テキストボックス310−nは、上記発話データに対応する音声のn番目の音節の発声を表す文字(すなわち、n番目の音節データが表す文字)を表示するための領域であり、その音節の話速に応じた間隔でグラフ領域320の時間軸に沿ってその発声順に並べられる。グラフ領域320は、上記発話データにしたがって出力される音声のピッチや音量の時間変化を表すグラフを表示するための領域である。例えば、本実施形態では、図3に示されているように、各テキストボックスに対応する音節データの表すピッチを図像◆でプロットした折れ線グラフと、その音節データの表す音量を図像●でプロットした折れ線グラフとがグラフ領域320に表示される。このように、本実施形態に係る表示制御装置10によれば、編集対象の発話データにしたがって電子機器から出力される音声のピッチ、音量および話速の時間変化を表す折れ線グラフが表示されるため、その音声全体を通してのピッチ、音量および話速の時間変化を目視で把握することが可能になる。なお、本実施形態では、発話データにしたがって電子機器から出力される音声のピッチ、音量および話速の時間変化を折れ線グラフで表示する場合について説明したが、他の形態のグラフで表示しても良いことは勿論である。また、グラフではなく、各音節のピッチおよび音量を表す数値を各音節の発声を表すテキストボックスの近傍に表示してその時間変化を表すとしても良い。
図3に示す編集画面を視認したユーザは、上記グラフ領域320に表示された図像“◆”や“●”の位置を縦軸方向に移動させたり、上記テキストボックス310−nの間隔を横軸(時間軸)に沿って広げ或いは縮めたりすることや、挿入ボタンB4を押下することなどの編集操作を行うことができる。なお、挿入ボタンB4は、既存のテキストボックスの間に新たなテキストボックスを挿入するためのものである。また、上記ユーザは、編集操作の他に、再生ボタンB1を押下すること(以下、「再生操作」)、保存ボタンB2を押下すること(以下、「保存操作」)、終了ボタンB3を押下すること(以下、「終了操作」)なども行うことができる。そして、再生操作或いは保存操作が行われた場合には、表示制御装置10は、その時点で表示装置20に表示されている編集画面の内容を図2に示すデータ形式に変換して発話データを生成し、再生操作が行われた場合には、生成した発話データで示される音声をサウンドシステム40に出力させる一方、保存操作が行われた場合には、その発話データを記憶し保存する。このように、本実施形態に係る表示制御装置10によれば、ユーザは、発話データのデータ形式を知らなくても、その発話データを編集することが可能になる。以下では、本実施形態に係る発話データ編集システムの特徴を顕著に示している表示制御装置10を中心に説明する。
(A−2:表示制御装置10の構成)
図4は、表示制御装置10の構成例を示すブロック図である。図4に示されているように、この表示制御装置10は、制御部100と、インターフェイス(以下、「IF」)部110と、操作部120と、音声再生部130と、記憶部140と、これら各構成要素間のデータ授受を仲介するバス150とを有している。
制御部100は、例えばCPU(Central Processing Unit)であり、後述する記憶部140に格納されている各種ソフトウェアを実行することにより、本発明に係る表示制御装置に特有な機能を実現するためのものである。IF部110には、上述した表示装置20や外部記憶装置30、サウンドシステム40などが接続されており、これら外部機器との間のデータ授受を仲介するためのものである。操作部120は、マウスやキーボードを含んでおり、マウスやキーボードの操作内容に応じた信号(以下、操作内容信号)を制御部100へ引渡すものである。そして、音声再生部130は、制御部100から発話データを引渡された場合に、その発話データの示す音声に対応する音声信号を生成しIF部110を介してサウンドシステム40へ出力するものである。
記憶部140は、図4に示されているように、揮発性記憶部140aと不揮発性記憶部140bとを含んでいる。揮発性記憶部140aは、例えばRAM(Random Access Memory)であり、後述する各種ソフトウェアにしたがって作動している制御部100によってワークエリアとして利用される。不揮発性記憶部140bは、ROM(Read Only Memory)やハードディスクであり、上記基準ピッチや基準音量、基準話速を示すデータ(例えば、基準ピッチや基準音量、基準話速を表す制御文字やその値を示す数値データなど)を格納している。本実施形態では、基準ピッチを表す制御文字“PD”、基準音量を表す制御文字“VD”および基準話速を表す制御文字“SD”が不揮発性記憶部140bに格納されているものとする。また、この不揮発性記憶部140bには、オペレーティングシステム(Operating System:以下、「OS」)を制御部100に実現させるためのOSソフトウェアや、本発明に係る編集処理を制御部100に実現させるための編集ソフトウェアが格納されている。以下、これらソフトウェアを実行することにより制御部100に付与される機能について説明する。
表示制御装置10の電源(図示省略)が投入されると、制御部100は即座に上記OSソフトウェアを不揮発性記憶部140bから読み出し実行する。OSソフトウェアにしたがって作動している制御部100には、表示制御装置10の各部を制御する機能、ユーザの指示に基づいて他のソフトウェアを不揮発性記憶部140bから読み出し実行する機能が付与される。例えば、上記編集ソフトウェアの実行を指示された場合には、制御部100は上記編集ソフトウェアを読み出し、これを実行する。
OSの制御下で編集ソフトウェアにしたがって作動している制御部100には、以下の述べる4つの機能が付与される。第1に、前述した発話データ(図2参照)がIF部110を介して入力された場合に、この発話データに含まれている音節データの各々について各音節の話速とピッチ又は音量とを決定しその決定結果に応じた内部テーブルを揮発性記憶部140aに書き込む決定機能である。具体的には、制御部100は、上記発話データのボディ部220の先頭に記述されている音節データ(すなわち、第1音節に対応する音節データ)に含まれている属性データに基づいて、その第1音節のピッチ、音量および話速を決定する。なお、制御文字が省略されている場合には、上記基準ピッチ、基準音量および基準話速をその第1音節のピッチ、音量および話速として決定する。そして、制御部100は、第2音節以降の音節については、属性データが省略されている場合には、その手前の音節について決定したピッチ、音量および話速をその音節のピッチ、音量および話速として決定する。例えば、図2に示す発話データが入力された場合には、制御部100は、図5に示す内部テーブルを揮発性記憶部140aに書き込む。図5に示されているように、この内部テーブルには、各音節の発声を表す文字に対応付けてその音節のピッチ、音量および話速の各々を表す属性データである制御文字が格納されている。なお、本実施形態では、各音節の発生を表す文字に対応付けてその音節のピッチ、音量および話速の各々を表す制御文字を内部テーブルに格納する場合について説明したが、その音節のピッチ、音量および話速の各々を表す数値を対応付けて格納するとしても勿論良い。
上記編集ソフトウェアにしたがって作動している制御部100に付与される第2の機能は、上記各音節の発声を表す文字を上記決定機能により決定した話速に応じた間隔でその発声順に並べて表示するように表示装置20を制御する一方、その音節のピッチ又は音量を表すデータを該文字の近傍に表示するように表示装置20を制御する制御機能である。具体的には、この制御機能により、前述した編集画面(図3参照)を表示装置20に表示させるためのデータが上記内部テーブルに基づいて生成され、そのデータが表示装置20へ送信される。これにより、前述した編集画面(図3参照)が表示装置20に表示される。
上記編集ソフトウェアにしたがって作動している制御部100に付与される第3の機能は、ユーザが操作部120を操作することによって、図3に示す編集画面において、テキストボックス310−nの間隔を変更する旨の編集や、そのテキストボックス310−nの近傍に表示されている図像の位置を縦軸方向に変更する旨の操作が為された場合に、その操作内容に応じて上記内部テーブルの格納内容を編集する編集機能である。
そして、上記編集ソフトウェアにしたがって作動している制御部100に付与される第4の機能は、上記編集画面を表示装置20に表示されている状況下で、所定のデータ形式(本実施形態では、図2に示すデータ形式)を有する発話データの生成を指示された場合に、その時点の編集画面の表示内容をそのデータ形式に変換して発話データを生成する生成機能である。具体的には、上記編集画面を表示装置20に表示されている状況下で、再生ボタンB1或いは保存ボタンB2が押下されると、制御部100はその時点の上記内部テーブルの格納内容を上記データ形式に変換して発話データを生成する。そして、制御部100は、再生ボタンB1が押下された場合には、生成した発話データを音声再生部130へ引渡し、その発話データに対応する音声信号をサウンドシステム40へ出力させる一方、保存ボタンB2が押下された場合には、その発話データを不揮発性記憶部140bへ書き込んで保存する。
上記編集ソフトウェアにしたがって作動している制御部100は、上記4つの機能を適宜連携させることによって、本発明に係る表示制御装置に特有な編集処理を実現する。このように、本実施形態に係る表示制御装置10の構成は、一般的なコンピュータ装置の構成と同一であり、不揮発性記憶部140bに格納されている編集ソフトウェアにしたがった処理を制御部100に行わせることによって、本発明に係る表示制御装置に特有な機能が付与される。本実施形態では、本発明に係る表示制御装置に特有な4つの機能をソフトウェアモジュールで実現する場合について説明したが、これら4つの機能をハードウェアモジュールで実現するとしても良いことは勿論である。
[B.動作]
次いで、表示制御装置10が行う動作のうち、本発明に係る表示制御装置の特徴を顕著に示している動作について説明する。なお、以下に説明する動作例では、表示制御装置10の制御部100が上記編集ソフトウェアにしたがって作動している状況下で、図2に示す発話データが記録された記録媒体が外部記憶装置30にセットされ、この発話データが入力されるものとする。
図6は、表示制御装置10の制御部100が上記編集ソフトウェアにしたがって行う編集処理の流れを示すフローチャートである。図6に示されているように、制御部100は、IF部110を介して発話データ(図2参照)が入力(ステップSA1)されると、その発話データを解析し、各音節毎のピッチ、音量および話速を決定し、その決定結果に応じた内部テーブルを揮発性記憶部140aへ書き込む(ステップSA2)。前述したように、図2に示す発話データが入力されると、図5に示す内部テーブルが生成され揮発性記憶部140aに書き込まれる。
次いで、制御部100は、揮発性記憶部140aに格納されている内部データに対応する編集画面を表示するように表示装置20を制御する(ステップSA3)。前述したように、制御部100は、揮発性記憶部140aに書き込んだ内部テーブルに対応する編集画面を表示装置20に表示させるためのデータを生成し、この画像データをIF部110を介して表示装置20へ送信する。その結果、表示装置20には、図3に示す編集画面が表示される。この編集画面を視認したユーザは、操作部120を操作して各種入力操作を行うことができる。以下では、図3に示す編集画面を視認したユーザによって、第2音節のピッチを表す図像◆を上方へ移動し、その音節のピッチを基準ピッチから1単位ピッチだけ上げる旨の編集操作が為された場合について説明する。
上記編集画面を表示装置20に表示させている状態の制御部100は、ユーザの操作内容を表す操作内信号を操作部120から受け取り(ステップSA4)、まず、終了操作が為されたか否かを判定する(ステップSA5)。具体的には、制御部100は、ステップSA4にて受け取った操作内容信号が終了ボタンB3(図3参照)が押下されたことを示す信号である場合に、終了操作が為されたと判定する。
ステップSA5の判定結果が“Yes”である場合には、制御部100は、上記編集画面を表示装置20に消去させて当該編集プログラムの実行を終了し、編集処理を終了する。逆に、ステップSA5の判定結果が“No”である場合には、制御部100は、ユーザによって為された操作が編集操作であるか否かを上記操作内容データに基づいて判定する(ステップSA6)。具体的には、制御部100は、ステップSA4にて受け取った操作内容信号が、編集画面に表示されているテキストボックス310−nの間隔を変更することを示す信号である場合や、グラフ領域320に表示されている図像◆や図像●の位置をその縦軸方向に変更することを示す信号である場合、挿入ボタンB4が押下されたことを示す信号である場合に、上記編集操作が為されたと判定する。上述したように、本動作例では、第2音節のピッチを表す図像◆の位置を変更する旨の操作が為されるので、上記ステップSA5の判定結果は“No”になり、ステップSA6の処理が実行されることになる。
ステップSA6の判定結果が“Yes”である場合には、制御部100は、ステップSA4にて受け取った操作内容信号の表す編集内容に応じて内部テーブルを書き換え(ステップSA7)、上述したステップSA3以降の処理を実行する。逆に、ステップSA6の判定結果が“No”である場合には、制御部100は、後述するステップSA8の処理を実行する。本実施形態では、第2音節のピッチを基準ピッチから1単位ピッチ上げる旨の操作が為されたので、上記ステップSA6の判定結果は“Yes”になり、上記ステップSA7の処理が行われる。その結果、上記内部テーブルの格納内容が図7に示すように更新され、この更新後の内部テーブルの格納内容に基づいて図8に示す編集画面が表示装置20に表示される。
ステップSA6の判定結果が“No”である場合に後続して実行されるステップSA8では、制御部100は、再生操作が為された否かを上記操作内容信号に基づいて判定する。具体的には、制御部100は、ステップSA4にて取得した操作内容信号が、再生ボタンB1が押下されたことを示す信号である場合に、再生操作が為されたと判定する。ステップSA8の判定結果が“Yes”である場合には、制御部100は、揮発性記憶部140aに格納されている内部テーブルの格納内容を所定のデータ形式(本実施形態では、図2に示すデータ形式)に変換して発話データを生成しその発話データを音声再生部130へ引渡す(ステップSA9)。以降、制御部100はステップSA3以降の処理を繰り返し実行する。逆に、ステップSA8の判定結果が“No”である場合には、保存操作が為されたか否かを上記操作内容信号に基づいて判定する(ステップSA10)。具体的には、制御部100は、ステップSA4にて受け取った操作内容信号が、保存ボタンB2が押下されたことを示す信号である場合に、保存操作が為されたと判定する。
ステップSA10の判定結果が“Yes”である場合には、制御部100は、揮発性記憶部140aに格納されている内部データを上記データ形式に変換して発話データを生成し、この発話データを不揮発性記憶部140bへ書き込んで保存する(ステップSA11)。逆に、ステップSA10の判定結果が“No”である場合には、制御部100は、上述したステップSA3以降の処理を繰り返し実行する。例えば、図8に示す編集画面が表示装置20に表示されている状況下で保存操作が行われると、制御部100は、その時点の内部テーブルの格納内容(図7参照)を上記所定のデータ形式に変換して、図9に示す発話データを生成し、この発話データを不揮発性記憶部140bへ書き込んで保存する。
以上に説明したように、本実施形態に係る表示制御装置10によれば、編集中の発話データにしたがって出力される音声全体を通してのピッチや音量、話速の変化を目視確認しながら編集を行うことが可能になるといった効果を奏する。加えて、本実施形態によれば、その発話データに応じて表示されたグラフを適宜編集することで、その発話データのデータ形式を知らなくてもその発話データを編集することが可能になる。なお、本実施形態では、編集画面を表示装置20に表示させている状況下でユーザによって為された操作を制御部100に判定させる際に、まず、終了操作であるか否か判定させる場合について説明したが、編集操作であるか否かを最初に判定するとしても良く、また、保存操作或いは再生操作であるか否かを最初に判定するとしても良いことは勿論である。
[C.変形例]
以上、本発明の1実施形態について説明したが、係る実施形態に以下に述べるような変形を加えても良いことは勿論である。
(C−1:変形例1)
上述した実施形態では、音節のピッチや音量、話速を示す制御文字が所定の書式で記述された発話データ(図2参照)が表示制御装置10へ入力される場合について説明したが、上記制御文字を含まず電子機器に出力させる音声の文言に対応する文字列のみが記述されたテキストデータ(以下、プレーンテキスト)が入力されるとしても勿論良い。このようなプレーンテキストが入力される場合には、上記基準ピッチ、基準音量および基準話速を上記プレーンテキストに記述されている文字列を構成する各文字の表す音節のピッチ、音量および話速として制御部100に決定させるようにすれば良い。
(C−2:変形例2)
上述した実施形態では、CD−ROMなどの記録媒体に記録された発話データが表示制御装置10へ入力される場合について説明したが、有線又は無線通信網(以下、単に「通信網」と表記する)を介して発話データが表示制御装置10へ入力されるとしても良い。このように通信網を介して送信されてくる発話データを表示制御装置10へ入力する場合には、その通信網における通信プロトコルにしたがってデータを受信する通信部をIF部110に含ませておけば良い。このようにすると、例えば携帯電話機などに本発明を適用し、その携帯電話機に発話処理を実行させるための発話データをその携帯電話機を収容している移動通信網を介して入力することや、その発話データをユーザの所望に応じて適宜編集することが可能になる。また、編集対象の発話データをユーザにキーボード入力させるとしても勿論良い。このような態様の一例としては、前述した編集ソフトウェアの実行を開始した直後に、予め定められた数のテキストボックスが配置された編集画面を表示装置20に表示させ、そのテキストボックスに文字をキーボード入力させて上記プレーンテキストを発話データとして入力させる態様が挙げられる。このように、編集対象の発話データをプレーンテキストでユーザに入力させる態様によれば、既存の発話データの編集のみならず、発話データを新たに作成することが可能になる。
(C−3:変形例3)
上述した実施形態では、編集の前後で音節データの数が変化しない場合について説明したが、例えば挿入ボタンB4を押下し音節データを追加する編集や音節データを削除する編集など音節データの数が変化する編集を行わせるようにしても勿論良い。なお、テキストボックスを挿入し音節データを追加する旨の操作が行われた場合には、挿入されたテキストボックスに対応する音節のピッチや音量および話速については、上記基準ピッチ、基準音量および基準話速にするとしても良く、また、追加された音節に隣接する音節のピッチや音量および話速に基づいて決定するとしても良い。具体的には、ピッチと音量については、追加される音節の前後に位置する音節のピッチおよび音量から補完によって求めれば良く、また、話速については、追加される音節の1つ手前に位置する音節の話速と同一にすれば良い。
(C−4:変形例4)
上述した実施形態では、本発明に係る表示制御装置に特有な機能を制御部100に実現させるための編集ソフトウェアを予め不揮発性記憶部140bに予め格納しておく場合について説明した。しかしながら、CD−ROMなどのコンピュータ装置読み取り可能な記録媒体に上記ソフトウェアを記録させておき、係る記録媒体を用いて上記ソフトウェアを一般的なコンピュータ装置にインストールして本発明に係る表示制御装置と同一の機能を付与するとしても良いことは勿論である。
本発明の1実施形態に係る表示制御装置10を含むコンピュータシステムの構成例を示すブロック図である。 同表示制御装置10へ入力される発話データの一例を示す図である。 同表示制御装置10が表示装置20に表示させる編集画面の一例を示す図である。 同表示制御装置10の構成例を示すブロック図である。 同揮発性記憶部140aに格納される内部テーブルの一例を示す図である。 同制御部100が行う編集処理の流れを示すフローチャートである。 同揮発性記憶部140aに格納される内部テーブルの一例を示す図である。 同表示制御装置10が表示装置20に表示させる編集画面の一例を示す図である。 同表示制御装置10が生成する発話データの一例を示す図である。
符号の説明
10…表示制御装置、20…表示装置、30…外部記憶装置、40…サウンドシステム、100…制御部、110…IF部、120…操作部、130…音声再生部、140…記憶部、140a…揮発性記憶部、140b…不揮発性記憶部、150…バス。

Claims (5)

  1. 音声出力される文言の発声を音節毎に表す音節データのデータ列が入力された場合に、該音節データの各々について各音節のピッチ又は音量と話速とを決定する決定手段と、
    前記音節データに対応する音節の発声を表す文字を該音節の話速に応じた間隔でその発声順に並べて表示するように表示装置を制御する一方、該音節のピッチ又は音量を表すデータを該文字の近傍に表示するように該表示装置を制御する制御手段と、
    ユーザの操作に応じた操作信号を出力する操作信号出力手段と、
    前記操作信号出力手段から出力された前記操作信号に応じて、前記表示装置に表示されている前記文字の間隔又は前記文字の近傍に表示されている前記データを変化させる編集手段と、
    前記表示装置の表示内容を所定のデータ形式に変換して、該表示内容で表される音声を電子機器に出力させるための発話データを生成する生成手段と、
    を有する表示制御装置。
  2. 前記決定手段は、
    前記音節データに前記音節のピッチ又は音量と話速とを表す属性データが含まれている場合には、該属性データに基づいて該音節のピッチ又は音量と話速とを決定する
    ことを特徴とする請求項1に記載の表示制御装置。
  3. 前記決定手段は、
    前記音節データの各々が前記文字のみを表している場合には、前記各音節のピッチ又は音量と話速とを予め定められた値に決定する
    ことを特徴とする請求項1に記載の表示制御装置。
  4. 前記編集手段は、
    前記表示手段に表示されている文字の間に新たな文字を挿入することを示す操作信号が前記操作信号出力手段から出力された場合には、
    該新たな文字の1つ手前に位置する文字の表す音節の話速に基づいて該新たな文字の表す新たな音節の話速を決定する一方、
    該新たな文字の両隣に位置する文字の表す音節のピッチ又は音量に基づいて該新たな音節のピッチ又は音量を決定する
    ことを特徴とする請求項1に記載の表示制御装置。
  5. コンピュータ装置に、
    音声出力される文言の発声を音節毎に表す音節データのデータ列が入力された場合に、該音節データの各々について各音節のピッチ又は音量と話速とを決定する決定機能と、
    前記音節データに対応する音節の発声を表す文字を該音節の話速に応じた間隔でその発声順に並べて表示するように表示装置を制御する一方、該音節のピッチ又は音量を表すデータを該文字の近傍に表示するように該表示装置を制御する制御機能と、
    ユーザの操作に応じた操作信号を出力する操作信号出力機能と、
    前記操作信号出力機能により出力された前記操作信号に応じて、前記表示装置に表示されている前記文字の間隔又は前記文字の近傍に表示されている前記データを変化させる編集機能と、
    前記表示装置の表示内容を所定のデータ形式に変換して、該表示内容で表される音声を電子機器に出力させるための発話データを生成する生成機能と
    を実現させるプログラム。
JP2004095370A 2004-03-29 2004-03-29 表示制御装置およびプログラム Pending JP2005283788A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004095370A JP2005283788A (ja) 2004-03-29 2004-03-29 表示制御装置およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004095370A JP2005283788A (ja) 2004-03-29 2004-03-29 表示制御装置およびプログラム

Publications (1)

Publication Number Publication Date
JP2005283788A true JP2005283788A (ja) 2005-10-13

Family

ID=35182258

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004095370A Pending JP2005283788A (ja) 2004-03-29 2004-03-29 表示制御装置およびプログラム

Country Status (1)

Country Link
JP (1) JP2005283788A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010060886A (ja) * 2008-09-04 2010-03-18 Yamaha Corp 音声処理装置およびプログラム
JP2012118385A (ja) * 2010-12-02 2012-06-21 Yamaha Corp 音声合成情報編集装置
JP2015079064A (ja) * 2013-10-15 2015-04-23 ヤマハ株式会社 合成情報管理装置
JP2015517684A (ja) * 2012-05-07 2015-06-22 オーディブル・インコーポレイテッドAudible, Inc. コンテンツのカスタマイズ

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010060886A (ja) * 2008-09-04 2010-03-18 Yamaha Corp 音声処理装置およびプログラム
JP2012118385A (ja) * 2010-12-02 2012-06-21 Yamaha Corp 音声合成情報編集装置
US9135909B2 (en) 2010-12-02 2015-09-15 Yamaha Corporation Speech synthesis information editing apparatus
JP2015517684A (ja) * 2012-05-07 2015-06-22 オーディブル・インコーポレイテッドAudible, Inc. コンテンツのカスタマイズ
JP2015079064A (ja) * 2013-10-15 2015-04-23 ヤマハ株式会社 合成情報管理装置

Similar Documents

Publication Publication Date Title
JP5029167B2 (ja) 音声読み上げのための装置、プログラム及び方法
JP4006338B2 (ja) 情報処理装置及びその方法、プログラム
US9355634B2 (en) Voice synthesis device, voice synthesis method, and recording medium having a voice synthesis program stored thereon
JP5029168B2 (ja) 音声読み上げのための装置、プログラム及び方法
JP4797597B2 (ja) 語学学習装置
JP2013137520A (ja) 音楽データ編集装置
JP2007079397A (ja) 対話方法、対話装置、対話プログラムおよび記録媒体
JP2005283788A (ja) 表示制御装置およびプログラム
JP2001268669A (ja) 移動電話端末を利用した機器制御装置、方法、及び記録媒体
KR100551668B1 (ko) 문자 음성 변환 장치 및 그것을 이용한 휴대 단말 장치
JP2007139868A (ja) 語学学習装置
JPH0549998B2 (ja)
JP4654889B2 (ja) 再生装置
JP2001134283A (ja) 音声合成装置および音声合成方法
JP4508196B2 (ja) 曲編集装置および曲編集プログラム
JP2002268664A (ja) 音声変換装置及びプログラム
JP5605731B2 (ja) 音声特徴量算出装置
JP2010008714A (ja) 録音再生装置及び方法
JP5042485B2 (ja) 音声特徴量算出装置
JP2005309233A (ja) 編集装置およびプログラム
JP2010072057A (ja) 音声の録音と再生方法及び該方法を用いる電子辞書
WO2016072444A1 (ja) マークアップテキスト編集装置及び制御方法
JP2007127994A (ja) 音声合成方法及び音声合成装置並びにプログラム
JP2007221775A (ja) 携帯端末、作業支援システムおよびプログラム
JP5093387B2 (ja) 音声特徴量算出装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20061020

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061107

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070109

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20071113