JPH10222187A - 発話文書作成装置,発話文書作成方法および発話文書作成手順をコンピュータに実行させるプログラムを格納したコンピュータ読み取り可能な記録媒体 - Google Patents

発話文書作成装置,発話文書作成方法および発話文書作成手順をコンピュータに実行させるプログラムを格納したコンピュータ読み取り可能な記録媒体

Info

Publication number
JPH10222187A
JPH10222187A JP9083124A JP8312497A JPH10222187A JP H10222187 A JPH10222187 A JP H10222187A JP 9083124 A JP9083124 A JP 9083124A JP 8312497 A JP8312497 A JP 8312497A JP H10222187 A JPH10222187 A JP H10222187A
Authority
JP
Japan
Prior art keywords
information
voice
data
character string
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9083124A
Other languages
English (en)
Other versions
JP3270356B2 (ja
Inventor
Nobuhide Yamazaki
信英 山崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JustSystems Corp
Original Assignee
JustSystems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JustSystems Corp filed Critical JustSystems Corp
Priority to JP08312497A priority Critical patent/JP3270356B2/ja
Publication of JPH10222187A publication Critical patent/JPH10222187A/ja
Application granted granted Critical
Publication of JP3270356B2 publication Critical patent/JP3270356B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 文字情報と音声情報という2つの表現形態の
情報を整合性の取れた形で複合した情報(発話文書)を
作成すること。 【解決手段】 文字列情報等から構成される喋り方デー
タを,文字列情報に基づいて,グループ化して記憶した
喋り方データ記憶部103と,文字列を入力する文字列
入力手段(制御部101,アプリケーション記憶部10
2,キー入力部106,表示部107)と,文字列と同
一の文字列情報を有するグループを喋り方データ記憶部
103から検索する検索手段(制御部101)と,声色
データを複数記憶した声色データ記憶部104と,音声
を合成する音声合成部105と,合成された音声から所
望の音声を選択する音声選択手段(制御部101,キー
入力部106)と,選択された音声に対応する喋り方デ
ータを入力された文字列と対応させて発話文書として記
憶する発話文書記憶部110とを有する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は,文書を構成する文
字列に,それぞれの文字列の喋り方を特定する喋り方デ
ータを付加して発話文書を作成する発話文書作成装置,
発話文書作成方法および発話文書作成手順をコンピュー
タに実行させるプログラムを格納したコンピュータ読み
取り可能な記録媒体に関する。
【0002】
【従来の技術】情報の伝達・保管方法の一つとして文字
情報を用いる方法が知られている。この文字情報を用い
る方法として,近年,日本語ワードプロセッサ,英文ワ
ードプロセッサ等の文書作成装置や,ワープロ機能を有
したパソコンを用いて,文書作成者が所望の文書を作成
し,作成した文書をネットワークを介して転送したり,
作成した文書を磁気ディスクや,光ディスク等の記録媒
体に記憶させる方法が使用されるようになっている。こ
れは,コンピュータ関連技術の発展に伴って文書作成装
置自体が高機能化・低価格化を実現していると共に,オ
フィスのペーパレス化の推進や,通信網の整備,電子メ
ールの普及等による作業環境の変化に負うところが大き
い。
【0003】また,情報の伝達・保管等に使用される他
の方法として,音声情報を用いる方法や,音声情報と映
像情報とを用いる方法が知られている。例えば,音声情
報を用いる方法では,情報の伝達は電話等を介して直
接,音声情報を転送し,情報の保管は録音機器を用いて
テープ等に録音して保管している。また,音声情報と映
像情報とを用いる方法では,情報の伝達はモニターとス
ピーカーを有する通信装置を用いて音声情報と映像情報
を転送し,情報の保管はビデオ装置等の録画機器を用い
てビデオテープや,光ディスク等に保管している。
【0004】なお,上述した情報の伝達・保管方法のう
ち,文字情報を用いる方法は,他の方法と比較して,デ
ータ量が少なく,情報の編集が容易であること,さらに
デジタル情報としてコンピュータ上で使用可能であるこ
とから,最も汎用性が高く,広く使用されている。
【0005】
【発明が解決しようとする課題】しかしながら,上記従
来の文字情報を用いる方法では,作成した文書が視覚的
な言語情報(すなわち,文字言語情報)に限定された情
報であるため,非言語情報にあたる感情等の表現を情報
として付加することはできなかった。なお,音声を用い
た言語情報(すなわち,音声言語情報)では,アクセン
トや,声の大きさ(音量),声の高さ等の喋り方を変え
ることで,非言語情報にあたる感情等の表現を情報とし
て付加していた。
【0006】また,従来の技術において,文字情報と音
声情報という2つの表現形態の情報を整合性の取れた形
で複合した情報を作成する装置および方法は提供されて
いなかった。
【0007】また,音声情報の編集は,基本的に聴覚を
用いて(すなわち,再生させた音声情報を耳で聞いて)
行うのが一般的であり,一々再生して所望の音声情報の
位置(場所)を確認する必要があるため,作業が煩雑
で,面倒であるという問題点もあった。
【0008】なお,従来の音声合成技術の一つであるテ
キスト音声合成技術を用いることにより,テキスト文書
(すなわち,文字情報)から音声を合成することも可能
であるが,テキストからの音声合成では,辞書に入って
いない固有名詞を読み間違えたり,違ったアクセントで
発音するという問題点があった。さらに非言語情報であ
る感情等の表現ができないことや,文書作成者の意図す
る喋り方で正確に音声を合成することができないという
問題点もあった。
【0009】本発明は上記に鑑みてなされたものであっ
て,文字情報と音声情報という2つの表現形態の情報を
整合性の取れた形で複合した情報(発話文書)を作成す
ることができる装置および方法を提供することを目的と
する。
【0010】また,本発明は上記に鑑みてなされたもの
であって,文字情報と文書作成者の意図する喋り方を含
む音声情報(喋り方データ)との整合性をとった情報
(発話文書)を作成して,文書中に非言語情報にあたる
感情等の表現を付加できるようにすることを目的とす
る。
【0011】また,本発明は上記に鑑みてなされたもの
であって,音声情報の編集を文字情報を介して視覚的に
行って作業性の向上を図ると共に,文書作成者の意図す
る喋り方で正確に音声を合成できるようにすることを目
的とする。
【0012】
【課題を解決するための手段】上記の目的を達成するた
めに,請求項1に係る発話文書作成装置は,単語,文節
または文から成る文字列情報,前記文字列情報の文字に
対応した音韻から成る音韻列情報,前記音韻列情報中の
各音韻の継続時間長,前記音韻列情報の任意の時点での
相対的なピッチを指定するピッチ情報および前記音韻列
情報の各音韻の音量を指定するベロシティ情報から構成
される喋り方データを,前記喋り方データの文字列情報
に基づいて,前記文字列情報が同一の喋り方データをグ
ループ化してグループ毎に記憶した喋り方データ記憶手
段と,単語,文節または文を構成する文字列を入力する
ための文字列入力手段と,前記文字列入力手段を介して
入力された文字列を用いて,前記文字列と同一の文字列
情報を有するグループを前記喋り方データ記憶手段から
検索する検索手段と,合成する音声に声色を付加するた
めの声色データを複数記憶した声色データ記憶手段と,
前記検索手段で検索したグループ中の喋り方データを順
次読み出して,前記読み出した喋り方データの音韻列情
報,継続時間長,ピッチ情報およびベロシティ情報と前
記声色データ記憶手段に記憶されている声色データの一
つとを用いて音声を合成する音声合成手段と,前記音声
合成手段で合成された音声から所望の音声を選択するた
めの音声選択手段と,前記音声選択手段を用いて選択さ
れた音声に対応する喋り方データを前記文字列入力手段
を介して入力された文字列と対応させて発話文書として
記憶する発話文書記憶手段と,を備えたものである。
【0013】また,請求項2に係る発話文書作成装置
は,単語,文節または文から成る文字列情報,前記文字
列情報の文字に対応した音韻から成る音韻列情報,前記
音韻列情報中の各音韻の継続時間長,前記音韻列情報の
任意の時点での相対的なピッチを指定するピッチ情報お
よび前記音韻列情報の任意の時点での相対的な音量を指
定するベロシティ情報から構成される喋り方データを,
前記喋り方データの文字列情報に基づいて,前記文字列
情報が同一の喋り方データをグループ化してグループ毎
に記憶した喋り方データ記憶手段と,単語,文節または
文を構成する文字列を入力するための文字列入力手段
と,前記文字列入力手段を介して入力された文字列を用
いて,前記文字列と同一の文字列情報を有するグループ
を前記喋り方データ記憶手段から検索する検索手段と,
合成する音声に声色を付加するための声色データを複数
記憶した声色データ記憶手段と,前記検索手段で検索し
たグループ中の喋り方データを順次読み出して,前記読
み出した喋り方データの音韻列情報,継続時間長,ピッ
チ情報およびベロシティ情報と前記声色データ記憶手段
に記憶されている声色データの一つとを用いて音声を合
成する音声合成手段と,前記音声合成手段で合成された
音声から所望の音声を選択するための音声選択手段と,
前記音声選択手段を用いて選択された音声に対応する喋
り方データを前記文字列入力手段を介して入力された文
字列と対応させて発話文書として記憶する発話文書記憶
手段と,を備えたものである。
【0014】また,請求項3に係る発話文書作成装置
は,請求項1または2記載の発話文書作成装置におい
て,さらに,前記発話文書記憶手段に記憶されている発
話文書の再生を指定する再生指定手段を備え,前記発話
文書の再生が指定されると,前記音声合成手段が,前記
発話文書中の喋り方データを順次読み出して,音声を合
成するものである。
【0015】また,請求項4に係る発話文書作成装置
は,請求項3記載の発話文書作成装置において,前記再
生指定手段が,前記発話文書を再生する範囲として,前
記発話文書中の任意の文字列単位,文章単位,ページ単
位または発話文書全体の指定が可能であるものである。
【0016】また,請求項5に係る発話文書作成装置
は,単語,文節または文から成る文字列情報,前記文字
列情報の文字に対応した音韻から成る音韻列情報,前記
音韻列情報中の各音韻の継続時間長,前記音韻列情報の
任意の時点での相対的なピッチを指定するピッチ情報お
よび前記音韻列情報の各音韻の音量を指定するベロシテ
ィ情報から構成される喋り方データを,前記喋り方デー
タの文字列情報に基づいて,前記文字列情報が同一の喋
り方データをグループ化してグループ毎に記憶した喋り
方データ記憶手段と,単語,文節または文を構成する文
字列を入力するための文字列入力手段と,前記文字列入
力手段を介して入力された文字列を用いて,前記文字列
と同一の文字列情報を有するグループを前記喋り方デー
タ記憶手段から検索する検索手段と,合成する音声に声
色を付加するための声色データを複数記憶した声色デー
タ記憶手段と,前記声色データ記憶手段に記憶されてい
る声色データの一つを指定するための声色データ指定手
段と,前記検索手段で検索したグループ中の喋り方デー
タを順次読み出して,前記読み出した喋り方データの音
韻列情報,継続時間長,ピッチ情報およびベロシティ情
報と前記声色データ指定手段で指定された声色データと
を用いて音声を合成する音声合成手段と,前記音声合成
手段で合成された音声から所望の音声を選択するための
音声選択手段と,前記音声選択手段を用いて選択された
音声に対応する喋り方データおよび声色データを前記文
字列入力手段を介して入力された文字列と対応させて発
話文書として記憶する発話文書記憶手段と,を備えたも
のである。
【0017】また,請求項6に係る発話文書作成装置
は,単語,文節または文から成る文字列情報,前記文字
列情報の文字に対応した音韻から成る音韻列情報,前記
音韻列情報中の各音韻の継続時間長,前記音韻列情報の
任意の時点での相対的なピッチを指定するピッチ情報お
よび前記音韻列情報の任意の時点での相対的な音量を指
定するベロシティ情報から構成される喋り方データを,
前記喋り方データの文字列情報に基づいて,前記文字列
情報が同一の喋り方データをグループ化してグループ毎
に記憶した喋り方データ記憶手段と,単語,文節または
文を構成する文字列を入力するための文字列入力手段
と,前記文字列入力手段を介して入力された文字列を用
いて,前記文字列と同一の文字列情報を有するグループ
を前記喋り方データ記憶手段から検索する検索手段と,
合成する音声に声色を付加するための声色データを複数
記憶した声色データ記憶手段と,前記声色データ記憶手
段に記憶されている声色データの一つを指定するための
声色データ指定手段と,前記検索手段で検索したグルー
プ中の喋り方データを順次読み出して,前記読み出した
喋り方データの音韻列情報,継続時間長,ピッチ情報お
よびベロシティ情報と前記声色データ指定手段で指定さ
れた声色データとを用いて音声を合成する音声合成手段
と,前記音声合成手段で合成された音声から所望の音声
を選択するための音声選択手段と,前記音声選択手段を
用いて選択された音声に対応する喋り方データおよび声
色データを前記文字列入力手段を介して入力された文字
列と対応させて発話文書として記憶する発話文書記憶手
段と,を備えたものである。
【0018】また,請求項7に係る発話文書作成装置
は,請求項5または6記載の発話文書作成装置におい
て,さらに,前記喋り方データを作成して前記喋り方デ
ータ記憶手段に登録する喋り方データ作成・登録手段を
備えたものである。
【0019】また,請求項8に係る発話文書作成装置
は,請求項7記載の発話文書作成装置において,前記喋
り方データ作成・登録手段が,あらかじめ収録した音声
波形データまたはユーザが発話した肉声を入力して,音
声波形データを表示する音声波形データ入力手段と,ユ
ーザによる入力または前記音声波形データを音韻分析し
て,各音韻の継続時間長を設定して表示する継続時間長
設定手段と,前記設定された継続時間長に対応する音韻
列情報を付加する音韻列情報付加手段と,前記音声波形
データをピッチ分析してピッチ曲線を表示するピッチ曲
線表示手段と,前記表示されたピッチ曲線および音韻列
情報とに基づいて,前記音韻列情報の任意の時点での相
対的なピッチの値を調整または追加してピッチ情報を生
成するピッチ情報生成手段と,前記音韻列情報の各音韻
の音量を調整してベロシティ情報を生成するベロシティ
情報生成手段と,前記音声波形データに対応する文字列
を入力して文字列情報を設定する文字列情報設定手段
と,前記文字列情報に基づいて前記喋り方データ記憶手
段中の該当するグループに,前記文字列情報,音韻列情
報,継続時間長,ピッチ情報およびベロシティ情報を喋
り方データとして登録する登録手段と,を備えたもので
ある。
【0020】また,請求項9に係る発話文書作成装置
は,請求項5〜8記載のいずれか一つの発話文書作成装
置において,さらに,前記発話文書記憶手段に記憶され
ている発話文書の再生を指定する再生指定手段を備え,
前記発話文書の再生が指定されると,前記音声合成手段
が,前記発話文書中の喋り方データおよび声色データを
順次読み出して,音声を合成するものである。
【0021】また,請求項10に係る発話文書作成装置
は,請求項9記載の発話文書作成装置において,前記再
生指定手段が,前記発話文書を再生する範囲として,前
記発話文書中の任意の文字列単位,文章単位,ページ単
位または発話文書全体の指定が可能であるものである。
【0022】また,請求項11に係る発話文書作成装置
は,請求項5〜10記載のいずれか一つの発話文書作成
装置において,さらに,前記文字列入力手段を用いて,
前記発話文書記憶手段に記憶されている発話文書を表示
し,前記表示した発話文書の任意の文字列を指定し,前
記指定した文字列の変更または再入力が可能であり,前
記変更または再入力された文字列を用いて,前記検索手
段による検索,前記声色データ指定手段による声色デー
タの指定,前記音声合成手段による音声の合成および前
記音声選択手段による音声の選択を行うことにより,前
記指定した文字列に対応する喋り方データおよび声色デ
ータの変更が可能であるものである。
【0023】また,請求項12に係る発話文書作成装置
は,請求項1,2,5または6記載の発話文書作成装置
において,前記複数の声色データが,男性の声,女性の
声,子供の声,老人の声,掠れた声,明瞭な声,太い
声,細い声,力強い声,やさしい声,機械的な声のよう
に,それぞれ感覚的に識別可能な声色データであるもの
である。
【0024】また,請求項13に係る発話文書作成装置
は,請求項1,2,5または6記載の発話文書作成装置
において,前記文字列入力手段が,仮名漢字変換機能を
有し,前記文字例入力手段で入力した文字列が,前記仮
名漢字変換機能を用いて変換した後の漢字仮名交じりの
テキストであるものである。
【0025】また,請求項14に係る発話文書作成装置
は,請求項5または6記載の発話文書作成装置におい
て,さらに,前記喋り方データの分類タイプを指定する
分類タイプ指定手段を備え,前記喋り方データが,前記
文字列情報,音韻列情報,継続時間長,ピッチ情報およ
びベロシティ情報に加えて,それぞれの喋り方データの
分類タイプを示すタイプ情報を有し,前記分類タイプ指
定手段を介して分類タイプが指定されると,前記検索手
段が,前記文字列入力手段を介して入力された文字列お
よび前記分類タイプ指定手段を介して指定された分類タ
イプを用いて,前記文字列と同一の文字列情報を有する
グループで,かつ,前記指定された分類タイプと同一の
タイプ情報を有する喋り方データを前記喋り方データ記
憶手段から検索し,前記音声合成手段が,前記検索手段
で検索した喋り方データを読み出して,前記読み出した
喋り方データの音韻列情報,継続時間長,ピッチ情報お
よびベロシティ情報と前記声色データ指定手段で指定さ
れた声色データとを用いて音声を合成するものである。
【0026】また,請求項15に係る発話文書作成装置
は,請求項14記載の発話文書作成装置において,前記
分類タイプが,それぞれの喋り方データに対応する音声
を,東京型発音タイプ,大阪型発音タイプ,徳島型発音
タイプ等のように地域によって分類したものである。
【0027】また,請求項16に係る発話文書作成装置
は,請求項14記載の発話文書作成装置において,前記
分類タイプが,それぞれの喋り方データに対応する音声
を,老人型発音タイプ,若者型発音タイプ,高校生型発
音タイプ等のように年齢によって分類したものである。
【0028】また,請求項17に係る発話文書作成装置
は,請求項5〜16記載のいずれか一つの発話文書作成
装置において,前記文字列入力手段が,表示部を有して
おり,かつ,前記発話文書の各文字列毎に指定されてい
る声色データに基づいて,表示する文字列のフォント
や,装飾方法を変えて前記表示部に表示するものであ
る。
【0029】また,請求項18に係る発話文書作成方法
は,単語,文節または文を構成する文字列を入力する第
1の工程と,単語,文節または文から成る文字列情報,
前記文字列情報の文字に対応した音韻から成る音韻列情
報,前記音韻列情報中の各音韻の継続時間長,前記音韻
列情報の任意の時点での相対的なピッチを指定するピッ
チ情報および前記音韻列情報の各音韻の音量を指定する
ベロシティ情報から構成される喋り方データを,前記喋
り方データの文字列情報に基づいて,前記文字列情報が
同一の喋り方データをグループ化してグループ毎に記憶
したデータベースを参照して,前記第1の工程で入力さ
れた文字列と同一の文字列情報を有するグループを検索
する第2の工程と,合成する音声に声色を付加するため
声色データを指定する第3の工程と,前記第2の工程で
検索したグループ中の喋り方データを順次読み出して,
前記読み出した喋り方データの音韻列情報,継続時間
長,ピッチ情報およびベロシティ情報と,前記第3の工
程で指定された声色データとを用いて,音声を合成する
第4の工程と,前記第4の工程で合成された音声から所
望の音声を選択する第5の工程と,前記第5の工程で選
択した音声に対応する喋り方データを前記1の工程で入
力した文字列と対応させて発話文書として記憶する第6
の工程と,を含むものである。
【0030】また,請求項19に係る発話文書作成方法
は,単語,文節または文を構成する文字列を入力する第
1の工程と,単語,文節または文から成る文字列情報,
前記文字列情報の文字に対応した音韻から成る音韻列情
報,前記音韻列情報中の各音韻の継続時間長,前記音韻
列情報の任意の時点での相対的なピッチを指定するピッ
チ情報および前記音韻列情報の任意の時点での相対的な
音量を指定するベロシティ情報から構成される喋り方デ
ータを,前記喋り方データの文字列情報に基づいて,前
記文字列情報が同一の喋り方データをグループ化してグ
ループ毎に記憶したデータベースを参照して,前記第1
の工程で入力された文字列と同一の文字列情報を有する
グループを検索する第2の工程と,合成する音声に声色
を付加するため声色データを指定する第3の工程と,前
記第2の工程で検索したグループ中の喋り方データを順
次読み出して,前記読み出した喋り方データの音韻列情
報,継続時間長,ピッチ情報およびベロシティ情報と,
前記第3の工程で指定された声色データとを用いて,音
声を合成する第4の工程と,前記第4の工程で合成され
た音声から所望の音声を選択する第5の工程と,前記第
5の工程で選択した音声に対応する喋り方データを前記
1の工程で入力した文字列と対応させて発話文書として
記憶する第6の工程と,を含むものである。
【0031】また,請求項20に係る発話文書作成方法
は,請求項18または19記載の発話文書作成方法にお
いて,さらに,前記第6の工程で記憶した発話文書の再
生を指定する第7の工程と,前記第7の工程で前記発話
文書の再生が指定されると,前記発話文書中の喋り方デ
ータおよび声色データを順次読み出して,音声を合成す
る第8の工程と,を含むものである。
【0032】また,請求項21に係る発話文書作成方法
は,請求項20記載の発話文書作成方法において,前記
第7の工程で,前記発話文書を再生する範囲として,前
記発話文書中の任意の文字列単位,文章単位,ページ単
位または発話文書全体の指定が可能であるものである。
【0033】また,請求項22に係る発話文書作成方法
は,請求項18〜21記載のいずれか一つの発話文書作
成方法において,さらに,前記第6の工程で記憶した発
話文書を表示し,前記表示した発話文書の任意の文字列
を指定し,前記指定した文字列の変更または再入力を行
う第9の工程とを含み,前記第9の工程で変更または再
入力された文字列を用いて,再度,前記第2の工程,第
3の工程,第4の工程,第5の工程および第6の工程を
実行することにより,前記発話文書の変更が可能である
ものである。
【0034】また,請求項23に係るコンピュータ読み
取り可能な記録媒体は,発話文書作成方法は,単語,文
節または文を構成する文字列を入力する第1の手順と,
単語,文節または文から成る文字列情報,前記文字列情
報の文字に対応した音韻から成る音韻列情報,前記音韻
列情報中の各音韻の継続時間長,前記音韻列情報の任意
の時点での相対的なピッチを指定するピッチ情報および
前記音韻列情報の各音韻の音量を指定するベロシティ情
報から構成される喋り方データを,前記喋り方データの
文字列情報に基づいて,前記文字列情報が同一の喋り方
データをグループ化してグループ毎に記憶したデータベ
ースを参照して,前記第1の手順で入力された文字列と
同一の文字列情報を有するグループを検索する第2の手
順と,合成する音声に声色を付加するため声色データを
指定する第3の手順と,前記第2の手順で検索したグル
ープ中の喋り方データを順次読み出して,前記読み出し
た喋り方データの音韻列情報,継続時間長,ピッチ情報
およびベロシティ情報と,前記第3の手順で指定された
声色データとを用いて,音声を合成する第4の手順と,
前記第4の手順で合成された音声から所望の音声を選択
する第5の手順と,前記第5の手順で選択した音声に対
応する喋り方データを前記1の手順で入力した文字列と
対応させて発話文書として記憶する第6の手順と,を含
むプログラムをコンピュータに実行させるものである。
【0035】また,請求項24に係るコンピュータ読み
取り可能な記録媒体は,単語,文節または文を構成する
文字列を入力する第1の手順と,単語,文節または文か
ら成る文字列情報,前記文字列情報の文字に対応した音
韻から成る音韻列情報,前記音韻列情報中の各音韻の継
続時間長,前記音韻列情報の任意の時点での相対的なピ
ッチを指定するピッチ情報および前記音韻列情報任意の
時点での相対的な音量を指定するベロシティ情報から構
成される喋り方データを,前記喋り方データの文字列情
報に基づいて,前記文字列情報が同一の喋り方データを
グループ化してグループ毎に記憶したデータベースを参
照して,前記第1の手順で入力された文字列と同一の文
字列情報を有するグループを検索する第2の手順と,合
成する音声に声色を付加するため声色データを指定する
第3の手順と,前記第2の手順で検索したグループ中の
喋り方データを順次読み出して,前記読み出した喋り方
データの音韻列情報,継続時間長,ピッチ情報およびベ
ロシティ情報と,前記第3の手順で指定された声色デー
タとを用いて,音声を合成する第4の手順と,前記第4
の手順で合成された音声から所望の音声を選択する第5
の手順と,前記第5の手順で選択した音声に対応する喋
り方データを前記1の手順で入力した文字列と対応させ
て発話文書として記憶する第6の手順と,を含むプログ
ラムをコンピュータに実行させるものである。
【0036】また,請求項25に係るコンピュータ読み
取り可能な記録媒体は,請求項23または24記載のコ
ンピュータ読み取り可能な記録媒体において,さらに,
前記第6の手順で記憶した発話文書の再生を指定する第
7の手順と,前記第7の手順で前記発話文書の再生が指
定されると,前記発話文書中の喋り方データおよび声色
データを順次読み出して,音声を合成する第8の手順
と,を含むプログラムをコンピュータに実行させるもの
である。
【0037】また,請求項26に係るコンピュータ読み
取り可能な記録媒体は,請求項25記載のコンピュータ
読み取り可能な記録媒体において,前記第7の手順にお
いて,前記発話文書を再生する範囲として,前記発話文
書中の任意の文字列単位,文章単位,ページ単位または
発話文書全体の指定が可能であるものである。
【0038】また,請求項27に係るコンピュータ読み
取り可能な記録媒体は,請求項23〜26記載のいずれ
か一つのコンピュータ読み取り可能な記録媒体におい
て,さらに,前記第6の手順で記憶した発話文書を表示
し,前記表示した発話文書の任意の文字列を指定し,前
記指定した文字列の変更または再入力を行う第9の手順
とを含み,前記第9の手順で変更または再入力された文
字列を用いて,再度,前記第2の手順,第3の手順,第
4の手順,第5の手順および第6の手順を実行すること
により,前記発話文書の変更が可能であるものである。
【0039】
【発明の実施の形態】以下,本発明の発話文書作成装
置,発話文書作成方法およびその発話文書作成手順をコ
ンピュータに実行させるプログラムを格納したコンピュ
ータ読み取り可能な記録媒体について,〔実施の形態
1〕,〔実施の形態2〕の順で,添付の図面を参照して
詳細に説明する。
【0040】〔実施の形態1〕図1は,実施の形態1の
発話文書作成装置100の概略ブロック図を示す。この
発話文書作成装置100は,制御部101と,アプリケ
ーション記憶部102と,喋り方データ記憶部103
と,声色データ記憶部104と,音声合成部105と,
キー入力部106と,表示部107と,マイク108
と,スピーカ109と,発話文書記憶部110と,イン
タフェース(I/F)111と,フロッピーディスクド
ライブ(FDドライブ)112と,CD−ROMドライ
ブ113と,通信部114と,から構成される。
【0041】制御部101は,バスBSに結合された上
記各部を制御する中央処理ユニットであり,CPU10
1a,ROM101bおよびRAM101c等を備えて
いる。CPU101aはROM101bに格納されたO
S(オペレーティングシステム)プログラムやアプリケ
ーション記憶部102に格納されたアプリケーションプ
ログラムに従って動作する。また,ROM101bはO
Sプログラムを格納するメモリであり,RAM101c
は各種プログラムのワークエリアとして使用するメモリ
である。
【0042】アプリケーション記憶部102は,後述す
る発話文書作成プログラム,発話文書再生プログラム,
喋り方データ作成・登録プログラム等の各種アプリケー
ションが記憶されている。また,実施の形態1の発話文
書作成装置100は,仮名漢字変換機能を有しており,
この仮名漢字変換機能を実現する仮名漢字変換アプリケ
ーションもアプリケーション記憶部102に記憶されて
いる。
【0043】喋り方データ記憶部103は,本発明の喋
り方データ記憶手段の役割を果たし,図2に示すよう
に,喋り方データ201の有する情報の一つである文字
列情報202に基づいて,該文字列情報202が同一の
喋り方データ201をグループ化し,文字列情報202
を用いてグループ単位で検索できるように記憶してい
る。
【0044】なお,喋り方データ201は,単語,文節
または文から成る文字列情報202,文字列情報202
の文字に対応した音韻から成る音韻列情報203,音韻
列情報203中の各音韻の継続時間長204,音韻列情
報203の任意の時点での相対的なピッチを指定するピ
ッチ情報205,音韻列情報203の各音韻の音量を指
定するベロシティ情報206および各喋り方データの分
類タイプを示すタイプ情報207を有している。また,
詳細な説明は省略するが,文字列情報202以外の他の
情報(例えば音韻列情報203やタイプ情報207)を
それぞれ検索キーとして所望の喋り方データ201を検
索することも可能である。
【0045】ここで,例えば,文字列情報202が『こ
んにちは』のグループを検索すると,音韻列情報203
が『コ,ン,ニ,チ,ワ』の3種類の喋り方データ20
1が得られる。これらの喋り方データ201は,文字列
情報202と音韻列情報203が共通しているものの,
継続時間長204,ピッチ情報205,ベロシティ情報
206の何れかが異なることにより,異なる喋り方デー
タ201として区別することができる。
【0046】また,例えば,文字列情報202が『今日
は』のグループを検索すると,音韻列情報203が
『コ,ン,ニ,チ,ワ』の3種類と音韻列情報203が
『キョ,ウ,ワ』の2種類の計5種類の喋り方データ2
01が得られる。これらの喋り方データ201は,先
ず,音韻列情報203で2つに区別可能であり,さらに
継続時間長204,ピッチ情報205,ベロシティ情報
206の何れかが異なることにより,それぞれ異なる喋
り方データ201として区別することができる。
【0047】なお,文字列情報202が『こんにちは』
のグループの3種類の喋り方データ201と,文字列情
報202が『今日は』のグループにおける音韻列情報2
03が『コ,ン,ニ,チ,ワ』の3種類の喋り方データ
201は,文字列情報202が異なるだけで,他の情報
(音韻列情報203〜タイプ情報207)は同一であ
る。したがって,実施の形態1では説明を簡単にするた
めに,喋り方データ記憶部103における喋り方データ
201を図2に示すようにデータ・テーブルの形式で示
したが,喋り方データ201を,文字列情報202の部
分と,音韻列情報203〜ベロシティ情報206の部分
と,タイプ情報207の部分とに分けて,それぞれをリ
ンクして同一の情報を共通化したデータベースの形式で
記憶することにより,全体の情報の低減およびメモリの
効率的な使用が図れるのは明らかである。
【0048】声色データ記憶部104は,本発明の声色
データ記憶手段の役割を果たし,合成する音声に声色を
付加するための声色データを複数記憶している。ここ
で,声色データは,例えば,音韻系列に対するスペクト
ル情報(時間的に変化していく情報であり,具体的に
は,ケプストラム,LSPパラメータ等で表現される)
の形態で記憶されている。また,複数の声色データとし
ては,図3に示すように,男性の声,女性の声,子供の
声,老人の声,掠れた声,明瞭な声,太い声,細い声,
力強い声,やさしい声,機械的な声のように,それぞれ
感覚的に識別可能な声色データが記憶されている。
【0049】音声合成部105は,本発明の音声合成手
段の役割を果たし,制御部101が検索した喋り方デー
タ記憶部103のグループ中の喋り方データ201を順
次読み出して,読み出した喋り方データ201の音韻列
情報203,継続時間長204,ピッチ情報205およ
びベロシティ情報206と声色データ記憶部104に記
憶されている声色データの一つとを用いて音声を合成す
るものである。
【0050】キー入力部106は,キーボード,マウス
等の入力デバイスを備えており,文字列の入力や,音声
の選択,発話文書の再生指定,発話文書の作成・登録等
の各種オペレーションを行うのに使用される。
【0051】表示部107は,液晶表示装置またはCR
Tディスプレイからなり,文字列の表示,発話文書の表
示,各種メッセージの表示等に使用される。
【0052】マイク108は,喋り方データ201の作
成・登録時に,元音声波形データとなるオリジナルの肉
声をサンプリングするのに使用される。
【0053】スピーカ109は,音声合成部105で合
成した音声の再生出力や,各種音の再生に使用される。
【0054】発話文書記憶部110は,作成された発話
文書を記憶するメモリである。詳細は後述するが,発話
文書とは,選択された喋り方データ201および声色デ
ータを指定する声色選択番号と,キー入力部106を介
して入力された文字列とを対応させて作成した文書であ
る。
【0055】I/F111は,バスBSとFDドライブ
112やCD−ROMドライブ113との間でデータ授
受を行うユニットである。FDドライブ112は着脱自
在のFD112a(記録媒体)を装着してデータを読み
出したり書き込む動作を実施する。CD−ROMドライ
ブ113は着脱自在のCD−ROM113a(記録媒
体)を装着してデータを読み出す動作を実施する。な
お,発話文書記憶部110に記憶されている発話文書
を,I/F111およびFDドライブ112を介してF
D112aに保存することも可能である。
【0056】通信部114は,通信回線に接続されてお
り,その通信回線を介して外部装置との通信を行う。
【0057】なお,実施の形態1では,制御部101,
キー入力部106および表示部107が本発明の文字列
入力手段および再生指定手段の役割を果たし,制御部1
01が本発明の検索手段の役割を果たし,スピーカ10
9,キー入力部106および制御部101が本発明の音
声選択手段および声色データ指定手段の役割を果たし,
制御部101および発話文書記憶部110が本発明の発
話文書記憶手段の役割を果たし,制御部101,キー入
力部106,表示部107,マイク108およびスピー
カ109が本発明の喋り方データ作成・登録手段の役割
を果たす。
【0058】なお,実施の形態1では,キー入力部10
6を介して文字列を入力する場合を例として説明する
が,特にこれに限定するものではなく,手書き入力装置
を接続して,手書きの文字を判別(文字認識)して文字
列を入力しても良く,さらにあらかじめ作成したワープ
ロ文書等から文字列を入力しても良い。
【0059】図4は,実施の形態1の発話文書作成装置
100の外観図を示す。図示の如く,ハードウェアの構
成としては,マイク108およびスピーカ109を有し
たパソコンを使用することが可能である。
【0060】以上の構成において, 発話文書の作成処理 発話文書の再生処理 タイプ情報を用いた発話文書の作成処理 タイプ情報を用いた発話文書の再生処理 喋り方データの作成・登録処理 発話文書の変更処理 の順で,その動作を説明する。
【0061】発話文書の作成処理 図5〜図9を参照して,発話文書の作成処理について説
明する。ここで,図5は発話文書の作成処理の概略フロ
ーチャートを示し,図6〜図9は発話文書の作成処理に
おける表示部107の表示画面の例を示す。なお,ここ
では発話文書作成装置100の本体電源が投入される
と,制御部101がアプリケーション記憶部102に格
納されている発話文書作成プログラムを起動して,図5
の概略フローチャートを実行するものとする。
【0062】先ず,文書作成者は,キー入力部106お
よび表示部107を用いて,単語,文節または文を構成
する文字列を入力する(S501:請求項18の第1の
工程)。例えば,キー入力部106を介して文字列『こ
んにちは』を入力すると,表示部107には,図6
(a)の表示画面D1に示すように,文字列『こんにち
は』が表示される。なお,この文字列『こんにちは』を
そのまま使用することも可能であるが,ここでは,さら
に仮名漢字変換機能を用いて,図6(b)の表示画面D
2に示すように,『こんにちは』→『今日は』の漢字仮
名交じりの文字列に変換したテキストを用いるものとす
る。
【0063】次に,喋り方データ記憶部103から,ス
テップS501で入力した文字列『今日は』と同一の文
字列情報202を有するグループを検索する(S50
2:請求項18の第2の工程)。換言すれば,文字列
『今日は』に対応した喋り方データ201を検索する。
具体的には,図2に示したように,喋り方データ記憶部
103には,文字列『今日は』に対応する文字列情報2
02のグループとして,音韻列情報203が『コ,ン,
ニ,チ,ワ』の3種類と音韻列情報203が『キョ,
ウ,ワ』の2種類の計5種類の喋り方データ201が得
られる。
【0064】続いて,声色データの指定を選択し,合成
する音声に声色を付加するため声色データを指定する
(S503,S504:請求項18の第3の工程)。具
体的には,例えば,図7(a)の表示画面D3に示すよ
うに,声色指定ボタン701を表示し,これをマウスで
クリックして,図7(b)の表示画面D4に示すよう
に,声色データ記憶部104に記憶してある声色データ
を表示して選択することにより実現できる。なお,ここ
では,選択された声色データに対応する声色選択番号
(図7(b)の声色データに対応する番号)を保持し,
以降,声色選択番号によって声色データを特定する。ま
た,声色データの指定を選択しない場合には,前回指定
した声色データ(すなわち,前回選択された声色選択番
号)が再度指定されたものと見做し,ステップS505
へ進むものとする。
【0065】次に,音声合成部105が,ステップS5
02で検索したグループ中の喋り方データ201を順次
読み出して,読み出した喋り方データ201の音韻列情
報203,継続時間長204,ピッチ情報205および
ベロシティ情報206と,指定された声色データとを用
いて,音声を合成し,スピーカ109を介して合成した
音声を出力する(S505:請求項18の第4の工
程)。具体的には,検索したグループに属する音韻列情
報203が『コ,ン,ニ,チ,ワ』の3種類の喋り方デ
ータ201と音韻列情報203が『キョ,ウ,ワ』の2
種類の喋り方データ201が順次,音声合成されて出力
される。
【0066】文書作成者は,順次再生される喋り方デー
タ201を聞いて,所望の音声を選択する(S506:
請求項18の第5の工程)。ここで,所望の音声が選択
されるまで,ステップS505〜S506を繰り返す。
【0067】ステップS506で所望の音声が選択され
ると,その時の声色データ(声色選択番号)と,選択し
た音声に対応する喋り方データ201と,ステップS5
01で入力した文字列『今日は』と,を対応させて発話
文書データを作成し,発話文書記憶部110に記憶し
(S507:請求項18の第6の工程),所定の終了キ
ーが指定されるまで,ステップS501〜S507を繰
り返す(S508)。
【0068】図8は,上記発話文書の作成処理で作成し
た発話文書の画面表示例を示し,図9は,発話文書記憶
部110に記憶されている発話文書データの例を示す。
図8に示すような発話文書において,例えば,花子さん
の言葉である『今日は,一太郎さん』や,『いいえ,特
許図面の……』という部分の声色データとして女性の声
を指定し,それ以外の部分の声色データとして男性の声
を指定することにより,音声合成部105を介して再生
する際に,一つの発話文書を複数の声色データで再生す
ることが可能である。
【0069】また,801で示す文字列『今日は』と8
02で示す文字列『今日は』は,画面表示における文字
列は同じであるが,図9の発話文書データの901,9
02で示すように,喋り方データ201の音韻列情報2
03が異なるため,文字列801が(コ,ン,ニ,チ,
ワ)と発音され,文字列802が(キョ,ウ,ワ)と発
音される。したがって,文書作成者の意図した通りの読
み方で正確に文書を音声化することができる。
【0070】前述したように発話文書の作成処理におい
て,入力した文字列(文字情報)と文書作成者の意図す
る喋り方を含む音声情報(喋り方データ)との整合性を
とった発話文書データを作成することができる。
【0071】また,発話文書データ(換言すれば,喋り
方データ201)が音韻列情報203の他に,継続時間
長204,ピッチ情報205およびベロシティ情報20
6を有しており,かつ,喋り方データ201を音声合成
した音声を文書作成者が実際に聞いて発話文書データを
作成できるので,アクセントや,声の大きさ(音量),
声の高さ等を調整して意図する喋り方を有した情報(発
話文書データ)を作成することにより,非言語情報にあ
たる感情等の表現を情報として付加することができる。
【0072】感情等の表現としては,例えば,『わかり
ました』という文字列の喋り方データ201を音声合成
し,次の2種類を選択することにより,文書作成者の意
図する感情を表現することができる。
【0073】1)『わかりました』という文字列を,し
り上がりの調子で喋る場合,わかったか否かを問いかけ
る疑問文となり,文章中における使い方によって,相手
がわかったか否か多少不安であるという感情等を含ませ
ることができる。 2)『わかりました』という文字列を,例えば,『た』
の部分のみの音量を大きくして,短く喋る場合,文字通
りの意味で,理解したこと,または承諾したことを情報
として伝える一方で,文章中における使い方によって,
十分理解していること,理解したが不快であること,不
承不承の承諾であること等を感情として表現することが
できる。
【0074】発話文書の再生処理 次に,図10〜図13を参照して,発話文書の再生処理
について説明する。ここで,図10は発話文書の再生処
理の概略フローチャートを示し,図11〜図13は発話
文書の再生処理における表示部107の表示画面の例を
示す。なお,図示を省略するが,表示部107の表示画
面上から発話文書の再生処理を選択すると,制御部10
1がアプリケーション記憶部102に格納されている発
話文書再生プログラムを起動して,図10の概略フロー
チャートを実行するものとする。
【0075】先ず,発話文書記憶部110に記憶されて
いる発話文書の一覧を表示部107に表示し,文書作成
者に再生する発話文書の選択を促す。文書作成者がキー
入力部106を介して発話文書を選択する(S100
1:請求項20の第7の工程)と,選択された発話文書
を発話文書記憶部110から読み出して,表示部107
に表示する(S1002)。このとき,図11に示すよ
うに,発話文書の各文字列毎に指定されている声色デー
タに基づいて,表示する文字列のフォントや,装飾方法
(例えば,網点・反転表示等)を変えて表示することに
より,視覚的に声色データの違いを認識できるようにす
ると便利である。
【0076】次に,キー入力部106および表示部10
7を用いて発話文書を再生する再生範囲を,図12の表
示画面上の1)発話文書中の任意の文字列単位,2)文
章単位,3)ページ単位,4)発話文書全体(文書単
位)の何れかから選択する(S1003)。ここで,例
えば,1)の文字列単位を選択し,図13(a)の表示
画面に示すように,発話文書中の任意の文字列単位(少
なくとも一つの文字列)を指定すると,指定された文字
列1301が反転表示される。また,2)の文章単位を
選択し,図13(b)の表示画面に示すように,発話文
書中の任意の文章単位(少なくとも一つの文章単位)を
指定すると,指定された文章1302が反転表示され
る。なお,3)のページ単位および4)の発話文書全体
を指定した場合には,画面表示は図11のままで指定さ
れたページ番号または文書全体の指定を示すメッセージ
が表示されるものとする。
【0077】ステップS1003において再生範囲が指
定されると,音声合成部105が,指定された再生範囲
に基づいて,発話文書中の該当する発話文書データ(喋
り方データおよび声色データ)を順次読み出して,音声
を合成する(S1004:請求項20の第8の工程)。
【0078】その後,指定された再生範囲の音声合成が
終了すると,表示部107上の所定の再生処理の終了ボ
タン(図示せず)が選択されるまで,ステップS100
3〜S1004を繰り返す(S1005)。
【0079】前述したように発話文書の再生処理では,
あらかじめ発話文書が,文字列(文字情報)と文書作成
者の意図する喋り方を含む音声情報(喋り方データ)と
の整合性をとった発話文書データとして作成されている
ので,表示画面上に表示された発話文書(表示された文
字列)から再生したい音声だけを視覚的に選択すること
ができる。
【0080】また,発話文書データ(換言すれば,喋り
方データ201)が,音韻列情報203の他に,継続時
間長204,ピッチ情報205およびベロシティ情報2
06を有しており,かつ,喋り方データ201を音声合
成した音声を文書作成者が実際に聞いて作成したもので
あるため,非言語情報にあたる感情等の表現が付加され
た音声として再生することができる。
【0081】タイプ情報を用いた発話文書の作成処理 タイプ情報を用いた発話文書の作成処理について説明す
る。図14は,タイプ情報を用いた発話文書の作成処理
の概略フローチャートを示し,図示を省略するが,表示
部107の表示画面上からタイプ情報を用いた発話文書
の作成処理を選択すると,制御部101がアプリケーシ
ョン記憶部102に格納されているタイプ情報を用いた
発話文書作成プログラムを起動して,図14の概略フロ
ーチャートを実行するものとする。
【0082】なお,図14の概略フローチャートは,基
本的に図5で示した発話文書の作成処理の概略フローチ
ャートと同じであるため,同一のステップは共通の符号
を付して,ここでは異なる部分のみを説明する。
【0083】先ず,キー入力部106および表示部10
7を用いて,喋り方データの分類タイプを指定する(S
1401)。ここで,分類タイプとは,例えば,それぞ
れの喋り方データに対応する音声を,東京型発音タイ
プ,大阪型発音タイプ,徳島型発音タイプ等のように地
域によって分類したものや,老人型発音タイプ,若者型
発音タイプ,高校生型発音タイプ等のように年齢によっ
て分類したものを用いることができる。換言すれば,あ
らかじめ分類タイプを決めて,その分類タイプに基づい
て,例えば,大阪型発音タイプの場合には,関西風の喋
り方データ201を作成し,大阪型発音タイプとして分
類し,それぞれの喋り方データ201のタイプ情報20
7に登録しておく。
【0084】図15は分類タイプの指定画面の例を示
す。ここでは,TYPE1:東京型,TYPE2:大阪
型,TYPE3:老人型,TYPE4:若者型,TYP
E5:高校生型の5つの分類タイプがあらかじめ用意さ
れているものとする。
【0085】分類タイプの指定後,文字列の入力(S5
01)が行われると,次に,喋り方データ記憶部103
から,ステップS501で入力された文字列と,指定さ
れた分類タイプを用いて,該文字列と同一の文字列情報
を有するグループで,かつ,指定された分類タイプと同
一のタイプ情報を有する喋り方データ201を喋り方デ
ータ記憶部103から検索する(S1402)。換言す
れば,該当する分類タイプの喋り方データ201のみが
検索されることになる。この場合,喋り方データ記憶部
103内に,該当する分類タイプの喋り方データ201
が複数存在する場合には複数の喋り方データ201が検
索されることになる。
【0086】続いて,声色データの指定(S503,S
504)が実行される。
【0087】次に,音声合成部105が,ステップS1
402で検索した喋り方データ201を読み出して,読
み出した喋り方データ201の音韻列情報203,継続
時間長204,ピッチ情報205およびベロシティ情報
206と,指定された声色データとを用いて,音声を合
成し,スピーカ109を介して合成した音声を出力する
(S505)。ここでは,分類タイプが指定されている
ので,該当する喋り方データ201のみが音声合成され
る。
【0088】その後,所望の音声を選択すると(S50
6),発話文書データを作成して発話文書記憶部110
に記憶し(S507),所定の終了キーが指定されるま
で,ステップS1401,S501,S1402および
S502〜S507を繰り返す(S508)。なお,2
回目以降のステップS1401では,特に分類タイプの
変更を行わないかぎり,すぐにステップS501へ進
み,文字列の入力が行えるものとする。
【0089】前述したようにタイプ情報を用いた発話文
書の作成処理において,音声合成を行って再生する喋り
方データ201の分類タイプを指定することができるの
で,喋り方に所定の特徴を有するタイプの発話文書デー
タ(すなわち,発話文書)を容易に作成することがで
き,便利である。また,発話文書の作成時間の短縮を図
ることができる。
【0090】なお,図14のフローチャートでは,文字
列を入力する度に,ステップS503〜ステップS50
6を実行して,声色データの指定および音声の選択を行
うようにしたが,特にこれに限定するものではなく,ス
テップS1402で該当する分類タイプの喋り方データ
201を検索すると,ステップS507へ進み,検索し
た喋り方データ201を用いて自動的に発話文書を記憶
するようにしても良い。この場合には,発話文書を構成
する文字列をある程度入力した後,後からステップS5
03〜ステップS506を実行して,それぞれの文字列
に対して声色データの指定が行えるようにする。
【0091】タイプ情報を用いた発話文書の再生処理 タイプ情報を用いた発話文書の再生処理とは,再生に使
用する分類タイプを指定し,指定された分類タイプと,
の発話文書の作成処理で作成した発話文書(発話文書
記憶部110に記憶されている発話文書)の中の文字列
情報202および音韻列情報203とを用いて,喋り方
データ記憶部103から該当する喋り方データ201を
検索し,検索した喋り方データ201との発話文書の
作成処理で作成した発話文書(発話文書記憶部110に
記憶されている発話文書)の中の声色データとを用い
て,音声合成部105で音声を合成し,スピーカ109
を介して再生出力するものである。
【0092】換言すれば,の発話文書の作成処理で指
定した喋り方データ201の継続時間長204,ピッチ
情報205およびベロシティ情報206を使用せずに,
タイプ情報207によって特定された喋り方データ20
1の継続時間長204,ピッチ情報205およびベロシ
ティ情報206を用いるものである。
【0093】図16は,タイプ情報を用いた発話文書の
再生処理の概略フローチャートを示し,図示を省略する
が,表示部107の表示画面上からタイプ情報を用いた
発話文書の再生処理を選択すると,制御部101がアプ
リケーション記憶部102に格納されているタイプ情報
を用いた発話文書再生プログラムを起動して,図16の
概略フローチャートを実行するものとする。
【0094】先ず,発話文書記憶部110に記憶されて
いる発話文書の一覧を表示部107に表示し,文書作成
者に再生する発話文書の選択を促す。文書作成者がキー
入力部106を介して発話文書を選択する(S160
1)と,選択された発話文書を発話文書記憶部110か
ら読み出して,表示部107に表示する(S160
2)。
【0095】次に,キー入力部106および表示部10
7を用いて,再生に使用する分類タイプを指定する(S
1603)。なお,分類タイプの指定は,図15の表示
画面を使用して指定することができる。
【0096】続いて,指定された分類タイプと,選択さ
れた発話文書の中の文字列情報202および音韻列情報
203とを用いて,喋り方データ記憶部103から該当
する喋り方データ201を検索する(S1604)。
【0097】次に,音声合成部105が,検索した喋り
方データ201の音韻列情報203,継続時間長20
4,ピッチ情報205およびベロシティ情報206と,
選択された発話文書の中の声色データ(検索に使用した
音韻列情報203を含む発話文書データの声色データ)
とを用いて,音声を合成し,スピーカ109を介して再
生出力する(S1605)。これによって,指定された
分類タイプおよび声色データで,該当する文字列情報2
02および音韻列情報203が,音声合成されたことに
なる。
【0098】その後,選択された発話文書の全ての文字
列を音声合成したか否か判定し(S1606),該当す
る発話文書中の文字列を全て音声合成して出力するま
で,ステップS1604,S1605を繰り返し,出力
が終わると処理を終了する。
【0099】前述したようにタイプ情報を用いた発話文
書の再生処理を実行することにより,既に作成した発話
文書で,喋り方(すなわち,喋り方データ201)が設
定されている場合でも,分類タイプを指定することで,
異なる喋り方で音声を再生することが可能である。
【0100】喋り方データの作成・登録処理 次に,図17〜図25を参照して,新規に喋り方データ
201を作成して,喋り方データ記憶部103に登録す
る方法について説明する。喋り方データ201は,図2
で示したように,文字列情報202,音韻列情報20
3,継続時間長204,ピッチ情報205,ベロシティ
情報206およびタイプ情報207から構成される。し
たがって,喋り方データ201の作成とは,これらの情
報を作成または設定することである。
【0101】なお,喋り方データ201は,原則とし
て,あらかじめ標準となるものが作成されて喋り方デー
タ記憶部103に複数登録されているものとするが,文
書作成者の個々の感覚によって自由に喋り方データ20
1を作成し,登録することにより,喋り方(音声)の選
択を広げることができ,さらに発話文書の表現力を増す
ことができる。
【0102】図17は,喋り方データの作成・登録処理
の概略フローチャートを示す。先ず,あらかじめ収録し
た音声波形データを入力またはマイク108を用いて自
然音声(ユーザが発話した肉声)を入力し(S170
1),入力した自然音声を解析してデジタル化した後,
音声波形データを生成して表示部107に表示する(S
1702)。なお,ここで,あらかじめ収録した音声波
形データとは,発話文書作成装置100において,事前
にマイク108を用いて自然音声を入力し,アプリケー
ション記憶部102や,I/F111およびFDドライ
ブ112を介してFD112aに保存しておいた音声波
形データを示す。また,他の装置で収録した音声波形デ
ータを入力して用いても良い。
【0103】生成された音声波形データは,図18の1
0Bで示すように表示部107の表示画面上に表示され
る。なお,図18は,表示部107に表示される喋り方
データの作成・登録処理の表示画面を示し,音韻列情報
203を表示するウインドである音節表示ウインド10
Aと,入力した自然音声から生成した音声波形データを
表示するウインドである元波形表示ウインド10Bと,
喋り方データ201から合成した波形データを表示する
ウインドである合成波形表示ウインド10Cと,ピッチ
情報205を表示するウインドであるピッチ表示ウイン
ド10Dと,ベロシティ情報206を表示するウインド
であるベロシティ表示ウインド10Eと,元波形表示ウ
インド10Bに表示されている音声波形データの音声再
生/停止を指定するための元音声再生/停止ボタン10
Fと,合成波形表示ウインド10Cに表示されている波
形データの音声再生/停止を指定するための音声再生/
停止ボタン10Gと,ピッチ情報205のピッチ基準を
設定するためのピッチ基準設定目盛り10Hと,文字列
情報202を入力するための文字列入力エリア10Y
と,を有している。
【0104】次に,ステップS1702で生成した音声
波形データの音韻分析を行って各音韻の継続時間長を求
め,求めた各音韻の継続時間長を時間軸上で視覚化した
ラベルを生成し,表示部107に表示する(S170
3)。ここで,視覚化したラベルとは,図19の表示画
面に示すように,各ウインド10A〜10Eを縦方向に
横切る線10Iを示す。なお,音韻分析によって自動的
に付与された各ラベル10Iの位置は,キー入力部10
6のマウスを用いて,マニュアルで移動(または変更)
可能とする。これは,音韻分析の精度が低い場合に,よ
り適切な位置にラベル10Iを付与できるようにするた
めである。
【0105】続いて,設定されたラベル(すなわち,継
続時間長)10Iで仕切られたスペースに対応する音韻
列情報を入力する(S1704)。具体的には,キー入
力部106を用いたマニュアル操作で,音節表示ウイン
ド10Aのラベル10Iの間に該当する音韻(文字)を
入力する。図20は,音韻列情報203を入力した例を
示し,時間軸上,先頭から「ヨ」,「ロ」,「Uシ」,
「イ」,「デ」,「Uス」,「,」,「カ」の順で音韻
入力された例を示している。この入力された音韻の内,
「Uシ」および「Uス」は無声化音韻を示し,その他は
有声化音韻を示す。
【0106】続くステップS1705では,音声波形デ
ータをピッチ分析してピッチ曲線を表示する。図21に
は,ピッチ表示ウインド10Dに表示されたピッチ分析
後のピッチ曲線が示されている。
【0107】続くステップS1706では,ピッチ調整
が行われる。このピッチ調整には,後述するピッチラベ
ルの追加や削除,ピッチ基準のピッチ値の変更等の操作
が含まれている。すなわち,ステップS1706では,
音韻列情報203の任意の時点でのピッチの値を調整ま
たは追加してピッチ情報205を生成する。図22は,
ピッチ調整においてピッチラベル10Jを追加した例を
示し,音韻を仕切るラベル10Iにさらにピッチラベル
10Jが追加されている。この追加操作は,ピッチ表示
ウインド10D内に直接マウス等でラベル位置を指定す
れば良い。このようにして新たに付与されたピッチは隣
り合うピッチと直線で結ばれるので,一つの音韻の中に
所望のピッチ変化を与えることができ,理想とする声質
に加工することが容易となる。
【0108】続くステップS1707では,ステップS
1706までの処理でピッチ調整を終えた段階での合成
波形が生成され,例えば,図23の表示画面に示すよう
に,合成波形表示ウインド10Cに合成した波形データ
が表示される。このとき,ベロシティは未設定であるた
め,図示の如く,ベロシティ表示ウインド10Eにはプ
レーンなベロシティが表示される。
【0109】なお,詳細な説明は省略するが,ステップ
S1707において,合成波形表示ウインド10Cに表
示されている合成した波形データと,元波形表示ウイン
ド10Bに表示されているオリジナルの音声波形データ
とを比較再生させることが可能である。また,この段階
では,合成される音声の声色の種類(声色データ)はデ
フォルトの声色とする。具体的には,音声再生/停止ボ
タン10Gを操作して合成した波形データの再生または
停止を行うことができ,元音声再生/停止ボタン10F
を操作して音声波形データの再生または停止を行うこと
ができる。
【0110】続くステップS1708では,音韻の音量
を示すベロシティ(ベロシティ情報206)をマニュア
ル操作で調整する。すなわち,音韻列情報203の各音
韻の音量を調整してベロシティ情報206を生成する。
このベロシティの調整は,図24に示すように,音韻毎
に行われ,あらかじめ決められた段階の範囲(例えば,
16段階)で調整される。
【0111】このベロシティの調整後に,再び合成した
波形データの再生が操作されると,音韻毎に声の強さが
変化して,プレーンなベロシティ状態と比較して,声
(音声)に抑揚を付加される。
【0112】次に,ステップS1709において,文書
作成者(ここでは喋り方データの作成者)が意図する音
声波形データに対応する文字列を入力して文字列情報2
02を設定する。例えば,図25に示すように,キー入
力部106を介して文字列入力エリア10Yに文字列
『宜しいですか』を入力すると,この文字列『宜しいで
すか』が文字列情報202として設定される。
【0113】続くステップS1710では,設定された
文字列情報202に基づいて,喋り方データ記憶部10
3の該当するグループを検索し,検索したグループ中に
喋り方データ201を追加登録する。すなわち,文字列
入力エリア10Yに設定された文字列情報202と,音
節表示ウインド10Aに入力された音韻列情報203
と,視覚化したラベルとして設定された継続時間長20
4と,ピッチ表示ウインド10Dに設定されたピッチ情
報205と,ベロシティ表示ウインド10Eに設定され
たベロシティ情報206とから喋り方データ201を生
成し,喋り方データ記憶部103に記憶する。
【0114】なお,説明を省略するが,このように登録
した喋り方データ201のタイプ情報207は,喋り方
データ201の登録後に,別途,分類タイプ設定・変更
処理を実行して設定するものとする。これは,喋り方デ
ータ201の作成作業と分類タイプの設定作業を同時に
行うと,文書作成者の感覚が鈍り,タイプの分類が的確
に行えなくなることを考慮したものであり,上記ステッ
プS1709の後にステップを追加してタイプ情報20
7の設定を行うようにしても良いのは勿論である。
【0115】また,実施の形態1では,マイク108を
用いて自然音声を入力して音声波形データを生成した
が,喋り方データ記憶部103に記憶されている喋り方
データ201の一つを指定して,オリジナルの音声波形
データとして入力し,この喋り方データ201の持つ,
継続時間長204,ピッチ情報205およびベロシティ
情報206を修正して,喋り方データ201の有する文
字列情報202および音韻列情報203と,修正後の継
続時間長204,ピッチ情報205およびベロシティ情
報206を用いて新規の喋り方データ201を作成し
て,喋り方データ記憶部103に登録しても良い。
【0116】また,実施の形態1では,ステップS17
03でラベルを生成した後,ステップS1704で音韻
列情報を入力する例を示したが,例えば,音韻列情報を
入力した後,ラベルを生成しても良い。さらに,音声認
識技術を用いることにより,音韻列情報の入力からラベ
ルの生成までを自動化することも可能である。
【0117】発話文書の変更処理 発話文書の変更処理は,発話文書記憶部110に記憶さ
れている発話文書を再度表示部107に表示して,発話
文書を構成する文字列および喋り方データ201を変更
するものである。
【0118】図26は,発話文書の変更処理の概略フロ
ーチャートを示す。先ず,発話文書記憶部110に記憶
されている発話文書の一覧を表示部107に表示し,文
書作成者に変更する発話文書の選択を促す。文書作成者
がキー入力部106を介して発話文書を選択する(S2
601)と,選択された発話文書を発話文書記憶部11
0から読み出して,表示部107に表示する(S260
2)。
【0119】次に,表示画面(図示せず)から変更する
項目を指定する(S2603)。ここで,変更可能な項
目としては,1)発話文書中の文字列の変更,2)文字
列に対応する喋り方データの変更,3)喋り方データ中
の情報の変更,4)声色データの変更がある。
【0120】次に,変更の対象となる文字列を指定する
と(S2604),ステップS2603で指定された変
更項目を判定し(S2605),変更項目にしたがって
ステップS2606〜ステップS2609の何れかへ進
む。
【0121】1)発話文書中の文字列の変更の場合に
は,ステップS2606へ進み,文字列の変更処理を実
行する。この文字列の変更処理は,基本的に図5で示し
た発話文書の作成処理の概略フローチャートと同様の処
理を行うものである。異なる部分は,図5のステップS
507が,作成した発話文書(すなわち,入力した文字
列を用いて作成した発話文書)を用いて,変更指定され
た文字列部分の発話文書(喋り方データ記憶部103に
記憶されている元の発話文書)を置き換える点である。
【0122】2)文字列に対応する喋り方データの変更
の場合には,ステップS2607へ進み,喋り方データ
の変更処理を実行する。この喋り方データの変更処理
は,基本的に図5で示した発話文書の作成処理の概略フ
ローチャートからステップS501を除いた他のステッ
プを実行するものである。異なる部分は,図5のステッ
プS507が,作成した発話文書(すなわち,喋り方デ
ータ変更後の発話文書)を用いて,変更指定された文字
列部分の発話文書(喋り方データ記憶部103に記憶さ
れている元の発話文書)を置き換える点である。
【0123】3)喋り方データ中の情報の変更の場合に
は,ステップS2608へ進み,喋り方データ中の情報
の変更処理を実行する。喋り方データ中の情報の変更処
理は,基本的に図17で示した喋り方データの作成・登
録処理と同様の方法で実現することできる。すなわち,
変更指定された文字列部分の喋り方データ201が有す
る文字列情報202,音韻列情報203,継続時間長2
04,ピッチ情報205およびベロシティ情報206を
オリジナルの情報として,それぞれ文字列入力エリア1
0Y,音節表示ウインド10A,視覚化したラベル,ピ
ッチ表示ウインド10D,ベロシティ表示ウインド10
Eに設定した後,視覚化したラベルの調整,ピッチの調
整,ベロシティの調整を行って喋り方データ201を変
更するものである。
【0124】4)声色データの変更の場合には,ステッ
プS2609へ進み,声色データの変更処理を実行す
る。この喋り方データの変更処理は,基本的に図5で示
した発話文書の作成処理の概略フローチャートのステッ
プS503とステップS504を実行するものである。
すなわち,声色データの変更が指定された文字列に対応
する発話文書(発話文書データ)中の声色データを,新
たに指定された声色データで置き換えるものである。
【0125】このように発話文書記憶部110に記憶さ
れている発話文書を変更することが可能であるため,作
成した発話文書を効率的に利用することが可能となる。
例えば,定型の発話文書を作成しておき,必要な部分の
みを変更して使用することができる。
【0126】前述したように実施の形態1によれば,文
字情報(文字列)と音声情報(喋り方データ)という2
つの表現形態の情報を整合性の取れた形で複合した情報
(発話文書)を作成することができる。
【0127】また,発話文書作成装置100で作成した
発話文書は,文字情報と文書作成者の意図する喋り方を
含む音声情報(喋り方データ)とが1対1に対応してい
るため,通常の文書作成装置(日本語ワードプロセッ
サ,英文ワードプロセッサ)における文書の移動・複写
と同様の操作を行っても,文字情報と音声情報の整合が
崩れることがなく,発話文書の編集が容易に行える。し
たがって,聴くだけでなく,見ながら作業をすすめるこ
とができるため,音声情報の編集が容易にできる。
【0128】さらに,使用目的に応じて,文字と音声の
両方を同時に提示することができると共に,どちらか一
方の情報を切り出して,一方の情報のみを提示すること
もできる。例えば,本発明の発話文書作成装置で作成さ
れた発話文書を電子メール等で受信した場合に,外出先
から電話で音声情報(喋り方データを用いて合成した音
声)のみを取り出すことが可能である。
【0129】また,文書作成者が所望の音声(喋り方デ
ータ)を選択して発話文書を作成できるので,作成した
発話文書に基づいて音声合成を行った際に,読みや,ア
クセント等の間違いのない,換言すれば,文書作成者の
意図する正確な音声を出力することが可能となる。
【0130】また,実施の形態1で説明した発話文書作
成手順をプログラム化し,これをコンピュータ読み取り
可能な記録媒体に,コンピュータが実行可能なプログラ
ムとして格納することができる。
【0131】〔実施の形態2〕実施の形態2は,発話文
書の作成処理の中で喋り方データ201の編集(喋り方
データ中の情報の変更処理)を行えるようにすると共
に,喋り方データ201のベロシティ情報206を,音
韻列情報203の任意の時点での相対的な音量を指定す
る情報としたものである。なお,基本的な構成および動
作は,実施の形態1の発話文書作成装置100と同様に
つき,ここでは異なる部分のみを説明する。
【0132】図27は,実施の形態2の発話文書の作成
処理の概略フローチャートを示す。なお,基本的な動作
は,図5に示した実施の形態1の発話文書の作成処理と
同様につき,同一のステップは共通の符号を付けて簡単
に説明する。
【0133】先ず,文書作成者は,キー入力部106お
よび表示部107を用いて,単語,文節または文を構成
する文字列を入力する(S501:請求項19の第1の
工程)。次に,喋り方データ記憶部103から,ステッ
プS501で入力した文字列と同一の文字列情報202
を有するグループを検索する(S502:請求項19の
第2の工程)。
【0134】続いて,声色データの指定を選択し,合成
する音声に声色を付加するため声色データを指定する
(S503,S504:請求項19の第3の工程)。こ
こでは,選択された声色データに対応する声色選択番号
を保持し,以降,声色選択番号によって声色データを特
定する。また,声色データの指定を選択しない場合に
は,前回指定した声色データ(すなわち,前回選択され
た声色選択番号)が再度指定されとものと見做し,ステ
ップS505へ進むものとする。
【0135】次に,音声合成部105が,ステップS5
02で検索したグループ中の喋り方データ201を順次
読み出して,読み出した喋り方データ201の音韻列情
報203,継続時間長204,ピッチ情報205および
ベロシティ情報206と,指定された声色データとを用
いて,音声を合成し,スピーカ109を介して合成した
音声を出力する(S505:請求項19の第5の工
程)。
【0136】続いて,文書作成者は,順次再生される喋
り方データ201を聞いて,所望の音声を選択するか,
または所望の音声が存在しない場合には喋り方データの
編集を選択した後,最も近い音声を選択する。なお,喋
り方データの編集の選択は,図7に示した声色データの
指定の表示画面と同様の方法で行うものとする。この選
択の有無にしたがって,ステップS506およびS27
01において,音声が選択されたか,または喋り方デー
タの編集が選択されたかを判定する。
【0137】所望の音声が選択されると,その時の声色
データ(声色選択番号)と,選択した音声に対応する喋
り方データ201と,ステップS501で入力した文字
列と,を対応させて発話文書データを作成し,発話文書
記憶部110に記憶し(S507:請求項19の第6の
工程),所定の終了キーが指定されるまで,ステップS
501以下の処理を繰り返す(S508)。
【0138】一方,喋り方データの編集が選択される
と,ステップS2702へ進み,最も近い音声が選択さ
れたか否かを判定し,最も近い音声が選択されると,ス
テップS2703へ進み,後述するように,図28の喋
り方データ中の情報の変更処理の概略フローチャートを
実行する。
【0139】その後,喋り方データ中の情報の変更処理
で変更した喋り方データ201と,その時の声色データ
(声色選択番号)と,ステップS501で入力した文字
列と,を対応させて発話文書データを作成し,発話文書
記憶部110に記憶し(S507),所定の終了キーが
指定されるまで,ステップS501以下の処理を繰り返
す(S508)。
【0140】図28は,実施の形態2における喋り方デ
ータ中の情報の変更処理の概略フローチャートを示す。
先ず,選択した最も近い音声に対応する喋り方データ2
01が有する文字列情報202,音韻列情報203,継
続時間長204,ピッチ情報205およびベロシティ情
報206を喋り方データ記憶部103から読み出す(S
2801)。
【0141】次に,図29に示すように,ステップS2
801で読み出した文字列情報202,音韻列情報20
3,継続時間長204,ピッチ情報205およびベロシ
ティ情報206を,それぞれ文字列入力エリア10Y,
音節表示ウインド10A,視覚化したラベル,ピッチ表
示ウインド10D,ベロシティ表示ウインド10Eに設
定(すなわち,表示)する(S2802)。また,この
とき喋り方データ201から合成した波形データを元波
形表示ウインド10Bに表示する。
【0142】続いて,図29の表示画面上において,視
覚化したラベルの調整,ピッチの調整またはベロシティ
の調整を行って喋り方データ201の情報を変更する
(S2803)。なお,実施の形態2では,喋り方デー
タ201のベロシティ情報206を,音韻列情報203
の単位とは無関係に音韻列情報203の任意の時点での
相対的な音量として指定および調整することが可能であ
る。具体的には,音韻列情報203の単位(区切り)を
示すラベル10Iとは別に,任意の位置にラベル10K
を指定し,音量(ベロシティ情報206)を調整するこ
とができるものとする。これによって,さらに喋り方を
多様に編集することができる。
【0143】次に,調整後の情報に基づいて合成波形を
生成し,例えば,図30の表示画面に示すように,合成
波形表示ウインド10Cに合成した波形データを表示す
ると共に,音声合成を行って再生する(S2804)。
なお,詳細な説明は省略するが,ステップS2802に
おいて,合成波形表示ウインド10Cに表示されている
合成した波形データと,元波形表示ウインド10Bに表
示されているオリジナルの喋り方データから合成した波
形データとを比較再生させることが可能であるものとす
る。
【0144】その後,所定の終了キーが指定されるま
で,ステップS2803〜S2804の処理を繰り返す
(S2805)。
【0145】前述したように実施の形態2によれば,発
話文書の作成中に,喋り方データ中の細部の情報の編集
(ラベルの調整,ピッチの調整およびベロシティの調
整)を行うことができるので,さらに利便性を向上させ
ることができる。
【0146】また,喋り方データ201のベロシティ情
報206を,音韻列情報203の任意の時点での相対的
な音量を指定する情報としたため,文書作成者の意図す
る喋り方データの作成が容易になると共に,さらに多彩
な表現の喋り方を作成することができる。
【0147】
【発明の効果】以上説明したように,本発明の発話文書
作成装置(請求項1)は,単語,文節または文から成る
文字列情報,文字列情報の文字に対応した音韻から成る
音韻列情報,音韻列情報中の各音韻の継続時間長,音韻
列情報の任意の時点での相対的なピッチを指定するピッ
チ情報および音韻列情報の各音韻の音量を指定するベロ
シティ情報から構成される喋り方データを,喋り方デー
タの文字列情報に基づいて,文字列情報が同一の喋り方
データをグループ化してグループ毎に記憶した喋り方デ
ータ記憶手段と,単語,文節または文を構成する文字列
を入力するための文字列入力手段と,文字列入力手段を
介して入力された文字列を用いて,文字列と同一の文字
列情報を有するグループを喋り方データ記憶手段から検
索する検索手段と,合成する音声に声色を付加するため
の声色データを複数記憶した声色データ記憶手段と,検
索手段で検索したグループ中の喋り方データを順次読み
出して,読み出した喋り方データの音韻列情報,継続時
間長,ピッチ情報およびベロシティ情報と声色データ記
憶手段に記憶されている声色データの一つとを用いて音
声を合成する音声合成手段と,音声合成手段で合成され
た音声から所望の音声を選択するための音声選択手段
と,音声選択手段を用いて選択された音声に対応する喋
り方データを文字列入力手段を介して入力された文字列
と対応させて発話文書として記憶する発話文書記憶手段
と,を備えたため,文字情報と音声情報という2つの表
現形態の情報を整合性の取れた形で複合した情報(発話
文書)を作成することができる。また,文字情報と文書
作成者の意図する喋り方を含む音声情報(喋り方デー
タ)との整合性をとった情報(発話文書)を作成して,
文書中に非言語情報にあたる感情等の表現を付加するこ
とができる。さらに,文書作成者の意図する喋り方で正
確に音声を合成することができる。
【0148】また,本発明の発話文書作成装置(請求項
2)は,単語,文節または文から成る文字列情報,文字
列情報の文字に対応した音韻から成る音韻列情報,音韻
列情報中の各音韻の継続時間長,音韻列情報の任意の時
点での相対的なピッチを指定するピッチ情報および音韻
列情報の任意の時点での相対的な音量を指定するベロシ
ティ情報から構成される喋り方データを,喋り方データ
の文字列情報に基づいて,文字列情報が同一の喋り方デ
ータをグループ化してグループ毎に記憶した喋り方デー
タ記憶手段と,単語,文節または文を構成する文字列を
入力するための文字列入力手段と,文字列入力手段を介
して入力された文字列を用いて,文字列と同一の文字列
情報を有するグループを喋り方データ記憶手段から検索
する検索手段と,合成する音声に声色を付加するための
声色データを複数記憶した声色データ記憶手段と,検索
手段で検索したグループ中の喋り方データを順次読み出
して,読み出した喋り方データの音韻列情報,継続時間
長,ピッチ情報およびベロシティ情報と声色データ記憶
手段に記憶されている声色データの一つとを用いて音声
を合成する音声合成手段と,音声合成手段で合成された
音声から所望の音声を選択するための音声選択手段と,
音声選択手段を用いて選択された音声に対応する喋り方
データを文字列入力手段を介して入力された文字列と対
応させて発話文書として記憶する発話文書記憶手段と,
を備えたため,文字情報と音声情報という2つの表現形
態の情報を整合性の取れた形で複合した情報(発話文
書)を作成することができる。また,文字情報と文書作
成者の意図する喋り方を含む音声情報(喋り方データ)
との整合性をとった情報(発話文書)を作成して,文書
中に非言語情報にあたる感情等の表現を付加することが
できる。さらに,文書作成者の意図する喋り方で正確に
音声を合成することができる。
【0149】また,本発明の発話文書作成装置(請求項
3)は,発話文書の再生を指定し,発話文書中の喋り方
データを順次読み出して,音声を合成することができる
ため,発話文書の確認が容易に行える。
【0150】また,本発明の発話文書作成装置(請求項
4)は,発話文書を再生する範囲として,発話文書中の
任意の文字列単位,文章単位,ページ単位または発話文
書全体の指定が可能であるため,発話文書の再生・確認
が容易に行える。
【0151】また,本発明の発話文書作成装置(請求項
5)は,単語,文節または文から成る文字列情報,文字
列情報の文字に対応した音韻から成る音韻列情報,音韻
列情報中の各音韻の継続時間長,音韻列情報の任意の時
点での相対的なピッチを指定するピッチ情報および音韻
列情報の各音韻の音量を指定するベロシティ情報から構
成される喋り方データを,喋り方データの文字列情報に
基づいて,文字列情報が同一の喋り方データをグループ
化してグループ毎に記憶した喋り方データ記憶手段と,
単語,文節または文を構成する文字列を入力するための
文字列入力手段と,文字列入力手段を介して入力された
文字列を用いて,文字列と同一の文字列情報を有するグ
ループを喋り方データ記憶手段から検索する検索手段
と,合成する音声に声色を付加するための声色データを
複数記憶した声色データ記憶手段と,声色データ記憶手
段に記憶されている声色データの一つを指定するための
声色データ指定手段と,検索手段で検索したグループ中
の喋り方データを順次読み出して,読み出した喋り方デ
ータの音韻列情報,継続時間長,ピッチ情報およびベロ
シティ情報と声色データ指定手段で指定された声色デー
タとを用いて音声を合成する音声合成手段と,音声合成
手段で合成された音声から所望の音声を選択するための
音声選択手段と,音声選択手段を用いて選択された音声
に対応する喋り方データおよび声色データを文字列入力
手段を介して入力された文字列と対応させて発話文書と
して記憶する発話文書記憶手段と,を備えたため,文字
情報と音声情報という2つの表現形態の情報を整合性の
取れた形で複合した情報(発話文書)を作成することが
できる。また,文字情報と文書作成者の意図する喋り方
を含む音声情報(喋り方データ)との整合性をとった情
報(発話文書)を作成して,文書中に非言語情報にあた
る感情等の表現を付加することができる。さらに,文書
作成者の意図する喋り方で正確に音声を合成することが
できる。
【0152】また,本発明の発話文書作成装置(請求項
6)は,単語,文節または文から成る文字列情報,文字
列情報の文字に対応した音韻から成る音韻列情報,音韻
列情報中の各音韻の継続時間長,音韻列情報の任意の時
点での相対的なピッチを指定するピッチ情報および音韻
列情報の任意の時点での相対的な音量を指定するベロシ
ティ情報から構成される喋り方データを,喋り方データ
の文字列情報に基づいて,文字列情報が同一の喋り方デ
ータをグループ化してグループ毎に記憶した喋り方デー
タ記憶手段と,単語,文節または文を構成する文字列を
入力するための文字列入力手段と,文字列入力手段を介
して入力された文字列を用いて,文字列と同一の文字列
情報を有するグループを喋り方データ記憶手段から検索
する検索手段と,合成する音声に声色を付加するための
声色データを複数記憶した声色データ記憶手段と,声色
データ記憶手段に記憶されている声色データの一つを指
定するための声色データ指定手段と,検索手段で検索し
たグループ中の喋り方データを順次読み出して,読み出
した喋り方データの音韻列情報,継続時間長,ピッチ情
報およびベロシティ情報と声色データ指定手段で指定さ
れた声色データとを用いて音声を合成する音声合成手段
と,音声合成手段で合成された音声から所望の音声を選
択するための音声選択手段と,音声選択手段を用いて選
択された音声に対応する喋り方データおよび声色データ
を文字列入力手段を介して入力された文字列と対応させ
て発話文書として記憶する発話文書記憶手段と,を備え
たため,文字情報と音声情報という2つの表現形態の情
報を整合性の取れた形で複合した情報(発話文書)を作
成することができる。また,文字情報と文書作成者の意
図する喋り方を含む音声情報(喋り方データ)との整合
性をとった情報(発話文書)を作成して,文書中に非言
語情報にあたる感情等の表現を付加することができる。
さらに,文書作成者の意図する喋り方で正確に音声を合
成することができる。
【0153】また,本発明の発話文書作成装置(請求項
7)は,喋り方データを作成して喋り方データ記憶手段
に登録する喋り方データ作成・登録手段を備えたため,
文書作成者が所望の喋り方データを作成・登録すること
ができ,発話文書を用いた音声(喋り方)の表現を豊か
にすることができる。
【0154】また,本発明の発話文書作成装置(請求項
8)は,喋り方データ中の情報である文字列情報,音韻
列情報,継続時間長,ピッチ情報およびベロシティ情報
をそれぞれ設定して喋り方データを作成し,喋り方デー
タ記憶手段に登録するため,文書作成者が所望の喋り方
データを作成・登録することができ,発話文書を用いた
音声(喋り方)の表現を豊かにすることができる。
【0155】また,本発明の発話文書作成装置(請求項
9)は,発話文書の再生を指定し,発話文書中の喋り方
データを順次読み出して,音声を合成することができる
ため,発話文書の確認が容易に行える。
【0156】また,本発明の発話文書作成装置(請求項
10)は,発話文書を再生する範囲として,発話文書中
の任意の文字列単位,文章単位,ページ単位または発話
文書全体の指定が可能であるため,発話文書の再生・確
認が容易に行える。
【0157】また,本発明の発話文書作成装置(請求項
11)は,文字列入力手段を用いて,発話文書記憶手段
に記憶されている発話文書を表示し,表示した発話文書
の任意の文字列を指定し,指定した文字列の変更または
再入力が可能であり,変更または再入力された文字列を
用いて,検索手段による検索,声色データ指定手段によ
る声色データの指定,音声合成手段による音声の合成お
よび音声選択手段による音声の選択を行うことにより,
指定した文字列に対応する喋り方データおよび声色デー
タの変更が可能であるため,発話文書の利用範囲,利便
性の向上を図ることができる。
【0158】また,本発明の発話文書作成装置(請求項
12)は,複数の声色データとして,男性の声,女性の
声,子供の声,老人の声,掠れた声,明瞭な声,太い
声,細い声,力強い声,やさしい声,機械的な声のよう
に,それぞれ感覚的に識別可能な声色データを有してい
るため,発話文書の利用範囲,利便性の向上を図ること
ができる。また,より多彩な音声合成を行うことができ
る。
【0159】また,本発明の発話文書作成装置(請求項
13)は,仮名漢字変換機能を有し,文字例入力手段で
入力した文字列として仮名漢字変換機能を用いて変換し
た後の漢字仮名交じりのテキストを用いることができる
ので,発話文書の利用範囲,利便性の向上を図ることが
できる。また,より自由な文書表現を行うことができ
る。
【0160】また,本発明の発話文書作成装置(請求項
14)は,喋り方データが,文字列情報,音韻列情報,
継続時間長,ピッチ情報およびベロシティ情報に加え
て,それぞれの喋り方データの分類タイプを示すタイプ
情報を有し,分類タイプが指定されると,入力された文
字列と同一の文字列情報を有するグループで,かつ,指
定された分類タイプと同一のタイプ情報を有する喋り方
データを喋り方データ記憶手段から検索し,検索した喋
り方データを読み出して,読み出した喋り方データの音
韻列情報,継続時間長,ピッチ情報およびベロシティ情
報と声色データ指定手段で指定された声色データとを用
いて音声を合成するため,発話文書の作成効率および利
便性の向上を図ることができる。
【0161】また,本発明の発話文書作成装置(請求項
15)は,分類タイプとして,それぞれの喋り方データ
に対応する音声を,東京型発音タイプ,大阪型発音タイ
プ,徳島型発音タイプ等のように地域によって分類した
ため,分類タイプを指定することで,各地域の喋り方で
音声合成が行える発話文書を容易に作成できる。
【0162】また,本発明の発話文書作成装置(請求項
16)は,分類タイプとして,それぞれの喋り方データ
に対応する音声を,老人型発音タイプ,若者型発音タイ
プ,高校生型発音タイプ等のように年齢によって分類し
たため,分類タイプを指定することで,各年齢の喋り方
で音声合成が行える発話文書を容易に作成できる。
【0163】また,本発明の発話文書作成装置(請求項
17)は,文字列入力手段が,表示部を有しており,か
つ,発話文書の各文字列毎に指定されている声色データ
に基づいて,表示する文字列のフォントや,装飾方法を
変えて表示部に表示するため,発話文書の作成・変更等
の作業が容易であると共に,声色データの指定状況を容
易に把握することができ,利便性が向上する。
【0164】また,本発明の発話文書作成方法(請求項
18)は,単語,文節または文を構成する文字列を入力
する第1の工程と,単語,文節または文から成る文字列
情報,文字列情報の文字に対応した音韻から成る音韻列
情報,音韻列情報中の各音韻の継続時間長,音韻列情報
の任意の時点での相対的なピッチを指定するピッチ情報
および音韻列情報の各音韻の音量を指定するベロシティ
情報から構成される喋り方データを,喋り方データの文
字列情報に基づいて,文字列情報が同一の喋り方データ
をグループ化してグループ毎に記憶したデータベースを
参照して,第1の工程で入力された文字列と同一の文字
列情報を有するグループを検索する第2の工程と,合成
する音声に声色を付加するため声色データを指定する第
3の工程と,第2の工程で検索したグループ中の喋り方
データを順次読み出して,読み出した喋り方データの音
韻列情報,継続時間長,ピッチ情報およびベロシティ情
報と,第3の工程で指定された声色データとを用いて,
音声を合成する第4の工程と,第4の工程で合成された
音声から所望の音声を選択する第5の工程と,第5の工
程で選択した音声に対応する喋り方データを1の工程で
入力した文字列と対応させて発話文書として記憶する第
6の工程と,を含むため,文字情報と音声情報という2
つの表現形態の情報を整合性の取れた形で複合した情報
(発話文書)を作成することができる。また,文字情報
と文書作成者の意図する喋り方を含む音声情報(喋り方
データ)との整合性をとった情報(発話文書)を作成し
て,文書中に非言語情報にあたる感情等の表現を付加す
ることができる。さらに,文書作成者の意図する喋り方
で正確に音声を合成することができる。
【0165】また,本発明の発話文書作成方法(請求項
19)は,単語,文節または文を構成する文字列を入力
する第1の工程と,単語,文節または文から成る文字列
情報,文字列情報の文字に対応した音韻から成る音韻列
情報,音韻列情報中の各音韻の継続時間長,音韻列情報
の任意の時点での相対的なピッチを指定するピッチ情報
および音韻列情報の任意の時点での相対的な音量を指定
するベロシティ情報から構成される喋り方データを,喋
り方データの文字列情報に基づいて,文字列情報が同一
の喋り方データをグループ化してグループ毎に記憶した
データベースを参照して,第1の工程で入力された文字
列と同一の文字列情報を有するグループを検索する第2
の工程と,合成する音声に声色を付加するため声色デー
タを指定する第3の工程と,第2の工程で検索したグル
ープ中の喋り方データを順次読み出して,読み出した喋
り方データの音韻列情報,継続時間長,ピッチ情報およ
びベロシティ情報と,第3の工程で指定された声色デー
タとを用いて,音声を合成する第4の工程と,第4の工
程で合成された音声から所望の音声を選択する第5の工
程と,第5の工程で選択した音声に対応する喋り方デー
タを1の工程で入力した文字列と対応させて発話文書と
して記憶する第6の工程と,を含むため,文字情報と文
書作成者の意図する喋り方を含む音声情報(喋り方デー
タ)との整合性をとった情報(発話文書)を作成するこ
とができる。また,文字情報と文書作成者の意図する喋
り方を含む音声情報(喋り方データ)との整合性をとっ
た情報(発話文書)を作成して,文書中に非言語情報に
あたる感情等の表現を付加することができる。さらに,
文書作成者の意図する喋り方で正確に音声を合成するこ
とができる。
【0166】また,本発明の発話文書作成方法(請求項
20)は,第6の工程で記憶した発話文書の再生を指定
する第7の工程と,第7の工程で発話文書の再生が指定
されると,発話文書中の喋り方データおよび声色データ
を順次読み出して,音声を合成する第8の工程と,を含
むため,発話文書の確認が容易に行える。
【0167】また,本発明の発話文書作成方法(請求項
21)は,第7の工程において,発話文書を再生する範
囲として,発話文書中の任意の文字列単位,文章単位,
ページ単位または発話文書全体の指定が可能であるた
め,発話文書の再生・確認が容易に行える。
【0168】また,本発明の発話文書作成方法(請求項
22)は,第6の工程で記憶した発話文書を表示し,表
示した発話文書の任意の文字列を指定し,指定した文字
列の変更または再入力を行う第9の工程とを含み,第9
の工程で変更または再入力された文字列を用いて,再
度,第2の工程,第3の工程,第4の工程,第5の工程
および第6の工程を実行することにより,発話文書の変
更が可能であるため,発話文書の利用範囲,利便性の向
上を図ることができる。
【0169】また,本発明の発話文書作成手順をコンピ
ュータに実行させるプログラムを格納したコンピュータ
読み取り可能な記録媒体(請求項23)は,単語,文節
または文を構成する文字列を入力する第1の手順と,単
語,文節または文から成る文字列情報,文字列情報の文
字に対応した音韻から成る音韻列情報,音韻列情報中の
各音韻の継続時間長,音韻列情報の任意の時点での相対
的なピッチを指定するピッチ情報および音韻列情報の各
音韻の音量を指定するベロシティ情報から構成される喋
り方データを,喋り方データの文字列情報に基づいて,
文字列情報が同一の喋り方データをグループ化してグル
ープ毎に記憶したデータベースを参照して,第1の手順
で入力された文字列と同一の文字列情報を有するグルー
プを検索する第2の手順と,合成する音声に声色を付加
するため声色データを指定する第3の手順と,第2の手
順で検索したグループ中の喋り方データを順次読み出し
て,読み出した喋り方データの音韻列情報,継続時間
長,ピッチ情報およびベロシティ情報と,第3の手順で
指定された声色データとを用いて,音声を合成する第4
の手順と,第4の手順で合成された音声から所望の音声
を選択する第5の手順と,第5の手順で選択した音声に
対応する喋り方データを1の手順で入力した文字列と対
応させて発話文書として記憶する第6の手順と,を含む
ため,文字情報と文書作成者の意図する喋り方を含む音
声情報(喋り方データ)との整合性をとった情報(発話
文書)を作成することができる。また,文字情報と文書
作成者の意図する喋り方を含む音声情報(喋り方デー
タ)との整合性をとった情報(発話文書)を作成して,
文書中に非言語情報にあたる感情等の表現を付加するこ
とができる。さらに,文書作成者の意図する喋り方で正
確に音声を合成することができる。
【0170】また,本発明の発話文書作成手順をコンピ
ュータに実行させるプログラムを格納したコンピュータ
読み取り可能な記録媒体(請求項24)は,単語,文節
または文を構成する文字列を入力する第1の手順と,単
語,文節または文から成る文字列情報,文字列情報の文
字に対応した音韻から成る音韻列情報,音韻列情報中の
各音韻の継続時間長,音韻列情報の任意の時点での相対
的なピッチを指定するピッチ情報および音韻列情報任意
の時点での相対的な音量を指定するベロシティ情報から
構成される喋り方データを,喋り方データの文字列情報
に基づいて,文字列情報が同一の喋り方データをグルー
プ化してグループ毎に記憶したデータベースを参照し
て,第1の手順で入力された文字列と同一の文字列情報
を有するグループを検索する第2の手順と,合成する音
声に声色を付加するため声色データを指定する第3の手
順と,第2の手順で検索したグループ中の喋り方データ
を順次読み出して,読み出した喋り方データの音韻列情
報,継続時間長,ピッチ情報およびベロシティ情報と,
第3の手順で指定された声色データとを用いて,音声を
合成する第4の手順と,第4の手順で合成された音声か
ら所望の音声を選択する第5の手順と,第5の手順で選
択した音声に対応する喋り方データを1の手順で入力し
た文字列と対応させて発話文書として記憶する第6の手
順と,を含むため,文字情報と文書作成者の意図する喋
り方を含む音声情報(喋り方データ)との整合性をとっ
た情報(発話文書)を作成することができる。また,文
字情報と文書作成者の意図する喋り方を含む音声情報
(喋り方データ)との整合性をとった情報(発話文書)
を作成して,文書中に非言語情報にあたる感情等の表現
を付加することができる。さらに,文書作成者の意図す
る喋り方で正確に音声を合成することができる。
【0171】また,本発明の発話文書作成手順をコンピ
ュータに実行させるプログラムを格納したコンピュータ
読み取り可能な記録媒体(請求項25)は,第6の手順
で記憶した発話文書の再生を指定する第7の手順と,第
7の手順で発話文書の再生が指定されると,発話文書中
の喋り方データおよび声色データを順次読み出して,音
声を合成する第8の手順と,を含むため,発話文書の確
認が容易に行える。
【0172】また,本発明の発話文書作成手順をコンピ
ュータに実行させるプログラムを格納したコンピュータ
読み取り可能な記録媒体(請求項26)は,第7の手順
において,発話文書を再生する範囲として,発話文書中
の任意の文字列単位,文章単位,ページ単位または発話
文書全体の指定が可能であるため,発話文書の再生・確
認が容易に行える。
【0173】また,本発明の発話文書作成手順をコンピ
ュータに実行させるプログラムを格納したコンピュータ
読み取り可能な記録媒体(請求項27)は,第6の手順
で記憶した発話文書を表示し,表示した発話文書の任意
の文字列を指定し,指定した文字列の変更または再入力
を行う第9の手順とを含み,第9の手順で変更または再
入力された文字列を用いて,再度,第2の手順,第3の
手順,第4の手順,第5の手順および第6の手順を実行
することにより,発話文書の変更が可能であるため,発
話文書の利用範囲,利便性の向上を図ることができる。
【図面の簡単な説明】
【図1】実施の形態1の発話文書作成装置の概略ブロッ
ク図である。
【図2】実施の形態1における喋り方データ記憶部に記
憶されている喋り方データを示す説明図である。
【図3】実施の形態1における声色データ記憶部に記憶
されている声色データの種類を示す説明図である。
【図4】実施の形態1の発話文書作成装置の外観図であ
る。
【図5】実施の形態1における発話文書の作成処理の概
略フローチャートである。
【図6】発話文書の作成処理における表示部の表示画面
の例を示す説明図である。
【図7】発話文書の作成処理における表示部の表示画面
の例を示す説明図である。
【図8】発話文書の作成処理で作成した発話文書の画面
表示例示す説明図である。
【図9】発話文書記憶部に記憶されている発話文書デー
タの例を示す説明図である。
【図10】実施の形態1における発話文書の再生処理の
概略フローチャートである。
【図11】発話文書の再生処理における表示部の表示画
面の例を示す説明図である。
【図12】発話文書の再生処理における表示部の表示画
面の例を示す説明図である。
【図13】発話文書の再生処理における表示部の表示画
面の例を示す説明図である。
【図14】実施の形態1におけるタイプ情報を用いた発
話文書の作成処理の概略フローチャートである。
【図15】タイプ情報を用いた発話文書の作成処理にお
ける表示部の表示画面の例を示す説明図である。
【図16】実施の形態1におけるタイプ情報を用いた発
話文書の再生処理の概略フローチャートである。
【図17】実施の形態1における喋り方データの作成・
登録処理の概略フローチャートである。
【図18】喋り方データの作成・登録処理の表示画面を
示す説明図である。
【図19】喋り方データの作成・登録処理の表示画面を
示す説明図である。
【図20】喋り方データの作成・登録処理の表示画面を
示す説明図である。
【図21】喋り方データの作成・登録処理の表示画面を
示す説明図である。
【図22】喋り方データの作成・登録処理の表示画面を
示す説明図である。
【図23】喋り方データの作成・登録処理の表示画面を
示す説明図である。
【図24】喋り方データの作成・登録処理の表示画面を
示す説明図である。
【図25】喋り方データの作成・登録処理の表示画面を
示す説明図である。
【図26】実施の形態1における発話文書の変更処理の
概略フローチャートである。
【図27】実施の形態2における発話文書の作成処理の
概略フローチャートである。
【図28】実施の形態2における喋り方データ中の情報
の変更処理の概略フローチャートである。
【図29】実施の形態2における喋り方データ中の情報
の変更処理の表示画面を示す説明図である。
【図30】実施の形態2における喋り方データ中の情報
の変更処理の表示画面を示す説明図である。
【符号の説明】
101 制御部 101a CPU 101b ROM 101c RAM 102 アプリケーション記憶部 103 喋り方データ記憶部 104 声色データ記憶部 105 音声合成部 106 キー入力部 107 表示部 108 マイク 109 スピーカ 110 発話文書記憶部 111 インタフェース(I/F) 112 FDドライブ 113 CD−ROMドライブ 114 通信部 201 喋り方データ 202 文字列情報 203 音韻列情報 204 継続時間長 205 ピッチ情報 206 ベロシティ情報 207 タイプ情報

Claims (27)

    【特許請求の範囲】
  1. 【請求項1】 単語,文節または文から成る文字列情
    報,前記文字列情報の文字に対応した音韻から成る音韻
    列情報,前記音韻列情報中の各音韻の継続時間長,前記
    音韻列情報の任意の時点での相対的なピッチを指定する
    ピッチ情報および前記音韻列情報の各音韻の音量を指定
    するベロシティ情報から構成される喋り方データを,前
    記喋り方データの文字列情報に基づいて,前記文字列情
    報が同一の喋り方データをグループ化してグループ毎に
    記憶した喋り方データ記憶手段と,単語,文節または文
    を構成する文字列を入力するための文字列入力手段と,
    前記文字列入力手段を介して入力された文字列を用い
    て,前記文字列と同一の文字列情報を有するグループを
    前記喋り方データ記憶手段から検索する検索手段と,合
    成する音声に声色を付加するための声色データを複数記
    憶した声色データ記憶手段と,前記検索手段で検索した
    グループ中の喋り方データを順次読み出して,前記読み
    出した喋り方データの音韻列情報,継続時間長,ピッチ
    情報およびベロシティ情報と前記声色データ記憶手段に
    記憶されている声色データの一つとを用いて音声を合成
    する音声合成手段と,前記音声合成手段で合成された音
    声から所望の音声を選択するための音声選択手段と,前
    記音声選択手段を用いて選択された音声に対応する喋り
    方データを前記文字列入力手段を介して入力された文字
    列と対応させて発話文書として記憶する発話文書記憶手
    段と,を備えたことを特徴とする発話文書作成装置。
  2. 【請求項2】 単語,文節または文から成る文字列情
    報,前記文字列情報の文字に対応した音韻から成る音韻
    列情報,前記音韻列情報中の各音韻の継続時間長,前記
    音韻列情報の任意の時点での相対的なピッチを指定する
    ピッチ情報および前記音韻列情報の任意の時点での相対
    的な音量を指定するベロシティ情報から構成される喋り
    方データを,前記喋り方データの文字列情報に基づい
    て,前記文字列情報が同一の喋り方データをグループ化
    してグループ毎に記憶した喋り方データ記憶手段と,単
    語,文節または文を構成する文字列を入力するための文
    字列入力手段と,前記文字列入力手段を介して入力され
    た文字列を用いて,前記文字列と同一の文字列情報を有
    するグループを前記喋り方データ記憶手段から検索する
    検索手段と,合成する音声に声色を付加するための声色
    データを複数記憶した声色データ記憶手段と,前記検索
    手段で検索したグループ中の喋り方データを順次読み出
    して,前記読み出した喋り方データの音韻列情報,継続
    時間長,ピッチ情報およびベロシティ情報と前記声色デ
    ータ記憶手段に記憶されている声色データの一つとを用
    いて音声を合成する音声合成手段と,前記音声合成手段
    で合成された音声から所望の音声を選択するための音声
    選択手段と,前記音声選択手段を用いて選択された音声
    に対応する喋り方データを前記文字列入力手段を介して
    入力された文字列と対応させて発話文書として記憶する
    発話文書記憶手段と,を備えたことを特徴とする発話文
    書作成装置。
  3. 【請求項3】 さらに,前記発話文書記憶手段に記憶さ
    れている発話文書の再生を指定する再生指定手段を備
    え,前記発話文書の再生が指定されると,前記音声合成
    手段が,前記発話文書中の喋り方データを順次読み出し
    て,音声を合成することを特徴とする請求項1または2
    記載の発話文書作成装置。
  4. 【請求項4】 前記再生指定手段は,前記発話文書を再
    生する範囲として,前記発話文書中の任意の文字列単
    位,文章単位,ページ単位または発話文書全体の指定が
    可能であることを特徴とする請求項3記載の発話文書作
    成装置。
  5. 【請求項5】 単語,文節または文から成る文字列情
    報,前記文字列情報の文字に対応した音韻から成る音韻
    列情報,前記音韻列情報中の各音韻の継続時間長,前記
    音韻列情報の任意の時点での相対的なピッチを指定する
    ピッチ情報および前記音韻列情報の各音韻の音量を指定
    するベロシティ情報から構成される喋り方データを,前
    記喋り方データの文字列情報に基づいて,前記文字列情
    報が同一の喋り方データをグループ化してグループ毎に
    記憶した喋り方データ記憶手段と,単語,文節または文
    を構成する文字列を入力するための文字列入力手段と,
    前記文字列入力手段を介して入力された文字列を用い
    て,前記文字列と同一の文字列情報を有するグループを
    前記喋り方データ記憶手段から検索する検索手段と,合
    成する音声に声色を付加するための声色データを複数記
    憶した声色データ記憶手段と,前記声色データ記憶手段
    に記憶されている声色データの一つを指定するための声
    色データ指定手段と,前記検索手段で検索したグループ
    中の喋り方データを順次読み出して,前記読み出した喋
    り方データの音韻列情報,継続時間長,ピッチ情報およ
    びベロシティ情報と前記声色データ指定手段で指定され
    た声色データとを用いて音声を合成する音声合成手段
    と,前記音声合成手段で合成された音声から所望の音声
    を選択するための音声選択手段と,前記音声選択手段を
    用いて選択された音声に対応する喋り方データおよび声
    色データを前記文字列入力手段を介して入力された文字
    列と対応させて発話文書として記憶する発話文書記憶手
    段と,を備えたことを特徴とする発話文書作成装置。
  6. 【請求項6】 単語,文節または文から成る文字列情
    報,前記文字列情報の文字に対応した音韻から成る音韻
    列情報,前記音韻列情報中の各音韻の継続時間長,前記
    音韻列情報の任意の時点での相対的なピッチを指定する
    ピッチ情報および前記音韻列情報の任意の時点での相対
    的な音量を指定するベロシティ情報から構成される喋り
    方データを,前記喋り方データの文字列情報に基づい
    て,前記文字列情報が同一の喋り方データをグループ化
    してグループ毎に記憶した喋り方データ記憶手段と,単
    語,文節または文を構成する文字列を入力するための文
    字列入力手段と,前記文字列入力手段を介して入力され
    た文字列を用いて,前記文字列と同一の文字列情報を有
    するグループを前記喋り方データ記憶手段から検索する
    検索手段と,合成する音声に声色を付加するための声色
    データを複数記憶した声色データ記憶手段と,前記声色
    データ記憶手段に記憶されている声色データの一つを指
    定するための声色データ指定手段と,前記検索手段で検
    索したグループ中の喋り方データを順次読み出して,前
    記読み出した喋り方データの音韻列情報,継続時間長,
    ピッチ情報およびベロシティ情報と前記声色データ指定
    手段で指定された声色データとを用いて音声を合成する
    音声合成手段と,前記音声合成手段で合成された音声か
    ら所望の音声を選択するための音声選択手段と,前記音
    声選択手段を用いて選択された音声に対応する喋り方デ
    ータおよび声色データを前記文字列入力手段を介して入
    力された文字列と対応させて発話文書として記憶する発
    話文書記憶手段と,を備えたことを特徴とする発話文書
    作成装置。
  7. 【請求項7】 さらに,前記喋り方データを作成して前
    記喋り方データ記憶手段に登録する喋り方データ作成・
    登録手段を備えたことを特徴とする請求項5または6記
    載の発話文書作成装置。
  8. 【請求項8】 前記喋り方データ作成・登録手段は,あ
    らかじめ収録した音声波形データまたはユーザが発話し
    た肉声を入力して,音声波形データを表示する音声波形
    データ入力手段と,ユーザによる入力または前記音声波
    形データを音韻分析して,各音韻の継続時間長を設定し
    て表示する継続時間長設定手段と,前記設定された継続
    時間長に対応する音韻列情報を付加する音韻列情報付加
    手段と,前記音声波形データをピッチ分析してピッチ曲
    線を表示するピッチ曲線表示手段と,前記表示されたピ
    ッチ曲線および音韻列情報とに基づいて,前記音韻列情
    報の任意の時点での相対的なピッチの値を調整または追
    加してピッチ情報を生成するピッチ情報生成手段と,前
    記音韻列情報の各音韻の音量を調整してベロシティ情報
    を生成するベロシティ情報生成手段と,前記音声波形デ
    ータに対応する文字列を入力して文字列情報を設定する
    文字列情報設定手段と,前記文字列情報に基づいて前記
    喋り方データ記憶手段中の該当するグループに,前記文
    字列情報,音韻列情報,継続時間長,ピッチ情報および
    ベロシティ情報を喋り方データとして登録する登録手段
    と,を備えたことを特徴とする請求項7記載の発話文書
    作成装置。
  9. 【請求項9】 さらに,前記発話文書記憶手段に記憶さ
    れている発話文書の再生を指定する再生指定手段を備
    え,前記発話文書の再生が指定されると,前記音声合成
    手段が,前記発話文書中の喋り方データおよび声色デー
    タを順次読み出して,音声を合成することを特徴とする
    請求項5〜8記載のいずれか一つの発話文書作成装置。
  10. 【請求項10】 前記再生指定手段は,前記発話文書を
    再生する範囲として,前記発話文書中の任意の文字列単
    位,文章単位,ページ単位または発話文書全体の指定が
    可能であることを特徴とする請求項9記載の発話文書作
    成装置。
  11. 【請求項11】 さらに,前記文字列入力手段を用い
    て,前記発話文書記憶手段に記憶されている発話文書を
    表示し,前記表示した発話文書の任意の文字列を指定
    し,前記指定した文字列の変更または再入力が可能であ
    り,前記変更または再入力された文字列を用いて,前記
    検索手段による検索,前記声色データ指定手段による声
    色データの指定,前記音声合成手段による音声の合成お
    よび前記音声選択手段による音声の選択を行うことによ
    り,前記指定した文字列に対応する喋り方データおよび
    声色データの変更が可能であることを特徴とする請求項
    5〜10記載のいずれか一つの発話文書作成装置。
  12. 【請求項12】 前記複数の声色データは,男性の声,
    女性の声,子供の声,老人の声,掠れた声,明瞭な声,
    太い声,細い声,力強い声,やさしい声,機械的な声の
    ように,それぞれ感覚的に識別可能な声色データである
    ことを特徴とする請求項1,2,5または6記載の発話
    文書作成装置。
  13. 【請求項13】 前記文字列入力手段が,仮名漢字変換
    機能を有し,前記文字例入力手段で入力した文字列が,
    前記仮名漢字変換機能を用いて変換した後の漢字仮名交
    じりのテキストであることを特徴とする請求項1,2,
    5または6記載の発話文書作成装置。
  14. 【請求項14】 さらに,前記喋り方データの分類タイ
    プを指定する分類タイプ指定手段を備え,前記喋り方デ
    ータが,前記文字列情報,音韻列情報,継続時間長,ピ
    ッチ情報およびベロシティ情報に加えて,それぞれの喋
    り方データの分類タイプを示すタイプ情報を有し,前記
    分類タイプ指定手段を介して分類タイプが指定される
    と,前記検索手段が,前記文字列入力手段を介して入力
    された文字列および前記分類タイプ指定手段を介して指
    定された分類タイプを用いて,前記文字列と同一の文字
    列情報を有するグループで,かつ,前記指定された分類
    タイプと同一のタイプ情報を有する喋り方データを前記
    喋り方データ記憶手段から検索し,前記音声合成手段
    が,前記検索手段で検索した喋り方データを読み出し
    て,前記読み出した喋り方データの音韻列情報,継続時
    間長,ピッチ情報およびベロシティ情報と前記声色デー
    タ指定手段で指定された声色データとを用いて音声を合
    成することを特徴とする請求項5または6記載の発話文
    書作成装置。
  15. 【請求項15】 前記分類タイプとは,それぞれの喋り
    方データに対応する音声を,東京型発音タイプ,大阪型
    発音タイプ,徳島型発音タイプ等のように地域によって
    分類したものであることを特徴とする請求項14記載の
    発話文書作成装置。
  16. 【請求項16】 前記分類タイプとは,それぞれの喋り
    方データに対応する音声を,老人型発音タイプ,若者型
    発音タイプ,高校生型発音タイプ等のように年齢によっ
    て分類したものであることを特徴とする請求項14記載
    の発話文書作成装置。
  17. 【請求項17】 前記文字列入力手段が,表示部を有し
    ており,かつ,前記発話文書の各文字列毎に指定されて
    いる声色データに基づいて,表示する文字列のフォント
    や,装飾方法を変えて前記表示部に表示することを特徴
    とする請求項5〜16記載のいずれか一つの発話文書作
    成装置。
  18. 【請求項18】 単語,文節または文を構成する文字列
    を入力する第1の工程と,単語,文節または文から成る
    文字列情報,前記文字列情報の文字に対応した音韻から
    成る音韻列情報,前記音韻列情報中の各音韻の継続時間
    長,前記音韻列情報の任意の時点での相対的なピッチを
    指定するピッチ情報および前記音韻列情報の各音韻の音
    量を指定するベロシティ情報から構成される喋り方デー
    タを,前記喋り方データの文字列情報に基づいて,前記
    文字列情報が同一の喋り方データをグループ化してグル
    ープ毎に記憶したデータベースを参照して,前記第1の
    工程で入力された文字列と同一の文字列情報を有するグ
    ループを検索する第2の工程と,合成する音声に声色を
    付加するため声色データを指定する第3の工程と,前記
    第2の工程で検索したグループ中の喋り方データを順次
    読み出して,前記読み出した喋り方データの音韻列情
    報,継続時間長,ピッチ情報およびベロシティ情報と,
    前記第3の工程で指定された声色データとを用いて,音
    声を合成する第4の工程と,前記第4の工程で合成され
    た音声から所望の音声を選択する第5の工程と,前記第
    5の工程で選択した音声に対応する喋り方データを前記
    1の工程で入力した文字列と対応させて発話文書として
    記憶する第6の工程と,を含むことを特徴とする発話文
    書作成方法。
  19. 【請求項19】 単語,文節または文を構成する文字列
    を入力する第1の工程と,単語,文節または文から成る
    文字列情報,前記文字列情報の文字に対応した音韻から
    成る音韻列情報,前記音韻列情報中の各音韻の継続時間
    長,前記音韻列情報の任意の時点での相対的なピッチを
    指定するピッチ情報および前記音韻列情報の任意の時点
    での相対的な音量を指定するベロシティ情報から構成さ
    れる喋り方データを,前記喋り方データの文字列情報に
    基づいて,前記文字列情報が同一の喋り方データをグル
    ープ化してグループ毎に記憶したデータベースを参照し
    て,前記第1の工程で入力された文字列と同一の文字列
    情報を有するグループを検索する第2の工程と,合成す
    る音声に声色を付加するため声色データを指定する第3
    の工程と,前記第2の工程で検索したグループ中の喋り
    方データを順次読み出して,前記読み出した喋り方デー
    タの音韻列情報,継続時間長,ピッチ情報およびベロシ
    ティ情報と,前記第3の工程で指定された声色データと
    を用いて,音声を合成する第4の工程と,前記第4の工
    程で合成された音声から所望の音声を選択する第5の工
    程と,前記第5の工程で選択した音声に対応する喋り方
    データを前記1の工程で入力した文字列と対応させて発
    話文書として記憶する第6の工程と,を含むことを特徴
    とする発話文書作成方法。
  20. 【請求項20】 さらに,前記第6の工程で記憶した発
    話文書の再生を指定する第7の工程と,前記第7の工程
    で前記発話文書の再生が指定されると,前記発話文書中
    の喋り方データおよび声色データを順次読み出して,音
    声を合成する第8の工程と,を含むことを特徴とする請
    求項18または19記載の発話文書作成方法。
  21. 【請求項21】 前記第7の工程において,前記発話文
    書を再生する範囲として,前記発話文書中の任意の文字
    列単位,文章単位,ページ単位または発話文書全体の指
    定が可能であることを特徴とする請求項20記載の発話
    文書作成方法。
  22. 【請求項22】 さらに,前記第6の工程で記憶した発
    話文書を表示し,前記表示した発話文書の任意の文字列
    を指定し,前記指定した文字列の変更または再入力を行
    う第9の工程とを含み,前記第9の工程で変更または再
    入力された文字列を用いて,再度,前記第2の工程,第
    3の工程,第4の工程,第5の工程および第6の工程を
    実行することにより,前記発話文書の変更が可能である
    ことを特徴とする請求項18〜21記載のいずれか一つ
    の発話文書作成方法。
  23. 【請求項23】 単語,文節または文を構成する文字列
    を入力する第1の手順と,単語,文節または文から成る
    文字列情報,前記文字列情報の文字に対応した音韻から
    成る音韻列情報,前記音韻列情報中の各音韻の継続時間
    長,前記音韻列情報の任意の時点での相対的なピッチを
    指定するピッチ情報および前記音韻列情報の各音韻の音
    量を指定するベロシティ情報から構成される喋り方デー
    タを,前記喋り方データの文字列情報に基づいて,前記
    文字列情報が同一の喋り方データをグループ化してグル
    ープ毎に記憶したデータベースを参照して,前記第1の
    手順で入力された文字列と同一の文字列情報を有するグ
    ループを検索する第2の手順と,合成する音声に声色を
    付加するため声色データを指定する第3の手順と,前記
    第2の手順で検索したグループ中の喋り方データを順次
    読み出して,前記読み出した喋り方データの音韻列情
    報,継続時間長,ピッチ情報およびベロシティ情報と,
    前記第3の手順で指定された声色データとを用いて,音
    声を合成する第4の手順と,前記第4の手順で合成され
    た音声から所望の音声を選択する第5の手順と,前記第
    5の手順で選択した音声に対応する喋り方データを前記
    1の手順で入力した文字列と対応させて発話文書として
    記憶する第6の手順と,をコンピュータに実行させるプ
    ログラムを格納したことを特徴とするコンピュータ読み
    取り可能な記録媒体。
  24. 【請求項24】 単語,文節または文を構成する文字列
    を入力する第1の手順と,単語,文節または文から成る
    文字列情報,前記文字列情報の文字に対応した音韻から
    成る音韻列情報,前記音韻列情報中の各音韻の継続時間
    長,前記音韻列情報の任意の時点での相対的なピッチを
    指定するピッチ情報および前記音韻列情報任意の時点で
    の相対的な音量を指定するベロシティ情報から構成され
    る喋り方データを,前記喋り方データの文字列情報に基
    づいて,前記文字列情報が同一の喋り方データをグルー
    プ化してグループ毎に記憶したデータベースを参照し
    て,前記第1の手順で入力された文字列と同一の文字列
    情報を有するグループを検索する第2の手順と,合成す
    る音声に声色を付加するため声色データを指定する第3
    の手順と,前記第2の手順で検索したグループ中の喋り
    方データを順次読み出して,前記読み出した喋り方デー
    タの音韻列情報,継続時間長,ピッチ情報およびベロシ
    ティ情報と,前記第3の手順で指定された声色データと
    を用いて,音声を合成する第4の手順と,前記第4の手
    順で合成された音声から所望の音声を選択する第5の手
    順と,前記第5の手順で選択した音声に対応する喋り方
    データを前記1の手順で入力した文字列と対応させて発
    話文書として記憶する第6の手順と,をコンピュータに
    実行させるプログラムを格納したことを特徴とするコン
    ピュータ読み取り可能な記録媒体。
  25. 【請求項25】 さらに,前記第6の手順で記憶した発
    話文書の再生を指定する第7の手順と,前記第7の手順
    で前記発話文書の再生が指定されると,前記発話文書中
    の喋り方データおよび声色データを順次読み出して,音
    声を合成する第8の手順と,をコンピュータに実行させ
    るプログラムを格納したことを特徴とする請求項23ま
    たは24記載のコンピュータ読み取り可能な記録媒体。
  26. 【請求項26】 前記第7の手順において,前記発話文
    書を再生する範囲として,前記発話文書中の任意の文字
    列単位,文章単位,ページ単位または発話文書全体の指
    定が可能であることを特徴とする請求項25記載のコン
    ピュータ読み取り可能な記録媒体。
  27. 【請求項27】 さらに,前記第6の手順で記憶した発
    話文書を表示し,前記表示した発話文書の任意の文字列
    を指定し,前記指定した文字列の変更または再入力を行
    う第9の手順とを含み,前記第9の手順で変更または再
    入力された文字列を用いて,再度,前記第2の手順,第
    3の手順,第4の手順,第5の手順および第6の手順を
    実行することにより,前記発話文書の変更が可能である
    ことを特徴とする請求項23〜26記載のいずれか一つ
    のコンピュータ読み取り可能な記録媒体。
JP08312497A 1996-12-04 1997-04-01 発話文書作成装置,発話文書作成方法および発話文書作成手順をコンピュータに実行させるプログラムを格納したコンピュータ読み取り可能な記録媒体 Expired - Fee Related JP3270356B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP08312497A JP3270356B2 (ja) 1996-12-04 1997-04-01 発話文書作成装置,発話文書作成方法および発話文書作成手順をコンピュータに実行させるプログラムを格納したコンピュータ読み取り可能な記録媒体

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP32445996 1996-12-04
JP8-324459 1996-12-04
JP08312497A JP3270356B2 (ja) 1996-12-04 1997-04-01 発話文書作成装置,発話文書作成方法および発話文書作成手順をコンピュータに実行させるプログラムを格納したコンピュータ読み取り可能な記録媒体

Publications (2)

Publication Number Publication Date
JPH10222187A true JPH10222187A (ja) 1998-08-21
JP3270356B2 JP3270356B2 (ja) 2002-04-02

Family

ID=26424189

Family Applications (1)

Application Number Title Priority Date Filing Date
JP08312497A Expired - Fee Related JP3270356B2 (ja) 1996-12-04 1997-04-01 発話文書作成装置,発話文書作成方法および発話文書作成手順をコンピュータに実行させるプログラムを格納したコンピュータ読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JP3270356B2 (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001073752A1 (fr) * 2000-03-28 2001-10-04 Kabushiki Kaisha Toshiba Moyen de stockage, procede de distribution et dispositif de sortie vocale
JP2002091474A (ja) * 2000-09-05 2002-03-27 Lucent Technol Inc 非言語依存韻律マークアップを用いてテキストからスピーチに処理する方法および装置
JP2002297188A (ja) * 2001-03-30 2002-10-11 Konami Computer Entertainment Yokyo Inc 音声編集装置及び音声編集プログラム
JP2002297187A (ja) * 2001-03-30 2002-10-11 Konami Computer Entertainment Yokyo Inc 音声編集装置及び音声編集プログラム
JP2008015424A (ja) * 2006-07-10 2008-01-24 Nippon Telegr & Teleph Corp <Ntt> 様式指定型音声合成方法、及び様式指定型音声合成装置とそのプログラムと、その記憶媒体
JP2008015361A (ja) * 2006-07-07 2008-01-24 Sharp Corp 音声合成装置、音声合成方法および音声合成方法を実現するためのプログラム
US10089975B2 (en) 2014-04-23 2018-10-02 Kabushiki Kaisha Toshiba Transliteration work support device, transliteration work support method, and computer program product
JP2019535037A (ja) * 2016-10-03 2019-12-05 グーグル エルエルシー コンピュータによるエージェントのための合成音声の選択
US10853747B2 (en) 2016-10-03 2020-12-01 Google Llc Selection of computational agent for task performance
US10854188B2 (en) 2016-10-03 2020-12-01 Google Llc Synthesized voice selection for computational agents
US11663535B2 (en) 2016-10-03 2023-05-30 Google Llc Multi computational agent performance of tasks

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62217294A (ja) * 1986-03-18 1987-09-24 富士通株式会社 音声情報辞書作成装置
JPH02234198A (ja) * 1989-03-07 1990-09-17 Ricoh Co Ltd テキスト音声合成システム
JPH02247696A (ja) * 1989-03-20 1990-10-03 Ricoh Co Ltd テキスト音声合成装置
JPH0389300A (ja) * 1989-08-31 1991-04-15 Ricoh Co Ltd 韻律制御方式
JPH0420998A (ja) * 1990-05-16 1992-01-24 Ricoh Co Ltd 音声合成装置
JPH07134597A (ja) * 1993-09-14 1995-05-23 Toshiba Corp 読み学習機能付き文書読み上げ装置及び文書読み上げ方法
JPH07319495A (ja) * 1994-05-26 1995-12-08 N T T Data Tsushin Kk 音声合成装置のための合成単位データ生成方式及び方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62217294A (ja) * 1986-03-18 1987-09-24 富士通株式会社 音声情報辞書作成装置
JPH02234198A (ja) * 1989-03-07 1990-09-17 Ricoh Co Ltd テキスト音声合成システム
JPH02247696A (ja) * 1989-03-20 1990-10-03 Ricoh Co Ltd テキスト音声合成装置
JPH0389300A (ja) * 1989-08-31 1991-04-15 Ricoh Co Ltd 韻律制御方式
JPH0420998A (ja) * 1990-05-16 1992-01-24 Ricoh Co Ltd 音声合成装置
JPH07134597A (ja) * 1993-09-14 1995-05-23 Toshiba Corp 読み学習機能付き文書読み上げ装置及び文書読み上げ方法
JPH07319495A (ja) * 1994-05-26 1995-12-08 N T T Data Tsushin Kk 音声合成装置のための合成単位データ生成方式及び方法

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001073752A1 (fr) * 2000-03-28 2001-10-04 Kabushiki Kaisha Toshiba Moyen de stockage, procede de distribution et dispositif de sortie vocale
JP2002091474A (ja) * 2000-09-05 2002-03-27 Lucent Technol Inc 非言語依存韻律マークアップを用いてテキストからスピーチに処理する方法および装置
JP2013011902A (ja) * 2000-09-05 2013-01-17 Alcatel-Lucent Usa Inc 非言語依存韻律マークアップを用いてテキストからスピーチに処理する方法および装置
JP2002297188A (ja) * 2001-03-30 2002-10-11 Konami Computer Entertainment Yokyo Inc 音声編集装置及び音声編集プログラム
JP2002297187A (ja) * 2001-03-30 2002-10-11 Konami Computer Entertainment Yokyo Inc 音声編集装置及び音声編集プログラム
JP2008015361A (ja) * 2006-07-07 2008-01-24 Sharp Corp 音声合成装置、音声合成方法および音声合成方法を実現するためのプログラム
JP4648878B2 (ja) * 2006-07-10 2011-03-09 日本電信電話株式会社 様式指定型音声合成方法、及び様式指定型音声合成装置とそのプログラムと、その記憶媒体
JP2008015424A (ja) * 2006-07-10 2008-01-24 Nippon Telegr & Teleph Corp <Ntt> 様式指定型音声合成方法、及び様式指定型音声合成装置とそのプログラムと、その記憶媒体
US10089975B2 (en) 2014-04-23 2018-10-02 Kabushiki Kaisha Toshiba Transliteration work support device, transliteration work support method, and computer program product
JP2019535037A (ja) * 2016-10-03 2019-12-05 グーグル エルエルシー コンピュータによるエージェントのための合成音声の選択
US10853747B2 (en) 2016-10-03 2020-12-01 Google Llc Selection of computational agent for task performance
US10854188B2 (en) 2016-10-03 2020-12-01 Google Llc Synthesized voice selection for computational agents
US11663535B2 (en) 2016-10-03 2023-05-30 Google Llc Multi computational agent performance of tasks

Also Published As

Publication number Publication date
JP3270356B2 (ja) 2002-04-02

Similar Documents

Publication Publication Date Title
US5875427A (en) Voice-generating/document making apparatus voice-generating/document making method and computer-readable medium for storing therein a program having a computer execute voice-generating/document making sequence
US8219398B2 (en) Computerized speech synthesizer for synthesizing speech from text
US6684187B1 (en) Method and system for preselection of suitable units for concatenative speech
US7013278B1 (en) Synthesis-based pre-selection of suitable units for concatenative speech
WO2004066271A1 (ja) 音声合成装置,音声合成方法および音声合成システム
JP3270356B2 (ja) 発話文書作成装置,発話文書作成方法および発話文書作成手順をコンピュータに実行させるプログラムを格納したコンピュータ読み取り可能な記録媒体
US20090281808A1 (en) Voice data creation system, program, semiconductor integrated circuit device, and method for producing semiconductor integrated circuit device
JP5343293B2 (ja) 音声編集合成装置及び音声編集合成方法
JP4409279B2 (ja) 音声合成装置及び音声合成プログラム
JPH08335096A (ja) テキスト音声合成装置
JPH10171485A (ja) 音声合成装置
JP3060276B2 (ja) 音声合成装置
JP3366253B2 (ja) 音声合成装置
JP3668583B2 (ja) 音声合成装置及びその方法
JP3522005B2 (ja) 音声合成装置
JP2577372B2 (ja) 音声合成装置および方法
JP3280729B2 (ja) 発音記号作成装置
Kayte et al. Artificially Generatedof Concatenative Syllable based Text to Speech Synthesis System for Marathi
JPH08328578A (ja) テキスト音声合成装置
JP2680643B2 (ja) 規則合成装置の文字表示方法
JPH04177526A (ja) 文章読み上げ装置
JPH09292897A (ja) 音声合成装置
JPH0644247A (ja) 音声合成装置
CN116580696A (zh) 基于情感识别的语音流合成方法及装置
JPH11344996A (ja) 発音文書作成装置、発音文書作成方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080118

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110118

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140118

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees