JP2002023777A - 音声合成システム、音声合成方法、サーバ、記憶媒体、プログラム伝送装置、音声合成データ記憶媒体、音声出力機器 - Google Patents

音声合成システム、音声合成方法、サーバ、記憶媒体、プログラム伝送装置、音声合成データ記憶媒体、音声出力機器

Info

Publication number
JP2002023777A
JP2002023777A JP2000191573A JP2000191573A JP2002023777A JP 2002023777 A JP2002023777 A JP 2002023777A JP 2000191573 A JP2000191573 A JP 2000191573A JP 2000191573 A JP2000191573 A JP 2000191573A JP 2002023777 A JP2002023777 A JP 2002023777A
Authority
JP
Japan
Prior art keywords
customer
voice
data
speech synthesis
service provider
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000191573A
Other languages
English (en)
Inventor
Hideo Sakai
秀雄 酒井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP2000191573A priority Critical patent/JP2002023777A/ja
Priority to DE10128882A priority patent/DE10128882A1/de
Priority to US09/891,717 priority patent/US6983249B2/en
Publication of JP2002023777A publication Critical patent/JP2002023777A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems

Abstract

(57)【要約】 【課題】 顧客の好みに応じた音声合成メッセージを提
供する音声合成システム、音声合成方法、サーバ、記憶
媒体、プログラム伝送装置、音声合成データ記憶媒体、
音声出力機器を提供する。 【解決手段】 サービス提供者1は、ネットワーク5を
介してなされた顧客3のオーダに応じ、顧客3が選択し
たスピーカの音声特徴データと、顧客3が入力した文章
とに基づく音声合成データを生成した後、顧客3に受け
渡す構成とした。このとき、顧客3のオーダに対して取
引番号が付与され、取引番号が顧客3から提示されたと
きに、生成した音声合成データを顧客3に受け渡すよう
にする。顧客3は、受け取った音声合成データを機器1
00に入力し、オーダした音声を出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、特定キャラクタの
音声を合成して生成する音声合成データを、ネットワー
クを介して取引することを可能とする音声合成システ
ム、音声合成方法、サーバ、記憶媒体、プログラム伝送
装置、音声合成データ記憶媒体、音声出力機器に関す
る。
【0002】
【従来の技術】従来より、歌手、政治家等の有名人、テ
レビ番組や映画の登場人物等、特定キャラクタの音声
を、玩具、目覚し時計、携帯型電話端末等、種々の機器
に組み込んだ製品が提供されている。このような製品で
は、所定の操作を行ったときに、特定キャラクタの音声
によるメッセージが出力され、これにより製品の付加価
値が高められている。
【0003】
【発明が解決しようとする課題】しかしながら、従来
は、機器メーカ側で、特定キャラクタの音声による、予
め決められた文章の音声データを機器に収めているに過
ぎず、購入者(顧客)の好みでメッセージの文章を設定す
ることはできなかった。
【0004】また、近年の音声合成技術の進歩により、
特定キャラクタの音声の声質・韻律等の特徴をデータ化
し、そのデータから、入力した文章に基づいて、特定キ
ャラクタの音声に酷似した音声合成メッセージを生成す
ることが可能となっている。このような技術を機器メー
カ側で用いる場合には、特定キャラクタに対して著作権
料の支払を契約によって明確にすることができるので特
に問題はない。しかし、上記したような技術を、例えば
ソフトウェアの形態でユーザ(購入者)に提供(販売)する
と、ユーザ側において音声合成メッセージを自由に生成
することが可能となり、このような場合には、特定キャ
ラクタに対する著作権料の支払が不明確になるという側
面もある。
【0005】本発明は、このような技術的課題に基づい
て、顧客の好みに応じた音声合成メッセージを提供する
音声合成システム、音声合成方法、サーバ、記憶媒体、
プログラム伝送装置、音声合成データ記憶媒体、音声出
力機器を提供することを主たる目的とする。また、他の
目的は、特定キャラクタの音声を用いる場合、著作権料
を確実に支払い、特定キャラクタの権利を保護すること
にある。
【0006】
【課題を解決するための手段】かかる目的のもと、本発
明の音声合成システムは、顧客に対し選択可能に提示さ
れた話者の中から特定の話者を選択するとともに、音声
合成すべき文章を指定する顧客の端末と、顧客が指定し
た音声合成すべき文章を、特定の話者の音声特徴データ
を用いて音声合成するサービス提供者のサーバと、を含
むことを特徴としている。このような構成により、顧客
は、歌手、政治家等の有名人、テレビ番組や映画の登場
人物等、自分の希望する話者の音声による自由なメッセ
ージや歌等の音声合成データをオーダして入手すること
ができる。そして入手した音声合成データにより、例え
ば目覚し時計の目覚しアラーム、携帯型電話端末の呼び
出し音(メッセージ)や留守応答メッセージ、カーナビゲ
ーション装置におけるガイダンスメッセージ等を自分の
好みに応じて設定することが可能となるのである。
【0007】更に、サービス提供者のサーバは、顧客に
対し取引番号を付与し、顧客の端末から取引番号が提示
されたときに、生成した音声合成データを受け渡すこと
を特徴とすれば、オーダした顧客のみに音声合成データ
を受け渡すことができる。つまり、生成した音声合成デ
ータは、顧客以外の手に渡ることのない唯一無二のもの
となるのである。
【0008】本発明の音声合成方法は、サービス提供者
が、複数の話者のリストをネットワークを介して外部に
提示し、顧客は、提示されたリストから選択した話者と
音声合成すべき文章とをサービス提供者に伝え、サービ
ス提供者は、顧客の選択した話者の音声特徴データに基
づき、音声合成すべき文章を音声合成することを特徴と
する。このようにして、サービス提供者は、インターネ
ット等のネットワークを介して音声合成の受注を行うこ
とができる。ところで、ここでいう「外部」とは、ネッ
トワークを介してサービス提供者が話者のリストを提示
できる対象を示すものである。インターネットのホーム
ページにおいては、不特定多数の者がアクセスすること
が可能であり、これらのものを「外部」と称したのであ
る。ただし、アクセスした者が必ずしも音声合成データ
をオーダするとは限らず、「外部」が必ずしも「顧客」
なるとは限らない。
【0009】また、サービス提供者のサーバは、顧客に
対し、生成する音声合成データについて課金し、サービ
ス提供者は、顧客側から課金した代金を受け取った後に
音声合成データを顧客に受け渡すようにしてもよい。こ
こでいう「顧客側」とは、顧客本人、あるいは顧客本人
が契約している金融機関を指している。
【0010】さらに、サービス提供者は、当該サービス
提供者が保有する音声特徴データの権利を有する者、つ
まり歌手、政治家等の有名人、テレビ番組や映画の登場
人物等、特定キャラクタの音声の音源についての著作権
の権利者(本人や管理者等)に対し、音声合成データの生
成に応じた代金を支払うことにより、権利者に対するロ
イヤリティ等、権利に対する対価の支払を確実に行うこ
とができる。
【0011】加えて、顧客は、サービス提供者から受け
渡された音声合成データを機器に入力することにより、
この機器において、オーダした音声合成データに基づく
音声を出力することが可能となる。
【0012】これとは他に、サービス提供者は、顧客の
選択に基づく音声合成データを生成するとともに、生成
した音声合成データを顧客が選択した機器に入力しても
よい。このようにして、サービス提供者から顧客に対
し、オーダに応じた音声合成データが入力された機器を
顧客に受け渡すようにしても良い。
【0013】本発明は、話者の音声を分析して得られた
音声特徴データを格納する音声特徴データ格納部と、ネ
ットワークを介して、顧客が選択した話者および顧客が
入力した文章等、顧客からの要求を受け付ける要求受付
部と、顧客からの要求に応じ音声特徴データに基づいて
音声合成する音声合成データ生成部と、を備えることを
特徴とするサーバとして捉えることもできる。
【0014】また、音声特徴データ格納部は、音声特徴
データとして、話者毎の声質データと韻律データとを格
納することを特徴とする。
【0015】さらに、顧客によってなされた要求に基づ
き、生成する音声合成データの価格を設定する価格設定
部を備えても良い。
【0016】本発明は、外部から音声合成データを生成
するための要求を受け付ける処理と、前記要求に対して
取引番号を生成して出力する処理と、取引番号が入力さ
れたときに、要求に応じて生成した音声合成データを出
力する処理とをコンピュータに実行させるプログラムを
記憶したことを特徴とする記憶媒体として捉えることも
できる。さらに、前記プログラムは、生成した音声合成
データに、音声合成データの内容を証明する認証データ
を添付することにより、生成された音声合成データの不
法作成や不法コピー等を防止することができる。このと
きに添付する認証データは、電子透かし等、いかなる形
態のものであっても良い。また証明する内容としては、
例えば音声合成データの出所や、音声の音源についての
権利者の正式の許可を得ていること等がある。
【0017】また、本発明のプログラムは、音声合成す
べき文章と話者の指定とを含む外部からの要求を受け付
ける処理と、受け付けた要求に応じ、話者に対応した音
声特徴データに基づいて文章を音声合成する処理と、を
コンピュータに実行させることを特徴とすることもでき
る。
【0018】本発明は、コンピュータに実行させるプロ
グラムが記憶された記憶手段と、記憶手段から読み出し
たプログラムをコンピュータに送信する送信手段とを備
え、前記プログラムは、複数の音声データのリストを顧
客に対して出力する処理と、顧客がリストから選択した
音声特徴データに基づいて顧客が入力した文章を音声合
成した音声合成データを、顧客に出力する処理をコンピ
ュータに実行させることを特徴とするプログラム伝送装
置とすることもできる。
【0019】また、本発明を、サービス提供者が顧客の
指定に応じて生成した音声合成データが格納されている
ことを特徴とする音声合成データ記憶媒体として捉える
こともできる。ここで、音声合成データ記憶媒体として
は、フレキシブルディスク、CD−ROM、DVD、メ
モリ、ハードディスク等の各種記憶媒体がある。そし
て、このような音声合成データ記憶媒体に格納した音声
合成データは、コンピュータや携帯型電話端末、カーナ
ビゲーション装置等の様々な機器に転送し、この機器で
前記音声合成データに基づく音声を出力すれば良い。ま
た、音声合成データ記憶媒体として、可搬性のあるメモ
リを用いれば、サービス提供者から顧客に対して音声合
成データを受け渡す際にも本発明を適用できる。
【0020】さらに、本発明は、指定された話者および
文章に基づいてサービス提供者が生成した音声合成デー
タを記憶する記憶部と、当該記憶部で記憶した音声合成
データに基づく音声を出力する音声出力部と、を備える
ことを特徴とする音声出力機器とすることもできる。こ
のような音声出力機器としては、生成した音声合成デー
タを組み込んだ(入力した)、玩具、目覚し時計、携帯型
電話端末、カーナビゲーション装置、メモリープレーヤ
等の音声再生機器等がある。
【0021】
【発明の実施の形態】以下、添付図面に示す実施の形態
に基づいてこの発明を詳細に説明する。図1は、本実施
の形態におけるシステム構成を説明するための図であ
る。この図において、符号1は、音声合成データを提供
するサービス提供者であり、本実施の形態におけるシス
テムのウェブサーバとして機能している。符号2は歌
手、政治家等の有名人、テレビ番組や映画の登場人物等
の、特定キャラクタの音源の権利(著作権等)を所有ある
いは管理する権利者であり、サービス提供者1との間
で、音声データの使用許諾、および音声データの使用に
応じたロイヤリティの支払条件等に関し、所定の契約を
結んでいる。符号3は音声合成データを購入したいと欲
する購入者である顧客(外部、顧客側)、符号4はサービ
ス提供者1と提携している金融機関(顧客側)であり、例
えばクレジットカード会社やデビットカード(Debit Car
d)等の即時決済サービスを行っている銀行等である。ま
た符号5はインターネット等のネットワークであり、こ
のネットワーク5には、ウェブサーバとしてのサービス
提供者1、ウェブ端末である顧客3がそれぞれ接続され
ている。
【0022】顧客3のウェブ端末は、例えば、ウェブブ
ラウザ等のソフトウェアを備えたPCであり、サービス
提供者1のホームページの閲覧や、送られてくる各種情
報等をディスプレイ上で表示することができ、また送ら
れてくる画面において、各種情報や金額等を入力できる
ポインティングデバイスやキーボード等の入力手段を備
えている。
【0023】また、金融機関4は、サービス提供者1
と、ネットワーク5あるいは他のネットワーク等を介し
て接続されており、双方間で情報の送受を行うことがで
きるようになっている。またこの金融機関4は、顧客3
との間で所定の契約を結んでいるものとする。
【0024】さて、本実施の形態におけるサービス提供
者1は、顧客3のオーダに応じ、顧客3の指定した特定
キャラクタ(以下、スピーカと称する)の音声で、顧客3
の希望する文章を出力(発声)させるための音声合成デー
タを提供する。
【0025】図2は、ウェブサーバであるサービス提供
者1のサーバ構成を示すブロック図である。図2におい
て、ネットワーク5に対する送受部として例えば用いら
れるHTTPサーバ11は、ネットワーク5を介して外
部のウェブ端末とデータの送受信を行っている。このサ
ーバは、大きく分けると、顧客情報に関する処理を行う
顧客情報処理ブロック20、顧客3からのオーダ、支
払、顧客3に対してのデリバリ(受け渡し)等の処理を行
うオーダ/支払/デリバリ処理ブロック30、権利者2
との間でのロイヤリティ契約に基づく処理を行うロイヤ
リティ処理ブロック40、音声合成データ生成を行うた
めのコンテンツを処理するコンテンツ処理ブロック5
0、顧客3からのオーダを受けて音声合成データを生成
する音声合成データ生成ブロック60から構成されてい
る。また、このサーバは、顧客3との取引によって生じ
る金銭の授受処理を行うため、支払ゲートウェイ70、
ロイヤリティゲートウェイ75を備えており、この支払
ゲートウェイ70、ロイヤリティゲートウェイ75を介
して、このサーバは、サービス提供者1がサーバ外に設
けたロイヤリティ支払システム80とクレジットカード
システム90等とに接続されている。また、このサーバ
は、画面データ生成部13を備えており、この画面デー
タ生成部13は、顧客3が入力したデータを受け、デー
タの種類に応じて各データをサーバ各部に割り振る。ま
たサーバ各部から受領したデータ等を基に、画面データ
を生成することができる。
【0026】顧客情報処理ブロック20は、顧客情報処
理(Customer Management)部21、顧客情報DB(データ
ベース)22を備えており、顧客情報処理部21は、顧
客3から得た、顧客名、住所、e−メールアドレス等の
情報を顧客情報DB22に格納し、必要に応じて格納し
た情報を顧客情報DB22から取り出す。
【0027】オーダ/支払/デリバリ処理ブロック30
は、オーダ処理部(要求受付部)31、支払処理部(価格
設定部)32、デリバリ処理部33、オーダ/支払/デ
リバリDB34、デリバリサーバ35を備える。
【0028】オーダ処理部31は、顧客3からのオーダ
内容をオーダ/支払/デリバリDB34に格納するとと
もに、そのオーダ内容に基づく音声合成データを生成す
るための指令をコンテンツ処理ブロック50に出す。
【0029】支払処理部32は、オーダ/支払/デリバ
リDB34に予め格納されている価格データに基づき、
顧客3からのオーダ内容に応じた価格を算出して出力
し、また顧客3から得たクレジットカード情報等、支払
に関する情報をオーダ/支払/デリバリDB34に格納
する。またこの支払処理部32では、支払ゲートウェイ
70およびサーバ外部のクレジットカードシステム90
を介して、金融機関4との間で、顧客3から得たクレジ
ットカード情報の照合、金融機関4に対する代金支払請
求、金融機関4からの入金確認処理等を行う。
【0030】デリバリ処理部33は、顧客3から受けた
オーダによって生成する音声合成データがデリバリ可能
となるまでのスケジュールの管理および出力、顧客3が
オーダした音声合成データを受け取るためのURL(Uni
form Resource Locators)等の出力、顧客3からのオー
ダに対しての取引番号の生成および出力等を行う。そし
て、デリバリ処理部33で顧客3に対して出力した情報
を、必要に応じてオーダ/支払/デリバリDB34に格
納する。
【0031】ロイヤリティ処理ブロック40は、ロイヤ
リティ処理部41とロイヤリティ契約DB42とを備え
る。ロイヤリティ契約DB42には、権利者2との間で
のロイヤリティ契約等のデータが格納されており、ロイ
ヤリティ処理部41には、このデータに基づき、顧客3
からのオーダに応じたロイヤリティの計算、ロイヤリテ
ィゲートウェイ75およびロイヤリティ支払システム8
0を介しての権利者2に対するロイヤリティの支払処理
を行う。
【0032】コンテンツ処理ブロック50は、コンテン
ツ処理部(音声合成データ生成部)51とコンテンツDB
52とから構成され、コンテンツ処理部51は、オーダ
処理部31から転送されたオーダ内容情報、指定された
スピーカ、指定された文章等をコンテンツDB52に格
納するとともに、後述する音声合成データ生成ブロック
60で生成された音声合成データを出力する処理を行
う。また、コンテンツDB52には、登録されているス
ピーカ(音声)のリスト、およびその一部ないし全部の音
声サンプルデータが格納されており、コンテンツ処理部
51では、顧客3からの要求に応じ、指定された音声サ
ンプルデータを出力できるようになっている。
【0033】音声合成データ生成ブロック60は、音声
合成処理部(音声合成データ生成部)61、音声特徴DB
(音声特徴データ格納部)62を備えて構成される。音声
特徴DB62には、予め登録されたスピーカの音声デー
タ(音声特徴データ)が格納されている。この音声データ
は、登録されたスピーカ一人一人について、そのスピー
カの声の声質をデータ化した声質データD1と、そのス
ピーカが話すときの韻律をデータ化した韻律データD2
からなり、これら声質データD1、韻律データD2が、
登録されたスピーカ毎に分類されて音声特徴DB62に
格納されているのである。
【0034】図3に示すように、音声特徴DB62に格
納されている音声データを得るには、まず、スピーカが
直接録音したもの、あるいはテレビ番組や映画等を録画
したもの、歌等を録音したもの等をデータ化し、音源デ
ータとして保持する。そしてその音源データを解析し、
そのスピーカの音声の特徴、つまりスピーカの音声の声
質とスピーカが話すときの韻律とを抽出し、それぞれ声
質データD1、韻律データD2としてデータ化するので
ある。
【0035】図2に示したように、音声合成処理部61
は、文章の分析処理を行うテキストマイニングエンジン
63、音声合成データを生成するシンセサイズエンジン
64、生成した音声合成データに電子透かし等の認証(W
ater Mark)を埋め込むウォータマークエンジン65、音
声合成データをファイル形式に変換するファイルフォー
マットエンジン66を備えて構成されている。
【0036】このような音声合成処理部61において、
音声合成データを生成するには、コンテンツDB52か
ら、顧客3からのオーダにおいて指定されたスピーカを
示すデータを引き出す。また、音声特徴DB62から
は、このスピーカの音声データ(声質データD1と韻律
データD2)を引き出し、さらに、コンテンツDB52
から、顧客3からのオーダにおいて指定された文章を引
き出す。そしてまず、図3に示したように、顧客3の入
力した文章を、テキストマイニングエンジン63に備え
た文法DB67に格納された文法等に基づいて分析する
(ステップS1)。次いで、シンセサイズエンジン64
で、その分析結果と韻律データD2とに基づいて、入力
された文章に応じた韻律制御を行い(ステップS2)、ス
ピーカの韻律を反映させる。続いて、スピーカの韻律を
反映させたデータに、スピーカの声質データD1を組み
合わせて生成した音声波形により、所定の音声合成デー
タを得る(ステップS3)。ここで、所定の音声合成デー
タとは、言うまでもなく、顧客3からのオーダによって
指定されたスピーカの音声で、指定された文章内容を出
力(発声)するための音声データである。
【0037】次に、ウォータマークエンジン65におい
て、生成された音声合成データが、正式に認証されてい
るもの、つまり音源権利者の許諾を得ていることを証明
する電子透かし(認証データ)を、音声合成データに埋め
込む(ステップS4)。しかる後、ファイルフォーマット
エンジン66で、生成された音声合成データを、所定の
ファイル形式、例えばWAV形式等のサウンドファイル
に変換し、さらに、この音声合成データが、顧客3から
オーダされたものであることを示すファイル名等を付与
する。
【0038】このようにして音声合成処理部61で生成
された音声合成データは、音声合成処理部61から出力
され(ステップS5)、顧客3がこれをダウンロードする
まで、コンテンツDB52に格納される。このときに
は、生成された音声合成データと、顧客3がオーダ時に
付与された取引番号とが、関連付けされてコンテンツD
B52に格納される。
【0039】ところで、上記のように、実際の音声から
声質データD1、韻律データD2を抽出する技術、声質
データD1、韻律データD2から希望の文章を話す音声
合成データを生成する技術、としては、既に様々なもの
が提案あるいは実用化されているので、それらの技術を
適宜用いれば良く、ここではより具体的に限定する意図
はない。ここで、このような技術の一例を挙げれば、例
えば特開平9−90970号公報に開示された技術があ
り、ここに開示された技術を適用すれば、上記の如く特
定スピーカの音声合成を行うことができる。しかし、前
記公報に開示された技術は、あくまでもその一例に過ぎ
ず、適宜他の技術を用いることも可能である。
【0040】さて、上記したようなシステムにおいて、
顧客3が希望の音声合成データを購入する方法を、図4
〜図6を参照しつつ説明する。 〔オーダセッション〕図4では、サービス提供者1と顧
客3との間でのやり取りを示している。この図4に示す
ように、まず、顧客3は、ウェブ端末からインターネッ
ト等のネットワーク5を介し、サービス提供者1のウェ
ブサーバにアクセスする(ステップS11)。するとサー
ビス提供者1のオーダ処理部31側から顧客3に対し
て、スピーカ選択要求がなされる(ステップS21)。こ
のときには、顧客3のウェブ端末のディスプレイ上に、
サービス提供者1のコンテンツDB52に登録されてい
るスピーカのリストが表示される。このリストには、ス
ピーカの名称が、ジャンル別、アルファベット順、あい
うえお順等で表示され、さらに各スピーカの名称ととも
に、スピーカの顔の画像やアニメーションを表示しても
良い。顧客3はこのリストから希望のスピーカ(特定の
話者、音源)を選択し、ディスプレイ上に表示されたボ
タン等でこれを入力する(ステップS12)。また、スピ
ーカの選択にあたっては、顧客3が選択したスピーカの
音声サンプルデータを、コンテンツDB52からダウン
ロードすることもできる。顧客3は、必要に応じ音声サ
ンプルデータをダウンロードして音声サンプルを試聴
し、最終的に選択するスピーカを決定する。
【0041】スピーカの選択が行われると、サービス提
供者1のオーダ処理部31から顧客3に対し、文章入力
要求が行われる(ステップS22)。顧客3は、ディスプ
レイ上に表示される入力欄に、希望する文章をキーボー
ド等の入力手段で入力する(ステップS13)。
【0042】すると、サービス提供者1のオーダ処理部
31側では、テキストマイニングエンジン63において
入力された文章を分析し、文章のリーガルチェックを行
うとともに、文章を構成する文字数あるいは単語数をカ
ウントする。さらに、ロイヤリティ契約DB42に、ス
テップS12で選択されたスピーカのロイヤリティを含
んだベース価格を参照する。そして、支払処理部32
が、前記文字数あるいは単語数のカウント値と、選択さ
れたスピーカとに応じたベース価格とから、顧客3のオ
ーダ内容に応じた価格を算出する。しかる後、オーダ処
理部31では、顧客3からのオーダ内容、つまり選択し
たスピーカの名称、入力した文章を表示するとともに、
オーダ内容に応じた価格を表示し、顧客3に対してオー
ダ内容の確認を要求する(ステップS23)。顧客3は、
サービス提供者1側から表示されたオーダ内容を確認
し、ディスプレイ上に表示されたボタン等で、確認の意
思表示を入力する(ステップS14)。
【0043】次に、サービス提供者1のオーダ処理部3
1は、顧客3に対し、顧客情報の入力を要求する(ステ
ップS24)。顧客3は、自分の氏名、住所、e−メー
ルアドレス等を必要に応じて入力する(ステップS1
5)。するとサービス提供者1側では、顧客情報処理部
21で、入力された顧客3の情報を顧客情報DB22に
格納する。
【0044】続いて、サービス提供者1のオーダ処理部
31から顧客3に対し、支払情報の入力が要求されるの
で(ステップS25)、顧客3は、クレジットカードの種
類、クレジットカード番号等を入力する(ステップS1
6)。このとき、例えばデビットカード等の即時決済シ
ステムが利用可能であれば、支払情報として、銀行のキ
ャッシュカードの番号と、暗証番号とを入力するように
しても良い。なお、上記ステップS15、S16におい
て、顧客3が予めサービス提供者1にメンバー登録をし
ているのであれば、ステップS11のアクセス(ログイ
ン)時、あるいはステップS16において、メンバーI
Dやパスワードを入力することにより、上記ステップS
16の顧客情報入力およびステップS17の支払情報の
入力を省略することも可能である。
【0045】顧客3から支払情報を受けたサービス提供
者1側は、支払処理部32において、支払ゲートウェイ
70およびクレジットカードシステム90を介し、金融
機関4に対して顧客3の支払情報を照会する(ステップ
S26)。これを受けた金融機関4側では、顧客3の支
払情報を確認し、サービス提供者1側に対し確認(承認)
の可否を回答する(ステップS30)。金融機関4から確
認が得られた後、支払処理部32では顧客3の支払情報
をオーダ/支払/デリバリDB34に格納する。
【0046】次いで、サービス提供者1のオーダ処理部
31から顧客3に対し、オーダの最終確認を要求し(ス
テップS27)、顧客3は、オーダの最終確認を行う(ス
テップS17)。
【0047】顧客3からの最終確認が得られると、サー
ビス提供者1のオーダ処理部31においてオーダを受け
付け(ステップS28)、そのオーダ内容をコンテンツ処
理部51に送る。これとともに、デリバリ処理部33
で、顧客3からの当該オーダに対する取引番号(Transac
tion ID)を生成する。この取引番号は、顧客3からのオ
ーダ一つ一つに対して個別に生成されるものである。そ
して、オーダ処理部31では、デリバリ処理部33で生
成された取引番号とともに、後に顧客3が音声合成デー
タをダウンロードするためのサイトのURL、音声合成
データが完成してデリバリ可能となるスケジュール(完
成予定期日)を顧客3に対し出力する(ステップS2
9)。また、HTTPサーバ11から、顧客3に対し、
完成した音声合成データのダウンロード方法を転送す
る。顧客3は、これを受け取ることにより、オーダセッ
ションが終了する。
【0048】上記の如くして顧客3からのオーダを受け
たサービス提供者1側では、オーダ内容に基づき、前記
したような手順で音声合成データを生成する。その一
方、サービス提供者1側では、金融機関4に対し、顧客
3のオーダに応じた代金の決済を要求する。その要求
は、顧客3からのオーダを受け付けた後であれば、音声
合成データの生成前、生成中、生成後、音声合成データ
の顧客3へのデリバリ後、のいずれであっても良いが、
一例を挙げれば図5に示すような処理となる。この図5
に示すように、サービス提供者1側では、顧客3とのオ
ーダセッションの終了後、支払処理部32において、支
払ゲートウェイ70およびクレジットカードシステム9
0を介して、金融機関4に対し顧客3のオーダに応じた
代金の決済を要求する(ステップS41)。金融機関4で
は、この要求に応じ、サービス提供者1に対し代金の支
払を行う(ステップS50)。サービス提供者1側におい
て、金融機関4からの代金支払を確認した時点で、音声
合成データの作成に着手する(ステップS42)。そし
て、音声合成データの生成が完了した時点で、生成した
音声合成データを、コンテンツDB52に格納(保管)す
る(ステップS43)。
【0049】〔ダウンロードセッション〕前記オーダセ
ッションのステップS29においてサービス提供者1側
から告知された完成予定期日以降、顧客3がオーダした
音声合成データを受け取るには、図6に示す流れを経
る。この図6に示すように、顧客3が、サービス提供者
1のサーバの、オーダセッションのステップS29で示
されたURLにアクセスすると(ステップS61)、サー
ビス提供者1のコンテンツ処理部51では顧客3に対し
て取引番号の入力を要求する(ステップS71)。顧客3
は、オーダセッションのステップS29でサービス提供
者1から示された取引番号を入力する(ステップS6
2)。この取引番号が、オーダした音声合成データを受
け取るためのいわば合鍵となるので、取引番号が一致し
ない限り、音声合成のデータの受け取りは不可能であ
る。
【0050】顧客3が入力した取引番号が、オーダ/支
払/デリバリDB34に格納されている取引番号と一致
すると、デリバリ処理部33は、顧客3に対し、オーダ
/支払/デリバリDB34に格納されている顧客3のオ
ーダ内容を表示する。表示するオーダ内容としては、顧
客3の名前、オーダしたスピーカの名称、オーダした文
章等の情報がある。これとともに、デリバリ処理部33
では、顧客3側のディスプレイ上に、オーダされた音声
合成データのファイルをダウンロードするためのボタン
等を表示し、顧客3からのダウンロード開始信号の入力
を要求する(ステップS72)。そして顧客3が、ディス
プレイ上のボタンを操作すると、サービス提供者1側に
対して、オーダした音声合成データのファイルのダウン
ロードを開始する信号が入力される(ステップS63)。
【0051】すると、サービス提供者1側では、コンテ
ンツ処理部51において、コンテンツDB52に所定の
ファイル形式で格納されている、顧客3のオーダに応じ
て生成した音声合成データのファイルを、顧客3に対し
て出力する(ステップS73)。顧客3側では、出力され
た音声合成データのファイルをダウンロードする(ステ
ップS64)。ダウンロードが完了した時点で、音声合
成データのダウンロードセッションが完了し、つまり顧
客3のオーダに対するサービス提供者1との間での取引
がすべて完了する。
【0052】一方、上記オーダセッションとは別に、金
融機関4は、顧客3に対し、代金の支払を要求し、顧客
3はこれに応じて金融機関4に代金の支払を行う。また
サービス提供者1は、顧客3のオーダ内容に応じたロイ
ヤリティを、権利者2に対し別途支払う。
【0053】しかる後は、顧客3は、自らのPC端末に
おいて、ダウンロードした音声合成データのファイルを
保存し、これを再生用のソフトウェアによって再生して
も良い。また、図1に示したように、顧客3が、音声合
成データを記憶する記憶部と、当該記憶部で記憶した音
声合成データに基づく音声を出力可能な音声出力部とを
備えた機器(音声出力機器)100、例えば玩具、目覚し
時計、携帯型電話端末、カーナビゲーション装置、いわ
ゆるメモリープレーヤのような音声データ再生機器等、
を別途購入、あるいは既に所有している場合、ダウンロ
ードした音声合成データを機器100に転送し、この機
器100において、音声合成データを再生するようにし
ても良い。このとき、各種の機器100に音声合成デー
タを転送するには、例えばデータ伝送用の接続ケーブル
や無線、赤外線通信を用いても良いし、また可搬性のあ
るメモリ(音声合成データ記憶媒体)に音声合成データを
格納し、このメモリを介して機器100に音声合成デー
タを転送してもよい。なお、図1は、上記したような音
声合成データのオーダ〜受け取りまでの流れを示すもの
であり、この図1中、〜は音声合成データの提供ま
でに着目した処理の順序を示している。
【0054】上述したようにして、顧客3は、オーダし
た音声合成データにより、歌手、政治家等の有名人、テ
レビ番組や映画の登場人物等、希望したスピーカの音声
で、希望した文章を、自ら所有するPCや機器100で
出力させることが可能となる。つまり、例えば目覚し時
計の目覚しアラーム、携帯型電話端末の呼び出し音(メ
ッセージ)や留守応答メッセージ、カーナビゲーション
装置におけるガイダンスメッセージ等、を自分の好みに
応じて変更することが可能となるのである。
【0055】しかも、音声合成データは、顧客3のオー
ダに応じて生成され、取引番号によって顧客3に対して
受け渡されるので、唯一無二なものとなる。その際、顧
客3のオーダに応じた価格が設定され、音源の権利者2
に対してのロイヤリティの支払を確実に行うことができ
る。
【0056】さらに、顧客3によって音声合成データを
入力できる機器100に対し、上記システムにより、顧
客3が機器100で再生させるメッセージ等を適宜変更
することが可能となる。つまり、顧客3が新たに音声合
成データをオーダしてこれを入手した後、機器100に
入力されている音声合成データを、新たな音声合成デー
タに入れ換えるのである。このようにして、上記システ
ムにより、機器100に対する顧客3の飽きを防ぎ、機
器100の付加価値をさらに高めることが可能となる。
【0057】なお、上記実施の形態において、例えばデ
リバリ処理部33で、完成予定期日を顧客3に告知し、
顧客3は完成予定期日以降に音声合成データを受け取る
構成となっているが、顧客3からオーダを受けたセッシ
ョンの間(例えばオーダを受けて即時)に、音声合成デー
タを提供できるのであれば、そのような処理は不要であ
る。また、図4〜図6に示した処理の流れにおいて、所
定の入力や確認が行われないときには、処理が中止、あ
るいは前のステップに戻る処理が行われたりするのは言
うまでもない。
【0058】〔他の実施の形態〕次に、図7を参照しつ
つ他の実施の形態について説明する。以下の説明におい
て、上記実施の形態と同様の構成については、同符号を
付してその説明を省略する。この図7に示す実施の形態
では、サービス提供者1が顧客3に対し、音声合成デー
タのみではなく、顧客3がオーダした音声合成データを
入力した機器を提供するのである。この図7は、上記し
たような音声合成データのオーダ〜受け取りまでの流れ
を示すものであり、図中、〜は音声合成データの提
供までに着目した処理の順序を示している。
【0059】これには、サービス提供者1は、顧客3に
対し、スピーカのリストと機器のリストとを提供する。
ここで、顧客3がオーダする機器としては、玩具、目覚
し時計、ナビゲーション装置等、音声合成データを入力
する機器であればいかなるものであっても良い。顧客3
は、サービス提供者1に対し、音声合成データのオーダ
を上記実施の形態と同様に行うとともに、音声合成デー
タを入力する機器のオーダを行う。この機器のオーダ
は、上記実施の形態で示したオーダセッション(図4参
照)の中の適宜タイミングで行えば良い。そして、顧客
3に対しては、サービス提供者1から、オーダした音声
合成データと、選択した機器とに応じた価格が提示され
るので、顧客3がそのオーダ内容を確認し、その意思表
示をサービス提供者1に対して示した時点で、オーダが
完了する。
【0060】そして、サービス提供者1は、顧客3のオ
ーダに応じ、上記実施の形態の如く音声合成データを生
成するとともに、生成された音声合成データを、顧客3
がオーダした機器に入力し、この機器を顧客3に納品す
る。またサービス提供者1は、顧客3が指定した金融機
関4に対し、顧客3がオーダした音声合成データと機器
の代金の支払を請求し、代金の決済を行う。また顧客3
は、金融機関4に対し、オーダ内容に応じた代金を支払
い、サービス提供者1が音声合成データの生成に応じた
ロイヤリティを権利者2に支払うことにより、すべての
取引が完了する。
【0061】なお、上記各実施の形態において、サービ
ス提供者1と金融機関4との間、金融機関4と顧客3と
の間での決済タイミングについては、何ら問うものでは
なく、上記した記載に限定する意図はない。また、顧客
3によるサービス提供者1への代金支払は、必ずしも金
融機関4を介さなくても良く、例えば電子マネーやプリ
ペイドカード等によるものでも良い。
【0062】また、上記実施の形態で示したように、顧
客3は、音声合成データのみを購入しても良いし、音声
合成データを組み込んだ機器100を購入してもよい
が、さらに、顧客3が購入した音声合成データを機器メ
ーカに送り、当該機器メーカで前記音声合成データを顧
客3が希望する機器に組み込み、これを顧客3に販売す
る形態、顧客3のオーダにより生成した音声合成データ
を、サービス提供者1が機器メーカに送り、当該機器メ
ーカで前記音声合成データを機器に組み込み、これを顧
客3に受け渡す形態も可能である。
【0063】また、音声合成データは、音声のみによる
メッセージに限らず、歌(伴奏有り/なし)や朗読等であ
っても良い。さらに、顧客3は、文章内容を自由にオー
ダすることも可能であるが、例えばサービス提供者1側
が提示した文章の中から顧客3が選択する構成としても
良い。このような構成においては、文章として例えば詩
や小説等をサービス提供者1が提示し、顧客3がスピー
カを選択することにより、いわば顧客3が、好きなスピ
ーカによる朗読の音声合成データを得ることのできるシ
ステム構成とすることも可能である。
【0064】またサービス提供者1から顧客3に対して
提供する音声合成データは、上記実施の形態で示したよ
うに、オンラインでの伝送(ダウンロード)、機器に入力
した状態での受け渡しに限らず、例えばフレキシブルデ
ィスク等、種々の形態の記憶媒体(音声合成データ記憶
媒体)に格納して受け渡すことも可能である。
【0065】加えて、上記のようなプログラムをコンピ
ュータに実行させるため、前記プログラムを記憶した、
CD−ROM、DVD、メモリ、ハードディスク等の記
憶媒体の形態をなしていても良い。また上記のようなプ
ログラムを記憶するCD−ROM、DVD、メモリ、ハ
ードディスク等の記憶手段と、この記憶手段から当該プ
ログラムを読み出し、当該プログラムを実行する装置側
に直接あるいは間接的に当該プログラムを送信する送信
手段とを備える伝送装置の形態を成していても良い。
【0066】
【発明の効果】以上説明したように、本発明によれば、
顧客は、希望したスピーカの音声で、希望した文章内容
の音声合成データを得ることができ、また音源の権利者
に対してのロイヤリティの支払を確実に行うことができ
る。
【図面の簡単な説明】
【図1】 本実施の形態におけるシステム構成を示す図
である。
【図2】 サービス提供者のサーバ構成を示すための図
である。
【図3】 サービス提供者における音声合成データ生成
方法を示すための図である。
【図4】 音声合成データを顧客がオーダするときの処
理の流れを示す図である。
【図5】 音声合成データを生成するときの処理の流れ
を示す図である。
【図6】 オーダした音声合成データを顧客に受け渡す
ときの処理の流れを示す図である。
【図7】 他の実施の形態におけるシステム構成を示す
図である。
【符号の説明】 1…サービス提供者、2…権利者、3…顧客(外部、顧
客側)、4…金融機関(顧客側)、5…ネットワーク、2
1…顧客情報処理部、22…顧客情報DB、31…オー
ダ処理部(要求受付部)、32…支払処理部(価格設定
部)、33…デリバリ処理部、34…オーダ/支払/デ
リバリDB、41…ロイヤリティ処理部、42…ロイヤ
リティ契約DB、51…コンテンツ処理部(音声合成デ
ータ生成部)、52…コンテンツDB、61…音声合成
処理部(音声合成データ生成部)、62…音声特徴DB
(音声特徴データ格納部)、80…ロイヤリティ支払シス
テム、90…クレジットカードシステム、100…機器
(音声出力機器)、D1…声質データ、D2…韻律データ
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10K 15/02 G10L 3/00 Q G10L 11/00 E 19/00 9/00 E N Fターム(参考) 5B049 CC36 FF06 FF09 GG08 5D045 AA07 AB01 AB26

Claims (17)

    【特許請求の範囲】
  1. 【請求項1】 顧客とサービス提供者との間でネットワ
    ークを介してなされる音声合成システムであって、 前記顧客に対し選択可能に提示された話者の中から特定
    の話者を選択するとともに、音声合成すべき文章を指定
    する前記顧客の端末と、 前記顧客が前記端末で指定した前記音声合成すべき文章
    を、前記特定の話者の音声特徴データを用いて音声合成
    する前記サービス提供者のサーバと、を含むことを特徴
    とする音声合成システム。
  2. 【請求項2】 前記サービス提供者の前記サーバは、音
    声合成することにより生成した音声合成データを、前記
    ネットワークを介して前記顧客の前記端末に受け渡すこ
    とを特徴とする請求項1記載の音声合成システム。
  3. 【請求項3】 前記サービス提供者の前記サーバは、前
    記顧客に対し取引番号を付与し、 前記顧客の前記端末から前記取引番号が提示されたとき
    に、生成した前記音声合成データを前記顧客の前記端末
    に受け渡すことを特徴とする請求項2記載の音声合成シ
    ステム。
  4. 【請求項4】 複数の話者の音声特徴データを保有した
    サービス提供者と顧客との間におけるネットワークを介
    しての音声合成方法であって、 前記サービス提供者は、複数の前記話者のリストを、前
    記ネットワークを介して外部に提示し、 前記顧客は、提示された前記リストから選択した話者
    と、音声合成すべき文章とを、前記ネットワークを介し
    て前記サービス提供者に伝え、 前記サービス提供者は、前記顧客の選択した前記話者の
    音声特徴データに基づき、前記音声合成すべき文章を音
    声合成することを特徴とする音声合成方法。
  5. 【請求項5】 前記サービス提供者は、前記顧客に対し
    て、音声合成して生成する音声合成データについて課金
    し、 前記サービス提供者は、前記顧客側から前記課金した代
    金を受け取った後に前記音声合成データを前記顧客に受
    け渡すことを特徴とする請求項4記載の音声合成方法。
  6. 【請求項6】 前記サービス提供者は、当該サービス提
    供者が保有する音声特徴データの権利を有する者に対
    し、音声合成データの生成に応じた代金を支払うことを
    特徴とする請求項4記載の音声合成方法。
  7. 【請求項7】 前記サービス提供者は、音声合成して生
    成した音声合成データを前記顧客に受け渡し、 当該顧客は、受け渡された前記音声合成データを、当該
    音声合成データに基づいた音声が再生可能な機器に入力
    することを特徴とする請求項4記載の音声合成方法。
  8. 【請求項8】 前記サービス提供者は、前記顧客に対
    し、音声合成データを入力すべき機器のリストを、前記
    話者のリストとともに提示し、 前記顧客は、前記機器のリストから選択した機器を前記
    ネットワークを介して前記サービス提供者に伝え、 前記サービス提供者は、前記顧客の選択した前記話者の
    音声特徴データに基づく音声合成データを生成するとと
    もに、生成した当該音声合成データを前記顧客が選択し
    た前記機器に入力することを特徴とする請求項4記載の
    音声合成方法。
  9. 【請求項9】 ネットワーク上に接続された顧客の要求
    に応じて音声合成するサーバであって、 話者の音声を分析して得られた音声特徴データを格納す
    る音声特徴データ格納部と、 前記ネットワークを介して、音声合成すべき文章と話者
    の指定を含む顧客からの要求を受け付ける要求受付部
    と、 前記要求受付部を介して入力された顧客からの要求に応
    じ、前記音声特徴データ格納部に格納されかつ前記話者
    に対応した音声特徴データに基づいて、前記文章を音声
    合成する音声合成データ生成部と、を備えることを特徴
    とするサーバ。
  10. 【請求項10】 前記音声特徴データ格納部は、音声特
    徴データとして、話者毎の声質データと韻律データとを
    格納することを特徴とする請求項9記載のサーバ。
  11. 【請求項11】 前記顧客によってなされた要求に基づ
    き、生成する前記音声合成データの価格を設定する価格
    設定部とをさらに備えることを特徴とする請求項9記載
    のサーバ。
  12. 【請求項12】 コンピュータに実行させるプログラム
    を当該コンピュータの入力手段が読み取り可能に記憶し
    た記憶媒体において、 前記プログラムは、外部から音声合成データを生成する
    ための要求を受け付ける処理と、 受け付けた前記要求に対し、取引番号を生成して出力す
    る処理と、 前記取引番号が入力されたときに、受け付けた前記要求
    に応じた音声合成データを出力する処理と、を前記コン
    ピュータに実行させることを特徴とする記憶媒体。
  13. 【請求項13】 前記プログラムは、生成した前記音声
    合成データに、当該音声合成データの内容を証明する認
    証データを添付する処理と、をさらに前記コンピュータ
    に実行させることを特徴とする請求項12記載の記憶媒
    体。
  14. 【請求項14】 コンピュータに実行させるプログラム
    を、当該コンピュータの入力手段が読み取り可能に記憶
    した記憶媒体において、 前記プログラムは、音声合成すべき文章の指定と話者の
    指定を含む外部からの要求を受け付ける処理と、 受け付けた要求に応じ、前記話者に対応した音声特徴デ
    ータに基づいて前記文章を音声合成する処理と、を前記
    コンピュータに実行させることを特徴とする記憶媒体。
  15. 【請求項15】 コンピュータに、当該コンピュータに
    格納している複数の音声特徴データのリストを顧客に対
    して出力する処理と、前記顧客が入力した文章を当該顧
    客が前記リストから選択した音声特徴データに基づいて
    音声合成した音声合成データを、前記顧客に出力する処
    理をコンピュータに実行させるプログラムが記憶された
    記憶手段と、 前記記憶手段から前記プログラムを読み出して当該プロ
    グラムを送信する送信手段とを備えたことを特徴とする
    プログラム伝送装置。
  16. 【請求項16】 ネットワークを介してサービス提供者
    に接続された顧客が、話者と文章とを前記サービス提供
    者に指定し、当該サービス提供者が前記顧客の指定に応
    じて生成した音声合成データを格納したことを特徴とす
    る音声合成データ記憶媒体。
  17. 【請求項17】 複数の話者の音声データを保有するサ
    ービス提供者に対しネットワークを介して指定された話
    者および文章に基づき、前記サービス提供者が生成した
    音声合成データを記憶する記憶部と、 当該記憶部で記憶した前記音声合成データに基づく音声
    を出力する音声出力部と、を備えることを特徴とする音
    声出力機器。
JP2000191573A 2000-06-26 2000-06-26 音声合成システム、音声合成方法、サーバ、記憶媒体、プログラム伝送装置、音声合成データ記憶媒体、音声出力機器 Pending JP2002023777A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2000191573A JP2002023777A (ja) 2000-06-26 2000-06-26 音声合成システム、音声合成方法、サーバ、記憶媒体、プログラム伝送装置、音声合成データ記憶媒体、音声出力機器
DE10128882A DE10128882A1 (de) 2000-06-26 2001-06-15 Sprachsynthesesystem, Sprachsynthesemethode, Server, Speichermedium, Programmübertragungsgerät Sprachsynthese-Daten-Speichermedium und Sprachausgabevorrichtung
US09/891,717 US6983249B2 (en) 2000-06-26 2001-06-26 Systems and methods for voice synthesis

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000191573A JP2002023777A (ja) 2000-06-26 2000-06-26 音声合成システム、音声合成方法、サーバ、記憶媒体、プログラム伝送装置、音声合成データ記憶媒体、音声出力機器

Publications (1)

Publication Number Publication Date
JP2002023777A true JP2002023777A (ja) 2002-01-25

Family

ID=18690857

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000191573A Pending JP2002023777A (ja) 2000-06-26 2000-06-26 音声合成システム、音声合成方法、サーバ、記憶媒体、プログラム伝送装置、音声合成データ記憶媒体、音声出力機器

Country Status (3)

Country Link
US (1) US6983249B2 (ja)
JP (1) JP2002023777A (ja)
DE (1) DE10128882A1 (ja)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002366184A (ja) * 2001-06-08 2002-12-20 Matsushita Electric Ind Co Ltd 音素公証システム
JP2002366182A (ja) * 2001-06-08 2002-12-20 Matsushita Electric Ind Co Ltd 音素ランキングシステム
JP2002366183A (ja) * 2001-06-08 2002-12-20 Matsushita Electric Ind Co Ltd 音素セキュリティシステム
JP2002366185A (ja) * 2001-06-08 2002-12-20 Matsushita Electric Ind Co Ltd 音素ジャンル分けシステム
JP2003058180A (ja) * 2001-06-08 2003-02-28 Matsushita Electric Ind Co Ltd 合成音販売システムおよび音素の著作権認定システム
JP2003122387A (ja) * 2001-10-11 2003-04-25 Matsushita Electric Ind Co Ltd 読み上げシステム
JP2003140677A (ja) * 2001-11-06 2003-05-16 Matsushita Electric Ind Co Ltd 読み上げシステム
JP2003140672A (ja) * 2001-11-06 2003-05-16 Matsushita Electric Ind Co Ltd 音素ビジネスシステム
JP2003308541A (ja) * 2002-04-16 2003-10-31 Arcadia:Kk プロモーションシステムおよびその方法ならびに仮想実在互換システムおよびその方法
DE102004012208A1 (de) * 2004-03-12 2005-09-29 Siemens Ag Individualisierung von Sprachausgabe durch Anpassen einer Synthesestimme an eine Zielstimme
JP2006012075A (ja) * 2004-06-29 2006-01-12 Navitime Japan Co Ltd 通信型情報配信システムおよび情報配信サーバならびにプログラム
JP2009217846A (ja) * 2009-06-23 2009-09-24 Seiko Epson Corp 音声データ作成装置および音声データ作成方法
JP2012073643A (ja) * 2003-04-18 2012-04-12 At & T Corp 携帯型デバイス内のテキスト音声処理用システムおよび方法

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6912295B2 (en) * 2000-04-19 2005-06-28 Digimarc Corporation Enhancing embedding of out-of-phase signals
JP2003186490A (ja) * 2001-12-21 2003-07-04 Nissan Motor Co Ltd テキスト音声読み上げ装置および情報提供システム
JP2005070430A (ja) * 2003-08-25 2005-03-17 Alpine Electronics Inc 音声出力装置および方法
US20050096909A1 (en) * 2003-10-29 2005-05-05 Raimo Bakis Systems and methods for expressive text-to-speech
US20050171780A1 (en) * 2004-02-03 2005-08-04 Microsoft Corporation Speech-related object model and interface in managed code system
US7382867B2 (en) * 2004-05-13 2008-06-03 Extended Data Solutions, Inc. Variable data voice survey and recipient voice message capture system
US7206390B2 (en) * 2004-05-13 2007-04-17 Extended Data Solutions, Inc. Simulated voice message by concatenating voice files
JP3812848B2 (ja) * 2004-06-04 2006-08-23 松下電器産業株式会社 音声合成装置
US7831656B2 (en) * 2004-12-29 2010-11-09 International Business Machines Corporation Effortless association between services in a communication system and methods thereof
US8650035B1 (en) * 2005-11-18 2014-02-11 Verizon Laboratories Inc. Speech conversion
US20070121817A1 (en) * 2005-11-30 2007-05-31 Yigang Cai Confirmation on interactive voice response messages
JP2008172579A (ja) * 2007-01-12 2008-07-24 Brother Ind Ltd 通信装置
US20100067669A1 (en) * 2008-09-14 2010-03-18 Chris Albert Webb Personalized Web Based Integrated Voice Response System (Celebritiescallyou.com)
JP2014021136A (ja) * 2012-07-12 2014-02-03 Yahoo Japan Corp 音声合成システム
JP6203258B2 (ja) * 2013-06-11 2017-09-27 株式会社東芝 電子透かし埋め込み装置、電子透かし埋め込み方法、及び電子透かし埋め込みプログラム
US9311912B1 (en) * 2013-07-22 2016-04-12 Amazon Technologies, Inc. Cost efficient distributed text-to-speech processing
US9882719B2 (en) * 2015-04-21 2018-01-30 Tata Consultancy Services Limited Methods and systems for multi-factor authentication
JP7082357B2 (ja) * 2018-01-11 2022-06-08 ネオサピエンス株式会社 機械学習を利用したテキスト音声合成方法、装置およびコンピュータ読み取り可能な記憶媒体
US11043204B2 (en) * 2019-03-18 2021-06-22 Servicenow, Inc. Adaptable audio notifications
US11373633B2 (en) * 2019-09-27 2022-06-28 Amazon Technologies, Inc. Text-to-speech processing using input voice characteristic data

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0542628B1 (en) * 1991-11-12 2001-10-10 Fujitsu Limited Speech synthesis system
JP3446764B2 (ja) 1991-11-12 2003-09-16 富士通株式会社 音声合成システム及び音声合成サーバ
JP2880433B2 (ja) 1995-09-20 1999-04-12 株式会社エイ・ティ・アール音声翻訳通信研究所 音声合成装置
JPH09171396A (ja) 1995-10-18 1997-06-30 Baisera:Kk 音声発生システム
JPH10191036A (ja) 1996-11-08 1998-07-21 Monorisu:Kk デジタルコンテンツに対するidの刷込および読出方法
US6134533A (en) * 1996-11-25 2000-10-17 Shell; Allyn M. Multi-level marketing computer network server
JP3884851B2 (ja) 1998-01-28 2007-02-21 ユニデン株式会社 通信システムおよびこれに用いられる無線通信端末装置
US6269336B1 (en) * 1998-07-24 2001-07-31 Motorola, Inc. Voice browser for interactive services and methods thereof
US6324511B1 (en) * 1998-10-01 2001-11-27 Mindmaker, Inc. Method of and apparatus for multi-modal information presentation to computer users with dyslexia, reading disabilities or visual impairment

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002366184A (ja) * 2001-06-08 2002-12-20 Matsushita Electric Ind Co Ltd 音素公証システム
JP2002366182A (ja) * 2001-06-08 2002-12-20 Matsushita Electric Ind Co Ltd 音素ランキングシステム
JP2002366183A (ja) * 2001-06-08 2002-12-20 Matsushita Electric Ind Co Ltd 音素セキュリティシステム
JP2002366185A (ja) * 2001-06-08 2002-12-20 Matsushita Electric Ind Co Ltd 音素ジャンル分けシステム
JP2003058180A (ja) * 2001-06-08 2003-02-28 Matsushita Electric Ind Co Ltd 合成音販売システムおよび音素の著作権認定システム
JP2003122387A (ja) * 2001-10-11 2003-04-25 Matsushita Electric Ind Co Ltd 読み上げシステム
JP2003140677A (ja) * 2001-11-06 2003-05-16 Matsushita Electric Ind Co Ltd 読み上げシステム
JP2003140672A (ja) * 2001-11-06 2003-05-16 Matsushita Electric Ind Co Ltd 音素ビジネスシステム
JP2003308541A (ja) * 2002-04-16 2003-10-31 Arcadia:Kk プロモーションシステムおよびその方法ならびに仮想実在互換システムおよびその方法
JP2012073643A (ja) * 2003-04-18 2012-04-12 At & T Corp 携帯型デバイス内のテキスト音声処理用システムおよび方法
DE102004012208A1 (de) * 2004-03-12 2005-09-29 Siemens Ag Individualisierung von Sprachausgabe durch Anpassen einer Synthesestimme an eine Zielstimme
US7664645B2 (en) 2004-03-12 2010-02-16 Svox Ag Individualization of voice output by matching synthesized voice target voice
JP2006012075A (ja) * 2004-06-29 2006-01-12 Navitime Japan Co Ltd 通信型情報配信システムおよび情報配信サーバならびにプログラム
JP2009217846A (ja) * 2009-06-23 2009-09-24 Seiko Epson Corp 音声データ作成装置および音声データ作成方法

Also Published As

Publication number Publication date
DE10128882A1 (de) 2002-02-28
US20020055843A1 (en) 2002-05-09
US6983249B2 (en) 2006-01-03

Similar Documents

Publication Publication Date Title
JP2002023777A (ja) 音声合成システム、音声合成方法、サーバ、記憶媒体、プログラム伝送装置、音声合成データ記憶媒体、音声出力機器
US5953005A (en) System and method for on-line multimedia access
CN101277210B (zh) 信息处理设备和方法及信息分配系统、设备和方法
US20020032747A1 (en) System, method, device, and program for distributing data, and data reproduction device
US20070269025A1 (en) Managing Customer Access to a Communication Recorded by A Provider in Association with a Transaction
JP2009515484A (ja) 電話通信のためのサービス・インタフェース
JP2002091454A (ja) サーバ装置、配信システム、配信方法、及び端末装置
JP2003085084A (ja) コンテンツ配信システム及びコンテンツ配信方法、携帯端末、配信サーバ、並びに記憶媒体
JP2001350479A (ja) 音声データ配信システム、同配信方法、同配信システムに利用される配信用サーバ、クライアント側端末、及び同配信システムに利用されるコンピュータに適用されるプログラムを記録したコンピュータ読取り可能な記録媒体。
JP2002055686A (ja) 音声データの販売方法および販売システム
WO2001095310A1 (fr) Dispositif de controle des donnees, support d'enregistrement pour programme de controle des donnees, support d'enregistrement pour donnees de certification d'utilisation, et procede d'utilisation de donnees
JP2003216586A (ja) Usbアクセスキー
JP2020017031A (ja) 音声データ提供システム及びプログラム
JP2003058180A (ja) 合成音販売システムおよび音素の著作権認定システム
JP3721179B2 (ja) サウンドデータを用いたicカード決済方法及び店舗端末
JP4635689B2 (ja) 端末装置、制約解除システム、端末装置の制御方法、及び端末装置制御プログラム
JP2006031478A (ja) コンテンツ再生端末およびコンテンツ配信システム
JP2003196563A (ja) 情報処理システム
JP2002041999A (ja) コンテンツの配信システム、コンテンツの配信方法、配信サーバ、及び配信プログラムを記録したコンピュータ読取り可能な記録媒体
JP2007213530A (ja) データ保存送信装置、それに用いるコンピュータプログラム及びそれを記録した記録媒体、並びに、データ再生方法
KR20010025222A (ko) 네트워크를 이용한 실시간 다자간 노래방 시스템
JP2002175085A (ja) カラオケ情報配信装置
JP2004295379A (ja) データ提供システム及びデータ提供方法並びにデータ提供プログラム
JP2002351487A (ja) 音声ライブラリシステム及びその運用方法
KR20010008385A (ko) 디지털 무선 통신망을 이용한 음성맞춤정보 제공방법,음성맞춤정보 제공시스템 및 음성맞춤정보 수신단말기

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040423

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040722

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20041207

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050217

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20050222

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20050603

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20070809