JP3384646B2 - 音声合成装置及び読み上げ時間演算装置 - Google Patents

音声合成装置及び読み上げ時間演算装置

Info

Publication number
JP3384646B2
JP3384646B2 JP13337495A JP13337495A JP3384646B2 JP 3384646 B2 JP3384646 B2 JP 3384646B2 JP 13337495 A JP13337495 A JP 13337495A JP 13337495 A JP13337495 A JP 13337495A JP 3384646 B2 JP3384646 B2 JP 3384646B2
Authority
JP
Japan
Prior art keywords
text information
voice
information
reading time
speaker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP13337495A
Other languages
English (en)
Other versions
JPH08328577A (ja
Inventor
武 湯村
宏樹 大西
正典 宮武
直之 余田
正士 落岩
貴次 泉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP13337495A priority Critical patent/JP3384646B2/ja
Priority to US08/564,594 priority patent/US5752228A/en
Priority to KR1019960018728A priority patent/KR960042521A/ko
Publication of JPH08328577A publication Critical patent/JPH08328577A/ja
Application granted granted Critical
Publication of JP3384646B2 publication Critical patent/JP3384646B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/04Details of speech synthesis systems, e.g. synthesiser structure or memory management

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Description

【発明の詳細な説明】 【0001】 【産業上の利用分野】本発明は、設定された時間でテキ
スト情報を読み終えられる速度の音声を、このテキスト
情報から合成出力する音声合成装置、及び発声者の音声
情報から抽出した発声速度から、この発声者がテキスト
情報を読み終える読み上げ時間を算出する読み上げ時間
演算装置に関する。 【0002】 【従来の技術】講演会、スピーチ等の各人の発表時間
内、また映像のタイトルが映写されている間、音楽の前
奏、間奏の間、関連性のある映像が映写されている間等
に原稿を読んだりナレーションを付けたりする場合、原
稿を読み終えるまでの読み上げ時間が制限されている。
また、有料のメディアを利用してテキスト情報を音声で
提供する場合、テキスト情報の読み上げ時間が料金に関
係する。 【0003】上述のように、テキスト情報の読み上げ時
間が重要なファクタとなる場合、一般的には原稿を読み
上げる発声者が、実際に読む場合と同様の口調、感情で
原稿を声に出して読み、その時間が一定時間を超える場
合には原稿の内容を削ったり、要約したりし、また一定
時間に満たない場合は原稿の内容を追加する。このよう
な試行錯誤を繰り返して一定時間に読み終えられる原稿
に仕上げていく。また、一定時間内に音声で伝達すべき
内容を削れない場合は早口で読んで時間内に収めるよう
に、読みの速さを試行錯誤的に変えていく。 【0004】 【発明が解決しようとする課題】従って、原稿を仕上げ
るまで、又は読みの速さを調整するために発声者は幾度
も原稿を声に出して読まなければならずに作業負担が大
きく、原稿が長い場合にはその負担が増す。また、原稿
の読み方、原稿を読む速度、口調は人によって様々であ
って、原稿を読み上げるべき発声者の読み上げ時間は他
の発声者の読み上げ時間と必ずしも一致しないので、他
の発声者では原稿の読み上げを代行できない。 【0005】本発明はこのような問題点を解決するため
になされたものであって、設定時間及びテキスト分量に
合わせた速度の合成音声でテキスト情報を読み上げ、ま
た発声者が所定の一文、単語等を発声した音声情報を基
に、この発声者がテキスト情報を読み上げた場合の読み
上げ時間を算出することにより、テキスト情報の読み上
げを代行してテキスト情報作成における発声者の作業負
担を軽減する音声合成装置及び読み上げ時間演算装置の
提供を目的とする。 【0006】 【0007】 【0008】【発明が解決しようとする課題】 第1発明の読み上げ時
間演算装置 は、発声者がテキスト情報を読み終える読み
上げ時間を演算する装置であって、テキスト情報を入力
するテキスト入力手段と、テキスト入力手段により入力
されたテキスト情報を解析するテキスト解析手段と、テ
キスト解析手段の解析結果から所定の発声速度の音声に
よる前記テキスト情報の読み上げ時間を算出する演算手
段と、発声者の音声を入力する音声入力手段と、前記所
定の発声速度の音声が、前記音声入力手段により入力さ
れた音声が発声したと同じ内容を発声した音声情報を格
納しており、該音声情報と音声入力手段から入力された
発声者の音声とに基づいて、前記所定の発声速度に対す
る該発声者の発声速度の相対値を算出する相対的発声速
度算出手段と、前記発声者による前記テキスト情報の読
み上げ時間を算出すべく、前記相対値に基づいて、前記
演算手段により算出された読み上げ時間を補正する補正
手段と、該補正手段の補正の結果算出された、前記発声
者による前記テキスト情報の読み上げ時間を出力する手
段とを備えたことを特徴とする。 【0009】 【0010】 【作用】第1発明の音声合成装置は、テキスト情報が入
力され、このテキスト情報の読み上げ時間が設定される
と、入力されたテキスト情報を解析し、解析結果から所
定の発声速度によるテキスト情報の標準的な読み上げ時
間を算出し、標準的な読み上げ時間と、設定された読み
上げ時間との比較から、標準的な読み上げ時間が設定時
間に一致する発声速度を決定し、合成データを参照し
て、テキスト情報から、決定された発声速度の音声を合
成して出力する。ユーザは合成音声により発声されるテ
キスト情報の発声速度を聞いて、設定時間に収めるべく
決定された発声速度が、テキスト情報の内容を充分に伝
達し得る速度であるか否かを判定し、充分に伝達し得る
と判定した場合は、テキスト情報の内容はこのままで、
所定の発声者にこの速度に合わせてテキスト情報を読み
上げさせ、またテキスト情報の内容が充分に伝達されな
いと判定した場合はテキスト情報の内容を調整する。従
って、発声速度の適否の判定のために発声者がテキスト
情報を実際に読む必要がなくなってテキスト情報作成に
おける発声者の負担が軽減される。 【0011】第2発明の音声合成装置は、所定の発声者
の声質情報を格納しており、この声質情報に基づいて、
テキスト情報を発声する音声を合成する。従って、テキ
スト情報を発声すべき発声者の声質情報を格納しておけ
ば、設定時間に合わせて発声者が早口で読んだ場合又は
ゆっくりと読んだ場合にテキスト情報が明瞭に伝達され
るか否かが再現され、発声者の声質により生じる固有の
不明瞭部分もチェックできる。 【0012】第3発明の読み上げ時間演算装置は、テキ
スト情報が入力されると、このテキスト情報を解析し、
解析結果から所定の発声速度によるテキスト情報の標準
的な読み上げ時間を算出する一方、発声者の音声が入力
されると、入力された音声と、これと同じ内容を所定の
発声速度の音声が発声した音声情報とに基づいて、所定
の発声速度に対する発声者の発声速度の相対値を算出
し、算出した相対値に基づいて、標準的な読み上げ時間
を補正して発声者によるテキスト情報の読み上げ時間を
算出し、この読み上げ時間を出力する。ユーザは出力さ
れた読み上げ時間を参照して、テキスト情報の読み上げ
が所定の時間に収まるようにテキスト情報の内容を削っ
たり、補充したりする。従って、読み上げ時間の計測の
ために発声者がテキスト情報を実際に読む必要がなくな
ってテキスト情報作成における発声者の負担が軽減され
る。 【0013】第4発明の読み上げ時間演算装置は、読み
上げ時間が設定され、テキスト情報が入力されると、こ
のテキスト情報を解析し、解析結果から、設定された発
声速度によるテキスト情報の標準的な読み上げ時間を算
出し、この読み上げ時間を出力する。ユーザは出力され
た読み上げ時間を参照して、テキスト情報の読み上げが
所定の時間に収まるようにテキスト情報の内容を削った
り、補充したりする。従って、読み上げ時間の計測のた
めに発声者がテキスト情報を実際に読む必要がなくなっ
てテキスト情報作成における発声者の負担が軽減され
る。 【0014】 【実施例】以下、本発明をその実施例を示す図に基づい
て説明する。図1は本発明の音声合成装置の構成を示す
ブロック図である。図中、1はテキスト情報を入力する
キーボード、スキャナ、タッチパネル等のテキスト入力
部であって、形態素解析部2は、テキスト情報を、意味
を持つ最小の言語単位に分解するための文法規則等が格
納されている形態素辞書3を参照して、テキスト入力部
1から入力されたテキスト情報を、例えば1文ごとに切
り出し、形態素解析を行って品詞、アクセント情報を付
与した後、読み仮名を付与し、文節、アクセント句を抽
出して、発声間隔をあける必要がある部分にポーズ情報
を付与する。さらに、形態素解析部2はテキスト情報に
音声言語処理を行って、音韻的に強勢を置くべき部分に
焦点情報を付すとともに、焦点情報を付した部分に、速
度制御情報を付与する。標準読み上げ時間演算部4は、
テキスト情報に焦点情報が付されている場合は、その部
分がゆっくり発声されるように、音声波形の時間軸上に
おける1音節の発声時間単位であるモーラ(拍)を時間
軸変換し、標準的な所定の発声速度で1文ごとのテキス
ト情報を読み上げた場合の読み時間を積算し、テキスト
情報全体の標準読み上げ時間を算出する。 【0015】読み上げ時間設定部5は、テキスト情報を
読み終えるべき読み上げ時間を設定するテンキー等から
なる。発声速度制御部6は、読み上げ時間設定部5によ
り設定された読み上げ時間と、標準読み上げ時間演算部
4が算出した標準読み上げ時間とを比較し、比較結果を
基に、標準読み上げ時間が設定時間に一致するような発
声速度パラメータを決定する。 【0016】音声データベース7には、テキスト情報の
自然な読み方に可及的に近い読み方が得られるように、
テキスト情報を表記単位ではなく、音韻解析等に基づ
き、発声に適した合成単位に分割した単位毎の音声の波
形信号が音声の合成データとして格納されており、さら
に、予めテキスト情報の発声者の音声情報の周波数スペ
クトル等から抽出されたこの発声者の声質情報が格納さ
れている。音声合成部8はテキスト情報の音声を合成す
べき合成データ、声質情報を音声データベース7から読
み出し、各合成単位の発声者の声質を有する音声の合成
データを、なめらかな発声が得られるように連結する波
形処理を行って、発声者がテキスト情報を読み上げてい
るような合成音声をスピーカ9から出力する。 【0017】また、図2は本発明の読み上げ時間演算装
置の構成を示すブロック図であって、図1の音声合成装
置と同一部分(1〜4)には同一符号を付してその説明
を省略する。図中、11はマイクロフォン等の音声入力部
11であって、発声速度抽出部12は、所定の語句、文章等
を、標準的な所定の発声速度で発声した音声情報を格納
しており、音声入力部11から発声者がこの所定の語句、
文章等を入力した音声情報を、所定の発声速度で発声し
た音声情報と比較し、所定の発声速度に対する、発声者
の相対的な発声速度のパラメータを抽出する。 【0018】読み上げ時間補正部13は、発声速度抽出部
12により抽出されたパラメータに基づいて、標準読み上
げ時間演算部4により算出された所定の発声速度でのテ
キスト情報の標準的読み上げ時間を補正することで、発
声者によるテキスト情報の読み上げ時間を算出し、発声
者によるテキスト情報の読み上げ時間をモニタ14に表示
する。 【0019】また、図3は本発明の読み上げ時間演算装
置の変形例の構成を示すブロック図であって、図1の音
声合成装置、及び図2の読み上げ時間演算装置と同一部
分には同一符号を付してその説明を省略する。本変形例
は前述の実施例と異なり、音声情報から発声速度を抽出
するのではなく、発声速度を設定する構成であって、発
声速度を設定する発声速度設定部15と、テキスト情報に
焦点情報が付されている場合は、その部分がゆっくり発
声されるように、音声波形の時間軸上における1音節の
発声時間単位であるモーラ(拍)を時間軸変換し、設定
された発声速度で1文ごとのテキスト情報を読み上げた
場合の読み時間を積算し、テキスト情報全体の標準読み
上げ時間を算出する読み上げ時間演算部16とが設けられ
ている。 【0020】次に、本発明の音声合成装置による読み上
げ代行の手順を図4及び図5に示すフローチャートに基
づいて説明する。テキスト入力部1からテキスト情報が
入力されると(S1)、形態素解析部2は、入力された
テキスト情報から1文を切り出し(S2)、形態素辞書
3を参照してテキスト情報を形態素に解析して品詞、ア
クセント情報を付与し(S3)、各形態素に読み仮名を
付与し(S4)、さらに文節、アクセント句を抽出し
て、発声間隔をあける必要がある部分にポーズ情報を付
与する(S5)。 【0021】図6は形態素解析されたテキスト情報に対
して読み仮名を付与した状態の概念図である。例えば、
「今日オリンピックが開幕した。」という1文から、
「今日/オリンピック/が/開幕し/た。」という形態
素に解析され、各形態素に「きょう/おりんぴっく/が
/かいまくし/た。」と読み仮名が付与された状態を示
したものである。 【0022】また、図7は読み仮名を付与されたテキス
ト情報に対してポーズ情報を付与した状態の概念図であ
る。図6のように、「きょう/おりんぴっく/が/かい
まくし/た。」と読み仮名を付与されたテキスト情報の
「きょう」と「おりんぴっくが」との間に“ポーズ1”
が、「かいまくした」の後ろに“ポーズ2”が付与され
た状態を示したものである。 【0023】また、形態素解析部2はテキスト情報に音
声言語処理を行って、音韻的に強勢を置くべき部分に焦
点情報を付すとともに、焦点情報を付した部分に、その
部分をゆっくり発声するような速度制御情報を付与する
(S6)。標準読み上げ時間演算部4は、テキスト情報
に焦点情報が付されている場合は、その部分がゆっくり
発声されるように、各モーラを時間軸変換し(S7)、
標準的な所定の発声速度で1文ごとのテキスト情報を読
み上げた場合の読み時間を算出し(S8)、各1文の読
み時間を積算してテキスト情報全体の標準読み上げ時間
を算出する(S9)。 【0024】一方、読み上げ時間設定部5からテキスト
情報の読み上げ時間が設定されると(S10)、発声速度
制御部6は、設定された読み上げ時間と、標準読み上げ
時間演算部4により算出された標準読み上げ時間とを比
較し、標準読み上げ時間が設定時間に一致するような発
声速度パラメータ、即ち、設定時間内にテキスト情報を
読み上げられる発声速度パラメータを決定する(S1
1)。以上のようにして算出した発声速度パラメータを
基に、上述のステップS2〜S7と同様の手順で各1文
の各形態素に、読み仮名、ポーズ情報、焦点情報による
速度制御情報を付与し(S12〜S16)、各モーラを時間
軸変換する(S17)。音声合成部8は、設定時間内にテ
キスト情報を読み上げられる発声速度パラメータに基づ
いて補正された各種パラメータ、及び音声データベース
7に格納されている発声者の声質情報を基に、設定時間
内にテキスト情報を終えられる発声速度の発声者の音声
を合成し(S18)、合成音をスピーカ9から出力する
(S19)。以上の動作をテキスト情報の各1文に対して
繰り返してテキスト情報全体の合成音声を出力する。 【0025】ユーザは、以上のようにして合成された音
声で読み上げられるテキスト情報を聴いて、発声速度が
適当であってテキスト情報の内容が充分に伝達されるか
否かを判定し、充分に伝達されると判定した場合、発声
者に合成音声と同様の発声速度でテキスト情報を発声さ
せる。また、発声速度が速すぎてテキスト情報の内容が
充分に伝達されないと判定した場合はテキスト情報の内
容を削るか、又は要約する。なお、本実施例では発声者
の音声情報から抽出した声質情報を音声データベース7
に格納しておく構成としたが、発声者の声質情報は格納
せず、不特定の発声者の合成音声でテキスト情報を読み
上げる構成であってもよい。 【0026】また、本発明の読み上げ時間演算装置によ
る読み上げ時間算出の手順を図8に示すフローチャート
に基づいて説明する。テキスト入力部1からテキスト情
報が入力されると(S21)、形態素解析部2は、入力さ
れたテキスト情報から1文を切り出し(S22)、形態素
辞書3を参照してテキスト情報を形態素に解析して品
詞、アクセント情報を付与し(S23)、各形態素に読み
仮名を付与し(S24)、さらに文節、アクセント句を抽
出して、発声間隔をあける必要がある部分にポーズ情報
を付与する(S25)。また、形態素解析部2はテキスト
情報に音声言語処理を行って、音韻的に強勢を置くべき
部分に焦点情報を付すとともに、焦点情報を付した部分
に、その部分をゆっくり発声するような速度制御情報を
付与する(S26)。標準読み上げ時間演算部4は、テキ
スト情報に焦点情報が付されている場合は、その部分が
ゆっくり発声されるように、各モーラを時間軸変換し
(S27)、標準的な所定の発声速度で1文ごとのテキス
ト情報を読み上げた場合の読み時間を算出し(S28)、
各1文の読み時間を積算してテキスト情報全体の標準読
み上げ時間を算出する(S29)。 【0027】一方、音声入力部11から発声者の音声が入
力されると(S30)、発声速度抽出部12は標準的な所定
の発声速度で発声した所定の語句、文章等の音声情報
と、音声入力部11から入力された発声者の音声情報とを
比較し、所定の発声速度に対する、発声者の相対的な発
声速度のパラメータを抽出する(S31)。読み上げ時間
補正部13は、発声速度抽出部12により抽出されたパラメ
ータに基づいて、標準読み上げ時間演算部4により算出
された所定の発声速度でのテキスト情報の標準的読み上
げ時間を補正することで(S32)、発声者によるテキス
ト情報の読み上げ時間を算出し、発声者によるテキスト
情報の読み上げ時間をモニタ14に表示する(S33)。 【0028】また、図9は本発明の読み上げ時間演算装
置の変形例による読み上げ時間算出の手順を示すフロー
チャートである。テキスト入力部1からテキスト情報が
入力されると(S41)、形態素解析部2は、入力された
テキスト情報から1文を切り出し(S42)、形態素辞書
3を参照してテキスト情報を形態素に解析して品詞、ア
クセント情報を付与し(S43)、各形態素に読み仮名を
付与し(S44)、さらに文節、アクセント句を抽出し
て、発声間隔をあける必要がある部分にポーズ情報を付
与する(S45)。また、形態素解析部2はテキスト情報
に音声言語処理を行って、音韻的に強勢を置くべき部分
に焦点情報を付すとともに、焦点情報を付した部分に、
その部分をゆっくり発声するような速度制御情報を付与
する(S46)。読み上げ時間演算部16は、テキスト情報
に焦点情報が付されている場合は、その部分がゆっくり
発声されるように、各モーラを時間軸変換する(S4
7)。一方、発声速度設定部15により発声速度が設定さ
れ(S48)、読み上げ時間演算部16は、設定された発声
速度での1文ごとのテキスト情報を読み上げた場合の読
み時間を算出し(S49)、各1文の読み時間を積算して
テキスト情報全体の標準読み上げ時間を算出し(S5
0)、設定速度でのテキスト情報の読み上げ時間をモニ
タ14に表示する(S51)。 【0029】ユーザは、以上のようにしてモニタ14に表
示された読み上げ時間を参照して、読み上げ時間がスピ
ーチ時間等を超える場合はテキスト情報の内容を削る
か、又は要約し、読み上げ時間が短すぎる場合はテキス
ト情報の内容を補充する。 【0030】 【発明の効果】以上のように、本発明の音声合成装置
は、設定時間及びテキスト分量に合わせた速度の合成音
声でテキスト情報を読み上げ、また本発明の読み上げ時
間演算装置は、発声者が所定の一文、単語等を発声した
音声情報を基に、この発声者がテキスト情報を読み上げ
た場合の読み上げ時間を算出するので、テキスト情報の
読み上げが代行されてテキスト情報作成における発声者
の作業負担が軽減されるという優れた効果を奏する。
【図面の簡単な説明】 【図1】本発明の音声合成装置の構成を示すブロック図
である。 【図2】本発明の読み上げ時間演算装置の構成を示すブ
ロック図である。 【図3】本発明の読み上げ時間演算装置の変形例の構成
を示すブロック図である。 【図4】本発明の音声合成装置による音声合成での、設
定時間に合わせた読み速度によるテキスト情報の読み上
げ手順を示すフローチャートである。 【図5】本発明の音声合成装置による音声合成での、設
定時間に合わせた読み速度によるテキスト情報の読み上
げ手順を示すフローチャートである。 【図6】形態素解析においてテキスト情報の読み仮名が
付与された状態を示す概念図である。 【図7】形態素解析において読み仮名が付与されたテキ
スト情報にポーズ情報が付与された状態を示す概念図で
ある。 【図8】本発明の読み上げ時間演算装置による読み上げ
時間の算出手順を示すフローチャートである。 【図9】本発明の読み上げ時間演算装置の変形例による
読み上げ時間の算出手順を示すフローチャートである。 【符号の説明】 1 テキスト入力部 2 形態素解析部 3 形態素辞書 4 標準読み上げ時間演算部 5 読み上げ時間設定部 6 発声速度制御部 7 音声データデータベース 8 音声合成部 9 スピーカ 11 音声入力部 12 発声速度抽出部 13 読み上げ時間補正部 14 モニタ 15 発声速度設定部 16 読み上げ時間演算部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 余田 直之 大阪府守口市京阪本通2丁目5番5号 三洋電機株式会社内 (72)発明者 落岩 正士 大阪府守口市京阪本通2丁目5番5号 三洋電機株式会社内 (72)発明者 泉 貴次 大阪府守口市京阪本通2丁目5番5号 三洋電機株式会社内 (56)参考文献 特開 平6−67685(JP,A) 特開 平5−232982(JP,A) 特開 平6−131148(JP,A) 特開 平6−132248(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 13/08

Claims (1)

  1. (57)【特許請求の範囲】 【請求項1】 発声者がテキスト情報を読み終える読み
    上げ時間を演算する装置であって、テキスト情報を入力
    するテキスト入力手段と、テキスト入力手段により入力
    されたテキスト情報を解析するテキスト解析手段と、テ
    キスト解析手段の解析結果から所定の発声速度の音声に
    よる前記テキスト情報の読み上げ時間を算出する演算手
    段と、発声者の音声を入力する音声入力手段と、前記所
    定の発声速度の音声が、前記音声入力手段により入力さ
    れた音声が発声したと同じ内容を発声した音声情報を格
    納しており、該音声情報と音声入力手段から入力された
    発声者の音声とに基づいて、前記所定の発声速度に対す
    る該発声者の発声速度の相対値を算出する相対的発声速
    度算出手段と、前記発声者による前記テキスト情報の読
    み上げ時間を算出すべく、前記相対値に基づいて、前記
    演算手段により算出された読み上げ時間を補正する補正
    手段と、該補正手段の補正の結果算出された、前記発声
    者による前記テキスト情報の読み上げ時間を出力する手
    段とを備えたことを特徴とする読み上げ時間演算装置。
JP13337495A 1995-05-31 1995-05-31 音声合成装置及び読み上げ時間演算装置 Expired - Fee Related JP3384646B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP13337495A JP3384646B2 (ja) 1995-05-31 1995-05-31 音声合成装置及び読み上げ時間演算装置
US08/564,594 US5752228A (en) 1995-05-31 1995-11-29 Speech synthesis apparatus and read out time calculating apparatus to finish reading out text
KR1019960018728A KR960042521A (ko) 1995-05-31 1996-05-30 음성 합성 장치 및 낭독 시간 연산 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP13337495A JP3384646B2 (ja) 1995-05-31 1995-05-31 音声合成装置及び読み上げ時間演算装置

Publications (2)

Publication Number Publication Date
JPH08328577A JPH08328577A (ja) 1996-12-13
JP3384646B2 true JP3384646B2 (ja) 2003-03-10

Family

ID=15103243

Family Applications (1)

Application Number Title Priority Date Filing Date
JP13337495A Expired - Fee Related JP3384646B2 (ja) 1995-05-31 1995-05-31 音声合成装置及び読み上げ時間演算装置

Country Status (3)

Country Link
US (1) US5752228A (ja)
JP (1) JP3384646B2 (ja)
KR (1) KR960042521A (ja)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6240384B1 (en) 1995-12-04 2001-05-29 Kabushiki Kaisha Toshiba Speech synthesis method
JP3036430B2 (ja) * 1996-04-12 2000-04-24 日本電気株式会社 文章読み上げ装置
JPH11161298A (ja) * 1997-11-28 1999-06-18 Toshiba Corp 音声合成方法及び装置
US6289310B1 (en) * 1998-10-07 2001-09-11 Scientific Learning Corp. Apparatus for enhancing phoneme differences according to acoustic processing profile for language learning impaired subject
US6374225B1 (en) * 1998-10-09 2002-04-16 Enounce, Incorporated Method and apparatus to prepare listener-interest-filtered works
JP2001014306A (ja) * 1999-06-30 2001-01-19 Sony Corp 電子文書処理方法及び電子文書処理装置並びに電子文書処理プログラムが記録された記録媒体
AU4200600A (en) * 1999-09-16 2001-04-17 Enounce, Incorporated Method and apparatus to determine and use audience affinity and aptitude
JP2002169581A (ja) * 2000-11-29 2002-06-14 Matsushita Electric Ind Co Ltd 音声合成方法およびその装置
WO2006070566A1 (ja) * 2004-12-28 2006-07-06 Matsushita Electric Industrial Co., Ltd. 音声合成方法および情報提供装置
CN101223571B (zh) * 2005-07-20 2011-05-18 松下电器产业株式会社 音质变化部位确定装置及音质变化部位确定方法
JP4816266B2 (ja) * 2006-06-07 2011-11-16 ソニー株式会社 記録システム、記録方法
US9087507B2 (en) * 2006-09-15 2015-07-21 Yahoo! Inc. Aural skimming and scrolling
EP2169663B8 (en) * 2007-07-24 2013-03-06 Panasonic Corporation Text information presentation device
US8145490B2 (en) * 2007-10-24 2012-03-27 Nuance Communications, Inc. Predicting a resultant attribute of a text file before it has been converted into an audio file
US8423365B2 (en) 2010-05-28 2013-04-16 Daniel Ben-Ezri Contextual conversion platform
US20120197630A1 (en) * 2011-01-28 2012-08-02 Lyons Kenton M Methods and systems to summarize a source text as a function of contextual information
JP4996750B1 (ja) 2011-01-31 2012-08-08 株式会社東芝 電子機器
US9875218B2 (en) * 2014-01-28 2018-01-23 International Business Machines Corporation Document summarization
KR101587625B1 (ko) * 2014-11-18 2016-01-21 박남태 음성제어 영상표시 장치 및 영상표시 장치의 음성제어 방법
CN104462027A (zh) * 2015-01-04 2015-03-25 王美金 一种实时将陈述句进行半人工标准化处理的方法和系统
JP7284571B2 (ja) * 2018-11-20 2023-05-31 東京瓦斯株式会社 情報処理装置およびプログラム

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4527274A (en) * 1983-09-26 1985-07-02 Gaynor Ronald E Voice synthesizer
US4799261A (en) * 1983-11-03 1989-01-17 Texas Instruments Incorporated Low data rate speech encoding employing syllable duration patterns
US4692941A (en) * 1984-04-10 1987-09-08 First Byte Real-time text-to-speech conversion system
US4833718A (en) * 1986-11-18 1989-05-23 First Byte Compression of stored waveforms for artificial speech
US4852168A (en) * 1986-11-18 1989-07-25 Sprague Richard P Compression of stored waveforms for artificial speech
JP2767910B2 (ja) * 1989-07-18 1998-06-25 日本電気株式会社 時分割通話路
JPH04191899A (ja) * 1990-11-27 1992-07-10 Canon Inc 音声合成方法及び装置
JPH04199421A (ja) * 1990-11-29 1992-07-20 Toshiba Corp 文書読上げ装置
JPH05113795A (ja) * 1991-05-31 1993-05-07 Oki Electric Ind Co Ltd 音声合成装置
JPH05181491A (ja) * 1991-12-30 1993-07-23 Sony Corp 音声合成装置
EP0598598B1 (en) * 1992-11-18 2000-02-02 Canon Information Systems, Inc. Text-to-speech processor, and parser for use in such a processor
JPH07110807A (ja) * 1993-10-13 1995-04-25 Hitachi Ltd 文書読み上げ装置
JPH07181992A (ja) * 1993-12-22 1995-07-21 Toshiba Corp 文書読上げ装置及び方法
US5615301A (en) * 1994-09-28 1997-03-25 Rivers; W. L. Automated language translation system

Also Published As

Publication number Publication date
JPH08328577A (ja) 1996-12-13
US5752228A (en) 1998-05-12
KR960042521A (ko) 1996-12-21

Similar Documents

Publication Publication Date Title
JP3384646B2 (ja) 音声合成装置及び読み上げ時間演算装置
US6990451B2 (en) Method and apparatus for recording prosody for fully concatenated speech
JPH10153998A (ja) 補助情報利用型音声合成方法、この方法を実施する手順を記録した記録媒体、およびこの方法を実施する装置
US20070088547A1 (en) Phonetic speech-to-text-to-speech system and method
US20080319754A1 (en) Text-to-speech apparatus
JPH0632020B2 (ja) 音声合成方法および装置
JPH05165486A (ja) テキスト音声変換装置
AU769036B2 (en) Device and method for digital voice processing
JP2001117920A (ja) 翻訳装置および翻訳方法、並びに記録媒体
WO1999046732A1 (fr) Dispositif de generation d'images en mouvement et dispositif d'apprentissage via reseau de controle d'images
JP3060276B2 (ja) 音声合成装置
JPH0580791A (ja) 音声規則合成装置および方法
JP3575919B2 (ja) テキスト音声変換装置
JP3113101B2 (ja) 音声合成装置
JP4056647B2 (ja) 波形接続型音声合成装置および方法
Ojala Auditory quality evaluation of present Finnish text-to-speech systems
JP2003005774A (ja) 音声合成装置
JPH1063287A (ja) 発音訓練装置
Madaminjonov Formation of a Speech Database in the Karakalpak Language for Speech Synthesis Systems
JPH08328578A (ja) テキスト音声合成装置
JPH06214585A (ja) 音声合成装置
JP2578876B2 (ja) 文章読み上げ装置
JPH09292897A (ja) 音声合成装置
JP2001166787A (ja) 音声合成装置および自然言語処理方法
JPH0644247A (ja) 音声合成装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees