JPH02238494A - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JPH02238494A
JPH02238494A JP1059922A JP5992289A JPH02238494A JP H02238494 A JPH02238494 A JP H02238494A JP 1059922 A JP1059922 A JP 1059922A JP 5992289 A JP5992289 A JP 5992289A JP H02238494 A JPH02238494 A JP H02238494A
Authority
JP
Japan
Prior art keywords
speech
input
section
information
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1059922A
Other languages
English (en)
Inventor
Kenji Matsui
謙二 松井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP1059922A priority Critical patent/JPH02238494A/ja
Publication of JPH02238494A publication Critical patent/JPH02238494A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、テキストを音声に変換する音声合成装置に関
する。
従来の技術 任意のテキストを自然性の高い音声に変換する音声合成
の従来技術は大きく分けて第2図に示すような処理が必
要である。同図に於で、後述するように、9はテキスト
入力部、10は言語処理部、11は音声合成用辞書、1
2は合成用辞書登録変更部、13は音響処理部、14は
音声合成部である。
合成しようとするテキスト情報はASCIIやJISコ
ード等の文字コードの形態でテキスト入力部9に入力さ
れる。テキスト入力部9は外部機器とのインタフェース
としての機能を持ち、送られてきた文字コードデータを
言語処理部lOに送る。次に、言語処理部10で入力テ
キストを1)入力された文章を単語や文節に分割し、そ
れぞれに読み、アクセント、品詞情報などを付与する。
2)記号や数詞等の処理、読みの選択、変更(連濁等)
を行う。3)複合単語や文節のアクセント型を決定する
。4)構文解析を行い自然な音声の合成に必要な構文情
報を得る,−●●,等の言語処理を行う。これらの一連
の処理に必要な辞書情報は、音声合成用辞書1lから取
り出す。これらの処理が終了した時点で発音記号や構文
情報等の出力データを音響処理部l3に送りだす。音響
処理部13は、上記言語処理部からの出力データに対し
て以下の処理を行う。1)ポーズ位置やポーズ長の決定
、音韻変形処理(母音の無声化等)。
2)各音韻の持続時間長の決定。3)イントネーシロン
(基本周波数)の決定。4)調音結合による音素や音韻
の変形処理。5)音声合成部用パラメータの生成、●●
●、等である。このようにして生成された音声合成部用
パラメータにより音声合成部14がリアルタイムで所望
の音声信号を合成する。
上記の動作例でユーザーが所望するテキストを正確に合
成できない場合、ユーザーは音声合成用辞書の内容を変
更するか、あるいは新規登録することによりほとんどの
場合解決できる。この変更、登録は以下のようにして行
う。
まず既存の辞書内容を変更する場合、ユーザーは辞書変
更のモードを選択した後、テキスト入力部9より変更し
たい単語の見出し部分と変更したい内容を入力する。こ
の情報は音声合成用辞書登録変更部12に送られ、この
登録変更部は辞書中のこの見出しに対応する部分に上記
の変更したい内容を書き込む。
新たな単語を登録する場合も同様で、ユーザーは登録モ
ードを選択し、テキスト入力部9より登録したい単語の
見出しとその発音記号等の内容を入力する。この情報は
音声合成用辞書登録変更部12により辞書中に書き込ま
れる。以上が従来の音声合成装置の動作例である。
一般に合成技術では音声品質もさることなから正読率が
重要なファクターになる。この正続率を高く保つために
は、辞書を増大させることが最も効果的である。しかし
ながら辞書のサイズは装置コストとの兼ね合から拡張が
難しいのが現状である。そこで実際には、ユーザーが頻
繁に使用する単語で誤りのあるものを新規登録すること
により全体の正続率を高く保つことが唯一の対処方法で
ある。また、既に登録済みの単語で発音やアクセントが
正しくないものについても同様に辞書の変更をすること
が重要である。
従って、音声合成装置には合成する機能以外に辞書の登
録変更を行う機能が必要不可欠である。
発明が解決しようとする課題 しかるに上記に示したような従来の手法では、ユーザー
が音声合成用辞書を登録あるいは変更したい場合、思い
どうりの発音をさせるためにユーザー自身が発音記号や
品詞コード等を正しく入力しなければならない。このこ
とはユーザーが発音記号等に対して何らかの知識を要求
されることになりマンマシンインターフェースとしては
好ましいことではない。特に英語などの外来単語を登録
する場合、発音記号の表記を正しく表すことは通常のユ
ーザーにとってかなり難しい。また、常にキーボード等
の入力装置が必要であることもユーザーにとっては制限
を科せられることになる。
音声合成技術の究極の目的は音声を用いた自然なマンマ
シンインタフェースを提供することである。従ってその
使用法は誰に対しても極めて容易でかつ自然に行えなく
てはならない。音声合成装置の場合、合成音を出力する
という点ではその品質が最も重要であるのは言うまでも
ない。それ以外の点で重要なのは装置のモードを変更し
たり内部の辞書に変更を加える場合の容易さである。こ
の操作がユーザーに負担を与えるようではマンマシンイ
ンタフェースとして不適切である。
本発明は、かかる点に鑑み、音声認識機能を付加するこ
とにより辞書変更などの機能が容易に行える音声規則合
成装置を提供することを目的とする。
課題を解決するための手段 本発明は、テキストの情報を入力できるテキスト入力部
と、上記テキスト入力部から出力されるテキスト記号列
を発音記号列やアクセント記号列や構文情報等に変換す
る言語処理部と、上記言語処理部に接続されて音声合成
に必要な発音記号情報やアクセント情報などを持つ音声
合成用辞書と、音声情報を電気信号等に変換して入力で
きる音声入力部と、上記音声入力部からの情報をもとに
音声認識し入力された音声の発音記号列やアクセント情
報等を抽出する音声認識部と、上記音声認識部からの出
力をもとに上記音声合成用辞書を更新したり新たな項目
を登録する音声合成用辞書登録更新部と、上記言語処理
部から出力される発音記号列やアクセント記号列や構文
情報等から入力テキストに対応した音声の特徴パラメー
タに変換する音響処理部と、上記音響処理部から出力さ
れる音声の特徴パラメータを音声信号に変換する音声合
成部と、上記音声合成部から出力される音声信号を音声
に変換する電気音響変換部とを用いるものである。
作用 本発明は、上記手段を用いることにより例えば音声合成
用辞書を変更あるいは新たに登録したい場合、ユーザー
は通常入力が煩わしい発音記号やアクセント情報などを
音声認識装置を用いて自動的に入力できるので、ユーザ
ーの負担が軽減でき操作性の向上が図れる。特に複雑な
発音の外来語においては発音記号が自動的に記述される
ことは一層効果的である。さらにすべての必要な情報を
音声認識を用いて入力すれば上記変更や登録のためのキ
ーボード等の入力手段は不要になる。
実施例 以下に、本発明の実施例について図面を参照しながら説
明する。
第1図は、本発明の一実施例に於ける音声合成装置の構
成を示すブロック図である。同図に於て、後述するよう
に、1はテキスト入力部、2は言語処理部、3は音響処
理部、4は音声合成部、5は音声合成用辞書、6は音声
合成用登録変更部、7は音声認識部、8は音声入力部で
ある。
上記のように構成された本発明の実施例の音声合成装置
について以下その動作を説明する。
合成しようとするテキスト情報はASCII等の文字コ
ードの形態でテキスト入力部1に入力される。テキスト
入力部1は外部機器とのインタフェースとしての機能を
持ち、送られてきた文字コードデータを言語処理部2に
取り込む。次に、言語処理部3で入力テキストを1)単
語や文節に分割し、それぞれに読み、アクセント、品詞
情報などを付与する。2)記号や数詞等の処理、読みの
選択、変更(連濁等)を行う。3)複合単語や文節のア
クセント型を決定する。4)構文解析を行い自然な音声
の合成に必要な構文情報を得る、等の一連の処理を行う
。これらの処理が終了した時点で発音記号や構文情報等
の出力データを音響処理部3に送る。音響処理部3は、
上記の言語処理部からの出力データに1)ポーズ位置や
ポーズ長の決定、音韻変形処理(母音の無声化等)。2
)各音韻の持続時間長の決定。3)イントネーシ日ン(
基本周波数)の決定。4)調音結合による音素や音韻の
変形処理。5)音声合成部用バラメー夕の生成、等の一
連の処理を行う。これらの処理が終了した時点で合成用
パラメータ等の出力データを音声合成部4に送りだす。
このようにして生成された音声合成部用パラメータによ
り音声合成部4がリアルタイムで所望の音声信号を合成
する。
次に、音声合成用辞書5の登録作業について説明する。
先ず、合成装置を通常のモードから辞書登録モードに切
り替える。このモード切り替えにはテキスト入力部1か
らのコマンドや電気的なスイッチあるいは音声入力部8
からのコマンドなどが切り替える手段として使用できる
。このとき音声合成郎4により例えば、 「辞書登録モ
ードに入りました。ご希望の単語を入力して下さい。」
というようなメッセージが出力される。上記のいずれか
の手段でモードを切り替えた後、新規登録したい単語の
見出し情報をテキスト入力部1を通じて入力する。入力
された見出し情報は音声合成用辞書登録変更部6に送ら
れる。同時に音声合成部4より発音記号やアクセント情
報を得るためにユーザーにその単語の発声を促すメッセ
ージを合成音で出力する。例えば、「その単語を発声し
て下さい。」等である。ユーザーがこのメッセージに従
って発声することにより音声入力部8がその音声を電気
信号に変換し、音声認識部7がその信号を分析認識し発
音記号列とアクセント情報およびその他の辞書に必要な
情報を抽出する。抽出されたこれらの情報は音声合成用
辞書登録変更部6に送られる。この登録変更部6は先ほ
ど入力された見出し情報と共にこれらの発音記号情報な
どを音声合成用辞書5に格納する。この後、辞書項目が
正しく登録されたことをユーザーに確認させるために音
声合成郎4により新しく登録された単語の合成音が出力
される。
さらに、上記の見出し情報をも音声で入力する例を説明
する。上記の例で見出し情報は通常JISコードなどの
コード情報として取り扱われるので、このコード情報を
音声入力部8および音声認識部7で数字として認識する
ことによりテキスト入力部1を用いることなく入力でき
る。例えば「愛」という字であればそのJISコードは
1θ進形式で3028である。従って、この数字を音声
で読み上げることにより、 「愛」という文字が入力で
きる。
以上の例は音声合成用辞書に単語を新規登録する場合で
あるが、全く間様の操作を辞書の変更の場合にも用いる
ことができる。
発明の効果 以上、説明したように本発明によれば、音声合成装置に
音声認識手段を付加することにより音声合成用辞書を変
更あるいは新たに登録する場合、ユーザーは通常入力が
煩わしい発音記号やアクセント情報などをいちいち調べ
る必要がなく発声するだけで音声認識装置を用いて自動
的に入力できるので、ユーザーの負担が軽減でき操作性
の向上が図れ、かつ、通常の場合入力が難しいアクセン
ト情報なども正確に入力できる。さらにすべての必要な
情報を音声認識を用いて入力すれば上記変更や登録のた
めのキーボード等の入力手段は不要になるのでユーザ.
一の使用上においてキーボードを常に用意しなければな
らないといった制約がなくなる。これらの理由によりそ
の実用的効果は大きい。
【図面の簡単な説明】
第1図は本発明による音声合成装置のブロック図、第2
図は従来例の音声合成装置のブロック図である。 1、9●●●テキスト入力部、2、10●●●言語処理
部、3、13●●●音響処理部、4、14●●●音声合
成部、5、l1●●●音声合成用辞書、6、l2●拳●
音声合成用辞書登録変更部、7●●●音声認識部、8壷
●●音声入力部。 代理人の氏名 弁理士 栗野重孝はか1名箒1図 テ午スト 番辰膏声

Claims (1)

    【特許請求の範囲】
  1. テキストの情報を入力できるテキスト入力部と、前記テ
    キスト入力部から出力されるテキスト記号列を発音記号
    列やアクセント記号列や構文情報等に変換して言語を処
    理する言語処理部と、前記言語処理部に接続されこれら
    の一連の処理に必要な辞書情報を持つ音声合成用辞書と
    、音声情報を電気信号等に変換して入力できる音声入力
    部と、前記音声入力部からの情報をもとに音声認識し入
    力された音声の発音記号列やアクセント情報等を抽出す
    る音声認識部と、前記音声認識部からの出力をもとに前
    記音声合成用辞書を変更したり新たな項目を登録する音
    声合成用辞書登録変更部と、前記言語処理部から出力さ
    れる発音記号列やアクセント記号列や構文情報等から入
    力テキストに対応した音声の特徴パラメータに変換する
    音響処理部と、前記音響処理部から出力される音声の特
    徴パラメータを音声信号に変換する音声合成部とを具備
    することを特徴とする音声合成装置。
JP1059922A 1989-03-13 1989-03-13 音声合成装置 Pending JPH02238494A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1059922A JPH02238494A (ja) 1989-03-13 1989-03-13 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1059922A JPH02238494A (ja) 1989-03-13 1989-03-13 音声合成装置

Publications (1)

Publication Number Publication Date
JPH02238494A true JPH02238494A (ja) 1990-09-20

Family

ID=13127108

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1059922A Pending JPH02238494A (ja) 1989-03-13 1989-03-13 音声合成装置

Country Status (1)

Country Link
JP (1) JPH02238494A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012063542A (ja) * 2010-09-15 2012-03-29 Toshiba Corp 文章提示装置、文章提示方法及びプログラム
WO2013102954A1 (ja) * 2012-01-06 2013-07-11 パナソニック株式会社 放送受信装置および音声辞書構築処理方法
JP2014215396A (ja) * 2013-04-24 2014-11-17 日本電信電話株式会社 発音付与方法とその装置とプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012063542A (ja) * 2010-09-15 2012-03-29 Toshiba Corp 文章提示装置、文章提示方法及びプログラム
US8655664B2 (en) 2010-09-15 2014-02-18 Kabushiki Kaisha Toshiba Text presentation apparatus, text presentation method, and computer program product
WO2013102954A1 (ja) * 2012-01-06 2013-07-11 パナソニック株式会社 放送受信装置および音声辞書構築処理方法
JP2014215396A (ja) * 2013-04-24 2014-11-17 日本電信電話株式会社 発音付与方法とその装置とプログラム

Similar Documents

Publication Publication Date Title
US6952665B1 (en) Translating apparatus and method, and recording medium used therewith
KR101120710B1 (ko) 텍스트 처리 시스템 및 방법과, 컴퓨터 판독 가능 저장 매체
KR100769029B1 (ko) 다언어의 이름들의 음성 인식을 위한 방법 및 시스템
US20030154080A1 (en) Method and apparatus for modification of audio input to a data processing system
JPH0916602A (ja) 翻訳装置および翻訳方法
WO2000058943A1 (fr) Systeme et procede de synthese de la parole
KR20150014235A (ko) 자동 통역 장치 및 방법
JPH02238494A (ja) 音声合成装置
KR20000063774A (ko) 음성합성을 이용하여 문자를 음성으로 변환하는 방법 및 그 단말기
JP2002268680A (ja) 悪環境下でのキーパッド/音声を用いたハイブリッドな東洋文字認識技術
JP3576066B2 (ja) 音声合成システム、および音声合成方法
Ngugi et al. Swahili text-to-speech system
JP2001117752A (ja) 情報処理装置および情報処理方法、並びに記録媒体
JP2001117921A (ja) 翻訳装置および翻訳方法、並びに記録媒体
JPH0634175B2 (ja) 文章読上げ装置
Kaur et al. BUILDING AText-TO-SPEECH SYSTEM FOR PUNJABI LANGUAGE
JP2000047683A (ja) セグメンテーション補助装置及び媒体
JPH03217900A (ja) テキスト音声合成装置
Zitouni et al. OrienTel: speech-based interactive communication applications for the mediterranean and the Middle East
JPH0229797A (ja) テキスト音声変換装置
JPH09258776A (ja) 音声認識方法および音声認識装置、並びに翻訳方法および翻訳装置
JP4208819B2 (ja) 音声合成辞書登録方法および装置
JPH02240699A (ja) 音声合成装置
JPH1063292A (ja) 音声処理装置および音声処理方法
JPH07152392A (ja) 音声合成装置