JPH01266598A - 音声出力装置 - Google Patents

音声出力装置

Info

Publication number
JPH01266598A
JPH01266598A JP63096566A JP9656688A JPH01266598A JP H01266598 A JPH01266598 A JP H01266598A JP 63096566 A JP63096566 A JP 63096566A JP 9656688 A JP9656688 A JP 9656688A JP H01266598 A JPH01266598 A JP H01266598A
Authority
JP
Japan
Prior art keywords
output
speech
audio
alteration
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63096566A
Other languages
English (en)
Inventor
Masashi Katsumata
勝俣 雅司
Hisashi Nakada
中田 寿
Yutaka Muto
武藤 裕
Tsukasa Kawaoka
河岡 司
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP63096566A priority Critical patent/JPH01266598A/ja
Publication of JPH01266598A publication Critical patent/JPH01266598A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 「産業上の利用分野」 この発明は、合成音声の聞き直しのための音声再出力機
能を有する音声出力装置に関するものである。
「従来の技術」 音声出力では記録性がないため、以下の場合に聞き直し
のための音声再出力が必要となる。
■ 利用者が聞き漏らした場合 ■ 合成音声の品質が十分でなく開きとれなかった場合 第5図、第6図は従来技術に基づく音声出力装置の音声
再出力方法を示したものである。
第5図は応答型の再出力で、音声出力装置llからの音
声出力文13を聞き取れなかった時には、確認メツセー
ジ14に対して復唱要求の信号15を端末12から送信
する。復唱要求の信号としては、電話の場合、PB信号
、または音声「もう−度」等が用いられる。音声出力装
置は音声出力文13を最初からもう一度出力する。
第6図は割り込み型の再出力で、音声出力中に聞き取れ
ない部分があると、端末22から特定信号を送る。音声
出力装置21は現在出力中の音声出力文23を中止し、
文/段落等の先頭から音声出力を再開する。
第5図、第6図いずれの場合も、再出力が全く同じ条件
で繰り返されるだけなので、聞きもらしの場合は効果が
あるが、合成音声品質により聞き取れない場合は、何度
間いても理解できないことが多いという問題がある。
また音声出力装置には音声発声速度を変更できるものが
あるが、再出力要求と音声発声速度の変更は独立の機能
と考えて設計されており、再出力時にゆっくり聞くため
には、■出力速度を遅くする、■再出力を要求する、■
出力速度をもとに戻す、の3操作が必要となり、利用者
の操作性が悪い。
音声会話において相手が聞き取れない時は、■ゆっくり
区切って言う、■同音意義語等分かりにくい言葉は表現
を変える、等が有効であり、人間同志の会話でも無意識
に行われている。
この発明の目的は、端末利用者から合成音声の聞き直し
の要求を受けたときに、出力音声を変更して再出力する
ことにより、従来の単純再出力に比べて、了解性、操作
性の改善された音声出力装置を提供することである。
「課題を解決するための手段」 この発明は合成音声の再出力時に、出力音声を変更する
ことを最も大きな特徴とする。従来の技術とは、再出力
要求時に、出力音声を変更する手段をもつことが異なる
「実施例」 音声合成方式には、■規則合成方式、■分析合成方式が
ある。■は音声品質は良いが生成できる文が限定される
。逆に■は任意の文を音声出力できるが音声品質は劣る
。この発明はいずれのケースにも適用できるが、合成音
質の点から聞き直しが有効と考える規則合成方式の場合
について説明する。
〔実施例1〕 第1図は第1の実施例を説明するための図であり、31
が音声出力装置、32が端末、33が音声出力用信号線
、34が音声出力制御用信号線である。音声出力装置3
1は大きく分けて、音声出力機構40と信号受信機構3
9から構成される。
入力日本文(漢字かな混じり文)は音声文作成機構35
で単語分割処理(行程351)、単語読み処理(行程3
52)、韻律処理(行程353)が行われアクセント付
きカナ情報に変換され、音声出力文記憶域36に格納さ
れる。
音声出力制御機構37はアクセント付きカナ情報を音声
合成機構38に転送し音声出力を指示する。音声合成機
構38はアクセント付きカナ情報から韻律パラメータ、
音声パラメータを生成し、音声を合成して信号線33経
由で端末32に送る。
端末利用者が聞き直しのため端末から再出力要求を信号
線34を経由して送信すると、信号受信機構39がこれ
を検出し、信号種別を音声出力制御機構37に通知する
音声出力制御機構37の信号解析部371では再出力要
求信号であれば、再出力処理部372を起動する。なお
、信号種別には再出力以外に音声の停止/再開、音声出
力スキップ等があり、それに対応した処理部が起動され
るがこの発明には直接関係しないので省略する。
再出力部372では、最初に出力音声変更要否判定部3
721で変更要否を判定し、変更要であれば、変更再出
力処理部3723、変更不要であれば、そのまま単純再
出力処理部3722を起動する。変更要否は、例えば以
下のようにして行うことができる。
a)−足回数(0回を含む)以上、単純再出力が繰り返
されたら変更要とする b)単純再出力と変更再出力で信号を別にする(例:P
Bボタンを区別) 変更再出力処理部3723では■音声出力文記憶域36
にあるアクセント付きカナ情報を変更する、■音声合成
機構38の音声合成条件(音声発声速度の変更、音量等
)を変更する、のいずれか又は双方の処理を行った後、
音声出力文の再出力を行う。上記■、■の処理部は変更
方法に応じて作成すればよく、変更方法の実現例を実施
例2〜4に示す。なお、割り込み型の再出力要求の場合
は、音声が出力されているのでその音声の出力を中止し
てから再出力を行う。
以上述べたように、再出力方法の変更要否の判定部、変
更再出力処理部を設けることにより、利用者からの再出
力要求を受信した時に出力音声を変更することができ、
単純に再出力する従来装置に比べて利用者の了解性をあ
げることができる。
なお、信号線33.34は共用してもよく、電話がこの
例にあたる。共用した時には、音声出力中に再出力要求
(割り込み型)を受けようとするすると、出力音声が信
号受信機構に回り込むため誤動作(PBボタンを押下し
ないときにもPB音を誤検出してしまうこと)が発生す
る危険性がある。これについては、0周波数フィルター
を用いる、■誤動作しにくいPBを使用する、等の既存
技術で解決される。
〔実施例2〕 第2図は第2の実施例を説明するための図であり、第1
図の変更再出力部3723の処理フローを記述したもの
である。
音声出力文記憶域にあるアクセント付きカナ情報の具体
例を41に、その−船形式を42に示す。
1文のアクセント付きカナ情報は、アクセントを付与す
る単位であるアクセント句情報421 (複数個)と文
末境界情報422から構成される。アクセント句情報は
音韻情報421) (読みを表すカナ)アクセント句境
界情14212 (ポーズ有無等)、アクセント型42
13から成る。アクセント句境界情報は、アクセント旬
間の結合の強さに応じて、■ポーズを伴う境界、■弱結
合、■強結合等の区別があり、■の場合はポーズ長も指
定される。アクセント型には、日本語の場合、0〜n型
(n=モーラ数)がある(古井著「ディジタル音声処理
」p。
143、東海大学出版会および研究実用化報告第35巻
第2号「日本文音声出力システムjp、147、p、 
183、日本電信電話株式会社研究開発本部)。
この発明の場合、アクセント句境界情報、アクセント型
の具体値は直接関係しないので以下の記号を用いて説明
する。
アクセント句境界情報 Pm:ポーズを伴う境界、ポーズ長==mPO:ポーズ
を伴わない境界(強結合、弱結合など) アクセント型 Ai二単語iのアクセント型(0〜n型)変更再出力部
では音声出力文記憶域のアクセント付きカナ情報をサー
チし、アクセント句境界情報を検出する(行程401)
、これは41に示したように音韻情報のカナコードとは
別のコード(“/′等)を使用することにより可能であ
る。
次にアクセント句境界情報からポーズ有無を判定しく行
程402)、ポーズ有(Pm)の場合はポーズ長を大き
い値に変更する(行程403)、またポーズ無(PO)
の場合はポーズ有に変更し、ポーズ長を設定する(行程
404)。
以上の処理により各アクセント旬間にポーズが挿入され
るので音声出力は1語1語区切って出力されることにな
り、続けて音声出力されて聞きづらい部分の了解度を上
げることができる。
なお、人間がゆっくり話す時は、発声速度とポーズの量
の2つが変化するが、ポーズの量の増加が大部分を占め
るとの実験報告がある(古井著[ディジタル音声処理j
 p、 18、東海大学出版会。
従って、この実施例によるポーズ回数、ポーズ長の変更
は、相手が聞き取れないときに人間がゆっくり言い直す
ときの特性を類領した自然な方法と言える。
〔実施例3〕 第3図は第3の実施例を説明する図であり、第1図の変
更再出力部3723の処理フローである。変更再出力部
は再出力要求を受けると、音声発声速度の変更(遅くす
る)を音声合成機構に指示する(行程51)、音声合成
機構における音声発声速度の変更はフレーム周期(音声
パラメータの更新周期で音声合成に於ける基本処理局!
tll)を変更することで可能である。その後、音声出
力文記憶域のアクセント付きカナ情報を音声合成機構に
送信し音声再出力する(行程52)。音声再出力終了後
、音声発声速度を元に戻す指示を音声合成機構に送信す
る(行程53)。
以上の処理を行えば、通常は標準速度で聞き、聞き取り
にくい部分の再出力のみ発声速度を遅く) し、ゆっく
り聞くことが可能となる。
〔実施例4〕 第4図は第4の実施例を説明するための図であり、音声
文作成機構61、音声出力文記憶域62、音声出力制御
機構63、変更再出力処理64はそれぞれ第1図の35
. 36. 37.3723に対応するものである、こ
の実施例では、音声文作成用辞書610に通常の読みデ
ータ61)に加えて、言い替えデータ612を登録して
おく、音声文作成機構61では辞書610を用いて単語
分割処理を行′−5際、言い替え表現が登録されていれ
ば言い替え表示ID(第4図、6221)をその単語の
前に付加する。単語読み処理では言い替え表示[Dがあ
る単語に対しては、音声出力文記憶域62の言い替え情
報域623に、■言い替え表示ID、■通常読みデータ
、■言い替えデータを書き込む。
■、■については辞書610に登録されているその単語
の通常読みデータ61)、言い替えデークロ12からコ
ピーすればよい、韻律処理では、言い替え表示IDがあ
る場合にはその単語の音韻情報の直前に言い替え表示I
Dを挿入してアクセント付きカナ情報624を作成する
音声出力制御機構63では、最初の音声出力ではアクセ
ント付きカナ情軸624から言い替え表示IDを削除し
て音声合成が可能な形に変換してから音声合成機構に送
り、音声合成を指示する。
再出力要求時は、変更再出力処理部64が以下の手順で
表現を変える。
音声出力文記憶域62のアクセント付きカナ624に言
い替え表示IDがあるかチエ7りしく行程641)、あ
れば言い替え挿入処理を起動し、なければ行程643に
進み、そのアクセント付きカナを音声合成機構に送り音
声出力する。言い替え挿入処理(行程642)では、言
い替え表示[Dのある単語の前にアクセント句情報があ
れば、そのアクセント句境界情報をポーズ有にする(行
程6421) 、次に、言い替え情報域623から表現
IDの一致するものを探し、それに対応する言い替えデ
ータ欄の音韻情報、アクセント型を読みだす。第4図の
例では、アクセント付きカナ624の言い替え表示ID
は「Hl」であり、言い替え情報域の「Hl」に対応す
る言い替えデータ欄の音韻、アクセント型は「バケガク
」、rA2Jである。この読みだした情報をポーズ有の
アクセント句情報(第4図、651)として挿入する(
行程6422)。次に予め用意しておいた挿入用言い回
しく第4図では「即ち」)のアクセント句情報をポーズ
有で挿入する(行程6423) 。
以上の処理により言い替え表示IDの付加された単語に
対し、言い替えが挿入されたアクセント付きカナ情報6
5が作成される。これを音声合成機構に送り、音声出力
をI指示する(行程643)。
以上により再出力音声文は次のように言い替えられ、了
解性が向上する。
a)i!iiノシンポ(化学/科学)−バケガク、スナ
フチ、カガクノシンポ b)Iニヱガアル(硬度/高度)→カタサ、スナフチ、
コードガアル また、再出力時のみ変更されるので、始めから全部解か
りやすい表現に変えてしまう方式に比べ以下のメリット
がある。
■リプレースされる単語のニュアンスの違いにより原文
の文意を1員なうことが少ない。
■利用者が前後関係等から理解している単語についてま
で挿入説明が行われる過剰親切がない。
「発明の効果」 以上述べたように合成音声が聞きにくい部分を再出力す
る時、■ゆっくり発声する、■言い方を変える、など出
力条件を変更することが可能となるので、従来の単純再
出力方式に比較して、了解性、操作性を向上することが
できる。
【図面の簡単な説明】
第1図はこの発明の第1の実施例を示すブロック図、第
2図は第2の実施例を示し、ポーズ長とポーズ頻度の変
更を実現する時の変更再出力部の処理流れ図、第3図は
第3の実施例を示し、合成音声の発声速度変更を実現す
る時の変更再出力部の処理流れ図、第4図は第4の実施
例を示し、同音意義語など音声で聞きづらい表現の変更
例を示す図、第5図及び第6図はそれぞれ従来の音声出
力装置の音声再出力を示す図である。 特許出願人:日本電信電話株式会社

Claims (1)

    【特許請求の範囲】
  1. (1)音声を合成出力する手段と、その出力音声の再出
    力要求の信号を受信する手段から構成される音声出力装
    置において、 出力音声の再出力要求の信号を受信したとき、出力音声
    を変更する手段を設けたことを特徴とする音声出力装置
JP63096566A 1988-04-18 1988-04-18 音声出力装置 Pending JPH01266598A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63096566A JPH01266598A (ja) 1988-04-18 1988-04-18 音声出力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63096566A JPH01266598A (ja) 1988-04-18 1988-04-18 音声出力装置

Publications (1)

Publication Number Publication Date
JPH01266598A true JPH01266598A (ja) 1989-10-24

Family

ID=14168574

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63096566A Pending JPH01266598A (ja) 1988-04-18 1988-04-18 音声出力装置

Country Status (1)

Country Link
JP (1) JPH01266598A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000267687A (ja) * 1999-03-19 2000-09-29 Mitsubishi Electric Corp 音声応答装置
CN103151037A (zh) * 2011-09-27 2013-06-12 通用汽车有限责任公司 校正难以理解的合成语音

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000267687A (ja) * 1999-03-19 2000-09-29 Mitsubishi Electric Corp 音声応答装置
CN103151037A (zh) * 2011-09-27 2013-06-12 通用汽车有限责任公司 校正难以理解的合成语音

Similar Documents

Publication Publication Date Title
JP3224000B2 (ja) テキスト−音声変換システム
JP2000267687A (ja) 音声応答装置
Whitehead et al. Temporal characteristics of speech in simultaneous communication
JPH07129594A (ja) 自動通訳システム
Cutler Prosody in situations of communication: Salience and segmentation
JPH01266598A (ja) 音声出力装置
JP4979336B2 (ja) 音声出力装置
JPH08248993A (ja) 音韻時間長制御方法
JPH04167749A (ja) 音声応答装置
Schramm et al. A Brazilian Portuguese language corpus development
JPS5854400A (ja) 音声出力編集方式
Spiegel et al. Applying speech synthesis to user interfaces
JPS60188995A (ja) 文章発声方法
JPS59180728A (ja) 音声出力編集方式
Tatham et al. Speech synthesis in dialogue systems
JPH054676B2 (ja)
JPH01224797A (ja) 規則型音声合成装置
JP3090238B2 (ja) 合成音声ポーズ設定方法
JPH01224798A (ja) 規則型音声合成装置
JPH05224875A (ja) 音声規則合成装置
Kang et al. Canned speech for tactical voice message systems
Morton et al. Natural voice output in interactive information systems
JP2854652B2 (ja) 発話繰り返し機能付き語学用教育装置
JPH08248990A (ja) 音声合成装置
JPH09251373A (ja) 音声合成方法および音声合成装置