JPH03217900A - テキスト音声合成装置 - Google Patents
テキスト音声合成装置Info
- Publication number
- JPH03217900A JPH03217900A JP2014199A JP1419990A JPH03217900A JP H03217900 A JPH03217900 A JP H03217900A JP 2014199 A JP2014199 A JP 2014199A JP 1419990 A JP1419990 A JP 1419990A JP H03217900 A JPH03217900 A JP H03217900A
- Authority
- JP
- Japan
- Prior art keywords
- word
- section
- unknown word
- text
- control information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002194 synthesizing effect Effects 0.000 title 1
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 34
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 34
- 238000001514 detection method Methods 0.000 claims abstract description 13
- 230000005236 sound signal Effects 0.000 claims description 6
- 230000004044 response Effects 0.000 claims description 5
- 238000000034 method Methods 0.000 description 31
- 238000010586 diagram Methods 0.000 description 24
- 235000016496 Panda oleosa Nutrition 0.000 description 6
- 240000000220 Panda oleosa Species 0.000 description 6
- 230000006870 function Effects 0.000 description 3
- 238000001308 synthesis method Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 239000013256 coordination polymer Substances 0.000 description 1
- 238000010252 digital analysis Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(産業上の利用分野)
この発明は、テキスト音声合成装冒に関する。
(従来の技術)
従来より、規則合成方式の分野に属する音声合成方式と
してテキスト音声合成装冒があり、例えば文献「デイジ
タル音声処理」 (古井貞煕 著、東濁大学出版会、p
p134−148)に開示ざれている。
してテキスト音声合成装冒があり、例えば文献「デイジ
タル音声処理」 (古井貞煕 著、東濁大学出版会、p
p134−148)に開示ざれている。
この従来のテキスト音声合成装盲の概略を第2図を参照
して簡単に説明する。
して簡単に説明する。
従来のテキスト音声合成装置は、文章ファイル10と、
文章解析部12と、単語辞書14と、音声合成部16と
、合成音声出力部18とを具えでいる。
文章解析部12と、単語辞書14と、音声合成部16と
、合成音声出力部18とを具えでいる。
文章ファイル10には、日本語文章をテキストとして予
めファイルしてあり、単語辞書14には予め所要の単語
と、これら単語の読み、アクセント等を登録しでおく。
めファイルしてあり、単語辞書14には予め所要の単語
と、これら単語の読み、アクセント等を登録しでおく。
文章解析部12は、文章ファイル10からの読み出した
文章を、単語辞書14の登録単語と照合させながら、各
単語(ここでは、読み出し単語と称する)に分解しなか
ら、文章解析を行う。この照合は、単語の表記(単語名
)で行なわれ、この文章解析により、各読み出し単語に
読み、アクセント等の制御情報を生成して出力する。
文章を、単語辞書14の登録単語と照合させながら、各
単語(ここでは、読み出し単語と称する)に分解しなか
ら、文章解析を行う。この照合は、単語の表記(単語名
)で行なわれ、この文章解析により、各読み出し単語に
読み、アクセント等の制御情報を生成して出力する。
音声合成部16は、音声素片ファイル20と音声パラメ
ータ生成部22とを具えでいる。文章解析部12から音
声パラメータ生成部22に、読み出し単語に係る制御情
報が供給ざれると、音声パラメータ生成部22は音素片
ファイル20を譬照しなから、当該単語のピッチ、エネ
ルキー等の信号を生成して音声合成を行う。
ータ生成部22とを具えでいる。文章解析部12から音
声パラメータ生成部22に、読み出し単語に係る制御情
報が供給ざれると、音声パラメータ生成部22は音素片
ファイル20を譬照しなから、当該単語のピッチ、エネ
ルキー等の信号を生成して音声合成を行う。
この音声合成の結果はデイジタル信号として合成音声出
力部18に供給される。合成音声出力部18は、主とし
てフィルタ24とスビ一カ26とからなり、供給された
デイジタル信号はフィルタ24を通してアナログ信号と
してスビーカ26によりオペレータに向けて出力ざれる
。このようにしで、テキストの合成音声か出力ざれる。
力部18に供給される。合成音声出力部18は、主とし
てフィルタ24とスビ一カ26とからなり、供給された
デイジタル信号はフィルタ24を通してアナログ信号と
してスビーカ26によりオペレータに向けて出力ざれる
。このようにしで、テキストの合成音声か出力ざれる。
(発明か解決しようとする課題)
しかしなから、このような従来構成のテキスト合成音声
装置では、文書ファイルから読み出された文章を構成す
る単語中には例えば固有名詞や専門用語等の単語辞書に
登録ざれていない単語かあり、このような未知語が存在
しでいる場合には、文章解析部にあいて、この未知語に
対しでは、読みとかアクセントとかの制御情報を生成す
ることか出来ないため、文章解析はすすます、その読み
やアクセシト等は不明であり、従って、適切な合成音声
を合成音声出力部から発生させることが出来ない. そこで、この発明の目的は、上述した従来の問題点に鑑
み、文書ファイルから読み出ざれて文章を構成する単語
中に未知語が存在しでいる場合にも、音声入力により未
知語に該当する単語の表記およびその制御情報を単語辞
書に登録して当該単語の読み、或いは、読みとアクセン
トとか適切な合成音声を出力出来るようにしたテキスト
音声合成装置を提供することにある。
装置では、文書ファイルから読み出された文章を構成す
る単語中には例えば固有名詞や専門用語等の単語辞書に
登録ざれていない単語かあり、このような未知語が存在
しでいる場合には、文章解析部にあいて、この未知語に
対しでは、読みとかアクセントとかの制御情報を生成す
ることか出来ないため、文章解析はすすます、その読み
やアクセシト等は不明であり、従って、適切な合成音声
を合成音声出力部から発生させることが出来ない. そこで、この発明の目的は、上述した従来の問題点に鑑
み、文書ファイルから読み出ざれて文章を構成する単語
中に未知語が存在しでいる場合にも、音声入力により未
知語に該当する単語の表記およびその制御情報を単語辞
書に登録して当該単語の読み、或いは、読みとアクセン
トとか適切な合成音声を出力出来るようにしたテキスト
音声合成装置を提供することにある。
(課題を解決するための手段)
この目的の達成を図るため、この発明のテキスト音声合
成装置によれば、 日本語文章かテキストとしてファイルされた文章ファイ
ルと、 登録単語に加えて新たな単語を登録出来る単語辞書と、 文章ファイルからの読み出し単語と登録単語とを照合し
て該読み出し単語の制御情報を出力しおよび、読み出し
単語が未登録である場合に、この読み出し単語を未知語
として検出する文章解析部と、 この文章解析部から読み出し単語の制御情報に基づいて
音声合成を行う音声合成部と、音声合成の結果を出力す
る合成音声出力部と、未知語表示部と、 前述の未知語検出に応答してこの未知語表示部で表示さ
せるための制御部と、 未知語表示部で表示された未知語の制御情報の発声音声
を取り込む音声信号入力部と、前述の未知語検出に応答
して前述の制御部によって始動ざれ、前述の音声信号入
力部からの音声入力から前述の未知語に関する制御情報
を出力する音声認識部とを含み、 前述の制御情報を前述の制御部または音声認識部から前
述の単語辞書に登録することを特徴とする。
成装置によれば、 日本語文章かテキストとしてファイルされた文章ファイ
ルと、 登録単語に加えて新たな単語を登録出来る単語辞書と、 文章ファイルからの読み出し単語と登録単語とを照合し
て該読み出し単語の制御情報を出力しおよび、読み出し
単語が未登録である場合に、この読み出し単語を未知語
として検出する文章解析部と、 この文章解析部から読み出し単語の制御情報に基づいて
音声合成を行う音声合成部と、音声合成の結果を出力す
る合成音声出力部と、未知語表示部と、 前述の未知語検出に応答してこの未知語表示部で表示さ
せるための制御部と、 未知語表示部で表示された未知語の制御情報の発声音声
を取り込む音声信号入力部と、前述の未知語検出に応答
して前述の制御部によって始動ざれ、前述の音声信号入
力部からの音声入力から前述の未知語に関する制御情報
を出力する音声認識部とを含み、 前述の制御情報を前述の制御部または音声認識部から前
述の単語辞書に登録することを特徴とする。
この発明の実施に当り、前述の制御情報を単語の読みと
する場合には、音声認識部を単音節音声認識部とするの
か好ましい。
する場合には、音声認識部を単音節音声認識部とするの
か好ましい。
さらに、この発明の他の好適実施例によれば、制御情報
を単語の読みとアクセントとする場合には、音声認識部
を単音節・数字音声認識部とするのか良い。
を単語の読みとアクセントとする場合には、音声認識部
を単音節・数字音声認識部とするのか良い。
(作用)
上述したこの発明の構成によれば、文章解析部によって
、文章ファイルから日本語文章をテキストとしで読み込
み、この文章を単語に分解して単語辞書と照合する。そ
の結果、照合した読み出し単語か未知語であると検出さ
れた場合には、これに応答して制御部が文章解析部から
未知語を未知語表示部に送って表示させる.これと同時
に、制御部から音声認識部にもこれを始動する信号を送
る。
、文章ファイルから日本語文章をテキストとしで読み込
み、この文章を単語に分解して単語辞書と照合する。そ
の結果、照合した読み出し単語か未知語であると検出さ
れた場合には、これに応答して制御部が文章解析部から
未知語を未知語表示部に送って表示させる.これと同時
に、制御部から音声認識部にもこれを始動する信号を送
る。
この未知語の表示を見てオペレータが未知語を発声する
。未知語の発声音が音声信号入力部を経て音声認識部に
入る。この音声認識部では、入力された未知語の単語の
表記と、その読みやアクセント型等といった所要な制御
情報とを認識して登録データとして単語辞書へ登録する
.或いは又、認識された制御情報を制御部へ戻し、この
制御部から単語辞書へ制御部に格納されでいる単語の表
記と、この制御情報とを登録しても良い。
。未知語の発声音が音声信号入力部を経て音声認識部に
入る。この音声認識部では、入力された未知語の単語の
表記と、その読みやアクセント型等といった所要な制御
情報とを認識して登録データとして単語辞書へ登録する
.或いは又、認識された制御情報を制御部へ戻し、この
制御部から単語辞書へ制御部に格納されでいる単語の表
記と、この制御情報とを登録しても良い。
このように、この発明によれば、未知語であっても、オ
ベレークが未知語を発声することによって、その単語お
よびその所要の制御情報が単語辞書にその都度登録ざれ
で、登録直前までの未知語は単語辞1への登録された後
は、未知語ではなくなる。従って、未知語か登録処理さ
れた後は、同一の単語に再び遭遇しても、二度目以降は
、未知語としで検出されす、文章解析部にあいて通常の
既登録の単語と同様に読み出し単語と照合ざれて音声合
成に用いられる。
ベレークが未知語を発声することによって、その単語お
よびその所要の制御情報が単語辞書にその都度登録ざれ
で、登録直前までの未知語は単語辞1への登録された後
は、未知語ではなくなる。従って、未知語か登録処理さ
れた後は、同一の単語に再び遭遇しても、二度目以降は
、未知語としで検出されす、文章解析部にあいて通常の
既登録の単語と同様に読み出し単語と照合ざれて音声合
成に用いられる。
(実施例)
以下、図面を参照しで、この発明の実施例につき説明す
る。
る。
菓1図は、この発明のテキスト音声合成装置の構成の説
明に供するブロック図である.同図において、第2図に
示した構成成分と同一の名称を有する構成成分について
は、同一の符号を付けで示し、特に言及する場合を除き
、その詳細な説明を省略する。
明に供するブロック図である.同図において、第2図に
示した構成成分と同一の名称を有する構成成分について
は、同一の符号を付けで示し、特に言及する場合を除き
、その詳細な説明を省略する。
先ず、第1図に示したこの装百の構成、特に、その接続
間係を簡単に説明する。文章ファイル10は、適当なメ
モリ例えばディスクメモリて構成し、装百の始動により
、ここにテキストとしてファイルされた日本語文章を文
章解析部12で読み取る構成となっている。一方、単語
辞114を、予め登録済みの単語およびその読みやアク
セントやアクセントの位置等の制御情報に加えて、新た
な単語およびその読みやアクセントやアクセントの位M
等の新たな制御情報を登録出来る適当なメモリ例えばR
AM(ランダム・アクセス・メモリ)で構成してあり、
文章解析部12における照合処理のために登録単語や制
御情報か読み出し出来る構成となっている。
間係を簡単に説明する。文章ファイル10は、適当なメ
モリ例えばディスクメモリて構成し、装百の始動により
、ここにテキストとしてファイルされた日本語文章を文
章解析部12で読み取る構成となっている。一方、単語
辞114を、予め登録済みの単語およびその読みやアク
セントやアクセントの位置等の制御情報に加えて、新た
な単語およびその読みやアクセントやアクセントの位M
等の新たな制御情報を登録出来る適当なメモリ例えばR
AM(ランダム・アクセス・メモリ)で構成してあり、
文章解析部12における照合処理のために登録単語や制
御情報か読み出し出来る構成となっている。
文章解析部12から音声合成部16に読み出し単語の制
御情報を送り、これらに基づいた音声合成結果を合成音
声出力部16から合成音声出力部18に送り、これより
合成音声を発声させる構造となっている。
御情報を送り、これらに基づいた音声合成結果を合成音
声出力部16から合成音声出力部18に送り、これより
合成音声を発声させる構造となっている。
さらに、この発明の構成では、文章解析部12を制御部
30と接続して制御部30にその始動信号である未知語
検出信号と未知語とを送り、制御部30からの指令で未
知語表示部32て未知語を視覚表示させると共に、制御
部30から音声認識部34の始vJ信号を供給する構成
とする。
30と接続して制御部30にその始動信号である未知語
検出信号と未知語とを送り、制御部30からの指令で未
知語表示部32て未知語を視覚表示させると共に、制御
部30から音声認識部34の始vJ信号を供給する構成
とする。
この音声認識部34には、未知語表示部で表示された未
知語の発声音声を取り込む音声信号入力部36を設けて
あり、一方、この音声認識部34から単語辞書14へは
、音声信号入力部36に入力した発声音声の単語の表記
およびその制御情報を登録データとして送り、これに登
録する構成とする。
知語の発声音声を取り込む音声信号入力部36を設けて
あり、一方、この音声認識部34から単語辞書14へは
、音声信号入力部36に入力した発声音声の単語の表記
およびその制御情報を登録データとして送り、これに登
録する構成とする。
この発明の装言ては、文章解析部12、制御部30およ
び音声認識部34はCPU (中央処理装冒)で構成す
る。
び音声認識部34はCPU (中央処理装冒)で構成す
る。
藁3図は、文章解析部]2のCPUおよびその周辺のハ
ード構成を示すブロック図である。
ード構成を示すブロック図である。
文章解析部12の処理を行うCPU120をプログラム
ROM(リート・オシリ・メモリ)121、ワークRA
M122、単語辞書日AM14とのインタフェース12
3、制御部30の未知語検出信号の入力端子へ接続ざれ
でいる出力インタフェース124、音声合成部16の音
声バラメータ生成部22に接続ざれでいる出力インタフ
ェース125、文章ファイル10に接続ざれているディ
スクインタフェース126あよび制御部30の未知語入
力端子に接続ざれでいる出力インタフェース127に、
バス128を経て、それぞれ接続しである。プログラム
日○M12NこはCPU120を作動させる必要なプロ
グラムか格納し、ワーク日AM122fこは、CPU1
20の機能を寅行させるために必要な情報やその中間結
果等の一時記憶すべき情報を格納する。
ROM(リート・オシリ・メモリ)121、ワークRA
M122、単語辞書日AM14とのインタフェース12
3、制御部30の未知語検出信号の入力端子へ接続ざれ
でいる出力インタフェース124、音声合成部16の音
声バラメータ生成部22に接続ざれでいる出力インタフ
ェース125、文章ファイル10に接続ざれているディ
スクインタフェース126あよび制御部30の未知語入
力端子に接続ざれでいる出力インタフェース127に、
バス128を経て、それぞれ接続しである。プログラム
日○M12NこはCPU120を作動させる必要なプロ
グラムか格納し、ワーク日AM122fこは、CPU1
20の機能を寅行させるために必要な情報やその中間結
果等の一時記憶すべき情報を格納する。
同様に、第4図は、制御部30のCPUおよびその周辺
のハード構成を示すブロック図である。
のハード構成を示すブロック図である。
制御部30の処理を行うCPU130をプログラムRO
M131、ワークRAM132、文章解析部]2からの
未知語検出信号が入力される入力インタフェース133
、音声認識部34に接続ざれでいる出力インタフェース
134、文章解析部12からの未知語か入力ざれる入力
インタフェース135および未知語表示部32に接続ざ
れているどデオRAM136に、バス137を経て、そ
れぞれ接続しである。この場合にも、プログラム日OM
131にはCPU 1 30を作動させる必要なプログ
ラムか格納し、ワーク日AM1321こは、CPU 1
30の機能を実行させるために必要な情報やその中間
結果等の一時記憶すべき情報を格納し、また、ビデオR
AM 1 3 6には未知語表示部32で表示する未知
語の文字バタンを一時的に格納する。
M131、ワークRAM132、文章解析部]2からの
未知語検出信号が入力される入力インタフェース133
、音声認識部34に接続ざれでいる出力インタフェース
134、文章解析部12からの未知語か入力ざれる入力
インタフェース135および未知語表示部32に接続ざ
れているどデオRAM136に、バス137を経て、そ
れぞれ接続しである。この場合にも、プログラム日OM
131にはCPU 1 30を作動させる必要なプログ
ラムか格納し、ワーク日AM1321こは、CPU 1
30の機能を実行させるために必要な情報やその中間
結果等の一時記憶すべき情報を格納し、また、ビデオR
AM 1 3 6には未知語表示部32で表示する未知
語の文字バタンを一時的に格納する。
同様に、藁5図は、音声認識部34のCPUおよびその
周辺のハート構成を示すブロック図である。
周辺のハート構成を示すブロック図である。
音声認識部34の処理を行うCPU140をプログラム
日○M141、ワークRAM1.42、音声標準バタン
RAM143、制御部30から未知語の表記および始動
信号が入力ざれる入力インタフェース144、単語辞1
14へ未知語の登録データlFr登録するための出力イ
ンタフェース145を、バス149を経て、それぞれ接
続してある。また、このCPU 1 40には、音声信
号入力部36からの入力される発声音声の処理か出来る
ように、増幅器148、AD変換器147およびデ′イ
ジタル式の分析BPF(ハント・パス・フィルタ)14
6を経て供給された音声信号をバス149を通しでCP
U 1 40に送給出来る構成とする。尚、分析BPF
tアナログ式とする場合には、増幅器148とAD変換
器147との間に分析BPFを配冒すれば良い。
日○M141、ワークRAM1.42、音声標準バタン
RAM143、制御部30から未知語の表記および始動
信号が入力ざれる入力インタフェース144、単語辞1
14へ未知語の登録データlFr登録するための出力イ
ンタフェース145を、バス149を経て、それぞれ接
続してある。また、このCPU 1 40には、音声信
号入力部36からの入力される発声音声の処理か出来る
ように、増幅器148、AD変換器147およびデ′イ
ジタル式の分析BPF(ハント・パス・フィルタ)14
6を経て供給された音声信号をバス149を通しでCP
U 1 40に送給出来る構成とする。尚、分析BPF
tアナログ式とする場合には、増幅器148とAD変換
器147との間に分析BPFを配冒すれば良い。
この場合にも、プログラムROM141にはCPU 1
40を作vJざせる必要なプログラムを格納し、ワー
クRAM142には、CPU140の機能を実行させる
ために必要な情報やその中間結果および制御部30から
送られた未知語の表記等の一時記憶すべき情報を格納し
、また、音声標準バタンRAM143には単音節と数字
のBPF分析された音声バタンを標準バタンとして格納
しでおく。
40を作vJざせる必要なプログラムを格納し、ワー
クRAM142には、CPU140の機能を実行させる
ために必要な情報やその中間結果および制御部30から
送られた未知語の表記等の一時記憶すべき情報を格納し
、また、音声標準バタンRAM143には単音節と数字
のBPF分析された音声バタンを標準バタンとして格納
しでおく。
次に、第1図のブロック図および第6〜8図の動作フロ
ー%9照して、この発明の装置の動作につき説明する。
ー%9照して、この発明の装置の動作につき説明する。
尚、第6図は、文章解析部12の動作フローの例を示し
、第7図は、制御部30の動作フローの例を示しおよび
第8図は、音声認識部34の動作フローの例をそれぞれ
示す図である. 先ず、文章解析部12につき説明する。ここでの文解析
【こおいでは、本来は、構文レヘル、意味レヘルに立ち
入った解析が必要であるか、この実施例の説明では、一
例として単語分割レベル(形態素解析レベル)における
最長一致法につき説明する。
、第7図は、制御部30の動作フローの例を示しおよび
第8図は、音声認識部34の動作フローの例をそれぞれ
示す図である. 先ず、文章解析部12につき説明する。ここでの文解析
【こおいでは、本来は、構文レヘル、意味レヘルに立ち
入った解析が必要であるか、この実施例の説明では、一
例として単語分割レベル(形態素解析レベル)における
最長一致法につき説明する。
装置か動作を開始すると、文章解析部12は文章ファイ
ル10からテキストすなわち日本語文章を読み出す(ス
テップ1:以下、ステップをSで表わし、S1のように
記載する). 文章ファイル10から入力された日本語文章(漢字かな
混しつ文字列)は、先頭から順に単語に文解析ざれて、
先頭の単語から順に単語辞書]4中の登録単語とのマッ
チングが行われる。この文解析は、文章の先頭から逐次
単語辞書14の見出し語の文字列と照合を取る。複数個
の見出し語と照合が取れた場合には、そのうちで最も長
い語長の文字列を選び出す。このようにして、文章の読
みと、アクセント等の制御情報とを生成する。
ル10からテキストすなわち日本語文章を読み出す(ス
テップ1:以下、ステップをSで表わし、S1のように
記載する). 文章ファイル10から入力された日本語文章(漢字かな
混しつ文字列)は、先頭から順に単語に文解析ざれて、
先頭の単語から順に単語辞書]4中の登録単語とのマッ
チングが行われる。この文解析は、文章の先頭から逐次
単語辞書14の見出し語の文字列と照合を取る。複数個
の見出し語と照合が取れた場合には、そのうちで最も長
い語長の文字列を選び出す。このようにして、文章の読
みと、アクセント等の制御情報とを生成する。
このような文解析を行うため、先ず、文頭に文字ポイン
クを、セットする(S2)。次に、文字ポインタの指す
文字で始まる単語(読み出し単語)を辞114から取り
出す(S3).この読み出し単語が単語辞書14に登録
ざれている場合には(S4.)、長い単語から入力文字
列とマッチングを取る(S5)。
クを、セットする(S2)。次に、文字ポインタの指す
文字で始まる単語(読み出し単語)を辞114から取り
出す(S3).この読み出し単語が単語辞書14に登録
ざれている場合には(S4.)、長い単語から入力文字
列とマッチングを取る(S5)。
この最長一致法を用いた文解析では、文中のある位雪以
降、後に続く単語の候補がなくなった場合にはマッチン
グがとれない(S6).その場合には、バックトラック
する必要がある.従って、前の単語の長さたけ文字ポイ
ンタを戻しで(S7)、前の単語にさかのぼって別の候
補で再びマッチングをとりなおす(S5). マ・ンチングがとれた場合には(S6) 、前の単語と
の接続間係を調べ(88)、その接続間係の良否を調べ
る(S9)。接続間係が否(NG)である場合には、再
び、(S5)の処理まで戻り、(S9)までの処理を繰
り返し行う。接続間係が良(OK)である場合1こは(
S9).単語の長さたけ文字ポインタを進める(SIO
)。そして、一文章につきこの一連の処理か終了したか
を調べ(Sll)、終了しでいなければ、(S3)の処
理へ戻り、同様な処理(S3〜S11)を行って文章の
処理を行う。一文章の処理が終了しでいなければ(S1
2)、(S2)の処理に戻り、同様な処理(82〜S
1 2) 1Fr!り返し行い、文章解析部12の処理
を終了する。その結果は従来と同様に、音声合成部16
に送られて最終的にスビーカ26からアナログ信号とし
て出力される。
降、後に続く単語の候補がなくなった場合にはマッチン
グがとれない(S6).その場合には、バックトラック
する必要がある.従って、前の単語の長さたけ文字ポイ
ンタを戻しで(S7)、前の単語にさかのぼって別の候
補で再びマッチングをとりなおす(S5). マ・ンチングがとれた場合には(S6) 、前の単語と
の接続間係を調べ(88)、その接続間係の良否を調べ
る(S9)。接続間係が否(NG)である場合には、再
び、(S5)の処理まで戻り、(S9)までの処理を繰
り返し行う。接続間係が良(OK)である場合1こは(
S9).単語の長さたけ文字ポインタを進める(SIO
)。そして、一文章につきこの一連の処理か終了したか
を調べ(Sll)、終了しでいなければ、(S3)の処
理へ戻り、同様な処理(S3〜S11)を行って文章の
処理を行う。一文章の処理が終了しでいなければ(S1
2)、(S2)の処理に戻り、同様な処理(82〜S
1 2) 1Fr!り返し行い、文章解析部12の処理
を終了する。その結果は従来と同様に、音声合成部16
に送られて最終的にスビーカ26からアナログ信号とし
て出力される。
この文章解析部12の処理において、文章に未知語か含
まれでいる場合には、処理(S5)においで、単語辞I
F14から単語および制御情報を取り出せない。その場
合には、例えば字種の変化位Nを利用して、未知語を切
り出す(S131)。ここでは、字種は漢字、ひらがな
、カタカナ等であり、この手法は未知語があると判断さ
れた位璽から字種の変り目までを未知語として切り出す
.未知語が検出された稜は、次の単語の照合のため処理
(S 1 0)へ進み、この処理で単語の長さたけ文字
をポインタを進めて既に説明したように52から812
までの所要の処理を行う.上述したように、読み出した
単語か単語辞書14に登録ざれていない単語に遭遇して
未知語であると検出ざれると、この実施例では、その都
度、文章解析部12から未知語検出信号が制御部30へ
出力し、これに応答して制御部30によって文章解析部
12から未知語が読み取られる.次に、この制御部3o
の動作につき説明する.第7図は、この制御部の動作フ
ローの一例を示す図である。尚、ここで、一例として読
み出し単語「上野」が未知語であるとして説明する。
まれでいる場合には、処理(S5)においで、単語辞I
F14から単語および制御情報を取り出せない。その場
合には、例えば字種の変化位Nを利用して、未知語を切
り出す(S131)。ここでは、字種は漢字、ひらがな
、カタカナ等であり、この手法は未知語があると判断さ
れた位璽から字種の変り目までを未知語として切り出す
.未知語が検出された稜は、次の単語の照合のため処理
(S 1 0)へ進み、この処理で単語の長さたけ文字
をポインタを進めて既に説明したように52から812
までの所要の処理を行う.上述したように、読み出した
単語か単語辞書14に登録ざれていない単語に遭遇して
未知語であると検出ざれると、この実施例では、その都
度、文章解析部12から未知語検出信号が制御部30へ
出力し、これに応答して制御部30によって文章解析部
12から未知語が読み取られる.次に、この制御部3o
の動作につき説明する.第7図は、この制御部の動作フ
ローの一例を示す図である。尚、ここで、一例として読
み出し単語「上野」が未知語であるとして説明する。
制御部30の動作がスタートすると、先ず、未知語検出
信号の有無を調べる(S20)。未知語検出信号が無け
れば、この処理(S20)を繰り返し行う。未知語検出
信号が有れば、この未知語検出に応答して対応する未知
語の表記「上野」を文章解析部12から読み取る(S2
1)。続いて、当該未知語の文字パタンをビデオRAM
136を通して未知語表示部32に送出し(522)、
また、音声認識部34には動作開始指令を発する(S2
3)。そして、この制御部3oは、音声認識部34での
未知語「上野」の発声音声の認識とその単語の表記およ
び制御情報の単語辞書14への登録を終了したかどうか
の監視を行い(S24)、これらか終了すれば(S20
)に戻って次の未知語検出のための待機状態となる. 未知語表示部32て未知語「上野」が表示ざれかつ音声
認識部34が動作を開始すると、オペレータは、この表
示を見ながら、音声信号入力部36例えばマイクロホン
に向って、未知語「上野」の制御情報である読みとアク
セント型とを発声する.読みは、一音節毎に発声する.
この場合には、「ウ、工、ノ*セロ」と発声する。ここ
で、*はポーズを表わす.また、この例では、アクセン
ト型は「0型」であり、日本語では、モラ数かnの単語
では、最大n+1個のアクセントパターンしか存在しな
いので、この発明では、制御情報としては、読みとアク
セント型たけて十分である。
信号の有無を調べる(S20)。未知語検出信号が無け
れば、この処理(S20)を繰り返し行う。未知語検出
信号が有れば、この未知語検出に応答して対応する未知
語の表記「上野」を文章解析部12から読み取る(S2
1)。続いて、当該未知語の文字パタンをビデオRAM
136を通して未知語表示部32に送出し(522)、
また、音声認識部34には動作開始指令を発する(S2
3)。そして、この制御部3oは、音声認識部34での
未知語「上野」の発声音声の認識とその単語の表記およ
び制御情報の単語辞書14への登録を終了したかどうか
の監視を行い(S24)、これらか終了すれば(S20
)に戻って次の未知語検出のための待機状態となる. 未知語表示部32て未知語「上野」が表示ざれかつ音声
認識部34が動作を開始すると、オペレータは、この表
示を見ながら、音声信号入力部36例えばマイクロホン
に向って、未知語「上野」の制御情報である読みとアク
セント型とを発声する.読みは、一音節毎に発声する.
この場合には、「ウ、工、ノ*セロ」と発声する。ここ
で、*はポーズを表わす.また、この例では、アクセン
ト型は「0型」であり、日本語では、モラ数かnの単語
では、最大n+1個のアクセントパターンしか存在しな
いので、この発明では、制御情報としては、読みとアク
セント型たけて十分である。
上述した未知語に関する発声音声は、マイクロホン36
にて収集ざれて、この実施例では、未知語の読みとアク
セント型とを制御情報として音声認識部34に入力する
。
にて収集ざれて、この実施例では、未知語の読みとアク
セント型とを制御情報として音声認識部34に入力する
。
次に、この音声認識部34の動作につき説明する。この
実施例では、制御情報を読みとアクセシト型としている
ので、音声認識部34を単音節・数字音声認識部とする
。この場合、単音節認識部分で「上野」の読みの「ウエ
ノ」が単音節認識ざれて文字コード(ASCIIコード
)(カナコード)に変換ざれ、数字認識部分でアクセン
ト型の「ゼロ」が「0」という文字コード(ASCII
コード)に変換ざれる。
実施例では、制御情報を読みとアクセシト型としている
ので、音声認識部34を単音節・数字音声認識部とする
。この場合、単音節認識部分で「上野」の読みの「ウエ
ノ」が単音節認識ざれて文字コード(ASCIIコード
)(カナコード)に変換ざれ、数字認識部分でアクセン
ト型の「ゼロ」が「0」という文字コード(ASCII
コード)に変換ざれる。
第8図は、音声認識装冒34の動作フローの一例を示す
図である. 音声認識部34ては、認識処理をスタートして良いかど
うかのチェックか行われる(S30)。
図である. 音声認識部34ては、認識処理をスタートして良いかど
うかのチェックか行われる(S30)。
制御部30がら認識動作開始指令を受けると、認識処理
がスクートし、先ず、制御部30がら未知語の表記を入
力する(S31)。次いで単音節認識モードとなる。入
力音声を8PFで周波数分析する(S32).次に、パ
ワー等によって、音声の始端と終端(音声区間)を検出
し(S33)、予め登!!ざれている標準バクンどの時
間正規化マッチングを行う(S34)。この時間正規化
マ・ンチング法としては、DPマッチングが有効である
。すべての単音節標準バタンとの闇の類似度のうち、最
も大きな類似度を与える標準バタンのカテゴリ名を認識
結果として判定し(S35)、その認識結果を、一時、
ワークRAM142に格納する(S36)。続けて、単
音節発声がある場合には、(.!932)の処理に戻り
(S37)、ポーズが十分ある場合には、単音節認識モ
ードを終了し(S37)、未知語の表記および認識結果
を送出し(S38)、次の数字音声認識モートとなる. 数字音声認識モードでは、単音節音声認識モードの場合
と同様に、アクセント型「ゼロ」の周波数分析を行う(
S39)。続いて、その音声区間を検出し(S40)、
次いて、数字標準バタンとの時間正規化マッチングを行
う(541)。最も大きナ類似度を与える標準バタンの
カテゴリ名を認識結果としで判定し(S42)、その認
識結果を送出する(S43)。
がスクートし、先ず、制御部30がら未知語の表記を入
力する(S31)。次いで単音節認識モードとなる。入
力音声を8PFで周波数分析する(S32).次に、パ
ワー等によって、音声の始端と終端(音声区間)を検出
し(S33)、予め登!!ざれている標準バクンどの時
間正規化マッチングを行う(S34)。この時間正規化
マ・ンチング法としては、DPマッチングが有効である
。すべての単音節標準バタンとの闇の類似度のうち、最
も大きな類似度を与える標準バタンのカテゴリ名を認識
結果として判定し(S35)、その認識結果を、一時、
ワークRAM142に格納する(S36)。続けて、単
音節発声がある場合には、(.!932)の処理に戻り
(S37)、ポーズが十分ある場合には、単音節認識モ
ードを終了し(S37)、未知語の表記および認識結果
を送出し(S38)、次の数字音声認識モートとなる. 数字音声認識モードでは、単音節音声認識モードの場合
と同様に、アクセント型「ゼロ」の周波数分析を行う(
S39)。続いて、その音声区間を検出し(S40)、
次いて、数字標準バタンとの時間正規化マッチングを行
う(541)。最も大きナ類似度を与える標準バタンの
カテゴリ名を認識結果としで判定し(S42)、その認
識結果を送出する(S43)。
認識結果の送出が終了すると、(S30)に戻り、次の
未知語に対する処理の待機状態となる.以上の処理によ
り、音声認識部34から、未知語に関する制御情報すな
わち読みであるカナコードおよびアクセント型、および
未知語の表記が登録データとして単語辞書14に格納ざ
れる。
未知語に対する処理の待機状態となる.以上の処理によ
り、音声認識部34から、未知語に関する制御情報すな
わち読みであるカナコードおよびアクセント型、および
未知語の表記が登録データとして単語辞書14に格納ざ
れる。
上述した実施例では、音声認識部34では、未知語の制
御情報として、「読み」と「アクセント型」を認識して
単語辞書14に登録する例について説明したが、制御情
報として未知語の「読み」だけが必要である場合もある
。その場合には、音声認識部34を単音節音声認識モー
ドのみでの処理を行えるように構成すれば良く、数字音
声認識モートを必要としない。
御情報として、「読み」と「アクセント型」を認識して
単語辞書14に登録する例について説明したが、制御情
報として未知語の「読み」だけが必要である場合もある
。その場合には、音声認識部34を単音節音声認識モー
ドのみでの処理を行えるように構成すれば良く、数字音
声認識モートを必要としない。
また、上述した実施例では、オペレータの音声入力を単
音節と数字とをポーズで区切って各々の認識モートを切
り替えているが、この切り替えをスイッチi+用いで行
うように構成しても良い。
音節と数字とをポーズで区切って各々の認識モートを切
り替えているが、この切り替えをスイッチi+用いで行
うように構成しても良い。
また、上述した実施例では、認識対象か未知語であるか
ら、単語辞114に無いことによるが、当然ながら、性
能か許せば、単語単位の発声からカナ文字列に変模する
ように構成しても良い。
ら、単語辞114に無いことによるが、当然ながら、性
能か許せば、単語単位の発声からカナ文字列に変模する
ように構成しても良い。
上述した実施例では、単語の表記と制御情報を音声認識
部34から単語辞書14へ登録しでいるか、この制御情
報を制御部30へ戻し、制御部30からこの制御情報と
制御部301こ格納ざれている単語の表記とを単語辞書
14へ登録するように構成してもよい。
部34から単語辞書14へ登録しでいるか、この制御情
報を制御部30へ戻し、制御部30からこの制御情報と
制御部301こ格納ざれている単語の表記とを単語辞書
14へ登録するように構成してもよい。
以下、この制御部30がら単語の表記と制御情報とを登
録データとしで送出する場合のテキスト音声合成装1の
構成例につき説明する。
録データとしで送出する場合のテキスト音声合成装1の
構成例につき説明する。
菓9図は、この発明のテキスト音声合成装冒の他の実施
例を示すブロック図であり、第1図に示した実施例の構
成との相違点は、音声認識部34から制御情報を制御部
30に送り、この制御部30から未知語の単語の表記と
制御情報例えば「読み」と「アクセント型」とを登録テ
ータとして単語辞114に登録できるように構成した点
にある。その他の点は、第1図につき説明した実施例の
場合と同様な構成であるので、同一名称の部分には同一
番号を付してその重複説明を省略する。
例を示すブロック図であり、第1図に示した実施例の構
成との相違点は、音声認識部34から制御情報を制御部
30に送り、この制御部30から未知語の単語の表記と
制御情報例えば「読み」と「アクセント型」とを登録テ
ータとして単語辞114に登録できるように構成した点
にある。その他の点は、第1図につき説明した実施例の
場合と同様な構成であるので、同一名称の部分には同一
番号を付してその重複説明を省略する。
この実施例の構成であると、制御部30のハード構成は
、既に説明した第4図に示した制御部のハード構成とは
一部分構成が異なってくる。この実施例での制御部のハ
ード構成を第10図に示す。第10図において、第4図
と共通する部分についでは同一の符号を付してその重複
説明を省略する。第10図の構成では、第4図の■カイ
ンタフェース1340代わりに、音声認識部34との信
号のやり取りを行なうために必要な入出力インタフェー
ス2 1 0!設けると共に、制御部30のCPU 1
30から単語辞書14へ所要のデータを送出するため
に必要な出力インタフェース212を、バス137を経
て、CPU 1 30に追加して投続してある。
、既に説明した第4図に示した制御部のハード構成とは
一部分構成が異なってくる。この実施例での制御部のハ
ード構成を第10図に示す。第10図において、第4図
と共通する部分についでは同一の符号を付してその重複
説明を省略する。第10図の構成では、第4図の■カイ
ンタフェース1340代わりに、音声認識部34との信
号のやり取りを行なうために必要な入出力インタフェー
ス2 1 0!設けると共に、制御部30のCPU 1
30から単語辞書14へ所要のデータを送出するため
に必要な出力インタフェース212を、バス137を経
て、CPU 1 30に追加して投続してある。
また、同様に、この実施例の構成であると、音声認識部
34のハート構成も、既に説明した第5図に示したハー
ト構成と異なっており、この実施例でのハード構成を藁
11図に示す。この第11図に示す構成では、第5図に
示した出力イシタフェース145を除去した点および制
御部30と信号のやり取りを行なう入出力インタフェー
ス212を設けた点のみか相違し、その他の構成部分は
同一であるので、同一の符号を付して示し、その重複説
明を省略する。
34のハート構成も、既に説明した第5図に示したハー
ト構成と異なっており、この実施例でのハード構成を藁
11図に示す。この第11図に示す構成では、第5図に
示した出力イシタフェース145を除去した点および制
御部30と信号のやり取りを行なう入出力インタフェー
ス212を設けた点のみか相違し、その他の構成部分は
同一であるので、同一の符号を付して示し、その重複説
明を省略する。
次に、この実施例の動作につき説明するが、第1図の実
施例の動作と共通する部分の説明は重複するので省略す
る。
施例の動作と共通する部分の説明は重複するので省略す
る。
第12図は、M9図の構成例の場合の、音声認識部の動
作フローを示す図であり、既に説明した菓8図の動作フ
ローとの相違点は未知語の表記は制御部30に既に格納
ざれている情報を利用するため、制御部から未知語の表
記を入力する処理(S31:第8図)は必要ないこと、
単音節認識モートか終了した(S37)後であって、次
の数字音声認識モートに入る前に、単音節認識結果を制
御部30へ送出する処理を行なう(S50)こと、単音
節認識モードから数字音声認識モートへは第8図の33
8の処理とは異なり未知語の表記は送出しないことおよ
び数字音声認識モートでの認識結果を単語辞書14へて
はなく制御部30へ送出すること(S51)にある。こ
のように、構成すれば、音声認識部34を単音節認識モ
ートでの処理のみとして構成する場合はもとより、単音
節・数字認識モートでの処理の場合であっても、未知語
の制御情報を制御部30へ送出することか出来る。すな
わち『読み」のみの場合には処理(550)により、ま
た、「読み」と「アクセント型」の場合には、「読み」
は処理(S 5 0)によりまた「アクセント型」は処
理(S51)によりそれぞれ制御部30に送出される。
作フローを示す図であり、既に説明した菓8図の動作フ
ローとの相違点は未知語の表記は制御部30に既に格納
ざれている情報を利用するため、制御部から未知語の表
記を入力する処理(S31:第8図)は必要ないこと、
単音節認識モートか終了した(S37)後であって、次
の数字音声認識モートに入る前に、単音節認識結果を制
御部30へ送出する処理を行なう(S50)こと、単音
節認識モードから数字音声認識モートへは第8図の33
8の処理とは異なり未知語の表記は送出しないことおよ
び数字音声認識モートでの認識結果を単語辞書14へて
はなく制御部30へ送出すること(S51)にある。こ
のように、構成すれば、音声認識部34を単音節認識モ
ートでの処理のみとして構成する場合はもとより、単音
節・数字認識モートでの処理の場合であっても、未知語
の制御情報を制御部30へ送出することか出来る。すな
わち『読み」のみの場合には処理(550)により、ま
た、「読み」と「アクセント型」の場合には、「読み」
は処理(S 5 0)によりまた「アクセント型」は処
理(S51)によりそれぞれ制御部30に送出される。
その他の処理(S30、S32〜S37、S39〜S4
2)は、第8図につき説明した処理と同一であるので、
その説明を省略する。
2)は、第8図につき説明した処理と同一であるので、
その説明を省略する。
また、第13図は、第9図の構成例の場合の、制御部3
0の動作フローを示す図であり、この動作フローにおい
て、文章解析部12か未知語を検出し、制御部30の動
作かスタートした後音声認識部30の動作開始指令か音
声認識部34へ送出し終るまでの各処理(S20−82
3)は、既に説明した第7図に示した処理(820〜S
23)と同一の処理であるので、その説明を省略する。
0の動作フローを示す図であり、この動作フローにおい
て、文章解析部12か未知語を検出し、制御部30の動
作かスタートした後音声認識部30の動作開始指令か音
声認識部34へ送出し終るまでの各処理(S20−82
3)は、既に説明した第7図に示した処理(820〜S
23)と同一の処理であるので、その説明を省略する。
この第9図の構成にあける制御部30の場合には、前述
した音声認識部34の動作開始指令か送出された後、先
ず、音声認識部34での既に説明した所要の処理動作か
終了したかどうかを調へる(S52)。また、所要の処
理動作が終了しでいなければ、この処理を繰り返し行な
う。この所要の処理動作か終了していると判断すると(
S52)、音声認識部34に未知語の「読み」や「アク
セント型」の未知語の制御情報が生成されている。従っ
て、制御部30は、音声認識部34からこれらの所要の
制御情報をそのワークRAM132に読み込む(S54
)。この制御情報を読み込むと、処理(S21)で既に
文章解析部12から対応する未知語の単語の表記かワー
クRAM132に格納ざれているので、この未知語の表
記と、認識結果てある制御情報とを、登録データとしで
、単語辞書14へ送出し、単語辞書14への未知語登録
を終了する(S56)。そして、これか終了していれば
、処理(S20)へ戻って、次の未知語検出のための待
機状態となる。
した音声認識部34の動作開始指令か送出された後、先
ず、音声認識部34での既に説明した所要の処理動作か
終了したかどうかを調へる(S52)。また、所要の処
理動作が終了しでいなければ、この処理を繰り返し行な
う。この所要の処理動作か終了していると判断すると(
S52)、音声認識部34に未知語の「読み」や「アク
セント型」の未知語の制御情報が生成されている。従っ
て、制御部30は、音声認識部34からこれらの所要の
制御情報をそのワークRAM132に読み込む(S54
)。この制御情報を読み込むと、処理(S21)で既に
文章解析部12から対応する未知語の単語の表記かワー
クRAM132に格納ざれているので、この未知語の表
記と、認識結果てある制御情報とを、登録データとしで
、単語辞書14へ送出し、単語辞書14への未知語登録
を終了する(S56)。そして、これか終了していれば
、処理(S20)へ戻って、次の未知語検出のための待
機状態となる。
上述したように、第9図に示した構成例でも、未知語か
検出された場合に、単語辞書14に未知語の表記と、そ
の制御情報従って「読み」およびまたは「読み」と「ア
クセント型」とを登録できるので、登録後は、通常の登
録済みの単語として音声合成に寄与する。
検出された場合に、単語辞書14に未知語の表記と、そ
の制御情報従って「読み」およびまたは「読み」と「ア
クセント型」とを登録できるので、登録後は、通常の登
録済みの単語として音声合成に寄与する。
ざらに、上述した実施例では、未知語表示部32で未知
語を表示させた後に制御部30から音声認識部34へそ
の動作開始信号を送出する例につき説明したか、そうす
る代わりに、文章解析部12からの未知語検出信号を、
直接、音声認識部34へ送給してこれを始171させる
ように構成することも出来る。
語を表示させた後に制御部30から音声認識部34へそ
の動作開始信号を送出する例につき説明したか、そうす
る代わりに、文章解析部12からの未知語検出信号を、
直接、音声認識部34へ送給してこれを始171させる
ように構成することも出来る。
ざらに、上述した実施例では、未知語に遭遇する毎に合
成音声の出力を中断し、未知語処理を行っているか、以
下に説明するような手順で未知語処理を行っても良い。
成音声の出力を中断し、未知語処理を行っているか、以
下に説明するような手順で未知語処理を行っても良い。
与えられた日本語文章ファイル10を単語辞書14を参
照しなから文章解析部12において文章解析し、未知語
の存在を全ての日本語文章ファイル10中に渡って探索
する。もし、未知語かある場合には、全ての未知語を、
一旦、文章解析部12のワークRAM122に格納して
おき、探索終了後に、上述した実施例と同様にして未知
後検出信号を文章解析部12から制御部30へ送出する
。制御部30、未知語表示部32、音声信号入力部36
あよび音声認識部34によって、上述した実施例と同様
に、検出した未知語について順次に発声入力を行って、
その読みたけの認識或いは読みとアクセント型の認識を
行って、その結果を登録データとして単語辞書に登録す
る。
照しなから文章解析部12において文章解析し、未知語
の存在を全ての日本語文章ファイル10中に渡って探索
する。もし、未知語かある場合には、全ての未知語を、
一旦、文章解析部12のワークRAM122に格納して
おき、探索終了後に、上述した実施例と同様にして未知
後検出信号を文章解析部12から制御部30へ送出する
。制御部30、未知語表示部32、音声信号入力部36
あよび音声認識部34によって、上述した実施例と同様
に、検出した未知語について順次に発声入力を行って、
その読みたけの認識或いは読みとアクセント型の認識を
行って、その結果を登録データとして単語辞書に登録す
る。
上述した前者或いは後者のいすれの手順によって未知語
についで読みであるカナ文字列、或いは、読み(カナ文
字列)とアクセント型か単語辞114に登録され終った
後になって、始めで、音声合成部16か起動して合成出
力部18のスビーカ26から日本語文章の合成音声か出
力する。
についで読みであるカナ文字列、或いは、読み(カナ文
字列)とアクセント型か単語辞114に登録され終った
後になって、始めで、音声合成部16か起動して合成出
力部18のスビーカ26から日本語文章の合成音声か出
力する。
従って、上述した前者の手順に従って未知語処理を行う
場合には、未知語検出毎に合成音声の出力か中断ざれる
か、後者の手順で未知語処理を行う場合には、この合成
音声の出力は中断されることが無いという特色を有する
。
場合には、未知語検出毎に合成音声の出力か中断ざれる
か、後者の手順で未知語処理を行う場合には、この合成
音声の出力は中断されることが無いという特色を有する
。
(発明の効果)
上述した説明から明らかなように、この発明のテキスト
音声合成装置によれば、未知語か検出ざれると、当該未
知語を表示し、表示されたこの未知語の制御情報を発声
してこれらを音声認識部に入力することにり、単語辞書
に未知語に関する制御情報を確実に登録することか出来
る。従って、キーボートなどの操作入力部を必要としな
いので、千軒に未知語処理か出来る。そして、未知語処
理により単語辞書に未知語の制御情報が、旦、登録され
ると、同一語に再び遭遇しても、二度目以降は未知語と
は検出ざれないで、適切に合成音声を出力することか出
来るので、ユーザに使い勝手の良いテキスト音声合成装
冒となる。
音声合成装置によれば、未知語か検出ざれると、当該未
知語を表示し、表示されたこの未知語の制御情報を発声
してこれらを音声認識部に入力することにり、単語辞書
に未知語に関する制御情報を確実に登録することか出来
る。従って、キーボートなどの操作入力部を必要としな
いので、千軒に未知語処理か出来る。そして、未知語処
理により単語辞書に未知語の制御情報が、旦、登録され
ると、同一語に再び遭遇しても、二度目以降は未知語と
は検出ざれないで、適切に合成音声を出力することか出
来るので、ユーザに使い勝手の良いテキスト音声合成装
冒となる。
第1図は、この発明のテキスト音声合成装百の構成の一
実施例を示すブロック図、 第2図は、従来のテキスト音声合成装置の構成を示すプ
ロ・ンク図、 第3図は、この発明の説明に供する文章解析部のハート
構成の一例を示すブロック図、第4図は、この発明の第
1図に示した実施例の説明に供する制御部のハート構成
の一例を示すブロック図、 第5図は、この発明の第1図に示した実施例の説明に供
する音声認識部のハート構成の一例を示すブロック図、 第6図は、この発明の説明に供する文章解析部の動作フ
ローの一例を示す図、 第7図は、この発明の第1図に示した実施例の説明に供
する制御部の動作フローの一例を示す図、 第8図は、この発明の第1図に示した実施例の説明に供
する音声認識部の動作フローの一例を示す図、 第9図は、この発明のテキスト音声合成装置の構成の他
の実施例を示すブロック図、 第10図は、この発明の第9図に示した実施例の説明に
供する制御部のハート構成の一例を示すプロ・ンク図、 第11図は、この発明の第9図に示した実施例の説明に
供する音声認識部のハート構成の一例を示すブロック図
、 第12図は、この発明の第9図に示した実施例の説明に
供する音声認識部の動作フローの一例を示す図、 第13図は、この発明の第9図に示した実施例の説明に
供する制御部の動作フローの一例を示す図である。 10・・・文章ファイル、 12・・・文章解析部1
4・・・単語辞嘗、 16・・・音声合成部18
・・・合成音声出力部、20・・・音素片ファイル22
・・・音声パラメータ主成部 24・・・フィルタ、 26・・・スビーカ3o
・・・制御部、 32・・・未知語表示部34
・・・音声認識部、 36・・・音声信号入力部12
0、130、140・・・CPU 121、131、141・・・プログラムROM122
、132、142・・・ワーク日AM123・・・単語
辞1RAMインタフェース]24、125、127、1
34、145、212・・・出力イシタフェース 126・・・ディスクインタフェース ]33、135、144・・・入力インタフェース14
3・・・音声標準バタンRAM 146・・・分析BPF、 147・・・AD変換器
148・・・アンプ 210、212・・・入出力インタフェース。 特 許 出 顧 人 沖電気工業株式会社 16 音声合成部 18一合成音声出力部 36 音声信号入力部 この発明のテキスト音声合成装百のプロ・ンク図第1 128バス 文章解析部のハ ド横成 第3 図 第7 図 16 音声合成部 8 合成音声出力部 36 音声信号入力部 テキスト音声合成装曹の他の実施例のブロック図第9
実施例を示すブロック図、 第2図は、従来のテキスト音声合成装置の構成を示すプ
ロ・ンク図、 第3図は、この発明の説明に供する文章解析部のハート
構成の一例を示すブロック図、第4図は、この発明の第
1図に示した実施例の説明に供する制御部のハート構成
の一例を示すブロック図、 第5図は、この発明の第1図に示した実施例の説明に供
する音声認識部のハート構成の一例を示すブロック図、 第6図は、この発明の説明に供する文章解析部の動作フ
ローの一例を示す図、 第7図は、この発明の第1図に示した実施例の説明に供
する制御部の動作フローの一例を示す図、 第8図は、この発明の第1図に示した実施例の説明に供
する音声認識部の動作フローの一例を示す図、 第9図は、この発明のテキスト音声合成装置の構成の他
の実施例を示すブロック図、 第10図は、この発明の第9図に示した実施例の説明に
供する制御部のハート構成の一例を示すプロ・ンク図、 第11図は、この発明の第9図に示した実施例の説明に
供する音声認識部のハート構成の一例を示すブロック図
、 第12図は、この発明の第9図に示した実施例の説明に
供する音声認識部の動作フローの一例を示す図、 第13図は、この発明の第9図に示した実施例の説明に
供する制御部の動作フローの一例を示す図である。 10・・・文章ファイル、 12・・・文章解析部1
4・・・単語辞嘗、 16・・・音声合成部18
・・・合成音声出力部、20・・・音素片ファイル22
・・・音声パラメータ主成部 24・・・フィルタ、 26・・・スビーカ3o
・・・制御部、 32・・・未知語表示部34
・・・音声認識部、 36・・・音声信号入力部12
0、130、140・・・CPU 121、131、141・・・プログラムROM122
、132、142・・・ワーク日AM123・・・単語
辞1RAMインタフェース]24、125、127、1
34、145、212・・・出力イシタフェース 126・・・ディスクインタフェース ]33、135、144・・・入力インタフェース14
3・・・音声標準バタンRAM 146・・・分析BPF、 147・・・AD変換器
148・・・アンプ 210、212・・・入出力インタフェース。 特 許 出 顧 人 沖電気工業株式会社 16 音声合成部 18一合成音声出力部 36 音声信号入力部 この発明のテキスト音声合成装百のプロ・ンク図第1 128バス 文章解析部のハ ド横成 第3 図 第7 図 16 音声合成部 8 合成音声出力部 36 音声信号入力部 テキスト音声合成装曹の他の実施例のブロック図第9
Claims (3)
- (1)日本語文章がテキストとしてファイルされた文章
ファイルと、 登録単語に加えて新たな単語を登録出来る単語辞書と、 文章ファイルからの読み出し単語と登録単語とを照合し
て該読み出し単語の制御情報を出力しおよび、読み出し
単語が未登録である場合に、該読み出し単語を未知語と
して検出する文章解析部と、 該文章解析部からの読み出し単語の制御情報に基づいて
音声合成を行う音声合成部と、 音声合成の結果を出力する合成音声出力部と、未知語表
示部と、 前記未知語検出に応答して該未知語表示部で表示させる
ための制御部と、 未知語表示部で表示された未知語の制御情報の発声音声
を取り込む音声信号入力部と、 前記未知語検出に応答して前記制御部によって始動され
、前記音声信号入力部からの音声入力から前記未知語に
関する制御情報を出力する音声認識部と を含み、 前記制御情報を前記制御部または音声認識部から前記単
語辞書に登録することを特徴とするテキスト音声合成装
置。 - (2)請求項1のテキスト音声合成装置において、前記
制御情報を単語の読みとする場合には、前記音声認識部
を単音節音声認識部とすることを特徴とするテキスト音
声合成装置。 - (3)請求項1のテキスト音声合成装置において、前記
制御情報を単語の読みとアクセントとする場合には、前
記音声認識部を単音節・数字音声認識部とすることを特
徴とするテキスト音声合成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014199A JPH03217900A (ja) | 1990-01-24 | 1990-01-24 | テキスト音声合成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014199A JPH03217900A (ja) | 1990-01-24 | 1990-01-24 | テキスト音声合成装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH03217900A true JPH03217900A (ja) | 1991-09-25 |
Family
ID=11854446
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014199A Pending JPH03217900A (ja) | 1990-01-24 | 1990-01-24 | テキスト音声合成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH03217900A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004271728A (ja) * | 2003-03-06 | 2004-09-30 | Seiko Epson Corp | 音声データ提供システムならびに音声データ作成装置および音声データ作成プログラム |
JP2009217846A (ja) * | 2009-06-23 | 2009-09-24 | Seiko Epson Corp | 音声データ作成装置および音声データ作成方法 |
JP2012063542A (ja) * | 2010-09-15 | 2012-03-29 | Toshiba Corp | 文章提示装置、文章提示方法及びプログラム |
JP2021529338A (ja) * | 2018-04-27 | 2021-10-28 | エル ソルー カンパニー, リミテッドLlsollu Co., Ltd. | 発音辞書生成方法及びそのための装置 |
-
1990
- 1990-01-24 JP JP2014199A patent/JPH03217900A/ja active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004271728A (ja) * | 2003-03-06 | 2004-09-30 | Seiko Epson Corp | 音声データ提供システムならびに音声データ作成装置および音声データ作成プログラム |
JP2009217846A (ja) * | 2009-06-23 | 2009-09-24 | Seiko Epson Corp | 音声データ作成装置および音声データ作成方法 |
JP2012063542A (ja) * | 2010-09-15 | 2012-03-29 | Toshiba Corp | 文章提示装置、文章提示方法及びプログラム |
US8655664B2 (en) | 2010-09-15 | 2014-02-18 | Kabushiki Kaisha Toshiba | Text presentation apparatus, text presentation method, and computer program product |
JP2021529338A (ja) * | 2018-04-27 | 2021-10-28 | エル ソルー カンパニー, リミテッドLlsollu Co., Ltd. | 発音辞書生成方法及びそのための装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2848458B2 (ja) | 言語翻訳システム | |
US6910012B2 (en) | Method and system for speech recognition using phonetically similar word alternatives | |
US6490563B2 (en) | Proofreading with text to speech feedback | |
US5208897A (en) | Method and apparatus for speech recognition based on subsyllable spellings | |
JPH0916602A (ja) | 翻訳装置および翻訳方法 | |
JPH0713594A (ja) | 音声合成において音声の質を評価するための方法 | |
JPH05165486A (ja) | テキスト音声変換装置 | |
US5222188A (en) | Method and apparatus for speech recognition based on subsyllable spellings | |
JPH03217900A (ja) | テキスト音声合成装置 | |
JPS634206B2 (ja) | ||
JP3378547B2 (ja) | 音声認識方法及び装置 | |
JP3626398B2 (ja) | テキスト音声合成装置、テキスト音声合成方法及びその方法を記録した記録媒体 | |
JPH0634175B2 (ja) | 文章読上げ装置 | |
JPH096378A (ja) | テキスト音声変換装置 | |
JPH09259145A (ja) | 検索方法および音声認識装置 | |
JP2001343987A (ja) | 音声合成方法、および音声合成装置 | |
JPH05189194A (ja) | 文書読み上げ装置 | |
JPH02238494A (ja) | 音声合成装置 | |
JP3402480B2 (ja) | 文書朗読装置 | |
JPH04350699A (ja) | テキスト音声合成装置 | |
JPH07152392A (ja) | 音声合成装置 | |
JPH08221095A (ja) | 文章読み上げ方法 | |
JPH02234198A (ja) | テキスト音声合成システム | |
JPH09258776A (ja) | 音声認識方法および音声認識装置、並びに翻訳方法および翻訳装置 | |
JPH03149598A (ja) | 音声認識装置 |