JP2004325692A - テキスト音声合成装置、テキスト処理装置、テキスト処理プログラムおよびこのプログラムの記録媒体 - Google Patents

テキスト音声合成装置、テキスト処理装置、テキスト処理プログラムおよびこのプログラムの記録媒体 Download PDF

Info

Publication number
JP2004325692A
JP2004325692A JP2003119068A JP2003119068A JP2004325692A JP 2004325692 A JP2004325692 A JP 2004325692A JP 2003119068 A JP2003119068 A JP 2003119068A JP 2003119068 A JP2003119068 A JP 2003119068A JP 2004325692 A JP2004325692 A JP 2004325692A
Authority
JP
Japan
Prior art keywords
control tag
text
control
tag
conversion table
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003119068A
Other languages
English (en)
Inventor
Tomokazu Morio
智一 森尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2003119068A priority Critical patent/JP2004325692A/ja
Publication of JP2004325692A publication Critical patent/JP2004325692A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】制御タグの動作定義を容易にし、編集操作性および柔軟性の高いテキスト音声合成装置を提供する。
【解決手段】テキストが含む第1制御タグを第2制御タグに変換する制御タグ変換手段と、制御タグ変換表を編集して前記第1制御タグと前記第2制御タグとの対応付けを書き換える変換表編集手段とを少なくとも備えたテキスト音声合成装置とする。
【選択図】 図9

Description

【0001】
【発明の属する技術分野】
本発明は、テキスト列の様式を変換するテキスト処理装置およびテキスト列から音声を生成する音声合成装置に関する。
【0002】
【従来の技術】
テキスト列から音声を生成するテキスト音声合成装置では、テキストの読み上げ様式に感情表現などを付与し、より人間的な発音を実現するための技術開発が盛んである。
【0003】
ここで、テキスト読み上げ様式を制御する方法(テキスト処理方法)として、識別記号からなる制御タグを読み上げ用のテキスト列に組み込む方法がある。図14はこのような制御タグを組み込んだテキスト列の一例である。このテキスト列では、制御タグ『<Emphasis>』『</Emphasis>』で挟まれたテキスト列の読み上げが強調され、制御タグ『<Speed +2>』『</Speed>』で挟まれたテキスト列の読み上げが通常よりも2段階速い発声速度となるように設定されている。
【0004】
テキスト列の読み上げには、例えば図13に示すような、テキスト入力部131、制御タグ処理部132、テキスト音声合成部133、音声出力部134および制御タグ定義部135からなるテキスト音声合成装置が用いられている。
以下に、この装置における処理様式を説明する。
▲1▼ 制御タグを含むテキスト列が、テキスト入力部から制御タグ処理部132に出力される。
▲2▼ 制御タグ処理部132は、制御タグ定義部135を参照し、テキスト列に含まれる制御タグを、音声合成様式を規定した制御コマンドへと変換する。
▲3▼ 制御コマンドを含むテキスト列がテキスト音声合成部133に出力される。ここで、制御タグで挟まれていない通常のテキスト列(例えば、図14における「ただ今通常の読み上げです。」など)は特に変換されないことは勿論である。
▲4▼ テキスト音声合成部133は、テキスト列とテキスト列に含まれる制御コマンドに基づいてテキスト列を音声信号に変換し、音声出力部134に出力する。
▲5▼ 音声出力部から音声が生成する。
【0005】
しかしながら、このような音声合成装置で用いられているテキスト処理方法では、制御タグと制御コマンドとの対応付けが固定されている。このため、その対応関係を変更することや、新たに制御タグを定義づけることができず、装置の柔軟性に劣る。また、このように対応関係が固定されたテキスト処理方法であると、対応できる制御タグセットを増やすためには、あらかじめ大量の対応付けを定義しておく必要がある。しかしながらこの場合には、制御タグ定義部における必要メモリ量が著しく増大してしまう。
【0006】
そこで、制御タグと制御コマンドとの対応付けを再定義(カスタマイズ)するテキスト処理方法を用い、テキスト音声合成装置の柔軟性を向上させる技術が提案されている(例えば、特許文献1参照。)。この技術にかかる装置は、図15に示すように、定義タグ管理部151、カスタマイズタグ処理部152、言語解析部153および音声合成部154を備えている。ここで、制御タグの動作(制御コマンド)を再定義するためには、図16に示すようなカスタマイズタグを定義タグ管理部151に登録させる。なお、このカスタマイズタグでは、単語の品詞、読みおよびアクセントと、発声休止時間とが定義されている。
【0007】
【特許文献1】
特開2000−214874号公報(第2頁)
【0008】
しかしながら、この技術に従ったテキスト処理方法では、カスタマイズタグを作成するために、テキスト音声合成装置の内部処理様式についての専門知識が必要である。このため一般のエンドユーザーでは制御タグの動作を再定義することが困難であり、装置の編集操作性および柔軟性が十分ではない。
【0009】
また制御タグには複数の仕様があり、例えば、規格Aのテキスト列中ではタグセットAが、規格Bのテキスト列中ではタグセットBが用いられている。この場合、使用されるタグセットが切り替わるたびに、定義タグ管理部の内容を登録し直す必要があるという課題があった。
【0010】
【発明が解決しようとする課題】
本発明は上記課題を解決するものであり、その目的は、制御タグの動作定義に対する編集操作性が高いテキスト処理装置を提供することである。また、本発明の更なる目的は、制御タグの編集操作性および柔軟性に優れたテキスト音声合成装置を提供することである。
【0011】
ここで、『制御タグ』とは、制御記号、文字(数字を含む現用文字、数字を含む歴史的文字)および/または符号(算術記号、マークなど)、またはテキスト規格記号などの『識別記号』を有するものである。
【0012】
【課題を解決するための手段】
本発明のテキスト処理装置は、第1制御タグを含むテキストを入力するテキスト入力手段と、前記第1制御タグを、制御タグ変換表にて対応付けられた第2制御タグへ変換する制御タグ変換手段と、前記第2制御タグを含むテキストを出力するテキスト出力手段と、前記制御タグ変換表における前記第1制御タグと前記第2制御タグとの対応付けを編集する変換表編集手段とを備えることを特徴とする。
【0013】
この構成であると、制御タグ変換表における第1制御タグと第2制御タグとの対応付けを編集する変換表編集手段を備えているため、第2制御タグの対応付けを編集することにより、第1制御タグの動作を再定義することができる。また、予め制御タグ変換表に登録されている第2制御タグを用いた制御タグ変換表の編集により、新たな第1制御タグの動作を設定できるため、制御タグの動作設定に通常かかるべき専門知識をほとんど必要としない。これにより、テキスト処理装置の対応柔軟性および編集操作性が向上する。
【0014】
本発明のテキスト処理装置は、さらに、前記制御タグ変換表では、1の第1制御タグに2以上の第2制御タグが対応付けられた構成とすることができる。
【0015】
この構成であると、2以上の第2制御タグを組合せて新たな第1制御タグの動作を設定できるため、少ない登録数の第2制御タグによっても大量の第1制御タグの動作を定義できる。これにより、テキスト処理装置の柔軟性が一層向上する。
【0016】
本発明のテキスト処理装置は、さらに、2以上の制御タグ変換表を備え、それぞれの制御タグ変換表を切り替えて用いる構成とすることができる。
【0017】
この構成であると、2以上の制御タグ変換表を備えるため、
a)1個の制御タグ変換表に登録されている母集団が少なくなり、
b)使用したい制御タグ変換表を任意に指定でき、
c)同じ制御タグ名を用いつつそのタグセット数を拡張できる。
これにより、テキスト処理装置の柔軟性が一層向上する。
【0018】
本発明のテキスト処理装置は、さらに、前記第2制御タグが固定された構成とすることができる。
【0019】
この構成であると、固定された形式、すなわち新たに創作された制御タグ形式ではなく、既存の制御タグ形式を第2制御タグに定めるため、制御タグ変換後のテキスト列を既存の音声合成装置で処理することができる。
【0020】
【発明の実施の形態】
本発明の実施の形態について説明する。
〔実施の形態1〕
本発明の第1の様態であるテキスト処理装置は、図1に示すように、
A)テキスト入力部11からなるテキスト入力手段と、
B)制御タグ変換部12と制御タグ変換表13とからなる制御タグ変換手段と、
C)変換表編集部14からなる変換表編集手段と、
D)テキスト出力部15からなるテキスト出力手段と
を少なくとも備える。
【0021】
ここで以下に、このテキスト処理装置における処理様式について説明する。
(1)制御タグに挟まれたテキスト文または通常テキスト文(制御タグに挟まれていないテキスト文)からなるテキスト列が、テキスト入力部11から制御タグ変換部12に入力する。
(2)制御タグ変換部12では、入力されたテキスト列が、▲1▼制御タグに挟まれたテキスト文であるか、▲2▼通常テキスト文であるかが判別される。
▲1▼ テキスト列が制御タグに挟まれたテキスト文である場合には、制御タグ変換部12が、制御タグ変換表13を参照することにより、テキスト列に含まれる第1制御タグとしての変換前制御タグを、対応付けが予め設定された第2制御タグとしての変換後制御タグに変換する。その後、この変換後制御タグを含むテキスト列はテキスト出力部15へ出力される。
▲2▼ テキスト列が通常テキスト文である場合には、このテキスト列はそのままテキスト出力部15へ出力される。
【0022】
次に、このテキスト処理装置における制御タグ変換表13の編集様式について説明する。
この制御タグ変換表13では、変換前制御タグ(第1制御タグ)と変換後制御タグ(第2制御タグ)との対応付けが保存されている。この対応付けは、変換表編集部14からの指示により、編集(新規作成、修正および削除など)される。
【0023】
ここで、対応付けが登録された制御タグ変換表の一例を図2に示す。表の左列はテキスト入力部11から入力される変換前制御タグであり、右列は変換後制御タグである。ここで、上述したように、変換前制御タグは編集可能であり、予め登録されている制御タグ(第2制御タグ)群から任意の制御タグを選択し、新たに対応付けることができる。
【0024】
以下に、この図2に示す制御タグ変換表での対応付けを説明する。
(a)変換前制御タグ『#emphasis#』に、予め登録されている制御タグ『<Emphasis +1>』を対応付けた。これにより、制御タグ変換部12において、入力されたテキスト列に制御タグ『#emphasis#』が検出されると、その識別記号(制御記号:##、タグ名称:emphasis)がこの変換表で対応付けられた識別記号(制御記号:<>、タグ名称:Emphasis、制御パラメータ:+1)へと変換される。この制御タグの変換例は、制御記号で挟まれたテキスト列(指定テキスト列)を通常よりも1段階高く強調して読み上げる設定に変換するものである。
(b1)変換前制御タグ『#volume(X)#』に、予め登録されている制御タグ『<Volume(X/10)>』を対応付けた。この制御タグの変換例は、変換前の音量レベルのパラメータ(X)を(X/10)に変換して指定テキスト列を読み上げる設定に変換するものである。
(b2)変換前制御タグ『#pause(X)#』に、予め登録されている制御タグ『<Pause(1000*X)>』を対応付けた。この制御タグの変換例は、変換前の休止時間のパラメータ(X)を1000倍に変換するものである。この変換例は、例えば、パラメータの単位を秒単位からミリ秒単位に変換する場合などに適用できる。
(c)変換前制御タグ『#happy#』に、予め登録されている制御タグ『<Pitch +1>』と『<Speed +1>』とを組合せて対応付けた。この制御タグの変換例は、通常よりも声の高さと読み上げ速度とを1段階高くして指定テキスト列を読み上げる設定に変換するものであり、楽しそうな読み上げを表現させるための設定である。
【0025】
すなわち、この変換表には、
(a)新たな制御タグに1個の既存制御タグを対応付ける、
(b)制御タグのパラメータ値を変換させる、
(c)新たな制御タグに、2以上の既存制御タグを対応付ける、
などの編集を加えることができる。
【0026】
ところで、図2では、変換前制御タグまたは変換後制御タグにおける制御記号(##および<>)が同一である場合を示しているが、その対応付けを登録している限り、1個の制御タグ変換表において任意の識別記号(制御記号、文字および/または記号(ここにおける名称を含む)、テキスト規格記号など)が付与された制御タグを登録させることができることは勿論である。
【0027】
ここでさらに、上述した変換表の編集操作を、図11の流れ図を用いて説明する。
▲1▼ ステップ(S)110:変換表の編集を開始させる。
▲2▼ S111:既存の制御タグ群(タグセット)を変換後タグセットとして設定する。この既存の制御タグセットとしては、例えば、テキスト音声合成装置用の制御タグセットや、HTML形式、DHTML形式、XML形式の書類に用いられているテキスト制御タグセットなどがあげられる。
▲3▼ S112:編集したい制御タグ変換表を指定する。ここで、変換表が複数個である場合には選択して指定するが、本実施の形態1は制御タグ変換表が1個であるため一意的にその対象が決定される。
▲4▼ S113:新しく定義させたい制御タグ(例えば、『#pause (X)#』)を選択する。
▲5▼ S114〜S115:S111で設定した変換後タグセットのなかから、S113で選択した新しく定義させたい制御タグ(変換前制御タグ)に対応付ける変換後制御タグを選択する。
A)S114:制御記号および名称(例えば、制御記号:<>、名称:Pause)を選択する。ここで、新たに定義させた変換前制御タグの登録を抹消させるには、例えば、名称『Delete』を選択する。
B)S115:制御パラメータ(例えば、(1000*X))を付与する。
▲6▼ S116:新しく定義させたい制御タグ(変換前制御タグ)と変換後制御タグとの対応付けを完了する(Y)か否(N)かを選択する。ここで、1つの変換前制御タグに2以上の変換後制御タグを対応付ける場合(例えば、変換前制御タグ『#happy#』と、変換後制御タグ『<Pitch +1>』と変換後制御タグ『<Speed +1>』との組合せ対応付けなど)には、否(N)を選択し、S114〜S115を繰り返す。
▲7▼ S117:新しく定義させたい制御タグ(変換前制御タグ)を制御タグ変換表に登録する。
▲8▼ S118:変換表の編集を終了する(Y)か否(N)かを選択する。新しく定義させたい制御タグが他にまだある場合には、否(N)を選択し、S113〜S117を繰り返す。
▲9▼ S119:変換表の編集を終了させる。
【0028】
このような編集処理では、制御タグの動作を新規に定義することに比べて必要とされる専門知識が少なくて済むため、このような変換表編集部と制御タグ変換表とを備えたテキスト処理装置であると、その編集操作性および柔軟性が向上する。
【0029】
〔実施の形態2〕
本発明の第2の様態であるテキスト処理装置は、図3に示すように、制御タグセット別変換表記憶部36を備えていること以外は上記実施の形態1と同じである。ただし、この制御タグセット別変換表記憶部36には2以上の制御タグ変換表33が保存されており、入力されたテキスト列が含む制御タグに応じて制御タグ変換表33を切り替えることができる。なお、それぞれの制御タグ変換表が編集可能であることは勿論であるが、本実施の形態2においては、制御タグセット別変換表記憶部36と制御タグ変換表33と変換表編集部34とにより編集処理される。
【0030】
以下に、本実施の形態2にかかるテキスト処理装置について、実施例1〜3を用い、さらに具体的にその構成および効果を説明する。
【0031】
[実施例1]
実施例1では、図4に示すように、制御タグ変換表1および制御タグ変換表2からなる制御タグセット別変換表が保存されている。ここでは、それぞれの制御タグ変換表では、同じ制御記号(変換表1:##、変換表2:<>)を有する変換前制御タグによってタグセットを形成させている。このように制御タグセット別に変換表を持ち、入力テキストに含まれる制御タグセットに応じて適切な変換表を設定して動作させることで、種々の制御タグセットに柔軟に対応できる。
【0032】
[実施例2]
実施例2では、図5に示すように、制御タグ変換表Aおよび制御タグ変換表Bからなる制御タグセット別変換表が保存されている。ここで、それぞれの制御タグ変換表では、同じテキスト規格記号(変換表1:〔A〕、変換表2:〔B〕)を有する変換前制御タグによってタグセットを形成させている。このようなテキスト規格記号を有する制御タグセット別変換表であると、同じ名称を用いつつも、制御記号数の上限を超えて制御タグセット数を拡張できるため、テキスト処理装置の柔軟性が一層向上する。
【0033】
[実施例3]
実施例3では、図6に示すように、2以上の変換前制御タグを有する制御タグ変換表A’および制御タグ変換表B’からなる制御タグセット別変換表が保存されている。ここで、変換前制御タグ『[A][/A]』および変換前制御タグ『[B][/B]』は、テキスト列において、
▲1▼ 図7に示すように、もう一つの変換前制御タグと連続していてもよく、
▲2▼ 図8に示すように、テキスト列全体を挟むように付与されていてもよい。
このような2以上の変換前制御タグを有する制御タグセット別変換表であると、変換前制御タグの種別を自動的に識別させるだけでなく、制御タグ化させたテキスト識別記号(例えば、[A]、[B]など)により、使用したい制御タグ変換表を任意に指定しておくこともできるため、対応する変換表の決定に間違いがなく、確実に処理できる。
【0034】
〔実施の形態3〕
本発明の第3の様態であるテキスト音声合成装置は、図9に示すように、
A)テキスト入力部91からなるテキスト入力手段と、
B)制御タグ変換部92と制御タグ変換表93とからなる制御タグ変換手段と、
C)変換表編集部94からなる変換表編集手段と、
D)テキスト出力部95からなるテキスト出力手段と
を少なくとも備えた上記実施の形態1〜2で示したテキスト処理装置と、
E)テキスト音声合成部96からなるテキスト音声合成手段と、
F)音声出力部97からなる音声出力手段と
を備える。
【0035】
ところで、本実施の形態3では、第1制御タグとしての変換前制御タグは、制御タグ変換部92により第2制御タグとしての変換後制御コマンドへと変換され、この制御コマンドにより合成音声の発音形態が規定される。なお、この制御タグ変換表93が編集可能であることは勿論である。この編集様式としては、例えば図10に示すように、新たに登録させたい変換前制御タグ『#emphasis#』に、既存の変換後制御コマンド『SetT2sProperty(Volume, +3)』と既存の変換後制御コマンド『SetT2sProperty(Pitch, +50)』とを組合せて対応付けることができる。
【0036】
ここで以下に、このテキスト音声合成装置における処理様式について説明する。
(1)制御タグに挟まれたテキスト文または通常テキスト文(制御タグに挟まれていない)からなるテキスト列が、テキスト入力部91から制御タグ変換部92に入力する。
(2)制御タグ変換部92では、入力されたテキスト列が、▲1▼制御タグに挟まれたテキスト文であるか、▲2▼通常テキスト文であるかが判別され、
▲1▼ テキスト列が制御タグに挟まれたテキスト文である場合には、制御タグ変換部92が、制御タグ変換表93を参照することにより、テキスト列に含まれる第1制御タグとしての変換前制御タグを、対応付けが予め設定された第2制御タグとしての変換後制御コマンドに変換する。その後、この変換後制御コマンドを含むテキスト列はテキスト出力部95へ出力される。
▲2▼ テキスト列が通常テキスト文である場合には、このテキスト列はそのままテキスト出力部95へ出力される。
(3)テキスト音声合成部96では、テキスト出力部95から入力したテキスト列に対応する音声波形列が、複数の音声素片を接続して合成音声を得るなどの公知の音声合成方法により合成される。その後、その音声波形列が音声出力部97に出力され、合成音声が生成される。
【0037】
このような変換表編集部と制御タグ変換表とを備えたテキスト音声合成装置であると、制御タグ変換表の編集処理に際して、制御タグの動作を新規に定義することに比べて必要とされる専門知識が少なくて済むため、音声合成装置の編集操作性および柔軟性が向上する。
【0038】
〔実施の形態4〕
本発明の第4の様態であるテキスト音声合成装置は、
A)テキスト入力部からなるテキスト入力手段と、
B)制御タグ変換部と制御タグ変換表と変換表選択部とからなる制御タグ変換手段と、
C)変換表編集部からなる変換表編集手段と、
D)テキスト出力部からなるテキスト出力手段と、
E)テキスト音声合成部からなるテキスト音声合成手段と、
F)音声出力部からなる音声出力手段と
を少なくとも備える。
【0039】
ここで、この実施の形態4の一具体例である以下の実施例4について説明する。
[実施例4]
このテキスト音声合成装置は、上記構成に加えて、図12に示すように使用制御タグ識別部122を備えている。この使用制御タグ識別部122は、上記実施の形態2の制御タグ変換部32における一部の機能を特化するものである。
すなわちここでは、制御タグ変換手段が
▲1▼ 制御タグ変換部124と、
▲2▼ 制御タグ変換表125と、
▲3▼ 変換表選択部123と、
▲4▼ 使用制御タグ識別部122と
からなるが、上記実施の形態2と実質的に同様の機能を有する。なお、この制御タグ変換表125が編集可能であるとことは勿論であるが、本実施例4では上記構成とするため、変換表選択部123と制御タグ変換表125と変換表編集部126とにより編集処理が行われる。
【0040】
ここで以下に、このテキスト音声合成装置における処理様式を説明する。
(1)制御タグに挟まれたテキスト文または通常テキスト文からなるテキスト列が、テキスト入力部121から使用制御タグ識別部122に入力する。
(2)使用制御タグ識別部122では、
a)上記実施の形態2と同様に識別記号が検出され、入力されたテキスト列に含まれる制御タグの種別が識別される。その後、この識別結果が変換表選択部123に出力される。
b)テキスト入力部121から入力したテキスト列が、制御タグ変換部124に出力される。
(3)変換表選択部123では、2以上の制御タグ変換表の中から、識別された制御タグの種別に応じた制御タグ変換表125を選択する。上記実施の形態2と同様に識別記号が検出され、入力されたテキスト列に含まれる制御タグの種別が識別される。
(4)制御タグ変換部124では、上記実施の形態3と同様に、
▲1▼ テキスト列が制御タグに挟まれたテキスト文である場合には、制御タグ変換表125を参照して、第1制御タグとしての変換前制御タグが第2制御タグとしての変換後制御コマンドに変換され、この変換後制御コマンドを含むテキスト列がテキスト出力部127へ出力される。
▲2▼ テキスト列が通常テキスト文である場合には、そのままテキスト出力部127へ出力する。
(5)テキスト音声合成部128では、上記実施の形態3と同様に、テキスト出力部127から入力したテキスト列に対応する音声波形列が、複数の音声素片を接続して合成音声を得るなどの公知の音声合成方法により合成される。その後、その音声波形列が音声出力部129に出力され、合成音声が生成される。
【0041】
このような2以上の制御タグ変換表を有する変換表選択部と変換表編集部と制御タグ変換表とからなる音声合成装置であると、
▲1▼ 制御タグの動作を新規に定義することに比べて、制御タグ変換表の編集に必要とされる専門知識が少なくなり、
▲2▼ 1個の制御タグ変換表における対応付けの検出対象となる母集団が少なくなり、
▲3▼ 同じ制御タグの名称を用いつつそのタグセット数を拡張でき、
▲4▼ 使用したい制御タグ変換表を任意に指定することもできる
ため、その編集操作性および柔軟性が向上する。
【0042】
〔実施の形態5〕
本発明の第5の様態であるテキスト処理プログラムは、
A)テキストに含まれる第1制御タグを制御タグ変換表にて対応付けられた第2制御タグに変換する制御タグ変換プログラムコードと、
B)前記第2制御タグを含むテキストを出力するテキスト出力プログラムコードと、
C)前記制御タグ変換表における前記第1制御タグと前記第2制御タグとの対応付けを編集する変換表編集プログラムコードと、
D)前記第2制御タグを含むテキスト出力を音声に変換するテキスト音声合成プログラムコードと
を少なくとも備える。
【0043】
上記構成のテキスト処理プログラムであると、上記実施の形態1〜4にかかるテキスト処理装置またはテキスト音声合成装置における、テキスト入力手段、制御タグ変換手段およびテキスト出力手段が提供される。
【0044】
このテキスト処理プログラムは、図17に示すように、テキスト列を入力する入力部172と、中央演算処理装置(CPU)171と、読み出し専用メモリ(ROM)173と、読み書き可能メモリ(RAM)174と、記憶装置176と、出力部175と、ネットワーク178と、各部を接続するバス177とを少なくとも備えたテキスト処理装置またはテキスト音声合成装置のハードウェア構成において、中央演算処理装置(CPU)171を動作させる。
【0045】
ここで、このプログラムは、読み出し専用メモリ(ROM)173上に格納することができる。また、このプログラムは、ネットワークや、コンピュータ読み取り可能な外部記録媒体を介して供給することもできるし、同様の動作をする回路を組み込んで供給することもできる。
【0046】
このような記録媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、DVD−ROM、磁気テープ、不揮発性のメモリカードなどがあげられる。
【0047】
【発明の効果】
以上説明したように、本発明のテキスト処理装置およびテキスト音声合成装置であると、以下に示す効果が得られるため、装置の対応柔軟性、編集操作性が向上する。
▲1▼ 編集可能な制御タグ変換表を備えるため、制御タグが再定義できる。
▲2▼ 新たな制御タグの動作を、既存の制御タグを用いた制御タグ変換表の編集により設定するため、制御タグの動作設定にかかるべき専門知識をほとんど必要としない。
▲3▼ 2以上の制御タグ変換表を備えるため、
a)1個の制御タグ変換表における母集団が少なくなる。
b)使用したい制御タグ変換表を任意に指定できる。
c)同じ制御タグの名称を用いつつそのタグセット数を拡張できる。
【図面の簡単な説明】
【図1】図1は、本発明の一例であるテキスト処理装置の主要な構成を示す概念図である。
【図2】図2は、本発明における制御タグ変換表の一例を示す図である。
【図3】図3は、本発明の別の例であるテキスト処理装置の主要な構成を示す概念図である。
【図4】図4は、本発明における複数の制御タグセット変換表の一例を示す図である。
【図5】図5は、本発明における複数の制御タグセット変換表の別例を示す図である。
【図6】図6は、本発明における複数の制御タグセット変換表の別例を示す図である。
【図7】図7は、変換前制御タグを含んだ入力テキスト列の一例を示す図である。
【図8】図8は、変換前制御タグを含んだ入力テキスト列の別例を示す図である。
【図9】図9は、本発明の一例であるテキスト音声合成装置の主要な構成を示す概念図である。
【図10】図10は、本発明における制御タグ変換表の別の例を示す図である。
【図11】図11は、本発明における制御タグ変換表の編集動作を説明する流れ図である。
【図12】図12は、本発明の一例である、複数の制御タグセットの入力を受付けるテキスト音声合成装置の主要な構成を示す概念図である。
【図13】図13は、従来技術にかかるテキスト音声合成装置の主要な構成を示す概念図である。
【図14】図14は、制御タグを含んだテキスト列の一例である。
【図15】図15は、従来技術にかかる制御タグの動作をカスタマイズ処理できる装置の主要な構成を示す概念図である。
【図16】図16は、従来技術にかかる制御タグの動作定義例を説明する図である。
【図17】図17は、本発明の一例であるテキスト処理装置におけるハードウェア構成を示す概念図である。
【符号の説明】
11、31、91、121、131 テキスト入力部
12、32、92、124 制御タグ変換部
13、33、93、125 制御タグ変換表
14、34、94、126 変換表編集部
15、35、95、127 テキスト出力部
36 制御タグセット別変換表記憶部
96、128、133 テキスト音声合成部
97、129、134 音声出力部
122 使用制御タグ識別部
123 変換表選択部
132 制御タグ処理部
135 制御タグ定義部
151 定義タグ管理部
152 カスタマイズタグ処理部
153 言語解析部
154 音声合成部
171 CPU
172 入力部
173 ROM
174 RAM
175 出力部
176 記憶装置
177 バス
178 ネットワーク

Claims (9)

  1. 第1制御タグを含むテキストを入力するテキスト入力手段と、
    前記第1制御タグを、制御タグ変換表にて対応付けられた第2制御タグへ変換する制御タグ変換手段と、
    前記第2制御タグを含むテキストを出力するテキスト出力手段と、
    前記制御タグ変換表における前記第1制御タグと前記第2制御タグとの対応付けを編集する変換表編集手段と
    を備えることを特徴とするテキスト処理装置。
  2. 前記第2制御タグが少なくとも制御記号と名称および/または制御パラメータとからなる
    ことを特徴とする請求項1記載のテキスト処理装置。
  3. 前記制御タグ変換表では、1の第1制御タグに2以上の第2制御タグが対応付けられている
    ことを特徴とする請求項1記載のテキスト処理装置。
  4. 2以上の制御タグ変換表を備え、
    それぞれの制御タグ変換表を切り替えて用いる
    ことを特徴とする請求項1記載のテキスト処理装置。
  5. 前記第2制御タグが固定されている
    ことを特徴とする請求項1記載のテキスト処理装置。
  6. 第1制御タグを含むテキストを入力するテキスト入力手段と、
    前記第1制御タグを、制御タグ変換表にて対応付けられた第2制御タグへ変換する制御タグ変換手段と、
    前記第2制御タグを含むテキストを出力するテキスト出力手段と、
    前記制御タグ変換表における前記第1制御タグと前記第2制御タグとの対応付けを編集する変換表編集手段と、
    前記テキスト出力手段によって出力された第2制御タグを含むテキストを音声に変換するテキスト音声合成手段と
    を備えることを特徴とするテキスト音声合成装置。
  7. 2以上の制御タグ変換表を備え、
    それぞれの制御タグ変換表を切り替えて用いる
    ことを特徴とする請求項6記載のテキスト音声合成装置。
  8. テキストに含まれる第1制御タグを制御タグ変換表にて対応付けられた第2制御タグに変換する制御タグ変換プログラムコードと、
    前記第2制御タグを含むテキストを出力するテキスト出力プログラムコードと、
    前記制御タグ変換表における前記第1制御タグと前記第2制御タグとの対応付けを編集する変換表編集プログラムコードと、
    前記第2制御タグを含むテキスト出力を音声に変換するテキスト音声合成プログラムコードと
    を少なくとも備えたテキスト処理プログラム。
  9. 請求項8記載のテキスト処理プログラムを記録した記録媒体。
JP2003119068A 2003-04-23 2003-04-23 テキスト音声合成装置、テキスト処理装置、テキスト処理プログラムおよびこのプログラムの記録媒体 Pending JP2004325692A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003119068A JP2004325692A (ja) 2003-04-23 2003-04-23 テキスト音声合成装置、テキスト処理装置、テキスト処理プログラムおよびこのプログラムの記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003119068A JP2004325692A (ja) 2003-04-23 2003-04-23 テキスト音声合成装置、テキスト処理装置、テキスト処理プログラムおよびこのプログラムの記録媒体

Publications (1)

Publication Number Publication Date
JP2004325692A true JP2004325692A (ja) 2004-11-18

Family

ID=33498424

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003119068A Pending JP2004325692A (ja) 2003-04-23 2003-04-23 テキスト音声合成装置、テキスト処理装置、テキスト処理プログラムおよびこのプログラムの記録媒体

Country Status (1)

Country Link
JP (1) JP2004325692A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015517684A (ja) * 2012-05-07 2015-06-22 オーディブル・インコーポレイテッドAudible, Inc. コンテンツのカスタマイズ
WO2016067766A1 (ja) * 2014-10-30 2016-05-06 株式会社東芝 音声合成装置、音声合成方法およびプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015517684A (ja) * 2012-05-07 2015-06-22 オーディブル・インコーポレイテッドAudible, Inc. コンテンツのカスタマイズ
WO2016067766A1 (ja) * 2014-10-30 2016-05-06 株式会社東芝 音声合成装置、音声合成方法およびプログラム
JP2016090664A (ja) * 2014-10-30 2016-05-23 株式会社東芝 音声合成装置、音声合成方法およびプログラム
US10217454B2 (en) 2014-10-30 2019-02-26 Kabushiki Kaisha Toshiba Voice synthesizer, voice synthesis method, and computer program product

Similar Documents

Publication Publication Date Title
EP1490861B1 (en) Method, apparatus and computer program for voice synthesis
WO1999060474A1 (fr) Dispositif de lecture a haute voix, procede de commande de lecture a haute voix et support d'enregistrement
US8626510B2 (en) Speech synthesizing device, computer program product, and method
JP2012022121A (ja) 音声合成装置
JP5743625B2 (ja) 音声合成編集装置および音声合成編集方法
JP6003115B2 (ja) 歌唱合成用シーケンスデータ編集装置および歌唱合成用シーケンスデータ編集方法
JP4287785B2 (ja) 音声合成装置、音声合成方法及びプログラム
JP5082971B2 (ja) 音声合成装置およびそれを用いた読み上げシステム。
JP2004325692A (ja) テキスト音声合成装置、テキスト処理装置、テキスト処理プログラムおよびこのプログラムの記録媒体
JPS6073589A (ja) 音声合成装置
JP2009157220A (ja) 音声編集合成システム、音声編集合成プログラム及び音声編集合成方法
JP4311710B2 (ja) 音声合成制御装置
JP2005326811A (ja) 音声合成装置および音声合成方法
CN113963674A (zh) 作品生成的方法、装置、电子设备及存储介质
JP3222283B2 (ja) 案内装置
JP2536169B2 (ja) 規則型音声合成装置
JP2005070604A (ja) 音声ラベリングエラー検出装置、音声ラベリングエラー検出方法及びプログラム
JP3060276B2 (ja) 音声合成装置
JP2004258564A (ja) スコアデータ編集装置、スコアデータ表示装置およびプログラム
JPH08272388A (ja) 音声合成装置及びその方法
JP2006349787A (ja) 音声合成方法および装置
JP2007127994A (ja) 音声合成方法及び音声合成装置並びにプログラム
JP2002268664A (ja) 音声変換装置及びプログラム
JP2001242881A (ja) 音声合成方法及び装置
JP2577372B2 (ja) 音声合成装置および方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050810

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080403

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081118

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081226

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090519