JPH09325787A - 音声合成方法、音声合成装置、文章への音声コマンド組み込み方法、及び装置 - Google Patents

音声合成方法、音声合成装置、文章への音声コマンド組み込み方法、及び装置

Info

Publication number
JPH09325787A
JPH09325787A JP8136327A JP13632796A JPH09325787A JP H09325787 A JPH09325787 A JP H09325787A JP 8136327 A JP8136327 A JP 8136327A JP 13632796 A JP13632796 A JP 13632796A JP H09325787 A JPH09325787 A JP H09325787A
Authority
JP
Japan
Prior art keywords
character string
voice
kana
input
kanji
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8136327A
Other languages
English (en)
Inventor
Shichiro Miyashita
下 七 郎 宮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP8136327A priority Critical patent/JPH09325787A/ja
Priority to EP97303442A priority patent/EP0810582A3/en
Publication of JPH09325787A publication Critical patent/JPH09325787A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】 文章を作成する作業と、音声属性を調整する
作業を同時に行うことのできる方法を提供する。 【解決手段】 かな漢字変換後の未確定文字列が表示さ
れている状態で、未確定文字列に埋め込みコマンドを埋
め込むためのキーを押すと、音声属性情報入力部115
に保持されている音声属性情報が、埋込みコマンドの形
式で未確定文字列に埋め込まれる。また、この状態で
で、音声合成を指示するキーを押すと、その埋め込まれ
た音声属性情報にしたがって音声合成する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、音声合成に関するも
のであり、より詳しくは、音声合成を行う際し、音声を
調整するための音声属性の指示を行う音声コマンドを埋
め込んだ文書を作成する方法に関する。
【0002】
【従来の技術】従来の音声合成プログラムの多くは、音
声合成用の文章を作ることと音声合成の調整を行なう事
が別れており、音声合成用の文章を作る作業は、まず、
(1)かな漢字変換プログラム等をつかって文章を作成
し、次に、(2)システム全体の大まかな調整(「速
度」「音量」など)の調整を行ない、そして、(3)う
まく読めない単語については単語登録などによって調節
を行なう手順によって行われている。
【0003】音声合成はこの(1)〜(3)の作業がす
べて終了した後に行ない、音声調整を行っている状態で
音声合成することはできない。また、音声合成と
(2),(3)の作業はカットアンドトライで繰り返す
ことが、一般的である。
【0004】しかしこのような方法では、一度音声合成
させたい文章を作成し、それを音声合成してみて、不具
合があればそれをシステム全体の音声の設定や単語登録
などで調節したり、文章に直接読み方の属性を与えるこ
とで調整し、その後、再度音声合成して確認するという
作業をそれぞれ一度中断して、繰り返す必要があったた
め、作業効率が悪かった。
【0005】音声合成プログラムの1つであるProTALKE
R/2 V1.0(「ProTALKER」はIBM社の商標)の場合、
上記の一般的な音声合成プログラムのもつ機能の他に、 a)音声合成させる文章中に、プログラムのみが解読で
きる属性を変えるコマンドを埋込みコマンドとして埋め
込むことができる。このコマンド以降、次のコマンドが
現れるまでの文章を指定された属性で音声合成する。こ
の埋込みコマンドで設定できるのは、「性別」、「速
度」、「音量」、「ピッチ」、「抑揚」などである。単
語単位での「読み」「アクセント」などは、このコマン
ドではサポートされていないため、一時的な単語登録は
できない。 b)これらのコマンドはユーザーが自分でキー入力する
事を前提にしている。
【0006】また、音声合成プログラムの1つである雄
弁家(「雄弁家」はリコー株式会社の商標) の場合、上
記の音声合成プログラム全般のもつ機能の他に、 a)音声合成すべき文章の作成中に開く特殊な編集ウイ
ンドウ上で、文節単位で「読み」、「アクセント」はも
ちろん、「アクセントの強さ」や息継ぎ場所での「息継
ぎの長さ」、「音量」、「速度」などを調節することが
できる。 b)きめ細かい設定での各文節の「読み」は全候補パネ
ルから選択して選ぶことができ、ユーザーが入力する必
要はないが、他の属性(「アクセントの強さ」「息継ぎ
の長さ」等)は ProTALKER/2 と同じく直接ユーザーが
入力する必要がある。 c)a)とb)で設定したその文章に対するきめ細かい
属性を、属性ファイルとして保存し、後で文章を音声合
成する際に、文章ファイルと一緒に読み込んで利用する
方式を取っている。
【0007】これらの「ProTALKER/2」,「雄弁家」等
の音声合成プログラムにおいても、文章を作成する作業
と、音声属性を調整する作業を同時に行うことが出来な
いため、文章全部を作成した後に、文章全体または、文
書中の指定した文字列を入力として音声合成を試みる必
要があり、音声を確認しながら文章を作成していくより
も作業効率が悪く、短時間で音声コマンド埋込み文章を
作成するには不向きであった。さらに、これらの方法
は、属性のコマンドを直接ユーザーがキー入力する必要
がったため、各種属性のコマンドを憶えたり、調べたり
する事は複雑になればなるほど面倒となり、また、直接
キー入力しなければならないため誤入力の可能性があっ
た。
【0008】この一方、特開平5−143278号公報
には、文書中に存在する文字列の書体(明朝体、ゴシッ
ク等)、強調(全角、半角等)、装飾(アンダーライ
ン、網掛等)に対応した音声合成を行う方法が開示され
ている。かかる方法では、その書体、強調、装飾の変更
された文字列が、どのような属性を有する音声に合成さ
れるかが不明である。すなわち、その文字列にどのよう
な書体、強調、装飾を行えば、ユーザが欲する所望の属
性を有する音声に合成されるか不明であり、その習熟に
は相当の熟練が必要となる。また、その書体等を変更し
た文字列のみを試験的に音声合成することは示唆されて
おらず、文書全体を入力として音声合成を行う必要があ
った。
【0009】また、特開平6−176023号公報に
は、文書中に存在する文字列の音声合成をかな漢字変換
時に入力されたかなの読みに優先度を置き行う(例え
ば、文字列「市場」が、「しじょう」ではなく「いち
ば」と入力され、かな漢字変換されたものである場合、
「市場」を「いちば」として音声合成を行う)方法が開
示されている。しかし、これは、1つの漢字に2以上の
読み方がある場合にのみ、その音声合成時の読み方を変
更し、ユーザが欲する所望の文字列の音声属性の変更を
行うことは不可能である。また、音声合成の際使用する
「読み・アクセント辞書」の優先度の変更を行ってしま
うため、例えば、ある文章でだけ「市場」を「いちば」
と発音したいと欲して、そのように単語登録を行うと、
「しじょう」と発音することを欲する他の文章において
も「いちば」と発音してしまうこととなってしまう。
【0010】
【発明が解決しようとする課題】本発明の目的は、文章
を作成する作業と、音声属性を調整する作業を同時に行
うことのできる方法を提供することにある。
【0011】本発明の更に他の目的は、音声属性をユー
ザが簡単に変更できる方法を提供することにある。
【0012】
【課題を解決するための手段】本発明によれば、未確定
文字列に埋め込みコマンドを埋め込む機能をあるキーに
割り当てた上で、そのキーを押すと、未確定文字列を埋
込みコマンドが埋め込まれた未確定文字列に変換する。
また、かな漢字変換後の未確定文字列が表示されている
状態で、音声合成を指示するキーを押すと、その時点で
有効な読み方の属性にしたがって音声合成し、同時に未
確定文字列を属性を表す埋込みコマンドを追加した形式
に変換する。そして、例えば、コントロールパネルなど
を使って属性を変化させてその場で何度でも音声合成で
き、未確定文字列も適宜その時の属性にしたがって変化
させる。さらに、一つの未確定文字列に複数の文節(変
換対象文字列)が存在し、ある文節から違った属性で読
ませたい場合にはその文節にカーソルを移動し、そこで
属性を調節した後再度、この音声合成のキーを押すこと
でその文節の頭に埋込みコマンドを埋め込むことがで
き、その文節以降はその属性の読み方になる。
【0013】本発明においては、一時的にのみ有効な単
語登録を起動する機能をあるキーに割り当て、単語登録
したい単語を一文節に切り直し、その単語が変換可能な
状態でそのキーを押すとその単語を登録すべき単語とし
て一時的にのみ有効な単語登録の機能を呼びだす。好適
には、ユーザーインターフェースは通常の単語登録とほ
ぼ同様なものとし、登録した情報をユーザー辞書に登録
するのではなく、埋込みコマンドとして未確定文字列に
埋め込む。埋め込まれる情報は、普通の単語登録に登録
される情報量と一致させる。そして、確定キーがユーザ
によって押されると、埋込みコマンドの挿入された文字
列が編集アプリケーションに渡される。この時点で再度
音声合成をすることもできる。
【0014】本発明の一態様においては、入力装置から
入力されたかな文字列を未確定文字列としてかな文字列
入力部において保持する段階と、入力装置からユーザの
未確定文字列に対する漢字かな混じり文字列へ変換する
ことを指示する入力を検出する段階と、漢字かな混じり
文字列への変換の指示の検出に応答して、かな漢字辞書
から、未確定文字列の一部を構成する変換対象文字列に
対応する漢字かな混じり文字列の候補である候補文字列
を特定する段階と、候補文字列を表示装置に表示する段
階と、入力装置から、候補文字列の内の1つである被選
択文字列を選択するユーザ入力を検出する段階と、変換
対象文字列を被選択文字列によって置換することによ
り、新たな未確定文字列とする段階と、ユーザの変換対
象文字列へ音声コマンドの埋込みを指示する入力を検出
する段階と、変換対象文字列へ埋め込む変換対象文字列
の読み及びアクセントを含む音声属性情報をユーザが入
力するためのエントリを表示する段階と、エントリへの
ユーザの入力に対応した音声属性情報を含む音声コマン
ドを変換対象文字列に埋め込む段階と、変換対象文字列
の音声合成を指示するユーザの入力を検出する段階と、
音声コマンドの音声属性に従った音声合成を行う段階と
を含む音声合成を行う際に参照される音声コマンドの埋
め込まれた文章を作成する方法が提供される。
【0015】本発明の他の一態様においては、入力装置
から入力されたかな文字列を未確定文字列としてかな文
字列入力部において保持する段階と、入力装置からユー
ザの未確定文字列に対する漢字かな混じり文字列へ変換
することを指示する入力を検出する段階と、漢字かな混
じり文字列への変換の指示の検出に応答して、かな漢字
辞書から、未確定文字列の一部を構成する変換対象文字
列に対応する漢字かな混じり文字列の候補である候補文
字列を特定する段階と、候補文字列を表示装置に表示す
る段階と、入力装置から、候補文字列の内の1つである
被選択文字列を選択するユーザ入力を検出する段階と、
変換対象文字列を被選択文字列によって置換することに
より、新たな未確定文字列とする段階と、ユーザの変換
対象文字列へ音声コマンドの埋込みを指示する入力を検
出する段階と、変換対象文字列へ埋め込む変換対象文字
列の読み及びアクセントを含む音声属性情報をユーザが
入力するためのエントリを表示する段階と、エントリへ
のユーザの入力に対応した音声属性情報を含む音声コマ
ンドを変換対象文字列に埋め込む段階とを含む音声合成
を行う際に参照される音声コマンドの埋め込まれた文章
を作成する方法が提供される。
【0016】本発明の他の一態様においては、音声コマ
ンドを埋め込む文字列特定する段階と、ユーザの特定さ
れた文字列へ音声コマンドの埋込みを指示する入力を検
出する段階と、特定された文字列の音声属性情報をユー
ザが入力するためのエントリを表示する段階と、エント
リへのユーザの入力に対応した音声属性情報を含む音声
コマンドを特定された文字列に埋め込む段階とを含む音
声合成を行う際に参照される音声コマンドの埋め込まれ
た文章を作成する方法が提供される。
【0017】本発明の他の一態様においては、ユーザに
よって入力された文字列を保持するかな文字列入力部
と、かな文字列に対応する漢字かな混じり文字列を管理
するかな漢字辞書と、かな文字列入力部の保持する文字
列に対応する漢字かな混じり文字列の候補を探索するか
な漢字変換部と、ユーザ入力によって調整された音声属
性値を保持する音声属性入力部と、ユーザ入力に応答し
て、かな漢字変換部に対し、漢字かな混じり文字列の候
補から、かな文字列入力部の保持する文字列に対応する
漢字かな混じり文字列の選択を指示し、さらに、音声属
性入力部の保持する音声属性値を音声コマンドの形式で
選択された漢字かな混じり文字列に埋め込むかな漢字変
換制御部とを含む音声合成を行う際に参照される音声コ
マンドの埋め込まれた文章を作成する装置が提供され
る。
【0018】本発明の他の一態様においては、ユーザに
よって入力された文字列を保持する文字列入力部と、ユ
ーザ入力によって調整されたその文字列の読み方等を指
示する文字列音声属性値を保持する音声属性入力部と、
ユーザ入力に応答して、音声属性入力部の保持する文字
列音声属性値を文字列音声コマンドの形式で入力された
文字列に埋め込む変換制御部と、文字列音声コマンドの
埋め込まれた文字列に埋め込まれた文字列音声属性情報
に従って音声合成することをパラメータ生成部に指示す
る音声合成制御部とを含む音声属性情報を含み、音声合
成を行う際に参照される音声コマンドの埋め込まれた文
章を作成する文書作成部と、音声合成に使用するパラメ
ータを生成するパラメータ生成部を備え、入力した文章
から音声合成を行う音声合成部を含む装置が提供され
る。
【0019】本発明の他の一態様においては、音声コマ
ンドを埋め込む文字列を保持するかな文字列入力部と、
かな文字列に対応する漢字かな混じり文字列を管理する
かな漢字辞書と、かな文字列入力部の保持する文字列に
対応する漢字かな混じり文字列の候補を探索するかな漢
字変換部と、ユーザ入力によって調整された音声属性値
を保持する音声属性入力部と、ユーザ入力に応答して、
かな漢字変換部に対し、漢字かな混じり文字列の候補か
ら、かな文字列入力部の保持する文字列に対応する漢字
かな混じり文字列の選択を指示し、さらに、音声属性入
力部の保持する音声属性値を音声コマンドの形式で選択
された漢字かな混じり文字列に埋め込むかな漢字変換制
御部と、音声コマンドの埋め込まれた漢字かな混じり文
字列に埋め込まれ音声属性情報に従って音声合成する音
声合成部とを含む音声属性情報を含む文章をもとに音声
合成する装置が提供される。
【0020】本発明の他の一態様においては、文法規則
情報及び読み・アクセント辞書に基づいて、入力された
文章に含まれる文字列の読み方、アクセントを決定する
言語解析部と、言語解析部で決定された入力された文章
に含まれる文字列の読み方とアクセントに従って音声合
成を行う音声合成器と、入力した文字列に対応する音声
コマンドあって、音声合成に際に、入力した文字列の読
み方及びアクセントを含む音声属性の音声属性値を指示
する音声コマンドが埋め込まれていた場合、文字列を音
声コマンドの指示する音声属性値に従って音声合成する
ことを合成器に指示する音声合成制御部とを含む入力し
た文章をもとに音声合成する装置が提供される。
【0021】本発明の他の一態様においては、音声コマ
ンドを埋め込む文字列特定することを文書作成装置に指
示するプログラムコード手段と、ユーザの特定された文
字列へ音声コマンドの埋込みを指示する入力を検出する
ことを文書作成装置に指示するプログラムコード手段
と、特定された文字列の音声属性情報をユーザが入力す
るためのエントリを表示することを文書作成装置に指示
するプログラムコード手段と、エントリへのユーザの入
力に対応した音声属性情報を含む音声コマンドを特定さ
れた文字列に埋め込むことを文書作成装置に指示するプ
ログラムコード手段とを含む音声合成を行う際に参照さ
れる音声コマンドの埋め込まれた文章を作成することを
文書作成装置に指示する制御プログラムを格納する記憶
媒体が提供される。
【0022】
【実施例】以下、図面を参照して本発明の実施例を説明
する。図1を参照すると、本発明の音声合成システムを
実施するためのハードウェア構成の概観図が示されてい
る。音声合成システム100は、中央処理装置(CP
U)1とメモリ4とを含んでいる。CPU1とメモリ4
は、バス2を介して、補助記憶装置としてのハードディ
スク装置13とを接続してある。フロッピーディスク装
置(またはMO、CD−ROM等の駆動装置)20はフ
ロッピーディスクコントローラ19を介してバス2へ接
続されている。
【0023】フロッピーディスク装置(またはMO、C
D−ROM等の駆動装置)20には、フロッピーディス
ク(またはMO、CD−ROM等の媒体)が挿入され、
このフロッピーディスク等やハードディスク装置13、
ROM14には、オペレーティングシステムと協働して
CPU等に命令を与え、本発明を実施するためのコンピ
ュータ・プログラムのコードを記録することができ、メ
モリ4にロードされることによって実行される。このコ
ンピュータ・プログラムのコードは圧縮し、または、複
数に分割して、複数の媒体に記録することもできる。
【0024】音声合成システム100は更に、ユーザ・
インターフェース・ハードウェアを備えたシステムとす
ることができ、ユーザ・インターフェース・ハードウェ
アとしては、例えば、入力をするためのポインティング
・デバイス(マウス、ジョイスティック等)7またはキ
ーボード6や、視覚データをユーザに提示するためのデ
ィスプレイ12がある。また、パラレルポート16を介
してプリンタを接続することや、シリアルポート15を
介してモデムを接続することが可能であり、シリアルポ
ート15およびモデムまたは通信アダプタ18を介して
他のコンピュータ等と通信を行うことが可能である。ス
ピーカ23は、オーディオ・コントローラから供給され
る音声信号を、アンプ22を介して受領し、音声として
出力する。このように、本発明は、通常のパーソナルコ
ンピュータ(PC)、やワークステーションやこれらの
組合せによって実施可能であることを容易に理解できる
であろう。ただし、これらの構成要素は例示であり、そ
の全ての構成成要素が本発明の必須の構成要素となるわ
けではない。
【0025】オペレーティング・システムとしては、W
indows(マイクロソフトの商標)、OS/2(I
BMの商標)、AIX(IBMの商標)上のX−WIN
DOWシステム(MITの商標)などの、標準でGUI
マルチウインドウ環境をサポートするものが望ましい
が、本発明は、PC−DOS(IBMの商標)、MS−
DOS(マイクロソフトの登録商標)などのキャラクタ
・ベース環境でも実現可能であり、特定のオペレーティ
ング・システム環境に限定されるものではない。また、
図1は、スタンド・アロン環境のシステムを示している
が、クライアント/サーバ・システムとして本発明を実
現し、クライアント・マシンは、サーバ・マシンに対し
て、イーサネット、トークン・リングなどでLAN接続
し、クライアント・マシン側には、後述する文書作成部
のかな文字列入力部と、サーバ・マシン側から音声デー
タを受領し、それを再生するための合成器及びスピーカ
のみを配置し、その他の機能をサーバ・マシン側に配置
してもよい。このように、サーバ・マシン側とクライア
ント・マシン側にどのような機能を配置するかは設計に
際し自由に変更できる事項であり、複数のマシンを組合
せ、それらにどのような機能を配分し、実施するか等の
種々の変更は本発明の思想に包含される概念である。
【0026】B.システム構成 次に、図2のブロック図を参照して、本発明のシステム
構成について説明する。本発明の好適な実施例において
は、大別して、文書作成部110と音声合成部120に
よって構成される。文書作成部110と音声合成部12
0は、夫々別々に図1に示すハードウエア構成によって
実現することも、共通のハードウエアによって実現する
事もできる。
【0027】この文書作成部110は、図に示すように
かな文字列入力部101、かな漢字変換部103、かな
漢字辞書105、文書編集部107、文書記憶部10
9、かな漢字変換制御部113及び音声属性入力部11
5によって構成されている。
【0028】文書作成部110では、音声合成の入力と
なる埋め込みコマンドを埋め込んだ文章を作成し、記憶
する。かな文字列入力部101は、キーボード6等から
入力された入力信号を未確定文字列として保持するもの
である。本発明の好適な実施例においては、かな漢字変
換ソフトの管理するバッファがこのかな文字列入力部に
相当する。本発明の好適な実施例においては、かな漢字
変換ソフトを改良することにより本発明を実施している
が、本発明の思想はこれに限定されず、例えば、既に確
定した文章の文字列をマウス7のポインタ等を使用し、
範囲指定し、文字列を特定し、その文字列を、かな文字
入力部101の管理するバッファにコピーすることもで
きる。かかる場合、後述する本発明の変換を行った後、
その確定した文書中の特定された文字列を削除し、また
はその文字列の直前に、変換された文字列を組み込むこ
ととなる。
【0029】かな文字列変換部103は、かな文字列入
力部101の保持する文字列に対応した漢字かな混じり
文字列に変換すべく、かな漢字辞書105を探索する。
かな漢字辞書105は、かな文字列に対応する漢字かな
混じり文字列を記憶しており、かな文字列変換部103
は、未確定文字列に対応する漢字かな混じり文字列を探
索する。このとき、未確定文字列は、かな漢字辞書で管
理するかな文字列に対応した長さの文字列よりも長い場
合があり、かかる場合は、好適には形態素解析が行わ
れ、かな漢字辞書で管理するかな文字列の長さ相当に分
割される。この分割され、現在変換キーがおされること
により変換される対象となる文字列を、ここでは、変換
対象文字列と呼ぶ。かな文字列を漢字かな混じり文字列
に変換する場合は、この変換対象文字列を単位として変
換処理される。好適には、この変換、未確定文字列と区
別されうる態様(例えば、未確定文字列のうち変換対象
文字列の部分を反転表示し、未確定文字列の他の部分は
アンダーラインで表示する等)において表示画面に表示
される。
【0030】かな文字列に対応する漢字かな混じり文字
列は複数存在する場合もある。本発明の好適な実施例に
おいては、このように複数存在する場合は、各漢字かな
混じり文字列(候補文字列)に優先順位が定められてお
り、優先順位に従って表示装置に表示される。ユーザは
この変換の候補となる漢字かな混じり文字列からユーザ
の欲する漢字かな混じり文字列を選択することができ
る。このユーザの選択によりかな文字入力部101の保
持する未確定文字列は、このユーザによって選択された
漢字かな混じり文字列によって置換される。
【0031】文編集部107は、かな漢字変換部103
から漢字かな混じり文字列を受領し、これを編集するも
のである。本発明の好適な実施例においては、ワープロ
ソフトがこれに対応する。文書記憶部109は、文編集
部の編集結果を記憶媒体に格納するものである。
【0032】かな漢字変換制御部113は、かな文字列
入力部に保持されているかな文字列に対応する漢字かな
混じり文字列候補のうちどの漢字かな混じり文字列を採
用するかを、ユーザが指示する入力(例えば「変換キ
ー」や数字の入力)により決定し、かな漢字変換部に指
示するものである。また、本発明においては、音声合成
に際し、音声属性の変更を指示する音声属性埋め込みコ
マンドをユーザの調整した音声属性調整エントリの内容
に基づいて埋め込む機能をも有している。
【0033】音声属性入力部115は、ユーザからの音
声属性の変更を指示する入力を保持する。音声属性入力
部については後に詳述する。音声属性入力部に保持され
ているデータは未確定文字列または変換対象文字列に組
み込まれるが、好適には、たとえば、音声合成に於ける
デフォルトの音声属性の変更等をこの音声属性入力部1
15を使用して音声合成部130に指示することも可能
である。かかる場合、後述するパラメータ生成部14
3,合成器145の管理しているパラメータ情報を更新
する(例えば、「音量」の音声属性の場合、合成器14
5に指示を与え、合成音声の音量を上げ、「抑揚」の音
声属性の場合は、パラメータ生成部143にパラメータ
の変更を指示することもできる)。この音声属性入力部
115は、文書作成部110に含まれた態様で記載して
いるが、音声合成部130に含めることも可能であり、
また、文書作成部110と音声合成部130の双方に配
置し、変更された音声属性データの受渡しを行うように
してもよい。
【0034】この一方、音声合成部130は、音声合成
制御部131、言語解析不133、文法規則保持部13
5、読みアクセント辞書137、読み付与部139、ア
クセント付与部141、パラメータ生成部143、音声
合成部145及び音声発生部147によって構成されて
いる。
【0035】音声合成制御部131は、文書作成部11
0の文書記憶部109に記憶されている埋め込みコマン
ドを含む文章、または、かな漢字変換制御部から渡され
る埋め込みコマンドを含む文字列を入力として、埋め込
みコマンドによって読み・アクセントが指示されている
文字列と、指示されていない文字列を判別し、指示され
ていない文字列を言語解析部133に渡す。指示されて
いる文字列は、直接パラメータ生成部143に渡す。ま
た、パラメータの変更を指示する埋め込みコマンドを検
出した場合、パラメータ生成部143にパラメータの変
更を指示する。
【0036】なお、音声合成制御部131は、指示され
ていない文字列のみではなく、指示されている文字列を
も言語解析部133に渡すことも可能である。かかる場
合、言語解析部133によって決定された読み・アクセ
ントは無視され、埋め込みコマンドによって指示された
読み・アクセントが優先される。この方式において、埋
め込みコマンドの文字列の切り分けと、言語解析部13
3の行う文字列の切り分けを一致させるため、埋め込み
コマンドによる切り分けを指示するデリミタまたは、コ
マンドが言語解析部133に渡されることが望ましい。
【0037】言語解析部133は、音声合成制御部13
1から渡された文字列を、読み・アクセント辞書137
及び文法規則保持部135に格納されている文法規則を
参照し、形態素解析を行い、入力された文章を適切な形
態素単位に切り分ける。
【0038】文法規則格納部135は、言語解析部13
3における形態素解析に参照される文法規則を格納す
る。読み・アクセント辞書137は、漢字かな混じり文
字列に対応する「品詞」、「読み」及び「アクセント」
を格納する。
【0039】読み付与部139は、言語解析部133に
よって切り分けられた個々の形態素に対し、読み・アク
セント辞書137に格納された読み情報から、その形態
素の読みを決定する。
【0040】アクセント付与部141は、言語解析部1
33によって切り分けられた個々の形態素に対し、読み
・アクセント辞書137に格納されたアクセント情報か
ら、その形態素のアクセントを決定する。
【0041】パラメータ生成部143は、読み付与部1
39によって決定された読みと、アクセント付与部14
1によって決定されたアクセントに応じて、現在指定さ
れている「速さ」「ピッチ」「音量」「抑揚」「性別」
等のパラメータで音声合成を行うための音声パラメータ
を生成する。ここで、「現在指示されているパラメー
タ」とは、現在音声合成を行っている文字列の前に音声
属性示す音声コマンドが埋め込まれている場合、その音
声属性を採用し、このような音声コマンドがない場合
は、システムに予め設定されているデフォルトの音声属
性値が採用されることを意味するものである。
【0042】音声合成器145は、パラメータ生成部1
43によって生成された音声パラメータに従って音声信
号を生成する。本発明の好適な実施例においては、図1
のオーディオ・コントローラによってD/A(デジタル
/アナログ変換)変換等が行われることにより、実施さ
れる。音声発生部147は、音声合成器145によって
生成された音声信号に応じて音声を発生させる。本発明
の好適な実施例においては、図1のアンプ22およびス
ピーカ23によって実施される。
【0043】以上図2に示す核機能ブロックを説明した
が、これらの機能ブロックは、論理的機能ブロックであ
り、各々1つのまとまりを持ったハードウエアやソフト
ウエアによって実現されることを意味するのではなく、
複合し、または共通したハードウエアやソフトウエアに
よって実現可能である。
【0044】図7、図8は本発明の好適な実施例を示す
フローチャートである。まず、本発明の文書作成部のか
な漢字変換制御部113は未確定文字列があるか否かを
判断する(ステップ404)。本発明の好適な実施例に
おいては、未確定文字列があるか否かの判断は、かな漢
字変換制御部113の管理するバッファにデータが存在
するか否か判断される。かな漢字変換ソフトウエア起動
中にキーボード6から文字入力されることにより、制御
部113の管理するバッファにデータが蓄積される。未
確定文字列が存在しない場合は、未確定文字列の入力が
あるまで待機する。未確定文字列が存在する場合は、そ
の未確定文字列を表示する(ステップ405)。本発明
の好適な実施例においては、未確定文字列は確定され、
編集部107に渡されている確定文字列と未確定文字列
を区別するために、未確定文字列はアンダーラインまた
は反転表示等によって強調表示される。
【0045】この未確定文書が存在する状態でかな漢字
変換制御部113は、何らかのキーが押されるまで待機
する(ステップ407)。そして、かな漢字変換制御部
113は、入力されたキーが、かな漢字変換キーであっ
た場合(ステップ409)、かな漢字変換部103は、
かな漢字辞書105から最も優先順位の高い漢字かな混
じり文字列またはユーザが選択した漢字かな混じり文字
列を選択し、その文字列を新たな未確定文字列とする
(ステップ411)。すなわち、かな漢字変換制御部の
管理するバッファの内容がこの文字列に置換される。
【0046】次に、入力されたキーが、音声合成キーで
あった場合は(ステップ413)、その時点の音声属性
情報を取得する(ステップ415)。本発明の好適な実
施例においては、特定のPFキーが音声合成キーとして
割りふられており、かな漢字変換制御部113は、その
PFキーの入力がなされると、音声合成キーが押された
と判断する。但し、音声合成キーは、PFキーに限定さ
れるものではなく、キーボード6の特定のキーや複数の
キーの組合せであったり、マウス7によってクリックさ
れた音声合成コマンドの埋込みを指示するボタンアイコ
ンであってもよい。また、「その時点の属性情報」と
は、本発明の好適な実施例においては、デフォルトの属
性情報が存在しており、その文章に何等音声属性情報が
定義されていない場合、デフォルトの属性情報に従って
音声合成がなされる。本発明の好適な実施例において
は、音声属性情報を変更するためのパネル303が提供
されており、このパネル303の各音声属性情報を変更
するためのエントリ311−329によって、音声属性
を定義することができる。
【0047】図3に示すように、パネル303は、音声
属性の1つである「速さ」を変更するためのエントリ3
11,313、「ピッチ」を変更するためのエントリ3
15,317、「音量」を変更するためのエントリ31
9,321、「抑揚」を変更するためのエントリ32
3,325、「性別」を変更するためのエントリ32
7,329を含んでいる。本発明の好適な実施例におい
ては、音声属性のデフォルト値がシステムに予め設定さ
れており、ユーザが音声属性値を変更していない状態の
ときは、各音声属性のデフォルト値の状態で表示されて
いる。また、ユーザが変更を行った場合、最後に変更を
加えた状態で表示されている。
【0048】ユーザは、例えば音声合成を行う「速さ」
の調整は、スライダ311をマウス等のポインタを使用
してドラッグすることにより行うことができる。また、
属性値入力部313に「速さ」を示す数値を直接入力す
ることにより調整することもできる。本発明の好適な実
施例においては、スライダ311,315,319,3
23の変更に伴って、属性値入力部313,317,3
21,325の数値も変更し表示され、逆に、属性値入
力部313,317,321,325の数値の変更に伴
って、スライダ311,315,319,323も変更
して表示される。また、「性別」を変更するためのエン
トリ327,329は、マウス等のポインタでクリック
することにより属性を指定することができる。
【0049】なお、本発明の好適な実施例において、オ
ペレーティング・システムは、標準でGUIマルチウイ
ンドウ環境をサポートするものが採用されているが、本
発明は、GUIマルチウインドウ環境をサポートしな
い、キャラクタ・ベース環境でも実現可能であり、かか
る場合は、各音声属性値を数値又は文字として入力する
ためのエントリがユーザに提供される。また、図3に示
す音声属性を調整するためのエントリは、例示であり、
音声属性として、ここで示す音声属性の全てを有してい
ることは本発明の要件ではなく、また、例えば、息継ぎ
の長さ等、他の音声属性を含んでもよい。さらに、音声
属性を調整するためのエントリは、設計段階で種々変更
可能な事項であり、このような種々の変更は全て本発明
の思想に包含される概念である。
【0050】そして、音声属性が調整された後、図3に
示す「了解」のボタンアイコン331がユーザによって
押されると(ステップ417)、この調整された音声属
性値が埋込みコマンドの形式で未確定文字列に埋め込ま
れる(ステップ419)。本発明の好適な実施例におい
て、文章に対し埋め込まれる文章埋込みコマンドは、図
4に示す態様で埋め込まれる。図において、埋込みコマ
ンドは"[*"で開始し、"]"で終了する。また、「明日は
晴れでしょう。」は未確定文字列を示している。音声合
成部130は、この埋込みコマンドの開始を示す記号
と、埋込みコマンドの終了を示す記号を判別することが
でき、これにより、埋込みコマンドと、通常の文字列を
識別することができる。この埋込みコマンドの内容を説
明すると、"[*MS9P81G8Y3]"の"M"は性別の音声属性が男
性であることを示している。"F"の場合は女性を示す。"
S9"は「速さ」が9であることを示す。"P81"は「ピッ
チ」が81であることを示している。"G8"は音量が8であ
ることを示している。そして、"Y3"は抑揚の値が3であ
ることを示している。
【0051】但し、ここで示すような音声属性の種類を
示す記号と、その音声属性値をセットとして音声コマン
ドに埋め込む態様は、単なる一実施例にすぎず、音声合
成部130の音声合成制御部131がそれが音声コマン
ドであるということと、音声コマンドに埋め込まれた音
声属性の種類とその音声属性値の値およびそのような音
声属性の変更を行う文章中の個所を判断できる態様で埋
め込めばよい。例えば、音声コマンド中例えば最初の1
バイトは「性別」、2バイト目は「速さ」等音声属性値
の配置を固定的にし、音声合成制御部131は、その配
置に従って、音声属性の種類を判別してもよい。また、
埋込みコマンドはそのコマンドに含まれる音声属性を有
効にする文字列の先頭に埋め込むことが好ましいが、こ
の音声属性を有効にする文字列の文章中の位置が分かれ
ば、その文字列の先頭に埋め込む必要はない。この場
合、音声コマンドに、その音声コマンドに埋め込まれた
音声属性を有効にする文字列の文章中の位置を埋め込ん
でおき、音声合成を行う際に、音声合成制御部131
は、音声コマンドに埋め込まれた音声属性を有効にする
文字列の文章中の位置にきたとき、その音声コマンドの
音声属性を有効にすることもできる。
【0052】そして、その埋込みコマンドが埋め込まれ
た未確定文字列が新たな未確定文字列としてかな文字列
入力部101に保持される。ただし、埋込みコマンドの
埋込みは了解ボタンを押すことによって行うのではな
く、後述する確認ボタンを押すことによって行ってもよ
い。確認ボタンによって埋込みコマンドを埋め込む場
合、ユーザによって変更された最終状態の音声属性エン
トリの音声属性が音声コマンドとして埋め込まれる。な
お、この了解ボタンが押されたことに応答して、現在の
未確定文字列に埋込みコマンドを埋め込んだ状態で、音
声合成部130(図2)に渡し、音声合成を行うことも
可能である。
【0053】図3の「取消」のボタンアイコン333が
選択された場合、現在未確定文字列に埋め込まれている
埋込みコマンドが取り払われる。したがって、その状態
で後述する確定キーがおされると、その時点の属性情報
に従ってその文字列は音声合成されることとなる。
【0054】そして、「音声合成」のボタンアイコン3
35が押された場合には、その未確定文字列において、
音声属性情報が変更されている場合は、未確定文字列に
埋込みコマンドを埋め込んだ状態で、未確定文字列を音
声合成部130に渡し、音声合成を行う。また、その未
確定文字列に対し、音声属性情報が変更されていない場
合は、その時点の音声属性情報を埋込みコマンドの形式
にして埋込み、音声合成部130に渡し、音声合成を行
う。なお、本発明の好適な実施例において、「その時点
の音声属性情報」は一時的に格納されており、その一時
的に格納された情報から、埋込みコマンドが作成され
る。ただし、デフォルトの状態の場合は埋込みコマンド
の埋込みは行わず、埋込みコマンドのない未確定文字列
が音声合成部130に渡され、パラメータ生成部143
は、予め設定されたデフォルトの音声パラメータを生成
する。
【0055】次に、入力されたキーが、一時単語登録キ
ーであった場合は(ステップ427)、図5に示す一時
単語登録パネル305をオープンする(ステップ42
9)。この例では、未確定文字列「明日は晴れでしょ
う」のうち、かな漢字変換における変換単位である変換
対象文「明日」が変換対象として指定されている状態で
一時単語登録キーが押され、一時単語登録パネル305
に文字列「明日」に対する文字列音声属性情報を調整す
るためのエントリが表示されている。この一時単語登録
パネル305は、アクセントを調整するためのエントリ
343,347、読みを調整するためのエントリ34
5、品詞を指定するためのエントリ349を備えてい
る。ユーザは「明日」に対し、所望のアクセント、読み
を付与することができる。例えば、「あす」でなく「み
ょうにち」と発音することや、通常と異なるアクセント
を指定することもできる。
【0056】ここで、音声出力のボタンアイコン355
が押された場合(ステップ431)、一時単語登録され
た「読み」「アクセント」「品詞」情報等が存在する場
合、これらの文字列音声属性情報を埋込みコマンドの形
式にして変換対象文字列に埋め込み、それを音声合成部
130に渡し、音声合成を行う(ステップ433)。ま
た、一時単語登録された「読み」「アクセント」「品
詞」情報等が存在しない場合、変換対象文字列をそのま
ま音声合成部130に渡し、音声合成を行う。この場合
音声合成部は130、文法規則135と読み・アクセン
ト辞書137を使用して、変換対象文字列に「読み」と
「アクセント」を付与する。
【0057】了解のボタンアイコン351が押された場
合には(ステップ435)、一時単語登録された「読
み」「アクセント」「品詞」等の文字列音声属性情報を
埋込みコマンドの形式にして埋込み、それを新しい未確
定文字列とする(ステップ437)。この文字列音声属
性情報を埋め込んだ文字列の好適な実施例を図6に示
す。
【0058】この埋込みコマンドの内容を説明する
と、"[*Tあす 明日 0 000020 0B 1800]"の"[*T"は一時
単語登録の埋込みコマンド(文字列音声コマンド)の開
始を示す記号である。音声合成部130の音声制御部1
31は、この記号を検出することにより、文字列音声コ
マンドに埋め込まれた文字列音声属性を判断することが
できる。
【0059】"あす"は、この文字列音声コマンドに含ま
れる音声属性情報を有効にする変換対象文字列の読みを
示すものである。"明日"は、この文字列音声コマンドに
含まれる変換対象文字列を指定するものである。音声合
成部130の音声合成制御部131は、この文字列音声
コマンドによって指定された文字列を言語解析部133
に渡すことを中止し、パラメータ生成部143,合成器
145に直接音声合成パラメータの生成及び音声合成を
指示する。本発明の好適な実施例においては、音声合成
制御部は、音声コマンドの内容を判断して、直接パラメ
ータ生成部143,合成器145に音声合成パラメータ
の生成及び音声合成を指示するが、読み付与部139と
アクセント付与部141に情報を与えることにより、所
望の音声合成を行うことも可能である。
【0060】また、次に出現する"0"は、アクセントの
位置を示す音声属性値であり、"000020"は、品詞情報で
あり、固有名詞、さ行5段活用の動詞名詞である等の情
報を示す音声属性情報であり、"0B"は、タイプであり、
接尾語、接頭語、一般後等の情報を示す音声属性情報で
あり、"1800"は、付加情報であり、例えば、接頭語が付
く性質にあるか否か等の付加的な情報を示す音声属性情
報である。そして、"]"は音声コマンドの終わりを示す
記号である。
【0061】本発明の好適な実施例においては、変換対
象文字列「明日」は、「[*Tあす 明日 0 000020 0B 180
0]明日」というように、変換対象文字列の前に文字列音
声コマンドを埋め込んだ文字列に変換されるが、例え
ば、「*Tあす 0 000020 0B 1800*T明日*」というよう
に、変換対象文字列の前後に文字列音声コマンドとコマ
ンドの終了を示す記号を埋め込んだ文字列に変換しても
よく、かかる事項は設計段階で種々変更可能なものであ
る。
【0062】本発明の好適な実施例においては、文字列
音声コマンドに含まれる音声属性は、その順番が決まっ
ており、デリミタ(スペース文字)によって区分けされ
ていることによって、音声合成制御部131は、文字列
音声コマンドに含まれる音声属性を判断することができ
る。但し、この文字列音声コマンドにおいても、文章音
声コマンドと同様に、ここで示すような音声属性コマン
ドの態様は、単なる一実施例にすぎず、種々の変更が可
能である。
【0063】再び図8を参照すると、取消のボタンアイ
コン353が押された場合には(ステップ439)、埋
込みコマンドを含む変換対象文字列を埋込みコマンドを
含まない変換対象文字列に置換する。
【0064】次に、入力されたキーが、確定キーであっ
た場合は(ステップ451)、未確定文字列を確定文字
列として文編集部107に渡す(ステップ455)。従
って、文章音声属性情報や、文字列音声属性情報を含む
埋込みコマンドを埋め込んだ文字列が確定文字列として
文編集部107に渡ることとなる。したがって、図4,
6に示した例では、"[*MS9P81G8Y3][*Tあす 明日 0 000
020 0B 1800]明日は晴れでしょう"という確定文字列が
文編集部107に渡されることとなる。但し、埋込みコ
マンドを含む音声属性ファイルと、埋込みコマンドを含
まない通常のファイルを2種類作成することもできる。
このように、通常のファイルをも作成することにより、
音声コマンドが邪魔にならず、他の文書編集プログラム
等で作成した文章を利用することができる。なお、本発
明の好適な実施例においては、確定キーが押されたこと
に応答して、この未確定文字列を文編集部107だけで
はなく、音声合成部130に渡す事により、音声合成を
行い、音声調整の最終確認を行う。また、かな文字列入
力部101の管理するバッファをクリアする。
【0065】次に、入力されたキーが、その他のキーで
あった場合は(ステップ457)、そのキー入力に応じ
たその他の処理を行なう。例えば、カーソルを右に移動
するキーが押された場合は、カーソルを移動し、それが
未確定文字列の現在の変換対象文字列から、未確定文字
列のうちの現在の変換対象文字列でない文字列の部分に
移動された場合、変更対象文字列を現在のカーソルがあ
る文字を含む文字列に変更する。
【0066】図9は、埋込みコマンドを含む文章を受領
した音声合成制御部131の制御の手順を示すフローチ
ャートである。音声合成制御部131は、埋込みコマン
ドを含む文章を受領すると、その文章の先頭に、文章音
声コマンドが埋め込まれているか否かを判断する(ステ
ップ603)。文章音声コマンドが埋め込まれていた場
合は、音声合成制御部131は、文章音声コマンドに含
まれる音声属性の内容に従って、パラメータ生成部14
3、音声合成器145にパラメータや音声合成の変更を
指示する(ステップ605)。文章音声コマンドが埋め
込まれていなかった場合は、音声合成制御部131は、
次に、文字列音声コマンドが含まれているか否かを判断
する(ステップ607)。文字列音声コマンドが埋め込
まれていた場合は、音声合成制御部131は、文字列音
声コマンドに含まれる音声属性の内容に従って、パラメ
ータ生成部143にその文字列の読み、アクセントに従
ったパラメータの生成を指示する(ステップ609)。
読み付与部139,アクセント付与部141にコマンド
に含まれる音声属性に従って、「読み」,「アクセン
ト」を付与することを指示してもよい。
【0067】文字列音声コマンドが埋め込まれていなか
った場合は、入力した文字列を言語解析部133に渡
し、公知の音声合成手順に従い、音声合成を行う(ステ
ップ611)制御部131は、文章音声コマンドに含ま
れる音声属性の内容に従って、パラメータ生成部143
にそも文字列の読み、アクセントに従ったパラメータの
生成を指示する(ステップ609)。
【0068】その後、次の文字列を読み(ステップ61
5)、文章の終わりか否かを判断し(ステップ61
7)、文章の終わりであった場合は、音声合成処理を終
了させる(ステップ619)。文章の終わりでなかった
場合は、処理を続行し、新たに読み込まれた文字列が音
声コマンド(文章音声コマンド、または文字列音声コマ
ンド)であるかを判断する(ステップ619)。音声コ
マンドでない場合は、その文字列を言語解析部133へ
渡す。
【0069】本発明の好適な実施例においては、日本語
のかな漢字変換を利用した実施例に沿って説明したが、
本発明は英語等の他の言語においても実施可能である。
図3、4に示す文章音声コマンドの埋込みに関しては、
言語を問わず、ほぼ同様な内容で実施可能であり、かか
る変更は当業者に容易に理解できる事項であるため、こ
こでは特に説明を行わない。
【0070】以後、英語等の言語における文字列音声コ
マンドの埋込みについて説明を行う。英語に対し、本発
明を実施する場合、かな漢字変換部103とかな漢字辞
書105は特に必要にならない。但し、日本語のかな漢
字変換のように、入力した文字列に対し、その文字列の
属性を変更していくような態様であればこれに似た構成
を採用することも可能である。たとえば、入力した文字
列を未確定の状態にしておき、フォントの変更や、大文
字、小文字または、最初の1文字のみ大文字とすること
を指示する入力によって、この未確定文字列を変換する
ことも可能であり、この未確定文字列に、音声コマンド
を埋め込んでいく方式が考えられる。
【0071】本発明を英語等で実施した場合、図2に示
す(かな)文字入力部101には、キーボードから入力
された文字列が保持される。但し、既に入力し、確定し
た文字列をマウスのポインタ等で範囲指定し、その範囲
指定された文字列を(かな)文字入力部101で保持す
ることもできる。(かな漢字)変換制御部113は、
(かな)文字入力部101の保持する情報に、音声属性
入力部115で保持する音声属性情報を音声コマンドの
形式にして埋め込む。音声コマンドの埋め込みは、日本
語のかな漢字変換を用いた方法と同様な方法で行われ
る。
【0072】図10は、文字列音声コマンドの音声属性
情報を調整するためにユーザに表示される一時単語登録
入力パネルの一実施例を示す図である。英語等は1つの
単語はブランク文字等のデリミタ文字によって区切られ
ており、(かな漢字)変換制御部113は、1つの単語
を1つの変換対象文字列として認識することができる。
図5に示した一時単語登録パネル305と同様に、一時
単語登録パネル505は、アクセントを調整するための
エントリ543,547、読み(発音)を調整するため
のエントリ545、品詞を指定するためのエントリ54
9を備えている。ユーザは"fine"に対し、所望のアクセ
ント、読みを付与することができる。このれにより、例
えば、"lead"の文字列に対し、その発音を[li:d](「導
く」の意)や[led](「鉛」の意)とすることによって
読み分けを行うことができる。また、"LED"(発行ダイオ
ード)を[led]と発音するか[eli:di:]と発音するか、文
章ごと変更することができる。
【0073】
【発明の効果】以上説明したように、本発明によれば、
かな漢字変換時において未確定文字列に埋込みコマンド
が自動的に埋め込まれるため、作業が簡素化され、さら
にコマンド自身をユーザが憶える必要もなく、入力ミス
もなくなる。
【0074】その文字にのみ有効な埋込みコマンドとそ
の後の文章に有効な埋込みコマンドを使用して埋込みコ
マンドを含む文章の作成することにより、その文章にお
いてのみ特定の文字列を変更することを可能にし、一般
の辞書に影響を与えない。また、きめ細かい読み方を簡
単に定義することができる。
【0075】文字列単位の埋込みコマンド編集ウインド
ウを表示させることにより、通常の単語登録とほぼ共通
のユーザインターフェースを提供することが可能であ
り、ユーザに直感的に分かりやすい
【0076】かな漢字変換時において、未確定文字列を
試験的に音声合成することができるため、ユーザは、単
語等の短い文字列単位で、音声合成の結果を確認するこ
とができ、一旦作成した後に、文章全体または、文書中
の指定した文字列を入力として音声合成を試みるよりも
作業効率がよく、短時間で音声コマンド埋込み文章を作
成することができる。
【0077】また、文字列埋込みコマンド、文章埋込み
コマンドを含む音声コマンド埋込み文章を音声合成可能
な音声合成アプリケーションが提供されるため、ユーザ
の欲する繊細に微調整された音声合成を効率的、かつ効
果的に行うことができる。
【0078】
【図面の簡単な説明】
【図1】 ハードウェア構成を示すブロック図である。
【図2】 処理要素のブロック図である。
【図3】 本発明のユーザインターフェースを示す図で
ある。
【図4】 本発明の文章埋め込みコマンドを示す図であ
る。
【図5】 本発明のユーザインターフェースを示す図で
ある。
【図6】 本発明の文字列埋め込みコマンドを示す図で
ある。
【図7】 本発明の埋め込みコマンドを含む文章を作成
する手順を示すフローチャートである。
【図8】 本発明の埋め込みコマンドを含む文章を作成
する手順を示すフローチャートである。
【図9】 本発明の埋込みコマンドを含む文章を受領し
た音声合成制御部の制御の手順を示すフローチャートで
ある。
【図10】 本発明のユーザインターフェースを示す図
である。
【0079】
【符号の説明】
100 音声合成システム 110 文書作成部 130 音声合成部 101 かな文字列入力部 103 かな漢字変換部 105 かな漢字辞書 107 文書編集部 109 文書記憶部 113 かな漢字変換制御部 115 音声属性入力部 131 音声合成制御部 133 言語解析部 135 文法規則保持部 137 読みアクセント辞書 139 読み付与部 141 アクセント付与部 143 パラメータ生成部 145 音声合成部 147 音声発生部

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】入力装置と、表示装置と、かな文字列入力
    部と、かな漢字変換部と、かな漢字辞書と、かな漢字変
    換制御部と、文書編集部と、文書記憶部とを含む文書作
    成システムにおいて、音声属性情報を含み、音声合成を
    行う際に参照される音声コマンドの埋め込まれた文章を
    作成する方法であって、 (a)前記入力装置から入力されたかな文字列を未確定
    文字列として前記かな文字列入力部において保持する段
    階と、 (b)前記入力装置からユーザの前記未確定文字列に対
    する漢字かな混じり文字列へ変換することを指示する入
    力を検出する段階と、 (c)前記漢字かな混じり文字列への変換の指示の検出
    に応答して、前記かな漢字辞書から、前記未確定文字列
    の一部を構成する変換対象文字列に対応する漢字かな混
    じり文字列の候補である候補文字列を特定する段階と、 (d)前記候補文字列を前記表示装置に表示する段階
    と、 (e)前記入力装置から、前記候補文字列の内の1つで
    ある被選択文字列を選択するユーザ入力を検出する段階
    と、 (f)前記変換対象文字列を前記被選択文字列によって
    置換することにより、新たな未確定文字列とする段階
    と、 (g)ユーザの前記変換対象文字列へ前記音声コマンド
    の埋込みを指示する入力を検出する段階と、 (h)前記変換対象文字列へ埋め込む前記変換対象文字
    列の読み及びアクセントを含む音声属性情報をユーザが
    入力するためのエントリを表示する段階と、 (i)前記エントリへのユーザの入力に対応した音声属
    性情報を含む音声コマンドを前記変換対象文字列に埋め
    込む段階と、 (j)前記変換対象文字列の音声合成を指示するユーザ
    の入力を検出する段階と、 (k)前記音声コマンドの音声属性に従った音声合成を
    行う段階と、 を含む方法。
  2. 【請求項2】入力装置と、表示装置と、かな文字列入力
    部と、かな漢字変換部と、かな漢字辞書と、かな漢字変
    換制御部と、文書編集部と、文書記憶部とを含む文書作
    成システムにおいて、音声属性情報を含み、音声合成を
    行う際に参照される音声コマンドの埋め込まれた文章を
    作成する方法であって、 (a)前記入力装置から入力されたかな文字列を未確定
    文字列として前記かな文字列入力部において保持する段
    階と、 (b)前記入力装置からユーザの前記未確定文字列に対
    する漢字かな混じり文字列へ変換することを指示する入
    力を検出する段階と、 (c)前記漢字かな混じり文字列への変換の指示の検出
    に応答して、前記かな漢字辞書から、前記未確定文字列
    の一部を構成する変換対象文字列に対応する漢字かな混
    じり文字列の候補である候補文字列を特定する段階と、 (d)前記候補文字列を前記表示装置に表示する段階
    と、 (e)前記入力装置から、前記候補文字列の内の1つで
    ある被選択文字列を選択するユーザ入力を検出する段階
    と、 (f)前記変換対象文字列を前記被選択文字列によって
    置換することにより、新たな未確定文字列とする段階
    と、 (g)ユーザの前記変換対象文字列へ前記音声コマンド
    の埋込みを指示する入力を検出する段階と、 (h)前記変換対象文字列へ埋め込む前記変換対象文字
    列の読み及びアクセントを含む音声属性情報をユーザが
    入力するためのエントリを表示する段階と、 (i)前記エントリへのユーザの入力に対応した音声属
    性情報を含む音声コマンドを前記変換対象文字列に埋め
    込む段階と、 を含む方法。
  3. 【請求項3】音声属性情報を含み、音声合成を行う際に
    参照される音声コマンドの埋め込まれた文章を作成する
    方法であって、 (a)前記音声コマンドを埋め込む文字列特定する段階
    と、 (b)ユーザの前記特定された文字列へ前記音声コマン
    ドの埋込みを指示する入力を検出する段階と、 (c)前記特定された文字列の音声属性情報をユーザが
    入力するためのエントリを表示する段階と、 (d)前記エントリへのユーザの入力に対応した音声属
    性情報を含む音声コマンドを前記特定された文字列に埋
    め込む段階と、 を含む方法。
  4. 【請求項4】音声属性情報を含み、音声合成を行う際に
    参照される音声コマンドの埋め込まれた文章を作成する
    装置であって、 (a)ユーザによって入力された文字列を保持するかな
    文字列入力部と、 (b)かな文字列に対応する漢字かな混じり文字列を管
    理するかな漢字辞書と、 (c)前記かな文字列入力部の保持する文字列に対応す
    る漢字かな混じり文字列の候補を探索するかな漢字変換
    部と、 (d)ユーザ入力によって調整された音声属性値を保持
    する音声属性入力部と、 (e)ユーザ入力に応答して、前記かな漢字変換部に対
    し、前記漢字かな混じり文字列の候補から、かな文字列
    入力部の保持する文字列に対応する漢字かな混じり文字
    列の選択を指示し、さらに、前記音声属性入力部の保持
    する前記音声属性値を音声コマンドの形式で前記選択さ
    れた漢字かな混じり文字列に埋め込むかな漢字変換制御
    部と、 を含む装置。
  5. 【請求項5】音声属性情報を含み、音声合成を行う際に
    参照される音声コマンドの埋め込まれた文章を作成する
    文書作成部と、音声合成に使用するパラメータを生成す
    るパラメータ生成部を備え、入力した文章から音声合成
    を行う音声合成部を含む装置であって、 (a)ユーザによって入力された文字列を保持する文字
    列入力部と、 (b)ユーザ入力によって調整されたその文字列の読み
    方等を指示する文字列音声属性値を保持する音声属性入
    力部と、 (c)ユーザ入力に応答して、前記音声属性入力部の保
    持する前記文字列音声属性値を文字列音声コマンドの形
    式で前記入力された文字列に埋め込む変換制御部と、 (d)前記文字列音声コマンドの埋め込まれた文字列に
    埋め込まれた文字列音声属性情報に従って音声合成する
    ことを前記パラメータ生成部に指示する音声合成制御部
    と、 を含む装置。
  6. 【請求項6】音声属性情報を含む文章をもとに音声合成
    する装置であって、 (a)前記音声コマンドを埋め込む文字列を保持するか
    な文字列入力部と、 (b)かな文字列に対応する漢字かな混じり文字列を管
    理するかな漢字辞書と、 (c)前記かな文字列入力部の保持する文字列に対応す
    る漢字かな混じり文字列の候補を探索するかな漢字変換
    部と、 (d)ユーザ入力によって調整された音声属性値を保持
    する音声属性入力部と、 (e)ユーザ入力に応答して、前記かな漢字変換部に対
    し、前記漢字かな混じり文字列の候補から、かな文字列
    入力部の保持する文字列に対応する漢字かな混じり文字
    列の選択を指示し、さらに、前記音声属性入力部の保持
    する前記音声属性値を音声コマンドの形式で前記選択さ
    れた漢字かな混じり文字列に埋め込むかな漢字変換制御
    部と、 (f)前記音声コマンドの埋め込まれた漢字かな混じり
    文字列に埋め込まれ音声属性情報に従って音声合成する
    音声合成部と、 を含む装置。
  7. 【請求項7】入力した文章をもとに音声合成する装置で
    あって、 (a)文法規則情報及び読み・アクセント辞書に基づい
    て、入力された文章に含まれる文字列の読み方、アクセ
    ントを決定する言語解析部と、 (b)前記言語解析部で決定された前記入力された文章
    に含まれる文字列の読み方とアクセントに従って音声合
    成を行う音声合成器と、 (c)前記入力した文字列に対応する音声コマンドあっ
    て、音声合成に際し、前記入力した文字列の読み方及び
    アクセントを含む音声属性の音声属性値を指示する音声
    コマンドが埋め込まれていた場合、前記文字列を前記音
    声コマンドの指示する音声属性値に従って音声合成する
    ことを前記合成器に指示する音声合成制御部と、 を含む装置。
  8. 【請求項8】音声属性情報を含み、音声合成を行う際に
    参照される音声コマンドの埋め込まれた文章を作成する
    ことを文書作成装置に指示する制御プログラムを格納す
    る記憶媒体であって、 該制御プログラムは、 (a)前記音声コマンドを埋め込む文字列特定すること
    を前記文書作成装置に指示するプログラムコード手段
    と、 (b)ユーザの前記特定された文字列へ前記音声コマン
    ドの埋込みを指示する入力を検出することを前記文書作
    成装置に指示するプログラムコード手段と、 (c)前記特定された文字列の音声属性情報をユーザが
    入力するためのエントリを表示することを前記文書作成
    装置に指示するプログラムコード手段と、 (d)前記エントリへのユーザの入力に対応した音声属
    性情報を含む音声コマンドを前記特定された文字列に埋
    め込むことを前記文書作成装置に指示するプログラムコ
    ード手段と、 を含むことを特徴とする記憶媒体。
JP8136327A 1996-05-30 1996-05-30 音声合成方法、音声合成装置、文章への音声コマンド組み込み方法、及び装置 Pending JPH09325787A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP8136327A JPH09325787A (ja) 1996-05-30 1996-05-30 音声合成方法、音声合成装置、文章への音声コマンド組み込み方法、及び装置
EP97303442A EP0810582A3 (en) 1996-05-30 1997-05-20 Voice synthesizing method, voice synthesizer and apparatus for and method of embodying a voice command into a sentence

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8136327A JPH09325787A (ja) 1996-05-30 1996-05-30 音声合成方法、音声合成装置、文章への音声コマンド組み込み方法、及び装置

Publications (1)

Publication Number Publication Date
JPH09325787A true JPH09325787A (ja) 1997-12-16

Family

ID=15172639

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8136327A Pending JPH09325787A (ja) 1996-05-30 1996-05-30 音声合成方法、音声合成装置、文章への音声コマンド組み込み方法、及び装置

Country Status (2)

Country Link
EP (1) EP0810582A3 (ja)
JP (1) JPH09325787A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100378898B1 (ko) * 1999-04-30 2003-04-07 루센트 테크놀러지스 인크 발음 설정 방법, 컴퓨터 판독가능 매체를 포함하는 제조 물품 및, 그래픽 사용자 인터페이스 시스템
JP2011170191A (ja) * 2010-02-19 2011-09-01 Fujitsu Ltd 音声合成装置、音声合成方法、及び音声合成プログラム
WO2017179164A1 (ja) * 2016-04-14 2017-10-19 三菱電機株式会社 読み上げルール修正装置、読み上げルール修正方法
WO2023167212A1 (ja) * 2022-03-01 2023-09-07 株式会社KPMG Ignition Tokyo コンピュータプログラム、情報処理方法及び情報処理装置

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001014306A (ja) 1999-06-30 2001-01-19 Sony Corp 電子文書処理方法及び電子文書処理装置並びに電子文書処理プログラムが記録された記録媒体
EP3602539A4 (en) * 2017-03-23 2021-08-11 D&M Holdings, Inc. SYSTEM FOR PROVIDING EXPRESSIVE AND EMOTIONAL TEXT-TO-LANGUAGE

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02289071A (ja) * 1989-03-22 1990-11-29 Ricoh Co Ltd 音声出力機能付ワードプロセッサ
JPH04342297A (ja) * 1991-05-20 1992-11-27 Toshiba Corp 情報機器
JPH06176023A (ja) * 1992-12-08 1994-06-24 Toshiba Corp 音声合成システム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100378898B1 (ko) * 1999-04-30 2003-04-07 루센트 테크놀러지스 인크 발음 설정 방법, 컴퓨터 판독가능 매체를 포함하는 제조 물품 및, 그래픽 사용자 인터페이스 시스템
JP2011170191A (ja) * 2010-02-19 2011-09-01 Fujitsu Ltd 音声合成装置、音声合成方法、及び音声合成プログラム
WO2017179164A1 (ja) * 2016-04-14 2017-10-19 三菱電機株式会社 読み上げルール修正装置、読み上げルール修正方法
JPWO2017179164A1 (ja) * 2016-04-14 2018-07-26 三菱電機株式会社 読み上げルール修正装置、読み上げルール修正方法
WO2023167212A1 (ja) * 2022-03-01 2023-09-07 株式会社KPMG Ignition Tokyo コンピュータプログラム、情報処理方法及び情報処理装置

Also Published As

Publication number Publication date
EP0810582A2 (en) 1997-12-03
EP0810582A3 (en) 1998-09-30

Similar Documents

Publication Publication Date Title
EP1096472B1 (en) Audio playback of a multi-source written document
KR100287093B1 (ko) 음성 합성 방법, 음성 합성 장치, 하이퍼 텍스트의 제어 방법 및 제어 장치
US6286014B1 (en) Method and apparatus for acquiring a file to be linked
JP3795692B2 (ja) 文字処理装置および方法
JPH09325787A (ja) 音声合成方法、音声合成装置、文章への音声コマンド組み込み方法、及び装置
JPH11238051A (ja) 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体
JP2002207728A (ja) 表音文字生成装置及びそれを実現するためのプログラムを記録した記録媒体
JP4643183B2 (ja) 翻訳装置および翻訳プログラム
JP3284976B2 (ja) 音声合成装置及びコンピュータ可読記録媒体
JPH11272673A (ja) 文書処理方法および文書処理装置ならびに文書処理のためのコンピュータプログラムを記録した記録媒体
JPH09258763A (ja) 音声合成装置
JPH0916597A (ja) 文章推敲装置及び方法
JP3952009B2 (ja) 翻訳メモリシステム、翻訳方法、および翻訳メモリシステム用プログラム
JP3069532B2 (ja) かな漢字変換方法およびその装置並びにかな漢字変換方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2001014304A (ja) 文書作成装置、変換処理方法及び変換処理プログラムを記録した記録媒体
JPH08272780A (ja) 中国語入力処理装置及び中国語入力処理方法及び言語処理装置及び言語処理方法
JP3206600B2 (ja) 文書生成装置
JP3280729B2 (ja) 発音記号作成装置
JP2000010973A (ja) 文字入力システム、文字入力方法及びコンピュータ読み取り可能な記録媒体
JP2004287192A (ja) 合成音声編集装置及び合成音声編集プログラム
JPH11232003A (ja) ドキュメント表示装置,表示方法および記憶媒体
JPH08221095A (ja) 文章読み上げ方法
JPH0457148A (ja) 文書作成装置
JPH0785026A (ja) 辞書更生方法及び装置
JP2004037528A (ja) 情報処理装置およびその方法