JPH09325787A

JPH09325787A - 音声合成方法、音声合成装置、文章への音声コマンド組み込み方法、及び装置

Info

Publication number: JPH09325787A
Application number: JP8136327A
Authority: JP
Inventors: Shichiro Miyashita; 下七郎宮
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1996-05-30
Filing date: 1996-05-30
Publication date: 1997-12-16
Also published as: EP0810582A2; EP0810582A3

Abstract

(57)【要約】【課題】文章を作成する作業と、音声属性を調整する
作業を同時に行うことのできる方法を提供する。【解決手段】かな漢字変換後の未確定文字列が表示さ
れている状態で、未確定文字列に埋め込みコマンドを埋
め込むためのキーを押すと、音声属性情報入力部１１５
に保持されている音声属性情報が、埋込みコマンドの形
式で未確定文字列に埋め込まれる。また、この状態で
で、音声合成を指示するキーを押すと、その埋め込まれ
た音声属性情報にしたがって音声合成する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】この発明は、音声合成に関するも
のであり、より詳しくは、音声合成を行う際し、音声を
調整するための音声属性の指示を行う音声コマンドを埋
め込んだ文書を作成する方法に関する。

【０００２】

【従来の技術】従来の音声合成プログラムの多くは、音
声合成用の文章を作ることと音声合成の調整を行なう事
が別れており、音声合成用の文章を作る作業は、まず、
（１）かな漢字変換プログラム等をつかって文章を作成
し、次に、（２）システム全体の大まかな調整（「速
度」「音量」など）の調整を行ない、そして、（３）う
まく読めない単語については単語登録などによって調節
を行なう手順によって行われている。

【０００３】音声合成はこの（１）〜（３）の作業がす
べて終了した後に行ない、音声調整を行っている状態で
音声合成することはできない。また、音声合成と
（２），（３）の作業はカットアンドトライで繰り返す
ことが、一般的である。

【０００４】しかしこのような方法では、一度音声合成
させたい文章を作成し、それを音声合成してみて、不具
合があればそれをシステム全体の音声の設定や単語登録
などで調節したり、文章に直接読み方の属性を与えるこ
とで調整し、その後、再度音声合成して確認するという
作業をそれぞれ一度中断して、繰り返す必要があったた
め、作業効率が悪かった。

【０００５】音声合成プログラムの１つであるProTALKE
R/2 V1.0（「ProTALKER」はＩＢＭ社の商標）の場合、
上記の一般的な音声合成プログラムのもつ機能の他に、ａ）音声合成させる文章中に、プログラムのみが解読で
きる属性を変えるコマンドを埋込みコマンドとして埋め
込むことができる。このコマンド以降、次のコマンドが
現れるまでの文章を指定された属性で音声合成する。こ
の埋込みコマンドで設定できるのは、「性別」、「速
度」、「音量」、「ピッチ」、「抑揚」などである。単
語単位での「読み」「アクセント」などは、このコマン
ドではサポートされていないため、一時的な単語登録は
できない。ｂ）これらのコマンドはユーザーが自分でキー入力する
事を前提にしている。

【０００６】また、音声合成プログラムの１つである雄
弁家（「雄弁家」はリコー株式会社の商標) の場合、上
記の音声合成プログラム全般のもつ機能の他に、ａ）音声合成すべき文章の作成中に開く特殊な編集ウイ
ンドウ上で、文節単位で「読み」、「アクセント」はも
ちろん、「アクセントの強さ」や息継ぎ場所での「息継
ぎの長さ」、「音量」、「速度」などを調節することが
できる。ｂ）きめ細かい設定での各文節の「読み」は全候補パネ
ルから選択して選ぶことができ、ユーザーが入力する必
要はないが、他の属性（「アクセントの強さ」「息継ぎ
の長さ」等）は ProTALKER/2 と同じく直接ユーザーが
入力する必要がある。ｃ）ａ）とｂ）で設定したその文章に対するきめ細かい
属性を、属性ファイルとして保存し、後で文章を音声合
成する際に、文章ファイルと一緒に読み込んで利用する
方式を取っている。

【０００７】これらの「ProTALKER/2」，「雄弁家」等
の音声合成プログラムにおいても、文章を作成する作業
と、音声属性を調整する作業を同時に行うことが出来な
いため、文章全部を作成した後に、文章全体または、文
書中の指定した文字列を入力として音声合成を試みる必
要があり、音声を確認しながら文章を作成していくより
も作業効率が悪く、短時間で音声コマンド埋込み文章を
作成するには不向きであった。さらに、これらの方法
は、属性のコマンドを直接ユーザーがキー入力する必要
がったため、各種属性のコマンドを憶えたり、調べたり
する事は複雑になればなるほど面倒となり、また、直接
キー入力しなければならないため誤入力の可能性があっ
た。

【０００８】この一方、特開平５−１４３２７８号公報
には、文書中に存在する文字列の書体（明朝体、ゴシッ
ク等）、強調（全角、半角等）、装飾（アンダーライ
ン、網掛等）に対応した音声合成を行う方法が開示され
ている。かかる方法では、その書体、強調、装飾の変更
された文字列が、どのような属性を有する音声に合成さ
れるかが不明である。すなわち、その文字列にどのよう
な書体、強調、装飾を行えば、ユーザが欲する所望の属
性を有する音声に合成されるか不明であり、その習熟に
は相当の熟練が必要となる。また、その書体等を変更し
た文字列のみを試験的に音声合成することは示唆されて
おらず、文書全体を入力として音声合成を行う必要があ
った。

【０００９】また、特開平６−１７６０２３号公報に
は、文書中に存在する文字列の音声合成をかな漢字変換
時に入力されたかなの読みに優先度を置き行う（例え
ば、文字列「市場」が、「しじょう」ではなく「いち
ば」と入力され、かな漢字変換されたものである場合、
「市場」を「いちば」として音声合成を行う）方法が開
示されている。しかし、これは、１つの漢字に２以上の
読み方がある場合にのみ、その音声合成時の読み方を変
更し、ユーザが欲する所望の文字列の音声属性の変更を
行うことは不可能である。また、音声合成の際使用する
「読み・アクセント辞書」の優先度の変更を行ってしま
うため、例えば、ある文章でだけ「市場」を「いちば」
と発音したいと欲して、そのように単語登録を行うと、
「しじょう」と発音することを欲する他の文章において
も「いちば」と発音してしまうこととなってしまう。

【００１０】

【発明が解決しようとする課題】本発明の目的は、文章
を作成する作業と、音声属性を調整する作業を同時に行
うことのできる方法を提供することにある。

【００１１】本発明の更に他の目的は、音声属性をユー
ザが簡単に変更できる方法を提供することにある。

【００１２】

【課題を解決するための手段】本発明によれば、未確定
文字列に埋め込みコマンドを埋め込む機能をあるキーに
割り当てた上で、そのキーを押すと、未確定文字列を埋
込みコマンドが埋め込まれた未確定文字列に変換する。
また、かな漢字変換後の未確定文字列が表示されている
状態で、音声合成を指示するキーを押すと、その時点で
有効な読み方の属性にしたがって音声合成し、同時に未
確定文字列を属性を表す埋込みコマンドを追加した形式
に変換する。そして、例えば、コントロールパネルなど
を使って属性を変化させてその場で何度でも音声合成で
き、未確定文字列も適宜その時の属性にしたがって変化
させる。さらに、一つの未確定文字列に複数の文節（変
換対象文字列）が存在し、ある文節から違った属性で読
ませたい場合にはその文節にカーソルを移動し、そこで
属性を調節した後再度、この音声合成のキーを押すこと
でその文節の頭に埋込みコマンドを埋め込むことがで
き、その文節以降はその属性の読み方になる。

【００１３】本発明においては、一時的にのみ有効な単
語登録を起動する機能をあるキーに割り当て、単語登録
したい単語を一文節に切り直し、その単語が変換可能な
状態でそのキーを押すとその単語を登録すべき単語とし
て一時的にのみ有効な単語登録の機能を呼びだす。好適
には、ユーザーインターフェースは通常の単語登録とほ
ぼ同様なものとし、登録した情報をユーザー辞書に登録
するのではなく、埋込みコマンドとして未確定文字列に
埋め込む。埋め込まれる情報は、普通の単語登録に登録
される情報量と一致させる。そして、確定キーがユーザ
によって押されると、埋込みコマンドの挿入された文字
列が編集アプリケーションに渡される。この時点で再度
音声合成をすることもできる。

【００１４】本発明の一態様においては、入力装置から
入力されたかな文字列を未確定文字列としてかな文字列
入力部において保持する段階と、入力装置からユーザの
未確定文字列に対する漢字かな混じり文字列へ変換する
ことを指示する入力を検出する段階と、漢字かな混じり
文字列への変換の指示の検出に応答して、かな漢字辞書
から、未確定文字列の一部を構成する変換対象文字列に
対応する漢字かな混じり文字列の候補である候補文字列
を特定する段階と、候補文字列を表示装置に表示する段
階と、入力装置から、候補文字列の内の１つである被選
択文字列を選択するユーザ入力を検出する段階と、変換
対象文字列を被選択文字列によって置換することによ
り、新たな未確定文字列とする段階と、ユーザの変換対
象文字列へ音声コマンドの埋込みを指示する入力を検出
する段階と、変換対象文字列へ埋め込む変換対象文字列
の読み及びアクセントを含む音声属性情報をユーザが入
力するためのエントリを表示する段階と、エントリへの
ユーザの入力に対応した音声属性情報を含む音声コマン
ドを変換対象文字列に埋め込む段階と、変換対象文字列
の音声合成を指示するユーザの入力を検出する段階と、
音声コマンドの音声属性に従った音声合成を行う段階と
を含む音声合成を行う際に参照される音声コマンドの埋
め込まれた文章を作成する方法が提供される。

【００１５】本発明の他の一態様においては、入力装置
から入力されたかな文字列を未確定文字列としてかな文
字列入力部において保持する段階と、入力装置からユー
ザの未確定文字列に対する漢字かな混じり文字列へ変換
することを指示する入力を検出する段階と、漢字かな混
じり文字列への変換の指示の検出に応答して、かな漢字
辞書から、未確定文字列の一部を構成する変換対象文字
列に対応する漢字かな混じり文字列の候補である候補文
字列を特定する段階と、候補文字列を表示装置に表示す
る段階と、入力装置から、候補文字列の内の１つである
被選択文字列を選択するユーザ入力を検出する段階と、
変換対象文字列を被選択文字列によって置換することに
より、新たな未確定文字列とする段階と、ユーザの変換
対象文字列へ音声コマンドの埋込みを指示する入力を検
出する段階と、変換対象文字列へ埋め込む変換対象文字
列の読み及びアクセントを含む音声属性情報をユーザが
入力するためのエントリを表示する段階と、エントリへ
のユーザの入力に対応した音声属性情報を含む音声コマ
ンドを変換対象文字列に埋め込む段階とを含む音声合成
を行う際に参照される音声コマンドの埋め込まれた文章
を作成する方法が提供される。

【００１６】本発明の他の一態様においては、音声コマ
ンドを埋め込む文字列特定する段階と、ユーザの特定さ
れた文字列へ音声コマンドの埋込みを指示する入力を検
出する段階と、特定された文字列の音声属性情報をユー
ザが入力するためのエントリを表示する段階と、エント
リへのユーザの入力に対応した音声属性情報を含む音声
コマンドを特定された文字列に埋め込む段階とを含む音
声合成を行う際に参照される音声コマンドの埋め込まれ
た文章を作成する方法が提供される。

【００１７】本発明の他の一態様においては、ユーザに
よって入力された文字列を保持するかな文字列入力部
と、かな文字列に対応する漢字かな混じり文字列を管理
するかな漢字辞書と、かな文字列入力部の保持する文字
列に対応する漢字かな混じり文字列の候補を探索するか
な漢字変換部と、ユーザ入力によって調整された音声属
性値を保持する音声属性入力部と、ユーザ入力に応答し
て、かな漢字変換部に対し、漢字かな混じり文字列の候
補から、かな文字列入力部の保持する文字列に対応する
漢字かな混じり文字列の選択を指示し、さらに、音声属
性入力部の保持する音声属性値を音声コマンドの形式で
選択された漢字かな混じり文字列に埋め込むかな漢字変
換制御部とを含む音声合成を行う際に参照される音声コ
マンドの埋め込まれた文章を作成する装置が提供され
る。

【００１８】本発明の他の一態様においては、ユーザに
よって入力された文字列を保持する文字列入力部と、ユ
ーザ入力によって調整されたその文字列の読み方等を指
示する文字列音声属性値を保持する音声属性入力部と、
ユーザ入力に応答して、音声属性入力部の保持する文字
列音声属性値を文字列音声コマンドの形式で入力された
文字列に埋め込む変換制御部と、文字列音声コマンドの
埋め込まれた文字列に埋め込まれた文字列音声属性情報
に従って音声合成することをパラメータ生成部に指示す
る音声合成制御部とを含む音声属性情報を含み、音声合
成を行う際に参照される音声コマンドの埋め込まれた文
章を作成する文書作成部と、音声合成に使用するパラメ
ータを生成するパラメータ生成部を備え、入力した文章
から音声合成を行う音声合成部を含む装置が提供され
る。

【００１９】本発明の他の一態様においては、音声コマ
ンドを埋め込む文字列を保持するかな文字列入力部と、
かな文字列に対応する漢字かな混じり文字列を管理する
かな漢字辞書と、かな文字列入力部の保持する文字列に
対応する漢字かな混じり文字列の候補を探索するかな漢
字変換部と、ユーザ入力によって調整された音声属性値
を保持する音声属性入力部と、ユーザ入力に応答して、
かな漢字変換部に対し、漢字かな混じり文字列の候補か
ら、かな文字列入力部の保持する文字列に対応する漢字
かな混じり文字列の選択を指示し、さらに、音声属性入
力部の保持する音声属性値を音声コマンドの形式で選択
された漢字かな混じり文字列に埋め込むかな漢字変換制
御部と、音声コマンドの埋め込まれた漢字かな混じり文
字列に埋め込まれ音声属性情報に従って音声合成する音
声合成部とを含む音声属性情報を含む文章をもとに音声
合成する装置が提供される。

【００２０】本発明の他の一態様においては、文法規則
情報及び読み・アクセント辞書に基づいて、入力された
文章に含まれる文字列の読み方、アクセントを決定する
言語解析部と、言語解析部で決定された入力された文章
に含まれる文字列の読み方とアクセントに従って音声合
成を行う音声合成器と、入力した文字列に対応する音声
コマンドあって、音声合成に際に、入力した文字列の読
み方及びアクセントを含む音声属性の音声属性値を指示
する音声コマンドが埋め込まれていた場合、文字列を音
声コマンドの指示する音声属性値に従って音声合成する
ことを合成器に指示する音声合成制御部とを含む入力し
た文章をもとに音声合成する装置が提供される。

【００２１】本発明の他の一態様においては、音声コマ
ンドを埋め込む文字列特定することを文書作成装置に指
示するプログラムコード手段と、ユーザの特定された文
字列へ音声コマンドの埋込みを指示する入力を検出する
ことを文書作成装置に指示するプログラムコード手段
と、特定された文字列の音声属性情報をユーザが入力す
るためのエントリを表示することを文書作成装置に指示
するプログラムコード手段と、エントリへのユーザの入
力に対応した音声属性情報を含む音声コマンドを特定さ
れた文字列に埋め込むことを文書作成装置に指示するプ
ログラムコード手段とを含む音声合成を行う際に参照さ
れる音声コマンドの埋め込まれた文章を作成することを
文書作成装置に指示する制御プログラムを格納する記憶
媒体が提供される。

【００２２】

【実施例】以下、図面を参照して本発明の実施例を説明
する。図１を参照すると、本発明の音声合成システムを
実施するためのハードウェア構成の概観図が示されてい
る。音声合成システム１００は、中央処理装置（ＣＰ
Ｕ）１とメモリ４とを含んでいる。ＣＰＵ１とメモリ４
は、バス２を介して、補助記憶装置としてのハードディ
スク装置１３とを接続してある。フロッピーディスク装
置（またはＭＯ、ＣＤ−ＲＯＭ等の駆動装置）２０はフ
ロッピーディスクコントローラ１９を介してバス２へ接
続されている。

【００２３】フロッピーディスク装置（またはＭＯ、Ｃ
Ｄ−ＲＯＭ等の駆動装置）２０には、フロッピーディス
ク（またはＭＯ、ＣＤ−ＲＯＭ等の媒体）が挿入され、
このフロッピーディスク等やハードディスク装置１３、
ＲＯＭ１４には、オペレーティングシステムと協働して
ＣＰＵ等に命令を与え、本発明を実施するためのコンピ
ュータ・プログラムのコードを記録することができ、メ
モリ４にロードされることによって実行される。このコ
ンピュータ・プログラムのコードは圧縮し、または、複
数に分割して、複数の媒体に記録することもできる。

【００２４】音声合成システム１００は更に、ユーザ・
インターフェース・ハードウェアを備えたシステムとす
ることができ、ユーザ・インターフェース・ハードウェ
アとしては、例えば、入力をするためのポインティング
・デバイス（マウス、ジョイスティック等）７またはキ
ーボード６や、視覚データをユーザに提示するためのデ
ィスプレイ１２がある。また、パラレルポート１６を介
してプリンタを接続することや、シリアルポート１５を
介してモデムを接続することが可能であり、シリアルポ
ート１５およびモデムまたは通信アダプタ１８を介して
他のコンピュータ等と通信を行うことが可能である。ス
ピーカ２３は、オーディオ・コントローラから供給され
る音声信号を、アンプ２２を介して受領し、音声として
出力する。このように、本発明は、通常のパーソナルコ
ンピュータ（ＰＣ）、やワークステーションやこれらの
組合せによって実施可能であることを容易に理解できる
であろう。ただし、これらの構成要素は例示であり、そ
の全ての構成成要素が本発明の必須の構成要素となるわ
けではない。

【００２５】オペレーティング・システムとしては、Ｗ
ｉｎｄｏｗｓ（マイクロソフトの商標）、ＯＳ／２（Ｉ
ＢＭの商標）、ＡＩＸ（ＩＢＭの商標）上のＸ−ＷＩＮ
ＤＯＷシステム（ＭＩＴの商標）などの、標準でＧＵＩ
マルチウインドウ環境をサポートするものが望ましい
が、本発明は、ＰＣ−ＤＯＳ（ＩＢＭの商標）、ＭＳ−
ＤＯＳ（マイクロソフトの登録商標）などのキャラクタ
・ベース環境でも実現可能であり、特定のオペレーティ
ング・システム環境に限定されるものではない。また、
図１は、スタンド・アロン環境のシステムを示している
が、クライアント／サーバ・システムとして本発明を実
現し、クライアント・マシンは、サーバ・マシンに対し
て、イーサネット、トークン・リングなどでＬＡＮ接続
し、クライアント・マシン側には、後述する文書作成部
のかな文字列入力部と、サーバ・マシン側から音声デー
タを受領し、それを再生するための合成器及びスピーカ
のみを配置し、その他の機能をサーバ・マシン側に配置
してもよい。このように、サーバ・マシン側とクライア
ント・マシン側にどのような機能を配置するかは設計に
際し自由に変更できる事項であり、複数のマシンを組合
せ、それらにどのような機能を配分し、実施するか等の
種々の変更は本発明の思想に包含される概念である。

【００２６】Ｂ．システム構成次に、図２のブロック図を参照して、本発明のシステム
構成について説明する。本発明の好適な実施例において
は、大別して、文書作成部１１０と音声合成部１２０に
よって構成される。文書作成部１１０と音声合成部１２
０は、夫々別々に図１に示すハードウエア構成によって
実現することも、共通のハードウエアによって実現する
事もできる。

【００２７】この文書作成部１１０は、図に示すように
かな文字列入力部１０１、かな漢字変換部１０３、かな
漢字辞書１０５、文書編集部１０７、文書記憶部１０
９、かな漢字変換制御部１１３及び音声属性入力部１１
５によって構成されている。

【００２８】文書作成部１１０では、音声合成の入力と
なる埋め込みコマンドを埋め込んだ文章を作成し、記憶
する。かな文字列入力部１０１は、キーボード６等から
入力された入力信号を未確定文字列として保持するもの
である。本発明の好適な実施例においては、かな漢字変
換ソフトの管理するバッファがこのかな文字列入力部に
相当する。本発明の好適な実施例においては、かな漢字
変換ソフトを改良することにより本発明を実施している
が、本発明の思想はこれに限定されず、例えば、既に確
定した文章の文字列をマウス７のポインタ等を使用し、
範囲指定し、文字列を特定し、その文字列を、かな文字
入力部１０１の管理するバッファにコピーすることもで
きる。かかる場合、後述する本発明の変換を行った後、
その確定した文書中の特定された文字列を削除し、また
はその文字列の直前に、変換された文字列を組み込むこ
ととなる。

【００２９】かな文字列変換部１０３は、かな文字列入
力部１０１の保持する文字列に対応した漢字かな混じり
文字列に変換すべく、かな漢字辞書１０５を探索する。
かな漢字辞書１０５は、かな文字列に対応する漢字かな
混じり文字列を記憶しており、かな文字列変換部１０３
は、未確定文字列に対応する漢字かな混じり文字列を探
索する。このとき、未確定文字列は、かな漢字辞書で管
理するかな文字列に対応した長さの文字列よりも長い場
合があり、かかる場合は、好適には形態素解析が行わ
れ、かな漢字辞書で管理するかな文字列の長さ相当に分
割される。この分割され、現在変換キーがおされること
により変換される対象となる文字列を、ここでは、変換
対象文字列と呼ぶ。かな文字列を漢字かな混じり文字列
に変換する場合は、この変換対象文字列を単位として変
換処理される。好適には、この変換、未確定文字列と区
別されうる態様（例えば、未確定文字列のうち変換対象
文字列の部分を反転表示し、未確定文字列の他の部分は
アンダーラインで表示する等）において表示画面に表示
される。

【００３０】かな文字列に対応する漢字かな混じり文字
列は複数存在する場合もある。本発明の好適な実施例に
おいては、このように複数存在する場合は、各漢字かな
混じり文字列（候補文字列）に優先順位が定められてお
り、優先順位に従って表示装置に表示される。ユーザは
この変換の候補となる漢字かな混じり文字列からユーザ
の欲する漢字かな混じり文字列を選択することができ
る。このユーザの選択によりかな文字入力部１０１の保
持する未確定文字列は、このユーザによって選択された
漢字かな混じり文字列によって置換される。

【００３１】文編集部１０７は、かな漢字変換部１０３
から漢字かな混じり文字列を受領し、これを編集するも
のである。本発明の好適な実施例においては、ワープロ
ソフトがこれに対応する。文書記憶部１０９は、文編集
部の編集結果を記憶媒体に格納するものである。

【００３２】かな漢字変換制御部１１３は、かな文字列
入力部に保持されているかな文字列に対応する漢字かな
混じり文字列候補のうちどの漢字かな混じり文字列を採
用するかを、ユーザが指示する入力（例えば「変換キ
ー」や数字の入力）により決定し、かな漢字変換部に指
示するものである。また、本発明においては、音声合成
に際し、音声属性の変更を指示する音声属性埋め込みコ
マンドをユーザの調整した音声属性調整エントリの内容
に基づいて埋め込む機能をも有している。

【００３３】音声属性入力部１１５は、ユーザからの音
声属性の変更を指示する入力を保持する。音声属性入力
部については後に詳述する。音声属性入力部に保持され
ているデータは未確定文字列または変換対象文字列に組
み込まれるが、好適には、たとえば、音声合成に於ける
デフォルトの音声属性の変更等をこの音声属性入力部１
１５を使用して音声合成部１３０に指示することも可能
である。かかる場合、後述するパラメータ生成部１４
３，合成器１４５の管理しているパラメータ情報を更新
する（例えば、「音量」の音声属性の場合、合成器１４
５に指示を与え、合成音声の音量を上げ、「抑揚」の音
声属性の場合は、パラメータ生成部１４３にパラメータ
の変更を指示することもできる）。この音声属性入力部
１１５は、文書作成部１１０に含まれた態様で記載して
いるが、音声合成部１３０に含めることも可能であり、
また、文書作成部１１０と音声合成部１３０の双方に配
置し、変更された音声属性データの受渡しを行うように
してもよい。

【００３４】この一方、音声合成部１３０は、音声合成
制御部１３１、言語解析不１３３、文法規則保持部１３
５、読みアクセント辞書１３７、読み付与部１３９、ア
クセント付与部１４１、パラメータ生成部１４３、音声
合成部１４５及び音声発生部１４７によって構成されて
いる。

【００３５】音声合成制御部１３１は、文書作成部１１
０の文書記憶部１０９に記憶されている埋め込みコマン
ドを含む文章、または、かな漢字変換制御部から渡され
る埋め込みコマンドを含む文字列を入力として、埋め込
みコマンドによって読み・アクセントが指示されている
文字列と、指示されていない文字列を判別し、指示され
ていない文字列を言語解析部１３３に渡す。指示されて
いる文字列は、直接パラメータ生成部１４３に渡す。ま
た、パラメータの変更を指示する埋め込みコマンドを検
出した場合、パラメータ生成部１４３にパラメータの変
更を指示する。

【００３６】なお、音声合成制御部１３１は、指示され
ていない文字列のみではなく、指示されている文字列を
も言語解析部１３３に渡すことも可能である。かかる場
合、言語解析部１３３によって決定された読み・アクセ
ントは無視され、埋め込みコマンドによって指示された
読み・アクセントが優先される。この方式において、埋
め込みコマンドの文字列の切り分けと、言語解析部１３
３の行う文字列の切り分けを一致させるため、埋め込み
コマンドによる切り分けを指示するデリミタまたは、コ
マンドが言語解析部１３３に渡されることが望ましい。

【００３７】言語解析部１３３は、音声合成制御部１３
１から渡された文字列を、読み・アクセント辞書１３７
及び文法規則保持部１３５に格納されている文法規則を
参照し、形態素解析を行い、入力された文章を適切な形
態素単位に切り分ける。

【００３８】文法規則格納部１３５は、言語解析部１３
３における形態素解析に参照される文法規則を格納す
る。読み・アクセント辞書１３７は、漢字かな混じり文
字列に対応する「品詞」、「読み」及び「アクセント」
を格納する。

【００３９】読み付与部１３９は、言語解析部１３３に
よって切り分けられた個々の形態素に対し、読み・アク
セント辞書１３７に格納された読み情報から、その形態
素の読みを決定する。

【００４０】アクセント付与部１４１は、言語解析部１
３３によって切り分けられた個々の形態素に対し、読み
・アクセント辞書１３７に格納されたアクセント情報か
ら、その形態素のアクセントを決定する。

【００４１】パラメータ生成部１４３は、読み付与部１
３９によって決定された読みと、アクセント付与部１４
１によって決定されたアクセントに応じて、現在指定さ
れている「速さ」「ピッチ」「音量」「抑揚」「性別」
等のパラメータで音声合成を行うための音声パラメータ
を生成する。ここで、「現在指示されているパラメー
タ」とは、現在音声合成を行っている文字列の前に音声
属性示す音声コマンドが埋め込まれている場合、その音
声属性を採用し、このような音声コマンドがない場合
は、システムに予め設定されているデフォルトの音声属
性値が採用されることを意味するものである。

【００４２】音声合成器１４５は、パラメータ生成部１
４３によって生成された音声パラメータに従って音声信
号を生成する。本発明の好適な実施例においては、図１
のオーディオ・コントローラによってＤ／Ａ（デジタル
／アナログ変換）変換等が行われることにより、実施さ
れる。音声発生部１４７は、音声合成器１４５によって
生成された音声信号に応じて音声を発生させる。本発明
の好適な実施例においては、図１のアンプ２２およびス
ピーカ２３によって実施される。

【００４３】以上図２に示す核機能ブロックを説明した
が、これらの機能ブロックは、論理的機能ブロックであ
り、各々１つのまとまりを持ったハードウエアやソフト
ウエアによって実現されることを意味するのではなく、
複合し、または共通したハードウエアやソフトウエアに
よって実現可能である。

【００４４】図７、図８は本発明の好適な実施例を示す
フローチャートである。まず、本発明の文書作成部のか
な漢字変換制御部１１３は未確定文字列があるか否かを
判断する（ステップ４０４）。本発明の好適な実施例に
おいては、未確定文字列があるか否かの判断は、かな漢
字変換制御部１１３の管理するバッファにデータが存在
するか否か判断される。かな漢字変換ソフトウエア起動
中にキーボード６から文字入力されることにより、制御
部１１３の管理するバッファにデータが蓄積される。未
確定文字列が存在しない場合は、未確定文字列の入力が
あるまで待機する。未確定文字列が存在する場合は、そ
の未確定文字列を表示する（ステップ４０５）。本発明
の好適な実施例においては、未確定文字列は確定され、
編集部１０７に渡されている確定文字列と未確定文字列
を区別するために、未確定文字列はアンダーラインまた
は反転表示等によって強調表示される。

【００４５】この未確定文書が存在する状態でかな漢字
変換制御部１１３は、何らかのキーが押されるまで待機
する（ステップ４０７）。そして、かな漢字変換制御部
１１３は、入力されたキーが、かな漢字変換キーであっ
た場合（ステップ４０９）、かな漢字変換部１０３は、
かな漢字辞書１０５から最も優先順位の高い漢字かな混
じり文字列またはユーザが選択した漢字かな混じり文字
列を選択し、その文字列を新たな未確定文字列とする
（ステップ４１１）。すなわち、かな漢字変換制御部の
管理するバッファの内容がこの文字列に置換される。

【００４６】次に、入力されたキーが、音声合成キーで
あった場合は（ステップ４１３）、その時点の音声属性
情報を取得する（ステップ４１５）。本発明の好適な実
施例においては、特定のＰＦキーが音声合成キーとして
割りふられており、かな漢字変換制御部１１３は、その
ＰＦキーの入力がなされると、音声合成キーが押された
と判断する。但し、音声合成キーは、ＰＦキーに限定さ
れるものではなく、キーボード６の特定のキーや複数の
キーの組合せであったり、マウス７によってクリックさ
れた音声合成コマンドの埋込みを指示するボタンアイコ
ンであってもよい。また、「その時点の属性情報」と
は、本発明の好適な実施例においては、デフォルトの属
性情報が存在しており、その文章に何等音声属性情報が
定義されていない場合、デフォルトの属性情報に従って
音声合成がなされる。本発明の好適な実施例において
は、音声属性情報を変更するためのパネル３０３が提供
されており、このパネル３０３の各音声属性情報を変更
するためのエントリ３１１−３２９によって、音声属性
を定義することができる。

【００４７】図３に示すように、パネル３０３は、音声
属性の１つである「速さ」を変更するためのエントリ３
１１，３１３、「ピッチ」を変更するためのエントリ３
１５，３１７、「音量」を変更するためのエントリ３１
９，３２１、「抑揚」を変更するためのエントリ３２
３，３２５、「性別」を変更するためのエントリ３２
７，３２９を含んでいる。本発明の好適な実施例におい
ては、音声属性のデフォルト値がシステムに予め設定さ
れており、ユーザが音声属性値を変更していない状態の
ときは、各音声属性のデフォルト値の状態で表示されて
いる。また、ユーザが変更を行った場合、最後に変更を
加えた状態で表示されている。

【００４８】ユーザは、例えば音声合成を行う「速さ」
の調整は、スライダ３１１をマウス等のポインタを使用
してドラッグすることにより行うことができる。また、
属性値入力部３１３に「速さ」を示す数値を直接入力す
ることにより調整することもできる。本発明の好適な実
施例においては、スライダ３１１，３１５，３１９，３
２３の変更に伴って、属性値入力部３１３，３１７，３
２１，３２５の数値も変更し表示され、逆に、属性値入
力部３１３，３１７，３２１，３２５の数値の変更に伴
って、スライダ３１１，３１５，３１９，３２３も変更
して表示される。また、「性別」を変更するためのエン
トリ３２７，３２９は、マウス等のポインタでクリック
することにより属性を指定することができる。

【００４９】なお、本発明の好適な実施例において、オ
ペレーティング・システムは、標準でＧＵＩマルチウイ
ンドウ環境をサポートするものが採用されているが、本
発明は、ＧＵＩマルチウインドウ環境をサポートしな
い、キャラクタ・ベース環境でも実現可能であり、かか
る場合は、各音声属性値を数値又は文字として入力する
ためのエントリがユーザに提供される。また、図３に示
す音声属性を調整するためのエントリは、例示であり、
音声属性として、ここで示す音声属性の全てを有してい
ることは本発明の要件ではなく、また、例えば、息継ぎ
の長さ等、他の音声属性を含んでもよい。さらに、音声
属性を調整するためのエントリは、設計段階で種々変更
可能な事項であり、このような種々の変更は全て本発明
の思想に包含される概念である。

【００５０】そして、音声属性が調整された後、図３に
示す「了解」のボタンアイコン３３１がユーザによって
押されると（ステップ４１７）、この調整された音声属
性値が埋込みコマンドの形式で未確定文字列に埋め込ま
れる（ステップ４１９）。本発明の好適な実施例におい
て、文章に対し埋め込まれる文章埋込みコマンドは、図
４に示す態様で埋め込まれる。図において、埋込みコマ
ンドは"[*"で開始し、"]"で終了する。また、「明日は
晴れでしょう。」は未確定文字列を示している。音声合
成部１３０は、この埋込みコマンドの開始を示す記号
と、埋込みコマンドの終了を示す記号を判別することが
でき、これにより、埋込みコマンドと、通常の文字列を
識別することができる。この埋込みコマンドの内容を説
明すると、"[*MS9P81G8Y3]"の"M"は性別の音声属性が男
性であることを示している。"F"の場合は女性を示す。"
S9"は「速さ」が9であることを示す。"P81"は「ピッ
チ」が81であることを示している。"G8"は音量が8であ
ることを示している。そして、"Y3"は抑揚の値が3であ
ることを示している。

【００５１】但し、ここで示すような音声属性の種類を
示す記号と、その音声属性値をセットとして音声コマン
ドに埋め込む態様は、単なる一実施例にすぎず、音声合
成部１３０の音声合成制御部１３１がそれが音声コマン
ドであるということと、音声コマンドに埋め込まれた音
声属性の種類とその音声属性値の値およびそのような音
声属性の変更を行う文章中の個所を判断できる態様で埋
め込めばよい。例えば、音声コマンド中例えば最初の１
バイトは「性別」、２バイト目は「速さ」等音声属性値
の配置を固定的にし、音声合成制御部１３１は、その配
置に従って、音声属性の種類を判別してもよい。また、
埋込みコマンドはそのコマンドに含まれる音声属性を有
効にする文字列の先頭に埋め込むことが好ましいが、こ
の音声属性を有効にする文字列の文章中の位置が分かれ
ば、その文字列の先頭に埋め込む必要はない。この場
合、音声コマンドに、その音声コマンドに埋め込まれた
音声属性を有効にする文字列の文章中の位置を埋め込ん
でおき、音声合成を行う際に、音声合成制御部１３１
は、音声コマンドに埋め込まれた音声属性を有効にする
文字列の文章中の位置にきたとき、その音声コマンドの
音声属性を有効にすることもできる。

【００５２】そして、その埋込みコマンドが埋め込まれ
た未確定文字列が新たな未確定文字列としてかな文字列
入力部１０１に保持される。ただし、埋込みコマンドの
埋込みは了解ボタンを押すことによって行うのではな
く、後述する確認ボタンを押すことによって行ってもよ
い。確認ボタンによって埋込みコマンドを埋め込む場
合、ユーザによって変更された最終状態の音声属性エン
トリの音声属性が音声コマンドとして埋め込まれる。な
お、この了解ボタンが押されたことに応答して、現在の
未確定文字列に埋込みコマンドを埋め込んだ状態で、音
声合成部１３０（図２）に渡し、音声合成を行うことも
可能である。

【００５３】図３の「取消」のボタンアイコン３３３が
選択された場合、現在未確定文字列に埋め込まれている
埋込みコマンドが取り払われる。したがって、その状態
で後述する確定キーがおされると、その時点の属性情報
に従ってその文字列は音声合成されることとなる。

【００５４】そして、「音声合成」のボタンアイコン３
３５が押された場合には、その未確定文字列において、
音声属性情報が変更されている場合は、未確定文字列に
埋込みコマンドを埋め込んだ状態で、未確定文字列を音
声合成部１３０に渡し、音声合成を行う。また、その未
確定文字列に対し、音声属性情報が変更されていない場
合は、その時点の音声属性情報を埋込みコマンドの形式
にして埋込み、音声合成部１３０に渡し、音声合成を行
う。なお、本発明の好適な実施例において、「その時点
の音声属性情報」は一時的に格納されており、その一時
的に格納された情報から、埋込みコマンドが作成され
る。ただし、デフォルトの状態の場合は埋込みコマンド
の埋込みは行わず、埋込みコマンドのない未確定文字列
が音声合成部１３０に渡され、パラメータ生成部１４３
は、予め設定されたデフォルトの音声パラメータを生成
する。

【００５５】次に、入力されたキーが、一時単語登録キ
ーであった場合は（ステップ４２７）、図５に示す一時
単語登録パネル３０５をオープンする（ステップ４２
９）。この例では、未確定文字列「明日は晴れでしょ
う」のうち、かな漢字変換における変換単位である変換
対象文「明日」が変換対象として指定されている状態で
一時単語登録キーが押され、一時単語登録パネル３０５
に文字列「明日」に対する文字列音声属性情報を調整す
るためのエントリが表示されている。この一時単語登録
パネル３０５は、アクセントを調整するためのエントリ
３４３，３４７、読みを調整するためのエントリ３４
５、品詞を指定するためのエントリ３４９を備えてい
る。ユーザは「明日」に対し、所望のアクセント、読み
を付与することができる。例えば、「あす」でなく「み
ょうにち」と発音することや、通常と異なるアクセント
を指定することもできる。

【００５６】ここで、音声出力のボタンアイコン３５５
が押された場合（ステップ４３１）、一時単語登録され
た「読み」「アクセント」「品詞」情報等が存在する場
合、これらの文字列音声属性情報を埋込みコマンドの形
式にして変換対象文字列に埋め込み、それを音声合成部
１３０に渡し、音声合成を行う（ステップ４３３）。ま
た、一時単語登録された「読み」「アクセント」「品
詞」情報等が存在しない場合、変換対象文字列をそのま
ま音声合成部１３０に渡し、音声合成を行う。この場合
音声合成部は１３０、文法規則１３５と読み・アクセン
ト辞書１３７を使用して、変換対象文字列に「読み」と
「アクセント」を付与する。

【００５７】了解のボタンアイコン３５１が押された場
合には（ステップ４３５）、一時単語登録された「読
み」「アクセント」「品詞」等の文字列音声属性情報を
埋込みコマンドの形式にして埋込み、それを新しい未確
定文字列とする（ステップ４３７）。この文字列音声属
性情報を埋め込んだ文字列の好適な実施例を図６に示
す。

【００５８】この埋込みコマンドの内容を説明する
と、"[*Tあす明日 0 000020 0B 1800]"の"[*T"は一時
単語登録の埋込みコマンド（文字列音声コマンド）の開
始を示す記号である。音声合成部１３０の音声制御部１
３１は、この記号を検出することにより、文字列音声コ
マンドに埋め込まれた文字列音声属性を判断することが
できる。

【００５９】"あす"は、この文字列音声コマンドに含ま
れる音声属性情報を有効にする変換対象文字列の読みを
示すものである。"明日"は、この文字列音声コマンドに
含まれる変換対象文字列を指定するものである。音声合
成部１３０の音声合成制御部１３１は、この文字列音声
コマンドによって指定された文字列を言語解析部１３３
に渡すことを中止し、パラメータ生成部１４３，合成器
１４５に直接音声合成パラメータの生成及び音声合成を
指示する。本発明の好適な実施例においては、音声合成
制御部は、音声コマンドの内容を判断して、直接パラメ
ータ生成部１４３，合成器１４５に音声合成パラメータ
の生成及び音声合成を指示するが、読み付与部１３９と
アクセント付与部１４１に情報を与えることにより、所
望の音声合成を行うことも可能である。

【００６０】また、次に出現する"0"は、アクセントの
位置を示す音声属性値であり、"000020"は、品詞情報で
あり、固有名詞、さ行５段活用の動詞名詞である等の情
報を示す音声属性情報であり、"0B"は、タイプであり、
接尾語、接頭語、一般後等の情報を示す音声属性情報で
あり、"1800"は、付加情報であり、例えば、接頭語が付
く性質にあるか否か等の付加的な情報を示す音声属性情
報である。そして、"]"は音声コマンドの終わりを示す
記号である。

【００６１】本発明の好適な実施例においては、変換対
象文字列「明日」は、「[*Tあす明日 0 000020 0B 180
0]明日」というように、変換対象文字列の前に文字列音
声コマンドを埋め込んだ文字列に変換されるが、例え
ば、「*Tあす 0 000020 0B 1800*T明日*」というよう
に、変換対象文字列の前後に文字列音声コマンドとコマ
ンドの終了を示す記号を埋め込んだ文字列に変換しても
よく、かかる事項は設計段階で種々変更可能なものであ
る。

【００６２】本発明の好適な実施例においては、文字列
音声コマンドに含まれる音声属性は、その順番が決まっ
ており、デリミタ（スペース文字）によって区分けされ
ていることによって、音声合成制御部１３１は、文字列
音声コマンドに含まれる音声属性を判断することができ
る。但し、この文字列音声コマンドにおいても、文章音
声コマンドと同様に、ここで示すような音声属性コマン
ドの態様は、単なる一実施例にすぎず、種々の変更が可
能である。

【００６３】再び図８を参照すると、取消のボタンアイ
コン３５３が押された場合には（ステップ４３９）、埋
込みコマンドを含む変換対象文字列を埋込みコマンドを
含まない変換対象文字列に置換する。

【００６４】次に、入力されたキーが、確定キーであっ
た場合は（ステップ４５１）、未確定文字列を確定文字
列として文編集部１０７に渡す（ステップ４５５）。従
って、文章音声属性情報や、文字列音声属性情報を含む
埋込みコマンドを埋め込んだ文字列が確定文字列として
文編集部１０７に渡ることとなる。したがって、図４，
６に示した例では、"[*MS9P81G8Y3][*Tあす明日 0 000
020 0B 1800]明日は晴れでしょう"という確定文字列が
文編集部１０７に渡されることとなる。但し、埋込みコ
マンドを含む音声属性ファイルと、埋込みコマンドを含
まない通常のファイルを２種類作成することもできる。
このように、通常のファイルをも作成することにより、
音声コマンドが邪魔にならず、他の文書編集プログラム
等で作成した文章を利用することができる。なお、本発
明の好適な実施例においては、確定キーが押されたこと
に応答して、この未確定文字列を文編集部１０７だけで
はなく、音声合成部１３０に渡す事により、音声合成を
行い、音声調整の最終確認を行う。また、かな文字列入
力部１０１の管理するバッファをクリアする。

【００６５】次に、入力されたキーが、その他のキーで
あった場合は（ステップ４５７）、そのキー入力に応じ
たその他の処理を行なう。例えば、カーソルを右に移動
するキーが押された場合は、カーソルを移動し、それが
未確定文字列の現在の変換対象文字列から、未確定文字
列のうちの現在の変換対象文字列でない文字列の部分に
移動された場合、変更対象文字列を現在のカーソルがあ
る文字を含む文字列に変更する。

【００６６】図９は、埋込みコマンドを含む文章を受領
した音声合成制御部１３１の制御の手順を示すフローチ
ャートである。音声合成制御部１３１は、埋込みコマン
ドを含む文章を受領すると、その文章の先頭に、文章音
声コマンドが埋め込まれているか否かを判断する（ステ
ップ６０３）。文章音声コマンドが埋め込まれていた場
合は、音声合成制御部１３１は、文章音声コマンドに含
まれる音声属性の内容に従って、パラメータ生成部１４
３、音声合成器１４５にパラメータや音声合成の変更を
指示する（ステップ６０５）。文章音声コマンドが埋め
込まれていなかった場合は、音声合成制御部１３１は、
次に、文字列音声コマンドが含まれているか否かを判断
する（ステップ６０７）。文字列音声コマンドが埋め込
まれていた場合は、音声合成制御部１３１は、文字列音
声コマンドに含まれる音声属性の内容に従って、パラメ
ータ生成部１４３にその文字列の読み、アクセントに従
ったパラメータの生成を指示する（ステップ６０９）。
読み付与部１３９，アクセント付与部１４１にコマンド
に含まれる音声属性に従って、「読み」，「アクセン
ト」を付与することを指示してもよい。

【００６７】文字列音声コマンドが埋め込まれていなか
った場合は、入力した文字列を言語解析部１３３に渡
し、公知の音声合成手順に従い、音声合成を行う（ステ
ップ６１１）制御部１３１は、文章音声コマンドに含ま
れる音声属性の内容に従って、パラメータ生成部１４３
にそも文字列の読み、アクセントに従ったパラメータの
生成を指示する（ステップ６０９）。

【００６８】その後、次の文字列を読み（ステップ６１
５）、文章の終わりか否かを判断し（ステップ６１
７）、文章の終わりであった場合は、音声合成処理を終
了させる（ステップ６１９）。文章の終わりでなかった
場合は、処理を続行し、新たに読み込まれた文字列が音
声コマンド（文章音声コマンド、または文字列音声コマ
ンド）であるかを判断する（ステップ６１９）。音声コ
マンドでない場合は、その文字列を言語解析部１３３へ
渡す。

【００６９】本発明の好適な実施例においては、日本語
のかな漢字変換を利用した実施例に沿って説明したが、
本発明は英語等の他の言語においても実施可能である。
図３、４に示す文章音声コマンドの埋込みに関しては、
言語を問わず、ほぼ同様な内容で実施可能であり、かか
る変更は当業者に容易に理解できる事項であるため、こ
こでは特に説明を行わない。

【００７０】以後、英語等の言語における文字列音声コ
マンドの埋込みについて説明を行う。英語に対し、本発
明を実施する場合、かな漢字変換部１０３とかな漢字辞
書１０５は特に必要にならない。但し、日本語のかな漢
字変換のように、入力した文字列に対し、その文字列の
属性を変更していくような態様であればこれに似た構成
を採用することも可能である。たとえば、入力した文字
列を未確定の状態にしておき、フォントの変更や、大文
字、小文字または、最初の１文字のみ大文字とすること
を指示する入力によって、この未確定文字列を変換する
ことも可能であり、この未確定文字列に、音声コマンド
を埋め込んでいく方式が考えられる。

【００７１】本発明を英語等で実施した場合、図２に示
す（かな）文字入力部１０１には、キーボードから入力
された文字列が保持される。但し、既に入力し、確定し
た文字列をマウスのポインタ等で範囲指定し、その範囲
指定された文字列を（かな）文字入力部１０１で保持す
ることもできる。（かな漢字）変換制御部１１３は、
（かな）文字入力部１０１の保持する情報に、音声属性
入力部１１５で保持する音声属性情報を音声コマンドの
形式にして埋め込む。音声コマンドの埋め込みは、日本
語のかな漢字変換を用いた方法と同様な方法で行われ
る。

【００７２】図１０は、文字列音声コマンドの音声属性
情報を調整するためにユーザに表示される一時単語登録
入力パネルの一実施例を示す図である。英語等は１つの
単語はブランク文字等のデリミタ文字によって区切られ
ており、（かな漢字）変換制御部１１３は、１つの単語
を１つの変換対象文字列として認識することができる。
図５に示した一時単語登録パネル３０５と同様に、一時
単語登録パネル５０５は、アクセントを調整するための
エントリ５４３，５４７、読み（発音）を調整するため
のエントリ５４５、品詞を指定するためのエントリ５４
９を備えている。ユーザは"fine"に対し、所望のアクセ
ント、読みを付与することができる。このれにより、例
えば、"lead"の文字列に対し、その発音を[li:d]（「導
く」の意）や[led]（「鉛」の意）とすることによって
読み分けを行うことができる。また、"LED"(発行ダイオ
ード)を[led]と発音するか[eli:di:]と発音するか、文
章ごと変更することができる。

【００７３】

【発明の効果】以上説明したように、本発明によれば、
かな漢字変換時において未確定文字列に埋込みコマンド
が自動的に埋め込まれるため、作業が簡素化され、さら
にコマンド自身をユーザが憶える必要もなく、入力ミス
もなくなる。

【００７４】その文字にのみ有効な埋込みコマンドとそ
の後の文章に有効な埋込みコマンドを使用して埋込みコ
マンドを含む文章の作成することにより、その文章にお
いてのみ特定の文字列を変更することを可能にし、一般
の辞書に影響を与えない。また、きめ細かい読み方を簡
単に定義することができる。

【００７５】文字列単位の埋込みコマンド編集ウインド
ウを表示させることにより、通常の単語登録とほぼ共通
のユーザインターフェースを提供することが可能であ
り、ユーザに直感的に分かりやすい

【００７６】かな漢字変換時において、未確定文字列を
試験的に音声合成することができるため、ユーザは、単
語等の短い文字列単位で、音声合成の結果を確認するこ
とができ、一旦作成した後に、文章全体または、文書中
の指定した文字列を入力として音声合成を試みるよりも
作業効率がよく、短時間で音声コマンド埋込み文章を作
成することができる。

【００７７】また、文字列埋込みコマンド、文章埋込み
コマンドを含む音声コマンド埋込み文章を音声合成可能
な音声合成アプリケーションが提供されるため、ユーザ
の欲する繊細に微調整された音声合成を効率的、かつ効
果的に行うことができる。

【００７８】

【図面の簡単な説明】

【図１】ハードウェア構成を示すブロック図である。

【図２】処理要素のブロック図である。

【図３】本発明のユーザインターフェースを示す図で
ある。

【図４】本発明の文章埋め込みコマンドを示す図であ
る。

【図５】本発明のユーザインターフェースを示す図で
ある。

【図６】本発明の文字列埋め込みコマンドを示す図で
ある。

【図７】本発明の埋め込みコマンドを含む文章を作成
する手順を示すフローチャートである。

【図８】本発明の埋め込みコマンドを含む文章を作成
する手順を示すフローチャートである。

【図９】本発明の埋込みコマンドを含む文章を受領し
た音声合成制御部の制御の手順を示すフローチャートで
ある。

【図１０】本発明のユーザインターフェースを示す図
である。

【００７９】

【符号の説明】

１００音声合成システム１１０文書作成部１３０音声合成部１０１かな文字列入力部１０３かな漢字変換部１０５かな漢字辞書１０７文書編集部１０９文書記憶部１１３かな漢字変換制御部１１５音声属性入力部１３１音声合成制御部１３３言語解析部１３５文法規則保持部１３７読みアクセント辞書１３９読み付与部１４１アクセント付与部１４３パラメータ生成部１４５音声合成部１４７音声発生部

Claims

【特許請求の範囲】

【請求項１】入力装置と、表示装置と、かな文字列入力
部と、かな漢字変換部と、かな漢字辞書と、かな漢字変
換制御部と、文書編集部と、文書記憶部とを含む文書作
成システムにおいて、音声属性情報を含み、音声合成を
行う際に参照される音声コマンドの埋め込まれた文章を
作成する方法であって、（ａ）前記入力装置から入力されたかな文字列を未確定
文字列として前記かな文字列入力部において保持する段
階と、（ｂ）前記入力装置からユーザの前記未確定文字列に対
する漢字かな混じり文字列へ変換することを指示する入
力を検出する段階と、（ｃ）前記漢字かな混じり文字列への変換の指示の検出
に応答して、前記かな漢字辞書から、前記未確定文字列
の一部を構成する変換対象文字列に対応する漢字かな混
じり文字列の候補である候補文字列を特定する段階と、（ｄ）前記候補文字列を前記表示装置に表示する段階
と、（ｅ）前記入力装置から、前記候補文字列の内の１つで
ある被選択文字列を選択するユーザ入力を検出する段階
と、（ｆ）前記変換対象文字列を前記被選択文字列によって
置換することにより、新たな未確定文字列とする段階
と、（ｇ）ユーザの前記変換対象文字列へ前記音声コマンド
の埋込みを指示する入力を検出する段階と、（ｈ）前記変換対象文字列へ埋め込む前記変換対象文字
列の読み及びアクセントを含む音声属性情報をユーザが
入力するためのエントリを表示する段階と、（ｉ）前記エントリへのユーザの入力に対応した音声属
性情報を含む音声コマンドを前記変換対象文字列に埋め
込む段階と、（ｊ）前記変換対象文字列の音声合成を指示するユーザ
の入力を検出する段階と、（ｋ）前記音声コマンドの音声属性に従った音声合成を
行う段階と、を含む方法。
【請求項２】入力装置と、表示装置と、かな文字列入力
部と、かな漢字変換部と、かな漢字辞書と、かな漢字変
換制御部と、文書編集部と、文書記憶部とを含む文書作
成システムにおいて、音声属性情報を含み、音声合成を
行う際に参照される音声コマンドの埋め込まれた文章を
作成する方法であって、（ａ）前記入力装置から入力されたかな文字列を未確定
文字列として前記かな文字列入力部において保持する段
階と、（ｂ）前記入力装置からユーザの前記未確定文字列に対
する漢字かな混じり文字列へ変換することを指示する入
力を検出する段階と、（ｃ）前記漢字かな混じり文字列への変換の指示の検出
に応答して、前記かな漢字辞書から、前記未確定文字列
の一部を構成する変換対象文字列に対応する漢字かな混
じり文字列の候補である候補文字列を特定する段階と、（ｄ）前記候補文字列を前記表示装置に表示する段階
と、（ｅ）前記入力装置から、前記候補文字列の内の１つで
ある被選択文字列を選択するユーザ入力を検出する段階
と、（ｆ）前記変換対象文字列を前記被選択文字列によって
置換することにより、新たな未確定文字列とする段階
と、（ｇ）ユーザの前記変換対象文字列へ前記音声コマンド
の埋込みを指示する入力を検出する段階と、（ｈ）前記変換対象文字列へ埋め込む前記変換対象文字
列の読み及びアクセントを含む音声属性情報をユーザが
入力するためのエントリを表示する段階と、（ｉ）前記エントリへのユーザの入力に対応した音声属
性情報を含む音声コマンドを前記変換対象文字列に埋め
込む段階と、を含む方法。
【請求項３】音声属性情報を含み、音声合成を行う際に
参照される音声コマンドの埋め込まれた文章を作成する
方法であって、（ａ）前記音声コマンドを埋め込む文字列特定する段階
と、（ｂ）ユーザの前記特定された文字列へ前記音声コマン
ドの埋込みを指示する入力を検出する段階と、（ｃ）前記特定された文字列の音声属性情報をユーザが
入力するためのエントリを表示する段階と、（ｄ）前記エントリへのユーザの入力に対応した音声属
性情報を含む音声コマンドを前記特定された文字列に埋
め込む段階と、を含む方法。
【請求項４】音声属性情報を含み、音声合成を行う際に
参照される音声コマンドの埋め込まれた文章を作成する
装置であって、（ａ）ユーザによって入力された文字列を保持するかな
文字列入力部と、（ｂ）かな文字列に対応する漢字かな混じり文字列を管
理するかな漢字辞書と、（ｃ）前記かな文字列入力部の保持する文字列に対応す
る漢字かな混じり文字列の候補を探索するかな漢字変換
部と、（ｄ）ユーザ入力によって調整された音声属性値を保持
する音声属性入力部と、（ｅ）ユーザ入力に応答して、前記かな漢字変換部に対
し、前記漢字かな混じり文字列の候補から、かな文字列
入力部の保持する文字列に対応する漢字かな混じり文字
列の選択を指示し、さらに、前記音声属性入力部の保持
する前記音声属性値を音声コマンドの形式で前記選択さ
れた漢字かな混じり文字列に埋め込むかな漢字変換制御
部と、を含む装置。
【請求項５】音声属性情報を含み、音声合成を行う際に
参照される音声コマンドの埋め込まれた文章を作成する
文書作成部と、音声合成に使用するパラメータを生成す
るパラメータ生成部を備え、入力した文章から音声合成
を行う音声合成部を含む装置であって、（ａ）ユーザによって入力された文字列を保持する文字
列入力部と、（ｂ）ユーザ入力によって調整されたその文字列の読み
方等を指示する文字列音声属性値を保持する音声属性入
力部と、（ｃ）ユーザ入力に応答して、前記音声属性入力部の保
持する前記文字列音声属性値を文字列音声コマンドの形
式で前記入力された文字列に埋め込む変換制御部と、（ｄ）前記文字列音声コマンドの埋め込まれた文字列に
埋め込まれた文字列音声属性情報に従って音声合成する
ことを前記パラメータ生成部に指示する音声合成制御部
と、を含む装置。
【請求項６】音声属性情報を含む文章をもとに音声合成
する装置であって、（ａ）前記音声コマンドを埋め込む文字列を保持するか
な文字列入力部と、（ｂ）かな文字列に対応する漢字かな混じり文字列を管
理するかな漢字辞書と、（ｃ）前記かな文字列入力部の保持する文字列に対応す
る漢字かな混じり文字列の候補を探索するかな漢字変換
部と、（ｄ）ユーザ入力によって調整された音声属性値を保持
する音声属性入力部と、（ｅ）ユーザ入力に応答して、前記かな漢字変換部に対
し、前記漢字かな混じり文字列の候補から、かな文字列
入力部の保持する文字列に対応する漢字かな混じり文字
列の選択を指示し、さらに、前記音声属性入力部の保持
する前記音声属性値を音声コマンドの形式で前記選択さ
れた漢字かな混じり文字列に埋め込むかな漢字変換制御
部と、（ｆ）前記音声コマンドの埋め込まれた漢字かな混じり
文字列に埋め込まれ音声属性情報に従って音声合成する
音声合成部と、を含む装置。
【請求項７】入力した文章をもとに音声合成する装置で
あって、（ａ）文法規則情報及び読み・アクセント辞書に基づい
て、入力された文章に含まれる文字列の読み方、アクセ
ントを決定する言語解析部と、（ｂ）前記言語解析部で決定された前記入力された文章
に含まれる文字列の読み方とアクセントに従って音声合
成を行う音声合成器と、（ｃ）前記入力した文字列に対応する音声コマンドあっ
て、音声合成に際し、前記入力した文字列の読み方及び
アクセントを含む音声属性の音声属性値を指示する音声
コマンドが埋め込まれていた場合、前記文字列を前記音
声コマンドの指示する音声属性値に従って音声合成する
ことを前記合成器に指示する音声合成制御部と、を含む装置。
【請求項８】音声属性情報を含み、音声合成を行う際に
参照される音声コマンドの埋め込まれた文章を作成する
ことを文書作成装置に指示する制御プログラムを格納す
る記憶媒体であって、該制御プログラムは、（ａ）前記音声コマンドを埋め込む文字列特定すること
を前記文書作成装置に指示するプログラムコード手段
と、（ｂ）ユーザの前記特定された文字列へ前記音声コマン
ドの埋込みを指示する入力を検出することを前記文書作
成装置に指示するプログラムコード手段と、（ｃ）前記特定された文字列の音声属性情報をユーザが
入力するためのエントリを表示することを前記文書作成
装置に指示するプログラムコード手段と、（ｄ）前記エントリへのユーザの入力に対応した音声属
性情報を含む音声コマンドを前記特定された文字列に埋
め込むことを前記文書作成装置に指示するプログラムコ
ード手段と、を含むことを特徴とする記憶媒体。