JP2004171174A - Device and program for reading text aloud, and recording medium - Google Patents
Device and program for reading text aloud, and recording medium Download PDFInfo
- Publication number
- JP2004171174A JP2004171174A JP2002334694A JP2002334694A JP2004171174A JP 2004171174 A JP2004171174 A JP 2004171174A JP 2002334694 A JP2002334694 A JP 2002334694A JP 2002334694 A JP2002334694 A JP 2002334694A JP 2004171174 A JP2004171174 A JP 2004171174A
- Authority
- JP
- Japan
- Prior art keywords
- reading
- unknown word
- text
- word
- unknown
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
【0001】
【発明が属する技術分野】
本発明は、文章を音声合成技術を用いて合成音声として出力する文章読み上げ装置、読み上げのためのプログラム及び同プログラムを記録した記録媒体に関する。
【0002】
【従来の技術】
文章を音声合成技術を用いて音声として出力することによって文章を読み上げる機能(文章読み上げ装置)が携帯情報端末(PDA)に組み込まれるようになってきている。このような装置において、読み上げる書籍(新聞等を含む)の文章の中に読み方が複数ある単語または辞書に登録されておらず読み方の分からない単語がある場合がある。
【0003】
このような場合、例えば特許文献1に開示された文書読上装置では、文書読み上げ中、読み上げ対象文書中から複数読み単語を検出し、その複数の読みを暫定学習データファイルから読み出して表示装置に表示し、その中から読み候補を指定することで、その読みを優先順位1位の読み候補に更新し、以後の読み上げを更新された読みにより行うようにしている。
【0004】
このように、前記従来公知のものは、複数読みを暫定学習データファイルに記述されたその読みの優先順位の1番高いものを採用しており、暫定学習ファイルにないものについては単語辞書に記述されている読みの第1優先順位の読みに従い読み上げるようになっている。
【0005】
【特許文献1】
特開平6−332899号公報(要約、段落(0017)、段落(0022))
【0006】
【発明が解決しようとする課題】
前記従来の文書読上装置では複数読み単語については、選択した読みでその後も読み上げを行うことができる。しかし、この文書読上装置では単語辞書にない未知語については対応できない。
【0007】
そこで、本発明は前記の問題点を解決するためになされたものであって、その第1の目的は文章の読み上げ中に、未知語についてユーザーがその未知語の読みを入力でき、その後は入力した読みで文章を読み上げることができるようにすることである。
【0008】
第2の目的は、未知語に予め未知語マークを付与しておくことにより、読み上げ中に未知語の抽出を容易かつ迅速に行い、未知語の入力処理を円滑に行えるようにすることである。
【0009】
【課題を解決するための手段】
請求項1の発明は、文章を解析し、該解析に従って音声を合成して読み上げる文章読み上げ装置において、読み上げ文章中の解析不能な未知語を抽出する手段と、抽出された未知語を表示する手段と、表示された未知語の読みを入力する手段と、入力された未知語をその読みと共に登録する手段とを備えている。この請求項1に記載の文章読み上げ装置では、前記未知語が登録された読みに従って読み上げられる。
【0010】
請求項2の発明は、請求項1に記載された文章読み上げ装置において、読み上げ文章の形態素解析において解析不能の単語に未知語マークを付与する手段を備えている。この請求項2に記載の文章読み上げ装置では、前記未知語を抽出する手段が未知語に付与された未知語マークを検索して抽出を行う。
【0011】
請求項3の発明は、文章を解析し、該解析に従って音声を合成して読み上げるためにコンピュータに、読み上げ文章中の解析不能な未知語を抽出する手順と、抽出された未知語を表示手段に表示する手順と、表示された未知語の読みを入力状態に移行する手順と、抽出された未知語を入力された読みと共に記憶手段に登録する手順と、前記未知語を登録された読みに従って読み上げるためのデータを生じる手順とを実行させることを特徴とする文章読み上げ装置用プログラムである。この請求項3に記載の発明によれば、上述の手順がコンピュータにより実行される。
【0012】
請求項4の発明は、文章を解析し、該解析に従って音声を合成して読み上げるためにコンピュータに読み上げ文章中の解析不能な未知語を抽出する手順と、抽出された未知語に対して、未知語マークを付与する手順とを実行させることを特徴とする文章読み上げ装置用プログラムである。この請求項4に記載の発明によれば、上述の手順がコンピュータにより実行される。
【0013】
請求項5に記載の発明は、請求項4に記載の手順に加えて、前記未知語マークを検出する手順と、前記未知語マークを付与された単語に読みを入力するための状態に移行する手順とをコンピュータに実行させるものである。この請求項5に記載の発明によれば、上述の手順がコンピュータにより実行される。
【0014】
請求項6の発明は、請求項3乃至5のいずれかに記載のプログラムを記録したコンピュータ読み取り可能な記録媒体である。この請求項5の発明によれば、請求項3又は4に記載の発明と同様の作用を奏する。
【0015】
【発明の実施の形態】
本発明の実施の形態に係る文章読み上げ装置について図面を参照しながら説明する。
【0016】
図1は本発明の実施の形態に係る携帯端末装置による文章読み上げ装置の正面図である。文章読み上げ装置1は、図示のように、文字、画像が表示される液晶ディスプレイ2と、ユーザが各種キー操作を行うための操作キー3と、ユーザがスタイラス等を利用して入力するために液晶ディスプレイ2の表面に貼付されたタッチパネル4、スピーカ5、並びにイヤフォン(図示略)への音声出力のための出力端子部(図示略)を備えている。
【0017】
次に上記文章読み上げ装置1の概略構成を示すブロック図である図2を参照して、上記装置の構成を説明する。
【0018】
文章読み上げ装置1は、CPU10と、ROM6と、RAM7と、表示装置である上記液晶ディスプレイ2を含む表示装置9と、上記操作キー3及びタッチパネル4を含む入力装置8と、上記スピーカ5や出力端子部を含む音声出力装置5とを備えている。
【0019】
ROM6には、上記文章読み上げ装置1のOS(制御プログラム)を記憶した領域(装置のプログラム領域)61,上記装置1の電子ブックとして機能させるための電子ブックリーダプログラムを記憶した領域(電子ブックリーダプログラム領域)62、文章読み上げ処理を実行させるための音声読み上げプログラムを記憶した領域(音声読み上げプログラム領域)63等各種のプログラム記憶領域が設けられている。さらに、音声合成辞書データを記憶した領域(音声合成辞書データ領域)65、音声合成音素データを記憶した領域(音声合成音素データ領域)66、アクセント処理用辞書データを記憶した領域(アクセント処理用データ領域)67等、読み上げ文章の形態素解析及び音声合成に必要なデータを記憶するためのデータ記憶領域が設けられている。
【0020】
RAM7には、音声合成のためのデータ処理の中間結果を記憶するためのワーク領域71、ユーザが使用する各種データを記憶するためのユーザデータ領域72、文章読み上げ装置1で読み上げられる書籍データを記憶するための書籍データ領域73が設けられている。さらに解析できない単語(未知語)に関する情報を登録(記憶)するための領域として単語登録領域74、及び、複数読みのある単語についてその読みを選択した場合その選択結果を記憶するための単語学習領域75が設けられている。尚、上記データ領域73は、文章読み上げ装置1外から取り込まれた書籍データも記憶されるように構成されている。
【0021】
CPU10は、本実施の形態に係る文章読み上げ装置1においては、ROM6に格納されている各種プログラムに基づいて、入力装置8、液晶ディスプレイ2、スピーカ5等について制御を行う。
【0022】
CPU10は書籍データから、ROM6の電子ブックリーダプログラム及び音声読み上げ用プログラムを使って音声合成データを作成し、このデータをスピーカ5に供給して合成音を出力する。合成音をスピーカ5に代えてイヤフォンから出力するようにしてもよいことは勿論である。
【0023】
次に、実施の形態に係る文章読み上げ装置1のソフトウェアの構成を説明する。
【0024】
図3は文章読み上げ装置1の文章読み上げ処理に関連する各プログラムの関連を示すブロック図である。
【0025】
図中、電子ブックリーダプログラムは、携帯情報端末(PDA)において、頁送り、文字組み、段組、頁サイズの変更、フォント設定、ルビ表示等の処理を実行させるためのプログラムである。
【0026】
音声読み上げプログラムは書籍データ(テキストデータ)を合成音声で読み上げるためのプログラムで、上記電子ブックリーダプログラムに連動して動作するプログラムである。この該音声読み上げプログラムは、更に音声パラメータ変換プログラム、音声出力プログラム及びルビ情報切り出し及び登録プログラムを備えている。
【0027】
音声パラメータ変換プログラムは読み上げ用文章から、音声合成単語辞書及びアクセント処理用辞書データを使って読み上げ用音声パラメータ文字列を作成する。音声出力プログラムは、上記音声パラメータ変換プログラムによって作成された読み上げ用音声パラメータ文字列に基づいて音声合成音素データを使って出力音声データを作成する。
【0028】
未知語読み取得及び登録プログラムは、読み上げ文書について形態素解析を行う際に、辞書にないつまり解析できない単語(未知語)を見つけた時にその単語に未知語マークを付与(未知語であることを示すためのデータであって、文章の一部としては読まれないデータ)しておき、文書読み上げ中にその単語を検索して液晶ディスプレイ2に表示して、ユーザーがその読みを入力し、未知語とその読みとの組を上記単語登録領域74に登録するまでの一連の処理を行うためのプログラムである。
【0029】
読み選択及び学習プログラムは、同様に、読み上げ文書について形態素解析を行う際に、複数読み単語を見つけた時にその単語に複数読みマークを付与(複数読み語であることを示すためのデータであって、文章の一部としては読まれないデータ)しておき、文書読み上げ中にその単語を検索して液晶ディスプレイ2に表示して、ユーザーが複数の読みから優先順位第1位としての読みを選択し、その単語の読みの組を上記単語学習領域75に登録するまでの一連の処理を行うためのプログラムである。
【0030】
次に、上記文章読み上げ装置1の読み上げ処理について、読み上げ処理を図4のフローチャートを参照して説明する。
【0031】
文章の読み上げ処理は、文章読み上げ装置1の液晶ディスプレイ2の表示画面に応じて、例えば読み上げ開始を入力するために操作キー3を操作することで開始され、以下のステップに従って実施される。
【0032】
即ち、ステップS101において、CPU10は書籍データから、実際には液晶ディスプレイ2に表示された複数の文章の中から次に読み上げる1文章分のデータを切り出す(抽出する)。
【0033】
切り出し文の一例として「今日は北京旅行の日です。」とする。
【0034】
ステップS102において、音声合成辞書データ領域65の音声合成辞書データを参照して1文章のデータを単語単位に分割して、各単語の読みとアクセント情報を取得する形態素解析を行う。
【0035】
ここで、複数読みがある単語に対しては、既にユーザーによりどの読みが適切か選択され、その選択された読みが単語学習領域75に登録されている場合はその読みを利用し、上記登録がない場合はあとで読みの選択ができるように所定の複数読みマークを付す。
【0036】
また、この形態素解析において解析できない単語(以下未知語という)に対しては、あとで該単語の読みを取得するために複数読みマークとは異なる所定の未知語マークを付しておく。
【0037】
上記例の解析結果は次のようになる。
【0038】
単語分割として 今日/は /北京 /旅行/の/日/です/。
読みとして キョー / ワ /ペキン /リョコー/ノ /ヒ/デス
アクセント情報として 2 * 1 0 * 0 *
(なお、数字はその位置でアクセントが落ちる。「0」は平板なアクセント、「*」はアクセント位置の情報を持たない。)
【0039】
続いてステップS103においてアクセント処理用データ領域67のアクセント処理用データを参照し単語単位の読み、アクセント情報を基にして読み上げ用の音声パラメータ文字列を作成する。
【0040】
上記例では、次のようになる。
アクセントと処理文字列 キョ’ーワ/ペキンリョ’コーノ/ヒデ’ス| (「/」は読み上げ単位の区切り位置、「|」はポーズ位置、「’」はアクセントの落ちる位置)
【0041】
ステップS104では、上記作成された音声パラメータ文字列を順に先頭から音声出力しながら読み上げていく。
【0042】
この時上記複数読みマークの付された単語が存在する時は、液晶ディスプレイ2に複数の読みを表示してユーザーに優先順位1のものを操作キー3によって選択してもらい、この優先順位で読みを単語学習領域75に記憶する。
【0043】
又、未知語マークのある単語については、同様に液晶ディスプレイ2に表示してユーザーに読みを操作キー3によって入力してもらい、その読みを単語登録領域74に登録する。なお、以後はこの登録された読みで文章の読み上げを行う。即ち、未知語に対して未知語マークを付与しその後、未知語マークを検出して、その検出された未知語マークを付与された単語の読みをユーザーが入力する状態に移行している。
【0044】
ステップS105において、音声パラメータ文字列を基にして、音声合成音素データ領域66のデータを参照して音素同士の結合・変形等を行い、出力音声データを作成する。
【0045】
ステップS106において、出力音声データをアナログ変換してスピーカ5から音声出力する。
【0046】
図5は、読み選択及び未知語読み取得処理のフローチャートである。
ステップS201においては、図4におけるステップS103で作成された音声パラメータ文字列を単語毎に検索し、複数読みマークの付された単語があるか否かを判定し(S202)、あると判定された時(ステップS202,YES)ステップS204に進む。
【0047】
ステップS204では読み上げを一次停止し、当該単語の読み選択一覧を液晶ディスプレイ2表示する。
【0048】
例えば、「大勢」という「たいせい」「おおぜい」の2通りの読みのある単語について、まだどちらの読みにするのか学習(登録)していない場合は読み上げを一旦停止し、例えば、図6に示す複数読みの選択画面で読み選択一覧を表示する。
【0049】
次にステップS205において、ユーザーが読みを選択したかを判定し、選択された場合(ステップS205、YES)、ステップS206に進み、その読み単語学習領域75に記憶し、読み上げを再開し(S209)、読み上げ処理を進める(S210)。なお、ステップS205では、ユーザーが読みを選択するまでは、次のステップS206には進まない。
【0050】
ステップS202で複数読みマークが付された単語がない場合でも(S202,NO)、ステップS203で未知語マークの付された単語があると判定された時は(ステップS203,YES)、ステップS207に進み、読み上げを一次停止し、液晶ディスプレイ2に未知語の読みを入力する入力画面を表示する。例えば、未知語マークの付された「朝青龍」という単語の読みについて、まだ登録されていない場合は読み上げを一旦停止し、図7に示す入力画面を表示して読みの入力を促す。
【0051】
なお、ステップS203において、未知語マークの付された単語がないと判定されたとき(ステップS203,NO)はそのまま読み上げ処理を進める(ステップ210)。
【0052】
ステップS208において、ユーザーにより未知語の読みが入力された場合は(ステップS208、YES)、ステップS209に進み、その読みを登録して読み上げを再開し、その読み上げ処理を進める(S210)。なお、未知語の読みが入力されなかった場合は(ステップS208、NO)、ユーザーが読みを入力するまで次のステップS209には進まない。
【0053】
このようにステップS201〜S210までの処理を順次行い、書籍データが最終まで読み上げられたと判定されたとき(S211、YES)、処理は終了する。
【0054】
以上の処理は、文章読み上げ装置1のCPU10がROM6に格納したプログラムの指示及びデータに基づき、入力文章を解析し、解析に従って音声を合成して文章を読み上げる手順で行うが、その際に、本発明の実施の形態では、CPU10に読み上げ文章中の解析不能な未知語を抽出する手順と、抽出された未知語を表示手段に表示する手順と、表示された未知語の読みを入力する手順と、入力された未知語をその読みと共に記憶手段に登録する手順と、上記未知語を登録された読みに従って読み上げる手順とを実行させ、更に、読み上げ文章の形態素解析において解析不能の単語に未知語マークを付与する手順と、未知語に付与された未知語マークを検索する未知語抽出を行う手順を実行させることを文章読み上げ装置用プログラムをも提供するものである。
【0055】
また、本プログラムは、従来周知のフレキシブルディスク、CDROM、DVDROM、MO、HDD等の任意のコンピュータ読み取り可能な記録媒体に記録して、或いはインターネット等のネットワーク網を介して提供することができる。
【0056】
上述した実施の形態においては合成音声を発生するためのスピーカ5を備える1つの装置において、図4、図5に示すプログラムを全て処理しているが、各プログラムやプログラムの一部を別々の装置で処理して、最終的にスピーカ5から合成音声を生じても良い。例えば第1のコンピュータがステップS101〜S103を処理して、インターネットを介して音声パラメータ文字列のデータを第2のコンピュータに出力して、第2のコンピュータがステップS104〜S106を処理する。更に、合成音声を生じさせる装置は、文章読み上げの専用装置に限らず、読み上げ以外の他の機能を有するPAD、パソコン、携帯電話、カーナビゲーション端末、TV等であっても良い。尚、読み上げられる文章は、書籍に限らず、手紙(電子メールを含む)、道案内、宣伝、並びに歌詞などであっても良い。また、RAM7に記憶されたデータは、装置の電源が落されると消失するが、装置の電源が落されても、継続して記憶されても良い。そして図4に示すステップS101〜S106については、一文章毎に処理する必要はなく、複数の文章毎について行っても良い。
【0057】
【発明の効果】
本願の請求項1に記載の発明によれば、解析できない未知語があると文章読み上げ処理中に、未知語についてその読みの入力画面を表示し、ユーザーが読みを入力することでその読みが登録され、ユーザーにとって自然な手順で未知語についても正しい読みで読み上げることができ、読み上げを極めて自然に行うことができる。
【0058】
本願の請求項2に記載の発明によれば、前記請求項1に記載の発明の効果に加え、読み上げ文章の解析時に未知語に予めマークを付与しておくことで読み上げ中に未知語の抽出が迅速に行われ、読み上げ中の処理がスムースに行われる。
【0059】
本願の請求項3に記載の発明によれば、コンピュータに各手順を実行させ、未知語の読みの入力状態に移行して、入力された読みを用いて様々な語の読み上げのためのデータを生じることができる。
【0060】
本願の請求項4に記載の発明によれば、コンピュータに各手順を実行させ、未知語の単語に未知語マークを付与しており、その未知語マークを付与された単語に関する後の処理を迅速に行うことができる。
【0061】
本願の請求項5に記載の発明によれば、請求項4に記載の手順に加えて、更に各手順をコンピュータに実行させ、付与された未知語マークが検出されて、単語の読みの入力状態となるので、迅速に入力を行うことができる。
【0062】
本願の請求項6に記載の発明によれば、請求項3乃至5のいずれかに記載の本発明のプログラムを記録媒体に記録したことで本プログラムを容易に提供することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態である文章読み上げ装置の正面図である。
【図2】本発明の実施の形態である文章読み上げ装置の概略構成を示すブロック図である。
【図3】本発明の実施の形態である文章読み上げ装置の読み上げソフトウェアのソフトウェア構成を示すブロック図である。
【図4】読み上げ処理のフローチャートである。
【図5】読み選択及び未知語読み取得処理のフローチャートである。
【図6】複数読み一覧表示した文章読み上げ装置の図である。
【図7】未知語の読み入力画面時の文章読み上げ装置の図である。
【符号の説明】
1・・・文章読み上げ装置、2・・・液晶ディスプレイ、3・・・操作キー、4・・・タッチパネル、5・・・スピーカー、6・・・ROM、7・・・RAM、8・・・入力装置、9・・・表示装置、10・・・CPU。[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a text-to-speech apparatus that outputs text as synthesized speech using a speech synthesis technique, a program for reading aloud, and a recording medium on which the program is recorded.
[0002]
[Prior art]
2. Description of the Related Art A function of reading a sentence by outputting a sentence as a sound using a speech synthesis technology (sentence reading device) has been incorporated into a portable information terminal (PDA). In such an apparatus, there is a case where a sentence of a book (including a newspaper or the like) to be read includes a word that has a plurality of reading methods or a word that is not registered in the dictionary and cannot be read.
[0003]
In such a case, for example, the document reading device disclosed in
[0004]
As described above, the conventional publicly known document employs a plurality of readings having the highest priority of the readings described in the provisional learning data file, and those not present in the provisional learning file are described in the word dictionary. The reading is performed according to the reading of the first priority of the reading being performed.
[0005]
[Patent Document 1]
JP-A-6-332899 (abstract, paragraph (0017), paragraph (0022))
[0006]
[Problems to be solved by the invention]
In the above-mentioned conventional text-to-speech apparatus, a plurality of words can be read aloud with the selected reading. However, this document reading device cannot handle unknown words that are not in the word dictionary.
[0007]
Therefore, the present invention has been made to solve the above problems, and a first object of the present invention is to allow a user to input the reading of an unknown word while reading out a sentence, It is to be able to read a sentence with the reading that was done.
[0008]
A second object is to add an unknown word mark to an unknown word in advance so that the unknown word can be easily and quickly extracted during reading, and the input processing of the unknown word can be performed smoothly. .
[0009]
[Means for Solving the Problems]
According to a first aspect of the present invention, there is provided a text-to-speech apparatus for analyzing a text, synthesizing a voice in accordance with the analysis, and reading out the unparseable unknown word in the text to be read, and displaying the extracted unknown word. Means for inputting the displayed reading of the unknown word, and means for registering the input unknown word together with the reading. In the text-to-speech apparatus according to the first aspect, the unknown word is read out according to the registered reading.
[0010]
According to a second aspect of the present invention, in the text-to-speech apparatus according to the first aspect, means is provided for assigning an unknown word mark to a word that cannot be analyzed in the morphological analysis of the text to be read. In the text-to-speech apparatus according to the second aspect, the means for extracting the unknown word searches for and extracts an unknown word mark assigned to the unknown word.
[0011]
According to a third aspect of the present invention, there is provided a computer for analyzing a sentence, synthesizing a speech in accordance with the analysis, and reading out the unparseable unknown word in the read-out sentence, and displaying the extracted unknown word on a display means. A displaying step, a step of shifting the displayed reading of the unknown word to an input state, a step of registering the extracted unknown word together with the input reading in the storage means, and reading out the unknown word according to the registered reading. And a procedure for generating data for the text reading apparatus. According to the third aspect of the present invention, the above procedure is executed by a computer.
[0012]
According to a fourth aspect of the present invention, there is provided a procedure for analyzing a sentence, synthesizing a speech in accordance with the analysis, and extracting an unanalyzable unknown word in the sentence read by a computer in order to read out the sentence. And a step of providing a word mark. According to the fourth aspect of the present invention, the above procedure is executed by a computer.
[0013]
According to a fifth aspect of the present invention, in addition to the procedure of the fourth aspect, the procedure shifts to a procedure for detecting the unknown word mark and a state for inputting a reading to a word to which the unknown word mark is added. And causing the computer to execute the steps. According to the invention described in
[0014]
According to a sixth aspect of the present invention, there is provided a computer-readable recording medium storing the program according to any one of the third to fifth aspects. According to the fifth aspect of the invention, the same effects as those of the third or fourth aspect of the invention are provided.
[0015]
BEST MODE FOR CARRYING OUT THE INVENTION
A text-to-speech apparatus according to an embodiment of the present invention will be described with reference to the drawings.
[0016]
FIG. 1 is a front view of a text-to-speech apparatus using a portable terminal device according to an embodiment of the present invention. As shown, the text-to-
[0017]
Next, the configuration of the text-to-
[0018]
The text-to-
[0019]
The
[0020]
The RAM 7 stores a
[0021]
In the text-to-
[0022]
The
[0023]
Next, the software configuration of the text-to-
[0024]
FIG. 3 is a block diagram showing the relationship between programs related to the text-to-speech process of the text-to-
[0025]
In the figure, an electronic book reader program is a program for causing a personal digital assistant (PDA) to execute processes such as page feed, character set, column set, change of page size, font setting, and ruby display.
[0026]
The voice reading program is a program for reading book data (text data) with synthesized voice, and operates in conjunction with the electronic book reader program. The voice reading program further includes a voice parameter conversion program, a voice output program, and a ruby information cutout and registration program.
[0027]
The speech parameter conversion program creates a speech parameter string for speech using a speech synthesis word dictionary and accent processing dictionary data from the text for speech. The speech output program creates output speech data using speech-synthesized phoneme data based on the speech parameter character string for reading-out created by the speech parameter conversion program.
[0028]
The unknown word reading acquisition and registration program assigns an unknown word mark to a word (indicating that the word is unknown) when it finds a word (unknown word) that is not in the dictionary, that is, cannot be analyzed, when performing morphological analysis on the read-out document. Data that is not read as part of a sentence), search for the word while reading out the document, display the word on the
[0029]
Similarly, when performing a morphological analysis on a read-aloud document, the reading selection and learning program adds a plurality of reading marks to a plurality of reading words when the word is found (data for indicating that the word is a plurality of reading words. Data that is not read as part of a sentence), search for the word while reading out the document, display the word on the
[0030]
Next, the text-to-speech processing of the text-to-
[0031]
The text-to-speech process is started, for example, by operating the
[0032]
That is, in step S101, the
[0033]
As an example of the cutout sentence, "Today is a day of a trip to Beijing."
[0034]
In step S102, the data of one sentence is divided into words by referring to the speech synthesis dictionary data in the speech synthesis
[0035]
Here, for a word having a plurality of readings, the user has already selected which reading is appropriate, and if the selected reading is registered in the
[0036]
In addition, a word that cannot be analyzed in the morphological analysis (hereinafter, referred to as an unknown word) is given a predetermined unknown word mark different from the multiple-read mark in order to acquire the reading of the word later.
[0037]
The analysis result of the above example is as follows.
[0038]
As word division, today / ha / Beijing / travel / no / day / is /.
2 * 10 * 0 * as Kyo / wa / pekin / ryoko / no / hi / death accent information as reading
(Note that the number is accented at that position. "0" has a flat accent, and "*" has no information on the accent position.)
[0039]
Subsequently, in step S103, reading is performed in word units with reference to the accent processing data in the accent
[0040]
In the above example, it is as follows.
Accent and processing character string kyo'wa / pekinryo'kono / hide's | ("/" is the position of the reading unit, "|" is the pause position, "'" is the position where the accent falls)
[0041]
In step S104, the generated voice parameter character strings are read out while outputting voices sequentially from the beginning.
[0042]
At this time, when there is a word with the multiple reading mark, a plurality of readings are displayed on the
[0043]
In addition, a word having an unknown word mark is similarly displayed on the
[0044]
In step S105, based on the voice parameter character string, referring to the data in the voice-synthesized
[0045]
In step S106, the output audio data is converted into an analog signal and output as audio from the
[0046]
FIG. 5 is a flowchart of the reading selection and unknown word reading acquisition processing.
In step S201, the voice parameter character string created in step S103 in FIG. 4 is searched for each word, and it is determined whether or not there is a word with multiple reading marks (S202). Time (step S202, YES), the process proceeds to step S204.
[0047]
In step S204, the reading is temporarily stopped, and a reading selection list of the word is displayed on the
[0048]
For example, if a word with two readings, "daisei" and "most", which is "many", has not yet learned (registered) which one to read, the reading is temporarily stopped. A reading selection list is displayed on the multiple reading selection screen shown in FIG.
[0049]
Next, in step S205, it is determined whether or not the user has selected reading, and if it has been selected (step S205, YES), the process proceeds to step S206, where it is stored in the reading
[0050]
Even if there is no word with the multiple reading mark in step S202 (S202, NO), if it is determined in step S203 that there is a word with the unknown word mark (step S203, YES), the process returns to step S207. Then, the reading is temporarily stopped, and an input screen for inputting the reading of the unknown word is displayed on the
[0051]
When it is determined in step S203 that there is no word with an unknown word mark (step S203, NO), the reading process proceeds as it is (step 210).
[0052]
In step S208, when an unknown word is read by the user (step S208, YES), the process proceeds to step S209, where the reading is registered, reading is resumed, and the reading process is advanced (S210). If the reading of the unknown word is not input (step S208, NO), the process does not proceed to the next step S209 until the user inputs the reading.
[0053]
In this way, the processing of steps S201 to S210 is sequentially performed, and when it is determined that the book data has been read out to the end (S211, YES), the processing ends.
[0054]
The above process is performed by the
[0055]
Further, the program can be recorded on any computer-readable recording medium such as a conventionally known flexible disk, CDROM, DVDROM, MO, and HDD, or can be provided via a network such as the Internet.
[0056]
In the above-described embodiment, one apparatus including the
[0057]
【The invention's effect】
According to the invention described in
[0058]
According to the invention described in
[0059]
According to the invention described in
[0060]
According to the invention described in
[0061]
According to the invention described in
[0062]
According to the invention described in
[Brief description of the drawings]
FIG. 1 is a front view of a text-to-speech apparatus according to an embodiment of the present invention.
FIG. 2 is a block diagram illustrating a schematic configuration of a text-to-speech apparatus according to an embodiment of the present invention.
FIG. 3 is a block diagram illustrating a software configuration of reading software of the text reading apparatus according to the embodiment of the present invention;
FIG. 4 is a flowchart of a reading process.
FIG. 5 is a flowchart of reading selection and unknown word reading acquisition processing.
FIG. 6 is a diagram of a text-to-speech apparatus displaying a plurality of reading lists.
FIG. 7 is a diagram of a text-to-speech apparatus on an unknown word reading input screen.
[Explanation of symbols]
DESCRIPTION OF
Claims (6)
読み上げ文章中の解析不能な未知語を抽出する手段と、
抽出された未知語を表示する手段と、
表示された未知語の読みを入力する手段と
抽出された未知語を入力された読みと共に登録する手段と、
を備え、
前記未知語を登録された読みに従って読み上げることを特徴とする文章読み上げ装置。In a text-to-speech apparatus that analyzes text and synthesizes and reads voice according to the analysis,
Means for extracting unparseable unknown words in the text to be read out;
Means for displaying the extracted unknown words,
Means for inputting the reading of the displayed unknown word, means for registering the extracted unknown word together with the input reading,
With
A text-to-speech apparatus, wherein the unknown word is read out according to the registered reading.
読み上げ文章の形態素解析において解析不能の単語に未知語マークを付与する手段を備え、かつ、
前記未知語を抽出する手段は、未知語に付与された未知語マークを検索して抽出を行うことを特徴とする文章読み上げ装置。The text-to-speech apparatus according to claim 1,
A means for assigning an unknown word mark to a word that cannot be analyzed in the morphological analysis of the text to be read, and
The text-to-speech apparatus, wherein the means for extracting the unknown word searches for and extracts an unknown word mark added to the unknown word.
読み上げ文章中の解析不能な未知語を抽出する手順と、
抽出された未知語を表示手段に表示する手順と、
表示された未知語の読みを入力状態に移行する手順と
抽出された未知語を入力された読みと共に記憶手段に登録する手順と、
前記未知語を登録された読みに従って読み上げるためのデータを生じる手順とを実行させることを特徴とする文章読み上げ装置用プログラム。In order to analyze a sentence, synthesize a voice according to the analysis, and read aloud,
Extracting unknown words that cannot be analyzed in the text to be read out,
Displaying the extracted unknown word on a display means;
A procedure for shifting the displayed unknown word reading to an input state, a procedure for registering the extracted unknown word in the storage means together with the input reading,
And a procedure for generating data for reading the unknown word in accordance with the registered reading.
読み上げ文章中の解析不能な未知語を抽出する手順と、抽出された未知語に対して、未知語マークを付与する手順とを実行させることを特徴とする読み上げのためのプログラム。In order to analyze a sentence, synthesize a voice according to the analysis, and read aloud,
A program for reading aloud, comprising: executing a procedure of extracting an unanalyzable unknown word in a text to be read and a step of adding an unknown word mark to the extracted unknown word.
前記未知語マークを検出する手順と、
前記未知語マークを付与された単語に読みを入力するための状態に移行する手順とを実行させることを特徴とする読み上げのためのプログラム。In the program for reading out according to claim 4,
Detecting the unknown word mark;
Shifting to a state for inputting a reading of the word to which the unknown word mark has been added.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002334694A JP2004171174A (en) | 2002-11-19 | 2002-11-19 | Device and program for reading text aloud, and recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002334694A JP2004171174A (en) | 2002-11-19 | 2002-11-19 | Device and program for reading text aloud, and recording medium |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004171174A true JP2004171174A (en) | 2004-06-17 |
Family
ID=32699011
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002334694A Pending JP2004171174A (en) | 2002-11-19 | 2002-11-19 | Device and program for reading text aloud, and recording medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004171174A (en) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007047859A (en) * | 2005-08-05 | 2007-02-22 | Nissan Motor Co Ltd | Text analyzing method, text analyzing program, text analyzing device and text analyzing system |
WO2008062529A1 (en) * | 2006-11-24 | 2008-05-29 | Fujitsu Limited | Sentence reading-out device, method for controlling sentence reading-out device and program for controlling sentence reading-out device |
JP2008146019A (en) * | 2006-11-16 | 2008-06-26 | Seiko Epson Corp | System for creating dictionary for speech synthesis, semiconductor integrated circuit device, and method for manufacturing semiconductor integrated circuit device |
US8374845B2 (en) | 2007-09-25 | 2013-02-12 | Kabushiki Kaisha Toshiba | Retrieving apparatus, retrieving method, and computer program product |
CN112309406A (en) * | 2020-09-21 | 2021-02-02 | 北京沃东天骏信息技术有限公司 | Voiceprint registration method, voiceprint registration device and computer-readable storage medium |
US20220245382A1 (en) * | 2021-02-02 | 2022-08-04 | Google Llc | Generating Assistive Indications Based on Detected Characters |
-
2002
- 2002-11-19 JP JP2002334694A patent/JP2004171174A/en active Pending
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007047859A (en) * | 2005-08-05 | 2007-02-22 | Nissan Motor Co Ltd | Text analyzing method, text analyzing program, text analyzing device and text analyzing system |
JP2008146019A (en) * | 2006-11-16 | 2008-06-26 | Seiko Epson Corp | System for creating dictionary for speech synthesis, semiconductor integrated circuit device, and method for manufacturing semiconductor integrated circuit device |
WO2008062529A1 (en) * | 2006-11-24 | 2008-05-29 | Fujitsu Limited | Sentence reading-out device, method for controlling sentence reading-out device and program for controlling sentence reading-out device |
US8315873B2 (en) | 2006-11-24 | 2012-11-20 | Fujitsu Limited | Sentence reading aloud apparatus, control method for controlling the same, and control program for controlling the same |
US8374845B2 (en) | 2007-09-25 | 2013-02-12 | Kabushiki Kaisha Toshiba | Retrieving apparatus, retrieving method, and computer program product |
CN112309406A (en) * | 2020-09-21 | 2021-02-02 | 北京沃东天骏信息技术有限公司 | Voiceprint registration method, voiceprint registration device and computer-readable storage medium |
US20220245382A1 (en) * | 2021-02-02 | 2022-08-04 | Google Llc | Generating Assistive Indications Based on Detected Characters |
US11769323B2 (en) * | 2021-02-02 | 2023-09-26 | Google Llc | Generating assistive indications based on detected characters |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2007206317A (en) | Authoring method and apparatus, and program | |
JP6645063B2 (en) | Estimate target string | |
JP4738847B2 (en) | Data retrieval apparatus and method | |
JP4967519B2 (en) | Voice recognition device | |
JP5119671B2 (en) | Audio output device and audio output program | |
KR100931464B1 (en) | Recording medium recording voice output device and voice output program | |
JP2004171174A (en) | Device and program for reading text aloud, and recording medium | |
JP2007086309A (en) | Voice synthesizer, voice synthesizing method, and program | |
JP5819147B2 (en) | Speech synthesis apparatus, speech synthesis method and program | |
JP4640063B2 (en) | Speech synthesis method, speech synthesizer, and computer program | |
JP3762300B2 (en) | Text input processing apparatus and method, and program | |
JP5975033B2 (en) | Speech synthesis apparatus, speech synthesis method, and speech synthesis program | |
JP2580565B2 (en) | Voice information dictionary creation device | |
JP3838507B2 (en) | Sentence reading apparatus, program for reading out, and recording medium | |
JP5125404B2 (en) | Abbreviation determination device, computer program, text analysis device, and speech synthesis device | |
JP3284976B2 (en) | Speech synthesis device and computer-readable recording medium | |
JP2006098552A (en) | Speech information generating device, speech information generating program and speech information generating method | |
JP4305515B2 (en) | Audio output device and audio output program | |
JP7280055B2 (en) | Song Pronunciation Character String Automatic Correction Program and Song Pronunciation Character String Automatic Correction Apparatus | |
JP7243418B2 (en) | Lyrics input method and program | |
JP3414326B2 (en) | Speech synthesis dictionary registration apparatus and method | |
JP2007178692A (en) | Character input device and method | |
JP2008158630A (en) | Image output device and image output method | |
JP4208819B2 (en) | Speech synthesis dictionary registration method and apparatus | |
JPH11259094A (en) | Regular speech synthesis device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040913 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060207 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060209 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20060608 |