JP3804188B2 - 文章読み上げ装置 - Google Patents
文章読み上げ装置 Download PDFInfo
- Publication number
- JP3804188B2 JP3804188B2 JP15106697A JP15106697A JP3804188B2 JP 3804188 B2 JP3804188 B2 JP 3804188B2 JP 15106697 A JP15106697 A JP 15106697A JP 15106697 A JP15106697 A JP 15106697A JP 3804188 B2 JP3804188 B2 JP 3804188B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- attribute
- sentence
- text
- display
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Description
【発明の属する技術分野】
本発明は、文章を合成音に変換し出力する文章読み上げ装置に関するものであり、特に、視覚による補助手段を備えた文章読み上げ装置に関する。
【0002】
【従来の技術】
従来、この種の文章読み上げ装置として、例えば、図6に示されるものが知られている。
【0003】
同図において、文章ファイル1は文章読み上げ装置が読み上げるテキストを格納するものである。
【0004】
形態素解析部5は、文章ファイル1のテキストを構成する単語を、辞書51に格納されている単語により同定するものである。例えば、「橋を渡る」という文章の場合には、辞書51に格納された「橋」・「を」・「渡る」といった単語から構成されていることを同定するのである。ここで、辞書51は、一般の形態素解析用の辞書であるが、規則合成のために各単語の「読み」・「アクセント」等の情報も記述されている。
【0005】
音韻記号列生成部7は、形態素解析部5により同定された各単語の「読み」を辞書51から読み込み、前後の文脈から「読み」を同定する。例えば、前記例「橋を渡る」という文章の場合、「ha-shi-wo-wa-ta-ru」という音韻記号列を生成する。
【0006】
韻律記号生成部9は、形態素解析部5により同定された各単語の「アクセント」を辞書51から読み込み、前後の文脈から「アクセント」を同定する。また、文章の「イントネーション」も同定する。例えば、前記例「橋を渡る」という文章の場合、「ha"shi'wowataru」という韻律記号列を生成する。ここで、「"」はアクセントの上昇を、「'」はアクセントの下降の位置を示す。
【0007】
規則合成部11は、上述したテキストの「読み」と「アクセント」、「イントネーション」から音声を合成するものであり、スピーカ等で構成された音声出力部13より合成音を出力する。
【0008】
なお、前記形態素解析部5と音韻記号列生成部7、韻律記号列生成部9、規則合成部11に関しては、例えば「音声合成の研究の現状と将来」(音響学会誌48巻1号)等に詳しく記載されているので、ここでは詳述しない。
【0009】
処で、一般に人間は同音異義語や日常において聞き慣れない単語等を聞いた場合、アクセントや前後の文脈からその単語を推定することができる。しかし、前記構成の装置で合成音声を出力する場合においては、規則合成の技術が未熟なこと等の理由により人間が推定しづらいこともあった。
【0010】
そこで、図8に示すような大型のディスプレイ53を備え、文章ファイル1のテキストを表示するものが提案された。例えば、特開昭59−127148号公報に記載され図7に示された発明は、大型ディスプレイ53に文章ファイル1のテキストを表示し、下線制御部55が画面バッファ57を制御し、読み上げ中の文章を図8に示すように下線により強調するものである。この装置においては利用者が合成音声を推定できなかった場合には、大型ディスプレイ53に表示された文章を見ることにより文意を理解するのである。
【0011】
【発明が解決しようとする課題】
しかしながら、このような文章読み上げ装置においては、文章を表示するために、コンピュータのディスプレイのような大型ディスプレイが必要であり、携帯機器等のような小型機器には向かないという問題点があった。また、文章を追うために視線を動かす必要もあり利用者の疲労の原因となっていた。
【0012】
そこで、本発明は、前記の如き実情に鑑みてなされたもので、小型の表示領域を持つ表示手段により効率よく合成音の補助をすることにより、小型でありながら同音異義語や日常において聞き慣れない単語等の聞き損ないを防ぐと共に、利用者の文章理解を補助し、また、視線移動による利用者の疲労を解消した文章読み上げ装置を提供することを目的としている。
【0013】
【課題を解決するための手段】
前記目的を達成するために、本発明の請求項1に記載の文章読み上げ装置は、単語の「表記」と「読み」、「アクセント」及び「属性」を辞書として格納した記憶手段と、表記された文章を構成する単語を前記辞書を参照しつつ同定し、単語の「読み」・「アクセント」と前後の文脈等から、この文章の音韻情報・韻律情報を生成する文章解析手段と、生成された前記音韻情報・韻律情報を基に音声を合成する規則合成手段と、文字を表示する表示手段と、前記文章解析手段において同定された単語の「属性」と予め設定された表示すべき属性とを比較し、前記同定された単語の「属性」が予め設定された表示すべき属性である場合には、前記同定された単語が前記規則合成手段によって合成音として出力されている期間と同期して前記表示手段に前記同定された単語を表示させるように制御する表示制御手段とを備えたことを特徴としている。
【0014】
この発明の文章読み上げ装置によれば、小型の表示領域を持つ表示手段を用いて合成音を視覚的に補助をすることにより、小型でありながら同音異義語や日常において聞き慣れない単語等の聞き損ないを防ぐことができ、また、視線移動による利用者の疲労を解消することができる。
【0015】
【0016】
また、この発明の文章読み上げ装置によれば、辞書内の単語の属性により表示する単語を効率よく絞ることができる。
【0017】
また、請求項2に記載の文章読み上げ装置は、前記辞書が「同音異義語」に関する属性を備え、前記文章解析手段がこの属性を持つ単語を同定したとき、前記表示制御手段が前記表示手段にこの単語を表示させることを特徴としている。
【0018】
この発明の文章読み上げ装置によれば、「同音異義語」の属性を持つ単語を検出して表示することにより、利用者の「同音異義語」に対する聞き違いを防ぐことができる。
【0019】
また、請求項3に記載の文章読み上げ装置は、前記辞書が「名詞」に関する属性を備え、前記文章解析手段がこの属性を持つ単語を同定したときに、前記表示制御手段が前記表示手段にこの単語を表示させることを特徴としている。
【0020】
この発明の文章読み上げ装置によれば、文章を理解するためのキーワードとなる「名詞」の属性を持つ単語を検出して表示することにより、重要語の聞き損ないを防ぐと共に利用者の文章理解を助けることができる。
【0021】
また、請求項4に記載の文章読み上げ装置は、前記辞書が「熟語」に関する属性を備え、前記文章解析手段がこの属性を持つ単語を同定したときに、前記表示制御手段が前記表示手段にこの単語を表示させることを特徴としている。
【0022】
この発明の文章読み上げ装置によれば、文章を理解するためのキーワードとなる「熟語」の属性を持つ単語を検出し表示することにより、重要語の聞き損ないを防ぐと共に利用者の文章理解を助けることができる。
【0023】
さらに、請求項5に記載の文章読み上げ装置は、前記辞書が「使用頻度」に関する属性を備え、前記文章解析手段が「使用頻度」の低い単語を同定したときには、前記表示制御手段が前記表示手段にこの単語を表示させることを特徴としている。
【0024】
この発明の文章読み上げ装置によれば、「使用頻度」が低い単語を検出して表示することにより、日常あまり使われないために聞き損ない易い低頻度単語の聞き損ないを防ぐことができる。
【0025】
【発明の実施の形態】
以下に、本発明の文章読み上げ装置を具体化した実施の形態について図を参照しながら説明する。なお、従来の技術と同一の要素には同一の符号を用いその説明を省略する。
【0026】
図1は、本実施の形態による文章読み上げ装置の概略構成を示している。
【0027】
本実施の形態による文章読み上げ装置は、文章ファイル1、辞書3、形態素解析部5、音韻記号列生成部7、韻律記号列生成部9、規則合成部11、音声出力部13、表示制御部15、画面バッファ17、表示装置19等から構成されている。
【0028】
同図において、文章ファイル1は文章読み上げ装置が読み上げるテキストを格納するものである。
【0029】
形態素解析部5は文章ファイル1のテキストを構成する単語を、辞書3に格納されている単語により同定するものである。例えば、「橋を渡る」という文章の場合には、辞書3に格納された「橋」・「を」・「渡る」といった単語から構成されていることを同定する。ここで、辞書3は、一般の形態素解析用の辞書であるが、ここで用いる辞書には、各単語の「読み」・「アクセント」・「属性」等の情報も記述されている。
【0030】
音韻記号列生成部7は、形態素解析部5により同定された各単語の「読み」を辞書3から読み込み、文脈から入力テキストの「読み」を同定する。例えば、前記例「橋を渡る」という文章の場合、「ha-shi-wo-wa-ta-ru」という音韻記号列を生成する。
【0031】
韻律記号生成部9は、形態素解析部5により同定された各単語の「アクセント」を辞書3から読み込み、文脈から入力テキストの「アクセント」を同定する。また、文章の「イントネーション」も同定する。例えば、前記の例の「橋を渡る」という文章の場合、「ha"shi'wowataru」という韻律記号列を生成する。ここで、「"」はアクセントの上昇を、「'」はアクセントの下降の位置を示す。
【0032】
文章解析手段は、上述した形態素解析部5と、音韻記号列生成部7及び韻律記号列生成部9とから構成されている。
【0033】
規則合成手段を構成する規則合成部11は、音韻記号列生成部7・韻律記号生成部9により生成されたテキストの「読み」と「アクセント」、「イントネーション」から音声を合成するものであり、D/A変換器、スピーカ等で構成される音声出力部13より合成音を出力する。
【0034】
同期信号発生部14は、合成音声が出力され始める時刻を基準として、各単語の合成音が出力開始される時刻t1、t2、…を算定し、時刻t1、t2、…が経過する毎に同期信号を発生する。前記例の場合では文章を構成する単語「橋」・「を」・「渡る」の合成音が、それぞれ出力される開始時刻で同期信号を発生する。
【0035】
表示制御部15は、この同期信号を受けると、形態素解析部5において同定された単語の属性をチェックし、表示すべき属性を持つ単語である場合にはこの単語の「表記」を画面バッファ17に書き込み表示装置19に表示する。ここで、表示装置19は、図2に示すように、携帯機器等でも使えるように小型な表示領域を備えたもので、最低限数文字分の表示領域を持つものである。
【0036】
表示制御手段は、上述した同期信号発生手段14と表示制御部15とから構成され、表示手段は画面バッファ17と表示装置19とから構成されている。
【0037】
また、表示すべき属性とは、例えば、意味を取り違えやすいような「同音異義語」の有無や、キーワードとなり易い「名詞」・「熟語」や、利用者が日常において聞き慣れないような単語に対する「使用頻度」の低さ等を設定することができる。また、属性としては、前記に限定されず、製造者が表示したい単語全てに対して、例えば、「表示」といった製造者独自の属性を付けてもかまわず、自由に属性を決定しても良い。また、全ての単語を表示するようにしても良い。
【0038】
次に、辞書3の一例を図3に示す。ここでは、「同音異義語」である「橋」・「端」・「箸」について説明する(この例では3単語とも読みは同一ではあるが、アクセントの型がそれぞれ違うために音声だけでも識別が十分可能であり、また日常使い慣れている語彙であるために文意からの識別も可能である)。属性としては「品詞」と「同音異義語」の有無が記述されている。表示制御部15は、例えば、品詞が「名詞」であり「同音異義語あり」の属性を持つ単語を表示装置19に表示する。
【0039】
次に、本発明の実施の形態の作用を図4・図5を用いて説明する。
【0040】
例えば、「橋を渡る」というテキストが入力された場合について説明する。テキストが入力されると(s1、sはステップを示す。以下同様)、形態素解析部5が文章を構成する単語「橋」・「を」・「渡る」を同定する。また、音韻記号列生成部7が入力テキストの「読み」を同定し、韻律記号生成部9が「アクセント」・「イントネーション」を同定する(s2)。次に、規則合成部11が、音韻記号列生成部7・韻律記号生成部9によって生成されたテキストの「読み」と「アクセント」、「イントネーション」から音声を合成する(s3)。次に、音声出力部13が合成音を出力する(s4)。また。同期信号発生部14は、合成音が出力され始めてから各単語が出力開始される時間t1、t2、…が経過する毎に同期信号を発生する。前記の例の場合では、文章を構成する単語「橋」・「を」・「渡る」の合成音が、それぞれ出力される開始時刻で同期信号を発生する(s5)。
【0041】
前記表示制御部15は、前記同期信号を受けると、音声出力部13が発声中の単語の属性を調べる(s11)。先ず、最初の単語「橋」の属性は「名詞」であり「同音異義語あり」であるために(s12)、画面バッファ17を消去した後に、この単語の「表記」を書き込み、表示装置19に表示する(s13)。従って、表示は、この単語の合成音が出力開始された直後から、次に、表示すべき属性を持つ単語が検出され、その合成音が出力開始されるまで続けられることになる。
【0042】
また、「を」・「渡る」という単語に対しても、合成音声と同期して処理s11〜s13が行われるが、品詞が「助詞」・「動詞」であるために表示は行われない。
【0043】
以上のように、上述した実施の形態では、表示制御部15は、前記属性の単語を形態素解析部5が検出すると、画面バッファ17を介して表示装置19上に表示する構成になっているので、効率よく視覚的に合成音を補助し、同音異義語や日常において聞き慣れない単語等の聞き損ないを防ぐことができる。また、小型な表示領域を持つ表示装置を用いているために携帯機器等にも適している。
【0044】
尚、本実施の形態においては、表示装置19への表示を、その単語の合成音の出力開始から、次に表示すべき属性を持つ単語が検出されその合成音が出力されるまで続ける様にした。つまり、複数単語を同時に表示しないような構成したが、特に限定されるものではなく、複数単語を同時に表示するような構成にしてもかまわない。
【0045】
また、表示時間も例えば一定時間以上経過した場合には、消えてしまうように構成しても良く、また、表示すべき単語の合成音が出力する直前に表示をするのではなく、一定時間前から表示をするように構成してもかまわない。
【0046】
また、本実施の形態においては単語を表示の単位としたが、文節等の単語より長い単位のものであってもかまわない。
【0047】
【発明の効果】
以上説明したことから明らかなように、本発明の請求項1に記載の文章読み上げ装置によれば、小型の表示領域を持つ表示手段を用いて合成音を視覚的に補助をすることにより、小型でありながら同音異義語や日常において聞き慣れない単語等の聞き損ないを防ぐことができ、また視線移動による利用者の疲労を解消することができる。
【0048】
また、辞書内の単語の属性により表示する単語を効率よく絞ることができる。
【0049】
また、請求項2に記載の文章読み上げ装置によれば、「同音異義語」の属性を持つ単語を検出し表示することにより、利用者の「同音異義語」に対する聞き違いを防ぐことができる。
【0050】
また、請求項3に記載の文章読み上げ装置によれば、文章を理解するためのキーワードとなる「名詞」の属性を持つ単語を検出し表示することにより、文意を理解する上で重要な単語の聞き損ないを防ぐことができる。
【0051】
また、請求項4に記載の文章読み上げ装置によれば、文章を理解するためのキーワードとなる「熟語」の属性を持つ単語を検出し表示することにより、重要語の聞き損ないを防ぐと共に利用者の文章理解を助けることができる。
【0052】
さらに、請求項5に記載の文章読み上げ装置によれば、「使用頻度」が低い単語を検出し表示することにより、日常あまり使われないために聞き損ない易い低頻度単語の聞き損ないを防ぐことができる。
【図面の簡単な説明】
【図1】 本実施の形態の文章読み上げ装置の概略構成図である。
【図2】 本実施の形態の表示装置の説明図である。
【図3】 本実施の形態の辞書の説明図である。
【図4】 本実施の形態の全体の動作を示すフローチャートである。
【図5】 本実施の形態の表示制御部の動作を示すフローチャートである。
【図6】 従来の文章読み上げ装置の概略構成図である。
【図7】 他の従来の文章読み上げ装置の概略構成図である。
【図8】 従来の文章読み上げ装置のディスプレイの説明図である。
【符号の説明】
3 辞書
5 形態素解析部
7 音韻記号列生成部
9 韻律記号列生成部
11 規則合成部
14 同期信号発生部
15 表示制御部
17 画面バッファ
19 表示装置
Claims (5)
- 文章読み上げ装置において、
単語の「表記」と「読み」、「アクセント」及び「属性」を辞書として格納した記憶手段と、
表記された文章を構成する単語を前記辞書を参照しつつ同定し、単語の「読み」・「アクセント」と前後の文脈等から、この文章の音韻情報・韻律情報を生成する文章解析手段と、生成された前記音韻情報・韻律情報を基に音声を合成する規則合成手段と、
文字を表示する表示手段と、
前記文章解析手段において同定された単語の「属性」と予め設定された表示すべき属性とを比較し、前記同定された単語の「属性」が予め設定された表示すべき属性である場合には、前記同定された単語が前記規則合成手段によって合成音として出力されている期間と同期して前記表示手段に前記同定された単語を表示させるように制御する表示制御手段と
を備えたことを特徴とする文章読み上げ装置。 - 前記辞書は「同音異義語」に関する属性を備え、前記文章解析手段がこの属性を持つ単語を同定したときに、前記表示制御手段が前記表示手段にこの単語を表示させることを特徴とする請求項1に記載の文章読み上げ装置。
- 前記辞書は「名詞」に関する属性を備え、前記文章解析手段がこの属性を持つ単語を同定したときに、前記表示制御手段が前記表示手段にこの単語を表示させることを特徴とする請求項1に記載の文章読み上げ装置。
- 前記辞書は「熟語」に関する属性を備え、前記文章解析手段がこの属性を持つ単語を同定したときに、前記表示制御手段が前記表示手段にこの単語を表示させることを特徴とする請求項1に記載の文章読み上げ装置。
- 前記辞書は「使用頻度」に関する属性を備え、前記文章解析手段が「使用頻度」が低い単語を同定したときに、前記表示制御手段が前記表示手段にこの単語を表示させることを特徴とする請求項1に記載の文章読み上げ装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP15106697A JP3804188B2 (ja) | 1997-06-09 | 1997-06-09 | 文章読み上げ装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP15106697A JP3804188B2 (ja) | 1997-06-09 | 1997-06-09 | 文章読み上げ装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH10340095A JPH10340095A (ja) | 1998-12-22 |
JP3804188B2 true JP3804188B2 (ja) | 2006-08-02 |
Family
ID=15510566
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP15106697A Expired - Fee Related JP3804188B2 (ja) | 1997-06-09 | 1997-06-09 | 文章読み上げ装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3804188B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100583236C (zh) * | 2003-05-21 | 2010-01-20 | 松下电器产业株式会社 | 声音输出装置及声音输出方法 |
JP4973664B2 (ja) | 2006-11-24 | 2012-07-11 | 富士通株式会社 | 文書読上げ装置、文書読上げ装置を制御する制御方法及び文書読上げ装置を制御する制御プログラム |
JP5159853B2 (ja) | 2010-09-28 | 2013-03-13 | 株式会社東芝 | 会議支援装置、方法およびプログラム |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6414662A (en) * | 1987-07-08 | 1989-01-18 | Sharp Kk | Japanese language document preparing device with voice reading |
JPH0371198A (ja) * | 1989-08-10 | 1991-03-26 | Sanyo Electric Co Ltd | 文章音声の規則合成装置 |
JPH05113764A (ja) * | 1991-10-23 | 1993-05-07 | Nippon Telegr & Teleph Corp <Ntt> | 音声出力機能付掲示装置 |
JPH0736377A (ja) * | 1993-07-23 | 1995-02-07 | Lion Corp | 視覚障害者用情報提供装置および方法 |
JPH07181992A (ja) * | 1993-12-22 | 1995-07-21 | Toshiba Corp | 文書読上げ装置及び方法 |
JP3668583B2 (ja) * | 1997-03-12 | 2005-07-06 | 株式会社東芝 | 音声合成装置及びその方法 |
-
1997
- 1997-06-09 JP JP15106697A patent/JP3804188B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH10340095A (ja) | 1998-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3142803B2 (ja) | テキストを音声に変換するシンセサイザ | |
EP3387646B1 (en) | Text-to-speech processing system and method | |
JP3224000B2 (ja) | テキスト−音声変換システム | |
US8175879B2 (en) | System-effected text annotation for expressive prosody in speech synthesis and recognition | |
JP2007206317A (ja) | オーサリング方法、オーサリング装置およびプログラム | |
JP5106608B2 (ja) | 読み上げ支援装置、方法、およびプログラム | |
JPH05165486A (ja) | テキスト音声変換装置 | |
Pitt et al. | Design of speech-based devices: a practical guide | |
JP3804188B2 (ja) | 文章読み上げ装置 | |
Demenko et al. | JURISDIC: Polish Speech Database for Taking Dictation of Legal Texts. | |
JP2004145015A (ja) | テキスト音声合成システム及び方法 | |
KR101553469B1 (ko) | 다언어 어휘 음성 인식 장치 및 방법 | |
Gakuru et al. | Development of a Kiswahili text to speech system. | |
JPS60188995A (ja) | 文章発声方法 | |
KR20020048357A (ko) | 오디오 플레이어에서의 텍스트/음성 변환 및 자동 음성인식 구현 방법 및 장치 | |
Anand et al. | Email access by visually impaired | |
JP2000330999A (ja) | 発音電子辞書 | |
Tatham et al. | Speech synthesis in dialogue systems | |
JPH0145089B2 (ja) | ||
JPH11259094A (ja) | 規則音声合成装置 | |
JPH10254676A (ja) | 音声合成装置及びその方法 | |
Bodenbender | The punctuation and intonation of parentheticals | |
JPH0371198A (ja) | 文章音声の規則合成装置 | |
JPS6391736A (ja) | 読み合わせ装置 | |
JP2015172625A (ja) | 音声合成装置、合成音声編集方法及び合成音声編集用コンピュータプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20050705 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050920 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20051121 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060418 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060501 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090519 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100519 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110519 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |