JP2004157457A - 音声提示装置 - Google Patents
音声提示装置 Download PDFInfo
- Publication number
- JP2004157457A JP2004157457A JP2002325268A JP2002325268A JP2004157457A JP 2004157457 A JP2004157457 A JP 2004157457A JP 2002325268 A JP2002325268 A JP 2002325268A JP 2002325268 A JP2002325268 A JP 2002325268A JP 2004157457 A JP2004157457 A JP 2004157457A
- Authority
- JP
- Japan
- Prior art keywords
- speech
- sentence
- information
- voice
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【解決手段】音声提示装置はテキスト音声変換部12、音声出力情報保存部13、音声合成部16、音声装置17、音声出力制御部15、操作部14を備えている。テキスト音声変換部12では、テキスト情報を文毎に処理し、各文の文頭に文番号を示す識別子を付して読み上げ情報に変換する。音声出力制御部15は、音声出力情報保存部13から読み上げ情報を順次音声合成部16に送出し、音声として出力する時に、読み上げ情報の文頭の識別子を検出してその文番号読み取る。操作者が操作部14を操作して、一時停止に続く一時停止解除時に、音声出力制御部15は一時停止時に音声提示中であった文番号の文を音声出力情報保存部13から読み出し、文頭から音声出力を再開する。
【選択図】 図1
Description
【発明の属する技術分野】
本発明は、テキストデータを音声に変換して音声提示する音声提示装置に関する。
【0002】
【従来の技術】
【特許文献1】特開2002−23785号公報
車載の装置により、インターネットなどを介して、Webサーバから文字情報を取得したものを提示する技術として、情報の出力を開始させる機能を備える「開始ボタン」と、情報の出力を一時停止させる「一時停止ボタン」と、情報の出力を停止させる「停止ボタン」と、出力する情報を前の情報の区切りに移動させる「前ボタン」と、出力する情報を次の情報の区切りに移動させる「次ボタン」と、出力中の情報の出力位置をこの出力中の情報の中で後方に移動させる「早戻りボタン」と、出力中の情報の出力位置をこの出力中の情報の中で前方に移動させる「早送りボタン」とを備え、ユーザーは各ボタンを操作することにより、テキスト情報を音声出力に変換して情報出力を制御する技術が知られている(特開2002−23785号公報参照)。
【0003】
【発明が解決しようとする課題】
しかしながら、上記技術では頭出し信号を付けたテキストの先頭の所定の文字数分を読み上げるように設定され、ユーザーが希望する情報を含むテキストの位置を探す構成としており、開始ボタンで音声出力としてテキストデータを読み上げている時に、一時停止ボタンが押された場合、一時停止ボタンを再度押すと、一時停止したところから音声合成による音声出力を再開する。
そのため、例えば車両に搭載され、外部から送信されたテキスト情報を合成音声によって運転手に提示する装置の場合に、何かの都合で運転者が情報の音声出力を一時停止したときは、文の途中から音声出力が再開され、文意を捉えにくいという不便さがある。
【0004】
本発明は上記の問題点を解決するため、音声による情報提示を、任意の場所で一時停止しても、一時停止解除後にその文意を捉え易いように音声出力提示を再開できる音声提示装置を提供することを目的とする。
【0005】
【課題を解決するための手段】
このため本発明は、テキスト情報を音声合成可能な情報に整形処理するテキスト音声変換手段と、前記音声合成可能な情報を音声に合成する音声合成手段とを備え、音声装置から前記音声合成した音声を出力する音声提示装置において、音声出力の一時停止および一時停止解除を行う一時停止制御手段を備え、前記一時停止解除がなされた時、一時停止前に音声出力中の文の文頭から音声出力を再開する再開制御手段を有するものとした。
【0006】
【発明の効果】
本発明により、一時停止した音声出力を再開した時、一時停止した文の頭から音声出力を再開するので、一時停止解除後に文意が理解しやすく、従来のように文の途中から再開されて文意が捉えられず、操作スイッチで音声出力の戻し操作をする必要がなくなる。
【0007】
【発明の実施の形態】
以下本発明の実施の形態を説明する。図1は本発明を適用した車載の移動体通信端末装置の全体構成を示す。
移動体通信端末装置1は、車両外部の通信ネットワークシステム2の検索ナビゲータ19を介して情報サーバ20から送信される交通情報、天気予報、ニュースをはじめとする各種情報を取得し、合成音声でスピーカーのような音声装置17から情報を提示する装置である。
【0008】
移動体通信端末装置1は、操作者の操作部14による指示に基づき通信装置18を介して図示しない無線基地局と通信を行い、情報サーバ20から必要な情報を選択し、受信情報保存部11に記憶する。
音声出力制御部15は、受信情報保存部11、テキスト音声変換部12、音声出力情報保存部13および音声合成部16に接続し、それぞれを制御する。
【0009】
音声出力制御部15は、受信情報保存部11に保存された情報のテキスト情報を抽出しテキスト音声変換部12に送出して、音声合成可能な形式つまり読み上げ可能な形式にテキスト音声変換部12で整形処理させる。この読み上げ可能な形式の情報を読み上げ情報と以後称する。この読み上げ情報は音声出力情報保存部13に一時記憶される。
【0010】
さらに、音声出力制御部15は、操作部14を介して運転者の指示を受け、音声出力情報保存部13に一時記憶保存された読み上げ情報を音声合成部16に送出させ、音声出力を開始、停止、一時停止、一時停止解除などの制御をする。
操作部14は、図示しない表示画面と図2に示すような操作スイッチ部3を備えている。操作者は操作部14により情報の取得選択および音声情報の提示制御ができる。
【0011】
情報取得選択の場合、操作者は移動体通信端末装置1に操作メニューとして予め用意された情報一覧のリストまたは検索ナビゲータ19と交信して送信させた情報のリストを操作部14の表示画面に表示させて、図2のジョイスティック21を、戻りマーク25の方向に倒すと、リストの小さい番号に、送りマーク26の方向に倒すとリストの大きい番号に表示画面上のカーソルを移動させることができ、ジョイスティック21の頂部の決定/実行ボタン22を押すことによってカーソルの位置する情報項目が選択できる。
【0012】
音声提示の場合、操作者がジョイスティックの頂部の決定/実行ボタン22を押すことにより、音声提示を開始する。音声提示中の場合は、ジョイスティック21を戻りマーク25の方向に倒すと音声提示中の文章の1つ前の文の頭に、送りマーク26の方向に倒すと、1つ後の文の頭に移動する。
【0013】
操作スイッチ部3には停止ボタン24が設けられており、これを押すことにより音声提示が停止される。さらに操作スイッチ部3には一時停止ボタン23が設けられており、一度押すと音声提示が一時停止となり、一時停止状態で再度押すと一時停止が解除される。
【0014】
次に、テキスト音声変換部12でテキスト情報を読み上げ情報に変換し、音声出力情報保存部13に一時保存する方法を説明する。
テキスト音声変換部12では、文頭の判別を行い、テキスト情報を文毎に処理する。
文の末尾は句点(。)によって判別し、句点に引き続く文字を文頭として検知する。文頭には文番号を含む識別子を付す。
【0015】
さらに、テキスト中の音読不要な記号の削除、数字表記の桁読みまたは棒読みの判別、必要な間の付与が行われる。
読み上げ情報に整形処理された情報は、音声出力情報保存部13を構成する複数の領域からなるバッファメモリに、文単位で記憶される。この時、例えばバッファ領域Nには、文Nが記憶される。
【0016】
本実施の形態の作用を以下に説明する。
図3、図4は本実施の形態における音声情報提示の流れを、特に一時停止および一時停止解除の操作の場合を中心に示すフローチャートである。
ステップ101では、運転者が取得情報の指示をする。運転者は、操作部14の操作スイッチ部3のジョイスティック21と決定/実行ボタン22を操作することによって、取得する情報の種類例えばニュース、交通情報、天気予報などの選択と取得の指示を行う。
【0017】
ステップ102では、ステップ101の操作者の指示によって、通信装置18はネットワークシステム2の検索ナビゲータ19に接続し、検索ナビゲータ19に操作者が入力した検索項目によってネットワークシステム2に接続した検索項目に対応する情報サーバ20にアクセスし、サーバ20の検索を行い、運転者が指示した情報の抽出を行う。
ステップ103では、検索ナビゲータ19が検索抽出した結果の情報リストが操作部14の図示しない表示画面に表示され、運転者は操作部14の操作スイッチ部3によって確定して、情報をダウンロードし受信情報保存部11に保存する。
【0018】
ステップ104では、音声出力制御部15は受信情報保存部11に保存された情報からテキスト文を抽出して、テキスト音声変換部12に送出し、テキスト音声変換部12において読み上げ情報に整形処理させる。この時文頭に文番号を含む識別子が付加される。
ステップ105では、読み上げ情報を音声出力情報保存部13つまりバッファメモリに一時記憶する。
ステップ105の後ステップ106へ進む。
【0019】
音声出力制御部15は、ステップ104とステップ105の処理を繰り返して、次の文の読み上げ情報をバッファメモリへ記憶する。バッファメモリに書き込みができなくなった所で、バッファメモリである音声出力情報保存部13への一時記憶作業を停止する。
【0020】
ステップ106では、音声出力制御部15は、音声出力情報保存部13に保存された文単位で、読み上げ情報を音声合成部16へ送出する。
また、音声出力制御部15は、音声合成部16へ送出した文頭の識別子を検出してそこに書き込まれている文番号を読み取る。
【0021】
音声合成部16は、送られてきた読み上げ情報を、あらかじめ用意された音素と呼ばれる発音単位を組み合わせて実際の音声信号に変換し、順次音声装置17に送出する。
この時、ステップ104で読み上げ情報整形処理時に付加された音声合成のための付加情報が処理され、適切な発音や適切な間が与えられる。
ステップ107では、音声装置17は音声合成部16から送出された音声信号を音声として運転者に提示する。
【0022】
ステップ108では、運転者が操作部14の操作スイッチ部3の一時停止ボタン23を使って、一時停止を指示したかどうかをチェックする。一時停止の指示があったときはステップ109に進み、一時停止の指示がない場合はステップ113に進む。
ステップ109では、音声出力制御部15は、一時停止時の文の文番号を記憶する。
【0023】
ステップ110では、音声出力制御部15は、音声合成部16で音声合成中の情報を削除して、音声合成部16をリセットする。
ステップ110の後ステップ111へ進む。
【0024】
ステップ111では、音声出力制御部15は一時停止解除の指示があったかどうかをチェックする。
一時停止が解除されない場合は、ステップ111に戻る。
一時停止が解除された場合はステップ112に進み、ステップ109で特定した文の文頭から読みあげを再開する。つまり、音声出力制御部15は一時停止時に記憶した音声出力中の文番号によって音声出力情報保存部13から該当の文の読み上げ情報を音声合成部16へ送出し、音声合成部16で音声信号に変換し、音声装置17から音声提示する。
ステップ112の後ステップ113に進む。
【0025】
ステップ113では、音声出力制御部15は、一つの文の読み上げが完了したかどうかをチェックする。
まだ一つの文の途中の場合は、ステップ106に戻り、現在の文を音声合成処理し、音声装置17からの音声提示を続ける。
一つの文の読み上げを完了した場合は、ステップ114に進む。
【0026】
ステップ114では、音声出力制御部15は、音声出力情報保存部13に指示し、読み上げ完了した読み上げ情報の文を音声出力情報保存部13のバッファメモリから削除する。
ステップ115では、音声出力制御部15は、読み上げ終了指示があるかどうかをチェックする。運転者が操作スイッチ部3の停止ボタン24を押したことを検知した場合は、読み上げを終了する。そうでない場合はステップ116に進む。
ステップ116では、音声出力制御部15は受信情報保存部11にまだ読み上げていない情報があるかどうかをチェックする。全ての文章の読み上げが完了した場合は終了し、残っている場合はステップ117に進む。
【0027】
ステップ117では、音声出力制御部15は音声合成可能な読み上げ情報に整形処理されていない新たな文をテキスト音声変換部12で読み上げ情報整形処理させる。
ステップ118では、音声出力制御部15は、ステップ114で空になったバッファメモリ領域に、ステップ117で整形処理した新たな読み上げ情報を一時記憶する。
ステップ118の後、ステップ106に戻る。
【0028】
本実施の形態のテキスト音声変換部12は本発明のテキスト音声変換手段を、音声合成部16は音声合成手段を、一時停止ボタン23は本発明の一時停止制御手段を、ステップ105からステップ112は再開制御手段を構成する。
【0029】
以上説明したように、本実施の形態によると、例えば「明日の横浜の降水確率は、60%でしょう。」という文の読みあげを、「明日の横浜の降水確率は、6」で一時停止した場合、読み上げを再開すると、再び「明日の横浜の降水確率は、60%でしょう。」と繰り返され、一時停止解除前後の情報のつながりを自然に保つことができ、文意を捉えやすい。
【0030】
つまり、一時停止した時点で、対応する文番号を記憶し、音声出力を再開するとき、一時停止した文番号の文頭から繰り返して再開されるので、一時停止解除後の音声出力の文の文意を捉えやすく、文頭探しを操作スイッチで行うという煩わしさがない。
【0031】
以上の実施の形態では、操作スイッチ部3の構成は図2に示すようなジョイスティックを用いたものとしたが、ステアリングホィールに設置されたステアリングスイッチでもよい。
【0032】
または、運転者が直接手で操作するスイッチの代わりに、操作部14に付加した音声認識装置で「音声提示開始」、「一時停止」、「一時停止解除」、「停止」などの特定の指示に対応して設定した音声用語を認識して、上記ステップにおける運転者の指示とする構成でもよい。
そのように構成することによって、運転者が運転その他で忙しいときにも容易に音声出力の制御が対応できる。
【0033】
また、上記実施の形態では、基本的にテキスト情報を文毎に読み上げ情報形式で一つのバッファメモリ領域に一時記憶し、それを文単位で音声合成部16で処理する方式であったが、その代わりに複数の文からなる段落ごとの単位としてもよい。
段落は例えば、テキストの改行命令に続く文頭のスペースを検知した時、段落の切れ目と判断して、その文頭に識別子を付し、文章毎に1から順に段落番号を付与する。
この場合読み上げ再開時には、音声出力中の段落の冒頭から再開する。
【図面の簡単な説明】
【図1】本発明の実施の形態の移動体通信端末装置の構成を示すブロック図である。
【図2】操作部のスイッチの例を示す図である。
【図3】音声提示の流れを示す図である。
【図4】音声提示の流れを示す図である。
【符号の説明】
1 移動体通信端末装置
2 ネットワークシステム
3 操作スイッチ部
11 受信情報保存部
12 テキスト音声変換部
13 音声出力情報保存部
14 操作部
15 音声出力制御部
16 音声合成部
17 音声装置
18 通信装置
19 検索ナビゲータ
20 情報サーバ
21 ジョイスティック
22 決定/実行ボタン
23 一時停止ボタン
24 停止ボタン
25 戻りマーク
26 送りマーク
Claims (3)
- テキスト情報を音声合成可能な情報に整形処理するテキスト音声変換手段と、前記音声合成可能な情報を音声に合成する音声合成手段とを備え、音声装置から前記音声合成した音声を出力する音声提示装置において、
音声出力の一時停止および一時停止解除を行う一時停止制御手段を備え、
前記一時停止解除がなされた時、一時停止前に音声出力中の文の文頭から音声出力を再開する再開制御手段を有することを特徴とする音声提示装置。 - 前記テキスト音声変換手段は、前記音声合成可能な情報の文頭に識別子を付し、
前記再開制御手段は前記識別子に基づいて、前記一時停止解除後の音声提示開始位置を決定することを特徴とする請求項1記載の音声提示装置。 - 前記識別子が文の番号データを含み、
前記再開制御手段は、前記音声合成可能な情報の一つの文単位で一時記憶するメモリを備え、一時停止時に音声提示中の前記文の番号を記憶し、記憶した該番号の文を一時停止解除時に前記メモリから読み出し、当該の文の頭から音声合成させて音声出力させることを特徴とする請求項2記載の音声提示装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002325268A JP2004157457A (ja) | 2002-11-08 | 2002-11-08 | 音声提示装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002325268A JP2004157457A (ja) | 2002-11-08 | 2002-11-08 | 音声提示装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004157457A true JP2004157457A (ja) | 2004-06-03 |
Family
ID=32804550
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002325268A Pending JP2004157457A (ja) | 2002-11-08 | 2002-11-08 | 音声提示装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004157457A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015510602A (ja) * | 2011-12-20 | 2015-04-09 | オーディブル・インコーポレイテッドAudible, Inc. | 補助情報の再生の管理 |
JP2016525765A (ja) * | 2014-06-06 | 2016-08-25 | シャオミ・インコーポレイテッド | マルチメディア再生方法、装置、プログラム、及び記録媒体 |
-
2002
- 2002-11-08 JP JP2002325268A patent/JP2004157457A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015510602A (ja) * | 2011-12-20 | 2015-04-09 | オーディブル・インコーポレイテッドAudible, Inc. | 補助情報の再生の管理 |
JP2016525765A (ja) * | 2014-06-06 | 2016-08-25 | シャオミ・インコーポレイテッド | マルチメディア再生方法、装置、プログラム、及び記録媒体 |
US9589596B2 (en) | 2014-06-06 | 2017-03-07 | Xiaomi Inc. | Method and device of playing multimedia and medium |
US9786326B2 (en) | 2014-06-06 | 2017-10-10 | Xiaomi Inc. | Method and device of playing multimedia and medium |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100556050B1 (ko) | 적어도위치및/또는거리이름들을위한입력시스템 | |
US6185537B1 (en) | Hands-free audio memo system and method | |
JP2013088477A (ja) | 音声認識システム | |
JP2011504624A (ja) | 自動同時通訳システム | |
JP4784156B2 (ja) | 複数のキャラクタによる音声案内を行う音声合成装置、音声合成方法、そのプログラム及びこのプログラムが記録された情報記録媒体 | |
JPH0944189A (ja) | テキスト情報の合成音声読み上げ装置及び文字放送受信機 | |
JP2012168349A (ja) | 音声認識システムおよびこれを用いた検索システム | |
JP2004157457A (ja) | 音声提示装置 | |
JPH0918394A (ja) | 端末装置並びに情報配信システムおよび情報再生方法 | |
WO1997037344A1 (fr) | Terminal possedant une fonction de synthese vocale et systeme dispensant des donnees caracteres utilisant ce terminal | |
JP3830124B2 (ja) | 音声認識装置 | |
JP4525376B2 (ja) | 音声−数字変換装置および音声−数字変換プログラム | |
JP3848455B2 (ja) | 情報読み上げシステム及び当該システムに用いる情報端末並びに記録媒体 | |
JP4520555B2 (ja) | 音声認識装置および音声認識ナビゲーション装置 | |
JP2005037662A (ja) | 音声対話システム | |
JP7002823B2 (ja) | 案内音声出力制御システムおよび案内音声出力制御方法 | |
JP2655086B2 (ja) | 電話回線音声入力システム | |
JP2000250587A (ja) | 音声認識装置及び音声認識翻訳装置 | |
JP2004301980A (ja) | 音声対話装置及び音声対話代行装置並びにそれらのプログラム | |
JP2005114964A (ja) | 音声認識方法および音声認識処理装置 | |
JP7335115B2 (ja) | カラオケ用入力装置 | |
JP2005241393A (ja) | 言語設定方法および言語設定装置 | |
JPH10271403A (ja) | 地図データベース機能付tv受信機 | |
JP2010205079A (ja) | 手書文字入力システム | |
WO2015102039A1 (ja) | 音声認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051026 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080523 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080708 |
|
A521 | Written amendment |
Effective date: 20080903 Free format text: JAPANESE INTERMEDIATE CODE: A523 |
|
RD04 | Notification of resignation of power of attorney |
Effective date: 20080912 Free format text: JAPANESE INTERMEDIATE CODE: A7424 |
|
A02 | Decision of refusal |
Effective date: 20090407 Free format text: JAPANESE INTERMEDIATE CODE: A02 |