JP2006208793A - 音声処理装置、音声処理方法およびプログラム - Google Patents

音声処理装置、音声処理方法およびプログラム Download PDF

Info

Publication number
JP2006208793A
JP2006208793A JP2005021533A JP2005021533A JP2006208793A JP 2006208793 A JP2006208793 A JP 2006208793A JP 2005021533 A JP2005021533 A JP 2005021533A JP 2005021533 A JP2005021533 A JP 2005021533A JP 2006208793 A JP2006208793 A JP 2006208793A
Authority
JP
Japan
Prior art keywords
reading
sentence
speech
read
immediately preceding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005021533A
Other languages
English (en)
Inventor
Hideaki Takeda
秀明 竹田
Katsunori Takahashi
克典 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alpine Electronics Inc
Original Assignee
Alpine Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alpine Electronics Inc filed Critical Alpine Electronics Inc
Priority to JP2005021533A priority Critical patent/JP2006208793A/ja
Publication of JP2006208793A publication Critical patent/JP2006208793A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Navigation (AREA)

Abstract

【課題】 聞き逃し単語を再度読み上げさせる場合、必要な箇所をすぐに読み上げさせることのできる「音声処理装置」、「音声処理方法」および「プログラム」を提供することを目的とする。
【解決手段】 音声処理装置2は、読み上げ文を音声合成する音声合成部23と、発話スイッチ4によって読み上げ文を読み上げ中に再度の読み上げが選択されたとき、読み上げ文中で再度の読み上げが選択された際の直前の文節から読み上げを開始するよう音声合成部23を制御する制御部22とを備える。本発明によれば、聞き逃した単語を再度読み上げさせる場合、読み上げ文中で再度の読み上げが選択された際の直前の文節から読み上げを開始するので、必要な箇所をすぐに読み上げさせることができる。制御部22は、直前の文節から読み上げを開始する際に、直前の文節を読み上げる際の音量が大きくなるよう音声合成部を制御する。
【選択図】 図1

Description

本発明は、音声処理装置、音声処理方法及びプログラムに関する。
従来、音声を直接人間の発声そのままによらないで、人工的に作りだす音声合成(speech synthesis)が提案されている。この音声合成の機能を例えばナビゲーションに持たせることにより、ニュース記事の読み上げや地点情報の読み上げを行うことができる。しかし、ニュース記事や地点情報の読み上げは、主に走行中に使用される機能であり、漠然と聞き流していたときやロードノイズなどにより、直前の単語がはっきり聞き取れないことがある。例えば、読み上げを始めるとき、たとえば、いきなり「馬耳東風」という単語が読み上げられた場合、この「馬耳東風」という部分を聞き逃したり、ロードノイズによって、聞き取れなかったりすることがある。このため、聞き逃した箇所を再度読み上げる技術が提案されている(従来技術1)。
また、他の従来技術として以下のようなものが提案されている。特許文献1に記載の技術は、現時点から所定時間長分だけ遡った時点までの音声信号を記憶しておき、利用者から与えられた指示に応じた時間長だけ音声信号を遡って読み出して音声出力部に出力させて再生させるので、読上げられた音声信号を任意の時間長だけ遡って再生させることができる。
特開平5−260082号公報
しかしながら、従来技術1では、聞き逃した単語を読み上げさせるためには、再度記事の一番最初から読み上げを開始していたため、必要な箇所をすぐに聞くことができないという問題があった。また、特許文献1に記載の技術では利用者が指示した時間長だけ遡って再生を行っているため、必要な箇所をすぐに再生することができるとは限らない。
そこで、本発明はこれらの問題を解決するためになされたもので、聞き逃し単語を再度読み上げさせる場合、必要な箇所をすぐに読み上げさせることのできる音声処理装置、音声処理方法及びプログラムを提供することを目的とする。
上記課題を解決するために、本発明は、読み上げ文を音声合成する音声合成部と、前記読み上げ文を読み上げ中に再度の読み上げが選択されたとき、前記読み上げ文中で前記再度の読み上げが選択された際の直前の文節から読み上げを開始するよう前記音声合成部を制御する制御部とを備える音声処理装置である。本発明によれば、聞き逃した単語を再度読み上げさせる場合、読み上げ文中で再度の読み上げが選択された際の直前の文節から読み上げを開始するので、必要な箇所をすぐに読み上げさせることができる。したがって、1番最初から読み上げさせる必要がなくなる。
前記制御部は、前記直前の文節から読み上げを開始する際に、前記直前の文節を読み上げる際の音量が大きくなるよう前記音声合成部を制御するのが好ましい。本発明によれば、聞き逃した単語について、大きい音量で読み上げを行うことで、再度の聞き逃しを防ぐことができる。前記制御部は、前記直前の文節から読み上げを開始する際に、前記直前の文節を読み上げる速度が遅くなるよう前記音声合成部を制御するのが好ましい。本発明によれば、聞き逃した単語について、ゆっくりと読み上げを行うことで、再度の聞き逃しを防ぐことができる。また、特許文献1に記載の技術では、同じ読み、アクセント又はイントネーションで再生を行うため、再度聞き逃してしまうという問題があったが、本発明では大きな音量やゆっくりと読み上げを行うようにすることで、再度の聞き逃しを防止することができる。
前記制御部は、前記直前の文節から読み上げを開始する際に、前記読み上げる直前の文節を意味がより詳しい文節となるよう読み上げ文を生成するのが好ましい。本発明は、前記音声処理装置を備えたナビゲーション装置である。これにより、必要な箇所をすぐに読み上げさせることができるナビゲーション装置を提供することができる。
本発明は、読み上げ文を音声合成するステップと、前記読み上げ文を読み上げ中に再度の読み上げを選択するステップと、前記読み上げ文中で前記再度の読み上げが選択された際の直前の文節から読み上げを開始するステップとを有する音声処理方法である。本発明によれば、聞き逃した単語を再度読み上げさせる場合、読み上げ文中で再度の読み上げが選択された際の直前の文節から読み上げを開始するので、必要な箇所をすぐに読み上げさせることができる。したがって、1番最初から読み上げさせる必要がなくなる。
本発明は、前記直前の文節から読み上げを開始する際に、前記直前の文節を読み上げる際の音量を大きくするステップをさらに有する音声処理方法である。本発明によれば、聞き逃した単語について、大きい音量で読み上げを行うことで、再度の聞き逃しを防ぐことができる。本発明は、前記直前の文節から読み上げを開始する際に、前記直前の文節を読み上げる速度を遅くするステップをさらに有する音声処理方法である。本発明によれば、聞き逃した単語について、ゆっくりと読み上げを行うことで、再度の聞き逃しを防ぐことができる。
本発明は、読み上げ文を音声合成するステップ、前記読み上げ文を読み上げ中に再度の読み上げが選択されたとき、前記読み上げ文中で前記再度の読み上げが選択された際の直前の文節から読み上げを開始するよう制御信号を生成するステップをコンピュータに実行させるためのプログラムである。本発明によれば、聞き逃した単語を再度読み上げさせる場合、読み上げ文中で再度の読み上げが選択された際の直前の文節から読み上げを開始するので、必要な箇所をすぐに読み上げさせることができる。したがって、1番最初から読み上げさせる必要がなくなる。
本発明によれば、聞き逃し単語を再度読み上げさせる場合、必要な箇所をすぐに読み上げることのできる音声処理装置、音声処理方法及びプログラムを提供できる。
以下、本発明を実施するための最良の形態について説明する。図1は、本発明の実施形態におけるナビゲーション装置の構成図である。図1に示すように、ナビゲーション装置1は、音声処理装置2、ディスプレイ3、発話スイッチ(SW)4、マイクロホン5及びスピーカ6を備える。このナビゲーション装置1は、聞き逃した文節を再度読み上げさせる機能を備える。ナビゲーション装置1は、例えば自車位置を検出して自車位置周辺の地図を表示し、利用者によって選択された目的地までの経路探索及び経路誘導等を行う機能を有する。また、音声処理装置2は、コンパクトディスクやミニディスク等の記録媒体に記録された音楽再生等を行うオーディオ装置内に組み込まれていてもよい。
発話スイッチ4は、利用者が音声処理装置2と対話を開始したり、利用者が音声処理装置2から出力される音声を再度聞きたい場合に押下げるボタンスイッチである。この発話スイッチ4が押下げられているときに、利用者が発話を行うと、音声認識部21によって発話内容が認識される。マイクロホン5は、利用者が発声した音声を集音して音声信号に変換する。
音声処理装置2は、利用者が発声した音声に応答して対話形式で各種の動作指示を決定して出力する等の機能を実現する。音声処理装置2は、音声認識部21、制御部22及び音声合成部23を備える。音声認識部21は、発話スイッチ4が押下げ中に、マイクロホン5から出力される音声信号を解析して所定の音声認識処理を行い、利用者が発声した音声に対応する文字列を特定する。音声認識部21は、通常の音声認識辞書と読み上げ時専用の音声認識辞書を用いて音声認識を行う。
制御部22は、文字で書かれた日本語を音声に変換するために、単語の境界の検出とセグメンテーション(区分化)、単語の音素記号列への変換、音素の継続時間長、単語のアクセント、文イントネーション等の韻律情報の付与およびあらかじめ蓄えてある合成単位と規則による音声合成器の制御信号の生成の手順を行う。具体的には、制御部22は、ニュース記事や地点情報等のように、利用者に対して出力する読み上げ文(案内文)を生成する。また、制御部22は、利用者が発話スイッチ4を押下げることによって読み上げ文を読み上げ中に再度の読み上げが選択されたとき、読み上げ文中で再度の読み上げが選択された際の直前の文節から読み上げを開始するよう音声合成部23を制御する。
制御部22は、直前の文節から読み上げを開始する際に、直前の文節を読み上げる際の音量が大きくなるよう音声合成部23を制御する。制御部22は、直前の文節から読み上げを開始する際に、直前の文節を読み上げる速度が遅くなるよう音声合成部23を制御する。さらに、制御部22は、直前の文節から読み上げを開始する際に、読み上げる直前の文節を意味がより詳しい文節となるよう読み上げ文を生成するようにしても良い。
音声合成部23は、制御部22が生成した読み上げ文を音声合成してスピーカ6に出力する。ここで、音声合成の方式は、一般に録音編集方式、パラメータ編集方式、規則合成方式に分類される。録音編集方式は、人が発声した音声波形を、そのままあるいは波形符号化して蓄積しておき、必要に応じて繋ぎ合わせて出力するものである。パラメータ編集方式は、人が発声した音声波形を分析してパラメータに変換された形で蓄積しておき、それを繋ぎ合わせて音声合成器を駆動し、音声を作り出すものである。規則合成方式は、文字列あるいは音素記号列から、音声学的・言語学的規則に基づいて、音声を作り出すものである。
なお、音声合成の方式としてパラメータ編集方式を採用する場合には、制御部23は、音声合成部23へのパラメータを調整することによって、直前の文節から読み上げる機能、直前の文節を読み上げる際に音量が大きくなる機能、直前の文節を読み上げる速度を遅くする機能を実現する。スピーカ6は、音声合成部23から入力される音声信号に基づいて読み上げ文を読み上げる。
次に、音声処理装置の動作を説明する。図2は音声処理装置の処理フローチャートである。利用者は発話スイッチ4を押下げて、「スタート」と発話する。音声認識部21は、通常の音声認識辞書をメモリ上に展開し、認識結果を検索し、読み上げ文の読み上げ処理がスタートする。読み上げられた文中の「馬耳東風」という単語が読み上げられた場合、利用者がこの「馬耳東風」という単語が聞き取れなかったと仮定する。このとき、利用者は発話スイッチ4を押下げて、「もう一度」と発話して、「馬耳東風」という単語を読み上げるよう指示を行う。
ステップS1で、音声認識部21は、読み上げ時専用の音声認識辞書をメモリ上に展開し、認識結果の検索を行う。ステップS2で、音声認識部21は、認識結果がヒットしたかどうかを判断し、認識結果がヒットしないと判断した場合、ステップS3で、従来の音声認識辞書から検索を行って、ステップS4で、制御部22は対応する処理を行う。
ステップS2で、音声認識部22は、読み上げ時専用の音声認識辞書で認識結果がヒットしたと判断した場合、ステップS5で、制御部22は、直前の文節から再度読み上げを開始すると共に、音声合成パラメータ調整を行って音量を大きくし、読み上げ速度を落すように音声合成部23を制御する。ステップS6で、音声合成部23は、直前の文節を読み上げる。これによって、再度の読み上げが選択されたときの直前の文節「馬耳東風」については、ボリュームアップおよびゆっくりと読み上げが行われる。ステップS7で、制御部22は、大きくした音量をもとに戻し、落とした読み上げ速度を通常の速度に戻すよう音声合成パラメータを調整する。ステップS8で、制御部22は、読み上げを継続するよう音声合成パラメータを調整する。音声合成部23は、直前の文節以降は、通常のパラメータで読み上げを行う。
このように、再度の読み上げが選択されたときの直前の文節「馬耳東風」については、ボリュームアップおよびゆっくりと読み上げを行うことにより、必要な箇所をすぐに読み上げさせることができる。再度読み上げる文節については、大きい音量で読み上げを行うことで、再度の聞き逃しを防ぐことができる。また、再度読み上げる文節ついては、ゆっくりと読み上げを行うことで、再度の聞き逃しを防ぐことができる。
なお、音声処理装置2は、例えば、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)等を用いて実現される。プログラムをハードディスク装置や、CD−ROM、DVDまたはフレキシブルディスクなどの可搬型記憶媒体等からインストールし、または通信回路からダウンロードし、CPUがこのプログラムを実行することで、本発明の各機能が実現される。このプログラムは、読み上げ文を音声合成するステップ、前記読み上げ文を読み上げ中に再度の読み上げが選択されたとき、前記読み上げ文中で前記再度の読み上げが選択された際の直前の文節から読み上げを開始するよう制御信号を生成するステップをコンピュータに実行させる。
以上、本発明の好ましい実施例について詳述したが、本発明は係る特定の実施例に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
本発明の実施形態におけるナビゲーション装置の構成図である。 音声処理装置の処理フローチャートである。
符号の説明
1 ナビゲーション装置
2 音声処理装置
21 音声認識部
22 制御部
23 音声合成部
3 ディスプレイ
4 発話スイッチ
5 マイクロホン

Claims (9)

  1. 読み上げ文を音声合成する音声合成部と、
    前記読み上げ文を読み上げ中に再度の読み上げが選択されたとき、前記読み上げ文中で前記再度の読み上げが選択された際の直前の文節から読み上げを開始するよう前記音声合成部を制御する制御部とを備えることを特徴とする音声処理装置。
  2. 前記制御部は、前記直前の文節から読み上げを開始する際に、前記直前の文節を読み上げる際の音量が大きくなるよう前記音声合成部を制御することを特徴とする請求項1に記載の音声処理装置。
  3. 前記制御部は、前記直前の文節から読み上げを開始する際に、前記直前の文節を読み上げる速度が遅くなるよう前記音声合成部を制御することを特徴とする請求項1に記載の音声処理装置。
  4. 前記制御部は、前記直前の文節から読み上げを開始する際に、前記読み上げる直前の文節を意味がより詳しい文節となるよう読み上げ文を生成することを特徴とする請求項1に記載の音声処理装置。
  5. 請求項1から請求項4のいずれか一項に記載の音声処理装置を備えたナビゲーション装置。
  6. 読み上げ文を音声合成するステップと、
    前記読み上げ文を読み上げ中に再度の読み上げを選択するステップと、
    前記読み上げ文中で前記再度の読み上げが選択された際の直前の文節から読み上げを開始するステップとを有することを特徴とする音声処理方法。
  7. 前記直前の文節から読み上げを開始する際に、前記直前の文節を読み上げる際の音量を大きくするステップをさらに有することを特徴とする請求項6に記載の音声処理方法。
  8. 前記直前の文節から読み上げを開始する際に、前記直前の文節を読み上げる速度を遅くするステップをさらに有することを特徴とする請求項6に記載の音声処理方法。
  9. 読み上げ文を音声合成するステップ、
    前記読み上げ文を読み上げ中に再度の読み上げが選択されたとき、前記読み上げ文中で前記再度の読み上げが選択された際の直前の文節から読み上げを開始するよう制御信号を生成するステップをコンピュータに実行させるためのプログラム。
JP2005021533A 2005-01-28 2005-01-28 音声処理装置、音声処理方法およびプログラム Pending JP2006208793A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005021533A JP2006208793A (ja) 2005-01-28 2005-01-28 音声処理装置、音声処理方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005021533A JP2006208793A (ja) 2005-01-28 2005-01-28 音声処理装置、音声処理方法およびプログラム

Publications (1)

Publication Number Publication Date
JP2006208793A true JP2006208793A (ja) 2006-08-10

Family

ID=36965719

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005021533A Pending JP2006208793A (ja) 2005-01-28 2005-01-28 音声処理装置、音声処理方法およびプログラム

Country Status (1)

Country Link
JP (1) JP2006208793A (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07121798A (ja) * 1993-10-21 1995-05-12 Matsushita Electric Ind Co Ltd ナビゲーション装置
JPH07141596A (ja) * 1993-11-17 1995-06-02 Honda Motor Co Ltd 移動体用情報提示装置
JP2000267687A (ja) * 1999-03-19 2000-09-29 Mitsubishi Electric Corp 音声応答装置
JP2003202233A (ja) * 2002-01-07 2003-07-18 Canon Inc 情報再生装置及び情報再生方法並びに記憶媒体
JP2004240217A (ja) * 2003-02-06 2004-08-26 Ricoh Co Ltd 文書/音声変換装置および文書/音声変換方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07121798A (ja) * 1993-10-21 1995-05-12 Matsushita Electric Ind Co Ltd ナビゲーション装置
JPH07141596A (ja) * 1993-11-17 1995-06-02 Honda Motor Co Ltd 移動体用情報提示装置
JP2000267687A (ja) * 1999-03-19 2000-09-29 Mitsubishi Electric Corp 音声応答装置
JP2003202233A (ja) * 2002-01-07 2003-07-18 Canon Inc 情報再生装置及び情報再生方法並びに記憶媒体
JP2004240217A (ja) * 2003-02-06 2004-08-26 Ricoh Co Ltd 文書/音声変換装置および文書/音声変換方法

Similar Documents

Publication Publication Date Title
JP2007086316A (ja) 音声合成装置、音声合成方法、音声合成プログラムおよび音声合成プログラムを記憶したコンピュータ読み取り可能な記憶媒体
JP2006201749A (ja) 音声による選択装置、及び選択方法
JP2005070430A (ja) 音声出力装置および方法
JPH09325796A (ja) 文書朗読装置
JP2004212665A (ja) 話速可変装置及び話速変換方法
JP5819147B2 (ja) 音声合成装置、音声合成方法およびプログラム
JPH0876796A (ja) 音声合成装置
JP2006330484A (ja) 音声案内装置及び音声案内プログラム
JP2006276560A (ja) 音楽再生装置および音楽再生方法
JP6044490B2 (ja) 情報処理装置、話速データ生成方法、及びプログラム
JP2006208793A (ja) 音声処理装置、音声処理方法およびプログラム
JP2010175717A (ja) 音声合成装置
JP2006139162A (ja) 語学学習装置
JPH07200554A (ja) 文章読み上げ装置
JP2011090218A (ja) 音素符号変換装置、音素符号データベース、および音声合成装置
JP4313724B2 (ja) 音声再生速度調節方法、音声再生速度調節プログラム、およびこれを格納した記録媒体
JP5106437B2 (ja) カラオケ装置及びその制御方法並びにその制御プログラム
JP4260071B2 (ja) 音声合成方法、音声合成プログラム及び音声合成装置
JP2007256815A (ja) 音声再生装置、音声再生方法、音声再生プログラム
JP4287664B2 (ja) 音声合成装置
JP2004061625A (ja) テキスト音声合成装置、テキスト音声合成方法、テキスト音声合成プログラム、および、プログラム記録媒体
JP6922306B2 (ja) 音声再生装置、および音声再生プログラム
JP2015049309A (ja) 情報処理装置、話速データ生成方法、及びプログラム
JPH08328575A (ja) 音声合成装置
JP2005037423A (ja) 音声出力装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070727

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100308

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100629

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20101221