JP2010048931A - 音声データ作成方法、記憶装置、集積回路装置及び音声再生システム - Google Patents
音声データ作成方法、記憶装置、集積回路装置及び音声再生システム Download PDFInfo
- Publication number
- JP2010048931A JP2010048931A JP2008211631A JP2008211631A JP2010048931A JP 2010048931 A JP2010048931 A JP 2010048931A JP 2008211631 A JP2008211631 A JP 2008211631A JP 2008211631 A JP2008211631 A JP 2008211631A JP 2010048931 A JP2010048931 A JP 2010048931A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- audio
- data
- voice data
- division
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Telephone Function (AREA)
Abstract
【課題】音声データの総量を削減しつつ、良好な音声データの再生を可能にする音声データ作成方法、記憶装置、集積回路装置及び音声再生システムを提供する。
【解決手段】音声メッセージを所与の分割箇所で分割した複数の音声データを作成する音声データ作成方法であって、音声メッセージの音声振幅に基づいて音声データの分割箇所を選定する第1の分割箇所選定手順(ステップS102)と、第1の分割箇所選定手順で選定した分割箇所で音声データを分割する分割手順(ステップS104)とを含む。
【選択図】図1
【解決手段】音声メッセージを所与の分割箇所で分割した複数の音声データを作成する音声データ作成方法であって、音声メッセージの音声振幅に基づいて音声データの分割箇所を選定する第1の分割箇所選定手順(ステップS102)と、第1の分割箇所選定手順で選定した分割箇所で音声データを分割する分割手順(ステップS104)とを含む。
【選択図】図1
Description
本発明は、音声データ作成方法、記憶装置、集積回路装置及び音声再生システム等に関する。
音声ICを搭載し、音声メッセージを出力する音声再生システムが搭載された電子機器が知られている。
このような音声再生システムにおいては、音声メッセージを複数の音声データとして記憶装置等に記憶させた構成が知られている。例えば、音声メッセージを単語や文節に基づいて分割した音声データを用意し、音声データを複数の音声メッセージで共通に利用することにより、必要な音声データの総量を削減することができる。
特開2004−240009号公報
特開平9−102818号公報
音声メッセージを単語や文節に基づいて分割した音声データを組み合わせて音声メッセージを再生した場合には、音声データの組合せによっては聞き取りの際に不自然になる場合があった。
本発明は、以上のような技術的課題に鑑みてなされたものである。本発明の幾つかの態様によれば、音声データの総量を削減しつつ、良好な音声データの再生を可能にする音声データ作成方法、記憶装置、集積回路装置及び音声再生システムを提供できる。
(1)本発明に係る音声データ作成方法は、
音声メッセージを所与の分割箇所で分割した複数の音声データを作成する音声データ作成方法であって、
前記音声メッセージの音声振幅に基づいて前記音声データの分割箇所を選定する第1の分割箇所選定手順と、
前記第1の分割箇所選定手順で選定した分割箇所で前記音声データを分割する分割手順とを含むことを特徴とする。
音声メッセージを所与の分割箇所で分割した複数の音声データを作成する音声データ作成方法であって、
前記音声メッセージの音声振幅に基づいて前記音声データの分割箇所を選定する第1の分割箇所選定手順と、
前記第1の分割箇所選定手順で選定した分割箇所で前記音声データを分割する分割手順とを含むことを特徴とする。
本発明によれば、音声データを組み合わせて音声メッセージを再生する際に、音声データ間の境界が目立たず、より自然に聞こえる音声データを作成することができる。
(2)この音声データ作成方法であって、
前記第1の分割箇所選定手順において、
前記分割箇所として、前記音声メッセージの音声振幅が所定値よりも小さい箇所の少なくとも1つを選定してもよい。
前記第1の分割箇所選定手順において、
前記分割箇所として、前記音声メッセージの音声振幅が所定値よりも小さい箇所の少なくとも1つを選定してもよい。
(3)これらのいずれかの音声データ作成方法であって、
前記第1の分割箇所選定手順において、
前記分割箇所として、前記音声メッセージの音声振幅が所定値よりも小さくなる期間が所定時間以上続く箇所の少なくとも1つを選定してもよい。
前記第1の分割箇所選定手順において、
前記分割箇所として、前記音声メッセージの音声振幅が所定値よりも小さくなる期間が所定時間以上続く箇所の少なくとも1つを選定してもよい。
(4)これらのいずれかの音声データ作成方法であって、
前記音声メッセージに含まれる音声周波数に基づいて前記音声データの分割箇所を選定する第2の分割箇所選定手順を含み、
前記分割手順において、
前記第1の分割箇所選定手順及び前記第2の分割箇所選定手順で選定した分割箇所で前記音声データを分割してもよい。
前記音声メッセージに含まれる音声周波数に基づいて前記音声データの分割箇所を選定する第2の分割箇所選定手順を含み、
前記分割手順において、
前記第1の分割箇所選定手順及び前記第2の分割箇所選定手順で選定した分割箇所で前記音声データを分割してもよい。
(5)この音声データ作成方法であって、
前記第2の分割箇所選定手順において、
前記分割箇所として、前記音声メッセージに含まれる所定周波数以下の音声周波数成分の強度が所定値以下となる箇所の少なくとも1つを選定してもよい。
前記第2の分割箇所選定手順において、
前記分割箇所として、前記音声メッセージに含まれる所定周波数以下の音声周波数成分の強度が所定値以下となる箇所の少なくとも1つを選定してもよい。
(6)これらのいずれかの音声データ作成方法であって、
前記第2の分割箇所選定手順において、
前記分割箇所として、前記音声メッセージに含まれる所定周波数以下の音声周波数成分の強度が所定値以下となる期間が所定時間以上続く箇所の少なくとも1つを選定してもよい。
前記第2の分割箇所選定手順において、
前記分割箇所として、前記音声メッセージに含まれる所定周波数以下の音声周波数成分の強度が所定値以下となる期間が所定時間以上続く箇所の少なくとも1つを選定してもよい。
(7)これらのいずれかの音声データ作成方法であって、
前記所定周波数は、音声データのサンプリング周波数の1/2であってもよい。
前記所定周波数は、音声データのサンプリング周波数の1/2であってもよい。
(8)これらのいずれかの音声データ作成方法であって、
前記音声メッセージは、数字の読み上げメッセージを含んでもよい。
前記音声メッセージは、数字の読み上げメッセージを含んでもよい。
(9)これらのいずれかの音声データ作成方法であって、
複数の前記音声メッセージに共通に含まれる共通音節群の前後を分割箇所候補として選定する分割箇所候補選定手順を含み、
前記第1の分割箇所選定手順及び前記第2の分割箇所選定手順において、
前記分割箇所候補の中から前記分割箇所を選定してもよい。
複数の前記音声メッセージに共通に含まれる共通音節群の前後を分割箇所候補として選定する分割箇所候補選定手順を含み、
前記第1の分割箇所選定手順及び前記第2の分割箇所選定手順において、
前記分割箇所候補の中から前記分割箇所を選定してもよい。
共通音節群は、例えば日本語の音声メッセージの場合は、音声メッセージのうち、平仮名で表した場合に共通文字列となる部分である。
(10)本発明に係る記憶装置は、
音声メッセージを分割した複数の音声データが記憶された記憶部を含む記憶装置であって、
少なくとも1つの前記音声データは、その先頭部分が前記音声メッセージに含まれる単語の途中の音節であって、前記音節の先頭の音声振幅が所定値よりも小さいことを特徴とする。
音声メッセージを分割した複数の音声データが記憶された記憶部を含む記憶装置であって、
少なくとも1つの前記音声データは、その先頭部分が前記音声メッセージに含まれる単語の途中の音節であって、前記音節の先頭の音声振幅が所定値よりも小さいことを特徴とする。
(11)本発明に係る記憶装置は、
音声メッセージを分割した複数の音声データが記憶された記憶部を含む記憶装置であって、
少なくとも1つの前記音声データは、その末尾部分が前記音声メッセージに含まれる単語の途中の音節であって、前記音節の末尾の音声振幅が所定値よりも小さいことを特徴とする。
音声メッセージを分割した複数の音声データが記憶された記憶部を含む記憶装置であって、
少なくとも1つの前記音声データは、その末尾部分が前記音声メッセージに含まれる単語の途中の音節であって、前記音節の末尾の音声振幅が所定値よりも小さいことを特徴とする。
(12)本発明に係る集積回路装置は、
音声メッセージを分割した複数の音声データが記憶された記憶部と、
音声再生コマンドを受け取り、受け取った音声再生コマンドに基づき前記記憶部から音声データを読み出して再生出力する音声再生部とを含む集積回路装置であって、
少なくとも1つの前記音声データは、その先頭部分が前記音声メッセージに含まれる単語の途中の音節であって、前記音節の先頭の音声振幅が所定値よりも小さいことを特徴とする。
音声メッセージを分割した複数の音声データが記憶された記憶部と、
音声再生コマンドを受け取り、受け取った音声再生コマンドに基づき前記記憶部から音声データを読み出して再生出力する音声再生部とを含む集積回路装置であって、
少なくとも1つの前記音声データは、その先頭部分が前記音声メッセージに含まれる単語の途中の音節であって、前記音節の先頭の音声振幅が所定値よりも小さいことを特徴とする。
(13)本発明に係る集積回路装置は、
音声メッセージを分割した複数の音声データが記憶された記憶部と、
音声再生コマンドを受け取り、受け取った音声再生コマンドに基づき前記記憶部から音声データを読み出して再生出力する音声再生部とを含む集積回路装置であって、
少なくとも1つの前記音声データは、その末尾部分が前記音声メッセージに含まれる単語の途中の音節であって、前記音節の末尾の音声振幅が所定値よりも小さいことを特徴とする。
音声メッセージを分割した複数の音声データが記憶された記憶部と、
音声再生コマンドを受け取り、受け取った音声再生コマンドに基づき前記記憶部から音声データを読み出して再生出力する音声再生部とを含む集積回路装置であって、
少なくとも1つの前記音声データは、その末尾部分が前記音声メッセージに含まれる単語の途中の音節であって、前記音節の末尾の音声振幅が所定値よりも小さいことを特徴とする。
(14)本発明に係る音声再生システムは、
音声メッセージを分割した複数の音声データが記憶された記憶装置と、
音声再生コマンドを受け取り、受け取った音声再生コマンドに基づき前記記憶装置に記憶された音声データを再生出力する集積回路装置とを含む音声再生システムであって、
前記記憶装置は、これらのいずれかの記憶装置であることを特徴とする。
音声メッセージを分割した複数の音声データが記憶された記憶装置と、
音声再生コマンドを受け取り、受け取った音声再生コマンドに基づき前記記憶装置に記憶された音声データを再生出力する集積回路装置とを含む音声再生システムであって、
前記記憶装置は、これらのいずれかの記憶装置であることを特徴とする。
以下、本発明を適用した実施の形態について図面を参照して説明する。ただし、本発明は以下の実施の形態に限定されるものではない。また、本発明は、以下の内容を自由に組み合わせたものを含むものとする。
1.音声データ作成方法
本実施の形態に係る音声データ作成方法は、音声メッセージを所与の分割箇所で分割した複数の音声データを作成する音声データ作成方法であって、音声メッセージの音声振幅に基づいて音声データの分割箇所を選定する第1の分割箇所選定手順と、第1の分割箇所選定手順で選定した分割箇所で音声データを分割する分割手順とを含む。
本実施の形態に係る音声データ作成方法は、音声メッセージを所与の分割箇所で分割した複数の音声データを作成する音声データ作成方法であって、音声メッセージの音声振幅に基づいて音声データの分割箇所を選定する第1の分割箇所選定手順と、第1の分割箇所選定手順で選定した分割箇所で音声データを分割する分割手順とを含む。
音声メッセージとは、例えば音声で読み上げた文や文節であり、文は電子機器などの音声ガイドメッセージとして使用される文であってもよい。本実施の形態においては、音声メッセージに使用される文として「料金は、700円です。」という文を用いて説明する。
図1は、本実施の形態に係る音声データ作成方法の一例を示すフローチャートである。
本実施の形態に係る音声データ作成方法では、まず音声メッセージから音声データを作成する(ステップS100)。
音声メッセージから音声データを作成する手法は、既知の手法を用いることが可能であり、例えば音声メッセージを読み上げた肉声をサンプリングしたり、TTS(Text to Speech)システムにより合成したりしてもよい。
図2は、音声メッセージの時間と音声振幅との関係の一例を示すグラフである。横軸は時間、縦軸は音圧を表す。図2においては、音声メッセージとして「料金は、700円です。」という文を読み上げた例を表している。音圧は様々な周波数波形の重ね合わせであり、その正側の包絡線(図示せず)と負側の包絡線(図示せず)との差を音声振幅と考える。同じ周波数の音であれば、音声振幅が大きいほど音は大きく聞こえる。
ステップS100では、時刻t0から時刻t5まで(「りょうきんは、ななひゃくえんです」に対応)を1つの音声データD0として作成することも可能であり、また、時刻t1から時刻t2までの無音期間を除いて、時刻t0から時刻t1まで(「りょうきんは」に対応)の音声データD1と、時刻t2から時刻t5まで(「ななひゃくえんです」に対応)の音声データD2を作成することも可能である。本実施の形態においては、時刻t0から時刻t1までの音声データD1と、時刻t2から時刻t5までの音声データを作成するものとし、以下では時刻t2から時刻t5までの音声データD2を分割する場合について説明する。
本実施の形態に係る音声データ作成方法では、ステップS100の次に、音声メッセージの音声振幅に基づいて音声データの分割箇所を選定する(ステップS102;第1の分割箇所選定手順に対応)。ステップS102では、分割箇所として、音声メッセージの音声振幅が所定値よりも小さい箇所の少なくとも1つを選定することが可能である。また、ステップS102では、分割箇所として、音声メッセージの音声振幅が所定値よりも小さくなる期間が所定時間以上続く箇所の少なくとも1つを選定することが可能である。所定時間は、例えば数10m秒程度とすることができる。
図2に示す例においては、音声振幅が所定値よりも小さくなる期間が所定時間以上続く箇所のうち、分割箇所として、時刻t3と時刻t4を選定している。
本実施の形態に係る音声データ作成方法では、ステップS102の次に、ステップS102で選定した分割箇所で音声データを分割する(ステップS104;分割手順に対応)。
図2に示す例においては、ステップS102で分割箇所として選定した時刻t3と時刻t4で音声データを分割する。その結果、音声データD2は、時刻t2から時刻t3まで(「ななひゃ」に対応)の音声データD21、時刻t3から時刻t4まで(「くえん」に対応)の音声データD22、時刻t4から時刻t5まで(「です」に対応)の音声データD23に分割される。
本実施の形態における音声データ作成方法によれば、音声データの分割箇所として、音声メッセージの音声振幅が所定値よりも小さくなる時間が所定時間以上続く箇所の少なくとも1つを選定している。音声メッセージの音声振幅が小さくなる箇所は、音が小さくしか聞こえない又はほとんど聞こえない箇所と考えることができる。
したがって、音が小さくしか聞こえない又はほとんど聞こえない箇所で音声データを分割することにより、音声データを組み合わせて音声メッセージを再生する際に、音声データ間の境界が目立たず、より自然に聞こえる音声データを作成することができる。
上述の説明では音声メッセージ「料金は、700円です。」についての音声データを作成する例で説明したが、他の音声メッセージについても同様に音声データの作成が可能である。例えば、音声メッセージ「料金は、900円です。」について、「りょうきんは」に対応する音声データD3、「きゅうひゃ」に対応する音声データ41、「くえん」に対応する音声データD42、「です」に対応する音声データD43を作成することができる。
この例の場合、「りょうきんは」に対応する音声データD1と音声データD3、「くえん」に対応する音声データD22と音声データD42、「です」に対応する音声データD23と音声データD43は、それぞれ共通の音声データとすることができる。これにより、例えば音声データを組み合わせて音声メッセージを再生する音声再生システム等において、音声データの総量を削減することが可能である。
図3(A)及び図3(B)は、音声メッセージを生成する音声データの組合せ例を示すグラフである。横軸は時間、縦軸は音圧を表す。また、図3(A)は、音声メッセージ「料金は、700円です。」を生成する場合の組合せ、図3(B)は、音声メッセージ「料金は、900円です。」を生成する場合の組合せを表す。
音声メッセージ「料金は、700円です。」を生成する場合には、「りょうきんは」に対応する音声データD1、「ななひゃ」に対応する音声データD21、「くえん」に対応する音声データD22、「です」に対応する音声データD23の順に再生する。なお、音声データD1と音声データD21の間には、無音期間を挿入している。
音声メッセージ「料金は、900円です。」を生成する場合には、「りょうきんは」に対応する音声データD1、「きゅうひゃ」に対応する音声データD41、「くえん」に対応する音声データD22、「です」に対応する音声データD23の順に再生する。なお、音声データD1と音声データD41の間には、無音期間を挿入している。
このように、音声メッセージ「料金は、700円です。」と「料金は、900円です。」を生成する場合には、音声データD1、D21、D22、D23、D41を用意するのみで済むので、全ての音声データを用意する場合に比べて音声データの総量を削減することができる。音声データを分割して共用して音声データの総量を削減する手法は、例えば音声メッセージが数字の読み上げメッセージ(例えば金額、時間、時刻、日付、温度、湿度等を読み上げるメッセージ)を含む場合には、共用できる音声データが多くなり、特に有効である。
したがって、本実施の形態における音声データ作成方法によれば、音声データの総量を削減しつつ、良好な音声データの再生を可能にする音声データを作成することができる。
〔変形例1〕
上述の実施の形態の説明においては、音声メッセージの音声振幅に基づいて音声データの分割箇所を選定する場合の音声データ作成方法について説明したが、音声メッセージの音声振幅に加えて、さらに音声メッセージに含まれる音声周波数に基づいて音声データの分割箇所を選定することも可能である。
上述の実施の形態の説明においては、音声メッセージの音声振幅に基づいて音声データの分割箇所を選定する場合の音声データ作成方法について説明したが、音声メッセージの音声振幅に加えて、さらに音声メッセージに含まれる音声周波数に基づいて音声データの分割箇所を選定することも可能である。
すなわち、上述の音声データ作成方法に加えて、音声メッセージに含まれる音声周波数に基づいて音声データの分割箇所を選定する第2の分割箇所選定手順を含み、分割手順において、第1の分割箇所選定手順及び第2の分割箇所選定手順で選定した分割箇所で音声データを分割することが可能である。
図4は、本実施の形態に係る音声データ作成方法の他の一例を示すフローチャートである。なお、図1のフローチャートと同一の手順には同一の符号を付し、詳細な説明を省略する。
本実施の形態に係る音声データ作成方法では、まず音声メッセージから音声データを作成する(ステップS100)。次に、音声メッセージの音声振幅に基づいて音声データの分割箇所を選定する(ステップS102;第1の分割箇所選定手順に対応)。ステップS102では、分割箇所として、音声メッセージの音声振幅が所定値よりも小さい箇所の少なくとも1つを選定することが可能である。また、ステップS102では、分割箇所として、音声メッセージの音声振幅が所定値よりも小さくなる期間が所定時間以上続く箇所の少なくとも1つを選定することが可能である。所定時間は、例えば数10m秒程度とすることができる。
本実施の形態に係る音声データ作成方法では、ステップS102の次に、音声メッセージに含まれる音声周波数に基づいて音声データの分割箇所を選定する(ステップS200;第2の分割箇所選定手順に対応)。ステップS200では、分割箇所として、音声メッセージに含まれる所定周波数以下の音声周波数成分の強度が所定値以下となる箇所の少なくとも1つを選定することが可能である。また、ステップS200では、分割箇所として、音声メッセージに含まれる所定周波数以下の音声周波数成分の強度が所定値以下となる期間が所定時間以上続く箇所の少なくとも1つを選定することが可能である。所定時間は、例えば数10m秒程度とすることができる。
所定周波数は、例えば音声データのサンプリング周波数fの1/2とすることができる。音声メッセージに含まれる音声周波数成分のうち、音声データのサンプリング周波数fの1/2を超える音声周波数成分は、その音声データを用いては再現することができないため、音声データの再生時には聞こえないことになるからである。
したがって、音声メッセージに含まれる所定周波数以下の音声周波数成分の強度が所定値以下となる箇所を分割箇所として選定することにより、音が小さくしか聞こえない又はほとんど聞こえない箇所で音声データを分割することにより、音声データを組み合わせて音声メッセージを再生する際に、音声データ間の境界が目立たず、より自然に聞こえる音声データを作成することができる。
図5(A)は音声メッセージの時間と音声振幅との関係の一例を示すグラフである。横軸は時間、縦軸は音圧を表す。図5(B)は音声メッセージの時間と音声周波数との関係の一例を示すグラフである。横軸は時間、縦軸は周波数を表し、音声周波数成分の強度を黒色の濃さで表す。図5(A)及び図5(B)においては、音声メッセージとして「料金は、700円です。」という文を読み上げた場合の「りょうきんは」付近についてのグラフを表している。
図5(A)及び図5(B)に示す例においては、音声メッセージに含まれる所定周波数以下の音声周波数成分の強度が所定値以下となる期間が所定時間以上続く箇所のうち、分割箇所として、時刻t6を選定している。
図5(A)及び図5(B)に示す例においては、時刻t6において、図5(A)では音声振幅が所定値以下とはならないが、図5(B)では音声メッセージに含まれる所定周波数以下の音声周波数成分の強度が所定値以下となっている。したがって、ステップS102では分割箇所として選定できなかった時刻t6が、ステップS200では分割箇所として選定することが可能になる。
本実施の形態に係る音声データ作成方法では、ステップS200の次に、ステップS102及びステップS200で選定した分割箇所で音声データを分割する(ステップS202;分割手順に対応)。図5(A)及び図5(B)に示す例においては、時刻t6において音声データを分割し、「りょう」に対応する音声データD11と、「きんは」に対応する音声データD12を作成することができる。
このように、音声メッセージの音声振幅に加えて、さらに音声メッセージに含まれる音声周波数に基づいて音声データの分割箇所を選定することにより、音声データの分割箇所の選択肢が増える。したがって、複数の音声メッセージで共用できる音声データの作成が容易になる。
〔変形例2〕
図1に示すフローチャートを用いて説明した実施の形態や、図4に示すフローチャートを用いて説明した変形例1の音声データ作成方法において、さらに、複数の音声メッセージに共通に含まれる共通音節群の前後を分割箇所候補として選定する分割箇所候補選定手順を含み、第1の分割箇所選定手順及び第2の分割箇所選定手順において、分割箇所候補の中から分割箇所を選定することも可能である。
図1に示すフローチャートを用いて説明した実施の形態や、図4に示すフローチャートを用いて説明した変形例1の音声データ作成方法において、さらに、複数の音声メッセージに共通に含まれる共通音節群の前後を分割箇所候補として選定する分割箇所候補選定手順を含み、第1の分割箇所選定手順及び第2の分割箇所選定手順において、分割箇所候補の中から分割箇所を選定することも可能である。
図6は、本実施の形態に係る音声データ作成方法の他の一例を示すフローチャートである。図6に示す例は、図1に示すフローチャートを用いて説明した実施の形態に、分割箇所候補選定手順を加えた例である。なお、図1のフローチャートと同一の手順には同一の符号を付し、詳細な説明を省略する。
本実施の形態に係る音声データ作成方法では、まず音声メッセージから音声データを作成する(ステップS100)。
次に、複数の音声メッセージに共通に含まれる共通音節群の前後を分割箇所候補として選定する(ステップS300;分割箇所候補選定手順に対応)。共通音節群は、例えば日本語の音声メッセージの場合には、音声メッセージのうち、平仮名で表した場合に共通文字列となる部分である。
例えば音声メッセージとして「700円です。」と「900円です。」を用いる場合には、共通音節群としては「ひゃくえんです」、「ひゃくえんで」、「す」、「ひゃく」、「えんです」、「ひゃ」、「くえんです」、「ひゃ」、「くえん」、「です」、「えん」等、様々な組合せが考えられる。ステップS300では、これらの共通音節群の前後を分割箇所候補として選定する。
本実施の形態に係る音声データ作成方法では、ステップS300の次に、音声メッセージの音声振幅に基づいて音声データの分割箇所を分割箇所候補の中から選定する(ステップS302;第1の分割箇所選定手順に対応)。ステップS302では、分割箇所として、音声メッセージの音声振幅が所定値よりも小さい箇所の少なくとも1つを選定することが可能である。また、ステップS302では、分割箇所として、音声メッセージの音声振幅が所定値よりも小さくなる期間が所定時間以上続く箇所の少なくとも1つを選定することが可能である。所定時間は、例えば数10m秒程度とすることができる。所定周波数は、例えば音声データのサンプリング周波数fの1/2とすることができる。
本実施の形態に係る音声データ作成方法では、ステップS302の次に、ステップS302で選定した分割箇所で音声データを分割する(ステップS104;分割手順に対応)。
図7は、本実施の形態に係る音声データ作成方法の他の一例を示すフローチャートである。図7に示す例は、図4に示すフローチャートを用いて説明した実施の形態に、分割箇所候補選定手順を加えた例である。なお、図4及び図6のフローチャートと同一の手順には同一の符号を付し、詳細な説明を省略する。
本実施の形態に係る音声データ作成方法では、まず音声メッセージから音声データを作成する(ステップS100)。次に、複数の音声メッセージに共通に含まれる共通音節群の前後を分割箇所候補として選定する(ステップS300;分割箇所候補選定手順に対応)。次に、音声メッセージの音声振幅に基づいて音声データの分割箇所を分割箇所候補の中から選定する(ステップS302;第1の分割箇所選定手順に対応)。
本実施の形態に係る音声データ作成方法では、ステップS302の次に、音声メッセージに含まれる音声周波数に基づいて音声データの分割箇所を分割箇所候補の中から選定する(ステップS304;第2の分割箇所選定手順に対応)。ステップS304では、分割箇所として、音声メッセージに含まれる所定周波数以下の音声周波数成分の強度が所定値以下となる箇所の少なくとも1つを選定することが可能である。また、ステップS304では、分割箇所として、音声メッセージに含まれる所定周波数以下の音声周波数成分の強度が所定値以下となる期間が所定時間以上続く箇所の少なくとも1つを選定することが可能である。所定時間は、例えば数10m秒程度とすることができる。
本実施の形態に係る音声データ作成方法では、ステップS304の次に、ステップS302及びステップS304で選定した分割箇所で音声データを分割する(ステップS202;分割手順に対応)。
このように、あらかじめ分割箇所候補を選定しておくことにより、分割箇所の選定が容易になる。
2.記憶装置
図8は、本実施の形態に係る記憶装置の構成の一例を示す機能ブロック図である。
図8は、本実施の形態に係る記憶装置の構成の一例を示す機能ブロック図である。
本実施の形態に係る記憶装置1は、記憶部10を含む。記憶部10は、音声メッセージを分割した複数の音声データを記憶する。
本実施の形態に係る記憶装置1は、インターフェイス部12を含んでもよい。インターフェイス部12は、記憶装置1と他の装置(図示せず)との間で音声データ等を入出力する際のインターフェイスとして機能する。
本実施の形態に係る記憶装置1の記憶部10に記憶される音声データの少なくとも1つは、その先頭部分が音声メッセージに含まれる単語の途中であって、音節の先頭の音声振幅が所定値よりも小さい音声データとすることができる。
また、本実施の形態に係る記憶装置1の記憶部10に記憶される音声データの少なくとも1つは、その末尾部分が音声メッセージに含まれる単語の途中であって、音節の末尾の音声振幅が所定値よりも小さい音声データとすることができる。
図9は、音声データの一例を示す図である。本実施の形態に係る記憶装置1の記憶部10は、音声メッセージとして「料金は、700円です。」と「料金は、900円です。」の2種類を生成するための音声データを記憶しているものとして説明する。
図9に示す音声データから音声メッセージとして「料金は、700円です。」を生成する場合には、「りょうきんは」に対応する音声データD1、「ななひゃ」に対応する音声データD21、「くえん」に対応する音声データD22、「です」に対応する音声データD23を順に再生することにより音声メッセージを生成することができる。
また、図9に示す音声データから音声メッセージとして「料金は、900円です。」を生成する場合には、「りょうきんは」に対応する音声データD1、「きゅうひゃ」に対応する音声データD41、「くえん」に対応する音声データD22、「です」に対応する音声データD23を順に再生することにより音声メッセージを生成することができる。
図9に示す音声データにおいて、「くえん」に対応する音声データD22は、その先頭部分が音声メッセージに含まれる単語の途中であって、音節の先頭の音声振幅が所定値よりも小さい音声データである。
また、図9に示す音声データにおいて、「ななひゃ」に対応する音声データD21と「きゅうひゃ」に対応する音声データD41は、その末尾部分が音声メッセージに含まれる単語の途中であって、音節の末尾の音声振幅が所定値よりも小さい音声データである。
これらの音声データは、例えば先に「1.音声データの作成方法」で説明した方法で作成することができる。
このように、音が小さくしか聞こえない又はほとんど聞こえない箇所で分割した音声データを記憶することにより、音声データを組み合わせて音声メッセージを再生する際に、音声データ間の境界が目立たず、より自然に聞こえる音声データを記憶した記憶装置を実現することができる。
本実施の形態に係る記憶装置1の記憶部10に記憶される音声データの少なくとも1つは、その先頭部分が音声メッセージに含まれる単語の途中であって、音節の先頭に含まれる所定周波数以下の音声周波数成分の強度が所定値以下となる音声データとすることができる。
また、本実施の形態に係る記憶装置1の記憶部10に記憶される音声データの少なくとも1つは、その末尾部分が音声メッセージに含まれる単語の途中であって、音節の末尾に含まれる所定周波数以下の音声周波数成分の強度が所定値以下となる音声データとすることができる。
また、本実施の形態に係る記憶装置1の記憶部10に記憶される音声データの少なくとも1つは、その末尾部分が音声メッセージに含まれる単語の途中であって、音節の末尾に含まれる所定周波数以下の音声周波数成分の強度が所定値以下となる音声データとすることができる。
所定周波数は、例えば音声データのサンプリング周波数の1/2とすることができる。音声メッセージに含まれる音声周波数成分のうち、音声データのサンプリング周波数の1/2を超える音声周波数成分は、その音声データを用いては再現することができないため、音声データの再生時には聞こえないことになるからである。
例えば、記憶装置1の記憶部10には、図9に示す音声データのうち、「りょうきんは」に対応する音声データD1を、「りょう」に対応する音声データD11と、「きんは」に対応する音声データD12とに分割して記憶させてもよい。
この場合、「きんは」に対応する音声データD12は、その末尾部分が音声メッセージに含まれる単語の途中であって、音節の末尾に含まれる所定周波数以下の音声周波数成分の強度が所定値以下となる音声データである。
また、「りょう」に対応する音声データD11は、その末尾部分が音声メッセージに含まれる単語の途中であって、音節の末尾に含まれる所定周波数以下の音声周波数成分の強度が所定値以下となる音声データである。
このような音声データも、例えば先に「1.音声データの作成方法」で説明した方法で作成することができる。
このように、音が小さくしか聞こえない又はほとんど聞こえない箇所で分割した音声データを記憶することにより、音声データを組み合わせて音声メッセージを再生する際に、音声データ間の境界が目立たず、より自然に聞こえる音声データを記憶した記憶装置を実現することができる。
3.集積回路装置
図10は、本実施の形態に係る集積回路装置の構成の一例を示すハードウェアブロック図である。
図10は、本実施の形態に係る集積回路装置の構成の一例を示すハードウェアブロック図である。
集積回路装置2は、ホストCPU100とともに電子機器に実装され、ホストCPU100からの制御コマンドによって動作し、電子機器に搭載されるホストCPU100をホストとするコンパニオンチップとして動作する。集積回路装置2は、ホストCPU100から発効されるコマンドで制御される。コマンドとしては、集積回路装置2の起動やデータ転送、再生/停止などの音声処理などが用意されている。
ホストCPU100は、電子機器に実装され電子機器の主制御や全体制御を行う電子機器組み込みのマイクロコンピュータ等である。
集積回路装置2とホストCPU100の通信は、例えばSPI(クロック同期式3線(REQ、RES、IND)シリアル)転送、SPI/UART転送により行われるように構成することができる。
集積回路装置2は、記憶部20を含む。記憶部20は、音声メッセージを分割した複数の音声データを記憶する。音声データは、後述する音声再生部30で再生可能なPCMデータ(例えばADPCM/AAC−LC)等の音声データが圧縮した形式で記憶されている。
集積回路装置2は、音声再生部30を含む。音声再生部30は、音声再生コマンドを受け取り、受け取った音声再生コマンドに基づき、記憶部20から音声データを読み出して再生出力する。音声再生コマンドには、例えば、後述する内蔵データ再生コマンドや添付データ付き再生コマンドを含んでもよい。
音声再生部30は、例えば、コマンド処理部31、再生対象格納バッファ32、デコード部33、デコード済データ格納バッファ34、D/Aコンバータ35を含んで構成することが可能である。
コマンド処理部31は、ホストCPU100とのコマンドやデータのやり取りの制御を行うもので、例えばホストCPU100から受け取った各種コマンドの処理(集積回路装置2の起動やデータ転送、再生/停止などの音声処理等)や、ホストCPU100との通信のハンドシェイク処理等を行う。
コマンド処理部31は、ホストCPU100から受信したコマンドに基づき記憶部20に記憶された音声データを読み出して再生するかコマンドに添付されている音声データを再生するか判断し、判断結果に基づき再生対象となる音声データを再生対象格納バッファに格納する制御を行う。例えば、コマンド処理部31は、ホストCPU100から添付データ付き再生コマンドを受信した場合には、添付された音声データを再生対象格納バッファ32に格納する制御を行い、内蔵データ再生コマンドを受信した場合には、記憶部20から再生対象となる音声データを読み出して、読み出した音声データを再生対象格納バッファ32に格納する制御を行う。
またコマンド処理部31は、添付データに無音区間を設定して再生することを指示する添付データ付き再生コマンドを受信した場合には、添付データに対応した音声が再生出力される際に無音区間を設定する制御を行う無音区間設定制御部310を含んでもよい。無音区間設定制御部32は、無音区間を添付データに対応する音声の出力前に設定するようにしてもよい。
再生対象格納バッファ40は、再生対象となる音声データが格納されるバッファである。
デコード部33は、再生対象格納バッファ32に格納された音声データをデコードする。再生オーディオフォーマットは、例えばADPCM/AAC−LCがサポートされるようにしてもよい。デコード済データ格納バッファ34は、デコード部33でデコードされたデータが格納されるバッファである。D/Aコンバータ35は、デコード済データ格納バッファ34に格納されたデータをD/A変換してスピーカ120へ出力する。
デコード部33は、コマンド処理部31からデコード開始信号210を受け取ることによりデコードを開始し、デコード終了後にコマンド処理部31にデコード終了信号220を出力する構成としてもよい。
また、D/Aコンバータ35は、スピーカ120への出力信号250の出力終了後に出力終了信号230をコマンド処理部31に出力する構成としてもよい。また、D/Aコンバータ35は、無音区間設定制御部310から無音区間設定信号240を受け取り、無音区間設定信号240に基づいて設定される所定期間中は出力信号250を出力しない無音期間を設ける構成としてもよい。
図11は、本発明に係る集積回路装置2の処理の流れを示すフローチャートである。
集積回路装置2はホストCPU100からコマンドを受信すると以下の処理を行う。
まずコマンド処理部31は、受信したコマンドが内蔵データ再生コマンドか否か判断し(ステップS10)、内蔵データ再生コマンドである場合には、コマンドで指示されたアドレス情報に基づき記憶部20から音声データを読み出して、読み出した音声データを再生対象格納バッファ32に出力する(ステップS20)。
また受信したコマンドが内蔵データ再生コマンドでない場合には、添付データ付き再生コマンドであるか否か判断し(ステップS30)、添付データ付き再生コマンドである場合には、コマンドに添付された音声データを取り出して再生対象格納バッファ32に出力する(ステップS40)。
次にデコード部33は、再生対象格納バッファ32からデータを読み出して、読み出したデータをデコードしてデコード済データを生成し、デコード済データ格納バッファ34に格納する(ステップS50)。
次にD/Aコンバータ35は、デコード済みデータ格納バッファ34のデータをD/A変換してスピーカ120へ出力する(ステップS60)。
本実施の形態に係る集積回路装置2の記憶部20に記憶される音声データの少なくとも1つは、その先頭部分が音声メッセージに含まれる単語の途中であって、音節の先頭の音声振幅が所定値よりも小さい音声データとすることができる。
また、本実施の形態に係る集積回路装置2の記憶部20に記憶される音声データの少なくとも1つは、その末尾部分が音声メッセージに含まれる単語の途中であって、音節の末尾の音声振幅が所定値よりも小さい音声データとすることができる。
また、本実施の形態に係る集積回路装置2の記憶部20に記憶される音声データの少なくとも1つは、その末尾部分が音声メッセージに含まれる単語の途中であって、音節の末尾の音声振幅が所定値よりも小さい音声データとすることができる。
このような音声データは、例えば図9に示すような音声データである。これらの音声データは、例えば先に「1.音声データの作成方法」で説明した方法で作成することができる。
このように、音が小さくしか聞こえない又はほとんど聞こえない箇所で分割した音声データを記憶することにより、音声データを組み合わせて音声メッセージを再生する際に、音声データ間の境界が目立たず、より自然に聞こえる集積回路装置を実現することができる。
本実施の形態に係る集積回路装置2の記憶部20に記憶される音声データの少なくとも1つは、その先頭部分が音声メッセージに含まれる単語の途中であって、音節の先頭に含まれる所定周波数以下の音声周波数成分の強度が所定値以下となる音声データとすることができる。
また、本実施の形態に係る集積回路装置2の記憶部20に記憶される音声データの少なくとも1つは、その末尾部分が音声メッセージに含まれる単語の途中であって、音節の末尾に含まれる所定周波数以下の音声周波数成分の強度が所定値以下となる音声データとすることができる。
また、本実施の形態に係る集積回路装置2の記憶部20に記憶される音声データの少なくとも1つは、その末尾部分が音声メッセージに含まれる単語の途中であって、音節の末尾に含まれる所定周波数以下の音声周波数成分の強度が所定値以下となる音声データとすることができる。
所定周波数は、例えば音声データのサンプリング周波数の1/2とすることができる。音声メッセージに含まれる音声周波数成分のうち、音声データのサンプリング周波数の1/2を超える音声周波数成分は、その音声データを用いては再現することができないため、音声データの再生時には聞こえないことになるからである。
このような音声データも、例えば先に「1.音声データの作成方法」で説明した方法で作成することができる。
このように、音が小さくしか聞こえない又はほとんど聞こえない箇所で分割した音声データを記憶することにより、音声データを組み合わせて音声メッセージを再生する際に、音声データ間の境界が目立たず、より自然に聞こえる集積回路装置を実現することができる。
4.音声再生システム
図12は、本実施の形態に係る音声再生システムの構成の一例を示すハードウェアブロック図である。
図12は、本実施の形態に係る音声再生システムの構成の一例を示すハードウェアブロック図である。
本実施の形態に係る音声再生システムは、記憶装置1及び集積回路装置4を含む。記憶装置1は、音声メッセージを分割した複数の音声データが記憶されている。本実施の形態においては、図8及び9を用いて説明した記憶装置である。集積回路装置4は、音声再生コマンドを受け取り、受け取った音声再生コマンドに基づいて記憶装置1に記憶された音声データを再生出力する。
集積回路装置4は、ホストCPU100とともに電子機器に実装され、ホストCPU100からの制御コマンドによって動作し、電子機器に搭載されるホストCPU100をホストとするコンパニオンチップとして動作する。集積回路装置4は、ホストCPU100から発効されるコマンドで制御される。コマンドとしては、集積回路装置4の起動やデータ転送、再生/停止などの音声処理などが用意されている。
ホストCPU100は、電子機器に実装され電子機器の主制御や全体制御を行う電子機器組み込みのマイクロコンピュータ等である。また、ホストCPU100は、記憶装置1から音声データを読み出し、集積回路装置4へ転送する。
集積回路装置4とホストCPU100の通信は、例えばSPI(クロック同期式3線(REQ、RES、IND)シリアル)転送、SPI/UART転送により行われるように構成することができる。
集積回路装置4は、音声再生部30を含む。音声再生部30は、例えば、コマンド処理部31、再生対象格納バッファ32、デコード部33、デコード済データ格納バッファ34、D/Aコンバータ35を含んで構成することが可能である。
コマンド処理部31は、ホストCPU100とのコマンドやデータのやり取りの制御を行うもので、例えばホストCPU100から受け取った各種コマンドの処理(集積回路装置4の起動やデータ転送、再生/停止などの音声処理等)や、ホストCPU100との通信のハンドシェイク処理等を行う。
コマンド処理部31は、ホストCPU100から添付データ付き再生コマンドを受信した場合には、添付された音声データを再生対象格納バッファ32に格納する制御を行う。
またコマンド処理部31は、添付データに無音区間を設定して再生することを指示する添付データ付き再生コマンドを受信した場合には、添付データに対応した音声が再生出力される際に無音区間を設定する制御を行う無音区間設定制御部310を含んでもよい。無音区間設定制御部32は、無音区間を添付データに対応する音声の出力前に設定するようにしてもよい。
再生対象格納バッファ40は、再生対象となる音声データが格納されるバッファである。
デコード部33は、再生対象格納バッファ32に格納された音声データをデコードする。再生オーディオフォーマットは、例えばADPCM/AAC−LCがサポートされるようにしてもよい。デコード済データ格納バッファ34は、デコード部33でデコードされたデータが格納されるバッファである。D/Aコンバータ35は、デコード済データ格納バッファ34に格納されたデータをD/A変換してスピーカ120へ出力する。
デコード部33は、コマンド処理部31からデコード開始信号210を受け取ることによりデコードを開始し、デコード終了後にコマンド処理部31にデコード終了信号220を出力する構成としてもよい。
また、D/Aコンバータ35は、スピーカ120への出力信号250の出力終了後に出力終了信号230をコマンド処理部31に出力する構成としてもよい。また、D/Aコンバータ35は、無音区間設定制御部310から無音区間設定信号240を受け取り、無音区間設定信号240に基づいて設定される所定期間中は出力信号250を出力しない無音期間を設ける構成としてもよい。
本実施の形態に係る音声再生システム3の記憶装置1に記憶される音声データの少なくとも1つは、その先頭部分が音声メッセージに含まれる単語の途中であって、音節の先頭の音声振幅が所定値よりも小さい音声データとすることができる。
また、本実施の形態に係る音声再生システム3の記憶装置1に記憶される音声データの少なくとも1つは、その末尾部分が音声メッセージに含まれる単語の途中であって、音節の末尾の音声振幅が所定値よりも小さい音声データとすることができる。
また、本実施の形態に係る音声再生システム3の記憶装置1に記憶される音声データの少なくとも1つは、その末尾部分が音声メッセージに含まれる単語の途中であって、音節の末尾の音声振幅が所定値よりも小さい音声データとすることができる。
このような音声データは、例えば図9に示すような音声データである。これらの音声データは、例えば先に「1.音声データの作成方法」で説明した方法で作成することができる。
このように、音が小さくしか聞こえない又はほとんど聞こえない箇所で分割した音声データを記憶することにより、音声データを組み合わせて音声メッセージを再生する際に、音声データ間の境界が目立たず、より自然に聞こえる音声再生システムを実現することができる。
本実施の形態に係る音声再生システム3の記憶装置1に記憶される音声データの少なくとも1つは、その先頭部分が音声メッセージに含まれる単語の途中であって、音節の先頭に含まれる所定周波数以下の音声周波数成分の強度が所定値以下となる音声データとすることができる。
また、本実施の形態に係る音声再生システム3の記憶装置1に記憶される音声データの少なくとも1つは、その末尾部分が音声メッセージに含まれる単語の途中であって、音節の末尾に含まれる所定周波数以下の音声周波数成分の強度が所定値以下となる音声データとすることができる。
また、本実施の形態に係る音声再生システム3の記憶装置1に記憶される音声データの少なくとも1つは、その末尾部分が音声メッセージに含まれる単語の途中であって、音節の末尾に含まれる所定周波数以下の音声周波数成分の強度が所定値以下となる音声データとすることができる。
所定周波数は、例えば音声データのサンプリング周波数の1/2とすることができる。音声メッセージに含まれる音声周波数成分のうち、音声データのサンプリング周波数の1/2を超える音声周波数成分は、その音声データを用いては再現することができないため、音声データの再生時には聞こえないことになるからである。
このような音声データも、例えば先に「1.音声データの作成方法」で説明した方法で作成することができる。
このように、音が小さくしか聞こえない又はほとんど聞こえない箇所で分割した音声データを記憶することにより、音声データを組み合わせて音声メッセージを再生する際に、音声データ間の境界が目立たず、より自然に聞こえる音声再生システムを実現することができる。
なお、本発明は本実施の形態に限定されず、本発明の要旨の範囲内で種々の変形実施が可能である。
本発明は、実施の形態で説明した構成と実質的に同一の構成(例えば、機能、方法及び結果が同一の構成、あるいは目的及び効果が同一の構成)を含む。また、本発明は、実施の形態で説明した構成の本質的でない部分を置き換えた構成を含む。また、本発明は、実施の形態で説明した構成と同一の作用効果を奏する構成又は同一の目的を達成することができる構成を含む。また、本発明は、実施の形態で説明した構成に公知技術を付加した構成を含む。
1 記憶装置、2 集積回路装置、3 音声再生システム、4 集積回路装置、10 記憶部、12 インターフェイス部、20 記憶部、30 音声再生部、31 コマンド処理部、32再生対象格納バッファ、33 デコード部、34 デコード済データ格納バッファ、35 D/Aコンバータ、100 ホストCPU、120 スピーカ、210 デコード開始信号、220 デコード終了信号、230 出力終了信号、240 無音区間設定信号、250 出力信号、310 無音区間設定制御部
Claims (14)
- 音声メッセージを所与の分割箇所で分割した複数の音声データを作成する音声データ作成方法であって、
前記音声メッセージの音声振幅に基づいて前記音声データの分割箇所を選定する第1の分割箇所選定手順と、
前記第1の分割箇所選定手順で選定した分割箇所で前記音声データを分割する分割手順とを含むことを特徴とする音声データ作成方法。 - 請求項1に記載の音声データ作成方法であって、
前記第1の分割箇所選定手順において、
前記分割箇所として、前記音声メッセージの音声振幅が所定値よりも小さい箇所の少なくとも1つを選定することを特徴とする音声データ作成方法。 - 請求項1及び2のいずれかに記載の音声データ作成方法であって、
前記第1の分割箇所選定手順において、
前記分割箇所として、前記音声メッセージの音声振幅が所定値よりも小さくなる期間が所定時間以上続く箇所の少なくとも1つを選定することを特徴とする音声データ作成方法。 - 請求項1乃至3のいずれかに記載の音声データ作成方法であって、
前記音声メッセージに含まれる音声周波数に基づいて前記音声データの分割箇所を選定する第2の分割箇所選定手順を含み、
前記分割手順において、
前記第1の分割箇所選定手順及び前記第2の分割箇所選定手順で選定した分割箇所で前記音声データを分割することを特徴とする音声データ作成方法。 - 請求項4に記載の音声データ作成方法であって、
前記第2の分割箇所選定手順において、
前記分割箇所として、前記音声メッセージに含まれる所定周波数以下の音声周波数成分の強度が所定値以下となる箇所の少なくとも1つを選定することを特徴とする音声データ作成方法。 - 請求項4及び5のいずれかに記載の音声データ作成方法であって、
前記第2の分割箇所選定手順において、
前記分割箇所として、前記音声メッセージに含まれる所定周波数以下の音声周波数成分の強度が所定値以下となる期間が所定時間以上続く箇所の少なくとも1つを選定することを特徴とする音声データ作成方法。 - 請求項5及び6のいずれかに記載の音声データ作成方法であって、
前記所定周波数は、音声データのサンプリング周波数の1/2であることを特徴とする音声データ作成方法。 - 請求項1乃至7のいずれかに記載の音声データ作成方法であって、
前記音声メッセージは、数字の読み上げメッセージを含むことを特徴とする音声データ作成方法。 - 請求項1乃至8のいずれかに記載の音声データ作成方法であって、
複数の前記音声メッセージに共通に含まれる共通音節群の前後を分割箇所候補として選定する分割箇所候補選定手順を含み、
前記第1の分割箇所選定手順及び前記第2の分割箇所選定手順において、
前記分割箇所候補の中から前記分割箇所を選定することを特徴とする音声データ作成方法。 - 音声メッセージを分割した複数の音声データが記憶された記憶部を含む記憶装置であって、
少なくとも1つの前記音声データは、その先頭部分が前記音声メッセージに含まれる単語の途中の音節であって、前記音節の先頭の音声振幅が所定値よりも小さいことを特徴とする記憶装置。 - 音声メッセージを分割した複数の音声データが記憶された記憶部を含む記憶装置であって、
少なくとも1つの前記音声データは、その末尾部分が前記音声メッセージに含まれる単語の途中の音節であって、前記音節の末尾の音声振幅が所定値よりも小さいことを特徴とする記憶装置。 - 音声メッセージを分割した複数の音声データが記憶された記憶部と、
音声再生コマンドを受け取り、受け取った音声再生コマンドに基づき前記記憶部から音声データを読み出して再生出力する音声再生部とを含む集積回路装置であって、
少なくとも1つの前記音声データは、その先頭部分が前記音声メッセージに含まれる単語の途中の音節であって、前記音節の先頭の音声振幅が所定値よりも小さいことを特徴とする集積回路装置。 - 音声メッセージを分割した複数の音声データが記憶された記憶部と、
音声再生コマンドを受け取り、受け取った音声再生コマンドに基づき前記記憶部から音声データを読み出して再生出力する音声再生部とを含む集積回路装置であって、
少なくとも1つの前記音声データは、その末尾部分が前記音声メッセージに含まれる単語の途中の音節であって、前記音節の末尾の音声振幅が所定値よりも小さいことを特徴とする集積回路装置。 - 音声メッセージを分割した複数の音声データが記憶された記憶装置と、
音声再生コマンドを受け取り、受け取った音声再生コマンドに基づき前記記憶装置に記憶された音声データを再生出力する集積回路装置とを含む音声再生システムであって、
前記記憶装置は、請求項10及び11のいずれかに記載の記憶装置であることを特徴とする音声再生システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008211631A JP2010048931A (ja) | 2008-08-20 | 2008-08-20 | 音声データ作成方法、記憶装置、集積回路装置及び音声再生システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008211631A JP2010048931A (ja) | 2008-08-20 | 2008-08-20 | 音声データ作成方法、記憶装置、集積回路装置及び音声再生システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010048931A true JP2010048931A (ja) | 2010-03-04 |
Family
ID=42066083
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008211631A Withdrawn JP2010048931A (ja) | 2008-08-20 | 2008-08-20 | 音声データ作成方法、記憶装置、集積回路装置及び音声再生システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010048931A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023032553A1 (ja) * | 2021-09-02 | 2023-03-09 | パナソニックホールディングス株式会社 | 構音異常検出方法、構音異常検出装置、及びプログラム |
-
2008
- 2008-08-20 JP JP2008211631A patent/JP2010048931A/ja not_active Withdrawn
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023032553A1 (ja) * | 2021-09-02 | 2023-03-09 | パナソニックホールディングス株式会社 | 構音異常検出方法、構音異常検出装置、及びプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2316786T3 (es) | Metodo, aparato y programa de ordenador para sintesis de voz. | |
JP5293460B2 (ja) | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 | |
JP5471858B2 (ja) | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 | |
JP4516863B2 (ja) | 音声合成装置、音声合成方法及びプログラム | |
EP1071074A2 (en) | Speech synthesis employing prosody templates | |
US20180130462A1 (en) | Voice interaction method and voice interaction device | |
KR102072627B1 (ko) | 음성 합성 장치 및 상기 음성 합성 장치에서의 음성 합성 방법 | |
JP2010048931A (ja) | 音声データ作成方法、記憶装置、集積回路装置及び音声再生システム | |
JP2010048930A (ja) | 音声データ作成方法、記憶装置、集積回路装置及び音声再生システム | |
JP2013164609A (ja) | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 | |
JP6170384B2 (ja) | 音声データベース生成システム、音声データベース生成方法、及びプログラム | |
JP2006337476A (ja) | 音声合成方法および装置 | |
JP5164041B2 (ja) | 音声合成装置、音声合成方法、及びプログラム | |
EP0194004A2 (en) | Voice synthesis module | |
JP4525162B2 (ja) | 音声合成装置及びそのプログラム | |
JP5387410B2 (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
JP4872690B2 (ja) | 音声合成方法、音声合成プログラム、音声合成装置 | |
JP5089473B2 (ja) | 音声合成装置及び音声合成方法 | |
JP2010128137A (ja) | 音声出力方法及び音声出力装置 | |
JP2007108450A (ja) | 音声再生装置、音声配信装置、音声配信システム、音声再生方法、音声配信方法及びプログラム | |
JP4574333B2 (ja) | 音声合成装置、音声合成方法及びプログラム | |
JP2008257120A (ja) | 音声再生装置及び音声再生システム | |
JP3406230B2 (ja) | 音声出力装置及び音声変換方法 | |
JPS6199198A (ja) | 音声分析合成装置 | |
CN113314092A (zh) | 一种模型训练和语音交互的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20111101 |