JP5152588B2 - 声質変化判定装置、声質変化判定方法、声質変化判定プログラム - Google Patents
声質変化判定装置、声質変化判定方法、声質変化判定プログラム Download PDFInfo
- Publication number
- JP5152588B2 JP5152588B2 JP2008290314A JP2008290314A JP5152588B2 JP 5152588 B2 JP5152588 B2 JP 5152588B2 JP 2008290314 A JP2008290314 A JP 2008290314A JP 2008290314 A JP2008290314 A JP 2008290314A JP 5152588 B2 JP5152588 B2 JP 5152588B2
- Authority
- JP
- Japan
- Prior art keywords
- text
- input
- voice quality
- voice
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
[声質変化判定装置の構成]
図1は、第1の実施形態にかかる声質変化判定装置の構成を示す機能ブロック図である。図1に示す声質変化判定装置1は、発声者の音声を入力して、発声者の声質を判定し、声質の変化が許容範囲内でない場合に警告を出力する装置である。そのため、声質変化判定装置1は、音声入力部2、テキスト入力部3、特徴量算出部4、声質判定部5、基準登録部6および基準データ記録部7を備える。
音声入力部2は、発声者の音声を外部から入力し、入力音声として、声質変化判定装置1で処理可能な状態にする。音声入力部2は、例えば、収録マイクなどを介して、発声者の音声を声質変化判定装置1に取り込み、特徴量算出部4に渡す。あるいは、音声入力部2は、外部または内蔵の記録媒体に予め記録された発声者の音声データを読み込むか、またはネットワークを介して音声データを受信することで発声者の音声を入力してもよい。
テキスト入力部3は、発声者の音声の内容を示すテキストを外部から入力し、入力テキストとして声質変化判定装置1で処理可能な状態にする。テキスト入力部3は、例えば、基準文章または読み上げ原稿の内容を入力テキストとして入力する。入力テキストの形式は、漢字の読みやアクセント位置情報を表す表音テキストが好ましいが、例えば、かな漢字混じりテキストのような通常表記のテキストでも良い。
特徴量算出部4は、入力音声と入力テキストから特徴量を算出し、対応する入力テキストとともに、声質判定部5あるいは基準データ記録部7へ出力する。本実施形態における特徴量は、音声の音響的、音韻的な特徴を数値化した量である。特徴量は、例えば、音量、話速、声の高さ、抑揚、音色または音韻のうち少なくとも1つを計算することにより得ることができる。以下に、特徴量の具体例を示すが、特徴量はこれらに限定されない。
図1に示す例では、特徴量算出部4からの特徴量およびテキストの出力先を、声質判定部5にするか、基準データ記録部7にするかを切り替える切り替え手段8、9が設けられる。切り替え手段8、9は、例えば、発声者が、声質判定の基準となる音声の特徴量およびテキストを登録する場合に、特徴量算出部4をBとDに接続することができる。これにより、特徴量算出部4からの特徴量およびテキストは、基準データ記録部7に出力される。それ以外の場合は、切り替え手段8、9は、特徴量算出部4をA、Cに接続するようにしてもよい。これにより、入力音声の特徴量およびテキストが声質判定部5に出力され、声質変化の判定が実行される。
基準データ記録部7は、声質変化の判定において基準声質となる音声の基準特徴量と、基準テキストとを対応付けて記録する。基準特徴量と基準テキストのデータ形式は特に限定されないが、例えば、テーブル形式で記録されてもよい。基準テキストは、例えば、文節単位のように、特徴量を算出し、声質変化の判定を行うのに適した単位で記録されることが好ましい。
声質判定部5は、特徴量算出部4から出力された入力音声の特徴量および対応するテキストと、基準データ記録部7から読み出した基準特徴量および基準テキストを比較することにより、声質変化の判定を実行する。声質判定部5は、例えば、入力テキストのうちで基準データ記録部7に記録された基準テキストと一致する部分を検索し、当該一致する部分について、特徴量と基準特徴量を比較することができる。声質判定部5は、この比較によって声質変化の程度を示す値(声質変化量)を計算することができる。一例として、特徴量と基準特徴量の差または比から声質変化量を算出することができる。特徴量に、上記の音量、話速、声の高さ、抑揚、音色、音韻等の複数の項目が含まれる場合は、各項目について声質変化量を算出すればよい。
基準登録部6は、声質判定部5が、音声変化量が許容範囲内であると判定した入力音声の特徴量とテキストを、基準特徴量および基準テキストとして、基準データ記録部7に記録する。その際、音声変化量が許容範囲内であると判定された入力音声のうち一部の特徴量およびテキストを抽出して記録してもよい。
次に、声質変化判定装置1の動作例について説明する。図2は、声質判定部5および基準登録部6の動作例を示すフローチャートである。図2に示す処理は、声質判定部5が、テキストと基準テキストが一致した部分の特徴量と基準特徴量から、音声の声質変化を判定する処理の一例である。
図5は、上記実施形態における声質変化判定装置1の構成の変形例を示す図である。図5に示す声質変化判定装置1は、発声者が読み上げるためのテキストを事前に入力して画面に表示し、表示されたテキストを見た発声者がそのテキストを読み上げる音声を、入力音声として受け付けるように構成したものである。
第2の実施形態は、上記第1の実施形態におけるテキスト入力部3の変形例である。図6は、本実施形態におけるテキスト入力部3aの構成を示す機能ブロック図である。図6に示すテキスト入力部3aは、言語処理部11と、変換部12を含む。言語処理部11および変換部12は言語辞書13にアクセス可能となっている。言語辞書13は、言語処理部11および変換部12の処理で必要なデータが記録される。言語辞書13には、例えば、入力テキストに含まれ得る複数の単語の表記、読み、品詞、アクセント情報等が記録されている。
第3の実施形態は、上記第1または第2の実施形態における基準登録部6の変形例である。本実施形態における基準登録部6bは、入力テキストと基準テキストが一致する部分に対応する入力音声の特徴量を基準データ記録部7に追加する場合に、(1)前記一致する部分に対応する既存の基準特徴量を入力音声の特徴量に置換するか。あるいは、(2)基準登録部6bは、前記既存の基準特徴量と前記入力音声の特徴量を用いて算出される特徴量を基準特徴量として基準データ記録部7に追加する処理を実行する。
第4の実施形態は、上記第1〜3いずれかの実施形態の声質変化判定装置を含む音声収録装置に関するものである。図10は、本実施形態における音声収録装置10の構成を示す機能ブロック図である。図10に示す音声収録装置10は、入力音声を収録データとして記録する機能をさらに有する。音声収録装置10は、図1に示す声質変化判定装置1に、収録部14を追加した構成である。図10において、図1と同じ機能ブロックには同じ番号を付す。
基準となる声質を表す基準特徴量と、基準特徴量に対応する基準テキストとを記録する基準データ記録部にアクセス可能な声質変化判定装置であって、
発声者の音声を入力音声として入力する音声入力部と、
前記入力音声に対応するテキストを、入力テキストとして入力するテキスト入力部と、
前記入力音声の特徴量を算出する特徴量算出部と、
前記入力テキストと前記基準テキストとが互いに一致する部分に対応する入力音声の特徴量を基準特徴量と比較することにより、前記入力音声の声質変化が所定の許容範囲内であるか否かを判定する声質判定部と、
該声質判定部が、声質変化は許容範囲内であると判定した入力音声に対応する入力テキストを、対応する特徴量とともに、新たな基準テキストおよび基準特徴量として前記基準データ記録部に記録する基準登録部とを備える、声質変化判定装置。
前記声質変化判定装置は、さらに、音声入力すべきテキストが予め登録されているテキスト記録部にアクセス可能であり、
前記テキスト入力部は、前記テキスト記録部にアクセスして、入力テキストを読み込み、当該入力テキストを発声者に対して出力し、
前記音声入力部は、前記出力された前記入力テキストを読み上げる発声者の音声を入力する、付記1に記載の声質変化判定装置。
前記入力テキストを言語解析し、言語解析の結果に基づき前記入力テキストを解析単位に分割する言語処理部をさらに備え、
前記特徴量算出部は、前記言語処理部により分割された解析単位ごとに対応する特徴量を算出し、
前記声質判定部は、前記入力テキストと前記基準テキストとが互いに一致する解析単位に対応する入力音声の特徴量と基準特徴量を比較することにより、前記入力音声の声質変化が所定の許容範囲内であるか否かを判定する、付記1または2に記載の声質変化判定装置。
基準データ記録部は、前記基準テキストを表音テキストとして記録し、
前記入力テキストを表音テキストに変換する変換部をさらに備え、
前記声質判定部は、表音テキストに変換された前記入力テキストと前記基準テキストが互いに一致する部分に対応する入力音声の特徴量と基準特徴量を比較することにより、前記入力音声の声質変化を判定する、付記1〜3のいずれか1項に記載の声質変化判定装置。
前記基準登録部は、テキストと基準テキストが一致する部分に対応する入力音声の特徴量を前記基準データ記録部に追加する場合に、前記部分に対応する既存の基準特徴量を、前記入力音声の特徴量に置換するか、または、前記既存の基準特徴量と前記入力音声の特徴量を用いて算出される特徴量を、新たな基準特徴量として追加する、付記1〜4のいずれか1項に記載の声質変化判定装置。
前記基準登録部は、前記声質判定部が声質変化は許容範囲内と判定した前記入力音声について、前記入力テキストと前記基準テキストとが互いに一致する解析単位および当該解析単位に隣接する解析単位に対応する入力テキストおよび特徴量を、新たな基準テキストおよび基準特徴量として、前記基準データ記録部に記録する、付記3に記載の声質変化判定装置。
付記1〜6のいずれか1項に記載の声質変化判定装置を含む音声収録装置であって、
前記入力音声のうち、前記声質変化判定装置の前記声質判定部によって、声質の変化が許容範囲内であると判定された入力音声を、収録データとして記録する収録部を備える、音声収録装置。
基準となる声質を示す基準特徴量と、前記基準特徴量に対応する基準テキストとを記録する基準データ記録部にアクセス可能なコンピュータに、声質変化判定処理を実行させる声質変化判定プログラムであって、
発声者の音声を入力音声として入力する音声入力処理と、
前記入力音声に対応するテキストを、入力テキストとして入力するテキスト入力処理と、
前記入力音声の特徴量を算出する特徴量算出処理と、
前記入力テキストと前記基準テキストとが互いに一致する部分に対応する入力音声の特徴量と基準特徴量を比較することにより、前記入力音声の声質変化が所定の許容範囲内であるか否かを判定する声質判定処理と、
前記声質判定処理で、声質変化は許容範囲内であると判定された入力音声に対応するテキストを、対応する特徴量とともに、新たな基準テキストおよび基準特徴量として前記基準データ記録部に記録する基準登録処理とをコンピュータに実行させる、声質変化判定プログラム。
コンピュータが、声質変化判定を実行する声質変化判定方法であって、
前記コンピュータは、基準となる声質を示す基準特徴量と、前記基準特徴量に対応する基準テキストとを記録する基準データ記録部にアクセス可能であり、
前記コンピュータが、発声者の音声を入力音声として受け付ける音声入力工程と、
前記コンピュータが、前記入力音声に対応するテキストを、入力テキストとして取得するテキスト入力工程と、
前記コンピュータが、前記入力音声の特徴量を算出する特徴量算出工程と、
前記コンピュータが、前記入力テキストと前記基準テキストとが互いに一致する部分に対応する入力音声の特徴量と基準特徴量を比較することにより、前記入力音声の声質変化を判定する声質判定工程と、
前記コンピュータが、前記声質判定工程で声質変化は許容範囲内であると判定された入力音声に対応するテキストの全体または一部を、対応する特徴量とともに、新たな基準テキストおよび基準特徴量として前記基準データ記録部に記録する基準登録工程とを含む声質変化判定方法。
2 音声入力部
3 テキスト入力部
4 特徴量算出部
5 声質判定部
6 基準登録部
7 基準データ記録部
10 音声収録装置
11 言語処理部
12 変換部
13 言語辞書
14 収録部
15 収録データ記録部
Claims (7)
- 基準となる声質を表す基準特徴量と、基準特徴量に対応する基準テキストとを記録する基準データ記録部にアクセス可能な声質変化判定装置であって、
発声者の音声を入力音声として入力する音声入力部と、
前記入力音声に対応するテキストを、入力テキストとして入力するテキスト入力部と、
前記入力音声の特徴量を算出する特徴量算出部と、
前記入力テキストのうちで前記基準データ記録部に記録された前記基準テキストと互いに一致する部分を検索し、当該一致する部分について、前記入力音声の特徴量を基準特徴量と比較することにより、前記入力音声の声質変化が所定の許容範囲内であるか否かを判定する声質判定部と、
該声質判定部が、声質変化は許容範囲内であると判定した入力音声に対応する入力テキストを、対応する特徴量とともに、新たな基準テキストおよび基準特徴量として前記基準データ記録部に記録する基準登録部とを備える、声質変化判定装置。 - 前記声質変化判定装置は、さらに、音声入力すべきテキストが予め登録されているテキスト記録部にアクセス可能であり、
前記テキスト入力部は、前記テキスト記録部にアクセスして、入力テキストを読み込み、当該入力テキストを発声者に対して出力し、
前記音声入力部は、前記出力された前記入力テキストを読み上げる発声者の音声を入力する、請求項1に記載の声質変化判定装置。 - 前記入力テキストを言語解析し、言語解析の結果に基づき前記入力テキストを解析単位に分割する言語処理部をさらに備え、
前記特徴量算出部は、前記言語処理部により分割された解析単位ごとに対応する特徴量を算出し、
前記声質判定部は、前記入力テキストと前記基準テキストとが互いに一致する解析単位に対応する入力音声の特徴量と基準特徴量を比較することにより、前記入力音声の声質変化が所定の許容範囲内であるか否かを判定する、請求項1または2に記載の声質変化判定装置。 - 基準データ記録部は、前記基準テキストを表音テキストとして記録し、
前記入力テキストを表音テキストに変換する変換部をさらに備え、
前記声質判定部は、表音テキストに変換された前記入力テキストと前記基準テキストが互いに一致する部分に対応する入力音声の特徴量と基準特徴量を比較することにより、前記入力音声の声質変化を判定する、請求項1〜3のいずれか1項に記載の声質変化判定装置。 - 前記基準登録部は、テキストと基準テキストが一致する部分に対応する入力音声の特徴量を前記基準データ記録部に追加する場合に、前記部分に対応する既存の基準特徴量を、前記入力音声の特徴量に置換するか、または、前記既存の基準特徴量と前記入力音声の特徴量を用いて算出される特徴量を、新たな基準特徴量として追加する、請求項1〜4のいずれか1項に記載の声質変化判定装置。
- 基準となる声質を示す基準特徴量と、前記基準特徴量に対応する基準テキストとを記録する基準データ記録部にアクセス可能なコンピュータに、声質変化判定処理を実行させる声質変化判定プログラムであって、
発声者の音声を入力音声として入力する音声入力処理と、
前記入力音声に対応するテキストを、入力テキストとして入力するテキスト入力処理と、
前記入力音声の特徴量を算出する特徴量算出処理と、
前記入力テキストのうちで前記基準データ記録部に記録された前記基準テキストと互いに一致する部分を検索し、当該一致する部分について、前記入力音声の特徴量と基準特徴量を比較することにより、前記入力音声の声質変化が所定の許容範囲内であるか否かを判定する声質判定処理と、
前記声質判定処理で、声質変化は許容範囲内であると判定された入力音声に対応するテキストを、対応する特徴量とともに、新たな基準テキストおよび基準特徴量として前記基準データ記録部に記録する基準登録処理とをコンピュータに実行させる、声質変化判定プログラム。 - コンピュータが、声質変化判定を実行する声質変化判定方法であって、
前記コンピュータは、基準となる声質を示す基準特徴量と、前記基準特徴量に対応する基準テキストとを記録する基準データ記録部にアクセス可能であり、
前記コンピュータが、発声者の音声を入力音声として受け付ける音声入力工程と、
前記コンピュータが、前記入力音声に対応するテキストを、入力テキストとして取得するテキスト入力工程と、
前記コンピュータが、前記入力音声の特徴量を算出する特徴量算出工程と、
前記コンピュータが、前記入力テキストのうちで前記基準データ記録部に記録された前記基準テキストと互いに一致する部分を検索し、当該一致する部分について、前記入力音声の特徴量と基準特徴量を比較することにより、前記入力音声の声質変化を判定する声質判定工程と、
前記コンピュータが、前記声質判定工程で声質変化は許容範囲内であると判定された入力音声に対応するテキストの全体または一部を、対応する特徴量とともに、新たな基準テキストおよび基準特徴量として前記基準データ記録部に記録する基準登録工程とを含む声質変化判定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008290314A JP5152588B2 (ja) | 2008-11-12 | 2008-11-12 | 声質変化判定装置、声質変化判定方法、声質変化判定プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008290314A JP5152588B2 (ja) | 2008-11-12 | 2008-11-12 | 声質変化判定装置、声質変化判定方法、声質変化判定プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010117528A JP2010117528A (ja) | 2010-05-27 |
JP5152588B2 true JP5152588B2 (ja) | 2013-02-27 |
Family
ID=42305236
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008290314A Expired - Fee Related JP5152588B2 (ja) | 2008-11-12 | 2008-11-12 | 声質変化判定装置、声質変化判定方法、声質変化判定プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5152588B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11074926B1 (en) | 2020-01-07 | 2021-07-27 | International Business Machines Corporation | Trending and context fatigue compensation in a voice signal |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5697395B2 (ja) * | 2010-10-05 | 2015-04-08 | ヤマハ株式会社 | 歌唱音声評価装置およびプログラム |
JP6048726B2 (ja) | 2012-08-16 | 2016-12-21 | トヨタ自動車株式会社 | リチウム二次電池およびその製造方法 |
CN105340003B (zh) | 2013-06-20 | 2019-04-05 | 株式会社东芝 | 语音合成字典创建装置以及语音合成字典创建方法 |
JP6909733B2 (ja) * | 2018-01-26 | 2021-07-28 | 株式会社日立製作所 | 音声分析装置および音声分析方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6223097A (ja) * | 1985-07-23 | 1987-01-31 | 株式会社トミー | 音声認識装置 |
JP4631464B2 (ja) * | 2005-02-23 | 2011-02-16 | パナソニック株式会社 | 体調判定装置およびそのプログラム |
-
2008
- 2008-11-12 JP JP2008290314A patent/JP5152588B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11074926B1 (en) | 2020-01-07 | 2021-07-27 | International Business Machines Corporation | Trending and context fatigue compensation in a voice signal |
Also Published As
Publication number | Publication date |
---|---|
JP2010117528A (ja) | 2010-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7013276B2 (en) | Method of assessing degree of acoustic confusability, and system therefor | |
US8204747B2 (en) | Emotion recognition apparatus | |
US8015011B2 (en) | Generating objectively evaluated sufficiently natural synthetic speech from text by using selective paraphrases | |
US6910012B2 (en) | Method and system for speech recognition using phonetically similar word alternatives | |
JP2008134475A (ja) | 入力された音声のアクセントを認識する技術 | |
JP4914295B2 (ja) | 力み音声検出装置 | |
JP4129989B2 (ja) | テキスト音声合成を支援するシステム | |
EP1668628A1 (en) | Method for synthesizing speech | |
US20090138266A1 (en) | Apparatus, method, and computer program product for recognizing speech | |
JP4586615B2 (ja) | 音声合成装置,音声合成方法およびコンピュータプログラム | |
CN110675866B (zh) | 用于改进至少一个语义单元集合的方法、设备及计算机可读记录介质 | |
JPWO2004066271A1 (ja) | 音声合成装置,音声合成方法および音声合成システム | |
JP5152588B2 (ja) | 声質変化判定装置、声質変化判定方法、声質変化判定プログラム | |
JP2015082138A (ja) | 音声検索装置及び音声検索方法 | |
JP6127422B2 (ja) | 音声認識装置及び方法、並びに、半導体集積回路装置 | |
KR102580904B1 (ko) | 음성 신호를 번역하는 방법 및 그에 따른 전자 디바이스 | |
JP6013104B2 (ja) | 音声合成方法、装置、及びプログラム | |
JP2007316330A (ja) | 韻律識別装置及び方法、並びに音声認識装置及び方法 | |
JP5696638B2 (ja) | 対話制御装置、対話制御方法及び対話制御用コンピュータプログラム | |
JP3050832B2 (ja) | 自然発話音声波形信号接続型音声合成装置 | |
JP2003186489A (ja) | 音声情報データベース作成システム,録音原稿作成装置および方法,録音管理装置および方法,ならびにラベリング装置および方法 | |
JP2003271183A (ja) | 音声認識辞書作成装置および音声認識辞書作成方法、音声認識装置、携帯端末器、音声認識システム、音声認識辞書作成プログラム、並びに、プログラム記録媒体 | |
JP6197523B2 (ja) | 音声合成装置、言語辞書修正方法及び言語辞書修正用コンピュータプログラム | |
JP3655808B2 (ja) | 音声合成装置および音声合成方法、携帯端末器、並びに、プログラム記録媒体 | |
JP2001092482A (ja) | 音声合成システム、および音声合成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110808 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120730 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120816 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121015 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121108 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121121 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151214 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5152588 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |