JP5152588B2 - 声質変化判定装置、声質変化判定方法、声質変化判定プログラム - Google Patents

声質変化判定装置、声質変化判定方法、声質変化判定プログラム Download PDF

Info

Publication number
JP5152588B2
JP5152588B2 JP2008290314A JP2008290314A JP5152588B2 JP 5152588 B2 JP5152588 B2 JP 5152588B2 JP 2008290314 A JP2008290314 A JP 2008290314A JP 2008290314 A JP2008290314 A JP 2008290314A JP 5152588 B2 JP5152588 B2 JP 5152588B2
Authority
JP
Japan
Prior art keywords
text
input
voice quality
voice
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008290314A
Other languages
English (en)
Other versions
JP2010117528A (ja
Inventor
拓也 野田
一宏 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2008290314A priority Critical patent/JP5152588B2/ja
Publication of JP2010117528A publication Critical patent/JP2010117528A/ja
Application granted granted Critical
Publication of JP5152588B2 publication Critical patent/JP5152588B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本願は、発声者の声質変化の判定を行う声質変化判定装置、声質変化判定方法および声質変化判定プログラムに関する。
音声合成データベースや録音再生コンテンツ等の音声を収録する場合、発声者による大量の音声を均一な声質で収録する必要がある。しかし、収録が長時間に渡ると、発声者の声質は、疲労により経時的に変化してしまう。さらに、収録が複数日に渡る場合には、収録日に応じて発声者の声質が変化してしまう。従来は、監督者が発声者の音声を聞きながら、収録を行う手法が採られていた。この手法では、発声者の声質が変化した場合は、監督者がそれを察知し、その場で発声者に再収録させる。このような、監督者の聴感に頼った手法では声質の均一化が困難である。そのため、収録後の試聴によって声質変化が判明し、後日改めて再収録するなどといった事態が発生しうる。すなわち、費用コスト、時間コストのロスが発生するといった問題がある。
そのため、人の聴覚に頼らずに発声者の声質変化を判定する技術が開示されている(例えば、特許文献1参照)。この従来技術は、予め特定の音声を登録しておき、その特定の音声と入力音声との比較により音声認識し、音声認識率に応じて体調を判定するものである。
特開2006−230548号公報
しかしながら、上記従来技術では、発声者が特定の発声をしなければ声質変化を検査することができない。この方法だと、発声者は、音声収録途中に、声質判定のために特定の発声を強要されるため、無駄に発声量を増やすこととなる。その結果、発声者を疲労させ、発声者の声質を変化させてしまう。
本発明は、上記課題に鑑み、発声者の発声量を増やすことなく、発声者の声質変化の自動判定を可能にする声質変化判定装置、声質変化判定方法および声質変化判定プログラムを提供することを目的とする。
本願に開示する声質変化判定装置は、基準となる声質を表す基準特徴量と、基準特徴量に対応する基準テキストとを記録する基準データ記録部にアクセス可能な声質変化判定装置であって、発声者の音声を入力音声として入力する音声入力部と、前記入力音声に対応するテキストを、入力テキストとして入力するテキスト入力部と、前記入力音声の特徴量を算出する特徴量算出部と、前記入力テキストと前記基準テキストとが互いに一致する部分に対応する入力音声の特徴量を基準特徴量と比較することにより、前記入力音声の声質変化が所定の許容範囲内であるか否かを判定する声質判定部と、該声質判定部が、声質変化は許容範囲内であると判定した入力音声に対応する入力テキストを、対応する特徴量とともに、新たな基準テキストおよび基準特徴量として前記基準データ記録部に記録する基準登録部とを備える。
声質判定部は、入力テキストと基準テキストとが互いに一致する部分において、入力音声の特徴量と基準特徴量とを比較することにより、入力音声の声質の変化を判定することができる。そして、声質判定部は、判定結果を出力する。
さらに、前記基準登録部は、前記声質判定部により声質変化が許容範囲内と判定された入力音声の特徴量および対応するテキストを、新たな基準テキストおよび基準特徴量として記録する。そのため、入力音声の声質変化の判定に伴って、基準特徴量と基準テキストの追加登録が自動的になされる。すなわち、発声者の発声量を増やさなくても、声質変化判定の基準となる情報を追加することができる。その結果、発声者の発声量を無駄に増やすくことなく、基準となるデータが拡充され、発声者の声質変化の自動判定が可能になる。ひいては、声質の安定した音声収録が実現になる。
なお、声質は、例えば、音量、話速、声の高さ、抑揚または音色もしくはこれらの組み合わせによって表すことができる。
本発明の実施形態において、前記声質変化判定装置は、さらに、音声入力すべきテキストが予め登録されているテキスト記録部にアクセス可能であり、前記テキスト入力部は、前記テキスト記録部にアクセスして、入力テキストを読み込み、当該入力テキストを発声者に対して出力し、前記音声入力部は、前記出力された前記入力テキストを読み上げる発声者の音声を入力する態様とすることができる。
本発明の実施形態において、声質変化判定装置は、前記入力テキストを言語解析し、言語解析の結果に基づき前記入力テキストを解析単位に分割する言語処理部をさらに備え、前記特徴量算出部は、前記言語処理部により分割された解析単位ごとに対応する特徴量を算出し、前記声質判定部は、前記入力テキストと前記基準テキストとが互いに一致する解析単位に対応する入力音声の特徴量と基準特徴量を比較することにより、前記入力音声の声質変化が所定の許容範囲内であるか否かを判定する態様とすることができる。
上記構成により、言語解析に基づいた適切な解析単位で、特徴量を算出し、声質変化の判定を行うことができる。その結果、判定精度をより向上させることができる。なお、言語解析は、例えば、形態素解析のようにテキストを言語処理上意味のある単位に区切る処理である。解析単位は、声質変化の判定を行うのに適した単位であり、言語解析の結果区切られた単位と必ずしも同じである必要はない。
本発明の実施形態において、基準データ記録部は、前記基準テキストを表音テキストとして記録し、前記入力テキストを表音テキストに変換する変換部をさらに備え、前記声質判定部は、表音テキストに変換された前記入力テキストと前記基準テキストが互いに一致する部分に対応する入力音声の特徴量と基準特徴量を比較することにより、前記入力音声の声質変化を判定する態様とすることができる。
これにより、表音テキストが一致する部分について、入力音声の特徴量と基準特徴量を比較することにより声質変化が判定されるので、表音テキストが一致しない部分については判定の対象から除外される。そのため、より正確な判定が可能になる。
なお、表音テキストは、コンピュータが処理する際、読みを表す情報として扱うことができるテキストであればよい。
本発明の実施形態において、前記基準登録部は、テキストと基準テキストが一致する部分に対応する入力音声の特徴量を前記基準データ記録部に追加する場合に、前記部分に対応する既存の基準特徴量を、前記入力音声の特徴量に置換するか、または、前記既存の基準特徴量と前記入力音声の特徴量を用いて算出される特徴量を、新たな基準特徴量として追加する態様とすることができる。
本発明の実施形態において、前記基準登録部は、前記声質判定部が声質変化は許容範囲内と判定した前記入力音声について、前記入力テキストと前記基準テキストとが互いに一致する解析単位および当該解析単位に隣接する解析単位に対応する入力テキストおよび特徴量を、新たな基準テキストおよび基準特徴量として、前記基準データ記録部に記録する態様とすることができる。
これにより、入力テキストと基準テキストが一致した箇所の近傍を新たに基準テキスト、基準特徴量として登録することができる。そのため、既存の基準となる音声に比べて声質変化の少ない部分の特徴量を適格に選び出し、新たな基準特徴量に追加することができる。
上記実施形態にかかる声質変化判定装置を含む音声収録装置であって、前記入力音声のうち、前記声質変化判定装置の前記声質判定部によって、声質の変化が許容範囲内であると判定された入力音声を、収録データとして記録する収録部を備える音声収録装置も、本発明の実施形態に含まれる。
コンピュータに声質変化判定処理を実行させることにより、当該コンピュータを上記声質変化判定装置として機能させる声質変化判定プログラムも、本発明の実施形態の一つである。
コンピュータが、上記声質変化判定装置の機能を実現するために実行する声質変化判定方法も、本発明の実施形態の一つである。
本願開示によれば、人の耳に頼らなくても、発声者の声質変化を正確に自動的に判定できるため、発声者の無駄な発声量を増やすことなく、発声者の声質の安定した音声収録をすることが可能になる。
(第1の実施形態)
[声質変化判定装置の構成]
図1は、第1の実施形態にかかる声質変化判定装置の構成を示す機能ブロック図である。図1に示す声質変化判定装置1は、発声者の音声を入力して、発声者の声質を判定し、声質の変化が許容範囲内でない場合に警告を出力する装置である。そのため、声質変化判定装置1は、音声入力部2、テキスト入力部3、特徴量算出部4、声質判定部5、基準登録部6および基準データ記録部7を備える。
なお、図示していないが、声質変化判定装置1は、スピーカやディスプレイ等の警告を出力するための出力機器、並びに、マウス、キーボード、タブレット、ボタン、スキャナまたはカメラ等の入力情報を入力するための入力機器を備えてもよい。
声質変化判定装置1は、例えば、パーソナルコンピュータやサーバマシン等の汎用コンピュータに所定のプログラムをインストールすることによって実現することができる。また、汎用コンピュータに限らず、例えば、車載情報端末、携帯電話、PDA(Personal Digital Assistant)、家電製品等の電子機器に組み込まれたコンピュータによって声質変化判定装置1が形成されてもよい。あるいは、コンピュータを内蔵した専用機器で声質変化判定装置1が形成されてもよい。
音声入力部2、テキスト入力部3、特徴量算出部4、声質判定部5および基準登録部6の各機能は、CPUが所定のプログラムを実行することによって実現される。したがって、上記の各機能をコンピュータで実現するためのプログラムまたはそれを記録した記録媒体も本発明の一実施態様である。また、基準データ記録部7は、安定した声質で入力された音声データであり、コンピュータの内蔵記憶装置またはこのコンピュータからアクセス可能な記憶装置によって具現化される。
なお、声質変化判定装置1の構成は、図1に示す例に限られない。例えば、基準データ記録部8は、声質変化判定装置1の外部に設けられた記憶媒体で実現されてもよい。以下、各機能部について詳細に説明する。
[音声入力部2]
音声入力部2は、発声者の音声を外部から入力し、入力音声として、声質変化判定装置1で処理可能な状態にする。音声入力部2は、例えば、収録マイクなどを介して、発声者の音声を声質変化判定装置1に取り込み、特徴量算出部4に渡す。あるいは、音声入力部2は、外部または内蔵の記録媒体に予め記録された発声者の音声データを読み込むか、またはネットワークを介して音声データを受信することで発声者の音声を入力してもよい。
[テキスト入力部3]
テキスト入力部3は、発声者の音声の内容を示すテキストを外部から入力し、入力テキストとして声質変化判定装置1で処理可能な状態にする。テキスト入力部3は、例えば、基準文章または読み上げ原稿の内容を入力テキストとして入力する。入力テキストの形式は、漢字の読みやアクセント位置情報を表す表音テキストが好ましいが、例えば、かな漢字混じりテキストのような通常表記のテキストでも良い。
また、テキスト入力部3は、例えば、GUIを介して、発声者に対してテキストを表示し、表示されたテキストを読み上げる発声者の音声を音声入力部2に入力させることで、入力音声とテキストとの対応関係を特定することができる。あるいは、テキスト入力部3は、GUIを介して発声者あるいは他のユーザから入力音声に対応するテキストの入力を受け付けてもよいし、音声入力部2の入力音声を音声認識することによって入力音声に対応する入力テキストを生成してもよい。そのため、音質変化判定装置1は、例えば、入力音声を認識して入力テキストを生成する音声認識部をさらに備えてもよい。
[特徴量算出部4]
特徴量算出部4は、入力音声と入力テキストから特徴量を算出し、対応する入力テキストとともに、声質判定部5あるいは基準データ記録部7へ出力する。本実施形態における特徴量は、音声の音響的、音韻的な特徴を数値化した量である。特徴量は、例えば、音量、話速、声の高さ、抑揚、音色または音韻のうち少なくとも1つを計算することにより得ることができる。以下に、特徴量の具体例を示すが、特徴量はこれらに限定されない。
音量については、例えば、音声の有音区間における振幅平均値を特徴量とすることができる。振幅平均値は、絶対値振幅の平均値、あるいはRMS値などを採用することができる。話速については、例えば、音声の有音区間における単位時間(秒)当たりの音節数または拍数(モーラ数)を特徴量とすることができる。声の高さについては、例えば、音声の有音区間のうち、音声波形に周期性が認められる有声区間のピッチ周波数(Hz)を特徴量とすることができる。抑揚については、例えば、前述の声の高さであるピッチ周波数の変化幅(ダイナミックレンジ)を特徴量とすることができる。音色については、例えば、音声の有音区間におけるフォルマント周波数を特徴量とすることができる。音韻については、例えば、音声を音声認識して得られる音素表記を特徴量とすることができる。
[切り替え手段8、9]
図1に示す例では、特徴量算出部4からの特徴量およびテキストの出力先を、声質判定部5にするか、基準データ記録部7にするかを切り替える切り替え手段8、9が設けられる。切り替え手段8、9は、例えば、発声者が、声質判定の基準となる音声の特徴量およびテキストを登録する場合に、特徴量算出部4をBとDに接続することができる。これにより、特徴量算出部4からの特徴量およびテキストは、基準データ記録部7に出力される。それ以外の場合は、切り替え手段8、9は、特徴量算出部4をA、Cに接続するようにしてもよい。これにより、入力音声の特徴量およびテキストが声質判定部5に出力され、声質変化の判定が実行される。
例えば、発声者が、音声収録の初回に、音量、話速、声の高さ、抑揚、音色等を予め決めた上で、基準文章を読み上げて基準音声とし、その音声の特徴量を基準音声特徴量、読み上げ原稿を基準テキストとして登録する場合が想定される。この場合、発声者が基準テキストとなる文章を読み上げて、その基準テキストと基準特徴量を登録する時に限り、特徴量算出部4をBとDに接続し、それ以外の場合はAとCに接続するように切り替え手段8、9を制御することができる。ここで、初回に登録される基準テキストは、1文章であっても良いが、文章数が多いほど発声者の声質変化判定の精度が向上するため、複数文章用意することが好ましい。
なお、切り替え手段8、9は、必ずしも、物理的なスイッチである必要はなく、例えば、ソフトウエアの処理によりデータの出力先を切り替えるものであってもよい。
[基準データ記録部7]
基準データ記録部7は、声質変化の判定において基準声質となる音声の基準特徴量と、基準テキストとを対応付けて記録する。基準特徴量と基準テキストのデータ形式は特に限定されないが、例えば、テーブル形式で記録されてもよい。基準テキストは、例えば、文節単位のように、特徴量を算出し、声質変化の判定を行うのに適した単位で記録されることが好ましい。
[声質判定部5]
声質判定部5は、特徴量算出部4から出力された入力音声の特徴量および対応するテキストと、基準データ記録部7から読み出した基準特徴量および基準テキストを比較することにより、声質変化の判定を実行する。声質判定部5は、例えば、入力テキストのうちで基準データ記録部7に記録された基準テキストと一致する部分を検索し、当該一致する部分について、特徴量と基準特徴量を比較することができる。声質判定部5は、この比較によって声質変化の程度を示す値(声質変化量)を計算することができる。一例として、特徴量と基準特徴量の差または比から声質変化量を算出することができる。特徴量に、上記の音量、話速、声の高さ、抑揚、音色、音韻等の複数の項目が含まれる場合は、各項目について声質変化量を算出すればよい。
声質判定部5は、声質変化量が許容範囲を越えているか否かを判断する。この判断は、例えば、声質変化量と予め設定された閾値とを比較することにより行うことができる。声質変化量が許容範囲を越えている場合には、発声者に対して、警告を出力する。警告は、例えば、ディスプレイまたはスピーカ等の出力装置を介して発声者に伝えることができる。なお、声質判定部5が出力する判定結果は、警告に限られない。例えば、声質判定部5は、算出した声質変化量を、判定結果としてそのまま出力してもよい。
[基準登録部6]
基準登録部6は、声質判定部5が、音声変化量が許容範囲内であると判定した入力音声の特徴量とテキストを、基準特徴量および基準テキストとして、基準データ記録部7に記録する。その際、音声変化量が許容範囲内であると判定された入力音声のうち一部の特徴量およびテキストを抽出して記録してもよい。
例えば、入力音声が、文章ごとに入力されて、文章ごとに声質変化判定された場合、許容範囲内と判定された文章について、文章全体のテキストおよび特徴量を基準データ記録部7に記録してもよいし、当該文章のうち、既存の基準テキストと一致する部分とその周辺部を基準テキストおよび基準特徴量として記録してもよい。
すなわち、基準登録部6は、入力テキストと既存の基準テキストとが一致する部分を基に、基準テキストとして追加する部分を選択することができる。これにより、声質変化が少なく、基準にするのに相応しい部分のテキストおよび特徴量を基準データ記録部に追加することが可能になる。
[動作例]
次に、声質変化判定装置1の動作例について説明する。図2は、声質判定部5および基準登録部6の動作例を示すフローチャートである。図2に示す処理は、声質判定部5が、テキストと基準テキストが一致した部分の特徴量と基準特徴量から、音声の声質変化を判定する処理の一例である。
まず、声質判定部5に、特徴量算出部4から、入力音声の特徴量と入力テキストが入力される(Op1)。ここでは、一例として、入力テキストと入力特徴量が、1文章単位で入力され、文章ごとに音質変化判定が行われる場合について説明する。すなわち、Op1では、1文章の入力テキストと、その1文章を読み上げる入力音声の特徴量の組が入力される。この実施例では、入力テキストと音声を同時に入力しているが、先に入力テキストを登録しておき、登録された入力テキストを表示して、音声を入力するようにしてもよい。
次に、声質判定部5は、1文章(1解析単位)の入力テキスト中に含まれるテキストと一致する基準テキストを探索する(Op2)。
一例として、発声者が図3Aに示す原稿を読み上げる場合、入力テキストとして、「昨日と今日の天気を調べます。」、「あなたの電話番号を教えて下さい。」および「あしたの予定はありません。」の3つの文章が入力される。例えば、図3Bに示す、「あしたの天気を教えて下さい」という1文章が、基準テキストとして、基準データ記録部7に記録されている場合、上記3つの文章において、基準テキストと一致するテキストは、それぞれ「天気を」、「教えて下さい」、「あしたの」となる。
一致する基準テキストが無い場合(Op2でNo)は、声質判定部5は、次の入力テキストと特徴量の組を入力して探索を継続する(Op1およびOp2の処理を繰り返す)。さらなる入力テキストおよび入力特徴量の組が無い場合(Op7でNo)、声質判定部5は処理を終了する。
基準テキストと一致するテキストが入力テキスト中にある場合(Op2でYes)、声質判定部5は、一致する部分の特徴量と基準特徴量を比較して声質変化を算出する(Op3)。声質判定部5は、例えば、特徴量と基準特徴量の差または比から声質変化量を算出することができる。ここでは、特徴量が、前述の音量、話速、声の高さ、抑揚、音色、音韻等、複数項目の値を含む場合について説明する。例えば、項目数がn(n=自然数)の場合、特徴量の項目ごと(1,・・・n)に声質変化量K(1),K(2),・・・K(n)が算出される。
次に、声質判定部5は、1つ以上の声質変化量K(1),・・・,K(n)と、声質変化量ごとに予め設定された閾値T(1),・・・,T(n)とを比較し、音声の声質変化の有無を判定する(Op4−1〜n)。声質判定部5は、例えば、1つ以上の声質変化量のうち、少なくとも1項目の声質変化量が閾値を超えた場合(Op4−1〜nのいずれかでNoの場合)、音声の声質が変化したと判定し、その情報を警告として出力する(Op6)。また、声質判定部5は、声質変化量の項目全てが閾値を越えないか、あるいは閾値と等しい場合(Op4−1〜nの全てでYesの場合)、音声の声質変化は無く、適正な発声であると判定し、基準登録部6は、入力テキストとその特徴量を基準データ記録部7へ登録する(Op5)。
ここで、声質判定部5による判定と基準登録部6による登録の具体例について説明する。ここでは、図3Aに示す原稿の例文1)と3)が「声質変化なし」と判定され、例文2)が「声質変化あり」と判定された場合の例を説明する。例文2)については、声質判定部5が、声質変化があったことを、ディスプレイおよびスピーカを介して発声者に通知する。この場合は、例文2)について、改めて、音声の再入力を発声者に促す表示を行うことにより、音声の再収録をすることができる。
一方、例文1)と3)の文章については、声質変化が無いと判定されたため、これらの文章のテキストおよび特徴量が、新たな基準テキストおよび特徴量として、基準データ記録部7に記録される。
図4Aおよび図4Bは、新規登録後の基準テキストの例を示す図である。図4Aに示す例では、基準テキストと一致する「天気を」を含む例文1)の文章のテキスト全体と、「あしたの」を含む例文3)の文章のテキスト全体が、新たな基準テキストとして対応する特徴量とともに登録されている。
図4Bは、例文1)および3)の文章のテキスト全体ではなく、基準テキストが一致した箇所の近傍のみを新規に基準テキストとして登録した場合の例を示す。図4Bに示す例では、例文1)の場合、「天気の」の前後の文節「今日の」と「調べます」のみが基準テキストとして登録されている。一致部分から離れている文節「昨日と」は登録されていない。例文3)についても、基準テキストと一致する「あしたの」の後の文節「予定は」のみが新たな基準テキストとして登録され、一致部分から離れている文節「ありません」は登録されていない。
このように、基準登録部6は、声質変化の少ない一致部分の近傍のテキストおよび特徴量を選択し、新たな基準テキストおよび基準特徴量として登録することができる。これにより、入力テキストと基準テキストが一致した箇所から離れた部分、すなわち、声質が変化する可能性が高い部分のテキストおよび特徴量が、基準テキストおよび基準特徴量に追加されるのを防ぐことができる。
なお、上記例では、基準登録部6は、一致部分に隣接する文節を基準テキストに含める範囲としているが、基準テキストに含める範囲は、これに限られない。例えば、一致部分に隣接する所定数の単語または所定数の文字等を基準テキストに含める範囲としてもよい。
以上、図2に示した声質変化判定装置1の動作により、入力音声のうち、声質変化が少なく、基準の音声に相応しい音声のテキストおよび特徴量が、自動的に基準テキストおよび基準特徴量に追加される。そのため、発声者の無駄な発声量を増やすことなく、基準テキストおよび基準特徴量が拡充される。その結果、発声者の声質(音量、話速、声の高さ、抑揚、音色など)の変化をより正確に自動判定することが可能になる。
なお、上記例では、n個の特徴量の差または比をn個の声質変化量とし、n個の声質変化量とn個の各閾値との比較によって声質変化の有無を判定しているが、判定処理はこれに限られない。例えば、n個の声質変化量をn次元ユークリッド空間として捕らえ、ユ−クリッド距離と所定の閾値との比較によって声質変化の有無を判定しても良い。
(変形例)
図5は、上記実施形態における声質変化判定装置1の構成の変形例を示す図である。図5に示す声質変化判定装置1は、発声者が読み上げるためのテキストを事前に入力して画面に表示し、表示されたテキストを見た発声者がそのテキストを読み上げる音声を、入力音声として受け付けるように構成したものである。
そのため、図5に示す声質変化判定装置1は、テキスト入力部3が外部のテキスト記録部16から読み込んだ入力テキストを発声者に対して出力する入力テキスト出力部17を備える。テキスト記録部16には、発声者が読み上げるべきテキストが予め記録される。なお、テキスト記録部16は、音質変化判定装置1の内部に設けられてもよい。
テキスト入力部3は、テキスト記録部16から読み込んだ入力テキストを、入力テキスト出力部17と特徴量算出部4に渡す。入力テキスト出力部17は、入力テキストを発声者に出力する。入力テキスト出力部17は、例えば、入力テキストを文章単位でディスプレイに表示させてもよい。その際、発声者に入力テキストの読み上げを促すメッセージも同時に表示することができる。発声者は、ディスプレイに表示された入力テキストを読み上げ、音声入力部2が発声者の音声を入力して特徴量算出部4へ渡す。入力テキストと入力テキストに対応する入力音声が特徴量算出部4へ入力される。
上記構成により、発声者は、入力テキスト出力部17の出力に従って、入力テキストを読み上げるだけで、声質変化判定を実行し、基準データを自動的に拡充することができる。
(第2の実施形態)
第2の実施形態は、上記第1の実施形態におけるテキスト入力部3の変形例である。図6は、本実施形態におけるテキスト入力部3aの構成を示す機能ブロック図である。図6に示すテキスト入力部3aは、言語処理部11と、変換部12を含む。言語処理部11および変換部12は言語辞書13にアクセス可能となっている。言語辞書13は、言語処理部11および変換部12の処理で必要なデータが記録される。言語辞書13には、例えば、入力テキストに含まれ得る複数の単語の表記、読み、品詞、アクセント情報等が記録されている。
言語処理部11は、言語辞書13を用いて、入力テキストを言語解析することにより解析単位に分割する。例えば、入力テキストが、かな漢字混じりテキストである場合、言語処理部11は、入力テキストと言語辞書13とを照合して形態素解析を行う。形態素解析の方法として、例えば、ビタビ(Viterbi)アルゴリズムや最長一致法等が挙げられるが、本発明に用いられる形態素解析の方法は、特定のものに限定されない。また、言語解析は、形態素解析に限られない。例えば、対象となる言語が英語の場合は、入力テキストを単語単位で区切る単語解析が実行されてもよい。
言語処理部11は、形態素解析によって、入力テキストを、言語処理上意味を持つ要素単位に区切ることができる。例えば、品詞、文節、アクセント句または呼気段落(句読点)などの境界が検出される。言語処理部11は、これらの境界のうちいずれかを解析境界とすることができる。解析境界により、入力テキストが解析単位に分割される。
ここで、解析境界は、特徴量を算出し、声質変化の判定を行うのに適した範囲を設定するように決定されることが好ましい。例えば、文節の境界を解析境界とするとよい。なぜなら、句読点で区切られた呼気段落境界のように、文節より長い区間を設定する境界を解析境界とすると、テキストと基準テキストが一致する確率が低下し、声質変化の自動判定や、基準声質への新規登録も困難となる場合があるからである。逆に、解析単位を短くすると、テキストと基準テキストが一致する確率は格段に上がるため、声質変化の自動判定は容易となる傾向はある。しかしながら、品詞単位のように、文節より短い区間を設定する境界を、解析境界とすると、短い音節単位での特徴量と基準特徴量の比較は、その精度の信頼性に乏しい場合が多くなる。そのため、呼気段落境界と品詞境界の中間単位である文節境界が音節数として妥当な解析境界といえる。アクセント句は、1文節ないし数文節で構成される長さであり、アクセント句の境界を解析境界とすることも同様に好ましい。
変換部12は、言語辞書13を用いて、入力テキストを表音テキストに変換する。変換部12は、言語処理部11の一部として機能してもよい。表音テキストは、入力テキストの読みを表すテキストであり、アクセント等が付加されていてもよい。
例えば、言語処理部11が、入力テキストの形態素解析を実行する際に、各単語の読みおよびアクセント等の表音情報を言語辞書13から取得し、各単語の表音テキストを生成することができる。
以下、言語処理部11および変換部12の処理の具体例を示す。図7Aは、発声者が読み上げる原稿の一例であり、図7Bは、図7Aに示す原稿の内容の入力テキストが、テキスト入力部3aにより、解析単位に分割され、表音テキストに変換された後のテキストの例を示す。
テキスト入力部3aが、図7Aに示すような、かな漢字混じりテキストを入力すると、言語処理部11は、当該テキストと言語辞書とを照合して形態素解析を行う。この形態素解析によって、かな漢字混じりテキストが、文節に分解される。それぞれの文節は、変換部12によってカタカナ表記に変換され、さらに、アクセント情報等が付与されて、表音テキストに変換される。
例えば、図7Aに示す例文1)の「会議の最中です。」は、言語処理部11で解析単位「会議の」「最中です」に分解され、変換部12で、表音テキスト「カ’イギノ」、「サイチューデス」に変換される(図7B参照)。なお、図7Bに示す表音テキストは、一例として、文節の境界をスペースで表し、アクセントが「高」から「低」に移行する位置(アクセント核)を「’」で表している。
これにより、特徴量算出部4から基準データ記録部7に記録される基準テキストも、特徴量算出部4から声質判定部5に渡されるテキストも、いずれも、解析単位に分解された表音テキストとなる。このように、基準テキストおよび入力テキストのいずれも表音テキストであれば、入力テキストと基準テキストの一致箇所を探索する場合、テキストの文字一致に加え、読みおよびアクセントの一致も考慮できる。そのため、同表記異読語や、同表記異アクセントのテキストを区別することができる。
例えば、図7Aに示す例文1)および2)は、同表記の「最中」を含むが、例文1)の「最中」の読みは「サイチュー」であり、例文2)の「最中」読みは「もなか」であり、全く異なる。このように表記が同じでも読みが異なるテキストについて、その表記を比較すると、発声者の声質に変化が無くとも、特徴量全般に大差が生じ、声質判定部5は「声質変化あり」と誤判定してしまう。
同様に、図7Aに示す例文3)、4)は共に「天気」を含む読み上げ原稿であるが、例文3)の「天気」は「て」の部分にアクセントのある頭高アクセント、例文4)の「天気」は平板型アクセント(アクセントなし)である。両者のテキスト表記は同一であるが、アクセントは一致しない。アクセントが一致しない特徴量同士を比較した場合、発声者の声質に変化が無くとも、特にピッチ周波数に大差が生じ、声質判定部は「声質変化あり」と誤判定してしまう。
したがって、本実施形態の構成では、テキストと基準テキストの一致部分を探索する場合、テキストの一致のみでなく、読みやアクセント等の表音情報の一致を含めた探索をすることが可能になる。すなわち、読みやアクセント情報を含めたテキストと基準テキストの一致部分探索が可能となる。
具体的には、声質判定部5が、入力テキストに、表音テキストで表される読みおよびアクセントが基準テキストと一致する文節がある否かを探索し、これらが一致する文節があれば、その文節の特徴量を基準特徴量と比較する。これにより、より正確な声質変化の判定が可能になる。
また、テキストと基準テキストの一致部分の探索や、テキストと基準テキストの特徴量の比較が文節単位で実行されるので、より精度の高い探索および特徴量の比較が可能になる。さらに、基準登録部6による、基準テキストおよび基準特徴量の追加も、文節単位で実行することができるので、基準にするのにより適切なテキストおよび特徴量を基準データ記録部に追加することができる。
なお、上記実施形態では、テキスト入力部3aが、言語処理部11および変換部12を有する場合を説明したが、テキスト入力部3aは、言語処理部11または変換部12のいずれか1つを備える構成であってもよい。
(第3の実施形態)
第3の実施形態は、上記第1または第2の実施形態における基準登録部6の変形例である。本実施形態における基準登録部6bは、入力テキストと基準テキストが一致する部分に対応する入力音声の特徴量を基準データ記録部7に追加する場合に、(1)前記一致する部分に対応する既存の基準特徴量を入力音声の特徴量に置換するか。あるいは、(2)基準登録部6bは、前記既存の基準特徴量と前記入力音声の特徴量を用いて算出される特徴量を基準特徴量として基準データ記録部7に追加する処理を実行する。
以下に、本実施形態の基準登録部6bによる処理の具体例を説明する。ここでは、一例として、入力テキストが図8Aに示す例文1)〜3)を含み、基準データ記録部7に記録されている既存の基準テキストおよび特徴量が、図8Bに示す内容である場合について説明する。本例では、例文1)〜3)いずれにおいても、「あしたの」の部分(フレーズ)が既存の基準テキストと一致する。ここで、声質判定部5が、例文1)〜3)いずれについても、声質変化量は、許容範囲を越えてない(「声質変化なし」)と判断した場合を想定する。この場合、基準登録部6bは、例えば、下記の3パターンの登録処理を実行することができる。
第1の登録処理として、基準登録部6bは、入力テキストと基準テキストが一致する部分の既存の基準特徴量を、入力音声の特徴量に置換してもよい。例えば、基準登録部6bは、既存の「あしたの」の基準特徴量「A1」を破棄し、例文1)、2)、3)における「あしたの」のそれぞれの特徴量A2、A3、A4のうちのいずれかを選定して登録することができる。図9Aは、既存の基本特徴量「A1」を、例文1)の「あしたの」の特徴量「A2」で置換した場合の、基準データ記録部7のデータ内容の一例を示す図である。このように、既存の基準特徴量を、入力音声の特徴量で置換することにより、発声者の状況を基準特徴量に反映させることができる。すなわち、基準特徴量を、発声者の状況に合わせて更新することが可能になる。
第2の登録処理として、基準登録部6bは、既存の基準特徴量と入力音声の特徴量を用いて計算された特徴量を、基準特徴量として登録することができる。例えば、既存の基準特徴量と入力音声の特徴量を重み付け平均などによって平均化した特徴量を基準特徴量とすることができる。図9Bは、既存の基準特徴量A1および、例文1)、2)、3)の特徴量A2、A3、A4の重み付け平均を、新たな基準特徴量として記録した場合の、基準データ記録部7のデータ内容の一例を示す図である。図9Bにおいて、α、β、γ、εはそれぞれ重み付け係数を表す。これにより、基準特徴量をより妥当な値に近づけることができる。
なお、既存の基準特徴量と入力音声の特徴量を用いて計算される特徴量は、上記例の重み付け平均に限られない。例えば、平均、中間値(最大値と最小値の中間の値)、最頻値等、その他の代表値が計算されてもよい。
第3の登録処理として、基準登録部6bは、入力テキストと基準テキストが一致する部分の基準特徴量については、更新せずにそのまま継続利用してもよい。このように更新処理を省略することで、コンピュータへの負荷を軽減することができる。図9Cは、基準特徴量A1を更新しない場合の基準データ記録部7のデータ内容を示す図である。
(第4の実施形態)
第4の実施形態は、上記第1〜3いずれかの実施形態の声質変化判定装置を含む音声収録装置に関するものである。図10は、本実施形態における音声収録装置10の構成を示す機能ブロック図である。図10に示す音声収録装置10は、入力音声を収録データとして記録する機能をさらに有する。音声収録装置10は、図1に示す声質変化判定装置1に、収録部14を追加した構成である。図10において、図1と同じ機能ブロックには同じ番号を付す。
収録部14は、音声入力部2が入力した入力音声を、収録データ記録部15へ記録する。その際、収録部14は、声質判定部5が、声質変化が許容範囲内であると判定した音声についてのみ記録するようにすることができる。
これにより、声質変化が許容範囲を越えている音声については、自動的に、収録データから除外される。その結果、音質の安定した音声収録が実現される。
以上、本発明の実施形態を、第1〜第4の実施形態として例示した。以上の実施形態によれば、発声者は読み上げ原稿を読み上げるだけで、その声質が自動判定されるとともに声質の基準となるデータも拡充されるため、従来技術のような定型文を発声する無駄がなく、発声者の負担が軽減される。すなわち、上記実施形態では、基準音声とする発声者の事前発声は最低1文章程度あれば良く、以後は発声者が原稿読み上げを継続していくにつれ、基準音質が自動的に新規登録される。特に、発声者により読み上げられた入力音声のうち、声質変化が無いと判定された音声の全体、または一部を基準声質(テキスト、特徴量)として新規登録される。これにより、基準声質量が自然増加する。その結果、読み上げ原稿と基準声質のテキスト一致率が増加し、声質判定精度が飛躍的に向上する。
なお、本発明の適用可能な範囲は、上記の実施形態に限定されない。また、上記第1〜4の実施形態のうち少なくとも2つの実施形態の組み合わせも、本発明の実施形態に含まれる。
以上の第1〜第4の実施形態に関し、さらに以下の付記を開示する。
(付記1)
基準となる声質を表す基準特徴量と、基準特徴量に対応する基準テキストとを記録する基準データ記録部にアクセス可能な声質変化判定装置であって、
発声者の音声を入力音声として入力する音声入力部と、
前記入力音声に対応するテキストを、入力テキストとして入力するテキスト入力部と、
前記入力音声の特徴量を算出する特徴量算出部と、
前記入力テキストと前記基準テキストとが互いに一致する部分に対応する入力音声の特徴量を基準特徴量と比較することにより、前記入力音声の声質変化が所定の許容範囲内であるか否かを判定する声質判定部と、
該声質判定部が、声質変化は許容範囲内であると判定した入力音声に対応する入力テキストを、対応する特徴量とともに、新たな基準テキストおよび基準特徴量として前記基準データ記録部に記録する基準登録部とを備える、声質変化判定装置。
(付記2)
前記声質変化判定装置は、さらに、音声入力すべきテキストが予め登録されているテキスト記録部にアクセス可能であり、
前記テキスト入力部は、前記テキスト記録部にアクセスして、入力テキストを読み込み、当該入力テキストを発声者に対して出力し、
前記音声入力部は、前記出力された前記入力テキストを読み上げる発声者の音声を入力する、付記1に記載の声質変化判定装置。
(付記3)
前記入力テキストを言語解析し、言語解析の結果に基づき前記入力テキストを解析単位に分割する言語処理部をさらに備え、
前記特徴量算出部は、前記言語処理部により分割された解析単位ごとに対応する特徴量を算出し、
前記声質判定部は、前記入力テキストと前記基準テキストとが互いに一致する解析単位に対応する入力音声の特徴量と基準特徴量を比較することにより、前記入力音声の声質変化が所定の許容範囲内であるか否かを判定する、付記1または2に記載の声質変化判定装置。
(付記4)
基準データ記録部は、前記基準テキストを表音テキストとして記録し、
前記入力テキストを表音テキストに変換する変換部をさらに備え、
前記声質判定部は、表音テキストに変換された前記入力テキストと前記基準テキストが互いに一致する部分に対応する入力音声の特徴量と基準特徴量を比較することにより、前記入力音声の声質変化を判定する、付記1〜3のいずれか1項に記載の声質変化判定装置。
(付記5)
前記基準登録部は、テキストと基準テキストが一致する部分に対応する入力音声の特徴量を前記基準データ記録部に追加する場合に、前記部分に対応する既存の基準特徴量を、前記入力音声の特徴量に置換するか、または、前記既存の基準特徴量と前記入力音声の特徴量を用いて算出される特徴量を、新たな基準特徴量として追加する、付記1〜4のいずれか1項に記載の声質変化判定装置。
(付記6)
前記基準登録部は、前記声質判定部が声質変化は許容範囲内と判定した前記入力音声について、前記入力テキストと前記基準テキストとが互いに一致する解析単位および当該解析単位に隣接する解析単位に対応する入力テキストおよび特徴量を、新たな基準テキストおよび基準特徴量として、前記基準データ記録部に記録する、付記3に記載の声質変化判定装置。
(付記7)
付記1〜6のいずれか1項に記載の声質変化判定装置を含む音声収録装置であって、
前記入力音声のうち、前記声質変化判定装置の前記声質判定部によって、声質の変化が許容範囲内であると判定された入力音声を、収録データとして記録する収録部を備える、音声収録装置。
(付記8)
基準となる声質を示す基準特徴量と、前記基準特徴量に対応する基準テキストとを記録する基準データ記録部にアクセス可能なコンピュータに、声質変化判定処理を実行させる声質変化判定プログラムであって、
発声者の音声を入力音声として入力する音声入力処理と、
前記入力音声に対応するテキストを、入力テキストとして入力するテキスト入力処理と、
前記入力音声の特徴量を算出する特徴量算出処理と、
前記入力テキストと前記基準テキストとが互いに一致する部分に対応する入力音声の特徴量と基準特徴量を比較することにより、前記入力音声の声質変化が所定の許容範囲内であるか否かを判定する声質判定処理と、
前記声質判定処理で、声質変化は許容範囲内であると判定された入力音声に対応するテキストを、対応する特徴量とともに、新たな基準テキストおよび基準特徴量として前記基準データ記録部に記録する基準登録処理とをコンピュータに実行させる、声質変化判定プログラム。
(付記9)
コンピュータが、声質変化判定を実行する声質変化判定方法であって、
前記コンピュータは、基準となる声質を示す基準特徴量と、前記基準特徴量に対応する基準テキストとを記録する基準データ記録部にアクセス可能であり、
前記コンピュータが、発声者の音声を入力音声として受け付ける音声入力工程と、
前記コンピュータが、前記入力音声に対応するテキストを、入力テキストとして取得するテキスト入力工程と、
前記コンピュータが、前記入力音声の特徴量を算出する特徴量算出工程と、
前記コンピュータが、前記入力テキストと前記基準テキストとが互いに一致する部分に対応する入力音声の特徴量と基準特徴量を比較することにより、前記入力音声の声質変化を判定する声質判定工程と、
前記コンピュータが、前記声質判定工程で声質変化は許容範囲内であると判定された入力音声に対応するテキストの全体または一部を、対応する特徴量とともに、新たな基準テキストおよび基準特徴量として前記基準データ記録部に記録する基準登録工程とを含む声質変化判定方法。
第1の実施形態にかかる声質変化判定装置の構成を示す機能ブロック図 声質判定部および基準登録部の動作例を示すフローチャート 発声者が読み上げる原稿の一例を示す図 基準データ記録部7に記録される基準テキストの一例を示す図 新規登録後の基準テキストの例を示す図 新規登録後の基準テキストの例を示す図 第1の実施形態における声質変化判定装置の構成の変形例を示す図 第2の実施形態におけるテキスト入力部の構成を示す機能ブロック図 発声者が読み上げる原稿の一例を示す図 図7Aに示す原稿の内容の入力テキストが、表音テキストに変換された後のテキストの一例を示す図 発声者が読み上げる文章の例を示す図 基準データ記録部に記録される基準テキストおよび基準特徴量の一例を示す図 第3の実施形態における基準登録部による処理後の基準データ記録部におけるデータ内容の一例を示す図 第3の実施形態における基準登録部による処理後の基準データ記録部におけるデータ内容の一例を示す図 第3の実施形態における基準登録部による処理後の基準データ記録部におけるデータ内容の一例を示す図 第4の実施形態における音声収録装置の構成を示す機能ブロック図
符号の説明
1 声質変化判定装置
2 音声入力部
3 テキスト入力部
4 特徴量算出部
5 声質判定部
6 基準登録部
7 基準データ記録部
10 音声収録装置
11 言語処理部
12 変換部
13 言語辞書
14 収録部
15 収録データ記録部

Claims (7)

  1. 基準となる声質を表す基準特徴量と、基準特徴量に対応する基準テキストとを記録する基準データ記録部にアクセス可能な声質変化判定装置であって、
    発声者の音声を入力音声として入力する音声入力部と、
    前記入力音声に対応するテキストを、入力テキストとして入力するテキスト入力部と、
    前記入力音声の特徴量を算出する特徴量算出部と、
    前記入力テキストのうちで前記基準データ記録部に記録された前記基準テキストと互いに一致する部分を検索し、当該一致する部分について、前記入力音声の特徴量を基準特徴量と比較することにより、前記入力音声の声質変化が所定の許容範囲内であるか否かを判定する声質判定部と、
    該声質判定部が、声質変化は許容範囲内であると判定した入力音声に対応する入力テキストを、対応する特徴量とともに、新たな基準テキストおよび基準特徴量として前記基準データ記録部に記録する基準登録部とを備える、声質変化判定装置。
  2. 前記声質変化判定装置は、さらに、音声入力すべきテキストが予め登録されているテキスト記録部にアクセス可能であり、
    前記テキスト入力部は、前記テキスト記録部にアクセスして、入力テキストを読み込み、当該入力テキストを発声者に対して出力し、
    前記音声入力部は、前記出力された前記入力テキストを読み上げる発声者の音声を入力する、請求項1に記載の声質変化判定装置。
  3. 前記入力テキストを言語解析し、言語解析の結果に基づき前記入力テキストを解析単位に分割する言語処理部をさらに備え、
    前記特徴量算出部は、前記言語処理部により分割された解析単位ごとに対応する特徴量を算出し、
    前記声質判定部は、前記入力テキストと前記基準テキストとが互いに一致する解析単位に対応する入力音声の特徴量と基準特徴量を比較することにより、前記入力音声の声質変化が所定の許容範囲内であるか否かを判定する、請求項1または2に記載の声質変化判定装置。
  4. 基準データ記録部は、前記基準テキストを表音テキストとして記録し、
    前記入力テキストを表音テキストに変換する変換部をさらに備え、
    前記声質判定部は、表音テキストに変換された前記入力テキストと前記基準テキストが互いに一致する部分に対応する入力音声の特徴量と基準特徴量を比較することにより、前記入力音声の声質変化を判定する、請求項1〜3のいずれか1項に記載の声質変化判定装置。
  5. 前記基準登録部は、テキストと基準テキストが一致する部分に対応する入力音声の特徴量を前記基準データ記録部に追加する場合に、前記部分に対応する既存の基準特徴量を、前記入力音声の特徴量に置換するか、または、前記既存の基準特徴量と前記入力音声の特徴量を用いて算出される特徴量を、新たな基準特徴量として追加する、請求項1〜4のいずれか1項に記載の声質変化判定装置。
  6. 基準となる声質を示す基準特徴量と、前記基準特徴量に対応する基準テキストとを記録する基準データ記録部にアクセス可能なコンピュータに、声質変化判定処理を実行させる声質変化判定プログラムであって、
    発声者の音声を入力音声として入力する音声入力処理と、
    前記入力音声に対応するテキストを、入力テキストとして入力するテキスト入力処理と、
    前記入力音声の特徴量を算出する特徴量算出処理と、
    前記入力テキストのうちで前記基準データ記録部に記録された前記基準テキストと互いに一致する部分を検索し、当該一致する部分について、前記入力音声の特徴量と基準特徴量を比較することにより、前記入力音声の声質変化が所定の許容範囲内であるか否かを判定する声質判定処理と、
    前記声質判定処理で、声質変化は許容範囲内であると判定された入力音声に対応するテキストを、対応する特徴量とともに、新たな基準テキストおよび基準特徴量として前記基準データ記録部に記録する基準登録処理とをコンピュータに実行させる、声質変化判定プログラム。
  7. コンピュータが、声質変化判定を実行する声質変化判定方法であって、
    前記コンピュータは、基準となる声質を示す基準特徴量と、前記基準特徴量に対応する基準テキストとを記録する基準データ記録部にアクセス可能であり、
    前記コンピュータが、発声者の音声を入力音声として受け付ける音声入力工程と、
    前記コンピュータが、前記入力音声に対応するテキストを、入力テキストとして取得するテキスト入力工程と、
    前記コンピュータが、前記入力音声の特徴量を算出する特徴量算出工程と、
    前記コンピュータが、前記入力テキストのうちで前記基準データ記録部に記録された前記基準テキストと互いに一致する部分を検索し、当該一致する部分について、前記入力音声の特徴量と基準特徴量を比較することにより、前記入力音声の声質変化を判定する声質判定工程と、
    前記コンピュータが、前記声質判定工程で声質変化は許容範囲内であると判定された入力音声に対応するテキストの全体または一部を、対応する特徴量とともに、新たな基準テキストおよび基準特徴量として前記基準データ記録部に記録する基準登録工程とを含む声質変化判定方法。
JP2008290314A 2008-11-12 2008-11-12 声質変化判定装置、声質変化判定方法、声質変化判定プログラム Expired - Fee Related JP5152588B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008290314A JP5152588B2 (ja) 2008-11-12 2008-11-12 声質変化判定装置、声質変化判定方法、声質変化判定プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008290314A JP5152588B2 (ja) 2008-11-12 2008-11-12 声質変化判定装置、声質変化判定方法、声質変化判定プログラム

Publications (2)

Publication Number Publication Date
JP2010117528A JP2010117528A (ja) 2010-05-27
JP5152588B2 true JP5152588B2 (ja) 2013-02-27

Family

ID=42305236

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008290314A Expired - Fee Related JP5152588B2 (ja) 2008-11-12 2008-11-12 声質変化判定装置、声質変化判定方法、声質変化判定プログラム

Country Status (1)

Country Link
JP (1) JP5152588B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11074926B1 (en) 2020-01-07 2021-07-27 International Business Machines Corporation Trending and context fatigue compensation in a voice signal

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5697395B2 (ja) * 2010-10-05 2015-04-08 ヤマハ株式会社 歌唱音声評価装置およびプログラム
JP6048726B2 (ja) 2012-08-16 2016-12-21 トヨタ自動車株式会社 リチウム二次電池およびその製造方法
CN105340003B (zh) 2013-06-20 2019-04-05 株式会社东芝 语音合成字典创建装置以及语音合成字典创建方法
JP6909733B2 (ja) * 2018-01-26 2021-07-28 株式会社日立製作所 音声分析装置および音声分析方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6223097A (ja) * 1985-07-23 1987-01-31 株式会社トミー 音声認識装置
JP4631464B2 (ja) * 2005-02-23 2011-02-16 パナソニック株式会社 体調判定装置およびそのプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11074926B1 (en) 2020-01-07 2021-07-27 International Business Machines Corporation Trending and context fatigue compensation in a voice signal

Also Published As

Publication number Publication date
JP2010117528A (ja) 2010-05-27

Similar Documents

Publication Publication Date Title
US7013276B2 (en) Method of assessing degree of acoustic confusability, and system therefor
US8204747B2 (en) Emotion recognition apparatus
US8015011B2 (en) Generating objectively evaluated sufficiently natural synthetic speech from text by using selective paraphrases
US6910012B2 (en) Method and system for speech recognition using phonetically similar word alternatives
JP2008134475A (ja) 入力された音声のアクセントを認識する技術
JP4914295B2 (ja) 力み音声検出装置
JP4129989B2 (ja) テキスト音声合成を支援するシステム
EP1668628A1 (en) Method for synthesizing speech
US20090138266A1 (en) Apparatus, method, and computer program product for recognizing speech
JP4586615B2 (ja) 音声合成装置,音声合成方法およびコンピュータプログラム
CN110675866B (zh) 用于改进至少一个语义单元集合的方法、设备及计算机可读记录介质
JPWO2004066271A1 (ja) 音声合成装置,音声合成方法および音声合成システム
JP5152588B2 (ja) 声質変化判定装置、声質変化判定方法、声質変化判定プログラム
JP2015082138A (ja) 音声検索装置及び音声検索方法
JP6127422B2 (ja) 音声認識装置及び方法、並びに、半導体集積回路装置
KR102580904B1 (ko) 음성 신호를 번역하는 방법 및 그에 따른 전자 디바이스
JP6013104B2 (ja) 音声合成方法、装置、及びプログラム
JP2007316330A (ja) 韻律識別装置及び方法、並びに音声認識装置及び方法
JP5696638B2 (ja) 対話制御装置、対話制御方法及び対話制御用コンピュータプログラム
JP3050832B2 (ja) 自然発話音声波形信号接続型音声合成装置
JP2003186489A (ja) 音声情報データベース作成システム,録音原稿作成装置および方法,録音管理装置および方法,ならびにラベリング装置および方法
JP2003271183A (ja) 音声認識辞書作成装置および音声認識辞書作成方法、音声認識装置、携帯端末器、音声認識システム、音声認識辞書作成プログラム、並びに、プログラム記録媒体
JP6197523B2 (ja) 音声合成装置、言語辞書修正方法及び言語辞書修正用コンピュータプログラム
JP3655808B2 (ja) 音声合成装置および音声合成方法、携帯端末器、並びに、プログラム記録媒体
JP2001092482A (ja) 音声合成システム、および音声合成方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110808

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120730

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120816

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121015

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121108

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121121

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151214

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5152588

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees