JP7458720B2 - 情報処理装置、情報処理方法、及びプログラム - Google Patents

情報処理装置、情報処理方法、及びプログラム Download PDF

Info

Publication number
JP7458720B2
JP7458720B2 JP2019145621A JP2019145621A JP7458720B2 JP 7458720 B2 JP7458720 B2 JP 7458720B2 JP 2019145621 A JP2019145621 A JP 2019145621A JP 2019145621 A JP2019145621 A JP 2019145621A JP 7458720 B2 JP7458720 B2 JP 7458720B2
Authority
JP
Japan
Prior art keywords
sound
voice
section
breath noise
amplitude
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019145621A
Other languages
English (en)
Other versions
JP2021026150A (ja
Inventor
雅人 小池
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koei Tecmo Games Co Ltd
Original Assignee
Koei Tecmo Games Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koei Tecmo Games Co Ltd filed Critical Koei Tecmo Games Co Ltd
Priority to JP2019145621A priority Critical patent/JP7458720B2/ja
Publication of JP2021026150A publication Critical patent/JP2021026150A/ja
Application granted granted Critical
Publication of JP7458720B2 publication Critical patent/JP7458720B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Description

本発明は、情報処理装置、情報処理方法、及びプログラムに関する。
従来、コンピュータゲーム等において、ゲームの状況に応じて、ゲームのキャラクタのセリフを、予め録音されている音声(ボイス)により出力する技術が知られている(例えば、特許文献1を参照)。
声優や歌手等の発声者が発声した音声を録音する場合、発声者が息継ぎ(呼吸)をした際に生じる雑音(ブレスノイズ)が、発声者の口元に設置されたマイクにより集音される場合がある。この場合、録音されている音声を出力すると、ユーザにとって耳障りな雑音となる場合がある。従来、音声を修正する者が、録音されている音声をスピーカに出力させてブレスノイズを耳で聞き取り、ブレスノイズが発生した時間の音声の波形を画面に表示させ、波形を手入力により修正することが知られている。
特開2017-184842号公報
しかしながら、従来技術では、職人の経験と勘に基づいて手作業により周波数成分や音量等を修正するため、作業に手間がかかると共に、修正の品質にばらつきがあるという問題がある。
そこで、一側面では、より適切に音声を修正することができる技術を提供することを目的とする。
一つの案では、情報処理装置が、発話された音声の振幅に基づいて、ブレスノイズによる音の区間を判定する判定部と、判定されたブレスノイズが前記音声から除去されるように前記音声のデータを修正する修正部と、を有し、前記判定部は、前記音声の有音区間のうち中央部以外の部分の最大音量と、中央部の最低音量との比率に基づいて、当該有音区間がブレスノイズであるか否かを判定する。
一側面によれば、より適切に音声を修正することができる。
実施形態に係る情報処理装置のハードウェア構成例を示す図である。 実施形態に係る情報処理装置の機能ブロック図である。 実施形態に係る情報処理装置の処理の一例を示すフローチャートである。 実施形態に係る情報処理装置の処理の一例について説明する図である。
以下、図面に基づいて本発明の実施形態を説明する。
<ハードウェア構成>
図1は、実施形態に係る情報処理装置10のハードウェア構成例を示す図である。図1に示す情報処理装置10は、それぞれバスBで相互に接続されているドライブ装置100、補助記憶装置102、メモリ装置103、CPU104、インタフェース装置105、表示装置106、及び入力装置107等を有する。
情報処理装置10での処理を実現するゲームプログラムは、記録媒体101によって提供される。ゲームプログラムを記録した記録媒体101がドライブ装置100にセットされると、ゲームプログラムが記録媒体101からドライブ装置100を介して補助記憶装置102にインストールされる。但し、ゲームプログラムのインストールは必ずしも記録媒体101より行う必要はなく、ネットワークを介して他のコンピュータよりダウンロードするようにしてもよい。補助記憶装置102は、インストールされたゲームプログラムを格納すると共に、必要なファイルやデータ等を格納する。
メモリ装置103は、例えば、DRAM(Dynamic Random Access Memory)、またはSRAM(Static Random Access Memory)等のメモリであり、プログラムの起動指示があった場合に、補助記憶装置102からプログラムを読み出して格納する。CPU104は、メモリ装置103に格納されたプログラムに従って情報処理装置10に係る機能を実現する。インタフェース装置105は、ネットワークに接続するためのインタフェースとして用いられる。表示装置106はプログラムによるGUI(Graphical User Interface)等を表示する。入力装置107は、コントローラ等、キーボード及びマウス等、またはタッチパネル及びボタン等で構成され、様々な操作指示を入力させるために用いられる。
なお、記録媒体101の一例としては、CD-ROM、DVDディスク、ブルーレイディスク、又はUSBメモリ等の可搬型の記録媒体が挙げられる。また、補助記憶装置102の一例としては、HDD(Hard Disk Drive)、SSD(Solid State Drive)、又はフラッシュメモリ等が挙げられる。記録媒体101及び補助記憶装置102のいずれについても、コンピュータ読み取り可能な記録媒体に相当する。
<機能構成>
次に、図2を参照し、情報処理装置10の機能構成について説明する。図2は、実施形態に係る情報処理装置10の機能ブロック図である。
情報処理装置10は、記憶部11を有する。記憶部11は、例えば、補助記憶装置102等を用いて実現される。記憶部11は、録音されたセリフの音声データ等を記憶する。
また、情報処理装置10は、取得部12、判定部13、及び修正部14を有する。これら各部は、情報処理装置10にインストールされた1以上のプログラムが、情報処理装置10のCPU104に実行させる処理により実現される。
取得部12は、録音されたセリフ等の音声データを記憶部11から取得する。判定部13は、取得部12により取得された音声データから、セリフ等が発話された音声の振幅に基づいて、ブレスノイズによる音の区間を判定する。
修正部14は、判定部13により判定されたブレスノイズが前記音声から除去されるように前記音声のデータを修正する。修正部14は、例えば、判定された各区間の音を修正することにより、取得部12により取得された音声データからブレスノイズの音を除去する。これにより、例えば、声優等が発声したセリフの音声データに含まれるブレスノイズを低減することができる。
<処理>
次に、図3、及び図4を参照して、情報処理装置10の処理について説明する。図3は、実施形態に係る情報処理装置10の処理の一例を示すフローチャートである。図4は、実施形態に係る情報処理装置の処理の一例について説明する図である。
ステップS1において、取得部12は、録音されたセリフの音声データを取得する。続いて、判定部13は、録音されたセリフの音声データの波形の振幅に基づいて、有音区間(音声区間)を判定する(ステップS2)。ここで、判定部13は、例えば、振幅の絶対値が所定の閾値以上であり、所定時間内のゼロクロス回数(零交差数)が所定の閾値以上となった時点から、所定時間内のゼロクロス回数が所定の閾値以下になった時点までの区間を、有音区間と判定してもよい。なお、ゼロクロス回数とは、例えば、振幅の値の符号の正負が入れ替わった回数(波形が振幅0の線を交差した回数)である。図4の例では、セリフの音声データの波形401において、区間411から416がそれぞれ有音区間と判定される。
以下で、判定した複数の有音区間のうちの一の有音区間を、「処理対象の区間」と称する。以下の処理は、判定した複数の有音区間をそれぞれ処理対象の区間とし、各処理対象の区間に対して実行される。
なお、判定部13は、有音区間のうち、例えば、所定時間(例えば、10ms)当たりの振幅の絶対値の平均値が所定の閾値以上の区間を、処理対象の区間としてもよい。この場合、図4の区間414に対しては、区間421が処理対象の区間として判定される。これにより、例えば、振幅の絶対値が比較的小さいため白色ノイズ等の影響を比較的受け易い区間を、処理対象に含めないようにすることができる。
続いて、判定部13は、処理対象の区間における波形のゼロクロス回数に基づいて、ブレスノイズらしさを示す第1指標の値を算出する(ステップS3)。ここで、判定部13は、例えば、処理対象の区間のうち、所定時間内のゼロクロス回数が第1閾値未満である区間が存在する場合、処理対象の区間をブレスノイズらしさが低いと判定してもよい。これにより、例えば、処理対象の区間において、一瞬でも声が混ざっていると考えられる時間帯があれば、ブレスノイズらしくないと判定されるため、ささやき声でセリフを発話している等の区間をブレスノイズと誤判定しないようにすることができる。
この場合、判定部13は、例えば、処理対象の区間を、所定の時間長(例えば、0.1秒)の各区間に分割し、分割した各区間におけるゼロクロス回数をそれぞれ判定してもよい。そして、判定部13は、分割した各区間のゼロクロス回数のうち、最も値が小さいゼロクロス回数が所定の閾値(例えば、2000回/秒)未満である場合、第1指標の値を小さな値(例えば、0)に決定してもよい。また、判定部13は、最も値が小さいゼロクロス回数が所定の閾値未満でない場合、第1指標の値を大きな値(例えば、1)に決定してもよい。
または、判定部13は、例えば、当該最も小さいゼロクロス回数が当該所定の閾値よりも小さいほど、第1指標の値をより小さな値に決定してもよい。
続いて、判定部13は、処理対象の区間の時間長に基づいて、ブレスノイズらしさを示す第2指標の値を算出する(ステップS4)。ここで、判定部13は、例えば、処理対象の区間のうち、所定時間当たりの振幅の絶対値の平均値が所定の閾値以上の区間の時間長に基づいて、当該処理対象の区間がブレスノイズであるか否かを判定してもよい。これにより、例えば、「チッ」、「ツッ」等のタ行の無声化する子音等が発音された場合は、ブレスノイズと誤判定しないようにすることができる。これは、発音された音がタ行の無声化する子音等の場合、その後に続く母音が発話されるまでに間が空く場合が多いため、当該子音の区間が当該所定の閾値以下の場合は、息継ぎではなく、タ行の無声化する子音等が発音されたと考えられるためである。
この場合、判定部13は、処理対象の区間の時間長が所定の閾値(例えば、0.3秒)以下である場合、第2指標の値を小さな値(例えば、0)に決定してもよい。または、判定部13は、当該時間長が当該所定の閾値よりも小さいほど、第2指標の値をより小さな値に決定してもよい。
続いて、判定部13は、処理対象の区間における音の抑揚に基づいて、ブレスノイズらしさを示す第3指標の値を算出する(ステップS5)。ここで、判定部13は、例えば、処理対象の区間のうち中央部以外の部分の最大音量と、中央部の最低音量との比率に基づいて、当該処理対象の区間がブレスノイズであるか否かを判定してもよい。これにより、処理対象の区間の左側部の最大音量または右側部の最大音量と中央部の最低音量との比率が所定の閾値以上である場合(抑揚が有る場合)には、ブレスノイズと誤判定しないようにすることができる。
これは、息継ぎによる音(例えば、「ハアッ」という音)は、処理対象の区間における左側部の最大音量、及び右部側の最大音量よりも、中央部の最低音量の方が大きい場合が多い。一方、ささやき声や通常の声でセリフを発話している場合、処理対象の区間における左側部の最大音量、及び右部側の最大音量は、中央部の最低音量よりも大きい場合が多い。これは、ささやき声等で発話している場合でも、セリフが発話された場合は抑揚があるためである。
この場合、判定部13は、例えば、処理対象の区間を、左側部、中央部、右側部の3つの区間に分割する。なお、処理対象の区間の左端は、処理対象の区間の開始時点であり、処理対象の区間の右端は、処理対象の区間の終了時点である。そして、判定部13は、処理対象の区間の左側部の最大音量または右側部の最大音量と中央部の最低音量との比率(比の値)が所定の閾値以上である場合、第3指標の値を小さな値(例えば、0)に決定してもよい。
または、判定部13は、例えば、処理対象の区間の左側部の最大音量、及び右側部の最大音量と中央部の最低音量との比率が所定の閾値よりも大きいほど、第3指標の値をより小さな値に決定してもよい。
続いて、判定部13は、処理対象の区間における発音に基づいて、ブレスノイズらしさを示す第4指標の値を算出する(ステップS6)。ここで、判定部13は、例えば、処理対象の区間のうち、音声の振幅の値の正負が所定時間内に入れ替わった回数が第1閾値よりも大きい第2閾値以上である区間が存在する場合、当該処理対象の区間をブレスノイズらしさが低いと判定してもよい。これにより、「sh」、「th」、「ch」等の子音が発音されている場合、例えば、「チッ」や「クウッ」等が発音された場合は、ブレスノイズと誤判定しないようにすることができる。これは、ゼロクロス回数が非常に大きくなる「sh」、「th」、「ch」等の子音が息継ぎによって発音される場合は少ないためである。
この場合、判定部13は、例えば、処理対象の区間における左側部を、所定の時間長(例えば、0.1秒)の各区間に分割し、分割した各区間におけるゼロクロス回数をそれぞれ判定してもよい。そして、判定部13は、分割した各区間のゼロクロス回数のうち、最も大きいゼロクロス回数が所定の閾値(例えば、10000回/秒)以上である場合、第4指標の値を小さな値(例えば、0)に決定してもよい。または、判定部13は、例えば、当該最も大きいゼロクロス回数が当該所定の閾値よりも大きいほど、第4指標の値をより小さな値に決定してもよい。
続いて、判定部13は、処理対象の区間における音の声質に基づいて、ブレスノイズらしさを示す第5指標の値を算出する(ステップS7)。ここで、判定部13は、例えば、処理対象の区間の振幅の値の増減が所定時間内に入れ替わった回数が閾値以である区間が存在する場合、当該処理対象の区間をブレスノイズらしさが低いと判定してもよい。これにより、例えば、がらがら声(だみ声)で発話された場合に、ブレスノイズと誤判定しないようにすることができる。これは、がらがら声で母音が発話された場合、所定時間内のゼロクロス回数は、息継ぎによる音の場合と同程度となる場合が多いものの、がらがら声で母音が発話された場合、振幅の波形は息継ぎによる音の場合と比較して滑らかに増減するため、振幅の波形の上がり下がりの方向転換の回数が比較的少ない場合が多いためである。
この場合、判定部13は、例えば、処理対象の区間における振幅の値の増減が所定時間内に入れ替わった回数が所定の閾値以下である場合、第5指標の値を小さな値(例えば、0)に決定してもよい。または、判定部13は、例えば、振幅の値の増減が所定時間内に入れ替わった回数が閾値よりも小さいほど、第5指標の値をより小さな値に決定してもよい。
続いて、判定部13は、処理対象の区間における音の類似度に基づいて、ブレスノイズらしさを示す第6指標の値を算出する(ステップS8)。ここで、判定部13は、例えば、処理対象の区間に含まれる各区間のうち、類似度が閾値以上である複数の区間が存在する場合、当該処理対象の区間をブレスノイズらしさが低いと判定してもよい。これにより、処理対象の区間における音に音程が有る場合は、ブレスノイズと誤判定しないようにすることができる。これは、発話の音声には、それぞれの音程の推移が類似する複数の区間が存在する場合は多く、息継ぎによる音には、それぞれの音程の推移が類似する複数の区間が存在しない場合が多いためである。
この場合、判定部13は、例えば、処理対象の区間を、所定の時間長(例えば、0.1秒)の各区間に分割し、分割した各区間について、分割した各区間のうちの他の区間との類似度をそれぞれ算出してもよい。そして、判定部13は、最も高い類似度が閾値以上の場合、第6指標の値を小さな値(例えば、0)に決定してもよい。または、判定部13は、例えば、最も高い類似度が閾値よりも高いほど、第6指標の値をより小さな値に決定してもよい。
なお、判定部13は、例えば、第1区間と第2区間との類似度を、第1区間の振幅と、第2区間の振幅との差分の合計値に基づいて決定してもよい。この場合、判定部13は、例えば、第1区間の開始時点から終了時点までの各時点の波形の振幅と、第2区間の開始時点から終了時点までの各時点の波形の振幅との差分の合計値が大きい程、類似度の値が低く、当該合計値が小さい程、類似度の値が高いとしてもよい。
また、判定部13は、第1区間と第2区間との類似度を、検索区間の振幅の波形と、第1区間の振幅の波形との相関係数に基づいて決定してもよい。この場合、判定部13は、例えば、第1区間の開始時点から終了時点までの振幅の波形と、第2区間の開始時点から終了時点までの振幅の波形との相関係数を、類似度の値としてもよい。
続いて、判定部13は、処理対象の区間における波形の右下がり度に基づいて、ブレスノイズらしさを示す第7指標の値を算出する(ステップS9)。ここで、判定部13は、例えば、処理対象の区間の振幅の絶対値の所定時間の最大値が、当該処理対象の区間の中央部よりも前の時点から、時間の経過に伴って減少して行く場合、当該有音区間をブレスノイズらしさが低いと判定してもよい。これにより、例えば、演技の息の音の場合は、ブレスノイズと誤判定しないようにすることができる。
これは、息継ぎによる音(例えば、「ハアッ」という音)は、処理対象の区間において、左端から中央部にかけて振幅の絶対値が増加して行き、中央部から右端にかけて振幅の絶対値が減少して行く場合が多い。一方、息を飲む演技による音(例えば、「ハッ」という音)は、左端から比較的急激に振幅の絶対値が増加した後、右端にかけて振幅の絶対値が減少して行く場合が多いためである。
この場合、判定部13は、例えば、左側部から右端にかけて振幅の絶対値が減少して行く場合は、第7指標の値を小さな値(例えば、0)に決定してもよい。または、判定部13は、左側部から中央部にかけて振幅の絶対値が減少して行く度合いが高いほど、第7指標の値をより小さな値に決定してもよい。
続いて、判定部13は、処理対象の区間における波形の立ち上がり度に基づいて、ブレスノイズらしさを示す第8指標の値を算出する(ステップS10)。ここで、判定部13は、例えば、処理対象の区間のうち、所定時間内の振幅の絶対値の平均値が、所定時間以内に所定の閾値以上増加した区間が存在する場合、当該処理対象の区間をブレスノイズらしさが低いと判定してもよい。これは、処理対象の区間において、波形が略垂直に立ち上がっている区間があれば、息継ぎによる音ではないと考えられるためである。
この場合、判定部13は、例えば、処理対象の区間のうち、所定時間(例えば、10ms)内の振幅の絶対値の平均値が、所定時間(例えば、30ms)内に所定の閾値以上増加した場合は、第8指標の値を小さな値(例えば、0)に決定してもよい。または、判定部13は、所定時間(例えば、10ms)内の振幅の絶対値の平均値が、大きく増加するほど、第8指標の値をより小さな値に決定してもよい。
続いて、判定部13は、第1指標から第8指標までの各値に基づいて、処理対象の区間がブレスノイズの区間であるか否かを判定する(ステップS11)。ここで、判定部13は、例えば、第1指標から第8指標までの各値を乗算した値が閾値以上である場合、処理対象の区間がブレスノイズの区間であると判定し、当該値が閾値以上でない場合、処理対象の区間がブレスノイズの区間でないと判定してもよい。これにより、例えば、第1指標から第8指標のうち、1つでもブレスノイズらしさが0(ブレスノイズではない)と判定された指標があれば、ブレスノイズの区間でないと判定される。
続いて、修正部14は、ブレスノイズの区間であると判定された処理対象の区間を含む有音区間の音量を減衰させる(ステップS12)。ここで、図4の区間421が処理対象の区間とされ、ブレスノイズの区間であると判定された場合、修正部14は、区間421を含む有音区間である区間414の音量を減衰させる。この場合、修正部14は、例えば、当該有音区間の平均音量が所定の閾値(例えば、予め設定された、無音と判定できる音量)まで低下する減衰率を算出し、当該有音区間の各時点の音量を、当該減衰率で減衰させてもよい。これにより、ブレスノイズの区間が全くの無音とはならないため、ユーザへの違和感を低減できる。
<変形例>
情報処理装置10の各機能部は、例えば1以上のコンピュータにより構成されるクラウドコンピューティングにより実現されていてもよい。
以上、本発明の実施例について詳述したが、本発明は斯かる特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
10 情報処理装置
11 記憶部
12 取得部
13 判定部
14 修正部

Claims (11)

  1. 発話された音声の振幅に基づいて、ブレスノイズによる音の区間を判定する判定部と、
    判定されたブレスノイズが前記音声から除去されるように前記音声のデータを修正する修正部と、を有し、
    前記判定部は、前記音声の有音区間のうち中央部以外の部分の最大音量と、中央部の最低音量との比率に基づいて、当該有音区間がブレスノイズであるか否かを判定する、情報処理装置。
  2. 発話された音声の振幅に基づいて、ブレスノイズによる音の区間を判定する判定部と、
    判定されたブレスノイズが前記音声から除去されるように前記音声のデータを修正する修正部と、を有し、
    前記判定部は、前記音声の有音区間の振幅の値の増減が所定時間内に入れ替わった回数が閾値以下である区間が存在する場合、当該有音区間をブレスノイズらしさが低いと判定する、情報処理装置。
  3. 発話された音声の振幅に基づいて、ブレスノイズによる音の区間を判定する判定部と、
    判定されたブレスノイズが前記音声から除去されるように前記音声のデータを修正する修正部と、を有し、
    前記判定部は、前記音声の有音区間に含まれる各区間のうち、類似度が閾値以上である複数の区間が存在する場合、当該有音区間をブレスノイズらしさが低いと判定する、情報処理装置。
  4. 発話された音声の振幅に基づいて、ブレスノイズによる音の区間を判定する判定部と、
    判定されたブレスノイズが前記音声から除去されるように前記音声のデータを修正する修正部と、を有し、
    前記判定部は、前記音声の有音区間の振幅の絶対値の所定時間の最大値が、当該有音区間の中央部よりも前の時点から、時間の経過に伴って減少して行く場合、当該有音区間をブレスノイズらしさが低いと判定する、情報処理装置。
  5. 発話された音声の振幅に基づいて、ブレスノイズによる音の区間を判定する判定部と、
    判定されたブレスノイズが前記音声から除去されるように前記音声のデータを修正する修正部と、を有し、
    前記判定部は、前記音声の有音区間のうち、所定時間内の振幅の絶対値の平均値が、所定時間以内に所定の閾値以上増加した区間が存在する場合、当該有音区間をブレスノイズらしさが低いと判定する、情報処理装置。
  6. 前記判定部は、前記音声の有音区間のうち、前記音声の振幅の値の正負が所定時間内に入れ替わった回数が第1閾値未満である区間が存在する場合、当該有音区間をブレスノイズらしさが低いと判定する、
    請求項1から5のいずれか一項に記載の情報処理装置。
  7. 前記判定部は、前記音声の有音区間のうち、前記音声の振幅の値の正負が所定時間内に入れ替わった回数が前記第1閾値よりも大きい第2閾値以上である区間が存在する場合、当該有音区間をブレスノイズらしさが低いと判定する、
    請求項6に記載の情報処理装置。
  8. 前記判定部は、前記音声の有音区間のうち、所定時間当たりの振幅の絶対値の平均値が所定の閾値以上の区間の時間長に基づいて、当該有音区間がブレスノイズであるか否かを判定する、
    請求項1から7のいずれか一項に記載の情報処理装置。
  9. 前記判定部は、前記音声の有音区間のうち、所定時間当たりの振幅の絶対値の平均値が所定の閾値以上の区間の音声の振幅に基づいて、ブレスノイズによる音の区間を判定し、
    前記修正部は、判定されたブレスノイズによる音の区間を含む前記音声の有音区間の音量を減衰させる、
    請求項1から8のいずれか一項に記載の情報処理装置。
  10. 情報処理装置が、発話された音声の振幅に基づいて、ブレスノイズによる音の区間を判定する処理と、判定されたブレスノイズが前記音声から除去されるように前記音声のデータを修正する処理と、を実行し、
    前記判定する処理は、前記音声の有音区間のうち中央部以外の部分の最大音量と、中央部の最低音量との比率に基づいて、当該有音区間がブレスノイズであるか否かを判定する処理を含む、情報処理方法。
  11. 情報処理装置に、
    発話された音声の振幅に基づいて、ブレスノイズによる音の区間を判定する処理と、
    判定されたブレスノイズが前記音声から除去されるように前記音声のデータを修正する処理と、を実行させ、
    前記判定する処理は、前記音声の有音区間のうち中央部以外の部分の最大音量と、中央部の最低音量との比率に基づいて、当該有音区間がブレスノイズであるか否かを判定する処理を含む、プログラム。
JP2019145621A 2019-08-07 2019-08-07 情報処理装置、情報処理方法、及びプログラム Active JP7458720B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019145621A JP7458720B2 (ja) 2019-08-07 2019-08-07 情報処理装置、情報処理方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019145621A JP7458720B2 (ja) 2019-08-07 2019-08-07 情報処理装置、情報処理方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2021026150A JP2021026150A (ja) 2021-02-22
JP7458720B2 true JP7458720B2 (ja) 2024-04-01

Family

ID=74662342

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019145621A Active JP7458720B2 (ja) 2019-08-07 2019-08-07 情報処理装置、情報処理方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP7458720B2 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007002393A (ja) 2005-05-26 2007-01-11 Yamaha Motor Co Ltd 消音ヘルメット、これを備えた車両システム、およびヘルメット内騒音消音方法
JP2008505356A (ja) 2004-06-30 2008-02-21 モトローラ・インコーポレイテッド 通信システムの吸気ノイズを検出して減衰させる方法及び装置
JP2014063018A (ja) 2012-09-21 2014-04-10 Systec:Kk 極微小音声入力装置
US20140142933A1 (en) 2012-11-22 2014-05-22 Hon Hai Precision Industry Co., Ltd. Device and method for processing vocal signal

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3096880B2 (ja) * 1994-05-18 2000-10-10 長野日本無線株式会社 音声信号処理方法及び装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008505356A (ja) 2004-06-30 2008-02-21 モトローラ・インコーポレイテッド 通信システムの吸気ノイズを検出して減衰させる方法及び装置
JP2007002393A (ja) 2005-05-26 2007-01-11 Yamaha Motor Co Ltd 消音ヘルメット、これを備えた車両システム、およびヘルメット内騒音消音方法
JP2014063018A (ja) 2012-09-21 2014-04-10 Systec:Kk 極微小音声入力装置
US20140142933A1 (en) 2012-11-22 2014-05-22 Hon Hai Precision Industry Co., Ltd. Device and method for processing vocal signal

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Dima Ruinskiy et al.,"An Effective Algorithm for Automatic Detection and Exact Demarcation of Breath Sounds in Speech and Song Signals",IEEE Transactions on Audio, Speech and Language Processing,2007年03月,Vol. 15, No. 3,p.838-850

Also Published As

Publication number Publication date
JP2021026150A (ja) 2021-02-22

Similar Documents

Publication Publication Date Title
JP6024180B2 (ja) 音声認識装置、音声認識方法、及びプログラム
US9251789B2 (en) Speech-recognition system, storage medium, and method of speech recognition
TWI312500B (en) Method of varying speech speed
JP5593244B2 (ja) 話速変換倍率決定装置、話速変換装置、プログラム、及び記録媒体
US9355634B2 (en) Voice synthesis device, voice synthesis method, and recording medium having a voice synthesis program stored thereon
JP5638479B2 (ja) 書き起こし支援システムおよび書き起こし支援方法
JP2009265276A (ja) 支援装置、プログラムおよび支援方法
CN107610691B (zh) 英语元音发声纠错方法及装置
JP7458720B2 (ja) 情報処理装置、情報処理方法、及びプログラム
JP5293478B2 (ja) 音声認識用の閾値管理プログラム、音声認識用の閾値管理方法、音声認識装置
JP2011075622A (ja) 音響モデル適応装置、その方法、プログラム、及び記録媒体
JP2020067531A (ja) プログラム、情報処理方法、及び情報処理装置
JP6314884B2 (ja) 音読評価装置、音読評価方法、及びプログラム
JP2008175851A (ja) 録音時間算出装置、発音練習装置および録音時間算出方法、発音練習処理方法、ならびにそのプログラム、電子辞書
JP5152020B2 (ja) 音声認識装置及び音声認識方法
JP2006010739A (ja) 音声認識装置
JP7345288B2 (ja) 情報処理装置、情報処理方法、及びプログラム
JP2006154531A (ja) 音声速度変換装置、音声速度変換方法、および音声速度変換プログラム
JP5962925B2 (ja) 音声合成装置、楽曲再生装置、音声合成プログラム及び楽曲再生プログラム
JP6903613B2 (ja) 音声認識装置、音声認識方法及びプログラム
Chen Evidence for the role of gestural overlap in consonant place assimilation
US20140185830A1 (en) Methods, systems, and apparatus for audio backtracking control
JP2008268358A (ja) カラオケ装置、歌唱評価方法およびプログラム
JP2018189760A (ja) 歌唱難易度の評価方法及び評価システム
JP2017122880A (ja) 音読評価装置、表示制御方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220713

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230531

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230613

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230810

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20231011

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231114

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231212

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240312

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240319

R150 Certificate of patent or registration of utility model

Ref document number: 7458720

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150