JPS597120B2 - 音声分析装置 - Google Patents
音声分析装置Info
- Publication number
- JPS597120B2 JPS597120B2 JP53145084A JP14508478A JPS597120B2 JP S597120 B2 JPS597120 B2 JP S597120B2 JP 53145084 A JP53145084 A JP 53145084A JP 14508478 A JP14508478 A JP 14508478A JP S597120 B2 JPS597120 B2 JP S597120B2
- Authority
- JP
- Japan
- Prior art keywords
- pitch period
- measuring
- autocorrelation coefficient
- power
- period
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 238000005070 sampling Methods 0.000 claims 3
- 238000000605 extraction Methods 0.000 abstract description 9
- 238000005259 measurement Methods 0.000 description 14
- 230000005540 biological transmission Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 9
- 230000007704 transition Effects 0.000 description 8
- 230000008054 signal transmission Effects 0.000 description 6
- 230000000630 rising effect Effects 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000000034 method Methods 0.000 description 3
- 230000003111 delayed effect Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
Description
【発明の詳細な説明】
5 本発明は音声の自己相関係数列の最大値を検索する
ことによりピッチ周期を計測する、特に有声音立上り部
分において優れたピッチ抽出特性を有する音声分析装置
に係る。
ことによりピッチ周期を計測する、特に有声音立上り部
分において優れたピッチ抽出特性を有する音声分析装置
に係る。
音声のピッチ周期情報及び有声無声判別情報は、0 音
声分析合成系等において極めて重要な情報であり、これ
らの情報の分析結果が合成側における合成音声の音質に
多大な影響を与える。
声分析合成系等において極めて重要な情報であり、これ
らの情報の分析結果が合成側における合成音声の音質に
多大な影響を与える。
音声のピッチ周期を精密に計測する方法として、音声波
形の自己相関係数列を計測し、前記自己相フ 関係数列
の最大値(以下ρMAXと云う)を検索しρMAXに対
応する自己相関係数の遅れ時間をピッチ周期とする方法
が知られている。
形の自己相関係数列を計測し、前記自己相フ 関係数列
の最大値(以下ρMAXと云う)を検索しρMAXに対
応する自己相関係数の遅れ時間をピッチ周期とする方法
が知られている。
又、前記ρMAXは有声無声判別における有力なパラメ
ータとして使用されて(・る。フ 従来、音声の自己相
関係数を計測する場合に゜よ、次式が広く用いられてい
る。
ータとして使用されて(・る。フ 従来、音声の自己相
関係数を計測する場合に゜よ、次式が広く用いられてい
る。
ゞ −1N−1
Σ Xi2)・( Σ xl2+τ)
i■ 0i=0
Xiは第i番目の標本化音声、Xi+τはXiからτだ
け遅れた標本化音声である。
け遅れた標本化音声である。
音声のピツチ周期のほとんどは2mSECから18mS
EC程度の範囲に分布することが知られている。上記の
式においてNは最大ピツチ周期(例えば18mSEC)
程度に相当するサンプル数に設定されることが多い。従
つてX。とXi+τとの最大時間間隔は例えば36mS
EC程度となる。従来の音声の自己相関係数を計測する
方法によるピツチ抽出方法は有声音定常部等の比較的に
長時間にわたり音声波形の周期性が保障され得る場合に
は極めて安定にピツチ周期を計測し得る。
EC程度の範囲に分布することが知られている。上記の
式においてNは最大ピツチ周期(例えば18mSEC)
程度に相当するサンプル数に設定されることが多い。従
つてX。とXi+τとの最大時間間隔は例えば36mS
EC程度となる。従来の音声の自己相関係数を計測する
方法によるピツチ抽出方法は有声音定常部等の比較的に
長時間にわたり音声波形の周期性が保障され得る場合に
は極めて安定にピツチ周期を計測し得る。
しかしながら従来の音声の自己相関係数を計測する方法
は、無声音部から有声音部への渡り区間、もしくは前記
渡り区間直後の有声音の立上り部分においては音声波形
の周期性が弱く、ピツチ周期の計測結果が不精密となる
ことが多い。本発明の目的は、無声音部から有声音部へ
の渡り区間、もしくは前記渡り区間直後の有声音の立上
り部分等において、正確にピツチ周期を計測し得るピツ
チ抽出装置を提供することにある。
は、無声音部から有声音部への渡り区間、もしくは前記
渡り区間直後の有声音の立上り部分においては音声波形
の周期性が弱く、ピツチ周期の計測結果が不精密となる
ことが多い。本発明の目的は、無声音部から有声音部へ
の渡り区間、もしくは前記渡り区間直後の有声音の立上
り部分等において、正確にピツチ周期を計測し得るピツ
チ抽出装置を提供することにある。
本発明は、少なくとも時間的に前向きに計測される自己
相関係数列と時間的に後向きに計測される自己相関係数
列とのどちらの自己相関係数列をも計測する手段を有し
、更に前記2つの自己相関係数列のうちのどちらの自己
相関係数列をピツチ周期の計測を行なうためのパラメー
タとして用いるかを判断するために、音声の電力増加率
が一定値以上であるか否かを判別する手段、もしくは前
記2つの自己相関係数列から別々に計測される2つのρ
MAXの大小関係を比較する手段を有している。本発明
の特徴は時間的に前向きに計測される自己相関係数列と
時間的に後向きに計測される自己相関係数列との2つの
自己相関係数列を用いてピツチ抽出を行なうことにある
。
相関係数列と時間的に後向きに計測される自己相関係数
列とのどちらの自己相関係数列をも計測する手段を有し
、更に前記2つの自己相関係数列のうちのどちらの自己
相関係数列をピツチ周期の計測を行なうためのパラメー
タとして用いるかを判断するために、音声の電力増加率
が一定値以上であるか否かを判別する手段、もしくは前
記2つの自己相関係数列から別々に計測される2つのρ
MAXの大小関係を比較する手段を有している。本発明
の特徴は時間的に前向きに計測される自己相関係数列と
時間的に後向きに計測される自己相関係数列との2つの
自己相関係数列を用いてピツチ抽出を行なうことにある
。
次に本発明の実施例を図面を参照して詳細に説明する。
第1図は第1の実施例を詳細に説明するためのプロツク
図である。
図である。
波形入力端子101を介して標本化音声波形列が電力増
加率計測器102と一時記憶103とべ供給される。電
力増加率計測器102は音声の電力増加率を計測し、前
記電力増加率が予め設定された値以上である場合には自
己相関係数計測制御信号を例えば1にし、前記電力増加
率が予め設定された値未満である場合には自己相関係数
計測制御信号を例えばOにする。更に電力増加率計測器
102は前記自己相関係数計測制御信号を制御信号伝送
路104を介して自己相関係数計測器106へ供給する
。次に他のプロツク図を参照して電力増加率計測器10
2を更に詳細に説明する。
加率計測器102と一時記憶103とべ供給される。電
力増加率計測器102は音声の電力増加率を計測し、前
記電力増加率が予め設定された値以上である場合には自
己相関係数計測制御信号を例えば1にし、前記電力増加
率が予め設定された値未満である場合には自己相関係数
計測制御信号を例えばOにする。更に電力増加率計測器
102は前記自己相関係数計測制御信号を制御信号伝送
路104を介して自己相関係数計測器106へ供給する
。次に他のプロツク図を参照して電力増加率計測器10
2を更に詳細に説明する。
第2図は電力増加率計測器102を更に詳細に説明する
ためのプロツク図である。第2図に於いて、一点鎖線2
01で囲まれた部分は電力増加率計測器102の構成範
囲を示す。波形入力端子101を介して標本化音声波形
列が一時記憶器202へ供給される。
ためのプロツク図である。第2図に於いて、一点鎖線2
01で囲まれた部分は電力増加率計測器102の構成範
囲を示す。波形入力端子101を介して標本化音声波形
列が一時記憶器202へ供給される。
一時記憶器202は前記標本化音声波形列を一時的に記
憶し、フレーム周期信号発生器203から供給されるフ
レーム信号により前記標本化音声波形列を電力計測器2
04へ出力する。電力計測器204は一時記憶器202
から供給されるフレーム周期毎に切出される標本化音声
信号の電力を計測し計測結果を電力記憶器205と電力
増加率判別器206とへ前記計測結果を出力する。電力
記憶器205は電力計測器204により計測された電力
値を一時的に記憶し、フレーム周期信号発生器203か
ら供給されるフレーム信号により前記計測値を電力増加
率判別器206へ出力する。電力増加率判別器206は
電力計測器204から供給される現在のフレームの電力
値(以下電力1と云う)と電力記憶器205から供給さ
れる直前のフレームの電力値(以下電力2と云う)とか
ら自己相関係数計測制御信号Scを次式により決定する
。
憶し、フレーム周期信号発生器203から供給されるフ
レーム信号により前記標本化音声波形列を電力計測器2
04へ出力する。電力計測器204は一時記憶器202
から供給されるフレーム周期毎に切出される標本化音声
信号の電力を計測し計測結果を電力記憶器205と電力
増加率判別器206とへ前記計測結果を出力する。電力
記憶器205は電力計測器204により計測された電力
値を一時的に記憶し、フレーム周期信号発生器203か
ら供給されるフレーム信号により前記計測値を電力増加
率判別器206へ出力する。電力増加率判別器206は
電力計測器204から供給される現在のフレームの電力
値(以下電力1と云う)と電力記憶器205から供給さ
れる直前のフレームの電力値(以下電力2と云う)とか
ら自己相関係数計測制御信号Scを次式により決定する
。
但しaは零又は正の定数である。更に電力増加率判別器
206は決定された自己相関係数計測制御信号を制御信
号伝送路104へ出力する。再び第1図に戻つて第1の
実施例の説明を継続する。
206は決定された自己相関係数計測制御信号を制御信
号伝送路104へ出力する。再び第1図に戻つて第1の
実施例の説明を継続する。
一時記憶器103は波形入力端子101を介して供給さ
れる標本化音声波形列を一時的に記憶し、前記標本化音
声波形列を周期的に切出し、更に前記切出された標本化
音声波形列を波形伝送路105へ出力する。自己相関係
数計測器106は制御信号伝送路104を介して供給さ
れる自己相関係数計測制御信号がOである場合には、波
形を用いて計測する。但しτは遅れ時間、XN−1−1
は第N−1−1番目の標本化音声、XN−1−1−τは
XN−,−1からτだけ進んだ標本化音声である。更に
自己相関係数計測器106は計測した自己相関係数列を
最大値検索器107へ出力する。最大値検索器107は
自己相関係数計測器106より供給された自己相関係数
列より最大値ρMAXを検索し、前記ρMAXをρMA
X端子109へ出力する。更に最大値検索器107は前
記ρMAXに対応する遅れ時間Tをピツチ同期としてピ
ツチ周期出力端子108へ出力する。なお、第1の実施
例はρMAX出力端子109を削除しても構成し得る。
れる標本化音声波形列を一時的に記憶し、前記標本化音
声波形列を周期的に切出し、更に前記切出された標本化
音声波形列を波形伝送路105へ出力する。自己相関係
数計測器106は制御信号伝送路104を介して供給さ
れる自己相関係数計測制御信号がOである場合には、波
形を用いて計測する。但しτは遅れ時間、XN−1−1
は第N−1−1番目の標本化音声、XN−1−1−τは
XN−,−1からτだけ進んだ標本化音声である。更に
自己相関係数計測器106は計測した自己相関係数列を
最大値検索器107へ出力する。最大値検索器107は
自己相関係数計測器106より供給された自己相関係数
列より最大値ρMAXを検索し、前記ρMAXをρMA
X端子109へ出力する。更に最大値検索器107は前
記ρMAXに対応する遅れ時間Tをピツチ同期としてピ
ツチ周期出力端子108へ出力する。なお、第1の実施
例はρMAX出力端子109を削除しても構成し得る。
次に第1の実施例における自己相関係数計測器106に
より計測される自己相関係数列の性質について波形図を
参照しながら詳細に説明する。
より計測される自己相関係数列の性質について波形図を
参照しながら詳細に説明する。
第3図は音声波形の一例であり、無声音と有声音との過
渡的な状態における模形化された音声波形図である。第
3図に於いて301は音声波形、302は直前の分析フ
レーム、303は現在の分析フレームである。
渡的な状態における模形化された音声波形図である。第
3図に於いて301は音声波形、302は直前の分析フ
レーム、303は現在の分析フレームである。
今、直前の分析フレーム302における平均電力に対し
、現在の分析フレーム303における平均電力の増加率
が予じめ設定された増加率を越えていると仮定する。現
在の分析フレーム303に於いては自己相関係数は時間
的に後向きに計測され、その計測結果は例えば第4図a
中の401になる。現在の分析フレーム303に於いて
仮に自己相関係数を時間的に前向きに計測すると、※伝
送路105を介して供給される標本化音声波形列から時
間的に前向きに自己相関係数ρ(τ)を例えば次式を用
いて計測する。
、現在の分析フレーム303における平均電力の増加率
が予じめ設定された増加率を越えていると仮定する。現
在の分析フレーム303に於いては自己相関係数は時間
的に後向きに計測され、その計測結果は例えば第4図a
中の401になる。現在の分析フレーム303に於いて
仮に自己相関係数を時間的に前向きに計測すると、※伝
送路105を介して供給される標本化音声波形列から時
間的に前向きに自己相関係数ρ(τ)を例えば次式を用
いて計測する。
値しτは遅れ時間、Xiは第i番目の標本化音声、Xi
+τはXiからτだけ遅れた標本化音声である。又、自
己相関係数計測器106は前記自己相関係数計測制御信
号が1である場合には波形伝送路105を介して供給さ
れる標本化音声波形列から時間的に後向きに自己相関係
数ρ(τ)を例えば次式し、前記切出された波形列を第
1自己相関計測器603と第2自己相関計測器604と
へ出力する。
+τはXiからτだけ遅れた標本化音声である。又、自
己相関係数計測器106は前記自己相関係数計測制御信
号が1である場合には波形伝送路105を介して供給さ
れる標本化音声波形列から時間的に後向きに自己相関係
数ρ(τ)を例えば次式し、前記切出された波形列を第
1自己相関計測器603と第2自己相関計測器604と
へ出力する。
第1自己相関計測器603は切出された波形列から時間
的に前向きに自己相関係図を計測し、更に前記自己相関
係数の最大値ρMAXlを検索し、前記ρMAXlに対
応する遅れ時間をピツチ周期候補1と決定する。更に第
1自己相関計測器603は前記ρMAXlをρMAXl
伝送路605へ、前記ピツチ周期候補1をピツチ周期候
補1伝送路606へ出力する。第2自己相関計測器60
4は一時記憶器602により切出された波形列から時間
的に後向きに自己相関係数を計測し、前記第1自己相関
計測器603と同様の動作により自己相関係数の最大値
ρMAX2をρMAX2伝送路607へ、ピツチ周期候
補2をピツチ周期候補2伝送路608へ出力する。
的に前向きに自己相関係図を計測し、更に前記自己相関
係数の最大値ρMAXlを検索し、前記ρMAXlに対
応する遅れ時間をピツチ周期候補1と決定する。更に第
1自己相関計測器603は前記ρMAXlをρMAXl
伝送路605へ、前記ピツチ周期候補1をピツチ周期候
補1伝送路606へ出力する。第2自己相関計測器60
4は一時記憶器602により切出された波形列から時間
的に後向きに自己相関係数を計測し、前記第1自己相関
計測器603と同様の動作により自己相関係数の最大値
ρMAX2をρMAX2伝送路607へ、ピツチ周期候
補2をピツチ周期候補2伝送路608へ出力する。
比較器609はρMAXl伝送路605を介して供給さ
れるρMAXlとρMAX2伝送路607を介して供給
される。
れるρMAXlとρMAX2伝送路607を介して供給
される。
ρMAX2との大小関係を比較し、ρMAXl〉ρMA
X2ならばρMAX=ρMAXlと決定し)ρMAXl
くρMAX2ならばρMAX一ρMAX2と決定し、前
記決定されたρMAXをρMAX出力端子613へ出力
する。更に比較器609はρMAXl〉ρMAX2なら
ば切換信号を0FFとし、ρMAXlくρMAX2なら
ば切換信号を0Nと決定し、前記切換信号を切換信号伝
送路610へ出力する。切換器611は切換信号伝送路
610を介して供給される切換信号が0FFであればピ
ツチ周期候補1伝送路606をピツチ周期出力端子61
2へ接続し、前記切換信号が0Nであればピツチ周期候
補2伝送路608をピッチ周期出力端子612へ接続す
る。この第3の実施例は例えば第3図における303の
入力波形列に対し第1の発明と同様に、より明確にピツ
チ周期を抽出し得ることは明らかである。
X2ならばρMAX=ρMAXlと決定し)ρMAXl
くρMAX2ならばρMAX一ρMAX2と決定し、前
記決定されたρMAXをρMAX出力端子613へ出力
する。更に比較器609はρMAXl〉ρMAX2なら
ば切換信号を0FFとし、ρMAXlくρMAX2なら
ば切換信号を0Nと決定し、前記切換信号を切換信号伝
送路610へ出力する。切換器611は切換信号伝送路
610を介して供給される切換信号が0FFであればピ
ツチ周期候補1伝送路606をピツチ周期出力端子61
2へ接続し、前記切換信号が0Nであればピツチ周期候
補2伝送路608をピッチ周期出力端子612へ接続す
る。この第3の実施例は例えば第3図における303の
入力波形列に対し第1の発明と同様に、より明確にピツ
チ周期を抽出し得ることは明らかである。
なお第3の発明はρMAX出力端子613を削除しても
構成し得る。第7図は第4の実施例を詳細に説明するた
めのプロツク図である。
構成し得る。第7図は第4の実施例を詳細に説明するた
めのプロツク図である。
第7図において701は第3の発明によるピツチ抽出装
置全体であり、613はρMAX出力端子である。波形
入力端子601を介して標本化音声波形列がピツチ抽出
装置701へ供給される。ピツチ抽出装置701は供給
された標本化音声波形列から自己相関係数の最大値ρM
AXを計測し、計測結果をρMAX出力端子613を介
して有声無声判別器702へ出力する。有声無声判別器
702は前記ρMAXから有声か無声かを決定し、決定
結果を有声無声判別信号出力端子703へ出力する。尚
、上述した無声音部から有声音部への渡り区間、もしく
は前記渡り区間直後の有声音の立上り部分等において、
ρMAXを適宜に前向きもしくは後向きに計測しピツチ
周期を計測し、あるいは更に前記ρMAXを用いて有声
無声を判別することにより、従来の方法と比較して、ピ
ツチ周期計測精度もしくは有声無声判別率が大きく改善
されることが確認されている。
置全体であり、613はρMAX出力端子である。波形
入力端子601を介して標本化音声波形列がピツチ抽出
装置701へ供給される。ピツチ抽出装置701は供給
された標本化音声波形列から自己相関係数の最大値ρM
AXを計測し、計測結果をρMAX出力端子613を介
して有声無声判別器702へ出力する。有声無声判別器
702は前記ρMAXから有声か無声かを決定し、決定
結果を有声無声判別信号出力端子703へ出力する。尚
、上述した無声音部から有声音部への渡り区間、もしく
は前記渡り区間直後の有声音の立上り部分等において、
ρMAXを適宜に前向きもしくは後向きに計測しピツチ
周期を計測し、あるいは更に前記ρMAXを用いて有声
無声を判別することにより、従来の方法と比較して、ピ
ツチ周期計測精度もしくは有声無声判別率が大きく改善
されることが確認されている。
例えば英語を母国語とする男声話者が発声した英語文章
による本発明者の実測データによれば、音声の電力増加
率が0.6dB/MSEC以上の場合にはρMAXを時
間的に後向きに0.6dB/MSEC未満の場合にはρ
MAXを時間的に前向きに計測しピツチ周期を計測し、
更に前記ρMAXを用いて有声無声を判別すると、無声
音部から有声音部への渡り区間および前記渡り区間直後
の有声音の立上り部分におけるピツチ周期計測誤りと有
声無声判別誤りとが、従来の方法と比較して、それぞれ
55%から19%へ(ピツチ周期の場合)、20%から
1.5%へ(有声無声判別の場合)減少することが確認
された。また、音声の電力増加率が0dB/MSEC以
上の場合、つまり音声の電力が増加中の場合には、ρM
AXを時間的に後向きに、0dB/MSEC未満の場合
、つまり音声の電力が減少中の場合にはρMAXを時間
的に前向きに計測しピツチ周期を計測し、更に前記ρM
AXを用いて有声無声を判別すると、上記電力増加率の
しきい値を0.6dB/MSECとしたときとほぼ用等
の効果があることが別途確認された。
による本発明者の実測データによれば、音声の電力増加
率が0.6dB/MSEC以上の場合にはρMAXを時
間的に後向きに0.6dB/MSEC未満の場合にはρ
MAXを時間的に前向きに計測しピツチ周期を計測し、
更に前記ρMAXを用いて有声無声を判別すると、無声
音部から有声音部への渡り区間および前記渡り区間直後
の有声音の立上り部分におけるピツチ周期計測誤りと有
声無声判別誤りとが、従来の方法と比較して、それぞれ
55%から19%へ(ピツチ周期の場合)、20%から
1.5%へ(有声無声判別の場合)減少することが確認
された。また、音声の電力増加率が0dB/MSEC以
上の場合、つまり音声の電力が増加中の場合には、ρM
AXを時間的に後向きに、0dB/MSEC未満の場合
、つまり音声の電力が減少中の場合にはρMAXを時間
的に前向きに計測しピツチ周期を計測し、更に前記ρM
AXを用いて有声無声を判別すると、上記電力増加率の
しきい値を0.6dB/MSECとしたときとほぼ用等
の効果があることが別途確認された。
なお電力が増加中の場合には時間的に後向きに計測され
たρMAXは時間的に前向きに計測されたρMAXより
殆んどの場合に大きな値を示し、電力が減少中の場合に
は時間的に前向きに計測されたρMAXは時間的に後向
きに計測されたρMAXより殆んどの場合に大きな値を
示すことが経験的に知られている。以上述べた様に本発
明は特に無声音と有声音との過渡部等に於いて正確にピ
ツチ周期を抽出し得るという第1の効果があり、前記過
渡部をより有声に有利に判別する。通常有声音と無声音
との混合波形は、有声音として取扱う場合には無声音と
して取扱かう場合と比較して音声分析合成等において良
好な合成音が得られる。従つて本発明は例えば音声分析
合成等に適用することにより、より良好な合成音声を得
ることができるという第2の効果がある。
たρMAXは時間的に前向きに計測されたρMAXより
殆んどの場合に大きな値を示し、電力が減少中の場合に
は時間的に前向きに計測されたρMAXは時間的に後向
きに計測されたρMAXより殆んどの場合に大きな値を
示すことが経験的に知られている。以上述べた様に本発
明は特に無声音と有声音との過渡部等に於いて正確にピ
ツチ周期を抽出し得るという第1の効果があり、前記過
渡部をより有声に有利に判別する。通常有声音と無声音
との混合波形は、有声音として取扱う場合には無声音と
して取扱かう場合と比較して音声分析合成等において良
好な合成音が得られる。従つて本発明は例えば音声分析
合成等に適用することにより、より良好な合成音声を得
ることができるという第2の効果がある。
第1図、第5図、第6図および第7図は本発明の実施例
を示すプロツク図、第2図は電力増加率計測器のプロツ
ク図、第3図および第4図A,bは本発明の実施例を説
明するための波形図である。 102・・・・・・電力増加率計測器、103,202
,602・・・・・・一時記憶器、104・・・・・・
制御信号伝送路、105・・・・・・波形伝送路、10
6・・・・・伯己相関係数計測器、107・・・・・・
最大値検索器、108・・・・・・ピツチ周期出力端子
、109・・・・・・ρMAX出力端子、203・・・
・・・フレーム周期信号発生器、204・・・・・・電
力計測器、205・・・・・・電力記憶器、206・・
・・・・電力増加率判別器、301・・・・・・音声波
形、302・・・・・・直前の分析フレーム、303・
・・・・・現在の分析フレーム、401・・・・・・時
間的に後向きに計測された自己相関係数列、402・・
・・・・時間的に前向きに計測された自己相関係数列、
501,701・・・・・・ピツチ抽出装置、502,
702・・・・・・有声無声判別器、603・・・・・
・第1自己相関計測器、604・・・・・・第2自己相
関計測器、609・・・・・・比較器、611・・・・
・・切換器。
を示すプロツク図、第2図は電力増加率計測器のプロツ
ク図、第3図および第4図A,bは本発明の実施例を説
明するための波形図である。 102・・・・・・電力増加率計測器、103,202
,602・・・・・・一時記憶器、104・・・・・・
制御信号伝送路、105・・・・・・波形伝送路、10
6・・・・・伯己相関係数計測器、107・・・・・・
最大値検索器、108・・・・・・ピツチ周期出力端子
、109・・・・・・ρMAX出力端子、203・・・
・・・フレーム周期信号発生器、204・・・・・・電
力計測器、205・・・・・・電力記憶器、206・・
・・・・電力増加率判別器、301・・・・・・音声波
形、302・・・・・・直前の分析フレーム、303・
・・・・・現在の分析フレーム、401・・・・・・時
間的に後向きに計測された自己相関係数列、402・・
・・・・時間的に前向きに計測された自己相関係数列、
501,701・・・・・・ピツチ抽出装置、502,
702・・・・・・有声無声判別器、603・・・・・
・第1自己相関計測器、604・・・・・・第2自己相
関計測器、609・・・・・・比較器、611・・・・
・・切換器。
Claims (1)
- 【特許請求の範囲】 1 音声波形を所定の時間間隔でサンプリングする手段
と、このサンプリングされた音声波形の電力を計測する
手段と、この計測された電力の増加率を計測する手段と
、前記サンプリングされた音声波形から自己相関係数列
を時間的に前向きに計測する第1の計測手段と、前記サ
ンプリングされた音声波形から自己相関係数列を時間的
に後向きに計測する第2の計測手段と、前記電力の増加
率が予め定めた値以上であるときには前記第2の計測手
段の出力を、前記電力の増加率が予め定めた値以下であ
るときには前記第1の計測手段の出力を取り出す手段と
、この手段の出力から得られる自己相関係数列の最大値
となる遅れ時間からピッチ周期を計測する手段を備えて
成ることを特徴とする音声分析装置。 2 音声波形を所定の時間間隔でサンプリングするサン
プリング手段と、このサンプリングされた音声波形から
自己相関係数列を時間的に前向きに計測する第1の計測
手段と、前記サンプリングされた音声波形から自己相関
係数列を時間的に後向きに計測する第2の計測手段と、
前記第1の計測手段から前記係数列の最大値を検索し、
この最大値に対応する遅れ時間を第1のピッチ周期候補
として出力する第1のピッチ周期出力手段と、前記第2
の計測手段から前記係数列の最大値を検索し、この最大
値に対応する遅れ時間を第2のピッチ周期候補として出
力する第2のピッチ周期出力手段と、前記第1のピッチ
周期候補と第2のピッチ周期候補を比較し大きい方のピ
ッチ周期候補をピッチ周期として出力する手段を備えて
成ることを特徴とする音声分析装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP53145084A JPS597120B2 (ja) | 1978-11-24 | 1978-11-24 | 音声分析装置 |
CA340,486A CA1127765A (en) | 1978-11-24 | 1979-11-23 | Speech analyzer comprising circuits for calculating autocorrelation coefficients forwardly and backwardly |
US06/097,283 US4282405A (en) | 1978-11-24 | 1979-11-26 | Speech analyzer comprising circuits for calculating autocorrelation coefficients forwardly and backwardly |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP53145084A JPS597120B2 (ja) | 1978-11-24 | 1978-11-24 | 音声分析装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS5570900A JPS5570900A (en) | 1980-05-28 |
JPS597120B2 true JPS597120B2 (ja) | 1984-02-16 |
Family
ID=15377004
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP53145084A Expired JPS597120B2 (ja) | 1978-11-24 | 1978-11-24 | 音声分析装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US4282405A (ja) |
JP (1) | JPS597120B2 (ja) |
CA (1) | CA1127765A (ja) |
Families Citing this family (196)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5768898A (en) * | 1980-10-18 | 1982-04-27 | Hitachi Ltd | Pitch period extracting device for voice signal |
US4489435A (en) * | 1981-10-05 | 1984-12-18 | Exxon Corporation | Method and apparatus for continuous word string recognition |
US4481593A (en) * | 1981-10-05 | 1984-11-06 | Exxon Corporation | Continuous speech recognition |
US4489434A (en) * | 1981-10-05 | 1984-12-18 | Exxon Corporation | Speech recognition method and apparatus |
US4544919A (en) * | 1982-01-03 | 1985-10-01 | Motorola, Inc. | Method and means of determining coefficients for linear predictive coding |
US4520499A (en) * | 1982-06-25 | 1985-05-28 | Milton Bradley Company | Combination speech synthesis and recognition apparatus |
US4561102A (en) * | 1982-09-20 | 1985-12-24 | At&T Bell Laboratories | Pitch detector for speech analysis |
JPS5975297A (ja) * | 1982-10-25 | 1984-04-27 | 松下電器産業株式会社 | ピツチ抽出方法 |
JPS59113500A (ja) * | 1982-12-20 | 1984-06-30 | 電子計算機基本技術研究組合 | 相関関数計算装置 |
AU566370B2 (en) * | 1983-01-03 | 1987-10-15 | Motorola, Inc. | Improved method and means of determining coefficients for linear predictive coding |
US4696038A (en) * | 1983-04-13 | 1987-09-22 | Texas Instruments Incorporated | Voice messaging system with unified pitch and voice tracking |
JPS60181798A (ja) * | 1984-02-28 | 1985-09-17 | 電子計算機基本技術研究組合 | 音声認識装置 |
JPS60225200A (ja) * | 1984-04-23 | 1985-11-09 | 日本電気株式会社 | 音声符号化器 |
JPS61134000A (ja) * | 1984-12-05 | 1986-06-21 | 株式会社日立製作所 | 音声分析合成方式 |
US4860357A (en) * | 1985-08-05 | 1989-08-22 | Ncr Corporation | Binary autocorrelation processor |
US4847906A (en) * | 1986-03-28 | 1989-07-11 | American Telephone And Telegraph Company, At&T Bell Laboratories | Linear predictive speech coding arrangement |
JPH0738116B2 (ja) * | 1986-07-30 | 1995-04-26 | 日本電気株式会社 | マルチパルス符号化装置 |
US4803730A (en) * | 1986-10-31 | 1989-02-07 | American Telephone And Telegraph Company, At&T Bell Laboratories | Fast significant sample detection for a pitch detector |
US5202953A (en) * | 1987-04-08 | 1993-04-13 | Nec Corporation | Multi-pulse type coding system with correlation calculation by backward-filtering operation for multi-pulse searching |
US5226108A (en) * | 1990-09-20 | 1993-07-06 | Digital Voice Systems, Inc. | Processing a speech signal with estimated pitch |
DE69231266T2 (de) * | 1991-08-09 | 2001-03-15 | Koninkl Philips Electronics Nv | Verfahren und Gerät zur Manipulation der Dauer eines physikalischen Audiosignals und eine Darstellung eines solchen physikalischen Audiosignals enthaltendes Speichermedium |
EP0527527B1 (en) * | 1991-08-09 | 1999-01-20 | Koninklijke Philips Electronics N.V. | Method and apparatus for manipulating pitch and duration of a physical audio signal |
US5715365A (en) * | 1994-04-04 | 1998-02-03 | Digital Voice Systems, Inc. | Estimation of excitation parameters |
FR2727236B1 (fr) * | 1994-11-22 | 1996-12-27 | Alcatel Mobile Comm France | Detection d'activite vocale |
AU696092B2 (en) * | 1995-01-12 | 1998-09-03 | Digital Voice Systems, Inc. | Estimation of excitation parameters |
US5696873A (en) * | 1996-03-18 | 1997-12-09 | Advanced Micro Devices, Inc. | Vocoder system and method for performing pitch estimation using an adaptive correlation sample window |
US6245517B1 (en) | 1998-09-29 | 2001-06-12 | The United States Of America As Represented By The Department Of Health And Human Services | Ratio-based decisions and the quantitative analysis of cDNA micro-array images |
US20070163425A1 (en) * | 2000-03-13 | 2007-07-19 | Tsui Chi-Ying | Melody retrieval system |
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
ITFI20010199A1 (it) | 2001-10-22 | 2003-04-22 | Riccardo Vieri | Sistema e metodo per trasformare in voce comunicazioni testuali ed inviarle con una connessione internet a qualsiasi apparato telefonico |
JP4366652B2 (ja) * | 2004-04-23 | 2009-11-18 | 横河電機株式会社 | 伝送器及びその二重化方法 |
EP2438879A3 (en) | 2004-08-13 | 2013-01-23 | Biolase, Inc. | Dual pulse-width medical laser with presets |
ES2424130T3 (es) | 2004-08-13 | 2013-09-27 | Biolase, Inc. | Estructura de instrumento de mano de láser, y métodos |
US7716046B2 (en) * | 2004-10-26 | 2010-05-11 | Qnx Software Systems (Wavemakers), Inc. | Advanced periodic signal enhancement |
US8306821B2 (en) * | 2004-10-26 | 2012-11-06 | Qnx Software Systems Limited | Sub-band periodic signal enhancement system |
US7949520B2 (en) * | 2004-10-26 | 2011-05-24 | QNX Software Sytems Co. | Adaptive filter pitch extraction |
US7610196B2 (en) * | 2004-10-26 | 2009-10-27 | Qnx Software Systems (Wavemakers), Inc. | Periodic signal enhancement system |
US7680652B2 (en) | 2004-10-26 | 2010-03-16 | Qnx Software Systems (Wavemakers), Inc. | Periodic signal enhancement system |
US8543390B2 (en) * | 2004-10-26 | 2013-09-24 | Qnx Software Systems Limited | Multi-channel periodic signal enhancement system |
US8170879B2 (en) * | 2004-10-26 | 2012-05-01 | Qnx Software Systems Limited | Periodic signal enhancement system |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US7633076B2 (en) | 2005-09-30 | 2009-12-15 | Apple Inc. | Automated response to and sensing of user activity in portable devices |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US20080231557A1 (en) * | 2007-03-20 | 2008-09-25 | Leadis Technology, Inc. | Emission control in aged active matrix oled display using voltage ratio or current ratio |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US8850154B2 (en) | 2007-09-11 | 2014-09-30 | 2236008 Ontario Inc. | Processing system having memory partitioning |
US8904400B2 (en) * | 2007-09-11 | 2014-12-02 | 2236008 Ontario Inc. | Processing system having a partitioning component for resource partitioning |
US8694310B2 (en) | 2007-09-17 | 2014-04-08 | Qnx Software Systems Limited | Remote control server protocol system |
US9053089B2 (en) | 2007-10-02 | 2015-06-09 | Apple Inc. | Part-of-speech tagging using latent analogy |
US8620662B2 (en) | 2007-11-20 | 2013-12-31 | Apple Inc. | Context-aware unit selection |
US10002189B2 (en) | 2007-12-20 | 2018-06-19 | Apple Inc. | Method and apparatus for searching using an active ontology |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8209514B2 (en) * | 2008-02-04 | 2012-06-26 | Qnx Software Systems Limited | Media processing system having resource partitioning |
US8065143B2 (en) | 2008-02-22 | 2011-11-22 | Apple Inc. | Providing text input using speech data and non-speech data |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US8464150B2 (en) | 2008-06-07 | 2013-06-11 | Apple Inc. | Automatic language identification for dynamic text processing |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US8768702B2 (en) | 2008-09-05 | 2014-07-01 | Apple Inc. | Multi-tiered voice feedback in an electronic device |
US8898568B2 (en) | 2008-09-09 | 2014-11-25 | Apple Inc. | Audio user interface |
US8583418B2 (en) | 2008-09-29 | 2013-11-12 | Apple Inc. | Systems and methods of detecting language and natural language strings for text to speech synthesis |
US8712776B2 (en) | 2008-09-29 | 2014-04-29 | Apple Inc. | Systems and methods for selective text to speech synthesis |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
CA2958963C (en) | 2008-10-15 | 2020-03-24 | Biolase, Inc. | Satellite-platformed electromagnetic energy treatment device |
EP3231385B1 (en) | 2008-11-29 | 2023-01-11 | Biolase, Inc. | Laser cutting device with an emission tip for contactless use |
US9959870B2 (en) | 2008-12-11 | 2018-05-01 | Apple Inc. | Speech recognition involving a mobile device |
US8862252B2 (en) | 2009-01-30 | 2014-10-14 | Apple Inc. | Audio user interface for displayless electronic device |
US8380507B2 (en) | 2009-03-09 | 2013-02-19 | Apple Inc. | Systems and methods for determining the language to use for speech generated by a text to speech engine |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US10540976B2 (en) | 2009-06-05 | 2020-01-21 | Apple Inc. | Contextual voice commands |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US10255566B2 (en) * | 2011-06-03 | 2019-04-09 | Apple Inc. | Generating and processing task items that represent tasks to perform |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
KR101487247B1 (ko) | 2009-10-26 | 2015-01-29 | 바이오레이즈, 인크. | 활성-미디어 하우징을 갖는 고 파워 방사선원 |
US8682649B2 (en) | 2009-11-12 | 2014-03-25 | Apple Inc. | Sentiment prediction from textual data |
US8600743B2 (en) | 2010-01-06 | 2013-12-03 | Apple Inc. | Noise profile determination for voice-related feature |
US8381107B2 (en) | 2010-01-13 | 2013-02-19 | Apple Inc. | Adaptive audio feedback system and method |
US8311838B2 (en) | 2010-01-13 | 2012-11-13 | Apple Inc. | Devices and methods for identifying a prompt corresponding to a voice input in a sequence of prompts |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
DE202011111062U1 (de) | 2010-01-25 | 2019-02-19 | Newvaluexchange Ltd. | Vorrichtung und System für eine Digitalkonversationsmanagementplattform |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US8713021B2 (en) | 2010-07-07 | 2014-04-29 | Apple Inc. | Unsupervised document clustering using latent semantic density analysis |
US8719006B2 (en) | 2010-08-27 | 2014-05-06 | Apple Inc. | Combined statistical and rule-based part-of-speech tagging for text-to-speech synthesis |
US8719014B2 (en) | 2010-09-27 | 2014-05-06 | Apple Inc. | Electronic device with text error correction based on voice recognition data |
US10762293B2 (en) | 2010-12-22 | 2020-09-01 | Apple Inc. | Using parts-of-speech tagging and named entity recognition for spelling correction |
US10515147B2 (en) | 2010-12-22 | 2019-12-24 | Apple Inc. | Using statistical language models for contextual lookup |
US8781836B2 (en) | 2011-02-22 | 2014-07-15 | Apple Inc. | Hearing assistance system for providing consistent human speech |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US10672399B2 (en) | 2011-06-03 | 2020-06-02 | Apple Inc. | Switching between text data and audio data based on a mapping |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US8812294B2 (en) | 2011-06-21 | 2014-08-19 | Apple Inc. | Translating phrases from one language into another using an order-based set of declarative rules |
US8706472B2 (en) | 2011-08-11 | 2014-04-22 | Apple Inc. | Method for disambiguating multiple readings in language conversion |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
US8762156B2 (en) | 2011-09-28 | 2014-06-24 | Apple Inc. | Speech recognition repair using contextual information |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US8775442B2 (en) | 2012-05-15 | 2014-07-08 | Apple Inc. | Semantic search using a single-source semantic model |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
WO2013185109A2 (en) | 2012-06-08 | 2013-12-12 | Apple Inc. | Systems and methods for recognizing textual identifiers within a plurality of words |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
US8935167B2 (en) | 2012-09-25 | 2015-01-13 | Apple Inc. | Exemplar-based latent perceptual modeling for automatic speech recognition |
WO2014076827A1 (en) * | 2012-11-13 | 2014-05-22 | Yoshimasa Electronic Inc. | Method and device for recognizing speech |
KR20230137475A (ko) | 2013-02-07 | 2023-10-04 | 애플 인크. | 디지털 어시스턴트를 위한 음성 트리거 |
US9977779B2 (en) | 2013-03-14 | 2018-05-22 | Apple Inc. | Automatic supplementation of word correction dictionaries |
US9733821B2 (en) | 2013-03-14 | 2017-08-15 | Apple Inc. | Voice control to diagnose inadvertent activation of accessibility features |
US10642574B2 (en) | 2013-03-14 | 2020-05-05 | Apple Inc. | Device, method, and graphical user interface for outputting captions |
US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
US10572476B2 (en) | 2013-03-14 | 2020-02-25 | Apple Inc. | Refining a search based on schedule items |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
KR101857648B1 (ko) | 2013-03-15 | 2018-05-15 | 애플 인크. | 지능형 디지털 어시스턴트에 의한 사용자 트레이닝 |
AU2014233517B2 (en) | 2013-03-15 | 2017-05-25 | Apple Inc. | Training an at least partial voice command system |
AU2014251347B2 (en) | 2013-03-15 | 2017-05-18 | Apple Inc. | Context-sensitive handling of interruptions |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
EP3937002A1 (en) | 2013-06-09 | 2022-01-12 | Apple Inc. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
AU2014278595B2 (en) | 2013-06-13 | 2017-04-06 | Apple Inc. | System and method for emergency calls initiated by voice command |
DE112014003653B4 (de) | 2013-08-06 | 2024-04-18 | Apple Inc. | Automatisch aktivierende intelligente Antworten auf der Grundlage von Aktivitäten von entfernt angeordneten Vorrichtungen |
US10296160B2 (en) | 2013-12-06 | 2019-05-21 | Apple Inc. | Method for extracting salient dialog usage from live data |
US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
AU2015266863B2 (en) | 2014-05-30 | 2018-03-15 | Apple Inc. | Multi-command single utterance input method |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179588B1 (en) | 2016-06-09 | 2019-02-22 | Apple Inc. | INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4074069A (en) * | 1975-06-18 | 1978-02-14 | Nippon Telegraph & Telephone Public Corporation | Method and apparatus for judging voiced and unvoiced conditions of speech signal |
JPS6051720B2 (ja) * | 1975-08-22 | 1985-11-15 | 日本電信電話株式会社 | 音声の基本周期抽出装置 |
US4015088A (en) * | 1975-10-31 | 1977-03-29 | Bell Telephone Laboratories, Incorporated | Real-time speech analyzer |
DE2715411B2 (de) * | 1977-04-06 | 1979-02-01 | Licentia Patent-Verwaltungs-Gmbh, 6000 Frankfurt | Elektrisches Verfahren zum Bestimmen der Grundperiode eines Sprachsignals |
-
1978
- 1978-11-24 JP JP53145084A patent/JPS597120B2/ja not_active Expired
-
1979
- 1979-11-23 CA CA340,486A patent/CA1127765A/en not_active Expired
- 1979-11-26 US US06/097,283 patent/US4282405A/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
CA1127765A (en) | 1982-07-13 |
US4282405A (en) | 1981-08-04 |
JPS5570900A (en) | 1980-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS597120B2 (ja) | 音声分析装置 | |
Parris et al. | Language independent gender identification | |
NL192701C (nl) | Werkwijze en inrichting voor het herkennen van een foneem in een stemsignaal. | |
US7999168B2 (en) | Robot | |
JPH0990974A (ja) | 信号処理方法 | |
WO2000031721A1 (en) | Method and apparatus for pitch tracking | |
US8942977B2 (en) | System and method for speech recognition using pitch-synchronous spectral parameters | |
US5806031A (en) | Method and recognizer for recognizing tonal acoustic sound signals | |
JPS5912185B2 (ja) | 有声無声判定装置 | |
JP2940835B2 (ja) | ピッチ周波数差分特徴量抽出法 | |
Sakamoto et al. | An automatic pitch-marking method using wavelet transform. | |
KR0136608B1 (ko) | 음성신호 검색용 음성인식 장치 | |
JPS5931080B2 (ja) | 音声分析装置 | |
JPS63281200A (ja) | 音声区間検出方式 | |
JPH06282296A (ja) | ピッチ抽出装置 | |
JPH0122639B2 (ja) | ||
JP2001083978A (ja) | 音声認識装置 | |
Buza et al. | Algorithm for detection of voice signal periodicity | |
JP3423233B2 (ja) | オーディオ信号処理方法および装置 | |
JPS59149400A (ja) | 音声入力装置 | |
JP2643202B2 (ja) | 入力音声の定常部、過渡部、不確定部の検出装置 | |
JPH0378636B2 (ja) | ||
JP2583854B2 (ja) | 有声無声判定方法 | |
KR940005047B1 (ko) | 음성전이구간 검출기 | |
JP3049711B2 (ja) | 音声処理装置 |