JP2016006440A - 音声処理装置、音声処理方法および音声処理プログラム - Google Patents
音声処理装置、音声処理方法および音声処理プログラム Download PDFInfo
- Publication number
- JP2016006440A JP2016006440A JP2014126828A JP2014126828A JP2016006440A JP 2016006440 A JP2016006440 A JP 2016006440A JP 2014126828 A JP2014126828 A JP 2014126828A JP 2014126828 A JP2014126828 A JP 2014126828A JP 2016006440 A JP2016006440 A JP 2016006440A
- Authority
- JP
- Japan
- Prior art keywords
- utterance
- voice
- section
- speech
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims abstract description 86
- 238000003672 processing method Methods 0.000 title claims description 18
- 238000001514 detection method Methods 0.000 claims abstract description 53
- 238000004364 calculation method Methods 0.000 claims abstract description 37
- 238000011156 evaluation Methods 0.000 claims description 15
- 230000005540 biological transmission Effects 0.000 claims description 13
- 230000004044 response Effects 0.000 claims description 5
- 238000000034 method Methods 0.000 description 25
- 238000010586 diagram Methods 0.000 description 23
- 230000006870 function Effects 0.000 description 10
- 230000003287 optical effect Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 230000002093 peripheral effect Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000008054 signal transmission Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Telephone Function (AREA)
- Spectroscopy & Molecular Physics (AREA)
Abstract
周囲雑音に依存せずに受話音声の発話区間を推定することが可能となる音声処理装置を提供する。
【解決手段】
音声処理装置は、送話音声を取得する取得部と、送話音声の第1発話区間を検出する検出部と、第1発話区間の区間長、または、第1発話区間の母音数を含む第1特徴量を算出する算出部を備える。更に当該音声処理装置は、第1特徴量が第1閾値未満となる第2特徴量が送話音声に出現する頻度を判定する判定部と、頻度に基づいて、受話音声の発話時間を推定する推定部を備える。
【選択図】図1
Description
図1は、第1の実施形態による音声処理装置1の機能ブロック図である。音声処理装置1は、取得部2、検出部3、算出部4、判定部5、推定部6を有する。図2は、音声処理装置1の音声処理のフローチャートである。実施例1においては、図2に示す音声処理装置1による音声処理のフローを、図1に示す音声処理装置1の機能ブロック図の各機能の説明に対応付けて説明する。
(数1)
ここで、nは、送話音声に含まれる音響フレームの入力開始から各フレームに連続して付されるフレーム番号(nは0以上の整数)、Mは1フレームの時間長、tは時間、c(t)は、送話音声の振幅(電力)を示す。
雑音推定部10は、フレームnにおける雑音の大きさ(電力)N(n)を、フレームnにおける音量S(n)、前フレーム(n−1)における音量S(n−1)ならびに、雑音の大きさN(n−1)に基づいて、次式を用いて推定することが出来る。
(数2)
ここで、α、βは、定数であり、実験的に決定されれば良い。例えば、α=0.9、β=2.0であれば良い。また、雑音電力の初期値N(−1)も、実験的に決定されれば良い。上述の(数2)において、フレームnの音量S(n)が、1つ前のフレームn−1の音量S(n−1)に対して一定値β以上変化しない場合には、フレームnの雑音電力N(n)が更新される。一方、フレームnの音量S(n)が、1つ前のフレームn−1の音量S(n−1)に対して一定値β以上変化する場合には、1つ前のフレームn−1の雑音電力N(n−1)をフレームnの雑音電力N(n)とする。なお、雑音電力N(n)を上述の雑音推定結果と称しても良い。
雑音推定部10は、雑音の大きさの更新を、次式の(数3)を用いて、フレームnの音量S(n)と、1つ前のフレームn−1の雑音電力N(n−1)との比に基づいて実施しても良い。
(数3)
ここで、γは定数であり、実験的に決定されれば良い。例えば、γ=2.0であれば良い。また、雑音電力の初期値N(−1)も、実験的に決定されれば良い。上述の(数3)において、フレームnの音量S(n)が、1つ前のフレームn−1の雑音電力N(n−1)に対して一定値γ倍未満である場合には、フレームnの雑音電力N(n)を更新する。一方、フレームnの音量S(n)が、1つ前のフレームn−1の雑音電力N(n−1)に対して一定値γ倍以上である場合には、1つ前のフレームn−1の雑音電力N(n−1)をフレームnの雑音電力N(n)とする。
(数4)
ここで、Lは促音の一般的な長さよりも大きな値に規定すれば良く、例えば、0.5msecに相当するフレーム数を規定すれば良い。
(数5)
Ts(n)=n×M
(if n_breath=発話区間ではない、かつ、SNR(n)>THSNR)
(数6)
Te(n)=n×M−1
(if n_breath=発話区間、かつ、SNR(n)<THSNR)
ここで、THSNRは、区間決定部12による処理フレームnが雑音ではないと看做すための任意の閾値(当該閾値を第5閾値(例えば、第5閾値=12dB)と称しても良い)であり、実験的に規定されれば良い。なお、発話区間の始点Ts(n)は、発話区間の始点におけるサンプル数であり、終点Te(n)は、発話区間の終点Te(n)のサンプル数であるものと考えることが出来る。また、区間決定部12は、送話音声において発話区間以外の区間を無音区間として検出することが出来る。
(数7)
L(n)=Te(n)−Ts(n)
但し、上述の(数7)において、Ts(n)は発話区間の始点におけるサンプル数であり、Te(n)は、発話区間の終点におけるサンプル数である。なお、Ts(n)とTe(n)は、例えば、上述の(数5)または(数6)に基づいて算出することが出来る。また、算出部4は、例えば、フォルマント分布により、第1特徴量の一例となる発話区間における母音数を検出する。算出部4は、フォルマント分布に基づく母音数の検出方法として、例えば特開2009−258366号公報に記載の方法を用いることが出来る。算出部4は算出した第1特徴量を判定部5に出力する。
(数8)
但し、上述の(数8)において、L(n)は発話区間の区間長、Ts(n)は発話区間の始点におけるサンプル数、TH2は第2閾値、TH3は第3閾値である。
(数9)
但し、上述の(数9)において、Ts’(n)は第2特徴量区間の始点におけるサンプル数であり、Te’(n)は、第2特徴量区間の終点におけるサンプル数である。
(数10)
但し、上述の(数10)において、L(n)は発話区間の区間長、Ts(n)は発話区間の始点におけるサンプル数、NV(n)は第2特徴量、TH2は第2閾値、TH3は第3閾値である。判定部5は、判定した頻度を推定部6に出力する。
(数11)
但し、上述の(数11)において、L(n)は発話区間の区間長、Ts(n)は発話区間の始点におけるサンプル数である。
(数12)
R(t)=TL2(t)/TL1(t)
なお、上述の(数12)において、なお、TL1(t)は、上述の(数11)を用いて算出することが可能であり、TL2(t)においては、TL1(t)と同様の方法を用いて算出することが可能である為、詳細な説明は省略する。
(数13)
if R(t)<TH5 CS(t)=1 (制御信号発信有り)
else CS(t)=0 (制御信号発信無し)
図9は、第2の実施形態による音声処理装置20の機能ブロック図である。音声処理装置20は、取得部2、検出部3、算出部4、判定部5、推定部6、受信部7、評価部8を有する。取得部2、検出部3、算出部4、判定部5、推定部6は、少なくとも実施例1で開示した機能と同様の機能を有する為、詳細な説明は省略する。
(数14)
Ts2=(Ts1+Te1)/2−L/2
Te2=(Ts1+Te1)/2+L/2
図11は、一つの実施形態による携帯端末装置30として機能するハードウェア構成図である。携帯端末装置30は、アンテナ31、無線部32、ベースバンド処理部33、端末インタフェース部34、マイク35、スピーカ36、制御部37、主記憶部38、補助記憶部39を有する。
信号を受信する。無線部32は、ベースバンド処理部33で拡散された送信信号をD/A変換し、直交変調により高周波信号に変換し、その信号を電力増幅器により増幅する。無線部32は、受信した無線信号を増幅し、その信号をA/D変換してベースバンド処理部33に伝送する。
タ端末とのインタフェース処理を行う。
図12は、一つの実施形態による音声処理装置1として機能するコンピュータのハードウェア構成図である。図12に示す通り、音声処理装置1は、コンピュータ100、およびコンピュータ100に接続する入出力装置(周辺機器)を含んで構成される。
(付記1)
送話音声を取得する取得部と、
前記送話音声の第1発話区間を検出する検出部と、
前記第1発話区間の第1特徴量を算出する算出部と、
前記第1特徴量が第1閾値未満となる第2特徴量が前記送話音声に出現する頻度を判定する判定部と、
前記頻度に基づいて、受話音声の発話時間を推定する推定部
を備えることを特徴とする音声処理装置。
(付記2)
前記第1閾値は、前記区間長に関する第2閾値、または、前記母音数に関する第3閾値であり、
前記判定部は、前記区間長が前記第2閾値未満または、前記母音数が前記第3閾値未満の場合に、前記第2特徴量として判定することを特徴とする付記1記載の音声処理装置。
(付記3)
前記判定部は、前記第2特徴量を前記受話音声の発話への反応として、前記頻度を判定することを特徴とする付記1または付記2記載の音声処理装置。
(付記4)
前記判定部は、単位時間あたりの前記第2特徴量の出現回数、または、前記単位時間あたりの前記第2特徴量の出現間隔を前記頻度として判定することを特徴とする付記1ないし付記3の何れか一つに記載の音声処理装置。
(付記5)
前記判定部は、前記第1発話区間の区間数に対する前記第2特徴量の出現回数の比率を前記頻度として判定することを特徴とする付記1ないし付記4の何れか一つに記載の音声処理装置。
(付記6)
前記判定部は、前記送話音声を文字列として認識し、前記文字列から前記第2特徴量に対応する所定の単語が出現する出現回数を前記頻度として算出することを特徴とする付記1記載の音声処理装置。
(付記7)
前記推定部は、予め規定される、前記頻度と前記発話時間の第1相関に基づいて前記発話時間を推定し、
前記第1発話区間の区間長の合計値が第4閾値未満の場合、前記第1相関よりも前記発話時間が短く規定される第2相関に基づいて前記発話時間を推定することを特徴とする付記1ないし付記6の何れか一つに記載の音声処理装置。
(付記8)
前記推定部は、前記受話音声の前記発話時間と、前記第1発話区間の前記合計値の比率に基づいて、所定の制御信号を発信することを特徴とする付記1ないし付記7の何れか一項に記載の音声処理装置。
(付記9)
前記検出部は、前記送話音声に含まれる複数のフレームの第1信号対雑音比を検出し、前記第1信号対雑音比が第5閾値以上の前記フレームを前記第1発話区間として検出することを特徴とする付記1ないし付記8の何れか一項に記載の音声処理装置。
(付記10)
前記受話音声を受信する受信部と、
前記受話音声の第2信号対雑音比を評価する評価部を更に有し、
前記取得部は、前記第2信号対雑音比に基づいて前記送話音声の取得の要否を判断する
ことを特徴とする付記1ないし付記9の何れか一つに記載の音声処理装置。
(付記11)
前記検出部は、前記受話音声の第2発話区間を更に検出し、
前記推定部は、前記第2特徴量と前記第2発話区間に基づいて、前記受話音声の発話区間を推定することを特徴とする付記10記載の音声処理装置。
(付記12)
前記第2特徴量は前記受話音声の発話に対する相槌であることを特徴とする付記1ないし付記11の何れか一つに記載の音声処理装置。
(付記13)
送話音声を取得し、
前記送話音声の第1発話区間を検出し、
前記第1発話区間の区間長、または、前記第1発話区間の母音数を含む第1特徴量を算出し、
前記第1特徴量が第1閾値未満となる第2特徴量が前記送話音声に出現する頻度を判定し、
前記頻度に基づいて、受話音声の発話時間を推定すること
を含むことを特徴とする音声処理方法。
(付記14)
前記第1閾値は、前記区間長に関する第2閾値、または、前記母音数に関する第3閾値であり、
前記判定部は、前記区間長が前記第2閾値未満または、前記母音数が前記第3閾値未満の場合に、前記第2特徴量として判定することを特徴とする付記13記載の音声処理方法。
(付記15)
前記判定部は、前記第2特徴量を前記受話音声の発話への反応として、前記頻度を判定することを特徴とする付記13または付記14記載の音声処理方法。
(付記16)
前記判定することは、単位時間あたりの前記第2特徴量の出現回数、または、前記単位時間あたりの前記第2特徴量の出現間隔を前記頻度として判定することを特徴とする付記13ないし付記15の何れか一つに記載の音声処理方法。
(付記17)
前記判定することは、前記第1発話区間の区間数に対する前記第2特徴量の出現回数の比率を前記頻度として判定することを特徴とする付記13ないし付記16の何れか一つに記載の音声処理方法。
(付記18)
前記判定することは、前記送話音声を文字列として認識し、前記文字列から前記第2特徴量に対応する所定の単語が出現する出現回数を前記頻度として算出することを特徴とする付記13記載の音声処理方法。
(付記19)
前記推定することは、予め規定される、前記頻度と前記発話時間の第1相関に基づいて前記発話時間を推定し、
前記第1発話区間の区間長の合計値が第4閾値未満の場合、前記第1相関よりも前記発話時間が短く規定される第2相関に基づいて前記発話時間を推定することを特徴とする付記13ないし付記18の何れか一つに記載の音声処理方法。
(付記20)
前記推定することは、前記受話音声の前記発話時間と、前記第1発話区間の前記合計値の比率に基づいて、所定の制御信号を発信することを特徴とする付記13ないし付記19の何れか一つに記載の音声処理方法。
(付記21)
前記受話音声を受信し、
前記受話音声の第2信号対雑音比を評価することを更に含み、
前記取得することは、前記第2信号対雑音比に基づいて前記送話音声の取得の要否を判断することを特徴とする付記13ないし付記19の何れか一つに記載の音声処理方法。
(付記22)
前記検出することは、前記受話音声の第2発話区間を更に検出し、
前記推定することは、前記第2特徴量と前記第2発話区間に基づいて、前記受話音声の発話区間を推定することを特徴とする付記21記載の音声処理方法。
(付記23)
前記検出することは、前記送話音声に含まれる複数のフレームの第1信号対雑音比を検出し、前記第1信号対雑音比が第5閾値以上の前記フレームを前記第1発話区間として検出することを特徴とする付記13の音声処理方法。
(付記24)
前記第2特徴量は前記受話音声の発話に対する相槌であることを特徴とする付記13ないし付記23の何れか一つに記載の音声処理方法。
(付記25)
コンピュータに
送話音声を取得し、
前記送話音声の第1発話区間を検出し、
前記第1発話区間の区間長、または、前記第1発話区間の母音数を含む第1特徴量を算出し、
前記第1特徴量が第1閾値未満となる第2特徴量が前記送話音声に出現する頻度を判定し、
前記頻度に基づいて、受話音声の発話時間を推定すること
を実行させることを特徴とする音声処理プログラム。
(付記26)
発話者の音声を送話音声として入力するマイクと、
送話音声を取得する取得部と、
前記送話音声の第1発話区間を検出する検出部と、
前記第1発話区間の区間長、または、前記第1発話区間の母音数を含む第1特徴量を算出する算出部と、
前記第1特徴量が第1閾値未満となる第2特徴量が前記送話音声に出現する頻度を判定する判定部と、
前記頻度に基づいて、前記受話音声の発話時間を推定する推定部
前記発話時間を出力するスピーカ
を備えることを特徴とする携帯端末装置。
2 取得部
3 検出部
4 算出部
5 判定部
6 推定部
Claims (13)
- 送話音声を取得する取得部と、
前記送話音声の第1発話区間を検出する検出部と、
前記第1発話区間の区間長、または、前記第1発話区間の母音数を含む第1特徴量を算出する算出部と、
前記第1特徴量が第1閾値未満となる第2特徴量が前記送話音声に出現する頻度を判定する判定部と、
前記頻度に基づいて、受話音声の発話時間を推定する推定部
を備えることを特徴とする音声処理装置。 - 前記第1閾値は、前記区間長に関する第2閾値、または、前記母音数に関する第3閾値であり、
前記判定部は、前記区間長が前記第2閾値未満または、前記母音数が前記第3閾値未満の場合に、前記第2特徴量として判定することを特徴とする請求項1記載の音声処理装置。 - 前記判定部は、前記第2特徴量を前記受話音声の発話への反応として、前記頻度を判定することを特徴とする請求項1または請求項2記載の音声処理装置。
- 前記判定部は、単位時間あたりの前記第2特徴量の出現回数、または、前記単位時間あたりの前記第2特徴量の出現間隔を前記頻度として判定することを特徴とする請求項1ないし請求項3の何れか一項に記載の音声処理装置。
- 前記判定部は、前記第1発話区間の区間数に対する前記第2特徴量の出現回数の比率を前記頻度として判定することを特徴とする請求項1ないし請求項4の何れか一項に記載の音声処理装置。
- 前記判定部は、前記送話音声を文字列として認識し、前記文字列から前記第2特徴量に対応する所定の単語が出現する出現回数を前記頻度として算出することを特徴とする請求項1記載の音声処理装置。
- 前記推定部は、予め規定される、前記頻度と前記発話時間の第1相関に基づいて前記発話時間を推定し、
前記第1発話区間の区間長の合計値が第4閾値未満の場合、前記第1相関よりも前記発話時間が短く規定される第2相関に基づいて前記発話時間を推定することを特徴とする請求項1ないし請求項6の何れか一項に記載の音声処理装置。 - 前記推定部は、前記受話音声の前記発話時間と、前記第1発話区間の前記合計値の比率に基づいて、所定の制御信号を発信することを特徴とする請求項1ないし請求項7の何れか一項に記載の音声処理装置。
- 前記検出部は、前記送話音声に含まれる複数のフレームの第1信号対雑音比を検出し、前記第1信号対雑音比が第5閾値以上の前記フレームを前記第1発話区間として検出することを特徴とする請求項1ないし請求項8の何れか一項に記載の音声処理装置。
- 前記受話音声を受信する受信部と、
前記受話音声の第2信号対雑音比を評価する評価部を更に有し、
前記取得部は、前記第2信号対雑音比に基づいて前記送話音声の取得の要否を判断する
ことを特徴とする請求項1ないし請求項9の何れか一項に記載の音声処理装置。 - 前記検出部は、前記受話音声の第2発話区間を更に検出し、
前記推定部は、前記第2特徴量と前記第2発話区間に基づいて、前記受話音声の発話区間を推定することを特徴とする請求項10記載の音声処理装置。 - 送話音声を取得し、
前記送話音声の第1発話区間を検出し、
前記第1発話区間の区間長、または、前記第1発話区間の母音数を含む第1特徴量を算出し、
前記第1特徴量が第1閾値未満となる第2特徴量が前記送話音声に出現する頻度を判定し、
前記頻度に基づいて、受話音声の発話時間を推定すること
を含むことを特徴とする音声処理方法。 - コンピュータに
送話音声を取得し、
前記送話音声の第1発話区間を検出し、
前記第1発話区間の区間長、または、前記第1発話区間の母音数を含む第1特徴量を算出し、
前記第1特徴量が第1閾値未満となる第2特徴量が前記送話音声に出現する頻度を判定し、
前記頻度に基づいて、受話音声の発話時間を推定すること
を実行させることを特徴とする音声処理プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014126828A JP6394103B2 (ja) | 2014-06-20 | 2014-06-20 | 音声処理装置、音声処理方法および音声処理プログラム |
US14/723,907 US20150371662A1 (en) | 2014-06-20 | 2015-05-28 | Voice processing device and voice processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014126828A JP6394103B2 (ja) | 2014-06-20 | 2014-06-20 | 音声処理装置、音声処理方法および音声処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016006440A true JP2016006440A (ja) | 2016-01-14 |
JP6394103B2 JP6394103B2 (ja) | 2018-09-26 |
Family
ID=54870220
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014126828A Expired - Fee Related JP6394103B2 (ja) | 2014-06-20 | 2014-06-20 | 音声処理装置、音声処理方法および音声処理プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20150371662A1 (ja) |
JP (1) | JP6394103B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102017126120A1 (de) | 2016-11-18 | 2018-05-24 | Toyota Jidosha Kabushiki Kaisha | Fahrunterstützungsvorrichtung |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6565500B2 (ja) * | 2015-08-31 | 2019-08-28 | 富士通株式会社 | 発話状態判定装置、発話状態判定方法、及び判定プログラム |
CN109166570B (zh) * | 2018-07-24 | 2019-11-26 | 百度在线网络技术(北京)有限公司 | 一种语音切分的方法、装置、设备和计算机存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001265367A (ja) * | 2000-03-16 | 2001-09-28 | Mitsubishi Electric Corp | 音声区間判定装置 |
JP2008051907A (ja) * | 2006-08-22 | 2008-03-06 | Toshiba Corp | 発話区間識別装置及びその方法 |
JP2010175684A (ja) * | 2009-01-28 | 2010-08-12 | Nippon Telegr & Teleph Corp <Ntt> | 通話状態判定装置、通話状態判定方法、プログラム、記録媒体 |
JP2013225002A (ja) * | 2012-04-20 | 2013-10-31 | Nippon Telegr & Teleph Corp <Ntt> | データ分析装置、データ分析方法およびデータ分析プログラム |
WO2014069122A1 (ja) * | 2012-10-31 | 2014-05-08 | 日本電気株式会社 | 表現分類装置、表現分類方法、不満検出装置及び不満検出方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4786384B2 (ja) * | 2006-03-27 | 2011-10-05 | 株式会社東芝 | 音声処理装置、音声処理方法および音声処理プログラム |
JP5326533B2 (ja) * | 2008-12-09 | 2013-10-30 | 富士通株式会社 | 音声加工装置及び音声加工方法 |
US8160877B1 (en) * | 2009-08-06 | 2012-04-17 | Narus, Inc. | Hierarchical real-time speaker recognition for biometric VoIP verification and targeting |
US9015046B2 (en) * | 2010-06-10 | 2015-04-21 | Nice-Systems Ltd. | Methods and apparatus for real-time interaction analysis in call centers |
EP2661053A4 (en) * | 2010-12-27 | 2015-04-29 | Fujitsu Ltd | LANGUAGE CONTROL DEVICE, VOICE CONTROL METHOD, LANGUAGE CONTROL PROGRAM AND MOBILE TERMINAL |
US8762147B2 (en) * | 2011-02-02 | 2014-06-24 | JVC Kenwood Corporation | Consonant-segment detection apparatus and consonant-segment detection method |
JP6098149B2 (ja) * | 2012-12-12 | 2017-03-22 | 富士通株式会社 | 音声処理装置、音声処理方法および音声処理プログラム |
JP2015169827A (ja) * | 2014-03-07 | 2015-09-28 | 富士通株式会社 | 音声処理装置、音声処理方法および音声処理プログラム |
-
2014
- 2014-06-20 JP JP2014126828A patent/JP6394103B2/ja not_active Expired - Fee Related
-
2015
- 2015-05-28 US US14/723,907 patent/US20150371662A1/en not_active Abandoned
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001265367A (ja) * | 2000-03-16 | 2001-09-28 | Mitsubishi Electric Corp | 音声区間判定装置 |
JP2008051907A (ja) * | 2006-08-22 | 2008-03-06 | Toshiba Corp | 発話区間識別装置及びその方法 |
JP2010175684A (ja) * | 2009-01-28 | 2010-08-12 | Nippon Telegr & Teleph Corp <Ntt> | 通話状態判定装置、通話状態判定方法、プログラム、記録媒体 |
JP2013225002A (ja) * | 2012-04-20 | 2013-10-31 | Nippon Telegr & Teleph Corp <Ntt> | データ分析装置、データ分析方法およびデータ分析プログラム |
WO2014069122A1 (ja) * | 2012-10-31 | 2014-05-08 | 日本電気株式会社 | 表現分類装置、表現分類方法、不満検出装置及び不満検出方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102017126120A1 (de) | 2016-11-18 | 2018-05-24 | Toyota Jidosha Kabushiki Kaisha | Fahrunterstützungsvorrichtung |
US10607490B2 (en) | 2016-11-18 | 2020-03-31 | Toyota Jidosha Kabushiki Kaisha | Driving support apparatus |
DE102017126120B4 (de) | 2016-11-18 | 2020-07-02 | Toyota Jidosha Kabushiki Kaisha | Fahrunterstützungsvorrichtung |
Also Published As
Publication number | Publication date |
---|---|
JP6394103B2 (ja) | 2018-09-26 |
US20150371662A1 (en) | 2015-12-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9293133B2 (en) | Improving voice communication over a network | |
JP5664480B2 (ja) | 異常状態検出装置、電話機、異常状態検出方法、及びプログラム | |
EP2816558B1 (en) | Speech processing device and method | |
CN112071328B (zh) | 音频降噪 | |
US20130197912A1 (en) | Specific call detecting device and specific call detecting method | |
US10403289B2 (en) | Voice processing device and voice processing method for impression evaluation | |
JP6244658B2 (ja) | 音声処理装置、音声処理方法および音声処理プログラム | |
JP6098149B2 (ja) | 音声処理装置、音声処理方法および音声処理プログラム | |
JP2015222847A (ja) | 音声処理装置、音声処理方法および音声処理プログラム | |
JP6394103B2 (ja) | 音声処理装置、音声処理方法および音声処理プログラム | |
JP2017062307A (ja) | 音声処理装置、音声処理方法および音声処理プログラム | |
JP6268916B2 (ja) | 異常会話検出装置、異常会話検出方法及び異常会話検出用コンピュータプログラム | |
EP3252765B1 (en) | Noise suppression in a voice signal | |
JP2013182150A (ja) | 発話区間検出装置及び発話区間検出のためのコンピュータプログラム | |
US9907509B2 (en) | Method for judgment of drinking using differential frequency energy, recording medium and device for performing the method | |
EP2736043A2 (en) | Signal processing device, method for processing signal | |
CN108352169B (zh) | 困惑状态判定装置、困惑状态判定方法、以及程序 | |
CN111582708A (zh) | 医疗信息的检测方法、系统、电子设备及计算机可读存储介质 | |
US20130317821A1 (en) | Sparse signal detection with mismatched models | |
JP2015132777A (ja) | 音声処理装置、音声処理方法および音声処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20160401 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170309 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180223 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180306 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180320 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20180528 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180731 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180813 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6394103 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |