JP6612277B2 - ターンテイキングタイミング識別装置、ターンテイキングタイミング識別方法、プログラム、記録媒体 - Google Patents
ターンテイキングタイミング識別装置、ターンテイキングタイミング識別方法、プログラム、記録媒体 Download PDFInfo
- Publication number
- JP6612277B2 JP6612277B2 JP2017026681A JP2017026681A JP6612277B2 JP 6612277 B2 JP6612277 B2 JP 6612277B2 JP 2017026681 A JP2017026681 A JP 2017026681A JP 2017026681 A JP2017026681 A JP 2017026681A JP 6612277 B2 JP6612277 B2 JP 6612277B2
- Authority
- JP
- Japan
- Prior art keywords
- utterance
- turn
- taking
- feature amount
- feature quantity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Machine Translation (AREA)
Description
以下、図2〜図4を参照してターンテイキングタイミング識別装置100について説明する。図2は、ターンテイキングタイミング識別装置100の構成を示すブロック図である。図3は、ターンテイキングタイミング識別装置100の動作を示すフローチャートである。図4は、発話内特徴量、発話特徴量、ターンテイキング点特徴量の関係を示す図である。図2に示すように、ターンテイキングタイミング識別装置100は、音声区間検出部110、発話内特徴量系列生成部120、発話特徴量計算部130、ターンテイキング点特徴量計算部140、ターンテイキングタイミング識別部150、記録部190を含む。記録部190は、ターンテイキングタイミング識別装置100の処理に必要な情報を適宜記録する構成部である。
第一実施形態では、単一の発話内特徴量系列(例えば、音声認識結果の単語系列)を用いて、ターンテイキングタイミングを識別したが、例えば、基本周波数系列とケプストラム系列というように、複数種類の発話内特徴量系列を用いて識別するようにしてもよい。
この発明は上述の実施形態に限定されるものではなく、この発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。上記実施形態において説明した各種の処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。
本発明の装置は、例えば単一のハードウェアエンティティとして、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、ハードウェアエンティティの外部に通信可能な通信装置(例えば通信ケーブル)が接続可能な通信部、CPU(Central Processing Unit、キャッシュメモリやレジスタなどを備えていてもよい)、メモリであるRAMやROM、ハードディスクである外部記憶装置並びにこれらの入力部、出力部、通信部、CPU、RAM、ROM、外部記憶装置の間のデータのやり取りが可能なように接続するバスを有している。また必要に応じて、ハードウェアエンティティに、CD−ROMなどの記録媒体を読み書きできる装置(ドライブ)などを設けることとしてもよい。このようなハードウェア資源を備えた物理的実体としては、汎用コンピュータなどがある。
Claims (6)
- 入力音声から、当該入力音声に含まれるk番目(kは1以上の整数)の発話である発話kを検出する音声区間検出部と、
前記発話kから、k番目の発話内特徴量系列である発話内特徴量系列kを生成する発話内特徴量系列生成部と、
前記発話内特徴量系列kから、前記発話kを特徴付ける発話特徴量である発話特徴量kを計算する発話特徴量計算部と、
既に計算してあるi番目の発話特徴量である発話特徴量i(i=1,…,k-1)と前記発話特徴量kから構成される時系列データである発話特徴量系列kから、前記発話kの直後に出現する識別対象ターンテイキング点となるターンテイキング点kを特徴付けるターンテイキング点特徴量kを計算するターンテイキング点特徴量計算部と、
前記ターンテイキング点特徴量kから、前記ターンテイキング点kがターンテイキングタイミングであるか否かを示す識別結果kを生成するターンテイキングタイミング識別部と
を含むターンテイキングタイミング識別装置であって、
前記発話特徴量計算部と前記ターンテイキング点特徴量計算部は、それぞれ固定長ベクトル系列として表現される時系列データを入力とし、固定長ベクトルとして表現される特徴量を出力するニューラルネットワークを用いて構成されることを特徴とするターンテイキングタイミング識別装置。 - 入力音声から、当該入力音声に含まれるk番目(kは1以上の整数)の発話である発話kを検出する音声区間検出部と、
Jを発話から生成される発話内特徴量の種類の数、jを1≦j≦Jを満たす整数とし、
前記発話kから、k番目の第j種発話内特徴量系列である第j種発話内特徴量系列kを生成する第j種発話内特徴量系列生成部と、
前記第j種発話内特徴量系列kから、前記発話kを特徴付ける第j種発話特徴量である第j種発話特徴量kを計算する第j種発話特徴量計算部と、
前記第j種発話特徴量k(1≦j≦J)から、前記発話kを特徴付ける結合発話特徴量である結合発話特徴量kを生成する発話特徴量結合部と、
既に計算してあるi番目の結合発話特徴量である結合発話特徴量i(i=1,…,k-1)と前記結合発話特徴量kから構成される時系列データである結合発話特徴量系列kから、前記発話kの直後に出現する識別対象ターンテイキング点となるターンテイキング点kを特徴付けるターンテイキング点特徴量kを計算するターンテイキング点特徴量計算部と、
前記ターンテイキング点特徴量kから、前記ターンテイキング点kがターンテイキングタイミングであるか否かを示す識別結果kを生成するターンテイキングタイミング識別部と
を含むターンテイキングタイミング識別装置であって、
前記発話特徴量計算部と前記ターンテイキング点特徴量計算部は、それぞれ固定長ベクトル系列として表現される時系列データを入力とし、固定長ベクトルとして表現される特徴量を出力するニューラルネットワークを用いて構成されることを特徴とするターンテイキングタイミング識別装置。 - ターンテイキングタイミング識別装置が、入力音声から、当該入力音声に含まれるk番目(kは1以上の整数)の発話である発話kを検出する音声区間検出ステップと、
前記ターンテイキングタイミング識別装置が、前記発話kから、k番目の発話内特徴量系列である発話内特徴量系列kを生成する発話内特徴量系列生成ステップと、
前記ターンテイキングタイミング識別装置が、前記発話内特徴量系列kから、前記発話kを特徴付ける発話特徴量である発話特徴量kを計算する発話特徴量計算ステップと、
前記ターンテイキングタイミング識別装置が、既に計算してあるi番目の発話特徴量である発話特徴量i(i=1,…,k-1)と前記発話特徴量kから構成される時系列データである発話特徴量系列kから、前記発話kの直後に出現する識別対象ターンテイキング点となるターンテイキング点kを特徴付けるターンテイキング点特徴量kを計算するターンテイキング点特徴量計算ステップと、
前記ターンテイキングタイミング識別装置が、前記ターンテイキング点特徴量kから、前記ターンテイキング点kがターンテイキングタイミングであるか否かを示す識別結果kを生成するターンテイキングタイミング識別ステップと
を含むターンテイキングタイミング識別方法であって、
前記発話特徴量計算ステップと前記ターンテイキング点特徴量計算ステップは、それぞれ固定長ベクトル系列として表現される時系列データを入力とし、固定長ベクトルとして表現される特徴量を出力するニューラルネットワークを用いて実行されることを特徴とするターンテイキングタイミング識別方法。 - ターンテイキングタイミング識別装置が、入力音声から、当該入力音声に含まれるk番目(kは1以上の整数)の発話である発話kを検出する音声区間検出ステップと、
Jを発話から生成される発話内特徴量の種類の数、jを1≦j≦Jを満たす整数とし、
前記ターンテイキングタイミング識別装置が、前記発話kから、k番目の第j種発話内特徴量系列である第j種発話内特徴量系列kを生成する第j種発話内特徴量系列生成ステップと、
前記ターンテイキングタイミング識別装置が、前記第j種発話内特徴量系列kから、前記発話kを特徴付ける第j種発話特徴量である第j種発話特徴量kを計算する第j種発話特徴量計算ステップと、
前記ターンテイキングタイミング識別装置が、前記第j種発話特徴量k(1≦j≦J)から、前記発話kを特徴付ける結合発話特徴量である結合発話特徴量kを生成する発話特徴量結合ステップと、
前記ターンテイキングタイミング識別装置が、既に計算してあるi番目の結合発話特徴量である結合発話特徴量i(i=1,…,k-1)と前記結合発話特徴量kから構成される時系列データである結合発話特徴量系列kから、前記発話kの直後に出現する識別対象ターンテイキング点となるターンテイキング点kを特徴付けるターンテイキング点特徴量kを計算するターンテイキング点特徴量計算ステップと、
前記ターンテイキングタイミング識別装置が、前記ターンテイキング点特徴量kから、前記ターンテイキング点kがターンテイキングタイミングであるか否かを示す識別結果kを生成するターンテイキングタイミング識別ステップと
を含むターンテイキングタイミング識別方法であって、
前記発話特徴量計算ステップと前記ターンテイキング点特徴量計算ステップは、それぞれ固定長ベクトル系列として表現される時系列データを入力とし、固定長ベクトルとして表現される特徴量を出力するニューラルネットワークを用いて実行されることを特徴とするターンテイキングタイミング識別方法。 - 請求項1または2に記載のターンテイキングタイミング識別装置としてコンピュータを機能させるためのプログラム。
- 請求項1または2に記載のターンテイキングタイミング識別装置としてコンピュータを機能させるためのプログラムを記録する記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017026681A JP6612277B2 (ja) | 2017-02-16 | 2017-02-16 | ターンテイキングタイミング識別装置、ターンテイキングタイミング識別方法、プログラム、記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017026681A JP6612277B2 (ja) | 2017-02-16 | 2017-02-16 | ターンテイキングタイミング識別装置、ターンテイキングタイミング識別方法、プログラム、記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018132678A JP2018132678A (ja) | 2018-08-23 |
JP6612277B2 true JP6612277B2 (ja) | 2019-11-27 |
Family
ID=63247420
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017026681A Active JP6612277B2 (ja) | 2017-02-16 | 2017-02-16 | ターンテイキングタイミング識別装置、ターンテイキングタイミング識別方法、プログラム、記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6612277B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7160170B2 (ja) * | 2019-02-07 | 2022-10-25 | 日本電信電話株式会社 | 音声認識装置、音声認識学習装置、音声認識方法、音声認識学習方法、プログラム |
JP7028203B2 (ja) * | 2019-02-07 | 2022-03-02 | 日本電信電話株式会社 | 音声認識装置、音声認識方法、プログラム |
-
2017
- 2017-02-16 JP JP2017026681A patent/JP6612277B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018132678A (ja) | 2018-08-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7627474B2 (en) | Large-vocabulary speech recognition method, apparatus, and medium based on multilayer central lexicons | |
JP2006510933A (ja) | センサ・ベース音声認識装置の選択、適応、および組合せ | |
CN104903954A (zh) | 使用基于人工神经网络的亚语音单位区分的说话人验证及识别 | |
US9595261B2 (en) | Pattern recognition device, pattern recognition method, and computer program product | |
JP6553015B2 (ja) | 話者属性推定システム、学習装置、推定装置、話者属性推定方法、およびプログラム | |
JP6495792B2 (ja) | 音声認識装置、音声認識方法、プログラム | |
CN112825249A (zh) | 语音处理方法和设备 | |
WO2018117094A1 (ja) | 音声認識結果リランキング装置、音声認識結果リランキング方法、プログラム | |
CN110895928A (zh) | 语音识别方法和设备 | |
JP7409381B2 (ja) | 発話区間検出装置、発話区間検出方法、プログラム | |
JP4594885B2 (ja) | 音響モデル適応装置、音響モデル適応方法、音響モデル適応プログラム及び記録媒体 | |
JP6612277B2 (ja) | ターンテイキングタイミング識別装置、ターンテイキングタイミング識別方法、プログラム、記録媒体 | |
US11587553B2 (en) | Appropriate utterance estimate model learning apparatus, appropriate utterance judgement apparatus, appropriate utterance estimate model learning method, appropriate utterance judgement method, and program | |
CN110969239A (zh) | 神经网络及对象识别的方法 | |
CN115512692B (zh) | 语音识别方法、装置、设备及存储介质 | |
JP6716513B2 (ja) | 音声区間検出装置、その方法、及びプログラム | |
JP6546070B2 (ja) | 音響モデル学習装置、音声認識装置、音響モデル学習方法、音声認識方法、およびプログラム | |
JP7279800B2 (ja) | 学習装置、推定装置、それらの方法、およびプログラム | |
JP6389776B2 (ja) | 言語識別モデル学習装置、言語識別装置、言語識別方法、およびプログラム | |
JP4537970B2 (ja) | 言語モデル作成装置、言語モデル作成方法、そのプログラムおよびその記録媒体 | |
JP5982265B2 (ja) | 音声認識装置、音声認識方法、およびプログラム | |
JP6728083B2 (ja) | 中間特徴量計算装置、音響モデル学習装置、音声認識装置、中間特徴量計算方法、音響モデル学習方法、音声認識方法、プログラム | |
JP6537996B2 (ja) | 未知語検出装置、未知語検出方法、プログラム | |
US11894017B2 (en) | Voice/non-voice determination device, voice/non-voice determination model parameter learning device, voice/non-voice determination method, voice/non-voice determination model parameter learning method, and program | |
JP7176629B2 (ja) | 識別モデル学習装置、識別装置、識別モデル学習方法、識別方法、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181107 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190920 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20191001 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191017 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191029 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191030 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6612277 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |