JP5302505B2 - 対話状況区切り推定方法、対話状況推定方法、対話状況推定システムおよび対話状況推定プログラム - Google Patents
対話状況区切り推定方法、対話状況推定方法、対話状況推定システムおよび対話状況推定プログラム Download PDFInfo
- Publication number
- JP5302505B2 JP5302505B2 JP2006326996A JP2006326996A JP5302505B2 JP 5302505 B2 JP5302505 B2 JP 5302505B2 JP 2006326996 A JP2006326996 A JP 2006326996A JP 2006326996 A JP2006326996 A JP 2006326996A JP 5302505 B2 JP5302505 B2 JP 5302505B2
- Authority
- JP
- Japan
- Prior art keywords
- utterance
- speaker
- amount
- situation
- speakers
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
1.Aさんによる提案内容説明
2.Aさんの提案内容に対して、A、B、Cさんで議論
3.Bさんによる提案内容説明
4.Bさんの提案内容に対して、A、B、Cさんで議論
5.Cさんによる提案内容説明
6.Cさんの提案内容に対して、A、B、Cさんで議論
以下、本発明の第1の実施の形態を図面を参照して説明する。図1は、本発明の第1の実施の形態に係る対話状態区切り推定システムの構成例を示すブロック図である。
次に、本発明の第2の実施の形態を図面を参照して説明する。図3は、本発明の第2の実施の形態に係る対話状況区切り推定システムの構成例を示すブロック図である。
次に、本発明の第3の実施の形態を図面を参照して説明する。図4は、本発明の第3の実施の形態に係る対話状況推定システムの構成例を示すブロック図である。
次に、本発明の第4の実施の形態を図面を参照して説明する。図5は、本発明の第4の実施の形態に係る対話状況推定システムの構成例を示すブロック図である。図5に示す対話状況推定システムを図4に示した対話状況推定システムと比較すると、図4に示す発話量抽出部4が図5では発話量・話者切替わりパタン抽出部41となっている点と、図4に示す対話状況モデル比較部8が図5では対話状況モデル比較部81となっている点のみが相違している。発話量・話者切替わりパタン抽出部41と対話状況モデル比較部81以外の動作は第3の実施の形態と同様であるため説明を省略する。また、発話量抽出部4と発話量・話者切替わりパタン抽出部41の相違点は本発明の第2の実施の形態に係る対話状況区切り推定システムの説明において述べたので、ここでは対話状況モデル比較部81の説明のみを行う。
次に、本発明の第5の実施の形態を図面を参照して説明する。図6は、本発明の第5の実施の形態に係る音声信号ストリームクラスタリングシステムの構成例を示すブロック図である。図6に示す音声信号ストリームクラスタリングシステムは、対話状況推定システム10と、音声信号ストリームクラスタリング部20とを有する。
次に、本発明の第6の実施の形態を図面を参照して説明する。図7は、本発明の第6の実施の形態に係る音声信号ストリーム内容推定システムの構成例を示すブロック図である。図7に示す音声信号ストリーム内容推定システム(入力信号内容推定システム)は、対話状況推定システム10と、音声信号ストリーム内容モデル30と、音声信号ストリーム内容モデル比較部40と、音声信号ストリーム内容推定部50とを有する。
次に、本発明の第7の実施の形態を図面を参照して説明する。図8は、本発明の第7の実施の形態に係る音声認識システムの構成例を示すブロック図である。図8に示す音声認識システムは、対話状況推定システム10と、音響モデル・辞書制御部60と、音声認識部70と、辞書80と、音響モデル90とを有する。
次に、本発明の第8の実施の形態を図面を参照して説明する。図9は、本発明の第8の実施の形態に係る音声認識結果を利用する音声書き起こしシステムの構成例を示すブロック図である。図9に示す音声書き起こしシステムは、対話状況推定システム10と、音声認識結果出力制御部100と、音声認識システム110と、音声書き起こし部120とを有する。
次に、本発明の第9の実施の形態を図面を参照して説明する。図10は、本発明の第9の実施の形態に係る音声検索システムの構成例を示すブロック図である。本発明の第9の実施の形態は、対話状況推定システム10と、音声検索結果出力制御部130と、音声検索部140とを有する。
次に、本発明の第10の実施の形態を図面を参照して説明する。図11は、本発明の第10の実施の形態に係る音声検索システムの構成例を示すブロック図である。本発明の第10の実施の形態は、音声信号ストリーム内容推定システム150と、音声検索結果出力制御部160と、音声検索部140とを有する。
2 発話者決定部
3 ストリーム分割部
4 発話量抽出部
41 発話量、話者切替わりパタン抽出部
5 ばらつき度合い抽出部
6 対話状況区切り推定部
61 対話状況区切り推定部
7 対話状況モデル
8 対話状況モデル比較部
81 対話状況モデル比較部
9 対話状況推定部
10 対話状況推定システム
20 音声信号ストリームクラスタリング部
30 音声信号ストリーム内容モデル
40 音声信号ストリーム内容モデル比較部
50 音声信号ストリーム内容推定部
60 音響モデル、辞書制御部
70 音声認識部
80 辞書
90 音響モデル
100 音声認識結果出力制御部
110 音声認識システム
120 音声書き起こし部
130 音声検索結果出力制御部
140 音声検索部
150 音声信号ストリーム内容推定システム
160 音声検索結果出力制御部
Claims (24)
- 複数の話者の音声を含む入力信号が示す場面に応じた少なくとも1名以上の話者の発話の当該入力信号中の一定期間におけるまとまりを示す対話状況の区切りを推定する対話状況区切り推定方法であって、
入力信号中の音声区間を検出する音声区間検出ステップと、
検出した音声区間において発話している話者を特定する発話者特定ステップと、
入力信号を所定の時間窓で区切る分割ステップと、
各音声区間において発話している話者の特定結果に基づいて、前記時間窓で区切った区間毎に、各話者の発話量を算出する発話量抽出ステップと、
算出した各話者の発話量に基づいて、前記時間窓で区切った区間毎に、話者間の発話量のばらつき度合いとして、当該話者間の各発話の発話量の分散度合いを算出するばらつき度合抽出ステップと、
算出した話者間の発話量のばらつき度合いを特徴量として用いて、前記時間窓で区切られた異なる区間における当該特徴量の変化量に基づいて、話者間の対話状況の区切りを示す対話状況区切りを推定する対話状況区切り推定ステップとを含み、
前記対話状況区切り推定ステップで、前記時間窓で区切られた少なくとも1つ以上の一の区間と、前記一の区間とは異なる少なくとも1つ以上の他の区間の前記特徴量を比較し、両者の特徴量の変化量が所定の基準を満たした場合に、前記他の区間を対話状況の区切りと推定する
ことを特徴とする対話状況区切り推定方法。 - 発話量抽出ステップで、分割ステップで所定の時間窓で区切られた区間毎に、発話者決定ステップで決定された各音声区間の発話者に基づいて、各話者の発話量と、話者の切り替わりに関する値を示す話者切替わり回数を含む話者切替わりパタンとを算出し、
対話状況区切り推定ステップで、ばらつき度合抽出ステップで算出された話者間の発話量のばらつき度合いと前記発話量抽出ステップで算出された話者切替わりパタンとを特徴量として、前記時間窓で区切られた異なる区間における特徴量の変化に基づいて対話状況区切りを推定する
請求項1記載の対話状況区切り推定方法。 - 発話量抽出ステップで、発話回数、平均発話時間および発話時間のうちの少なくとも1つを含む発話量を算出する請求項1または請求項2記載の対話状況区切り推定方法。
- 発話量抽出ステップで、発話回数、平均発話時間および発話時間のうちの少なくとも1つと、他の話者との発話重複回数、他の話者との平均発話重複時間および他の話者との発話重複時間のうちの少なくとも1つとを含む発話量を算出する請求項1または請求項2記載の対話状況区切り推定方法。
- ばらつき度合抽出ステップで、ばらつき度合を示す指標としてエントロピー、分散、標準偏差および最大値と最小値の差分値のうちの少なくとも1つを含む話者間の発話量のばらつき度合いを算出する請求項1から請求項4のうちのいずれか1項に記載の対話状況区切り推定方法。
- 対話状況区切り推定ステップで、前記時間窓で区切られた異なる区間の前記特徴量の距離を、予め定められた閾値と比較することにより対話状況区切りを推定する請求項1から請求項5のうちのいずれか1項に記載の対話状況区切り推定方法。
- 対話状況区切り推定ステップで、ばらつき度合抽出ステップで算出された話者間の発話量のばらつき度合いを示す特徴量を、予め定められた複数の対話状況に対応したクラスタ、予め定められた複数の前記クラスタを入力信号に適応させた前記クラスタおよび入力信号から作成された複数の前記クラスタのうちの少なくとも1つの前記クラスタの特徴量と比較し、最も距離が近い前記クラスタの時間遷移に応じて対話状況区切りを推定する請求項1から請求項5のうちのいずれか1項に記載の対話状況区切り推定方法。
- 複数の話者の音声を含む入力信号が示す場面に応じた少なくとも1名以上の話者の発話の当該入力信号中の一定期間におけるまとまりを示す対話状況を推定する対話状況推定方法であって、
入力信号中の音声区間を検出する音声区間検出ステップと、
検出した音声区間において発話している話者を特定する発話者特定ステップと、
入力信号を所定の時間窓で区切る分割ステップと、
各音声区間において発話している話者の特定結果に基づいて、前記時間窓で区切った区間毎に、各話者の発話量を算出する発話量抽出ステップと、
算出した各話者の発話量に基づいて、前記時間窓で区切った区間毎に、話者間の発話量のばらつき度合いとして、当該話者間の各発話の発話量の分散度合いを算出するばらつき度合抽出ステップと、
算出した話者間の発話量のばらつき度合いを特徴量として用いて、当該特徴量を、対話状況に対応付けられた特徴量のモデルを示す予め記憶された対話状況モデルと比較し、当該特徴量が示す対話状況の確率値を算出する対話状況モデル比較ステップと、
比較した結果として算出された確率値に基づいて、時間位置毎の対話状況を推定する対話状況推定ステップとを含む
ことを特徴とする対話状況推定方法。 - 発話量抽出ステップで、分割ステップで所定の時間窓で区切られた区間毎に、発話者決定ステップで決定された各音声区間の発話者に基づいて、各話者の発話量と、話者の切り替わりに関する値を示す話者切替わりパタンとを算出し、
対話状況モデル比較ステップで、ばらつき度合抽出ステップで算出された話者間の発話量のばらつき度合いと前記発話量抽出ステップで算出された話者切替わりパタンとを特徴量として、当該特徴量を対話状況モデルと比較する
請求項8記載の対話状況推定方法。 - 発話量抽出ステップで、話者切替わり回数を含む話者切替わりパタンを算出する請求項9記載の対話状況推定方法。
- 発話量抽出ステップで、発話回数、平均発話時間および発話時間のうちの少なくとも1つを含む発話量を算出する請求項8から請求項10のうちのいずれか1項に記載の対話状況推定方法。
- 発話量抽出ステップで、発話回数、平均発話時間および発話時間のうちの少なくとも1つと、他の話者との発話重複回数、他の話者との平均発話重複時間および他の話者との発話重複時間のうちの少なくとも1つとを含む発話量を算出する請求項8から請求項10のうちのいずれか1項に記載の対話状況推定方法。
- ばらつき度合抽出ステップで、ばらつき度合を示す指標としてエントロピー、分散、標準偏差および最大値と最小値の差分値のうちの少なくとも1つを含む話者間の発話量のばらつき度合いを算出する請求項8から請求項12うちのいずれか1項に記載の対話状況推定方法。
- 対話状況モデル比較ステップで、特徴量を、予め対話状況を示す対話状況ラベルが付与されたデータで学習された対話状況モデル、予め作成された規則に対話状況ラベルが付与された対話状況モデル、予め対話状況ラベルが付与されたデータで学習された対話状況モデルを入力信号の対話状況に適応させた対話状況モデルおよび予め作成された規則に対話状況ラベルが付与された対話状況モデルを入力信号の対話状況に適応させた対話状況モデルのうち少なくとも1つの対話状況モデルと比較する請求項8から請求項13のうちのいずれか1項に記載の対話状況推定方法。
- 請求項8から請求項14のうちのいずれか1項に記載の対話状況推定方法によって推定された時間位置毎の対話状況を示す遷移情報を特徴量として、複数の入力信号をクラスタリングするクラスタリングステップを含むことを特徴とする入力信号クラスタリング方法。
- 請求項8から請求項14のうちのいずれか1項に記載の対話状況推定方法によって推定された時間位置毎の対話状況の遷移情報を特徴量として、当該特徴量を、予め入力信号の内容を示す入力信号内容ラベルが付与されたデータで学習された入力信号内容モデルおよび予め作成された規則に入力信号内容ラベルが付与された入力信号内容モデルのうち少なくとも1つの入力信号内容モデルと比較する入力信号内容モデル比較ステップと、
前記入力信号内容モデル比較ステップで比較した結果に基づいて、入力信号の内容を推定する入力信号内容推定ステップと
を含むことを特徴とする入力信号内容推定方法。 - 請求項8から請求項14のうちのいずれか1項に記載の対話状況推定方法によって推定された時間位置毎の対話状況に応じて、音声認識に用いられる音響モデル、言語モデル、辞書および音声認識における探索範囲を調整するためのパラメタのうち少なくとも1つを制御するステップを含むことを特徴とする音声認識方法。
- 請求項8から請求項14のうちのいずれか1項に記載の対話状況推定方法によって推定された時間位置毎の対話状況に応じて、音声認識結果の出力方法を制御するステップを含むことを特徴とする音声認識結果を利用する音声書き起こし方法。
- 請求項8から請求項14のうちのいずれか1項に記載の対話状況推定方法によって推定された時間位置毎の対話状況に応じて、音声検索結果の出力方法を制御するステップを含むことを特徴とする音声検索方法。
- 請求項16記載の入力信号内容推定方法によって推定された入力信号内容に応じて、音声検索結果の出力方法を制御するステップを含むことを特徴とする音声検索方法。
- 複数の話者の音声を含む入力信号が示す場面に応じた少なくとも1名以上の話者の発話の当該入力信号中の一定期間におけるまとまりを示す対話状況の区切りを推定する対話状況区切り推定システムであって、
入力信号中の音声区間を検出する音声区間検出手段と、
前記音声区間検出手段が検出した音声区間において発話している話者を特定する発話者特定手段と、
入力信号を所定の時間窓で区切る分割手段と、
各音声区間において発話している話者の特定結果に基づいて、前記時間窓で区切った区間毎に、各話者の発話量を算出する発話量抽出手段と、
前記発話量抽出手段が算出した各話者の発話量に基づいて、前記時間窓で区切った区間毎に、話者間の発話量のばらつき度合いとして、当該話者間の各発話の発話量の分散度合いを算出するばらつき度合抽出手段と、
前記ばらつき度合抽出手段が算出した話者間の発話量のばらつき度合いを特徴量として用いて、前記時間窓で区切られた異なる区間における当該特徴量の変化量に基づいて、話者間の対話状況の区切りを示す対話状況区切りを推定する対話状況区切り推定手段とを備え、
前記対話状況区切り推定手段は、前記時間窓で区切られた少なくとも1つ以上の一の区間と、前記一の区間とは異なる少なくとも1つ以上の他の区間の前記特徴量を比較し、両者の特徴量の変化量が所定の基準を満たした場合に、前記他の区間を対話状況の区切りと推定する
ことを特徴とする対話状況区切り推定システム。 - 複数の話者の音声を含む入力信号が示す場面に応じた少なくとも1名以上の話者の発話の当該入力信号中の一定期間におけるまとまりを示す対話状況を推定する対話状況推定システムであって、
入力信号中の音声区間を検出する音声区間検出手段と、
前記音声区間検出手段が検出した音声区間において発話している話者を特定する発話者特定手段と、
入力信号を所定の時間窓で区切る分割手段と、
各音声区間において発話している話者の特定結果に基づいて、前記時間窓で区切った区間毎に、各話者の発話量を算出する発話量抽出手段と、
前記発話量抽出手段が算出した各話者の発話量に基づいて、前記時間窓で区切った区間毎に、話者間の発話量のばらつき度合いとして、当該話者間の各発話の発話量の分散度合いを算出するばらつき度合抽出手段と、
前記ばらつき度合抽出手段が算出した話者間の発話量のばらつき度合いを特徴量として用いて、当該特徴量を、対話状況に対応付けられた特徴量のモデルを示す予め記憶された対話状況モデルと比較し、当該特徴量が示す対話状況の確率値を算出する対話状況モデル比較手段と、
前記対話状況モデル比較手段が比較した結果として算出された確率値に基づいて、時間位置毎の対話状況を推定する対話状況推定手段とを備えた
ことを特徴とする対話状況推定システム。 - 複数の話者の音声を含む入力信号が示す場面に応じた少なくとも1名以上の話者の発話の当該入力信号中の一定期間におけるまとまりを示す対話状況の区切りを推定するための対話状況区切り推定プログラムであって、
コンピュータに、
入力信号中の音声区間を検出する音声区間検出処理と、
検出した音声区間において発話している話者を特定する発話者特定処理と、
入力信号を所定の間窓で区切る分割処理と、
各音声区間において発話している話者の特定結果に基づいて、前記時間窓で区切った区間毎に、各話者の発話量を算出する発話量抽出処理と、
算出した各話者の発話量に基づいて、前記時間窓で区切った区間毎に、話者間の発話量のばらつき度合いとして、当該話者間の各発話の発話量の分散度合いを算出するばらつき度合抽出処理と、
算出した話者間の発話量のばらつき度合いを特徴量として用いて、前記時間窓で区切られた異なる区間における当該特徴量の変化量に基づいて、話者間の対話状況の区切りを示す対話状況区切りを推定する対話状況区切り推定処理とを実行させ、
前記対話状況区切り推定処理で、前記時間窓で区切られた少なくとも1つ以上の一の区間と、前記一の区間とは異なる少なくとも1つ以上の他の区間の前記特徴量を比較し、両者の特徴量の変化量が所定の基準を満たした場合に、前記他の区間を対話状況の区切りと推定させる
ための対話状況区切り推定プログラム。 - 複数の話者の音声を含む入力信号が示す場面に応じた少なくとも1名以上の話者の発話の当該入力信号中の一定期間におけるまとまりを示す対話状況を推定するための対話状況推定プログラムであって、
コンピュータに、
入力信号中の音声区間を検出する音声区間検出処理と、
検出した音声区間において発話している話者を特定する発話者特定処理と、
入力信号を所定の時間窓で区切る分割処理と、
各音声区間において発話している話者の特定結果に基づいて、前記時間窓で区切った区間毎に、各話者の発話量を算出する発話量抽出処理と、
算出した各話者の発話量に基づいて、前記時間窓で区切った区間毎に、話者間の発話量のばらつき度合いとして、当該話者間の各発話の発話量の分散度合いを算出するばらつき度合抽出処理と、
算出した話者間の発話量のばらつき度合いを特徴量として用いて、当該特徴量を、対話状況に対応付けられた特徴量のモデルを示す予め記憶された対話状況モデルと比較し、当該特徴量が示す対話状況の確率値を算出する対話状況モデル比較処理と、
比較した結果として算出された確率値に基づいて、時間位置毎の対話状況を推定する対話状況推定処理とを実行させる
ための対話状況推定プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006326996A JP5302505B2 (ja) | 2006-12-04 | 2006-12-04 | 対話状況区切り推定方法、対話状況推定方法、対話状況推定システムおよび対話状況推定プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006326996A JP5302505B2 (ja) | 2006-12-04 | 2006-12-04 | 対話状況区切り推定方法、対話状況推定方法、対話状況推定システムおよび対話状況推定プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008139654A JP2008139654A (ja) | 2008-06-19 |
JP5302505B2 true JP5302505B2 (ja) | 2013-10-02 |
Family
ID=39601177
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006326996A Active JP5302505B2 (ja) | 2006-12-04 | 2006-12-04 | 対話状況区切り推定方法、対話状況推定方法、対話状況推定システムおよび対話状況推定プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5302505B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5052449B2 (ja) * | 2008-07-29 | 2012-10-17 | 日本電信電話株式会社 | 発話区間話者分類装置とその方法と、その装置を用いた音声認識装置とその方法と、プログラムと記録媒体 |
JP5691174B2 (ja) * | 2010-01-05 | 2015-04-01 | 富士通株式会社 | オペレータ選定装置、オペレータ選定プログラム、オペレータ評価装置、オペレータ評価プログラム及びオペレータ評価方法 |
JP6440967B2 (ja) * | 2014-05-21 | 2018-12-19 | 日本電信電話株式会社 | 文末記号推定装置、この方法及びプログラム |
JP6303971B2 (ja) * | 2014-10-17 | 2018-04-04 | 富士通株式会社 | 話者交替検出装置、話者交替検出方法及び話者交替検出用コンピュータプログラム |
JP6589040B1 (ja) * | 2018-01-16 | 2019-10-09 | ハイラブル株式会社 | 音声分析装置、音声分析方法、音声分析プログラム及び音声分析システム |
JP7279928B2 (ja) | 2019-03-14 | 2023-05-23 | ハイラブル株式会社 | 議論分析装置及び議論分析方法 |
JP7168223B2 (ja) * | 2019-10-28 | 2022-11-09 | ハイラブル株式会社 | 音声分析装置、音声分析方法、音声分析プログラム及び音声分析システム |
KR102661537B1 (ko) * | 2023-11-07 | 2024-04-25 | 전훈철 | 가상 공간에서 언어 학습을 제공하기 위한 장치, 시스템, 및 방법 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3664499B2 (ja) * | 1994-08-16 | 2005-06-29 | 富士通株式会社 | 音声情報の処理方法及びその装置 |
JP4183645B2 (ja) * | 2004-03-23 | 2008-11-19 | 株式会社国際電気通信基礎技術研究所 | 会話先導者判別装置および会話先導者判別方法 |
JP4011573B2 (ja) * | 2004-09-10 | 2007-11-21 | 日本電信電話株式会社 | 会議構造把握支援方法、装置、プログラム、及び該プログラムを格納した記録媒体 |
JP2006251042A (ja) * | 2005-03-08 | 2006-09-21 | Fuji Xerox Co Ltd | 情報処理装置、情報処理方法およびプログラム |
-
2006
- 2006-12-04 JP JP2006326996A patent/JP5302505B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2008139654A (ja) | 2008-06-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11636860B2 (en) | Word-level blind diarization of recorded calls with arbitrary number of speakers | |
JP5302505B2 (ja) | 対話状況区切り推定方法、対話状況推定方法、対話状況推定システムおよび対話状況推定プログラム | |
US9881617B2 (en) | Blind diarization of recorded calls with arbitrary number of speakers | |
Meignier et al. | Step-by-step and integrated approaches in broadcast news speaker diarization | |
Zhou et al. | Efficient audio stream segmentation via the combined T/sup 2/statistic and Bayesian information criterion | |
US9672825B2 (en) | Speech analytics system and methodology with accurate statistics | |
JP5381988B2 (ja) | 対話音声認識システム、対話音声認識方法および対話音声認識用プログラム | |
Vinciarelli | Speakers role recognition in multiparty audio recordings using social network analysis and duration distribution modeling | |
Yella et al. | Overlapping speech detection using long-term conversational features for speaker diarization in meeting room conversations | |
CN106847259B (zh) | 一种音频关键词模板的筛选和优化方法 | |
Ajmera et al. | Robust audio segmentation | |
JP2012048119A (ja) | 音声区間検出方法、音声認識方法、音声区間検出装置、音声認識装置、そのプログラム及び記録媒体 | |
Makishima et al. | Joint Autoregressive Modeling of End-to-End Multi-Talker Overlapped Speech Recognition and Utterance-level Timestamp Prediction | |
Kumar et al. | Robust Multichannel Gender Classification from Speech in Movie Audio. | |
JP2013235050A (ja) | 情報処理装置及び方法、並びにプログラム | |
Park et al. | GMM adaptation based online speaker segmentation for spoken document retrieval | |
CN116483960B (zh) | 对话识别方法、装置、设备以及存储介质 | |
Breslin et al. | Continuous asr for flexible incremental dialogue | |
US12087307B2 (en) | Method and apparatus for performing speaker diarization on mixed-bandwidth speech signals | |
US11984127B2 (en) | Training and using a transcript generation model on a multi-speaker audio stream | |
SPEAKER | TROPE | |
CN116052650A (zh) | 一种语音识别方法、装置、存储介质及设备 | |
Diliberto et al. | Speaker diarization with overlapped speech | |
CN118430538A (zh) | 一种纠错多模态模型构建方法、系统、设备及介质 | |
Uebler et al. | Is speech technology ready for use now? |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20091116 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110704 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110712 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110912 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120306 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120605 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20120613 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20120706 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130621 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5302505 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |