JP7093081B2 - 学習装置、推定装置、推定方法、およびプログラム - Google Patents
学習装置、推定装置、推定方法、およびプログラム Download PDFInfo
- Publication number
- JP7093081B2 JP7093081B2 JP2019127181A JP2019127181A JP7093081B2 JP 7093081 B2 JP7093081 B2 JP 7093081B2 JP 2019127181 A JP2019127181 A JP 2019127181A JP 2019127181 A JP2019127181 A JP 2019127181A JP 7093081 B2 JP7093081 B2 JP 7093081B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- estimation
- utterance
- call scene
- learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
Description
Tomas Mikolov, Kai Chen, Greg Corrado, Jeffrey Dean, “Efficient estimation of word representations in vector space”, 2013, ICLR
増村 亮, 田中 智大, 安藤 厚志, 神山 歩相名, 大庭 隆伸, 青野 裕司, "対話コンテキストを考慮したニューラル通話シーン分割", 信学技報, vol.117, 2018.
この文献には、通話全体を人手により設定された複数のシーンに自動分割する通話シーン分割手法に関する技術が記載されている。そして、この技術が、例えば、コールセンタにおけるオペレータの業務支援に応用できることが記載されている。
次に、図2を参照して、本実施形態に係る推定方法について説明する。図2は、推定方法の一例を示すフローチャートである。
本実施形態では、図1に示す推定装置100においては、学習装置10と推定部20とを分けて記載しているが、学習装置10と推定部20とは一体的に形成されていてもよい。したがって、推定部20が、学習装置10が備える各部を備えていてもよい。
本発明は上記の実施形態および変形例に限定されるものではない。例えば、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。
また、上記の実施形態および変形例で説明した各装置における各種の処理機能をコンピュータによって実現してもよい。その場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD-ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させてもよい。
11 表現変換部
12 推定用データ生成部
13 通話シーン推定部
14 通話シーンデータ生成部
15 推定モデル学習部
20 推定部
100 推定装置
Claims (8)
- 音声区間の継続時間長を推定する推定モデルを学習する学習装置であって、
学習用発話情報に含まれる複数の単語を、複数の数値表現データに表現変換する表現変換部と、
複数の前記学習用発話情報および前記複数の数値表現データを用いて、前記継続時間長を推定するためのデータである推定用データを生成する推定用データ生成部と、
前記学習用発話情報における通話シーンを推定し、前記通話シーンが推定されたデータである通話シーン推定データに表現変換する通話シーン推定部と、
複数の前記学習用発話情報および前記通話シーン推定データを用いて、前記継続時間長を推定するためのデータである通話シーンデータを生成する通話シーンデータ生成部と、
前記推定用データ、前記通話シーンデータ、および前記複数の単語の継続時間長を用いて、所定の音声区間の継続時間長を推定する推定モデルを学習する推定モデル学習部と、
を備える、学習装置。 - 前記推定用データ生成部は、推定対象となる発話より過去の発話の学習用発話情報に含まれる複数の単語が表現変換された複数の数値表現データを用いて、前記過去の発話に関する第1データを取得し、前記推定対象となる発話の学習用発話情報に含まれる推定対象となる単語が表現変換された数値表現データを用いて、前記推定対象となる発話に関する第2データを取得し、前記第1データおよび前記第2データに基づいて、前記推定用データを生成し、
前記通話シーンデータ生成部は、前記過去の発話の学習用発話情報における通話シーンが推定された通話シーン推定データを用いて、前記過去の発話における通話シーンに関する第3データを取得し、前記推定対象となる発話の学習用発話情報における通話シーンが推定された前記推定対象となる発話における通話シーンに関する第4データを取得し、前記第3データおよび前記第4データに基づいて、前記通話シーンデータを生成する、請求項1に記載の学習装置。 - 前記推定用データ生成部は、前記推定対象となる発話の直前の発話の学習用発話情報に含まれる複数の単語の全てが表現変換された複数の数値表現データの統計量を用いて、前記第1データを取得する、請求項2に記載の学習装置。
- 前記通話シーンデータ生成部は、前記過去の発話に含まれる複数の発話の学習用発話情報における通話シーンが推定された複数の通話シーン推定データの統計量を用いて、前記第3データを取得する、請求項2に記載の学習装置。
- 前記通話シーンデータ生成部は、前記推定対象となる発話の直前の発話の学習用発話情報における通話シーンが推定された通話シーン推定データを用いて、前記第3データを取得する、請求項2に記載の学習装置。
- 音声区間の継続時間長を推定する推定装置であって、
請求項1から5のいずれか一項に記載の学習装置と、
前記推定モデル学習部により学習された推定モデルを用いて、ユーザの発話情報に基づいて、前記所定の音声区間の継続時間長を推定する推定部と、
を備える、推定装置。 - 音声区間の継続時間長を推定する推定方法であって、
学習用発話情報に含まれる複数の単語を、複数の数値表現データに表現変換するステップと、
複数の前記学習用発話情報および前記複数の数値表現データを用いて、前記継続時間長を推定するためのデータである推定用データを生成するステップと、
前記学習用発話情報における通話シーンを推定し、前記通話シーンが推定されたデータである通話シーン推定データに表現変換するステップと、
複数の前記学習用発話情報および前記通話シーン推定データを用いて、前記継続時間長を推定するためのデータである通話シーンデータを生成するステップと、
前記推定用データ、前記通話シーンデータ、および前記複数の単語の継続時間長を用いて、所定の音声区間の継続時間長を推定する推定モデルを学習するステップと、
前記推定モデルを用いて、ユーザの発話情報に基づいて、前記所定の音声区間の継続時間長を推定するステップと、
を含む、推定方法。 - コンピュータを、請求項1から5のいずれか一項に記載の学習装置として機能させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019127181A JP7093081B2 (ja) | 2019-07-08 | 2019-07-08 | 学習装置、推定装置、推定方法、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019127181A JP7093081B2 (ja) | 2019-07-08 | 2019-07-08 | 学習装置、推定装置、推定方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021012315A JP2021012315A (ja) | 2021-02-04 |
JP7093081B2 true JP7093081B2 (ja) | 2022-06-29 |
Family
ID=74227388
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019127181A Active JP7093081B2 (ja) | 2019-07-08 | 2019-07-08 | 学習装置、推定装置、推定方法、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7093081B2 (ja) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000310996A (ja) | 1999-04-28 | 2000-11-07 | Oki Electric Ind Co Ltd | 音声合成装置および音韻継続時間長の制御方法 |
JP2001265375A (ja) | 2000-03-17 | 2001-09-28 | Oki Electric Ind Co Ltd | 規則音声合成装置 |
JP2001350491A (ja) | 2000-06-07 | 2001-12-21 | Canon Inc | 音声処理方法および装置 |
WO2017046887A1 (ja) | 2015-09-16 | 2017-03-23 | 株式会社東芝 | 音声合成装置、音声合成方法、音声合成プログラム、音声合成モデル学習装置、音声合成モデル学習方法及び音声合成モデル学習プログラム |
WO2018151125A1 (ja) | 2017-02-15 | 2018-08-23 | 日本電信電話株式会社 | 単語ベクトル化モデル学習装置、単語ベクトル化装置、音声合成装置、それらの方法、及びプログラム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4684770B2 (ja) * | 2005-06-30 | 2011-05-18 | 三菱電機株式会社 | 韻律生成装置及び音声合成装置 |
-
2019
- 2019-07-08 JP JP2019127181A patent/JP7093081B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000310996A (ja) | 1999-04-28 | 2000-11-07 | Oki Electric Ind Co Ltd | 音声合成装置および音韻継続時間長の制御方法 |
JP2001265375A (ja) | 2000-03-17 | 2001-09-28 | Oki Electric Ind Co Ltd | 規則音声合成装置 |
JP2001350491A (ja) | 2000-06-07 | 2001-12-21 | Canon Inc | 音声処理方法および装置 |
WO2017046887A1 (ja) | 2015-09-16 | 2017-03-23 | 株式会社東芝 | 音声合成装置、音声合成方法、音声合成プログラム、音声合成モデル学習装置、音声合成モデル学習方法及び音声合成モデル学習プログラム |
WO2018151125A1 (ja) | 2017-02-15 | 2018-08-23 | 日本電信電話株式会社 | 単語ベクトル化モデル学習装置、単語ベクトル化装置、音声合成装置、それらの方法、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2021012315A (ja) | 2021-02-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5956679A (en) | Speech processing apparatus and method using a noise-adaptive PMC model | |
JP5768093B2 (ja) | 音声処理システム | |
JP6777768B2 (ja) | 単語ベクトル化モデル学習装置、単語ベクトル化装置、音声合成装置、それらの方法、及びプログラム | |
US11450332B2 (en) | Audio conversion learning device, audio conversion device, method, and program | |
US7292976B1 (en) | Active learning process for spoken dialog systems | |
JP2006510933A (ja) | センサ・ベース音声認識装置の選択、適応、および組合せ | |
CN113470662A (zh) | 生成和使用用于关键词检出系统的文本到语音数据和语音识别系统中的说话者适配 | |
WO2018192186A1 (zh) | 语音识别方法及装置 | |
US20230343319A1 (en) | speech processing system and a method of processing a speech signal | |
JP5180800B2 (ja) | 統計的発音変異モデルを記憶する記録媒体、自動音声認識システム及びコンピュータプログラム | |
JPWO2007105409A1 (ja) | 標準パタン適応装置、標準パタン適応方法および標準パタン適応プログラム | |
JP6845489B2 (ja) | 音声処理装置、音声処理方法、および音声処理プログラム | |
CN113327575B (zh) | 一种语音合成方法、装置、计算机设备和存储介质 | |
JP4829871B2 (ja) | 学習データ選択装置、学習データ選択方法、プログラムおよび記録媒体、音響モデル作成装置、音響モデル作成方法、プログラムおよび記録媒体 | |
JP3919475B2 (ja) | 話者特徴抽出装置および話者特徴抽出方法、音声認識装置、並びに、プログラム記録媒体 | |
JP6594251B2 (ja) | 音響モデル学習装置、音声合成装置、これらの方法及びプログラム | |
WO2020166359A1 (ja) | 推定装置、推定方法、及びプログラム | |
JP3920749B2 (ja) | 音声認識用音響モデル作成方法、その装置、そのプログラムおよびその記録媒体、上記音響モデルを用いる音声認識装置 | |
JP7093081B2 (ja) | 学習装置、推定装置、推定方法、およびプログラム | |
JP2008129527A (ja) | 音響モデル生成装置、方法、プログラム及びその記録媒体 | |
CN112489646B (zh) | 语音识别方法及其装置 | |
JP6542823B2 (ja) | 音響モデル学習装置、音声合成装置、それらの方法、及びプログラム | |
JP7279800B2 (ja) | 学習装置、推定装置、それらの方法、およびプログラム | |
JP6220733B2 (ja) | 音声分類装置、音声分類方法、プログラム | |
JP2734828B2 (ja) | 確率演算装置及び確率演算方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20190709 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210902 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220526 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220607 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220608 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7093081 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |