JP2010197706A - 話題判定装置および話題判定方法 - Google Patents
話題判定装置および話題判定方法 Download PDFInfo
- Publication number
- JP2010197706A JP2010197706A JP2009042344A JP2009042344A JP2010197706A JP 2010197706 A JP2010197706 A JP 2010197706A JP 2009042344 A JP2009042344 A JP 2009042344A JP 2009042344 A JP2009042344 A JP 2009042344A JP 2010197706 A JP2010197706 A JP 2010197706A
- Authority
- JP
- Japan
- Prior art keywords
- topic
- language model
- specific
- score
- fraud
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Telephone Function (AREA)
Abstract
【解決手段】話題判定装置100は、詐欺の話題に特化したデータを収集する詐欺データ収集部120、当該データを用いて詐欺の話題に特化した詐欺LMを作成する詐欺LM作成部130、当該詐欺LMを保持する詐欺LM保持部140、音響モデルを保持する音響モデル保持部150、詐欺LMおよび音響モデルを用いて入力音声に対する音声認識を行い、且つ音声認識の結果に対するスコアを計算する音声認識部160、入力音声の内容が詐欺の話題に相当するか否かを判定するための判断基準となる閾値を保持する閾値保持部170、音声認識部160が計算したスコアを入力し、当該スコアが閾値保持部170に保持された閾値以上である場合に、入力音声の内容が詐欺の話題に相当すると判定する判定部180、を備える。
【選択図】図1
Description
発話:“会社のお金を使い込んだ。払わないと監査に間に合わない。このままでは横領罪になって捕まってしまう。”
この発話に対して音声認識を行った結果、以下のように誤認識されたとする。
音声認識結果:“会社のお金を使いこなした。払わないと検査に間に合わない。このままでは奉公になって捕まってしまう。”
なお、このような誤認識は特に珍しいものでもなく、音声認識の精度に応じては、十分に起こり得る程度のものである。
(詐欺判定装置100の構成)
まず、本発明の第1実施形態に係る詐欺判定装置100の構成について、図1および図2を参照しながら説明する。図1は詐欺判定装置100の構成概要図であり、図2はそのハードウェア構成図である。詐欺判定装置100は、例えば電話機(図示せず)を用いた発声である入力音声に対して音声認識を行い、その内容が特定の話題に関連した内容であるか否かを判定する装置である。本実施形態における「特定の話題」とは、例えば「オレオレ詐欺」等の電話機を用いた詐欺の話題である。
言語データの例:
“学生時代の友人に頼まれ、借金の保証人になってしまった。”
“友人が返済できず、保証人の僕がサラ金から借金をして返すことになった。”
“ご主人が、電車内で痴漢・わいせつ行為をやって捕まっている。示談が成立しなければ裁判になる。”
参考文献1:音声認識システム、ISBN/ASIN:4-274-13228-5、鹿野清宏他、オーム社
続いて、詐欺判定装置100により行われる動作(特許請求の範囲の「話題判定方法」)について、図3を参照しながら説明する。図3は詐欺判定装置100により行われる動作を示すフローチャートである。なお、以下の説明においては、詐欺データ収集部120および詐欺LM作成部130による詐欺データ収集処理および詐欺LM作成処理(特許請求の範囲の「データ収集ステップ」および「話題特化言語モデル作成ステップ」に相当)は既に行われており、作成された詐欺LMが既に詐欺LM保持部140に保持されているものとする(特許請求の範囲の「言語モデル保持ステップ」に相当)。また、音響モデルにおいても、既に音響モデル保持部150に保持されているものとする(特許請求の範囲の「音響モデル保持ステップ」に相当)。また、閾値保持部170には、入力音声の内容が詐欺の話題に相当するか否かを判定するための判断基準となる閾値Xが既に保持されているものとする(特許請求の範囲の「閾値保持ステップ」に相当)。
入力音声の例: “会社のお金を使い込んだ。払わないと監査に間に合わない。このままでは横領罪になって捕まってしまう。”
このような入力音声に対してステップS12の音声認識処理を行い、以下のような結果を得たとする。
音声認識の結果の例:“会社のお金を使いこなした。払わないと検査に間に合わない。このままでは奉公になって捕まってしまう。”
このような音声認識処理の結果に対してステップS13のスコア計算処理を行い、そのスコアSが例えば0.8であり、閾値Xが例えば0.7である場合には、ステップS15において上記入力音声は詐欺の話題であると判定される。つまり、本実施形態により、帯域が狭く且つ雑音の影響が大きいことから認識率が特に低い電話音声の場合に、「使い込んだ」、「監査」、「横領」等のキーワードが適切に認識されなかったにもかかわらず、入力音声が詐欺の話題であるか否かが適切に判定される。
続いて、本発明の第2実施形態について説明する。なお、上記説明した第1実施形態と重複する部分については説明を省略し、第1実施形態との相違点を中心に説明する。
続いて、詐欺判定装置200により行われる動作(特許請求の範囲の「話題判定方法」)について、図5を参照しながら説明する。図5は詐欺判定装置200により行われる動作を示すフローチャートである。なお、以下の説明においては、詐欺データ収集部120および詐欺LM作成部130による詐欺データ収集処理および詐欺LM作成処理(特許請求の範囲の「データ収集ステップ」および「話題特化言語モデル作成ステップ」に相当)は既に行われており、作成された詐欺LMが既に詐欺LM保持部140に保持されており、詐欺の話題に特化していない一般LMが既に一般LM保持部210に保持されているものとする(特許請求の範囲の「言語モデル保持ステップ」に相当)。また、音響モデルにおいても、既に音響モデル保持部150に保持されているものとする(特許請求の範囲の「音響モデル保持ステップ」に相当)。
入力音声の例:“会社のお金を使い込んだ。払わないと監査に間に合わない。このままでは横領罪になって捕まってしまう。”
このような入力音声に対してステップS22の音声認識処理およびステップS24の音声認識処理を行い、以下のような結果を得たとする。
S22の結果例:“カードのお金を使いこなした。払わないと検査に間に合わない。警察局では奉公になって捕まってしまう。”
S24の結果例:“会社のお金を使いこなした。払わないと検査に間に合わない。このままでは奉公になって捕まってしまう。”
このような音声認識処理の結果に対してステップS23およびステップS25のスコア計算処理を行い、第1スコアS1が例えば0.8であり、第2スコアS2が例えば0.4である場合には、ステップS27において上記入力音声は詐欺の話題であると判定される。つまり、本実施形態により、帯域が狭く且つ雑音の影響が大きいことから認識率が特に低い電話音声の場合に、「使い込んだ」、「監査」、「横領」等のキーワードが適切に認識されなかったにもかかわらず、入力音声が詐欺の話題であるか否かが適切に判定される。
続いて、本発明の第3実施形態について説明する。なお、上記説明した第1実施形態や第2実施形態と重複する部分については説明を省略し、第1実施形態や第2実施形態との相違点を中心に説明する。
続いて、詐欺判定装置300により行われる動作(特許請求の範囲の「話題判定方法」)について、図7を参照しながら説明する。図7は詐欺判定装置300により行われる動作を示すフローチャートである。なお、以下の説明においては、詐欺データ収集部120および詐欺LM作成部130による詐欺データ収集処理および詐欺LM作成処理(特許請求の範囲の「データ収集ステップ」および「話題特化言語モデル作成ステップ」に相当)は既に行われており、作成された詐欺LMが既に詐欺LM保持部140に保持されており、詐欺の話題に特化していない一般LMが既に一般LM保持部210に保持されているものとする(特許請求の範囲の「言語モデル保持ステップ」に相当)。また、音響モデルにおいても、既に音響モデル保持部150に保持されているものとする(特許請求の範囲の「音響モデル保持ステップ」に相当)。
Claims (9)
- 特定の話題に特化したデータを収集するデータ収集手段と、
前記データ収集手段が収集したデータを用いて、前記特定の話題に特化した話題特化言語モデルを作成する話題特化言語モデル作成手段と、
前記話題特化言語モデル作成手段が作成した話題特化言語モデルを保持する言語モデル保持手段と、
音声認識を行うための音響モデルを保持する音響モデル保持手段と、
前記言語モデル保持手段に保持された話題特化言語モデルおよび前記音響モデル保持手段に保持された音響モデルを用いて、入力音声に対する音声認識を行い、且つ前記音声認識の結果に対するスコアを計算する音声認識手段と、
前記入力音声の内容が前記特定の話題に相当するか否かを判定するための判断基準となる閾値を保持する閾値保持手段と、
前記音声認識手段が計算したスコアを入力し、当該スコアが前記閾値保持手段に保持された閾値以上である場合に、前記入力音声の内容が前記特定の話題に相当すると判定する判定手段と、
を備えることを特徴とする話題判定装置。 - 前記話題特化言語モデルは、単語の出現確率をモデル化した統計的言語モデルであることを特徴とする請求項1に記載の話題判定装置。
- 前記話題特化言語モデルは、単語間の接続確率をモデル化した統計的言語モデルであることを特徴とする請求項1に記載の話題判定装置。
- 前記特定の話題は、詐欺の話題であることを特徴とする請求項1〜3何れか1項に記載の話題判定装置。
- 前記入力音声は、電話機を用いた発声であることを特徴とする請求項1〜4何れか1項に記載の話題判定装置。
- 特定の話題に特化したデータを収集するデータ収集手段と、
前記データ収集手段が収集したデータを用いて、前記特定の話題に特化した話題特化言語モデルを作成する話題特化言語モデル作成手段と、
前記話題特化言語モデル作成手段が作成した話題特化言語モデル、および前記特定の話題に特化していない一般話題言語モデルを保持する言語モデル保持手段と、
音声認識を行うための音響モデルを保持する音響モデル保持手段と、
前記言語モデル保持手段に保持された話題特化言語モデルおよび前記音響モデル保持手段に保持された音響モデルを用いて入力音声に対する第1音声認識を行い、且つ前記言語モデル保持手段に保持された一般話題言語モデルおよび前記音響モデル保持手段に保持された音響モデルを用いて前記入力音声に対する第2音声認識を行い、更に前記第1音声認識の結果に対する第1スコアおよび前記第2音声認識の結果に対する第2スコアを計算する音声認識手段と、
前記音声認識手段が計算した第1スコアおよび第2スコアを入力し、前記第1スコアが前記第2スコア以上である場合に、前記入力音声の内容が前記特定の話題に相当すると判定する判定手段と、
を備えることを特徴とする話題判定装置。 - 前記特定の話題に特化したキーワードを保持するキーワード保持手段を更に備え、
前記判定手段は、前記第1スコアが前記第2スコア以上であることに加え、前記第1音声認識の結果または前記第2音声認識の結果に前記キーワードが一定回数以上検知された場合に、前記入力音声の内容が前記特定の話題に相当すると判定することを特徴とする請求項6に記載の話題判定装置。 - データ収集手段が、特定の話題に特化したデータを収集するデータ収集ステップと、
話題特化言語モデル作成手段が、前記データ収集手段が収集したデータを用いて、前記特定の話題に特化した話題特化言語モデルを作成する話題特化言語モデル作成ステップと、
言語モデル保持手段が、前記話題特化言語モデル作成手段が作成した話題特化言語モデルを保持する言語モデル保持ステップと、
音響モデル保持手段が、音声認識を行うための音響モデルを保持する音響モデル保持ステップと、
音声認識手段が、前記言語モデル保持手段に保持された話題特化言語モデルおよび前記音響モデル保持手段に保持された音響モデルを用いて、入力音声に対する音声認識を行い、且つ前記音声認識の結果に対するスコアを計算する音声認識ステップと、
閾値保持手段が、前記入力音声の内容が前記特定の話題に相当するか否かを判定するための判断基準となる閾値を保持する閾値保持ステップと、
判定手段が、前記音声認識手段が計算したスコアを入力し、当該スコアが前記閾値保持手段に保持された閾値以上である場合に、前記入力音声の内容が前記特定の話題に相当すると判定する判定ステップと、
を備えることを特徴とする話題判定方法。 - データ収集手段が、特定の話題に特化したデータを収集するデータ収集ステップと、
話題特化言語モデル作成手段が、前記データ収集手段が収集したデータを用いて、前記特定の話題に特化した話題特化言語モデルを作成する話題特化言語モデル作成ステップと、
言語モデル保持手段が、前記話題特化言語モデル作成手段が作成した話題特化言語モデル、および前記特定の話題に特化していない一般話題言語モデルを保持する言語モデル保持ステップと、
音響モデル保持手段が、音声認識を行うための音響モデルを保持する音響モデル保持ステップと、
音声認識手段が、前記言語モデル保持手段に保持された話題特化言語モデルおよび前記音響モデル保持手段に保持された音響モデルを用いて入力音声に対する第1音声認識を行い、且つ前記言語モデル保持手段に保持された一般話題言語モデルおよび前記音響モデル保持手段に保持された音響モデルを用いて前記入力音声に対する第2音声認識を行い、更に前記第1音声認識の結果に対する第1スコアおよび前記第2音声認識の結果に対する第2スコアを計算する音声認識ステップと、
判定手段が、前記音声認識手段が計算した第1スコアおよび第2スコアを入力し、前記第1スコアが前記第2スコア以上である場合に、前記入力音声の内容が前記特定の話題に相当すると判定する判定ステップと、
を備えることを特徴とする話題判定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009042344A JP5148532B2 (ja) | 2009-02-25 | 2009-02-25 | 話題判定装置および話題判定方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009042344A JP5148532B2 (ja) | 2009-02-25 | 2009-02-25 | 話題判定装置および話題判定方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010197706A true JP2010197706A (ja) | 2010-09-09 |
JP5148532B2 JP5148532B2 (ja) | 2013-02-20 |
Family
ID=42822490
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009042344A Expired - Fee Related JP5148532B2 (ja) | 2009-02-25 | 2009-02-25 | 話題判定装置および話題判定方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5148532B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010224194A (ja) * | 2009-03-23 | 2010-10-07 | Sony Corp | 音声認識装置及び音声認識方法、言語モデル生成装置及び言語モデル生成方法、並びにコンピューター・プログラム |
JP2013117683A (ja) * | 2011-12-05 | 2013-06-13 | Nippon Hoso Kyokai <Nhk> | 音声認識装置、誤り傾向学習方法、及びプログラム |
JP2013167666A (ja) * | 2012-02-14 | 2013-08-29 | Nec Corp | 音声認識装置、音声認識方法、及びプログラム |
JP2015225134A (ja) * | 2014-05-26 | 2015-12-14 | 日本電信電話株式会社 | 話題変換検出装置、方法、及びプログラム |
WO2020017243A1 (ja) * | 2018-07-19 | 2020-01-23 | ソニー株式会社 | 情報処理装置、情報処理方法及び情報処理プログラム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007139864A (ja) * | 2005-11-15 | 2007-06-07 | Nec Corp | 不審会話検出装置、方法及びそれを用いた通信装置 |
JP2007323107A (ja) * | 2006-05-30 | 2007-12-13 | Hitachi Software Eng Co Ltd | 振込み詐欺防止システム |
WO2008004666A1 (fr) * | 2006-07-07 | 2008-01-10 | Nec Corporation | Dispositif, procédé et programme de reconnaissance vocale |
-
2009
- 2009-02-25 JP JP2009042344A patent/JP5148532B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007139864A (ja) * | 2005-11-15 | 2007-06-07 | Nec Corp | 不審会話検出装置、方法及びそれを用いた通信装置 |
JP2007323107A (ja) * | 2006-05-30 | 2007-12-13 | Hitachi Software Eng Co Ltd | 振込み詐欺防止システム |
WO2008004666A1 (fr) * | 2006-07-07 | 2008-01-10 | Nec Corporation | Dispositif, procédé et programme de reconnaissance vocale |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010224194A (ja) * | 2009-03-23 | 2010-10-07 | Sony Corp | 音声認識装置及び音声認識方法、言語モデル生成装置及び言語モデル生成方法、並びにコンピューター・プログラム |
JP2013117683A (ja) * | 2011-12-05 | 2013-06-13 | Nippon Hoso Kyokai <Nhk> | 音声認識装置、誤り傾向学習方法、及びプログラム |
JP2013167666A (ja) * | 2012-02-14 | 2013-08-29 | Nec Corp | 音声認識装置、音声認識方法、及びプログラム |
JP2015225134A (ja) * | 2014-05-26 | 2015-12-14 | 日本電信電話株式会社 | 話題変換検出装置、方法、及びプログラム |
WO2020017243A1 (ja) * | 2018-07-19 | 2020-01-23 | ソニー株式会社 | 情報処理装置、情報処理方法及び情報処理プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5148532B2 (ja) | 2013-02-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101702829B1 (ko) | 인공 신경망 기반 서브-음성 유닛 구별을 이용한 화자 검증 및 식별 | |
US7949536B2 (en) | Intelligent speech recognition of incomplete phrases | |
CN102971725B (zh) | 语音输入的字词级纠正 | |
JP4679254B2 (ja) | 対話システム、対話方法、及びコンピュータプログラム | |
US8396713B2 (en) | Method and system for using a statistical language model and an action classifier in parallel with grammar for better handling of out-of-grammar utterances | |
US20070239453A1 (en) | Augmenting context-free grammars with back-off grammars for processing out-of-grammar utterances | |
JP5148532B2 (ja) | 話題判定装置および話題判定方法 | |
TW201517018A (zh) | 語音辨識方法及其電子裝置 | |
US10360904B2 (en) | Methods and apparatus for speech recognition using a garbage model | |
US20210306457A1 (en) | Method and apparatus for behavioral analysis of a conversation | |
CN113096647B (zh) | 语音模型训练方法、装置和电子设备 | |
Mitra et al. | Analysis and tuning of a voice assistant system for dysfluent speech | |
CN108039181A (zh) | 一种声音信号的情感信息分析方法和装置 | |
Chen et al. | Informative dialect recognition using context-dependent pronunciation modeling | |
JP2009014888A (ja) | 対話処理装置、対話処理方法及びコンピュータ・プログラム | |
JP6524674B2 (ja) | 音声処理装置、音声処理方法および音声処理プログラム | |
Zhang et al. | Dialect Recognition Based on Unsupervised Bottleneck Features. | |
JP4854732B2 (ja) | 話者認識システムにおける話者モデル登録装置及び方法、並びにコンピュータプログラム | |
Levit et al. | Don't Count on ASR to Transcribe for You: Breaking Bias with Two Crowds. | |
Tong et al. | Fusion of acoustic and tokenization features for speaker recognition | |
Chen et al. | System and keyword dependent fusion for spoken term detection | |
JP4408665B2 (ja) | 音声認識用発話データ収集装置、音声認識用発話データ収集方法、及びコンピュータプログラム | |
JP6260138B2 (ja) | コミュニケーション処理装置、コミュニケーション処理方法、及び、コミュニケーション処理プログラム | |
Niu et al. | Separation guided speaker diarization in realistic mismatched conditions | |
JP2016191739A (ja) | 発音誤り検出装置、方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110829 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120823 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120828 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121026 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121120 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121128 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5148532 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151207 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |