JP2007026347A - テキストマイニング装置、テキストマイニング方法およびテキストマイニングプログラム - Google Patents
テキストマイニング装置、テキストマイニング方法およびテキストマイニングプログラム Download PDFInfo
- Publication number
- JP2007026347A JP2007026347A JP2005211070A JP2005211070A JP2007026347A JP 2007026347 A JP2007026347 A JP 2007026347A JP 2005211070 A JP2005211070 A JP 2005211070A JP 2005211070 A JP2005211070 A JP 2005211070A JP 2007026347 A JP2007026347 A JP 2007026347A
- Authority
- JP
- Japan
- Prior art keywords
- reliability
- mining
- text
- result
- text mining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Character Discrimination (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】 音声認識手段21では、音声データを認識しテキスト化し、音声認識信頼度計算手段22では、音声認識結果に含まれる単語1語1語に対する信頼度が計算される。マイニング計算手段24は、音声認識テキストに対しマイニング処理する。マイニング結果信頼度計算手段25では、音声認識信頼度を参照しつつ、テキストマイニング処理結果の上位リストに含まれる単語または表現について信頼度を計算する。マイニング結果提示手段26では、テキストマイニング結果の上位リストに含まれる単語または表現について、その単語または表現と共に計算した信頼度を利用者へ提示する。
【選択図】 図1
Description
図1を参照すると、本発明の第1の実施の形態によるテキストマイニング装置は、キーボード等の入力装置1と、プログラム制御により動作するデータ処理装置2と、情報を記憶する記憶装置3と、ディスプレイ装置や印刷装置等の出力装置4とを含む。
次に、本発明の第2の発明を実施するための最良の形態について図面を参照して詳細に説明する。
次に、本発明の第3の発明を実施するための最良の形態について図面を参照して詳細に説明する。
また、テキストマイニング結果提示手段26は、2次元のグラフ(例えば、x軸に特徴度、y軸にテキストマイニング結果信頼度を割り当てたもの)上にテキストマイニング結果の上位リストに含まれる単語や表現をプロットしグラフィカルに提示するようにすることにより、マイニング結果信頼度をマイニング結果に反映させても良い。
2,200 データ処理装置
3,300 記憶装置
4 出力装置
5 テキストマイニングプログラム
21 音声認識手段
22 音声認識信頼度計算手段
23 マイニング条件設定手段
24 マイニング計算手段
25 マイニング結果信頼度計算手段
26 マイニング結果提示手段
27 モデル学習手段
28 モデル学習度計算手段
31 入力カテゴリデータ記憶部
32 音声データ集合記憶部
33 学習モデル記憶部
34 音声認識テキスト記憶部
35 音声認識信頼度データ記憶部
36 モデル学習度記憶部
37 音声認識学習コーパス記憶部
Claims (27)
- 入力データに対して認識処理を行なうことにより得られたテキストに対してマイニング処理を行なうことにより得られたマイニング結果に対し、前記認識処理の信頼度に基づいてマイニング結果信頼度を計算する信頼度計算手段を備えることを特徴とするテキストマイニング装置。
- 請求項1に記載のテキストマイニング装置において、
前記入力データは、音声データ又は画像データであり、前記認識処理は、音声認識処理又は文字認識処理であることを特徴とするテキストマイニング装置。 - 請求項1に記載のテキストマイニング装置において、
前記信頼度計算手段は、前記認識処理の信頼度として、前記テキストの個々の部分に付与された認識処理の信頼度を利用することを特徴とするテキストマイニング装置。 - 請求項3に記載のテキストマイニング装置において、
前記信頼度計算手段は、前記認識処理の信頼度として、前記テキストの、前記マイニング結果に含まれる或る単語が出現する1又は複数の部分に付与された認識処理の信頼度を利用することにより、前記マイニング結果に含まれるその単語に対するマイニング結果信頼度を計算することを特徴とするテキストマイニング装置。 - 請求項3に記載のテキストマイニング装置において、
前記信頼度計算手段は、前記認識処理の信頼度として、前記テキストの、前記マイニング結果に含まれる或る表現が出現する1又は複数の部分に付与された認識処理の信頼度を利用することにより、前記マイニング結果に含まれるその表現に対するマイニング結果信頼度を計算することを特徴とするテキストマイニング装置。 - 請求項3に記載のテキストマイニング装置において、
前記信頼度計算手段は、前記認識処理の信頼度として、前記テキストの、前記マイニング結果に含まれる或る表現に含まれる単語が出現する1又は複数の部分に付与された認識処理の信頼度を利用することにより、前記マイニング結果に含まれるその表現に対するマイニング結果信頼度を計算することを特徴とするテキストマイニング装置。 - 請求項1に記載のテキストマイニング装置において、
前記信頼度計算手段は、前記認識処理の信頼度として、前記認識処理のために利用する学習モデルの学習度を利用することを特徴とするテキストマイニング装置。 - 請求項7に記載のテキストマイニング装置において、
前記信頼度計算手段は、前記認識処理の信頼度として、前記マイニング結果に含まれる単語に付与された学習度を利用することにより、前記マイニング結果に含まれる単語に対するマイニング結果信頼度を計算することを特徴とするテキストマイニング装置。 - 請求項7に記載のテキストマイニング装置において、
前記信頼度計算手段は、前記認識処理の信頼度として、前記マイニング結果に含まれる表現に付与された学習度を利用することにより、前記マイニング結果に含まれる表現に対するマイニング結果信頼度を計算することを特徴とするテキストマイニング装置。 - 請求項7に記載のテキストマイニング装置において、
前記信頼度計算手段は、前記認識処理の信頼度として、前記マイニング結果に含まれる表現に含まれる単語に付与された学習度を利用することにより、前記マイニング結果に含まれる表現に対するマイニング結果信頼度を計算することを特徴とするテキストマイニング装置。 - 請求項7に記載のテキストマイニング装置において、
コーパスを基に前記学習モデルを生成するモデル学習手段から得たデータを基に、前記学習モデルの学習度を計算するモデル学習度計算手段を更に備えることを特徴とするテキストマイニング装置。 - 請求項11に記載のテキストマイニング装置において、
前記モデル学習度計算手段は、前記学習モデルに含まれる各単語又は各表現の学習度を、前記コーパスに含まれる全単語数及び前記コーパスにおける前記各単語又は各表現の出現回数を少なくとも基にして計算することを特徴とするテキストマイニング装置。 - 請求項1に記載のテキストマイニング装置において、
前記マイニング結果信頼度が反映された前記マイニング結果を出力するマイニング結果提示手段を更に備えることを特徴とするテキストマイニング装置。 - 入力データに対して認識処理を行なうことにより得られたテキストに対してマイニング処理を行なうことにより得られたマイニング結果に対し、前記認識処理の信頼度に基づいてマイニング結果信頼度を計算する信頼度計算ステップを備えることを特徴とするテキストマイニング方法。
- 請求項14に記載のテキストマイニング方法において、
前記入力データは、音声データ又は画像データであり、前記認識処理は、音声認識処理又は文字認識処理であることを特徴とするテキストマイニング方法。 - 請求項14に記載のテキストマイニング方法において、
前記信頼度計算ステップでは、前記認識処理の信頼度として、前記テキストの個々の部分に付与された認識処理の信頼度を利用することを特徴とするテキストマイニング方法。 - 請求項16に記載のテキストマイニング方法において、
前記信頼度計算ステップでは、前記認識処理の信頼度として、前記テキストの、前記マイニング結果に含まれる或る単語が出現する1又は複数の部分に付与された認識処理の信頼度を利用することにより、前記マイニング結果に含まれるその単語に対するマイニング結果信頼度を計算することを特徴とするテキストマイニング方法。 - 請求項16に記載のテキストマイニング方法において、
前記信頼度計算ステップでは、前記認識処理の信頼度として、前記テキストの、前記マイニング結果に含まれる或る表現が出現する1又は複数の部分に付与された認識処理の信頼度を利用することにより、前記マイニング結果に含まれるその表現に対するマイニング結果信頼度を計算することを特徴とするテキストマイニング方法。 - 請求項16に記載のテキストマイニング方法において、
前記信頼度計算ステップでは、前記認識処理の信頼度として、前記テキストの、前記マイニング結果に含まれる或る表現に含まれる単語が出現する1又は複数の部分に付与された認識処理の信頼度を利用することにより、前記マイニング結果に含まれるその表現に対するマイニング結果信頼度を計算することを特徴とするテキストマイニング方法。 - 請求項14に記載のテキストマイニング方法において、
前記信頼度計算ステップでは、前記認識処理の信頼度として、前記認識処理のために利用する学習モデルの学習度を利用することを特徴とするテキストマイニング方法。 - 請求項20に記載のテキストマイニング方法において、
前記信頼度計算ステップでは、前記認識処理の信頼度として、前記マイニング結果に含まれる単語に付与された学習度を利用することにより、前記マイニング結果に含まれる単語に対するマイニング結果信頼度を計算することを特徴とするテキストマイニング方法。 - 請求項20に記載のテキストマイニング方法において、
前記信頼度計算ステップでは、前記認識処理の信頼度として、前記マイニング結果に含まれる表現に付与された学習度を利用することにより、前記マイニング結果に含まれる表現に対するマイニング結果信頼度を計算することを特徴とするテキストマイニング方法。 - 請求項20に記載のテキストマイニング方法において、
前記信頼度計算ステップでは、前記認識処理の信頼度として、前記マイニング結果に含まれる表現に含まれる単語に付与された学習度を利用することにより、前記マイニング結果に含まれる表現に対するマイニング結果信頼度を計算することを特徴とするテキストマイニング方法。 - 請求項20に記載のテキストマイニング方法において、
コーパスを基に前記学習モデルを生成するモデル学習ステップから得たデータを基に、前記学習モデルの学習度を計算するモデル学習度計算ステップを更に備えることを特徴とするテキストマイニング方法。 - 請求項24に記載のテキストマイニング方法において、
前記モデル学習度計算ステップでは、前記学習モデルに含まれる各単語又は各表現の学習度を、前記コーパスに含まれる全単語数及び前記コーパスにおける前記各単語又は各表現の出現回数を少なくとも基にして計算することを特徴とするテキストマイニング方法。 - 請求項14に記載のテキストマイニング方法において、
前記マイニング結果信頼度が反映された前記マイニング結果を出力するマイニング結果提示ステップを更に備えることを特徴とするテキストマイニング方法。 - 請求項14乃至26の何れか1項に記載のテキストマイニング方法をコンピュータに実行させるためのテキストマイニングプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005211070A JP4735958B2 (ja) | 2005-07-21 | 2005-07-21 | テキストマイニング装置、テキストマイニング方法およびテキストマイニングプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005211070A JP4735958B2 (ja) | 2005-07-21 | 2005-07-21 | テキストマイニング装置、テキストマイニング方法およびテキストマイニングプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007026347A true JP2007026347A (ja) | 2007-02-01 |
JP4735958B2 JP4735958B2 (ja) | 2011-07-27 |
Family
ID=37786985
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005211070A Active JP4735958B2 (ja) | 2005-07-21 | 2005-07-21 | テキストマイニング装置、テキストマイニング方法およびテキストマイニングプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4735958B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009008115A1 (ja) * | 2007-07-09 | 2009-01-15 | Mitsubishi Electric Corporation | 音声認識装置およびナビゲーションシステム |
WO2010023939A1 (ja) * | 2008-08-29 | 2010-03-04 | 日本電気株式会社 | テキストマイニング装置、テキストマイニング方法、及びコンピュータ読み取り可能な記録媒体 |
WO2010023938A1 (ja) * | 2008-08-29 | 2010-03-04 | 日本電気株式会社 | テキストマイニング装置、テキストマイニング方法、及びコンピュータ読み取り可能な記録媒体 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000172691A (ja) * | 1998-12-03 | 2000-06-23 | Mitsubishi Electric Corp | 情報マイニング方法、情報マイニング装置、および情報マイニングプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2003248687A (ja) * | 2002-02-22 | 2003-09-05 | Nippon Yunishisu Kk | 情報処理装置およびその方法 |
JP2004046106A (ja) * | 2002-05-15 | 2004-02-12 | Pioneer Electronic Corp | 音声認識装置及び音声認識プログラム |
JP2004302506A (ja) * | 2003-03-28 | 2004-10-28 | Honda Motor Co Ltd | 修理依頼受付システムおよび修理依頼受付プログラム |
JP2005148342A (ja) * | 2003-11-14 | 2005-06-09 | Nippon Telegr & Teleph Corp <Ntt> | 音声認識方法、この方法を実施する装置、プログラムおよび記録媒体 |
-
2005
- 2005-07-21 JP JP2005211070A patent/JP4735958B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000172691A (ja) * | 1998-12-03 | 2000-06-23 | Mitsubishi Electric Corp | 情報マイニング方法、情報マイニング装置、および情報マイニングプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2003248687A (ja) * | 2002-02-22 | 2003-09-05 | Nippon Yunishisu Kk | 情報処理装置およびその方法 |
JP2004046106A (ja) * | 2002-05-15 | 2004-02-12 | Pioneer Electronic Corp | 音声認識装置及び音声認識プログラム |
JP2004302506A (ja) * | 2003-03-28 | 2004-10-28 | Honda Motor Co Ltd | 修理依頼受付システムおよび修理依頼受付プログラム |
JP2005148342A (ja) * | 2003-11-14 | 2005-06-09 | Nippon Telegr & Teleph Corp <Ntt> | 音声認識方法、この方法を実施する装置、プログラムおよび記録媒体 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009008115A1 (ja) * | 2007-07-09 | 2009-01-15 | Mitsubishi Electric Corporation | 音声認識装置およびナビゲーションシステム |
JPWO2009008115A1 (ja) * | 2007-07-09 | 2010-09-02 | 三菱電機株式会社 | 音声認識装置およびナビゲーションシステム |
WO2010023939A1 (ja) * | 2008-08-29 | 2010-03-04 | 日本電気株式会社 | テキストマイニング装置、テキストマイニング方法、及びコンピュータ読み取り可能な記録媒体 |
WO2010023938A1 (ja) * | 2008-08-29 | 2010-03-04 | 日本電気株式会社 | テキストマイニング装置、テキストマイニング方法、及びコンピュータ読み取り可能な記録媒体 |
US8380741B2 (en) | 2008-08-29 | 2013-02-19 | Nec Corporation | Text mining apparatus, text mining method, and computer-readable recording medium |
JP5472641B2 (ja) * | 2008-08-29 | 2014-04-16 | 日本電気株式会社 | テキストマイニング装置、テキストマイニング方法、及びプログラム |
JP5472640B2 (ja) * | 2008-08-29 | 2014-04-16 | 日本電気株式会社 | テキストマイニング装置、テキストマイニング方法、及びプログラム |
US8751531B2 (en) | 2008-08-29 | 2014-06-10 | Nec Corporation | Text mining apparatus, text mining method, and computer-readable recording medium |
Also Published As
Publication number | Publication date |
---|---|
JP4735958B2 (ja) | 2011-07-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20200251091A1 (en) | System and method for defining dialog intents and building zero-shot intent recognition models | |
US20180101522A1 (en) | Machine translation method for performing translation between languages | |
RU2571608C2 (ru) | Создание заметок с использованием голосового потока | |
US20200082808A1 (en) | Speech recognition error correction method and apparatus | |
KR101983975B1 (ko) | 문장 분류에 기반하는 문서 자동분류 방법 및 그 장치 | |
JP5071373B2 (ja) | 言語処理装置、言語処理方法および言語処理用プログラム | |
JP6019604B2 (ja) | 音声認識装置、音声認識方法、及びプログラム | |
CN110444198A (zh) | 检索方法、装置、计算机设备和存储介质 | |
JP2015094848A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP5932869B2 (ja) | N−gram言語モデルの教師無し学習方法、学習装置、および学習プログラム | |
US10460731B2 (en) | Apparatus, method, and non-transitory computer readable storage medium thereof for generating control instructions based on text | |
CN104462071A (zh) | 语音翻译设备和语音翻译方法 | |
JP5809381B1 (ja) | 自然言語処理システム、自然言語処理方法、および自然言語処理プログラム | |
JPWO2007138875A1 (ja) | 音声認識用単語辞書・言語モデル作成システム、方法、プログラムおよび音声認識システム | |
CN107451119A (zh) | 基于语音交互的语义识别方法及装置、存储介质、计算机设备 | |
EP2988298B1 (en) | Response generation method, response generation apparatus, and response generation program | |
JP7058574B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
KR101478146B1 (ko) | 화자 그룹 기반 음성인식 장치 및 방법 | |
JP4735958B2 (ja) | テキストマイニング装置、テキストマイニング方法およびテキストマイニングプログラム | |
CN112151021A (zh) | 语言模型的训练方法、语音识别方法、装置及电子设备 | |
CN112559725A (zh) | 文本匹配方法、装置、终端和存储介质 | |
CN112632956A (zh) | 文本匹配方法、装置、终端和存储介质 | |
JP7096199B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP2013134753A (ja) | 誤り文修正装置、誤り文修正方法およびプログラム | |
JP6664466B2 (ja) | 処理実行装置、処理実行装置の制御方法、および制御プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20080521 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080611 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20100927 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20100927 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101105 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101224 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110331 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110413 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4735958 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140513 Year of fee payment: 3 |