JPWO2011083528A1 - データ処理装置、そのコンピュータプログラムおよびデータ処理方法 - Google Patents
データ処理装置、そのコンピュータプログラムおよびデータ処理方法 Download PDFInfo
- Publication number
- JPWO2011083528A1 JPWO2011083528A1 JP2011548868A JP2011548868A JPWO2011083528A1 JP WO2011083528 A1 JPWO2011083528 A1 JP WO2011083528A1 JP 2011548868 A JP2011548868 A JP 2011548868A JP 2011548868 A JP2011548868 A JP 2011548868A JP WO2011083528 A1 JPWO2011083528 A1 JP WO2011083528A1
- Authority
- JP
- Japan
- Prior art keywords
- pruning
- threshold
- hypothesis
- data
- hypotheses
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims abstract description 60
- 238000004590 computer program Methods 0.000 title claims description 17
- 238000003672 processing method Methods 0.000 title claims description 13
- 238000013138 pruning Methods 0.000 claims abstract description 133
- 238000012360 testing method Methods 0.000 claims abstract description 55
- 238000000034 method Methods 0.000 claims description 20
- 230000008569 process Effects 0.000 claims description 19
- 238000004364 calculation method Methods 0.000 claims description 15
- 238000000605 extraction Methods 0.000 claims description 10
- 238000007476 Maximum Likelihood Methods 0.000 claims description 8
- 230000003247 decreasing effect Effects 0.000 claims 1
- 230000007423 decrease Effects 0.000 abstract description 10
- 230000006870 function Effects 0.000 description 5
- 244000141353 Prunus domestica Species 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 238000013179 statistical model Methods 0.000 description 4
- 230000001186 cumulative effect Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/085—Methods for reducing search complexity, pruning
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/24—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Human Computer Interaction (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
Description
Claims (5)
- 学習モードでは正解仮説が確定しているテストデータを所定の入力単位ごとに入力して探索モードでは仮説探索の対象データを前記入力単位ごとに入力するデータ入力手段と、
入力された前記テストデータおよび前記対象データを分析して特徴量を各々抽出する特徴量抽出手段と、
抽出された前記特徴量を用いて前記テストデータおよび前記対象データの複数の仮説ごとに複数の枝刈尺度を計算する仮説尺度計算手段と、
入力された前記テストデータの複数の前記仮説を各々計算された前記枝刈尺度に対応して複数の前記枝刈尺度で規定されている閾値空間にプロットするデータプロット手段と、
プロットされた複数の前記仮説の密度に対応して複数の等密度面を前記閾値空間に設定する等密度面設定手段と、
複数の前記等密度面から選定された一つの一部を一部として複数の前記枝刈尺度の少なくとも一つが低下すると少なくとも一つが上昇する複数の前記枝刈閾値からなる閾値曲面を前記閾値空間に生成する閾値曲面生成手段と、
前記対象データの複数の前記仮説からなる仮説曲面を各々計算された前記枝刈尺度に対応して前記閾値空間に生成する仮説曲面生成手段と、
生成された前記仮説曲面が前記閾値曲面と交差する位置を前記枝刈閾値として前記対象データの複数の前記仮説を枝刈する仮説枝刈手段と、
を有するデータ処理装置。 - 前記閾値空間が二つの前記枝刈尺度である前記仮説の最尤仮説からのスコア差と仮説順位とで規定されている二次元の閾値平面からなり、
前記仮説尺度計算手段は、抽出された前記特徴量を用いて前記テストデータおよび前記対象データの複数の前記仮説ごとにスコアを算出して前記スコア差と前記仮説順位とを前記枝刈尺度として計算し、
前記等密度面設定手段は、プロットされた複数の前記仮説の密度に対応して複数の前記等密度面である等密度線を前記閾値平面に設定し、
前記閾値曲面生成手段は、複数の前記等密度線から選定された一つの一部を一部として前記スコア差と前記仮説順位との一方が低下すると他方が上昇する複数の前記枝刈閾値からなる閾値曲線を前記閾値曲面として前記閾値平面に生成し、
前記仮説曲面生成手段は、前記対象データの複数の前記仮説からなる仮説曲線を前記仮説曲面として各々計算された前記スコア差と前記仮説順位とに対応して前記閾値平面に生成する請求項1に記載のデータ処理装置。 - 前記探索モードで枝刈された複数の前記仮説から累積された前記スコアが最大の一つを探索結果として出力する結果出力手段を、さらに有する請求項2に記載のデータ処理装置。
- 請求項1ないし3の何れか一項に記載のデータ処理装置のコンピュータプログラムであって、
学習モードでは正解仮説が確定しているテストデータを所定の入力単位ごとに入力して探索モードでは仮説探索の対象データを前記入力単位ごとに入力するデータ入力処理と、
入力された前記テストデータおよび前記対象データを分析して特徴量を各々抽出する特徴量抽出処理と、
抽出された前記特徴量を用いて前記テストデータおよび前記対象データの複数の仮説ごとに複数の枝刈尺度を計算する仮説尺度計算処理と、
入力された前記テストデータの複数の前記仮説を各々計算された前記枝刈尺度に対応して複数の前記枝刈尺度で規定されている閾値空間にプロットするデータプロット処理と、
プロットされた複数の前記仮説の密度に対応して複数の等密度面を前記閾値空間に設定する等密度面設定処理と、
複数の前記等密度面から選定された一つの一部を一部として複数の前記枝刈尺度の少なくとも一つが低下すると少なくとも一つが上昇する複数の前記枝刈閾値からなる閾値曲面を前記閾値空間に生成する閾値曲面生成処理と、
前記対象データの複数の前記仮説からなる仮説曲面を各々計算された前記枝刈尺度に対応して前記閾値空間に生成する仮説曲面生成処理と、
生成された前記仮説曲面が前記閾値曲面と交差する位置を前記枝刈閾値として前記対象データの複数の前記仮説を枝刈する仮説枝刈処理と、
をデータ処理装置に実行させるコンピュータプログラム。 - 請求項1ないし3の何れか一項に記載のデータ処理装置のデータ処理方法であって、
学習モードでは正解仮説が確定しているテストデータを所定の入力単位ごとに入力して探索モードでは仮説探索の対象データを前記入力単位ごとに入力するデータ入力動作と、
入力された前記テストデータおよび前記対象データを分析して特徴量を各々抽出する特徴量抽出動作と、
抽出された前記特徴量を用いて前記テストデータおよび前記対象データの複数の仮説ごとに複数の枝刈尺度を計算する仮説尺度計算動作と、
入力された前記テストデータの複数の前記仮説を各々計算された前記枝刈尺度に対応して複数の前記枝刈尺度で規定されている閾値空間にプロットするデータプロット動作と、
プロットされた複数の前記仮説の密度に対応して複数の等密度面を前記閾値空間に設定する等密度面設定動作と、
複数の前記等密度面から選定された一つの一部を一部として複数の前記枝刈尺度の少なくとも一つが低下すると少なくとも一つが上昇する複数の前記枝刈閾値からなる閾値曲面を前記閾値空間に生成する閾値曲面生成動作と、
前記対象データの複数の前記仮説からなる仮説曲面を各々計算された前記枝刈尺度に対応して前記閾値空間に生成する仮説曲面生成動作と、
生成された前記仮説曲面が前記閾値曲面と交差する位置を前記枝刈閾値として前記対象データの複数の前記仮説を枝刈する仮説枝刈動作と、
を有するデータ処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011548868A JP5786717B2 (ja) | 2010-01-06 | 2010-12-02 | データ処理装置、そのコンピュータプログラムおよびデータ処理方法 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010000940 | 2010-01-06 | ||
JP2010000940 | 2010-01-06 | ||
PCT/JP2010/007021 WO2011083528A1 (ja) | 2010-01-06 | 2010-12-02 | データ処理装置、そのコンピュータプログラムおよびデータ処理方法 |
JP2011548868A JP5786717B2 (ja) | 2010-01-06 | 2010-12-02 | データ処理装置、そのコンピュータプログラムおよびデータ処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2011083528A1 true JPWO2011083528A1 (ja) | 2013-05-13 |
JP5786717B2 JP5786717B2 (ja) | 2015-09-30 |
Family
ID=44305275
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011548868A Active JP5786717B2 (ja) | 2010-01-06 | 2010-12-02 | データ処理装置、そのコンピュータプログラムおよびデータ処理方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US9047562B2 (ja) |
JP (1) | JP5786717B2 (ja) |
WO (1) | WO2011083528A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011083528A1 (ja) * | 2010-01-06 | 2011-07-14 | 日本電気株式会社 | データ処理装置、そのコンピュータプログラムおよびデータ処理方法 |
WO2013125203A1 (ja) * | 2012-02-21 | 2013-08-29 | 日本電気株式会社 | 音声認識装置、音声認識方法およびコンピュータプログラム |
JP7005463B2 (ja) * | 2018-09-27 | 2022-01-21 | 株式会社東芝 | 学習装置、学習方法及びプログラム |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0642156B2 (ja) * | 1989-05-15 | 1994-06-01 | 株式会社エイ・ティ・アール自動翻訳電話研究所 | 音声認識装置におけるビーム制御方式 |
JP2864775B2 (ja) * | 1991-03-28 | 1999-03-08 | 日本電気株式会社 | 音声認識装置 |
JP2980420B2 (ja) * | 1991-07-26 | 1999-11-22 | 富士通株式会社 | 動的計画法照合装置 |
JPH0782357B2 (ja) * | 1993-03-29 | 1995-09-06 | 株式会社エイ・ティ・アール自動翻訳電話研究所 | 適応的探索方法 |
JP3061114B2 (ja) * | 1996-11-25 | 2000-07-10 | 日本電気株式会社 | 音声認識装置 |
JP4042176B2 (ja) * | 1997-03-11 | 2008-02-06 | 三菱電機株式会社 | 音声認識方式 |
US6285786B1 (en) * | 1998-04-30 | 2001-09-04 | Motorola, Inc. | Text recognizer and method using non-cumulative character scoring in a forward search |
JP3004254B2 (ja) * | 1998-06-12 | 2000-01-31 | 株式会社エイ・ティ・アール音声翻訳通信研究所 | 統計的シーケンスモデル生成装置、統計的言語モデル生成装置及び音声認識装置 |
JP3660137B2 (ja) * | 1998-09-25 | 2005-06-15 | 株式会社東芝 | シミュレーション方法、シミュレータ、シミュレーションプログラムを記録した記録媒体および半導体装置の製造方法 |
JP2001075596A (ja) * | 1999-09-03 | 2001-03-23 | Mitsubishi Electric Corp | 音声認識装置、音声認識方法及び音声認識プログラムを記録した記録媒体 |
WO2003005344A1 (en) * | 2001-07-03 | 2003-01-16 | Intel Zao | Method and apparatus for dynamic beam control in viterbi search |
US6788243B2 (en) * | 2001-09-06 | 2004-09-07 | Minister Of National Defence Of Her Majestry's Canadian Government The Secretary Of State For Defence | Hidden Markov modeling for radar electronic warfare |
US7603267B2 (en) * | 2003-05-01 | 2009-10-13 | Microsoft Corporation | Rules-based grammar for slots and statistical model for preterminals in natural language understanding system |
JP2005107743A (ja) * | 2003-09-29 | 2005-04-21 | Nec Corp | 学習システム |
US7946493B2 (en) * | 2007-09-27 | 2011-05-24 | Hand Held Products, Inc. | Wireless bar code transaction device |
WO2010013371A1 (ja) * | 2008-07-28 | 2010-02-04 | 日本電気株式会社 | 対話音声認識システム、対話音声認識方法および対話音声認識用プログラムを格納する記憶媒体 |
US8386401B2 (en) * | 2008-09-10 | 2013-02-26 | Digital Infuzion, Inc. | Machine learning methods and systems for identifying patterns in data using a plurality of learning machines wherein the learning machine that optimizes a performance function is selected |
WO2011083528A1 (ja) * | 2010-01-06 | 2011-07-14 | 日本電気株式会社 | データ処理装置、そのコンピュータプログラムおよびデータ処理方法 |
US8762009B2 (en) * | 2010-11-18 | 2014-06-24 | I.D. Systems, Inc. | Impact sensor calibration tool |
WO2012093661A1 (ja) * | 2011-01-07 | 2012-07-12 | 日本電気株式会社 | 音声認識装置、音声認識方法および音声認識プログラム |
WO2012093451A1 (ja) * | 2011-01-07 | 2012-07-12 | 日本電気株式会社 | 音声認識システム、音声認識方法および音声認識プログラム |
-
2010
- 2010-12-02 WO PCT/JP2010/007021 patent/WO2011083528A1/ja active Application Filing
- 2010-12-02 US US13/520,728 patent/US9047562B2/en active Active
- 2010-12-02 JP JP2011548868A patent/JP5786717B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
US9047562B2 (en) | 2015-06-02 |
US20120310866A1 (en) | 2012-12-06 |
JP5786717B2 (ja) | 2015-09-30 |
WO2011083528A1 (ja) | 2011-07-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10832685B2 (en) | Speech processing device, speech processing method, and computer program product | |
US20160260426A1 (en) | Speech recognition apparatus and method | |
US20140350934A1 (en) | Systems and Methods for Voice Identification | |
KR20140028174A (ko) | 음성 인식 방법 및 이를 적용한 전자 장치 | |
US9905224B2 (en) | System and method for automatic language model generation | |
US11227580B2 (en) | Speech recognition accuracy deterioration factor estimation device, speech recognition accuracy deterioration factor estimation method, and program | |
EP2988298B1 (en) | Response generation method, response generation apparatus, and response generation program | |
WO2018232591A1 (en) | SEQUENCE RECOGNITION PROCESSING | |
US20150255090A1 (en) | Method and apparatus for detecting speech segment | |
JP5786717B2 (ja) | データ処理装置、そのコンピュータプログラムおよびデータ処理方法 | |
JP6276513B2 (ja) | 音声認識装置および音声認識プログラム | |
US20220270637A1 (en) | Utterance section detection device, utterance section detection method, and program | |
JP2008097130A (ja) | タイミング解析方法および装置 | |
CN112259084A (zh) | 语音识别方法、装置和存储介质 | |
KR20200102309A (ko) | 단어 유사도를 이용한 음성 인식 시스템 및 그 방법 | |
JP6353408B2 (ja) | 言語モデル適応装置、言語モデル適応方法、プログラム | |
CN110210030B (zh) | 语句分析的方法及装置 | |
JP4735958B2 (ja) | テキストマイニング装置、テキストマイニング方法およびテキストマイニングプログラム | |
Chen et al. | System and keyword dependent fusion for spoken term detection | |
Kaneko et al. | Metric subspace indexing for fast spoken term detection. | |
KR20220090586A (ko) | 오디오-비주얼 매칭을 사용한 자동 음성 인식 가설 재점수화 | |
CN113782008B (zh) | 文本音频对齐方法和装置 | |
JP6537996B2 (ja) | 未知語検出装置、未知語検出方法、プログラム | |
KR101472029B1 (ko) | 색인요소를 이용한 자연어 분석 방법 및 시스템 | |
JP5980143B2 (ja) | ポーズ付与モデル生成装置、ポーズ付与モデル生成方法、ポーズ付与装置、ポーズ付与方法、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20131107 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20141125 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150113 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150630 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150713 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5786717 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |