JP2009516233A - インプットデータに対するワードクラスタリング - Google Patents
インプットデータに対するワードクラスタリング Download PDFInfo
- Publication number
- JP2009516233A JP2009516233A JP2008541262A JP2008541262A JP2009516233A JP 2009516233 A JP2009516233 A JP 2009516233A JP 2008541262 A JP2008541262 A JP 2008541262A JP 2008541262 A JP2008541262 A JP 2008541262A JP 2009516233 A JP2009516233 A JP 2009516233A
- Authority
- JP
- Japan
- Prior art keywords
- word
- component
- cluster
- vector
- clustering
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000013598 vector Substances 0.000 claims description 50
- 238000013138 pruning Methods 0.000 claims description 21
- 239000011159 matrix material Substances 0.000 claims description 20
- 238000000034 method Methods 0.000 claims description 18
- 238000010586 diagram Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 230000004044 response Effects 0.000 description 6
- 230000006855 networking Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 230000002093 peripheral effect Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000005055 memory storage Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- CDFKCKUONRRKJD-UHFFFAOYSA-N 1-(3-chlorophenoxy)-3-[2-[[3-(3-chlorophenoxy)-2-hydroxypropyl]amino]ethylamino]propan-2-ol;methanesulfonic acid Chemical compound CS(O)(=O)=O.CS(O)(=O)=O.C=1C=CC(Cl)=CC=1OCC(O)CNCCNCC(O)COC1=CC=CC(Cl)=C1 CDFKCKUONRRKJD-UHFFFAOYSA-N 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
- G10L15/19—Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
- G10L2015/0631—Creating reference templates; Clustering
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Machine Translation (AREA)
Abstract
Description
1) “building one reception”
2) “building two reception”
3) “building four reception”
報告コンポーネント252はワード位置情報を使用して、“building”と“reception”の間に“ワイルドカードワード”があることを判断する。従って、クラスタは“cluster 3:Building [X]reception”として報告される。
ワード“travel”の平均/予想相対位置(出現頻度x位置の総和)を次のように判断する。すなわち、18 x 1 + 1 x 2 + 1 x 5 = 25
“travel”の平均相対位置は“Florida”よりも低いので、相対順序付け(バブルソートによって判断された)は“travel”、“Florida”となる。
Claims (20)
- コンピュータ実装可能のクラスタリングツールであって、該クラスタリングツールは、
複数の発言を示すインプットデータ(240)を音声認識コンポーネント(224)から受信し、前記インプットデータ(240)の中の発言に同時に出現するワードを示すワードクラスタを生成するように構成されたクラスタリングコンポーネント(244)を備えたことを特徴とするクラスタリングツール。 - 請求項1に記載のクラスタリングツールにおいて、ワードクラスタは、2または3以上のワードのワード組み合わせを含んでいることを特徴とするクラスタリングツール。
- 請求項1に記載のクラスタリングツールにおいて、クラスタリングコンポーネントはワードクラスタおよびそのワードクラスタの出現頻度を出力することを特徴とするクラスタリングツール。
- 請求項1に記載のクラスタリングツールにおいて、類似性メトリックに基づいてクラスタをマージするマージコンポーネントをさらに備えたことを特徴とするクラスタリングツール。
- 請求項1に記載のクラスタリングツールにおいて、プルーニング基準に基づいてクラスタをプルーニングするプルーニングコンポーネントをさらに備えたことを特徴とするクラスタリングツール。
- 請求項1に記載のクラスタリングツールにおいて、ワード位置情報を利用してワードクラスタにラベルを付ける報告コンポーネントをさらに含むことを特徴とするクラスタリングツール。
- 請求項6に記載のクラスタリングツールにおいて、報告コンポーネントは、同時出現ワードに対する中間ワードを表わすワイルドカードを含をワードクラスタラベルを使用するように構成されていることを特徴とするクラスタリングツール。
- 請求項1に記載のクラスタリングツールにおいて、クラスタリングコンポーネントは、ワード出現ベクトルジェネレータおよびベクトルドット積を計算するベクトルドット積コンポーネントを含んでいることを特徴とするクラスタリングツール。
- 請求項8に記載のクラスタリングツールにおいて、ワード同時出現ベクトルジェネレータをさらに備えたことを特徴とするクラスタリングツール。
- コンピュータ実装可能のクラスタリングツールであって、該クラスタリングツールは、
インプットデータ(240)を受信し、ワード出現ベクトルまたはワード同時出現ベクトルの少なくとも1つを生成するように構成されたワードクラスタリングコンポーネント(244)と、
前記インプットデータ(240)内のワードクラスタ(246)をワード出現ベクトルまたはワード同時出現ベクトルから取得するためにベクトルドット積を計算するように構成されたベクトルドット積コンポーネント(246)と、
を備えたことを特徴とするクラスタリングツール。 - 請求項10に記載のクラスタリングツールにおいて、ベクトルドット積コンポーネントは、ワードクラスタと出現頻度を含むワード同時出現マトリックスを生成することを特徴とするクラスタリングツール。
- 請求項10に記載のクラスタリングツールにおいて、クラスタリングコンポーネントは、パイ積を計算してワード同時出現ベクトルを生成するように構成されていることを特徴とするクラスタリングツール。
- インプットデータ(240)を出力するステップと、
前記インプットデータ(240)の中のワードのワード出現ベクトルを生成するステップと、
ワード出現ベクトル相互間のベクトルドット積を計算して、インプットデータ(240)の中のクラスタに同時に出現するワードを示しているワードクラスタを生成するステップと、
を含むことを特徴とする方法。 - 請求項13に記載の方法において、さらに
ワードクラスタに対するワード同時出現ベクトルを生成するステップと、
前記ワード同時出現ベクトルに対するベクトルドット積を計算するステップと、
を含むことを特徴とする方法。 - 請求項13に記載の方法において、
パイ積を計算して、ワードクラスタに対するワード同時出現ベクトルを生成するステップを含むことを特徴とする方法。 - 請求項14に記載の方法において、
ワード同時出現ベクトルを生成するステップと、追加のワード同時出現ベクトルに対するベクトルドット積を計算するステップとを繰り返すステップを含むことを特徴とする方法。 - 請求項13に記載の方法において、さらに
閉じたボキャブラリ音声認識コンポーネントからの未認識音声データをログに記録するステップと、
フリーフォーム音声認識システムを使用して前記ログに記録された音声データを認識してインプットデータを出力するステップと、
を含むことを特徴とする方法。 - 請求項13に記載の方法において、さらに
クラスタラベルと出現頻度を含むワードクラスタを出力するステップを含むことを特徴とする方法。 - 請求項18に記載の方法において、さらに
ワードクラスタを出力する前にクラスタデータをプルーニングするステップを含むことを特徴とする方法。 - 請求項13に記載の方法において、さらに
類似ワードクラスタをマージするステップを含むことを特徴とする方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/283,149 | 2005-11-18 | ||
US11/283,149 US8249871B2 (en) | 2005-11-18 | 2005-11-18 | Word clustering for input data |
PCT/US2006/044080 WO2007061674A1 (en) | 2005-11-18 | 2006-11-14 | Word clustering for input data |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009516233A true JP2009516233A (ja) | 2009-04-16 |
JP5214461B2 JP5214461B2 (ja) | 2013-06-19 |
Family
ID=38054607
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008541262A Expired - Fee Related JP5214461B2 (ja) | 2005-11-18 | 2006-11-14 | インプットデータに対するワードクラスタリング |
Country Status (6)
Country | Link |
---|---|
US (1) | US8249871B2 (ja) |
EP (1) | EP1922653B1 (ja) |
JP (1) | JP5214461B2 (ja) |
KR (1) | KR101411113B1 (ja) |
CN (1) | CN101310273A (ja) |
WO (1) | WO2007061674A1 (ja) |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7756708B2 (en) * | 2006-04-03 | 2010-07-13 | Google Inc. | Automatic language model update |
US9245526B2 (en) * | 2006-04-25 | 2016-01-26 | General Motors Llc | Dynamic clustering of nametags in an automated speech recognition system |
US8050929B2 (en) * | 2007-08-24 | 2011-11-01 | Robert Bosch Gmbh | Method and system of optimal selection strategy for statistical classifications in dialog systems |
JP5284685B2 (ja) * | 2008-05-16 | 2013-09-11 | インターナショナル・ビジネス・マシーンズ・コーポレーション | ファイルの再配置装置、再配置方法、及び再配置プログラム |
EP2297703A1 (en) | 2008-06-03 | 2011-03-23 | ETH Zurich | Method and system for generating a pictorial reference database using geographical information |
WO2011078186A1 (ja) * | 2009-12-22 | 2011-06-30 | 日本電気株式会社 | 文書クラスタリングシステム、文書クラスタリング方法および記録媒体 |
US9813707B2 (en) * | 2010-01-22 | 2017-11-07 | Thomson Licensing Dtv | Data pruning for video compression using example-based super-resolution |
KR101789845B1 (ko) | 2010-01-22 | 2017-11-20 | 톰슨 라이센싱 | 샘플링 기반 초 해상도 비디오 인코딩 및 디코딩을 위한 방법 및 장치 |
US9191639B2 (en) | 2010-04-12 | 2015-11-17 | Adobe Systems Incorporated | Method and apparatus for generating video descriptions |
US8645136B2 (en) | 2010-07-20 | 2014-02-04 | Intellisist, Inc. | System and method for efficiently reducing transcription error using hybrid voice transcription |
US9544598B2 (en) | 2010-09-10 | 2017-01-10 | Thomson Licensing | Methods and apparatus for pruning decision optimization in example-based data pruning compression |
US9338477B2 (en) | 2010-09-10 | 2016-05-10 | Thomson Licensing | Recovering a pruned version of a picture in a video sequence for example-based data pruning using intra-frame patch similarity |
US8650031B1 (en) * | 2011-07-31 | 2014-02-11 | Nuance Communications, Inc. | Accuracy improvement of spoken queries transcription using co-occurrence information |
EP2829049B1 (en) | 2012-03-23 | 2021-05-26 | Dolby Laboratories Licensing Corporation | Clustering of audio streams in a 2d/3d conference scene |
US9373031B2 (en) | 2013-03-14 | 2016-06-21 | Digitech Systems Private Reserve, LLC | System and method for document alignment, correction, and classification |
US9953646B2 (en) | 2014-09-02 | 2018-04-24 | Belleau Technologies | Method and system for dynamic speech recognition and tracking of prewritten script |
US9462456B2 (en) | 2014-11-19 | 2016-10-04 | Qualcomm Incorporated | Method and apparatus for creating a time-sensitive grammar |
US9928232B2 (en) | 2015-02-27 | 2018-03-27 | Microsoft Technology Licensing, Llc | Topically aware word suggestions |
US9990268B2 (en) * | 2015-03-30 | 2018-06-05 | Infosys Limited | System and method for detection of duplicate bug reports |
US10140285B2 (en) * | 2016-06-15 | 2018-11-27 | Nice Ltd. | System and method for generating phrase based categories of interactions |
CN110516902B (zh) * | 2019-07-11 | 2023-08-22 | 平安科技(深圳)有限公司 | 一种智能调度方法、装置、计算机系统及可读存储介质 |
US11176924B2 (en) * | 2020-01-09 | 2021-11-16 | International Business Machines Corporation | Reduced miss rate in sound to text conversion using banach spaces |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08263510A (ja) * | 1995-03-24 | 1996-10-11 | Nec Corp | 文章自動分類システム |
JP2001101194A (ja) * | 1999-09-27 | 2001-04-13 | Mitsubishi Electric Corp | テキストマイニング方法、テキストマイニング装置及びテキストマイニングプログラムが記録された記録媒体 |
JP2001243223A (ja) * | 2000-02-29 | 2001-09-07 | Nec Corp | 意味ネットワーク自動作成装置及びコンピュータ可読記録媒体 |
JP2003288362A (ja) * | 2002-03-27 | 2003-10-10 | Seiko Epson Corp | 特定要素ベクトル生成装置、文字列ベクトル生成装置、類似度算出装置、特定要素ベクトル生成プログラム、文字列ベクトル生成プログラム及び類似度算出プログラム、並びに特定要素ベクトル生成方法、文字列ベクトル生成方法及び類似度算出方法 |
JP2004252775A (ja) * | 2003-02-20 | 2004-09-09 | Nippon Telegr & Teleph Corp <Ntt> | 単語抽出装置、単語抽出方法およびプログラム |
Family Cites Families (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0444165A (ja) * | 1990-06-12 | 1992-02-13 | Nec Corp | 対称連立一次方程式の求解方式 |
DE69423838T2 (de) * | 1993-09-23 | 2000-08-03 | Xerox Corp., Rochester | Semantische Gleichereignisfilterung für Spracherkennung und Signalübersetzungsanwendungen |
US5675819A (en) * | 1994-06-16 | 1997-10-07 | Xerox Corporation | Document information retrieval using global word co-occurrence patterns |
US5715468A (en) * | 1994-09-30 | 1998-02-03 | Budzinski; Robert Lucius | Memory system for storing and retrieving experience and knowledge with natural language |
US6173261B1 (en) * | 1998-09-30 | 2001-01-09 | At&T Corp | Grammar fragment acquisition using syntactic and semantic clustering |
US5828999A (en) * | 1996-05-06 | 1998-10-27 | Apple Computer, Inc. | Method and system for deriving a large-span semantic language model for large-vocabulary recognition systems |
US5842161A (en) * | 1996-06-25 | 1998-11-24 | Lucent Technologies Inc. | Telecommunications instrument employing variable criteria speech recognition |
US5991712A (en) * | 1996-12-05 | 1999-11-23 | Sun Microsystems, Inc. | Method, apparatus, and product for automatic generation of lexical features for speech recognition systems |
US6356864B1 (en) * | 1997-07-25 | 2002-03-12 | University Technology Corporation | Methods for analysis and evaluation of the semantic content of a writing based on vector length |
US6021384A (en) * | 1997-10-29 | 2000-02-01 | At&T Corp. | Automatic generation of superwords |
US6243680B1 (en) * | 1998-06-15 | 2001-06-05 | Nortel Networks Limited | Method and apparatus for obtaining a transcription of phrases through text and spoken utterances |
US6826556B1 (en) * | 1998-10-02 | 2004-11-30 | Ncr Corporation | Techniques for deploying analytic models in a parallel |
US6411930B1 (en) * | 1998-11-18 | 2002-06-25 | Lucent Technologies Inc. | Discriminative gaussian mixture models for speaker verification |
US6317707B1 (en) * | 1998-12-07 | 2001-11-13 | At&T Corp. | Automatic clustering of tokens from a corpus for grammar acquisition |
US6415248B1 (en) * | 1998-12-09 | 2002-07-02 | At&T Corp. | Method for building linguistic models from a corpus |
US6385579B1 (en) * | 1999-04-29 | 2002-05-07 | International Business Machines Corporation | Methods and apparatus for forming compound words for use in a continuous speech recognition system |
US6751621B1 (en) * | 2000-01-27 | 2004-06-15 | Manning & Napier Information Services, Llc. | Construction of trainable semantic vectors and clustering, classification, and searching using trainable semantic vectors |
CN1174332C (zh) * | 2000-03-10 | 2004-11-03 | 松下电器产业株式会社 | 转换表达方式的方法和装置 |
US6782357B1 (en) | 2000-05-04 | 2004-08-24 | Microsoft Corporation | Cluster and pruning-based language model compression |
US6578032B1 (en) * | 2000-06-28 | 2003-06-10 | Microsoft Corporation | Method and system for performing phrase/word clustering and cluster merging |
US7389234B2 (en) * | 2000-07-20 | 2008-06-17 | Microsoft Corporation | Method and apparatus utilizing speech grammar rules written in a markup language |
JP2002041544A (ja) * | 2000-07-25 | 2002-02-08 | Toshiba Corp | テキスト情報分析装置 |
US6925432B2 (en) * | 2000-10-11 | 2005-08-02 | Lucent Technologies Inc. | Method and apparatus using discriminative training in natural language call routing and document retrieval |
WO2002061728A1 (fr) * | 2001-02-01 | 2002-08-08 | Matsushita Electric Industrial Co., Ltd. | Dispositif de reconnaissance de phrases, procede de reconnaissance de phrases, programme et support |
US6856957B1 (en) * | 2001-02-07 | 2005-02-15 | Nuance Communications | Query expansion and weighting based on results of automatic speech recognition |
US7124081B1 (en) * | 2001-09-28 | 2006-10-17 | Apple Computer, Inc. | Method and apparatus for speech recognition using latent semantic adaptation |
JP2004164036A (ja) * | 2002-11-08 | 2004-06-10 | Hewlett Packard Co <Hp> | 文書の共通性評価方法 |
US7289956B2 (en) | 2003-05-27 | 2007-10-30 | Microsoft Corporation | System and method for user modeling to enhance named entity recognition |
JP4445997B2 (ja) * | 2004-02-25 | 2010-04-07 | 株式会社エヌ・ティ・ティ・ドコモ | マルチ入力マルチ出力フィルタを用いたシーケンス推定のための装置及び方法 |
US7254774B2 (en) * | 2004-03-16 | 2007-08-07 | Microsoft Corporation | Systems and methods for improved spell checking |
US7620539B2 (en) * | 2004-07-12 | 2009-11-17 | Xerox Corporation | Methods and apparatuses for identifying bilingual lexicons in comparable corpora using geometric processing |
US7379870B1 (en) * | 2005-02-03 | 2008-05-27 | Hrl Laboratories, Llc | Contextual filtering |
US7805300B2 (en) * | 2005-03-21 | 2010-09-28 | At&T Intellectual Property Ii, L.P. | Apparatus and method for analysis of language model changes |
JP4524640B2 (ja) * | 2005-03-31 | 2010-08-18 | ソニー株式会社 | 情報処理装置および方法、並びにプログラム |
US7672833B2 (en) * | 2005-09-22 | 2010-03-02 | Fair Isaac Corporation | Method and apparatus for automatic entity disambiguation |
US7590626B2 (en) * | 2006-10-30 | 2009-09-15 | Microsoft Corporation | Distributional similarity-based models for query correction |
-
2005
- 2005-11-18 US US11/283,149 patent/US8249871B2/en not_active Expired - Fee Related
-
2006
- 2006-11-14 KR KR1020087011856A patent/KR101411113B1/ko active IP Right Grant
- 2006-11-14 JP JP2008541262A patent/JP5214461B2/ja not_active Expired - Fee Related
- 2006-11-14 CN CNA2006800427922A patent/CN101310273A/zh active Pending
- 2006-11-14 EP EP06837492A patent/EP1922653B1/en not_active Not-in-force
- 2006-11-14 WO PCT/US2006/044080 patent/WO2007061674A1/en active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08263510A (ja) * | 1995-03-24 | 1996-10-11 | Nec Corp | 文章自動分類システム |
JP2001101194A (ja) * | 1999-09-27 | 2001-04-13 | Mitsubishi Electric Corp | テキストマイニング方法、テキストマイニング装置及びテキストマイニングプログラムが記録された記録媒体 |
JP2001243223A (ja) * | 2000-02-29 | 2001-09-07 | Nec Corp | 意味ネットワーク自動作成装置及びコンピュータ可読記録媒体 |
JP2003288362A (ja) * | 2002-03-27 | 2003-10-10 | Seiko Epson Corp | 特定要素ベクトル生成装置、文字列ベクトル生成装置、類似度算出装置、特定要素ベクトル生成プログラム、文字列ベクトル生成プログラム及び類似度算出プログラム、並びに特定要素ベクトル生成方法、文字列ベクトル生成方法及び類似度算出方法 |
JP2004252775A (ja) * | 2003-02-20 | 2004-09-09 | Nippon Telegr & Teleph Corp <Ntt> | 単語抽出装置、単語抽出方法およびプログラム |
Non-Patent Citations (4)
Title |
---|
CSNG200500672004; 南條浩輝 他: '"講演音声認識のための教師なし言語モデル適応と発話速度に適応したデコーディング"' 電子情報通信学会論文誌D-II Vol.J87-D-II,No.8, 20040801, p.1581-1592 * |
CSNG200600928054; 佐古淳 他: '"単語共起に注目した野球実況中継の構造化"' 日本音響学会2005年春季研究発表会講演論文集-I- , 20050308, p.149-150 * |
JPN6011062825; 南條浩輝 他: '"講演音声認識のための教師なし言語モデル適応と発話速度に適応したデコーディング"' 電子情報通信学会論文誌D-II Vol.J87-D-II,No.8, 20040801, p.1581-1592 * |
JPN6011062826; 佐古淳 他: '"単語共起に注目した野球実況中継の構造化"' 日本音響学会2005年春季研究発表会講演論文集-I- , 20050308, p.149-150 * |
Also Published As
Publication number | Publication date |
---|---|
EP1922653B1 (en) | 2012-12-26 |
WO2007061674A1 (en) | 2007-05-31 |
CN101310273A (zh) | 2008-11-19 |
US20070118376A1 (en) | 2007-05-24 |
EP1922653A4 (en) | 2011-09-28 |
KR101411113B1 (ko) | 2014-06-25 |
KR20080073298A (ko) | 2008-08-08 |
JP5214461B2 (ja) | 2013-06-19 |
US8249871B2 (en) | 2012-08-21 |
EP1922653A1 (en) | 2008-05-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5214461B2 (ja) | インプットデータに対するワードクラスタリング | |
US7813926B2 (en) | Training system for a speech recognition application | |
US7634406B2 (en) | System and method for identifying semantic intent from acoustic information | |
US10210862B1 (en) | Lattice decoding and result confirmation using recurrent neural networks | |
JP5459214B2 (ja) | 言語モデル作成装置、言語モデル作成方法、音声認識装置、音声認識方法、プログラム、および記録媒体 | |
US7844456B2 (en) | Grammar confusability metric for speech recognition | |
US9292487B1 (en) | Discriminative language model pruning | |
US7043422B2 (en) | Method and apparatus for distribution-based language model adaptation | |
TWI377561B (en) | Natural language business system and method based on unisolated performance metric | |
US20090037175A1 (en) | Confidence measure generation for speech related searching | |
US10089978B2 (en) | Detecting customers with low speech recognition accuracy by investigating consistency of conversation in call-center | |
US7401019B2 (en) | Phonetic fragment search in speech data | |
US20050228667A1 (en) | System and method for effectively implementing an optimized language model for speech recognition | |
KR20230006625A (ko) | Wfst의 최적화를 이용하는 음성 인식 장치 및 음성 인식 방법 | |
JP2004341520A (ja) | 音声認識方法 | |
US20030093272A1 (en) | Speech operated automatic inquiry system | |
JP2010078877A (ja) | 音声認識装置、音声認識方法及び音声認識プログラム | |
JP2004198597A (ja) | 音声認識装置および文分類装置としてコンピュータを動作させるコンピュータプログラム、階層化された言語モデルを作成する方法を実現する様にコンピュータを動作させるコンピュータプログラム、および記憶媒体 | |
JP4826719B2 (ja) | 音声認識システム、音声認識方法、および音声認識プログラム | |
Ogawa et al. | Error type classification and word accuracy estimation using alignment features from word confusion network | |
JP2886121B2 (ja) | 統計的言語モデル生成装置及び音声認識装置 | |
Shafran et al. | Efficient determinization of tagged word lattices using categorial and lexicographic semirings | |
JP2002082690A (ja) | 言語モデル生成方法、音声認識方法及びそのプログラム記録媒体 | |
JP2004101963A (ja) | 音声認識結果の訂正方法および音声認識結果の訂正のためのコンピュータプログラム | |
Ma et al. | Recognize foreign low-frequency words with similar pairs |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20091014 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111118 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111129 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120228 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121019 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130118 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130215 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130227 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160308 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |