JP2011185997A - 音声検索装置、音声検索方法、プログラム及び記録媒体 - Google Patents
音声検索装置、音声検索方法、プログラム及び記録媒体 Download PDFInfo
- Publication number
- JP2011185997A JP2011185997A JP2010048179A JP2010048179A JP2011185997A JP 2011185997 A JP2011185997 A JP 2011185997A JP 2010048179 A JP2010048179 A JP 2010048179A JP 2010048179 A JP2010048179 A JP 2010048179A JP 2011185997 A JP2011185997 A JP 2011185997A
- Authority
- JP
- Japan
- Prior art keywords
- keyword
- acoustic
- stored
- similarity
- score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000004364 calculation method Methods 0.000 claims description 42
- 238000000605 extraction Methods 0.000 claims description 20
- 239000000284 extract Substances 0.000 claims description 13
- 230000006870 function Effects 0.000 claims description 13
- 238000010586 diagram Methods 0.000 description 14
- 238000010606 normalization Methods 0.000 description 11
- 238000007476 Maximum Likelihood Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 4
- 238000012795 verification Methods 0.000 description 3
- 235000016496 Panda oleosa Nutrition 0.000 description 2
- 240000000220 Panda oleosa Species 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】蓄積された音声データの特徴量と、音響モデルとから基準スコアを予め算出し、記憶する。キーワードを受け付けた場合、キーワードに係る音声データの特徴量を抽出し、その特徴量と音響モデルとからKWスコアRを算出する。算出したKWスコアRと、予め算出し、記憶した基準スコアに基づいて、蓄積された音声データから、キーワードを含む音声データを検索する。
【選択図】図2
Description
図1は、実施の形態に係る音声検索装置のハードウェア構成例を示すブロック図である。
以下、実施の形態2について説明する。実施の形態1では、音声検索装置10は、音響モデル42を一つのみ有しているが、本実施の形態では、2つの音響モデルを有している点で相違する。以下、相違点について説明する。
以下、実施の形態3について説明する。本実施の形態では、日本語と英語の二ヶ国語をキーワード検索の対象としている。以下、相違点について説明する。
複数の音声データを蓄積する蓄積手段と、
認識単位毎の音響特徴量空間での特性を保持している音響モデル記憶手段と、
前記蓄積手段に蓄積された音声データから音響特徴量を抽出する抽出手段と、
該抽出手段が抽出した音響特徴量を記憶する音響特徴量記憶手段と、
該音響特徴量記憶手段に記憶された音響特徴量と、前記音響モデルとの類似度を算出する第1算出手段と、
該第1算出手段が算出した類似度を記憶する類似度記憶手段と、
キーワードを受け付ける手段と、
キーワードに対応する音響モデルと、前記音響特徴量記憶手段に記憶された音響特徴量との照合により、キーワードのスコアを算出する第2算出手段と、
該第2算出手段が算出したキーワードのスコアと、前記類似度記憶手段に記憶された類似度とに基づいて、前記蓄積手段に蓄積された音声データからキーワードを含む音声データを検索する検索手段と
を備える音声検索装置。
前記抽出手段は、
音声データを所定時間Tで区切り、前記時間T毎に音声データの音響特徴量を抽出し、
前記第1算出手段は、
時間T毎に類似度を算出し、
前記類似度記憶手段は、
前記第1算出手段が算出した類似度を時間T毎に記憶し、
前記検索手段は、
前記第2算出手段が算出した類似度を、前記類似度記憶手段に記憶した類似度と時間T単位で対比して、音声データを検索するようにしてある
付記1に記載の音声検索装置。
前記音響モデル記憶手段は、
複数の音響モデルを記憶しており、
前記第1及び第2算出手段は、
それぞれ異なる音響モデルを用いるようにしてある
付記1又は2に記載の音声検索装置。
受け付けたキーワードの言語を判定する言語判定手段
をさらに備えており、
前記蓄積手段は、
複数の言語を含む音声データを蓄積し、
前記音響モデル記憶手段は、
複数の言語それぞれに対応する音響モデルを記憶し、
前記抽出手段は、
言語毎に音声データの音響特徴量を抽出し、
前記第1算出手段は、
各音響モデルを用いて、前記音声データに係る類似度を言語毎に算出し、
前記類似度記憶手段は、
前記第1算出手段が言語毎に算出した類似度のなかで、上位N(N≧1)番目までに高い類似度を記憶し、
前記検索手段は、
前記類似度記憶手段に記憶され、前記言語判定手段が判定した言語に対応する類似度を用いて検索するようにしてある
付記1から3の何れか一つに記載の音声検索装置。
前記検索手段は、
前記第2算出手段が算出したキーワードのスコアと、音声データの任意の区間における前記類似度記憶手段に記憶された類似度の総和との差が所定値以下又は未満となる場合に、前記区間をキーワード存在区間として検索するようにしてある
付記1から4の何れか一つに記載の音声検索装置。
記憶された類似度に係る音素に応じて、前記所定値を調整する手段
をさらに備える付記5に記載の音声検索装置。
前記第2算出手段が算出した類似度に係る音素に応じて、前記所定値を調整する手段
をさらに備える付記5又は6に記載の音声検索装置。
前記抽出手段は、
新たな音声データが前記蓄積手段に蓄積される都度、新たに蓄積された音声データから音響特徴量を抽出するようにしてある
付記1から7の何れか一つに記載の音声検索装置。
前記検索手段が検索する場合、前記抽出手段が音響特徴量を抽出していない音声データが前記蓄積手段に蓄積されているか否かを判定する手段と、
蓄積されていないと判定した場合、前記抽出手段に音響特徴量の抽出を要求する手段と
をさらに備える付記1から8の何れか一つに記載の音声検索装置。
記憶された認識単位毎の音響特徴量空間での特性を保持している音響モデルを用いて、蓄積された音声データから、受け付けたキーワードを含む音声データを検索する音声検索方法において、
蓄積された音声データから音響特徴量を抽出し、
抽出した音響特徴量を記憶し、
記憶した音響特徴量と、記憶された音響モデルで定められた音響特徴量との類似度を算出し、
算出した類似度を記憶し、
キーワードを受け付け、
キーワードに対応する音響モデルと、前記音響特徴量記憶手段に記憶された音響特徴量との照合により、キーワードのスコアを算出し、
算出したキーワードのスコアと、前記類似度記憶手段に記憶された類似度とに基づいて、前記蓄積手段に蓄積された音声データからキーワードを含む音声データを検索する
音声検索方法。
音声データを蓄積しており、認識単位毎の音響特徴量空間での特性を保持している音響モデルを記憶しているコンピュータで実行させるプログラムにおいて、
コンピュータを、
蓄積された音声データから音響特徴量を抽出する手段、
抽出した音響特徴量と、記憶された音響モデルで定められた音響特徴量との類似度を算出する第1算出手段、
受け付けたキーワードに対応する音響モデルと、前記音響特徴量記憶手段に記憶された音響特徴量との照合により、キーワードのスコアを算出する第2算出手段、及び、
該第2算出手段が算出したキーワードのスコアと、前記類似度記憶手段に記憶された類似度とに基づいて、前記蓄積手段に蓄積された音声データからキーワードを含む音声データを検索する検索手段
として機能させるプログラム。
付記11に記載のプログラムが記録されており、コンピュータでの読取り可能な記録媒体。
11 特徴量抽出部(抽出手段)
12 特徴量記憶部
13 基準スコア算出部(第1算出手段)
14 基準スコア記憶部(類似度記憶手段)
15 KW入力部
16 KW照合部(第2算出手段、検索手段)
17 検索結果出力部
41 音声DB
42 音響モデル
Claims (7)
- 複数の音声データを蓄積する蓄積手段と、
認識単位毎の音響特徴量空間での特性を保持している音響モデル記憶手段と、
前記蓄積手段に蓄積された音声データから音響特徴量を抽出する抽出手段と、
該抽出手段が抽出した音響特徴量を記憶する音響特徴量記憶手段と、
該音響特徴量記憶手段に記憶された音響特徴量と、前記音響モデルとの類似度を算出する第1算出手段と、
該第1算出手段が算出した類似度を記憶する類似度記憶手段と、
キーワードを受け付ける手段と、
キーワードに対応する音響モデルと、前記音響特徴量記憶手段に記憶された音響特徴量との照合により、キーワードのスコアを算出する第2算出手段と、
該第2算出手段が算出したキーワードのスコアと、前記類似度記憶手段に記憶された類似度とに基づいて、前記蓄積手段に蓄積された音声データからキーワードを含む音声データを検索する検索手段と
を備える音声検索装置。 - 前記音響モデル記憶手段は、
複数の音響モデルを記憶しており、
前記第1及び第2算出手段は、
それぞれ異なる音響モデルを用いるようにしてある
請求項1に記載の音声検索装置。 - 受け付けたキーワードの言語を判定する言語判定手段
をさらに備えており、
前記蓄積手段は、
複数の言語を含む音声データを蓄積し、
前記音響モデル記憶手段は、
複数の言語それぞれに対応する音響モデルを記憶し、
前記抽出手段は、
言語毎に音声データの音響特徴量を抽出し、
前記第1算出手段は、
各音響モデルを用いて、前記音声データに係る類似度を言語毎に算出し、
前記類似度記憶手段は、
前記第1算出手段が言語毎に算出した類似度のなかで、上位N(N≧1)番目までに高い類似度を記憶し、
前記検索手段は、
前記類似度記憶手段に記憶され、前記言語判定手段が判定した言語に対応する類似度を用いて検索するようにしてある
請求項1又は2に記載の音声検索装置。 - 前記検索手段は、
前記第2算出手段が算出したキーワードのスコアと、音声データの任意の区間における前記類似度記憶手段に記憶された類似度の総和との差が所定値以下又は未満となる場合に、前記区間をキーワード存在区間として検索するようにしてある
請求項1から3の何れか一つに記載の音声検索装置。 - 記憶された認識単位毎の音響特徴量空間での特性を保持している音響モデルを用いて、蓄積された音声データから、受け付けたキーワードを含む音声データを検索する音声検索方法において、
蓄積された音声データから音響特徴量を抽出し、
抽出した音響特徴量を記憶し、
記憶した音響特徴量と、記憶された音響モデルで定められた音響特徴量との類似度を算出し、
算出した類似度を記憶し、
キーワードを受け付け、
キーワードに対応する音響モデルと、前記音響特徴量記憶手段に記憶された音響特徴量との照合により、キーワードのスコアを算出し、
算出したキーワードのスコアと、前記類似度記憶手段に記憶された類似度とに基づいて、前記蓄積手段に蓄積された音声データからキーワードを含む音声データを検索する
音声検索方法。 - 音声データを蓄積しており、認識単位毎の音響特徴量空間での特性を保持している音響モデルを記憶しているコンピュータで実行させるプログラムにおいて、
コンピュータを、
蓄積された音声データから音響特徴量を抽出する手段、
抽出した音響特徴量と、記憶された音響モデルで定められた音響特徴量との類似度を算出する第1算出手段、
受け付けたキーワードに対応する音響モデルと、前記音響特徴量記憶手段に記憶された音響特徴量との照合により、キーワードのスコアを算出する第2算出手段、及び、
該第2算出手段が算出したキーワードのスコアと、前記類似度記憶手段に記憶された類似度とに基づいて、前記蓄積手段に蓄積された音声データからキーワードを含む音声データを検索する検索手段
として機能させるプログラム。 - 請求項6に記載のプログラムが記録されており、コンピュータでの読取り可能な記録媒体。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010048179A JP5533042B2 (ja) | 2010-03-04 | 2010-03-04 | 音声検索装置、音声検索方法、プログラム及び記録媒体 |
US13/039,495 US8731926B2 (en) | 2010-03-04 | 2011-03-03 | Spoken term detection apparatus, method, program, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010048179A JP5533042B2 (ja) | 2010-03-04 | 2010-03-04 | 音声検索装置、音声検索方法、プログラム及び記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011185997A true JP2011185997A (ja) | 2011-09-22 |
JP5533042B2 JP5533042B2 (ja) | 2014-06-25 |
Family
ID=44532073
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010048179A Expired - Fee Related JP5533042B2 (ja) | 2010-03-04 | 2010-03-04 | 音声検索装置、音声検索方法、プログラム及び記録媒体 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8731926B2 (ja) |
JP (1) | JP5533042B2 (ja) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015075789A1 (ja) * | 2013-11-20 | 2015-05-28 | 三菱電機株式会社 | 音声認識装置および音声認識方法 |
JP2015169698A (ja) * | 2014-03-05 | 2015-09-28 | カシオ計算機株式会社 | 音声検索装置、音声検索方法及びプログラム |
JP2015206906A (ja) * | 2014-04-21 | 2015-11-19 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 音声検索方法、音声検索装置、並びに、音声検索装置用のプログラム |
JP2016119000A (ja) * | 2014-12-22 | 2016-06-30 | カシオ計算機株式会社 | 音声検索装置、音声検索方法及びプログラム |
JP2016118999A (ja) * | 2014-12-22 | 2016-06-30 | カシオ計算機株式会社 | 音声検索装置、音声検索方法及びプログラム |
US20160284345A1 (en) | 2013-11-06 | 2016-09-29 | Systran International Co., Ltd. | System for grasping keyword extraction based speech content on recorded voice data, indexing method using the system, and method for grasping speech content |
JP2017021196A (ja) * | 2015-07-10 | 2017-01-26 | カシオ計算機株式会社 | 音声検索装置、音声検索方法及びプログラム |
JP2017097162A (ja) * | 2015-11-24 | 2017-06-01 | 富士通株式会社 | キーワード検出装置、キーワード検出方法及びキーワード検出用コンピュータプログラム |
KR20190139774A (ko) * | 2018-06-08 | 2019-12-18 | 성신여자대학교 연구 산학협력단 | 음향 데이터 탐색 방법 및 장치 |
JP2021015137A (ja) * | 2019-07-10 | 2021-02-12 | 三菱電機株式会社 | 情報処理装置、プログラム及び情報処理方法 |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180317019A1 (en) | 2013-05-23 | 2018-11-01 | Knowles Electronics, Llc | Acoustic activity detecting microphone |
US20150206539A1 (en) * | 2013-06-04 | 2015-07-23 | Ims Solutions, Inc. | Enhanced human machine interface through hybrid word recognition and dynamic speech synthesis tuning |
US9177547B2 (en) * | 2013-06-25 | 2015-11-03 | The Johns Hopkins University | System and method for processing speech to identify keywords or other information |
US9508345B1 (en) | 2013-09-24 | 2016-11-29 | Knowles Electronics, Llc | Continuous voice sensing |
US9953634B1 (en) | 2013-12-17 | 2018-04-24 | Knowles Electronics, Llc | Passive training for automatic speech recognition |
US9899021B1 (en) * | 2013-12-20 | 2018-02-20 | Amazon Technologies, Inc. | Stochastic modeling of user interactions with a detection system |
US9437188B1 (en) | 2014-03-28 | 2016-09-06 | Knowles Electronics, Llc | Buffered reprocessing for multi-microphone automatic speech recognition assist |
US10045140B2 (en) | 2015-01-07 | 2018-08-07 | Knowles Electronics, Llc | Utilizing digital microphones for low power keyword detection and noise suppression |
US9875743B2 (en) * | 2015-01-26 | 2018-01-23 | Verint Systems Ltd. | Acoustic signature building for a speaker from multiple sessions |
US11721329B2 (en) * | 2017-09-11 | 2023-08-08 | Indian Institute Of Technology, Delhi | Method, system and apparatus for multilingual and multimodal keyword search in a mixlingual speech corpus |
CN107886968B (zh) * | 2017-12-28 | 2021-08-24 | 广州讯飞易听说网络科技有限公司 | 语音评测方法及系统 |
CN114596840B (zh) * | 2022-03-04 | 2024-06-18 | 腾讯科技(深圳)有限公司 | 语音识别方法、装置、设备及计算机可读存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11282857A (ja) * | 1998-03-27 | 1999-10-15 | Animo:Kk | 音声検索装置および記録媒体 |
JP2002221984A (ja) * | 2001-01-25 | 2002-08-09 | National Institute Of Advanced Industrial & Technology | 異種環境音声データの音声検索方法及び装置 |
Family Cites Families (44)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5218668A (en) * | 1984-09-28 | 1993-06-08 | Itt Corporation | Keyword recognition system and method using template concantenation model |
JP2964518B2 (ja) * | 1990-01-30 | 1999-10-18 | 日本電気株式会社 | 音声制御方式 |
JP2808906B2 (ja) | 1991-02-07 | 1998-10-08 | 日本電気株式会社 | 音声認識装置 |
JPH05334861A (ja) | 1992-06-03 | 1993-12-17 | Japan Radio Co Ltd | 音声検索装置 |
JPH06175698A (ja) | 1992-12-09 | 1994-06-24 | Ricoh Co Ltd | 音声検索装置 |
US5566272A (en) * | 1993-10-27 | 1996-10-15 | Lucent Technologies Inc. | Automatic speech recognition (ASR) processing using confidence measures |
TW323364B (ja) * | 1993-11-24 | 1997-12-21 | At & T Corp | |
US5625748A (en) * | 1994-04-18 | 1997-04-29 | Bbn Corporation | Topic discriminator using posterior probability or confidence scores |
US5710864A (en) * | 1994-12-29 | 1998-01-20 | Lucent Technologies Inc. | Systems, methods and articles of manufacture for improving recognition confidence in hypothesized keywords |
US5842163A (en) * | 1995-06-21 | 1998-11-24 | Sri International | Method and apparatus for computing likelihood and hypothesizing keyword appearance in speech |
US5717826A (en) * | 1995-08-11 | 1998-02-10 | Lucent Technologies Inc. | Utterance verification using word based minimum verification error training for recognizing a keyboard string |
US5684925A (en) * | 1995-09-08 | 1997-11-04 | Matsushita Electric Industrial Co., Ltd. | Speech representation by feature-based word prototypes comprising phoneme targets having reliable high similarity |
US5774858A (en) * | 1995-10-23 | 1998-06-30 | Taubkin; Vladimir L. | Speech analysis method of protecting a vehicle from unauthorized accessing and controlling |
US5960447A (en) * | 1995-11-13 | 1999-09-28 | Holt; Douglas | Word tagging and editing system for speech recognition |
GB2303955B (en) * | 1996-09-24 | 1997-05-14 | Allvoice Computing Plc | Data processing method and apparatus |
US5797123A (en) * | 1996-10-01 | 1998-08-18 | Lucent Technologies Inc. | Method of key-phase detection and verification for flexible speech understanding |
US6125345A (en) * | 1997-09-19 | 2000-09-26 | At&T Corporation | Method and apparatus for discriminative utterance verification using multiple confidence measures |
WO1999016051A1 (en) * | 1997-09-24 | 1999-04-01 | Lernout & Hauspie Speech Products N.V | Apparatus and method for distinguishing similar-sounding utterances in speech recognition |
US6233555B1 (en) * | 1997-11-25 | 2001-05-15 | At&T Corporation | Method and apparatus for speaker identification using mixture discriminant analysis to develop speaker models |
JPH11202890A (ja) | 1998-01-20 | 1999-07-30 | Ricoh Co Ltd | 音声検索装置 |
US6321195B1 (en) * | 1998-04-28 | 2001-11-20 | Lg Electronics Inc. | Speech recognition method |
US6292778B1 (en) * | 1998-10-30 | 2001-09-18 | Lucent Technologies Inc. | Task-independent utterance verification with subword-based minimum verification error training |
US6571210B2 (en) * | 1998-11-13 | 2003-05-27 | Microsoft Corporation | Confidence measure system using a near-miss pattern |
US6230129B1 (en) * | 1998-11-25 | 2001-05-08 | Matsushita Electric Industrial Co., Ltd. | Segment-based similarity method for low complexity speech recognizer |
JP2000259645A (ja) | 1999-03-05 | 2000-09-22 | Fuji Xerox Co Ltd | 音声処理装置及び音声データ検索装置 |
US6434520B1 (en) * | 1999-04-16 | 2002-08-13 | International Business Machines Corporation | System and method for indexing and querying audio archives |
US6434521B1 (en) * | 1999-06-24 | 2002-08-13 | Speechworks International, Inc. | Automatically determining words for updating in a pronunciation dictionary in a speech recognition system |
US8060906B2 (en) * | 2001-04-06 | 2011-11-15 | At&T Intellectual Property Ii, L.P. | Method and apparatus for interactively retrieving content related to previous query results |
US7058575B2 (en) * | 2001-06-27 | 2006-06-06 | Intel Corporation | Integrating keyword spotting with graph decoder to improve the robustness of speech recognition |
JP2003036093A (ja) * | 2001-07-23 | 2003-02-07 | Japan Science & Technology Corp | 音声入力検索システム |
TWI223791B (en) * | 2003-04-14 | 2004-11-11 | Ind Tech Res Inst | Method and system for utterance verification |
TWI220511B (en) * | 2003-09-12 | 2004-08-21 | Ind Tech Res Inst | An automatic speech segmentation and verification system and its method |
US7725318B2 (en) * | 2004-07-30 | 2010-05-25 | Nice Systems Inc. | System and method for improving the accuracy of audio searching |
KR100679044B1 (ko) * | 2005-03-07 | 2007-02-06 | 삼성전자주식회사 | 사용자 적응형 음성 인식 방법 및 장치 |
US7957972B2 (en) * | 2006-09-05 | 2011-06-07 | Fortemedia, Inc. | Voice recognition system and method thereof |
JP4845118B2 (ja) * | 2006-11-20 | 2011-12-28 | 富士通株式会社 | 音声認識装置、音声認識方法、および、音声認識プログラム |
JP4973731B2 (ja) * | 2007-07-09 | 2012-07-11 | 富士通株式会社 | 音声認識装置、音声認識方法、および、音声認識プログラム |
US9405823B2 (en) * | 2007-07-23 | 2016-08-02 | Nuance Communications, Inc. | Spoken document retrieval using multiple speech transcription indices |
US8831946B2 (en) * | 2007-07-23 | 2014-09-09 | Nuance Communications, Inc. | Method and system of indexing speech data |
US8209171B2 (en) * | 2007-08-07 | 2012-06-26 | Aurix Limited | Methods and apparatus relating to searching of spoken audio data |
US8311828B2 (en) * | 2007-08-28 | 2012-11-13 | Nexidia Inc. | Keyword spotting using a phoneme-sequence index |
EP2058800B1 (en) * | 2007-10-24 | 2010-09-01 | Harman Becker Automotive Systems GmbH | Method and system for recognizing speech for searching a database |
JP5098613B2 (ja) * | 2007-12-10 | 2012-12-12 | 富士通株式会社 | 音声認識装置及びコンピュータプログラム |
JP5440177B2 (ja) * | 2007-12-21 | 2014-03-12 | 日本電気株式会社 | 単語カテゴリ推定装置、単語カテゴリ推定方法、音声認識装置、音声認識方法、プログラム、および記録媒体 |
-
2010
- 2010-03-04 JP JP2010048179A patent/JP5533042B2/ja not_active Expired - Fee Related
-
2011
- 2011-03-03 US US13/039,495 patent/US8731926B2/en not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11282857A (ja) * | 1998-03-27 | 1999-10-15 | Animo:Kk | 音声検索装置および記録媒体 |
JP2002221984A (ja) * | 2001-01-25 | 2002-08-09 | National Institute Of Advanced Industrial & Technology | 異種環境音声データの音声検索方法及び装置 |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160284345A1 (en) | 2013-11-06 | 2016-09-29 | Systran International Co., Ltd. | System for grasping keyword extraction based speech content on recorded voice data, indexing method using the system, and method for grasping speech content |
US10304441B2 (en) | 2013-11-06 | 2019-05-28 | Systran International Co., Ltd. | System for grasping keyword extraction based speech content on recorded voice data, indexing method using the system, and method for grasping speech content |
JP2016539364A (ja) * | 2013-11-06 | 2016-12-15 | シストラン・インターナショナル・カンパニー・リミテッドSystran International Co., Ltd. | 録取された音声データに対する核心語の取出に基づく発話内容の把握システムと、このシステムを用いたインデクシング方法及び発話内容の把握方法 |
JP6080978B2 (ja) * | 2013-11-20 | 2017-02-15 | 三菱電機株式会社 | 音声認識装置および音声認識方法 |
WO2015075789A1 (ja) * | 2013-11-20 | 2015-05-28 | 三菱電機株式会社 | 音声認識装置および音声認識方法 |
JPWO2015075789A1 (ja) * | 2013-11-20 | 2017-03-16 | 三菱電機株式会社 | 音声認識装置および音声認識方法 |
US9711136B2 (en) | 2013-11-20 | 2017-07-18 | Mitsubishi Electric Corporation | Speech recognition device and speech recognition method |
JP2015169698A (ja) * | 2014-03-05 | 2015-09-28 | カシオ計算機株式会社 | 音声検索装置、音声検索方法及びプログラム |
JP2015206906A (ja) * | 2014-04-21 | 2015-11-19 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 音声検索方法、音声検索装置、並びに、音声検索装置用のプログラム |
JP2016119000A (ja) * | 2014-12-22 | 2016-06-30 | カシオ計算機株式会社 | 音声検索装置、音声検索方法及びプログラム |
JP2016118999A (ja) * | 2014-12-22 | 2016-06-30 | カシオ計算機株式会社 | 音声検索装置、音声検索方法及びプログラム |
JP2017021196A (ja) * | 2015-07-10 | 2017-01-26 | カシオ計算機株式会社 | 音声検索装置、音声検索方法及びプログラム |
JP2017097162A (ja) * | 2015-11-24 | 2017-06-01 | 富士通株式会社 | キーワード検出装置、キーワード検出方法及びキーワード検出用コンピュータプログラム |
KR20190139774A (ko) * | 2018-06-08 | 2019-12-18 | 성신여자대학교 연구 산학협력단 | 음향 데이터 탐색 방법 및 장치 |
KR102185784B1 (ko) * | 2018-06-08 | 2020-12-02 | 성신여자대학교 연구 산학협력단 | 음향 데이터 탐색 방법 및 장치 |
JP2021015137A (ja) * | 2019-07-10 | 2021-02-12 | 三菱電機株式会社 | 情報処理装置、プログラム及び情報処理方法 |
JP7278161B2 (ja) | 2019-07-10 | 2023-05-19 | 三菱電機株式会社 | 情報処理装置、プログラム及び情報処理方法 |
Also Published As
Publication number | Publication date |
---|---|
JP5533042B2 (ja) | 2014-06-25 |
US8731926B2 (en) | 2014-05-20 |
US20110218805A1 (en) | 2011-09-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5533042B2 (ja) | 音声検索装置、音声検索方法、プログラム及び記録媒体 | |
CN105723449B (zh) | 言语内容分析系统和言语内容分析方法 | |
US9466289B2 (en) | Keyword detection with international phonetic alphabet by foreground model and background model | |
JP3782943B2 (ja) | 音声認識装置、コンピュータ・システム、音声認識方法、プログラムおよび記録媒体 | |
US10319373B2 (en) | Information processing device, information processing method, computer program product, and recognition system | |
US8380505B2 (en) | System for recognizing speech for searching a database | |
US10019514B2 (en) | System and method for phonetic search over speech recordings | |
US20070094007A1 (en) | Conversation controller | |
JP2005010691A (ja) | 音声認識装置、音声認識方法、会話制御装置、会話制御方法及びこれらのためのプログラム | |
JP2008134475A (ja) | 入力された音声のアクセントを認識する技術 | |
JPWO2009081861A1 (ja) | 単語カテゴリ推定装置、単語カテゴリ推定方法、音声認識装置、音声認識方法、プログラム、および記録媒体 | |
Lugosch et al. | Donut: Ctc-based query-by-example keyword spotting | |
EP2545547A1 (en) | Fast partial pattern matching system and method | |
JP4758758B2 (ja) | 辞書作成装置および辞書作成プログラム | |
JP5897718B2 (ja) | 音声検索装置、計算機読み取り可能な記憶媒体、及び音声検索方法 | |
JPWO2010050414A1 (ja) | モデル適応装置、その方法及びそのプログラム | |
JP4764203B2 (ja) | 音声認識装置及び音声認識プログラム | |
JP2010164918A (ja) | 音声翻訳装置、および方法 | |
JP5004863B2 (ja) | 音声検索装置および音声検索方法 | |
JP2011007862A (ja) | 音声認識装置、音声認識プログラム、および音声認識方法 | |
Norouzian et al. | An approach for efficient open vocabulary spoken term detection | |
JP4528540B2 (ja) | 音声認識方法及び装置及び音声認識プログラム及び音声認識プログラムを格納した記憶媒体 | |
JP5124012B2 (ja) | 音声認識装置及び音声認識プログラム | |
JP2015118354A (ja) | 音声認識装置および音声認識方法 | |
JP2001312293A (ja) | 音声認識方法およびその装置、並びにコンピュータ読み取り可能な記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130108 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131003 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131015 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131125 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131204 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140401 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5533042 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140414 |
|
LAPS | Cancellation because of no payment of annual fees |