JP2009216986A - 音声データ検索システム及び音声データの検索方法 - Google Patents
音声データ検索システム及び音声データの検索方法 Download PDFInfo
- Publication number
- JP2009216986A JP2009216986A JP2008060778A JP2008060778A JP2009216986A JP 2009216986 A JP2009216986 A JP 2009216986A JP 2008060778 A JP2008060778 A JP 2008060778A JP 2008060778 A JP2008060778 A JP 2008060778A JP 2009216986 A JP2009216986 A JP 2009216986A
- Authority
- JP
- Japan
- Prior art keywords
- search
- information
- data
- feature amount
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 38
- 238000000605 extraction Methods 0.000 claims description 35
- 238000003860 storage Methods 0.000 claims description 33
- 239000000284 extract Substances 0.000 claims description 22
- 230000002596 correlated effect Effects 0.000 abstract 1
- 230000000875 corresponding effect Effects 0.000 abstract 1
- 238000013500 data storage Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 230000000877 morphologic effect Effects 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 239000000203 mixture Substances 0.000 description 3
- 238000009826 distribution Methods 0.000 description 2
- 230000008602 contraction Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/683—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/685—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using automatically derived transcript of audio data, e.g. lyrics
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Library & Information Science (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Acoustics & Sound (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】メタデータが付与された音声データを表現する音響情報特徴量を抽出する。次に、得られた音響情報特徴量のサブ集合のうちで、特定の単語をメタデータに含む音声データのみから抽出され、それ以外の音声データからは抽出されないような音響情報特徴量集合を抽出する。当該単語と前記抽出した音響情報特徴量の集合を対応づけて格納する。入力された検索キーの中に前記単語と合致するものがあった場合に、当該単語に対応した音響情報特徴量の集合を出力する。
【選択図】図2
Description
前記実施形態1では、検索キーとしてキーワードを入力し、音響情報特徴量提示部111では、表示装置5へ音声認識結果情報特徴量の提示を行った。これに対し、第2の実施形態では、検索キーとして、キーワードに加えて、音響的話者特徴情報、発話長、韻律特徴量、話者交代情報、発話音量情報、背景音情報のいずれかを入力し、これらの検索キーで音響情報特徴量の検索を行う音声検索システムを示す。
6 音声データ蓄積装置
10 音声検索アプリケーション
100 音声データベース
101 音声データ
102 メタデータ単語列
103 音響情報特徴量抽出部
106 単語・音響情報特徴量対応保管部
110 単語・音響情報特徴量検索部
111 音響情報特徴量提示部
Claims (16)
- 音声データを格納する音声データベースと、
前記音声データの検索を行う以前に、前記音声データから検索用の検索データを生成する検索データ生成部と、
前記予め設定した条件に基づいて前記検索データを検索する検索部と、を備え、
前記音声データベースは、
前記音声データに対応するメタデータを前記音声データに付加して格納し、
前記検索データ生成部は、
前記音声データから発話毎の音響情報特徴量を抽出する音響情報特徴量抽出部と、
前記抽出された音響情報特徴量に対してクラスタリングを行ってから、当該クラスタリングした音響情報特徴量と、前記メタデータに含まれる単語との対応関係を前記検索データとして生成する対応関係生成部と、
前記生成した対応関係を格納する対応関係格納部と、
を有することを特徴とする音声データ検索システム。 - 前記検索部は、
前記音声データベースを検索するための検索キーを前記条件として入力する検索キー入力部と、
前記検索キーが前記音声データ中で発話された位置を検出する音声データ検索部と、
前記検索キーに対応する音響情報特徴量を前記検索データから検索する単語・音響情報特徴量検索部と、
前記音声データ検索部の検索結果と、前記単語・音響情報特徴量検索部の検索結果を出力する提示部とを備えたことを特徴とする請求項1に記載の音声データ検索システム。 - 前記音響情報特徴量抽出部は、
前記音声データを発話毎に分割する音声分割部と、
前記音声データについて前記発話毎に音声認識を行い、音声認識結果情報として単語列を出力する音声認識部と、
予め設定した音声モデルと、前記音声データとを比較して、音声データに含まれる発話毎の話者の特徴量を音響的話者特徴情報として抽出する話者情報特徴量抽出部と、
前記音声データに含まれる発話の長さを発話長情報として抽出する発話長抽出部と、
前記音声データに含まれる発話毎の韻律を韻律情報として抽出する韻律情報抽出部と、
前記音声データ中の発話が同一人物であるか否かを示す特徴量として話者交代情報を前記音声データから抽出する話者交代情報抽出部と、
前記音声データに含まれる発話毎の音量を発話音量情報として抽出する発話音量抽出部と、
前記音声データに含まれる背景音を背景音情報として抽出する背景音抽出部と、を有し、
前記音声認識結果情報、音響的話者特徴情報、発話長情報、韻律情報、話者交代情報、発話音量情報、背景音情報のうちの少なくとも一つを出力することを特徴とする請求項1に記載の音声データ検索システム。 - 前記提示部は、前記単語・音響情報特徴量検索部で検索された音響情報特徴量を出力する音響情報特徴量提示部を有することを特徴とする請求項2に記載の音声データ検索システム。
- 前記音響情報特徴量提示部は、
前記単語・音響情報特徴量検索部で検索された音響情報特徴量のうち前記音声データに存在する確率の高い音響情報特徴量を優先して出力する音響情報特徴量提示部を含むことを特徴とする請求項4に記載の音声データ検索システム。 - 検索対象とする音声データを指定する音声データ指定部を、さらに備え、
前記音響情報特徴量提示部は、
前記単語・音響情報特徴量検索部で検索された音響情報特徴量のうち検索対象として指定された音声データに存在する確率の高い音響情報特徴量を優先して出力することを特徴とする請求項5に記載の音声データ検索システム。 - 前記単語・音響情報特徴量保管部は、
前記音響情報特徴量の組を追加、削除、編集する単語・音響情報特徴量編集部を有することを特徴とする請求項1に記載の音声データ検索システム。 - 前記検索部は、
前記音声データベースを検索するための検索キーを入力する検索キー入力部を有し、
前記検索キー入力部は、
キーワードと、前記音響的話者特徴情報と、前記発話長情報と、前記韻律情報と、前記話者交代情報と、前記発話音量情報と、前記背景音情報のうちの少なくとも一つを受け付けることを特徴とする請求項3に記載の音声データ検索システム。 - 音声データベースに格納された音声データを、予め設定した条件で計算機が前記音声データの検索を行う音声データの検索方法であって、
前記音声データの検索を行う以前に、計算機が前記音声データから検索用の検索データを生成するステップと、
前記予め設定した条件に基づいて前記計算機が前記検索データを検索するステップと、を備え、
前記音声データベースは、
前記音声データに対応するメタデータを前記音声データに付加して格納し、
前記音声データから検索用の検索データを生成するステップは、
前記音声データから発話毎の音響情報特徴量を抽出するステップと、
前記抽出された音響情報特徴量に対してクラスタリングを行ってから、当該クラスタリングした音響情報特徴量と、前記メタデータに含まれる単語との対応関係を前記検索データとして生成するステップと、
前記生成した対応関係を格納するステップと、
を含むことを特徴とする音声データの検索方法。 - 前記前記予め設定した条件に基づいて前記計算機が前記検索データを検索するステップは、
前記音声データベースを検索するための検索キーを前記条件として入力するステップと、
前記検索キーが前記音声データ中で発話された位置を検出するステップと、
前記検索キーに対応する音響情報特徴量を前記検索データから検索するステップと、
前記音声データの検索結果と、前記音響情報特徴量の検索結果を出力するステップと、
を備えたことを特徴とする請求項9に記載の音声データの検索方法。 - 前記音響情報特徴量を抽出するステップは、
前記音声データを発話毎に分割するステップと、
前記音声データについて前記発話毎に音声認識を行い、音声認識結果情報として単語列を出力するステップと、
予め設定した音声モデルと、前記音声データとを比較して、音声データに含まれる発話毎の話者の特徴量を音響的話者特徴情報として抽出するステップと、
前記音声データに含まれる発話の長さを発話長情報として抽出するステップと、
前記音声データに含まれる発話毎の韻律を韻律情報として抽出するステップと、
前記音声データ中の発話が同一人物であるか否かを示す特徴量として話者交代情報を前記音声データから抽出するステップと、
前記音声データに含まれる発話毎の音量を発話音量情報として抽出するステップと、
前記音声データに含まれる背景音を背景音情報として抽出するステップと、を含み、
前記音声認識結果情報、音響的話者特徴情報、発話長情報、韻律情報、話者交代情報、発話音量情報、背景音情報のうちの少なくとも一つを出力することを特徴とする請求項9に記載の音声データの検索方法。 - 前記音声データの検索結果と、前記音響情報特徴量の検索結果を出力するステップは、
前記検索された音響情報特徴量を出力することを特徴とする請求項10に記載の音声データの検索方法。 - 前記音声データの検索結果と、前記音響情報特徴量の検索結果を出力するステップは、
前記検索された音響情報特徴量のうち前記音声データに存在する確率の高い音響情報特徴量を優先して出力することを特徴とする請求項12に記載の音声データの検索方法。 - 検索対象とする音声データを指定するステップを、さらに含み、
前記音声データの検索結果と、前記音響情報特徴量の検索結果を出力するステップは、
前記検索された音響情報特徴量のうち検索対象として指定された音声データに存在する確率の高い音響情報特徴量を優先して出力することを特徴とする請求項13に記載の音声データの検索方法。 - 前記音響情報特徴量の組を追加、削除、編集するステップをさらに含むことを特徴とする請求項9に記載の声データの検索方法。
- 前記予め設定した条件に基づいて前記計算機が前記検索データを検索するステップは、
前記音声データベースを検索するための検索キーを入力するステップを含み、
前記検索キーを入力するステップは、
キーワードと、前記音響的話者特徴情報と、前記発話長情報と、前記韻律情報と、前記話者交代情報と、前記発話音量情報と、前記背景音情報のうちの少なくとも一つを受け付けることを特徴とする請求項11に記載の音声データの検索方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008060778A JP5142769B2 (ja) | 2008-03-11 | 2008-03-11 | 音声データ検索システム及び音声データの検索方法 |
US12/270,147 US20090234854A1 (en) | 2008-03-11 | 2008-11-13 | Search system and search method for speech database |
CN2008101761818A CN101533401B (zh) | 2008-03-11 | 2008-11-14 | 声音数据检索系统以及声音数据的检索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008060778A JP5142769B2 (ja) | 2008-03-11 | 2008-03-11 | 音声データ検索システム及び音声データの検索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009216986A true JP2009216986A (ja) | 2009-09-24 |
JP5142769B2 JP5142769B2 (ja) | 2013-02-13 |
Family
ID=41064146
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008060778A Expired - Fee Related JP5142769B2 (ja) | 2008-03-11 | 2008-03-11 | 音声データ検索システム及び音声データの検索方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20090234854A1 (ja) |
JP (1) | JP5142769B2 (ja) |
CN (1) | CN101533401B (ja) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011025042A1 (ja) | 2009-08-31 | 2011-03-03 | 新日本製鐵株式会社 | 高強度溶融亜鉛めっき鋼板及びその製造方法 |
JP2011175587A (ja) * | 2010-02-25 | 2011-09-08 | Nippon Telegr & Teleph Corp <Ntt> | ユーザ判定装置、方法、プログラム及びコンテンツ配信システム |
WO2013073250A1 (ja) * | 2011-11-16 | 2013-05-23 | ソニー株式会社 | 情報処理装置及び情報処理方法、情報提供装置、並びに、情報提供システム |
WO2014033855A1 (ja) * | 2012-08-29 | 2014-03-06 | 株式会社日立製作所 | 音声検索装置、計算機読み取り可能な記憶媒体、及び音声検索方法 |
JP2016018229A (ja) * | 2014-07-04 | 2016-02-01 | 日本電信電話株式会社 | 音声ドキュメント検索装置、音声ドキュメント検索方法及びプログラム |
WO2016028254A1 (en) * | 2014-08-18 | 2016-02-25 | Nuance Communications, Inc. | Methods and apparatus for speech segmentation using multiple metadata |
JP2016062333A (ja) * | 2014-09-18 | 2016-04-25 | 株式会社日立製作所 | 検索サーバ、及び検索方法 |
JP2018160137A (ja) * | 2017-03-23 | 2018-10-11 | カシオ計算機株式会社 | 音声データ検索装置、音声データ検索方法及び音声データ検索プログラム |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5025782B2 (ja) * | 2010-02-17 | 2012-09-12 | キヤノン株式会社 | 画像検索装置及び画像検索方法 |
EP2373005A1 (en) * | 2010-03-01 | 2011-10-05 | Nagravision S.A. | Method for notifying a user about a broadcast event |
US20120296652A1 (en) * | 2011-05-18 | 2012-11-22 | Sony Corporation | Obtaining information on audio video program using voice recognition of soundtrack |
TR201802631T4 (tr) * | 2013-01-21 | 2018-03-21 | Dolby Laboratories Licensing Corp | Program Ses Şiddeti ve Sınır Meta Verilere Sahip Sesli Enkoder ve Dekoder |
CN106021249A (zh) * | 2015-09-16 | 2016-10-12 | 展视网(北京)科技有限公司 | 一种基于内容的语音文件检索方法和系统 |
CN106021451A (zh) * | 2016-05-13 | 2016-10-12 | 百度在线网络技术(北京)有限公司 | 基于互联网的声音博物馆的实现方法和装置 |
CN108536414B (zh) * | 2017-03-06 | 2021-10-22 | 腾讯科技(深圳)有限公司 | 语音处理方法、装置和系统、移动终端 |
JP7202938B2 (ja) * | 2019-03-20 | 2023-01-12 | Tvs Regza株式会社 | 番組名検索支援装置、及び、番組名検索支援方法 |
CN111798840B (zh) * | 2020-07-16 | 2023-08-08 | 中移在线服务有限公司 | 语音关键词识别方法和装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10312389A (ja) * | 1997-05-13 | 1998-11-24 | Dainippon Screen Mfg Co Ltd | 音声データベースシステムおよび記録媒体 |
Family Cites Families (44)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3611799A (en) * | 1969-10-01 | 1971-10-12 | Dresser Ind | Multiple chamber earth formation fluid sampler |
US4570481A (en) * | 1984-09-10 | 1986-02-18 | V.E. Kuster Company | Instrument locking and port bundle carrier |
US4665983A (en) * | 1986-04-03 | 1987-05-19 | Halliburton Company | Full bore sampler valve with time delay |
US4747304A (en) * | 1986-10-20 | 1988-05-31 | V. E. Kuster Company | Bundle carrier |
US4787447A (en) * | 1987-06-19 | 1988-11-29 | Halliburton Company | Well fluid modular sampling apparatus |
US4878538A (en) * | 1987-06-19 | 1989-11-07 | Halliburton Company | Perforate, test and sample tool and method of use |
US4883123A (en) * | 1988-11-23 | 1989-11-28 | Halliburton Company | Above packer perforate, test and sample tool and method of use |
US4903765A (en) * | 1989-01-06 | 1990-02-27 | Halliburton Company | Delayed opening fluid sampler |
US5230244A (en) * | 1990-06-28 | 1993-07-27 | Halliburton Logging Services, Inc. | Formation flush pump system for use in a wireline formation test tool |
US5058674A (en) * | 1990-10-24 | 1991-10-22 | Halliburton Company | Wellbore fluid sampler and method |
US5240072A (en) * | 1991-09-24 | 1993-08-31 | Halliburton Company | Multiple sample annulus pressure responsive sampler |
US5329811A (en) * | 1993-02-04 | 1994-07-19 | Halliburton Company | Downhole fluid property measurement tool |
US5368100A (en) * | 1993-03-10 | 1994-11-29 | Halliburton Company | Coiled tubing actuated sampler |
US5540280A (en) * | 1994-08-15 | 1996-07-30 | Halliburton Company | Early evaluation system |
ES2138344T3 (es) * | 1995-05-29 | 2000-01-01 | Siemens Ag | Procedimiento y sistema de instalacion de programas de usuario, asi como ordenador de usuario en una red de ordenadores. |
US5687791A (en) * | 1995-12-26 | 1997-11-18 | Halliburton Energy Services, Inc. | Method of well-testing by obtaining a non-flashing fluid sample |
US5934374A (en) * | 1996-08-01 | 1999-08-10 | Halliburton Energy Services, Inc. | Formation tester with improved sample collection system |
US5992520A (en) * | 1997-09-15 | 1999-11-30 | Halliburton Energy Services, Inc. | Annulus pressure operated downhole choke and associated methods |
US6065355A (en) * | 1997-09-23 | 2000-05-23 | Halliburton Energy Services, Inc. | Non-flashing downhole fluid sampler and method |
US6301959B1 (en) * | 1999-01-26 | 2001-10-16 | Halliburton Energy Services, Inc. | Focused formation fluid sampling probe |
WO2000050736A1 (en) * | 1999-02-25 | 2000-08-31 | Baker Hughes Incorporated | Apparatus and method for controlling well fluid sample pressure |
US6748843B1 (en) * | 1999-06-26 | 2004-06-15 | Halliburton Energy Services, Inc. | Unique phasings and firing sequences for perforating guns |
US7590538B2 (en) * | 1999-08-31 | 2009-09-15 | Accenture Llp | Voice recognition system for navigating on the internet |
US6491104B1 (en) * | 2000-10-10 | 2002-12-10 | Halliburton Energy Services, Inc. | Open-hole test method and apparatus for subterranean wells |
US6668924B2 (en) * | 2000-11-14 | 2003-12-30 | Schlumberger Technology Corporation | Reduced contamination sampling |
US6711543B2 (en) * | 2001-05-30 | 2004-03-23 | Cameronsound, Inc. | Language independent and voice operated information management system |
US6622554B2 (en) * | 2001-06-04 | 2003-09-23 | Halliburton Energy Services, Inc. | Open hole formation testing |
US7246664B2 (en) * | 2001-09-19 | 2007-07-24 | Baker Hughes Incorporated | Dual piston, single phase sampling mechanism and procedure |
US6964301B2 (en) * | 2002-06-28 | 2005-11-15 | Schlumberger Technology Corporation | Method and apparatus for subsurface fluid sampling |
US6907797B2 (en) * | 2002-11-12 | 2005-06-21 | Baker Hughes Incorporated | Method and apparatus for supercharging downhole sample tanks |
US7128144B2 (en) * | 2003-03-07 | 2006-10-31 | Halliburton Energy Services, Inc. | Formation testing and sampling apparatus and methods |
US7140436B2 (en) * | 2003-04-29 | 2006-11-28 | Schlumberger Technology Corporation | Apparatus and method for controlling the pressure of fluid within a sample chamber |
US7083009B2 (en) * | 2003-08-04 | 2006-08-01 | Pathfinder Energy Services, Inc. | Pressure controlled fluid sampling apparatus and method |
US20050183610A1 (en) * | 2003-09-05 | 2005-08-25 | Barton John A. | High pressure exposed detonating cord detonator system |
US20050205301A1 (en) * | 2004-03-19 | 2005-09-22 | Halliburton Energy Services, Inc. | Testing of bottomhole samplers using acoustics |
US7380599B2 (en) * | 2004-06-30 | 2008-06-03 | Schlumberger Technology Corporation | Apparatus and method for characterizing a reservoir |
US7430965B2 (en) * | 2004-10-08 | 2008-10-07 | Halliburton Energy Services, Inc. | Debris retention perforating apparatus and method for use of same |
US7565835B2 (en) * | 2004-11-17 | 2009-07-28 | Schlumberger Technology Corporation | Method and apparatus for balanced pressure sampling |
JP2006244002A (ja) * | 2005-03-02 | 2006-09-14 | Sony Corp | コンテンツ再生装置およびコンテンツ再生方法 |
JP2007052594A (ja) * | 2005-08-17 | 2007-03-01 | Toshiba Corp | 情報処理端末、情報処理方法、情報処理プログラムおよびネットワークシステム |
US7472589B2 (en) * | 2005-11-07 | 2009-01-06 | Halliburton Energy Services, Inc. | Single phase fluid sampling apparatus and method for use of same |
US7874206B2 (en) * | 2005-11-07 | 2011-01-25 | Halliburton Energy Services, Inc. | Single phase fluid sampling apparatus and method for use of same |
US7197923B1 (en) * | 2005-11-07 | 2007-04-03 | Halliburton Energy Services, Inc. | Single phase fluid sampler systems and associated methods |
US7353725B2 (en) * | 2005-11-09 | 2008-04-08 | Caterpillar Inc. | Method of shifting gears in a work machine |
-
2008
- 2008-03-11 JP JP2008060778A patent/JP5142769B2/ja not_active Expired - Fee Related
- 2008-11-13 US US12/270,147 patent/US20090234854A1/en not_active Abandoned
- 2008-11-14 CN CN2008101761818A patent/CN101533401B/zh not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10312389A (ja) * | 1997-05-13 | 1998-11-24 | Dainippon Screen Mfg Co Ltd | 音声データベースシステムおよび記録媒体 |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011025042A1 (ja) | 2009-08-31 | 2011-03-03 | 新日本製鐵株式会社 | 高強度溶融亜鉛めっき鋼板及びその製造方法 |
JP2011175587A (ja) * | 2010-02-25 | 2011-09-08 | Nippon Telegr & Teleph Corp <Ntt> | ユーザ判定装置、方法、プログラム及びコンテンツ配信システム |
WO2013073250A1 (ja) * | 2011-11-16 | 2013-05-23 | ソニー株式会社 | 情報処理装置及び情報処理方法、情報提供装置、並びに、情報提供システム |
JP2013105146A (ja) * | 2011-11-16 | 2013-05-30 | Sony Corp | 情報処理装置及び情報処理方法、情報提供装置、並びに、情報提供システム |
US10477267B2 (en) | 2011-11-16 | 2019-11-12 | Saturn Licensing Llc | Information processing device, information processing method, information provision device, and information provision system |
WO2014033855A1 (ja) * | 2012-08-29 | 2014-03-06 | 株式会社日立製作所 | 音声検索装置、計算機読み取り可能な記憶媒体、及び音声検索方法 |
JP5897718B2 (ja) * | 2012-08-29 | 2016-03-30 | 株式会社日立製作所 | 音声検索装置、計算機読み取り可能な記憶媒体、及び音声検索方法 |
JP2016018229A (ja) * | 2014-07-04 | 2016-02-01 | 日本電信電話株式会社 | 音声ドキュメント検索装置、音声ドキュメント検索方法及びプログラム |
WO2016028254A1 (en) * | 2014-08-18 | 2016-02-25 | Nuance Communications, Inc. | Methods and apparatus for speech segmentation using multiple metadata |
US10229686B2 (en) | 2014-08-18 | 2019-03-12 | Nuance Communications, Inc. | Methods and apparatus for speech segmentation using multiple metadata |
JP2016062333A (ja) * | 2014-09-18 | 2016-04-25 | 株式会社日立製作所 | 検索サーバ、及び検索方法 |
JP2018160137A (ja) * | 2017-03-23 | 2018-10-11 | カシオ計算機株式会社 | 音声データ検索装置、音声データ検索方法及び音声データ検索プログラム |
Also Published As
Publication number | Publication date |
---|---|
CN101533401B (zh) | 2012-07-11 |
US20090234854A1 (en) | 2009-09-17 |
CN101533401A (zh) | 2009-09-16 |
JP5142769B2 (ja) | 2013-02-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5142769B2 (ja) | 音声データ検索システム及び音声データの検索方法 | |
US8694317B2 (en) | Methods and apparatus relating to searching of spoken audio data | |
US10056078B1 (en) | Output of content based on speech-based searching and browsing requests | |
US6434520B1 (en) | System and method for indexing and querying audio archives | |
US10074363B2 (en) | Method and apparatus for keyword speech recognition | |
US9123330B1 (en) | Large-scale speaker identification | |
KR100828884B1 (ko) | 데이터베이스 주석 및 검색 | |
US10133538B2 (en) | Semi-supervised speaker diarization | |
CN105723449B (zh) | 言语内容分析系统和言语内容分析方法 | |
JP3488174B2 (ja) | 内容情報と話者情報を使用して音声情報を検索するための方法および装置 | |
US7680853B2 (en) | Clickable snippets in audio/video search results | |
JP4600828B2 (ja) | 文書対応付け装置、および文書対応付け方法 | |
JP3848319B2 (ja) | 情報処理方法及び情報処理装置 | |
JPWO2008114811A1 (ja) | 情報検索システム、情報検索方法及び情報検索用プログラム | |
JP3799280B2 (ja) | 対話システムおよびその制御方法 | |
US10255321B2 (en) | Interactive system, server and control method thereof | |
KR20060020114A (ko) | 음악 검색 서비스 제공 시스템 및 방법 | |
CN106710585A (zh) | 语音交互过程中的多音字播报方法及系统 | |
US20210279427A1 (en) | Systems and methods for generating multi-language media content with automatic selection of matching voices | |
JP5182892B2 (ja) | 音声検索方法,音声検索装置および音声検索プログラム | |
JP5897718B2 (ja) | 音声検索装置、計算機読み取り可能な記憶媒体、及び音声検索方法 | |
CN113129895B (zh) | 一种语音检测处理系统 | |
JP2004302175A (ja) | 音声認識システム、音声認識方法及び音声認識プログラム | |
JP6322125B2 (ja) | 音声認識装置、音声認識方法および音声認識プログラム | |
US11632345B1 (en) | Message management for communal account |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101117 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111129 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111206 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120309 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120821 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121005 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121030 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121120 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151130 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5142769 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |