JP2013109061A - 音声データ検索システムおよびそのためのプログラム - Google Patents
音声データ検索システムおよびそのためのプログラム Download PDFInfo
- Publication number
- JP2013109061A JP2013109061A JP2011252425A JP2011252425A JP2013109061A JP 2013109061 A JP2013109061 A JP 2013109061A JP 2011252425 A JP2011252425 A JP 2011252425A JP 2011252425 A JP2011252425 A JP 2011252425A JP 2013109061 A JP2013109061 A JP 2013109061A
- Authority
- JP
- Japan
- Prior art keywords
- keyword
- unit
- phoneme
- voice data
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000011159 matrix material Substances 0.000 claims abstract description 52
- 238000006243 chemical reaction Methods 0.000 claims abstract description 11
- 230000015572 biosynthetic process Effects 0.000 claims description 9
- 238000003786 synthesis reaction Methods 0.000 claims description 9
- 230000006870 function Effects 0.000 claims 11
- 238000000034 method Methods 0.000 description 37
- 238000012545 processing Methods 0.000 description 15
- 238000013500 data storage Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 239000004927 clay Substances 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/683—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/685—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using automatically derived transcript of audio data, e.g. lyrics
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
- G10L2015/025—Phonemes, fenemes or fenones being the recognition units
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Library & Information Science (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
音声データ検索システムにおいて、検索結果の正解/不正解の判定を容易に行うことができるようにする。
【解決手段】
音声データ検索システムにおいて、キーワードを入力する入力装置112と、入力された前記キーワードを音素表記へ変換する音素変換部106と、音素表記のキーワードを元に音声データ中で当該キーワードが発話された個所を検索する音声データ探索部105と、ユーザごとの音素混同行列103に基づいて、ユーザが聴取混同する可能性のある対照キーワードの集合を生成する対照キーワード生成部107と、前記音声データ探索部105からの検索結果および前記対照キーワード生成部107からの前記対照キーワードをユーザへ提示する検索結果提示部110を備える。
【選択図】 図1
Description
ユーザが入力装置112からテキストでキーワードを入力すると(処理301)、まず音素変換部106が当該キーワードを音素表現へと変換する(処理302)。例えば、ユーザが入力として「play」というキーワードを入力した場合、これを「p l e I」と変換する。この変換は形態素解析処理として知られており、当業者に周知であるために説明を省略する。
続いて、音声データ探索部105が、音声データ蓄積装置102に蓄積されている音声データ中で、当該キーワードが発話された時刻を検出する(処理303)。この処理には、例えば非特許文献2で提示されているワードスポッティング処理を用いることができる。もしくは、特許文献1や非特許文献1など、予め音声データ蓄積装置を前処理しておく方法を利用することも可能である。事業者はこれらのうちいずれかの手段を選択すればよい。
続いて、対照キーワード生成部107が、ユーザが聴取混同する可能性のある対照キーワード集合を生成する(処理304)。以下の説明では、キーワードは英語で入力されており、一方でユーザは日本語を母語としているものとする。ただし、キーワードの言語及びユーザの母語は、英語と日本語に限定されず、いかなる言語の組み合わせでも実施可能である。
対照キーワード生成で使用する音素混同行列は、ユーザの母語もしくは使用可能言語によって切り替えることができる。この場合、ユーザは言語情報入力部114を通してシステムにユーザの母語もしくは使用可能言語に関する情報を入力する。ユーザからの入力を受け取ったシステムは音素混同行列生成部115がユーザの母語用の音素混同行列を出力する。例えば図6は、日本語話者用であるが、中国語を母語とするユーザに対しては、図9で示されたような音素混同行列を用いることが可能である。例えば図9では図6と違い、音素lと音素rの交差する点は1であり、この2つの音素は中国語を母語とするユーザにとっては混同しにくいものであるという定義がなされている。
音素混同行列生成部は、ユーザの母語に限定せず、ユーザが理解できる言語の情報によって、音素混同行列を切り替えてもよい。
例えば日本語と中国語が理解できるユーザに対しては図12の音素混同行列が生成される。図12の音素混同行列の各要素は、日本語話者用音素混同行列(図6)と中国語話者用音素混同行列(図9)の各行列要素の大きい方を代入したものである。
なお、音素混同行列の生成は、対照キーワード生成部が動作する前の任意のタイミングで行うことができる。
対照キーワード生成部107によって生成された対照キーワード候補に対して、対照キーワードチェック部108が動作し、当該対照キーワードをユーザへ提示するか否かの選別を行う。これにより不要な対照キーワード候補を除去する。
(1)まず対照キーワード生成部107によって生成された全ての対照キーワード候補Wi(i=1,…,N)についてflag(Wi)=0とする(処理701)。
(2)続いて、音声データ探索部から得られたキーワードの発話時刻候補全てに対して、以下の(i)〜(iii)の処理を行う。
(i)キーワードの発話時刻の始端と終端を含む音声Xを切り出す(処理703)。
(ii)全ての対照キーワード候補Wi(i=1,…,N)について、当該音声に対するワードスポッティング処理を行う(処理705)。
(iii)ワードスポッティングの結果得られたスコアP(*Wi*|X)がしきい値を超えた単語Wiに対してflag(Wi)=1とする(処理706)。
(3)flag(Wi)が0であるキーワードを対照キーワード候補から取り除く(処理707)。
なお、ワードスポッティング処理では、音声X内でキーワードWiが発話されている確率P(*key*|X)を数1式に従って算出する。
対照キーワード候補およびユーザが入力したキーワードの両方を音声合成部109によって音声波形へと変換する。ここでテキストを音声波形へ変換する音声合成技術については、当業者には周知であるため詳細は省略する。
最後に、検索結果提示部110が表示装置111および音声出力装置113を通して、ユーザへ検索結果および対照キーワードについての情報を提示する。この際に表示装置111へ表示する画面の例を、図8に示す。
102 音声データ蓄積装置
103 音素混同行列
104 単語辞書
105 音声データ探索部
106 音素変換部
107 対照キーワード生成部
108 対照キーワードチェック部
109 音声合成部
110 検索結果提示部
111 表示装置
112 入力装置
113 音声出力装置
114 言語情報入力部
115 音素混同行列生成部
Claims (14)
- キーワードを入力する入力装置と、
入力された前記キーワードを音素表記へ変換する音素変換部と、
音素表記のキーワードを元に音声データ中で当該キーワードが発話された個所を検索する音声データ探索部と、
音素表記のキーワードを元にユーザが聴取混同する可能性のある当該キーワードとは別の対照キーワードの集合を生成する対照キーワード生成部と、
前記音声データ探索部からの検索結果および前記対照キーワード生成部からの前記対照キーワードをユーザへ提示する検索結果提示部を備えた、音声データ検索システム。 - 請求項1に記載の音声データ検索システムにおいて、
ユーザごとの音素混同行列を備え、
前記対照キーワード生成部は、前記音素混同行列に基づいて対照キーワード生成を行うことを特徴とする音声データ検索システム。 - 請求項2に記載の音声データ検索システムにおいて、
ユーザが理解可能な言語についての情報を入力する言語情報入力部と、
言語情報入力部から得られた情報に基づいて前記音素混同行列を生成する音素混同行列生成部を備えたことを特徴とする音声データ検索システム。 - 請求項1に記載の音声データ検索システムにおいて、
前記対照キーワード生成部は、前記音素表記されたキーワードと単語辞書に登録された単語の音素表記との間の編集距離を計算し、編集距離がしきい値以下の単語を対照キーワードとすることを特徴とする音声データ検索システム。 - 請求項1に記載の音声データ検索システムにおいて、
ユーザが入力した前記キーワードと、前記対照キーワード生成部で生成した前記対照キーワードのいずれか一方もしくは両方を音声合成する音声合成部を備え、
前記検索結果提示部は、前記音声合成部からの合成音声をユーザへ提示することを特徴とする音声データ検索システム。 - 請求項1に記載の音声データ検索システムにおいて、
前記対照キーワード生成部で生成した対照キーワード候補と前記音声データ探索部の検索結果を比較して、不要な対照キーワード候補を除去する対照キーワードチェック部を備えたことを特徴とする音声データ検索システム。 - 請求項6に記載の音声データ検索システムにおいて、
前記対照キーワードチェック部は、前記対照キーワード候補と前記音声データ探索部の検索結果を比較して、不要な音声データ検索結果を除去することを特徴とする音声データ検索システム。 - コンピュータを、
入力されたキーワードを音素表記へ変換する音素変換部と、
音素表記のキーワードを元に音声データ中で当該キーワードが発話された個所を検索する音声データ探索部と、
音素表記のキーワードを元にユーザが聴取混同する可能性のある当該キーワードとは別の対照キーワードの集合を生成する対照キーワード生成部と、
前記音声データ探索部からの検索結果および前記対照キーワード生成部からの前記対照キーワードをユーザへ提示する検索結果提示部とを備えた、音声データ検索システムとして機能させるためのプログラム。 - 請求項8に記載のプログラムにおいて、
ユーザごとの音素混同行列を備え、前記対照キーワード生成部は、前記音素混同行列に基づいて対照キーワード生成を行うように機能させることを特徴とする、コンピュータを音声データ検索システムとして機能させるためのプログラム。 - 請求項9に記載のプログラムにおいて、更に、
ユーザが理解可能な言語についての情報を入力する言語情報入力部と、言語情報入力部から得られた情報に基づいて前記音素混同行列を生成する音素混同行列生成部として機能させることを特徴とする、コンピュータを音声データ検索システムとして機能させるためのプログラム。 - 請求項8に記載のプログラムにおいて、
前記対照キーワード生成部は、前記音素表記されたキーワードと単語辞書に登録された単語の音素表記との間の編集距離を計算し、編集距離がしきい値以下の単語を対照キーワードとするように機能させることを特徴とする、コンピュータを音声データ検索システムとして機能させるためのプログラム。 - 請求項8に記載のプログラムにおいて、
ユーザが入力した前記キーワードと、前記対照キーワード生成部で生成した前記対照キーワードのいずれか一方もしくは両方を音声合成する音声合成部を備え、前記検索結果提示部は、前記音声合成部からの合成音声をユーザへ提示するように機能させることを特徴とする、コンピュータを音声データ検索システムとして機能させるためのプログラム。 - 請求項8に記載のプログラムにおいて、更に、
前記対照キーワード生成部で生成した対照キーワード候補と前記音声データ探索部の検索結果を比較して、不要な対照キーワード候補を除去する対照キーワードチェック部として機能させることを特徴とする、コンピュータを音声データ検索システムとして機能させるためのプログラム。 - 請求項13に記載のプログラムにおいて、
前記対照キーワードチェック部は、前記対照キーワード候補と前記音声データ探索部の検索結果を比較して、不要な音声データ検索結果を除去するように機能させることを特徴とする、コンピュータを音声データ検索システムとして機能させるためのプログラム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011252425A JP5753769B2 (ja) | 2011-11-18 | 2011-11-18 | 音声データ検索システムおよびそのためのプログラム |
US13/673,444 US20130132090A1 (en) | 2011-11-18 | 2012-11-09 | Voice Data Retrieval System and Program Product Therefor |
CN201210465128.6A CN103123644B (zh) | 2011-11-18 | 2012-11-16 | 声音数据检索系统及用于该系统的程序 |
EP12193055.6A EP2595144B1 (en) | 2011-11-18 | 2012-11-16 | Voice data retrieval system and program product therefor |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011252425A JP5753769B2 (ja) | 2011-11-18 | 2011-11-18 | 音声データ検索システムおよびそのためのプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013109061A true JP2013109061A (ja) | 2013-06-06 |
JP5753769B2 JP5753769B2 (ja) | 2015-07-22 |
Family
ID=47221179
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011252425A Expired - Fee Related JP5753769B2 (ja) | 2011-11-18 | 2011-11-18 | 音声データ検索システムおよびそのためのプログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US20130132090A1 (ja) |
EP (1) | EP2595144B1 (ja) |
JP (1) | JP5753769B2 (ja) |
CN (1) | CN103123644B (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104900231A (zh) * | 2014-03-05 | 2015-09-09 | 卡西欧计算机株式会社 | 语音检索装置以及语音检索方法 |
JP2017016131A (ja) * | 2015-06-30 | 2017-01-19 | 三星電子株式会社Samsung Electronics Co.,Ltd. | 音声認識装置及び方法と電子装置 |
JP2017021196A (ja) * | 2015-07-10 | 2017-01-26 | カシオ計算機株式会社 | 音声検索装置、音声検索方法及びプログラム |
CN110832578A (zh) * | 2017-07-24 | 2020-02-21 | 美的集团股份有限公司 | 可定制唤醒语音命令 |
CN111275043A (zh) * | 2020-01-22 | 2020-06-12 | 西北师范大学 | 一种基于pcnn处理的纸质简谱电子化播放装置 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9317499B2 (en) * | 2013-04-11 | 2016-04-19 | International Business Machines Corporation | Optimizing generation of a regular expression |
JP6805037B2 (ja) * | 2017-03-22 | 2020-12-23 | 株式会社東芝 | 話者検索装置、話者検索方法、および話者検索プログラム |
CN109994106B (zh) * | 2017-12-29 | 2023-06-23 | 阿里巴巴集团控股有限公司 | 一种语音处理方法及设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0736481A (ja) * | 1993-07-19 | 1995-02-07 | Osaka Gas Co Ltd | 補完音声認識装置 |
JP2000035799A (ja) * | 1998-06-15 | 2000-02-02 | Dragon Syst Inc | 音声認識におけるポジション操作 |
JP2004508594A (ja) * | 2000-09-08 | 2004-03-18 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 置換コマンドを有する音声認識方法 |
JP2006039954A (ja) * | 2004-07-27 | 2006-02-09 | Denso Corp | データベース検索装置、プログラム及びナビゲーション装置 |
JP2010267012A (ja) * | 2009-05-13 | 2010-11-25 | Hitachi Ltd | 音声データ検索システム及び音声データ検索方法 |
US20100324900A1 (en) * | 2009-06-19 | 2010-12-23 | Ronen Faifkov | Searching in Audio Speech |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0645757B1 (en) * | 1993-09-23 | 2000-04-05 | Xerox Corporation | Semantic co-occurrence filtering for speech recognition and signal transcription applications |
US20020152258A1 (en) * | 2000-06-28 | 2002-10-17 | Hongyi Zhou | Method and system of intelligent information processing in a network |
JP3686934B2 (ja) | 2001-01-25 | 2005-08-24 | 独立行政法人産業技術総合研究所 | 異種環境音声データの音声検索方法及び装置 |
US7089188B2 (en) * | 2002-03-27 | 2006-08-08 | Hewlett-Packard Development Company, L.P. | Method to expand inputs for word or document searching |
US7293015B2 (en) * | 2002-09-19 | 2007-11-06 | Microsoft Corporation | Method and system for detecting user intentions in retrieval of hint sentences |
US7720683B1 (en) * | 2003-06-13 | 2010-05-18 | Sensory, Inc. | Method and apparatus of specifying and performing speech recognition operations |
JP4080965B2 (ja) | 2003-07-15 | 2008-04-23 | 株式会社東芝 | 情報提示装置及び情報提示方法 |
JP2005257954A (ja) * | 2004-03-10 | 2005-09-22 | Nec Corp | 音声検索装置、音声検索方法および音声検索プログラム |
KR100815115B1 (ko) * | 2006-03-31 | 2008-03-20 | 광주과학기술원 | 타 언어권 화자 음성에 대한 음성 인식시스템의 성능향상을 위한 발음 특성에 기반한 음향모델 변환 방법 및이를 이용한 장치 |
US20090004633A1 (en) * | 2007-06-29 | 2009-01-01 | Alelo, Inc. | Interactive language pronunciation teaching |
US9405823B2 (en) * | 2007-07-23 | 2016-08-02 | Nuance Communications, Inc. | Spoken document retrieval using multiple speech transcription indices |
EP2019383A1 (en) * | 2007-07-25 | 2009-01-28 | Dybuster AG | Device and method for computer-assisted learning |
JP4887264B2 (ja) * | 2007-11-21 | 2012-02-29 | 株式会社日立製作所 | 音声データ検索システム |
US7472061B1 (en) * | 2008-03-31 | 2008-12-30 | International Business Machines Corporation | Systems and methods for building a native language phoneme lexicon having native pronunciations of non-native words derived from non-native pronunciations |
US20100153366A1 (en) * | 2008-12-15 | 2010-06-17 | Motorola, Inc. | Assigning an indexing weight to a search term |
CN102346731B (zh) * | 2010-08-02 | 2014-09-03 | 联想(北京)有限公司 | 一种文件处理方法及文件处理装置 |
KR101231438B1 (ko) * | 2011-05-25 | 2013-02-07 | 엔에이치엔(주) | 외래어 발음 검색 서비스를 제공하는 검색결과 제공 시스템 및 방법 |
-
2011
- 2011-11-18 JP JP2011252425A patent/JP5753769B2/ja not_active Expired - Fee Related
-
2012
- 2012-11-09 US US13/673,444 patent/US20130132090A1/en not_active Abandoned
- 2012-11-16 CN CN201210465128.6A patent/CN103123644B/zh not_active Expired - Fee Related
- 2012-11-16 EP EP12193055.6A patent/EP2595144B1/en not_active Not-in-force
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0736481A (ja) * | 1993-07-19 | 1995-02-07 | Osaka Gas Co Ltd | 補完音声認識装置 |
JP2000035799A (ja) * | 1998-06-15 | 2000-02-02 | Dragon Syst Inc | 音声認識におけるポジション操作 |
JP2004508594A (ja) * | 2000-09-08 | 2004-03-18 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 置換コマンドを有する音声認識方法 |
JP2006039954A (ja) * | 2004-07-27 | 2006-02-09 | Denso Corp | データベース検索装置、プログラム及びナビゲーション装置 |
JP2010267012A (ja) * | 2009-05-13 | 2010-11-25 | Hitachi Ltd | 音声データ検索システム及び音声データ検索方法 |
US20100324900A1 (en) * | 2009-06-19 | 2010-12-23 | Ronen Faifkov | Searching in Audio Speech |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104900231A (zh) * | 2014-03-05 | 2015-09-09 | 卡西欧计算机株式会社 | 语音检索装置以及语音检索方法 |
JP2015169699A (ja) * | 2014-03-05 | 2015-09-28 | カシオ計算機株式会社 | 音声検索装置、音声検索方法及びプログラム |
CN104900231B (zh) * | 2014-03-05 | 2018-12-28 | 卡西欧计算机株式会社 | 语音检索装置以及语音检索方法 |
JP2017016131A (ja) * | 2015-06-30 | 2017-01-19 | 三星電子株式会社Samsung Electronics Co.,Ltd. | 音声認識装置及び方法と電子装置 |
JP2017021196A (ja) * | 2015-07-10 | 2017-01-26 | カシオ計算機株式会社 | 音声検索装置、音声検索方法及びプログラム |
CN110832578A (zh) * | 2017-07-24 | 2020-02-21 | 美的集团股份有限公司 | 可定制唤醒语音命令 |
CN111275043A (zh) * | 2020-01-22 | 2020-06-12 | 西北师范大学 | 一种基于pcnn处理的纸质简谱电子化播放装置 |
CN111275043B (zh) * | 2020-01-22 | 2021-08-20 | 西北师范大学 | 一种基于pcnn处理的纸质简谱电子化播放装置 |
Also Published As
Publication number | Publication date |
---|---|
JP5753769B2 (ja) | 2015-07-22 |
EP2595144A1 (en) | 2013-05-22 |
EP2595144B1 (en) | 2016-02-03 |
CN103123644B (zh) | 2016-11-16 |
US20130132090A1 (en) | 2013-05-23 |
CN103123644A (zh) | 2013-05-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5753769B2 (ja) | 音声データ検索システムおよびそのためのプログラム | |
US11037553B2 (en) | Learning-type interactive device | |
JP7200405B2 (ja) | 音声認識のためのコンテキストバイアス | |
US9640175B2 (en) | Pronunciation learning from user correction | |
KR102072730B1 (ko) | 핫워드 적합성을 결정하는 방법 및 장치 | |
JP5480760B2 (ja) | 端末装置、音声認識方法および音声認識プログラム | |
US9594744B2 (en) | Speech transcription including written text | |
JP6580882B2 (ja) | 音声認識結果出力装置、音声認識結果出力方法及び音声認識結果出力プログラム | |
TW201203222A (en) | Voice stream augmented note taking | |
JP5824829B2 (ja) | 音声認識装置、音声認識方法及び音声認識プログラム | |
JP5326169B2 (ja) | 音声データ検索システム及び音声データ検索方法 | |
JP2015520410A (ja) | 音声認識に対する負例(アンチワード)に基づく性能改善 | |
Moyal et al. | Phonetic search methods for large speech databases | |
JP5396530B2 (ja) | 音声認識装置および音声認識方法 | |
JP5160594B2 (ja) | 音声認識装置および音声認識方法 | |
JP5326549B2 (ja) | 音声認識装置及び方法 | |
Thennattil et al. | Phonetic engine for continuous speech in Malayalam | |
JP5196114B2 (ja) | 音声認識装置およびプログラム | |
JP2003162293A (ja) | 音声認識装置及び方法 | |
JP2004133003A (ja) | 音声認識辞書作成方法及びその装置と音声認識装置 | |
JP2015099290A (ja) | 発話内重要語抽出装置とその装置を用いた発話内重要語抽出システムと、それらの方法とプログラム | |
JP2005250071A (ja) | 音声認識方法及び装置及び音声認識プログラム及び音声認識プログラムを格納した記憶媒体 | |
JP2011113426A (ja) | 辞書作成装置,辞書作成プログラムおよび辞書作成方法 | |
KR20100067727A (ko) | 다중 탐색 기반의 음성 인식 장치 및 그 방법 | |
JP2008107641A (ja) | 音声データ検索装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140707 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20140908 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150123 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150217 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150406 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150428 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150525 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5753769 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |