JP5068225B2 - 音声ファイルの検索システム、方法及びプログラム - Google Patents
音声ファイルの検索システム、方法及びプログラム Download PDFInfo
- Publication number
- JP5068225B2 JP5068225B2 JP2008170021A JP2008170021A JP5068225B2 JP 5068225 B2 JP5068225 B2 JP 5068225B2 JP 2008170021 A JP2008170021 A JP 2008170021A JP 2008170021 A JP2008170021 A JP 2008170021A JP 5068225 B2 JP5068225 B2 JP 5068225B2
- Authority
- JP
- Japan
- Prior art keywords
- computer
- processing
- keyword
- speech
- speech recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
H = /k/a/b/u/k/e/_n/t/a/i/sy/a/k/u/t/o/r/i/h/i/k/i/
P(「課」) = P(開始記号→「課」) = 0.0001
P(「株」) = P(開始記号→「株」) = 0.0005
P(「株券」) = P(開始記号→「株券」) = 0.0025
といった計算が行われる。
下記の例で、左側の数字は、は当該結果の確率をPとした場合の-kΣlogP (但し、kは整数化するための係数で、ここでは256とし、対数の底は10を用いている) を示し、<..>uは、未知語を示す。
<例1>
入力>>かぶけんたいしゃくとりひき<<
4565 < 株券 たい 癪 取引 >
4640 < 株券 退社 く 取引 >
4673 < 株券 退社 九 取引 >
4732 < 株券 体 癪 取引 >
4867 < 株券 対 癪 取引 >
4937 < 株券 タイ 癪 取引 >
<例2>
入力>>とりぷるえーのめいがら<<
2247 < トリプルA の 銘柄 >
3239 < トリプル ええ の 銘柄 >
3514 < トリプルA 野 銘柄 >
3792 < トリプル A の 銘柄 >
3921 < トリプル エー の 銘柄 >
3942 < トリプル D_エー の 銘柄 >
4188 < トリプル ええ 野 銘柄 >
<例3>
入力>>かぶけんたいしゃくとりひき<<
4165 < 株券 <たいしゃく>u 取引 >
4565 < 株券 たい 癪 取引 >
4640 < 株 <けんたいしゃく>u 取引 >
4673 < 株券 退社 九 取引 >
4732 < 株券 体 癪 取引 >
4758 < <かぶけんたいしゃく>u 取引 >
Claims (9)
- 音声ファイルと、該音声ファイルを音声認識した結果の索引テキストとが関連付けられて保存されているデータを、コンピュータの処理によって検索するためのシステムであって、
前記コンピュータの処理によって、ユーザからの読みの入力を受け入れる手段と、
前記コンピュータの処理によって、前記読みを、発音記号列に変換する手段と、
前記コンピュータの処理によって、前記発音記号列を、前記音声ファイルの音声認識に使用された言語モデルと実質的に同一の言語モデルを用いてキーワードに変換する手段と、
前記コンピュータの処理によって、前記キーワードを用いて、前記索引テキストを検索する手段を有する、
音声ファイルの検索システム。 - 前記コンピュータの処理によって、ユーザの操作に従って前記キーワードを訂正する手段と、
前記コンピュータの処理によって、前記キーワードの訂正箇所に基づき、未知語を同定する手段と、
前記未知語の存在を前記ユーザに報知する手段とをさらに有する、
請求項1に記載の音声ファイルの検索システム。 - 音声ファイルを検索するために、該音声ファイルを音声認識して索引テキストとを作成するための音声認識辞書を、コンピュータの処理によって更新するためのシステムであって、
前記コンピュータの処理によって、ユーザからの読みの入力を受け入れる手段と、
前記コンピュータの処理によって、前記読みを、発音記号列に変換する手段と、
前記コンピュータの処理によって、前記発音記号列を、前記音声ファイルの音声認識に使用された言語モデルと実質的に同一の言語モデルを用いてキーワードに変換する手段と、
前記コンピュータの処理によって、ユーザの操作に従って前記キーワードを訂正する手段と、
前記コンピュータの処理によって、前記キーワードの訂正箇所に基づき、未知語を同定する手段と、
前記コンピュータの処理によって、前記未知語に対応するユーザ訂正語を、前記音声認識辞書に登録する手段を有する、
音声認識辞書の更新システム。 - 音声ファイルと、該音声ファイルを音声認識した結果の索引テキストとが関連付けられて保存されているデータを、コンピュータの処理によって検索するための方法であって、
前記コンピュータの処理によって、ユーザからの読みの入力を受け入れるステップと、
前記コンピュータの処理によって、前記読みを、発音記号列に変換するステップと、
前記コンピュータの処理によって、前記発音記号列を、前記音声ファイルの音声認識に使用された言語モデルと実質的に同一の言語モデルを用いてキーワードに変換するステップと、
前記コンピュータの処理によって、前記キーワードを用いて、前記索引テキストを検索するステップを有する、
音声ファイルの検索方法。 - 前記コンピュータの処理によって、ユーザの操作に従って前記キーワードを訂正するステップと、
前記コンピュータの処理によって、前記キーワードの訂正箇所に基づき、未知語を同定するステップと、
前記未知語の存在を前記ユーザに報知するステップとをさらに有する、
請求項4に記載の音声ファイルの検索方法。 - 音声ファイルを検索するために、該音声ファイルを音声認識して索引テキストとを作成するための音声認識辞書を、コンピュータの処理によって更新するための方法であって、
前記コンピュータの処理によって、ユーザからの読みの入力を受け入れるステップと、
前記コンピュータの処理によって、前記読みを、発音記号列に変換するステップと、
前記コンピュータの処理によって、前記発音記号列を、前記音声ファイルの音声認識に使用された言語モデルと実質的に同一の言語モデルを用いてキーワードに変換するステップと、
前記コンピュータの処理によって、ユーザの操作に従って前記キーワードを訂正するステップと、
前記コンピュータの処理によって、前記キーワードの訂正箇所に基づき、未知語を同定するステップと、
前記コンピュータの処理によって、前記未知語に対応するユーザ訂正語を、前記音声認識辞書に登録するステップを有する、
音声認識辞書の更新方法。 - 音声ファイルと、該音声ファイルを音声認識した結果の索引テキストとが関連付けられて保存されているデータを、コンピュータの処理によって検索するためのプログラムであって、
前記コンピュータをして、
ユーザからの読みの入力を受け入れるステップと、
前記読みを、発音記号列に変換するステップと、
前記発音記号列を、前記音声ファイルの音声認識に使用された言語モデルと実質的に同一の言語モデルを用いてキーワードに変換するステップと、
前記キーワードを用いて、前記索引テキストを検索するステップを実行させる、
音声ファイルの検索プログラム。 - 前記コンピュータをして、
前記コンピュータの処理によって、ユーザの操作に従って前記キーワードを訂正するステップと、
前記コンピュータの処理によって、前記キーワードの訂正箇所に基づき、未知語を同定するステップと、
前記未知語の存在を前記ユーザに報知するステップとをさらに実行させる、
請求項7に記載の音声ファイルの検索プログラム。 - 音声ファイルを検索するために、該音声ファイルを音声認識して索引テキストとを作成するための音声認識辞書を、コンピュータの処理によって更新するためのプログラムであって、
前記コンピュータをして、
前記コンピュータの処理によって、ユーザからの読みの入力を受け入れるステップと、
前記コンピュータの処理によって、前記読みを、発音記号列に変換するステップと、
前記コンピュータの処理によって、前記発音記号列を、前記音声ファイルの音声認識に使用された言語モデルと実質的に同一の言語モデルを用いてキーワードに変換するステップと、
前記コンピュータの処理によって、ユーザの操作に従って前記キーワードを訂正するステップと、
前記コンピュータの処理によって、前記キーワードの訂正箇所に基づき、未知語を同定するステップと、
前記コンピュータの処理によって、前記未知語に対応するユーザ訂正語を、前記音声認識辞書に登録するステップを実行させる、
音声認識辞書の更新プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008170021A JP5068225B2 (ja) | 2008-06-30 | 2008-06-30 | 音声ファイルの検索システム、方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008170021A JP5068225B2 (ja) | 2008-06-30 | 2008-06-30 | 音声ファイルの検索システム、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010009446A JP2010009446A (ja) | 2010-01-14 |
JP5068225B2 true JP5068225B2 (ja) | 2012-11-07 |
Family
ID=41589827
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008170021A Expired - Fee Related JP5068225B2 (ja) | 2008-06-30 | 2008-06-30 | 音声ファイルの検索システム、方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5068225B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103680498A (zh) | 2012-09-26 | 2014-03-26 | 华为技术有限公司 | 一种语音识别方法和设备 |
KR102298457B1 (ko) | 2014-11-12 | 2021-09-07 | 삼성전자주식회사 | 영상표시장치, 영상표시장치의 구동방법 및 컴퓨터 판독가능 기록매체 |
JP6580882B2 (ja) | 2015-06-24 | 2019-09-25 | 株式会社東芝 | 音声認識結果出力装置、音声認識結果出力方法及び音声認識結果出力プログラム |
KR102075796B1 (ko) * | 2017-11-14 | 2020-03-02 | 주식회사 엘솔루 | 자동 음성인식 장치 및 방법 |
KR20200056712A (ko) | 2018-11-15 | 2020-05-25 | 삼성전자주식회사 | 전자 장치 및 그 제어 방법 |
CN111161738A (zh) * | 2019-12-27 | 2020-05-15 | 苏州欧孚网络科技股份有限公司 | 一种语音文件检索系统及其检索方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07152756A (ja) * | 1993-11-30 | 1995-06-16 | Canon Inc | 文書処理装置 |
JP3825526B2 (ja) * | 1997-03-31 | 2006-09-27 | 株式会社東芝 | 音声認識装置 |
JPH11242496A (ja) * | 1998-02-26 | 1999-09-07 | Kobe Steel Ltd | 情報再生装置 |
JP3976959B2 (ja) * | 1999-09-24 | 2007-09-19 | 三菱電機株式会社 | 音声認識装置、音声認識方法および音声認識プログラム記録媒体 |
JP4259100B2 (ja) * | 2002-11-26 | 2009-04-30 | パナソニック株式会社 | 音声認識用未知発話検出装置及び音声認識装置 |
JP4080965B2 (ja) * | 2003-07-15 | 2008-04-23 | 株式会社東芝 | 情報提示装置及び情報提示方法 |
-
2008
- 2008-06-30 JP JP2008170021A patent/JP5068225B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010009446A (ja) | 2010-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5459214B2 (ja) | 言語モデル作成装置、言語モデル作成方法、音声認識装置、音声認識方法、プログラム、および記録媒体 | |
US6910012B2 (en) | Method and system for speech recognition using phonetically similar word alternatives | |
KR102390940B1 (ko) | 음성 인식을 위한 컨텍스트 바이어싱 | |
WO2017114172A1 (zh) | 一种发音词典的构建方法及装置 | |
US20170287474A1 (en) | Improving Automatic Speech Recognition of Multilingual Named Entities | |
US11024298B2 (en) | Methods and apparatus for speech recognition using a garbage model | |
WO2017061027A1 (ja) | 言語モデル生成装置、言語モデル生成方法とそのプログラム、音声認識装置、および音声認識方法とそのプログラム | |
US20140372119A1 (en) | Compounded Text Segmentation | |
TW201517018A (zh) | 語音辨識方法及其電子裝置 | |
JP5068225B2 (ja) | 音声ファイルの検索システム、方法及びプログラム | |
JP5753769B2 (ja) | 音声データ検索システムおよびそのためのプログラム | |
JP2017009842A (ja) | 音声認識結果出力装置、音声認識結果出力方法及び音声認識結果出力プログラム | |
JP2015049254A (ja) | 音声データ認識システム及び音声データ認識方法 | |
CN112346696B (zh) | 虚拟助理的语音比较 | |
JPWO2011033834A1 (ja) | 音声翻訳システム、音声翻訳方法および記録媒体 | |
US20130006604A1 (en) | Cross-lingual audio search | |
Alrumiah et al. | Intelligent Quran Recitation Recognition and Verification: Research Trends and Open Issues | |
JP6233867B2 (ja) | 音声認識用辞書登録システム、音声認識システム、音声認識サービスシステム、方法およびプログラム | |
JP6347939B2 (ja) | 発話内重要語抽出装置とその装置を用いた発話内重要語抽出システムと、それらの方法とプログラム | |
JP4839291B2 (ja) | 音声認識装置およびコンピュータプログラム | |
Alshammri | IoT‐Based Voice‐Controlled Smart Homes with Source Separation Based on Deep Learning | |
TW201828281A (zh) | 發音詞典的構建方法及裝置 | |
JP2003162524A (ja) | 言語処理装置 | |
Tetariy et al. | An efficient lattice-based phonetic search method for accelerating keyword spotting in large speech databases | |
Rani et al. | Error analysis to improve the speech recognition accuracy on Telugu language |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110527 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120726 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120731 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120814 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150824 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |