JP2006107108A - データ検索装置及びデータ検索方法 - Google Patents
データ検索装置及びデータ検索方法 Download PDFInfo
- Publication number
- JP2006107108A JP2006107108A JP2004292606A JP2004292606A JP2006107108A JP 2006107108 A JP2006107108 A JP 2006107108A JP 2004292606 A JP2004292606 A JP 2004292606A JP 2004292606 A JP2004292606 A JP 2004292606A JP 2006107108 A JP2006107108 A JP 2006107108A
- Authority
- JP
- Japan
- Prior art keywords
- data
- search
- order
- subword
- accuracy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Studio Devices (AREA)
Abstract
【解決手段】 入力された検索条件と、前記データに対応する音声データを音声認識した結果でありデータに関連付けられた音声認識結果アノテーションとの相関を表すスコアを取得し、取得したスコアが所定の閾値以上のデータは第1の基準で表示し、閾値未満のデータは第2の基準で表示するよう制御する表示制御ステップを有する。
【選択図】 図1
Description
{(正解数)―(挿入誤り数)―(削除誤り数)―(置換誤り数)}×100/(正解数)
で求める。図5においては挿入誤りが“o”と“a”の2箇所、そして“h”を“f”として誤った置換誤りが1箇所であり、音素正解精度は75%となる。このようにして求めた音素正解精度を検索に用いるスコアとしてデータ102をランキングする。ここで、図2の音声認識結果アノテーションデータは上位5つの認識結果音素列が存在するが、マッチングはこれらそれぞれと行って音素正解精度を求め、最も良い音素正解精度及び認識結果音素列を採用する。ただし本発明はこれに限るものではなく、順位によって重み係数を音素正解精度にかけてから最大値を取ったり、総和を取ったりしても良い。また、音声認識結果アノテーションデータは、図2のように上位N個の認識結果を保持する形態に限らず、各音素(あるいは単語など)で構成するラティス(単語グラフ)を出力し、ラティスの始端から終端までのそれぞれのパスにおいて音素正解精度を求めても良い。
上記実施例では音素列マッチングにより音素正解精度を検索のためのスコアとして用いたが、本発明はこれに限るものではなく、例えば音素ではなく音節でのマッチングや、単語単位でのマッチングによる正解精度でも良い。また、これに音声認識で求まる認識尤度203を加味したり、音素間の類似度(“p”と“t”は類似度が高いなど)を用いてスコアの重み付けをしたりしても良い。また、上記実施例では、図5に示すとおり音素列の全体マッチングによる音素正解精度を検索のためのスコアとして用いたが、挿入誤りによるスコアの劣化を抑えるなどとしたスコアの工夫により検索キーの部分的なマッチングによって検索しても良い。この実施例では、例えば音声認識結果アノテーションデータに「箱根の山」というアノテーションが付与されているときに、部分マッチングにより「箱根」、「山」を検索キーとして検索可能となる。
上記実施例は音素正解精度の閾値処理によって、順位順による整列とその他の整列とを切り替えて別の領域に表示するものであるが、本発明はこれに限らず、音素正解精度の閾値処理によってデータの表示方法を切り替える全ての実施形態に適用可能である。例えば、音素正解精度が閾値未満のデータは全て表示せず、音素正解精度が閾値以上のデータのみを表示させたり、音素正解精度が閾値以上のデータのみ画像を大きく表示して閾値未満のデータは小さなアイコンもしくはリンクのテキストのみを表示するといった実施形態も考えられる。
なお、本発明は、1つの機器からなる装置に適用しても、複数の機器から構成されるシステムに適用してもよい。また、前述した実施形態の機能を実現するソフトウエアのプログラムコードを記録した記録媒体を、システム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU)が記録媒体に格納されたプログラムコードを読み出し実行することによっても、達成されることは言うまでもない。この場合、記録媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記録した記録媒体は本発明を構成することになる。
Claims (14)
- データを検索するデータ検索方法であって、
入力された検索条件と、前記データに対応する音声データを音声認識した結果であり前記データに関連付けられた音声認識結果アノテーションとの相関を表すスコアを取得する取得ステップと、
取得したスコアが所定の閾値以上のデータは第1の基準で表示し、閾値未満のデータは第2の基準で表示するよう制御する表示制御ステップを有することを特徴とするデータ検索方法。 - 前記音声認識結果アノテーションデータは、所定の音声単位で分割したサブワードの列であり、
前記入力された検索条件は検索キーであり、
前記検索キーをサブワードの列に変換する変換ステップを更に有し、
前記取得ステップは前記検索キーと前記音声認識結果アノテーションとの両サブワード列の相関を表すスコアを取得することを特徴とする請求項1記載のデータ検索方法。 - 検索キーと対応の取れたデータの組の集合である学習セットを用いて、あらかじめ検索キーを入力し、前記サブワード正解精度に基づいて検索対象データ全てを順位付けして前記データの検索順位を求め、前記学習セットの各データの前記サブワード正解精度と前記検索順位の組に基づき、所定の検索順位を下回る順位が所定数以上表れないサブワード正解精度の値を前記閾値とすることを特徴とする請求項1記載のデータ検索方法。
- 前記閾値は50%以上のいずれかの値であることを特徴とする請求項1記載のデータ検索方法。
- 前記第1の基準は前記スコア順に並べて表示し、前記第2の基準は前記スコア順以外の方法で並べて表示する基準であることを特徴とする請求項1記載のデータ検索方法。
- 前記第2の基準は、前記データの名称の50音順、前記データが有する時間情報順、前記データのデータサイズ順、前記データの表示サイズ順のいずれかであることを特徴とする請求項1記載のデータ検索方法。
- 請求項1乃至6記載のデータ検索方法をコンピュータに実行させる制御プログラム。
- 請求項7記載の制御プログラムを記憶したコンピュータ読み取り可能な記憶媒体。
- データを検索するデータ検索装置であって、
入力された検索条件と、前記データに対応する音声データを音声認識した結果であり前記データに関連付けられた音声認識結果アノテーションとの相関を表すスコアを取得する取得手段と、
取得したスコアが所定の閾値以上のデータは第1の基準で表示し、閾値未満のデータは第2の基準で表示するよう制御する表示制御手段を有することを特徴とするデータ検索装置。 - 前記音声認識結果アノテーションデータは、所定の音声単位で分割したサブワードの列であり、
前記入力された検索条件は検索キーであり、
前記検索キーをサブワードの列に変換する変換手段を更に有し、
前記取得手段は前記検索キーと前記音声認識結果アノテーションとの両サブワード列の相関を表すスコアを取得することを特徴とする請求項9記載のデータ検索装置。 - 検索キーと対応の取れたデータの組の集合である学習セットを用いて、あらかじめ検索キーを入力し、前記サブワード正解精度に基づいて検索対象データ全てを順位付けして前記データの検索順位を求め、前記学習セットの各データの前記サブワード正解精度と前記検索順位の組に基づき、所定の検索順位を下回る順位が所定数以上表れないサブワード正解精度の値を前記閾値とすることを特徴とする請求項9記載のデータ検索装置。
- 前記閾値は50%以上のいずれかの値であることを特徴とする請求項9記載のデータ検索装置。
- 前記第1の基準は前記スコア順に並べて表示し、前記第2の基準は前記スコア順以外の方法で並べて表示する基準であることを特徴とする請求項9記載のデータ検索装置。
- 前記第2の基準は、前記データの名称の50音順、前記データが有する時間情報順、前記データのデータサイズ順、前記データの表示サイズ順のいずれかであることを特徴とする請求項9記載のデータ検索装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004292606A JP4579638B2 (ja) | 2004-10-05 | 2004-10-05 | データ検索装置及びデータ検索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004292606A JP4579638B2 (ja) | 2004-10-05 | 2004-10-05 | データ検索装置及びデータ検索方法 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2006107108A true JP2006107108A (ja) | 2006-04-20 |
JP2006107108A5 JP2006107108A5 (ja) | 2010-02-18 |
JP4579638B2 JP4579638B2 (ja) | 2010-11-10 |
Family
ID=36376778
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004292606A Expired - Fee Related JP4579638B2 (ja) | 2004-10-05 | 2004-10-05 | データ検索装置及びデータ検索方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4579638B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011527030A (ja) * | 2008-07-02 | 2011-10-20 | グーグル・インコーポレーテッド | 並列認識タスクを用いた音声認識 |
US8407047B2 (en) | 2008-06-25 | 2013-03-26 | Fujitsu Limited | Guidance information display device, guidance information display method and recording medium |
CN108984730A (zh) * | 2018-07-12 | 2018-12-11 | 三星电子(中国)研发中心 | 一种搜索方法和搜索设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6135498A (ja) * | 1984-07-27 | 1986-02-19 | 松下電器産業株式会社 | 音声認識装置 |
JPH03266898A (ja) * | 1990-03-16 | 1991-11-27 | Fujitsu Ltd | 大語彙音声認識処理方式 |
JPH09101970A (ja) * | 1995-10-06 | 1997-04-15 | Omron Corp | 画像検索方法および画像検索装置 |
JPH09135417A (ja) * | 1995-11-10 | 1997-05-20 | Ricoh Co Ltd | デジタルスチルビデオカメラ |
JPH11175535A (ja) * | 1997-12-08 | 1999-07-02 | Hitachi Ltd | 画像検索方法およびその装置およびこれを利用した検索サービス |
JP2000357175A (ja) * | 1993-05-18 | 2000-12-26 | Seiko Epson Corp | データ管理装置 |
-
2004
- 2004-10-05 JP JP2004292606A patent/JP4579638B2/ja not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6135498A (ja) * | 1984-07-27 | 1986-02-19 | 松下電器産業株式会社 | 音声認識装置 |
JPH03266898A (ja) * | 1990-03-16 | 1991-11-27 | Fujitsu Ltd | 大語彙音声認識処理方式 |
JP2000357175A (ja) * | 1993-05-18 | 2000-12-26 | Seiko Epson Corp | データ管理装置 |
JPH09101970A (ja) * | 1995-10-06 | 1997-04-15 | Omron Corp | 画像検索方法および画像検索装置 |
JPH09135417A (ja) * | 1995-11-10 | 1997-05-20 | Ricoh Co Ltd | デジタルスチルビデオカメラ |
JPH11175535A (ja) * | 1997-12-08 | 1999-07-02 | Hitachi Ltd | 画像検索方法およびその装置およびこれを利用した検索サービス |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8407047B2 (en) | 2008-06-25 | 2013-03-26 | Fujitsu Limited | Guidance information display device, guidance information display method and recording medium |
JP2011527030A (ja) * | 2008-07-02 | 2011-10-20 | グーグル・インコーポレーテッド | 並列認識タスクを用いた音声認識 |
JP2013238885A (ja) * | 2008-07-02 | 2013-11-28 | Google Inc | 並列認識タスクを用いた音声認識 |
JP2017076139A (ja) * | 2008-07-02 | 2017-04-20 | グーグル インコーポレイテッド | 並列認識タスクを用いた音声認識 |
CN108984730A (zh) * | 2018-07-12 | 2018-12-11 | 三星电子(中国)研发中心 | 一种搜索方法和搜索设备 |
Also Published As
Publication number | Publication date |
---|---|
JP4579638B2 (ja) | 2010-11-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4218758B2 (ja) | 字幕生成装置、字幕生成方法、及びプログラム | |
JP3848319B2 (ja) | 情報処理方法及び情報処理装置 | |
US20070174326A1 (en) | Application of metadata to digital media | |
JP2836159B2 (ja) | 同時通訳向き音声認識システムおよびその音声認識方法 | |
US20050143999A1 (en) | Question-answering method, system, and program for answering question input by speech | |
US10978077B1 (en) | Knowledge point mark generation system and method thereof | |
US20090234854A1 (en) | Search system and search method for speech database | |
US20160055763A1 (en) | Electronic apparatus, pronunciation learning support method, and program storage medium | |
US20160012751A1 (en) | Comprehension assistance system, comprehension assistance server, comprehension assistance method, and computer-readable recording medium | |
US20060047647A1 (en) | Method and apparatus for retrieving data | |
CN109033060B (zh) | 一种信息对齐方法、装置、设备及可读存储介质 | |
CN111276149B (zh) | 语音识别方法、装置、设备及可读存储介质 | |
JP5296598B2 (ja) | 音声情報抽出装置 | |
JP4738847B2 (ja) | データ検索装置および方法 | |
CN112382295B (zh) | 语音识别方法、装置、设备及可读存储介质 | |
JP5897718B2 (ja) | 音声検索装置、計算機読み取り可能な記憶媒体、及び音声検索方法 | |
KR20060100646A (ko) | 영상물의 특정 위치를 검색하는 방법 및 영상 검색 시스템 | |
US20150293902A1 (en) | Method for automated text processing and computer device for implementing said method | |
CN111785299B (zh) | 一种语音测评方法、装置、设备及计算机存储介质 | |
JP2005345616A (ja) | 情報処理装置及び情報処理方法 | |
JP4579638B2 (ja) | データ検索装置及びデータ検索方法 | |
US20050125224A1 (en) | Method and apparatus for fusion of recognition results from multiple types of data sources | |
JP3444831B2 (ja) | 編集処理装置、及び編集処理プログラムが記憶された記憶媒体 | |
CN110890095A (zh) | 语音检测方法、推荐方法、装置、存储介质和电子设备 | |
JP2004233541A (ja) | ハイライトシーン検出システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071003 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091228 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20100201 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100210 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100216 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100412 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20100630 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100824 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100826 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130903 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |