JP4579638B2 - データ検索装置及びデータ検索方法 - Google Patents
データ検索装置及びデータ検索方法 Download PDFInfo
- Publication number
- JP4579638B2 JP4579638B2 JP2004292606A JP2004292606A JP4579638B2 JP 4579638 B2 JP4579638 B2 JP 4579638B2 JP 2004292606 A JP2004292606 A JP 2004292606A JP 2004292606 A JP2004292606 A JP 2004292606A JP 4579638 B2 JP4579638 B2 JP 4579638B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- order
- search
- phoneme
- correlation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Studio Devices (AREA)
Description
{(正解数)―(挿入誤り数)―(削除誤り数)―(置換誤り数)}×100/(正解数)
で求める。図5においては挿入誤りが“o”と“a”の2箇所、そして“h”を“f”として誤った置換誤りが1箇所であり、音素正解精度は75%となる。このようにして求めた音素正解精度を検索に用いるスコアとしてデータ102をランキングする。ここで、図2の音声認識結果アノテーションデータは上位5つの認識結果音素列が存在するが、マッチングはこれらそれぞれと行って音素正解精度を求め、最も良い音素正解精度及び認識結果音素列を採用する。ただし本発明はこれに限るものではなく、順位によって重み係数を音素正解精度にかけてから最大値を取ったり、総和を取ったりしても良い。また、音声認識結果アノテーションデータは、図2のように上位N個の認識結果を保持する形態に限らず、各音素(あるいは単語など)で構成するラティス(単語グラフ)を出力し、ラティスの始端から終端までのそれぞれのパスにおいて音素正解精度を求めても良い。
上記実施例では音素列マッチングにより音素正解精度を検索のためのスコアとして用いたが、本発明はこれに限るものではなく、例えば音素ではなく音節でのマッチングや、単語単位でのマッチングによる正解精度でも良い。また、これに音声認識で求まる認識尤度203を加味したり、音素間の類似度(“p”と“t”は類似度が高いなど)を用いてスコアの重み付けをしたりしても良い。また、上記実施例では、図5に示すとおり音素列の全体マッチングによる音素正解精度を検索のためのスコアとして用いたが、挿入誤りによるスコアの劣化を抑えるなどとしたスコアの工夫により検索キーの部分的なマッチングによって検索しても良い。この実施例では、例えば音声認識結果アノテーションデータに「箱根の山」というアノテーションが付与されているときに、部分マッチングにより「箱根」、「山」を検索キーとして検索可能となる。
上記実施例は音素正解精度の閾値処理によって、順位順による整列とその他の整列とを切り替えて別の領域に表示するものであるが、本発明はこれに限らず、音素正解精度の閾値処理によってデータの表示方法を切り替える全ての実施形態に適用可能である。例えば、音素正解精度が閾値未満のデータは全て表示せず、音素正解精度が閾値以上のデータのみを表示させたり、音素正解精度が閾値以上のデータのみ画像を大きく表示して閾値未満のデータは小さなアイコンもしくはリンクのテキストのみを表示するといった実施形態も考えられる。
なお、本発明は、1つの機器からなる装置に適用しても、複数の機器から構成されるシステムに適用してもよい。また、前述した実施形態の機能を実現するソフトウエアのプログラムコードを記録した記録媒体を、システム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU)が記録媒体に格納されたプログラムコードを読み出し実行することによっても、達成されることは言うまでもない。この場合、記録媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記録した記録媒体は本発明を構成することになる。
Claims (7)
- 各々のデータが所定の音声データと対応付けて蓄積されている複数のデータから、所望のデータを検索し、検索結果を表示手段に表示させるデータ検索装置のデータ検索方法であって、
前記複数のデータと、前記複数のデータの各々に対応付けられた所定の音声データとを蓄積する蓄積ステップと、
各々の前記音声データを音声認識することによって得られた第1の音素列を取得する取得ステップと、
ユーザによる操作に応答して、検索条件に相当する検索キーを入力する入力ステップと、
前記検索キーを形態素解析して単語列に分割し、さらに当該単語列に読みを付与し、第2の音素列を得る変換ステップと、
各々の前記音声データから得られた前記第1の音素列について、音素マッチングを行うことにより、前記第2の音素列との相関度をそれぞれ決定する決定ステップと、
前記相関度が所定の閾値以上である前記第1の音素列に対応する音声データが対応付けられた前記データを前記相関度でランキングした順位順に並べて表示させると共に、前記相関度が前記閾値未満である前記第1の音素列に対応する音声データが対応付けられた前記データを、前記データの名称の名前順、前記データが有する時間情報順、前記データのデータサイズ順、前記データの表示サイズ順のうちいずれかに従って並べて表示させるよう前記表示手段を制御する表示制御ステップを有するデータ検索方法。 - 各々のデータが所定の音声データと対応付けて蓄積されている複数のデータから、所望のデータを検索し、検索結果を表示手段に表示させるデータ検索装置のデータ検索方法であって、
前記複数のデータと、前記複数のデータの各々に対応付けられた所定の音声データとを蓄積する蓄積ステップと、
各々の前記音声データを音声認識することによって得られた第1の単語列を取得する取得ステップと、
ユーザによる操作に応答して、検索条件に相当する検索キーを入力する入力ステップと、
前記検索キーを形態素解析して第2の単語列を得る変換ステップと、
各々の前記音声データから得られた前記第1の単語列について、単語マッチングを行うことにより、前記第2の単語列との相関度をそれぞれ決定する決定ステップと、
前記相関度が所定の閾値以上である前記第1の単語列に対応する音声データが対応付けられた前記データを前記相関度でランキングした順位順に並べて表示させると共に、前記相関度が前記閾値未満である前記第1の単語列に対応する音声データが対応付けられた前記データを、前記データの名称の名前順、前記データが有する時間情報順、前記データのデータサイズ順、前記データの表示サイズ順のうちいずれかに従って並べて表示させるよう前記表示手段を制御する表示制御ステップを有するデータ検索方法。 - 前記表示制御ステップは、前記相関度が所定の閾値以上である前記第1の音素列に対応する音声データが対応付けられた前記データを前記相関度でランキングした順位順に並べて第1のウインドウに表示させると共に、前記相関度が前記閾値未満である前記第1の音素列に対応する音声データが対応付けられた前記データを、前記データの名称の名前順、前記データが有する時間情報順、前記データのデータサイズ順、前記データの表示サイズ順のうちいずれかに従って並べて前記第1のウインドウと異なる第2のウインドウに表示させるよう前記表示手段を制御することを特徴とする請求項1に記載のデータ検索方法。
- 請求項1乃至は請求項3のいずれか1項に記載のデータ検索方法をコンピュータに実行させるプログラム。
- 請求項4に記載のプログラムを記憶したコンピュータ読み取り可能な記憶媒体。
- 各々のデータが所定の音声データと対応付けて蓄積されている複数のデータから、所望のデータを検索し、検索結果を表示手段に表示させるデータ検索装置であって、
前記複数のデータと、前記複数のデータの各々に対応付けられた所定の音声データとを蓄積する蓄積手段と、
各々の前記音声データを音声認識することによって得られた第1の音素列を取得する取得手段と、
ユーザによる操作に応答して、検索条件に相当する検索キーを入力する入力手段と、
前記検索キーを形態素解析して単語列に分割し、さらに当該単語列に読みを付与し、第2の音素列を得る変換手段と、
各々の前記音声データから得られた前記第1の音素列について、音素マッチングを行うことにより、前記第2の音素列との相関度をそれぞれ決定する決定手段と、
前記相関度が所定の閾値以上である前記第1の音素列に対応する音声データが対応付けられた前記データを前記相関度でランキングした順位順に並べて表示させると共に、前記相関度が前記閾値未満である前記第1の音素列に対応する音声データが対応付けられた前記データを、前記データの名称の名前順、前記データが有する時間情報順、前記データのデータサイズ順、前記データの表示サイズ順のうちいずれかに従って並べて表示させるよう前記表示手段を制御する表示制御手段を有するデータ検索装置。 - 各々のデータが所定の音声データと対応付けて蓄積されている複数のデータから、所望のデータを検索し、検索結果を表示手段に表示させるデータ検索装置であって、
前記複数のデータと、前記複数のデータの各々に対応付けられた所定の音声データとを蓄積する蓄積手段と、
各々の前記音声データを音声認識することによって得られた第1の単語列を取得する取得手段と、
ユーザによる操作に応答して、検索条件に相当する検索キーを入力する入力手段と、
前記検索キーを形態素解析して第2の単語列を得る変換手段と、
各々の前記音声データから得られた前記第1の単語列について、単語マッチングを行うことにより、前記第2の単語列との相関度をそれぞれ決定する決定手段と、
前記相関度が所定の閾値以上である前記第1の単語列に対応する音声データが対応付けられた前記データを前記相関度でランキングした順位順に並べて表示させると共に、前記相関度が前記閾値未満である前記第1の単語列に対応する音声データが対応付けられた前記データを、前記データの名称の名前順、前記データが有する時間情報順、前記データのデータサイズ順、前記データの表示サイズ順のうちいずれかに従って並べて表示させるよう前記表示手段を制御する表示制御手段を有するデータ検索装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004292606A JP4579638B2 (ja) | 2004-10-05 | 2004-10-05 | データ検索装置及びデータ検索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004292606A JP4579638B2 (ja) | 2004-10-05 | 2004-10-05 | データ検索装置及びデータ検索方法 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2006107108A JP2006107108A (ja) | 2006-04-20 |
JP2006107108A5 JP2006107108A5 (ja) | 2010-02-18 |
JP4579638B2 true JP4579638B2 (ja) | 2010-11-10 |
Family
ID=36376778
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004292606A Expired - Fee Related JP4579638B2 (ja) | 2004-10-05 | 2004-10-05 | データ検索装置及びデータ検索方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4579638B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010008601A (ja) | 2008-06-25 | 2010-01-14 | Fujitsu Ltd | 案内情報表示装置、案内情報表示方法及びプログラム |
US8364481B2 (en) * | 2008-07-02 | 2013-01-29 | Google Inc. | Speech recognition with parallel recognition tasks |
CN108984730A (zh) * | 2018-07-12 | 2018-12-11 | 三星电子(中国)研发中心 | 一种搜索方法和搜索设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6135498A (ja) * | 1984-07-27 | 1986-02-19 | 松下電器産業株式会社 | 音声認識装置 |
JPH03266898A (ja) * | 1990-03-16 | 1991-11-27 | Fujitsu Ltd | 大語彙音声認識処理方式 |
JPH09101970A (ja) * | 1995-10-06 | 1997-04-15 | Omron Corp | 画像検索方法および画像検索装置 |
JPH09135417A (ja) * | 1995-11-10 | 1997-05-20 | Ricoh Co Ltd | デジタルスチルビデオカメラ |
JPH11175535A (ja) * | 1997-12-08 | 1999-07-02 | Hitachi Ltd | 画像検索方法およびその装置およびこれを利用した検索サービス |
JP2000357175A (ja) * | 1993-05-18 | 2000-12-26 | Seiko Epson Corp | データ管理装置 |
-
2004
- 2004-10-05 JP JP2004292606A patent/JP4579638B2/ja not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6135498A (ja) * | 1984-07-27 | 1986-02-19 | 松下電器産業株式会社 | 音声認識装置 |
JPH03266898A (ja) * | 1990-03-16 | 1991-11-27 | Fujitsu Ltd | 大語彙音声認識処理方式 |
JP2000357175A (ja) * | 1993-05-18 | 2000-12-26 | Seiko Epson Corp | データ管理装置 |
JPH09101970A (ja) * | 1995-10-06 | 1997-04-15 | Omron Corp | 画像検索方法および画像検索装置 |
JPH09135417A (ja) * | 1995-11-10 | 1997-05-20 | Ricoh Co Ltd | デジタルスチルビデオカメラ |
JPH11175535A (ja) * | 1997-12-08 | 1999-07-02 | Hitachi Ltd | 画像検索方法およびその装置およびこれを利用した検索サービス |
Also Published As
Publication number | Publication date |
---|---|
JP2006107108A (ja) | 2006-04-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109493850B (zh) | 成长型对话装置 | |
JP3848319B2 (ja) | 情報処理方法及び情報処理装置 | |
JP4218758B2 (ja) | 字幕生成装置、字幕生成方法、及びプログラム | |
US20070174326A1 (en) | Application of metadata to digital media | |
JP2836159B2 (ja) | 同時通訳向き音声認識システムおよびその音声認識方法 | |
US20090234854A1 (en) | Search system and search method for speech database | |
US20060047647A1 (en) | Method and apparatus for retrieving data | |
CN109033060B (zh) | 一种信息对齐方法、装置、设备及可读存储介质 | |
JP4699954B2 (ja) | マルチメディアデータ管理方法とその装置 | |
CN111276149B (zh) | 语音识别方法、装置、设备及可读存储介质 | |
US9251808B2 (en) | Apparatus and method for clustering speakers, and a non-transitory computer readable medium thereof | |
JP5296598B2 (ja) | 音声情報抽出装置 | |
US11501546B2 (en) | Media management system for video data processing and adaptation data generation | |
CN112382295B (zh) | 语音识别方法、装置、设备及可读存储介质 | |
JP4738847B2 (ja) | データ検索装置および方法 | |
KR102170844B1 (ko) | 강의 관련 키워드를 기반으로 하는 강의 음성파일 텍스트 변환 시스템 | |
JP5897718B2 (ja) | 音声検索装置、計算機読み取り可能な記憶媒体、及び音声検索方法 | |
CN111785299B (zh) | 一种语音测评方法、装置、设备及计算机存储介质 | |
KR20060100646A (ko) | 영상물의 특정 위치를 검색하는 방법 및 영상 검색 시스템 | |
JP4579638B2 (ja) | データ検索装置及びデータ検索方法 | |
JP2005345616A (ja) | 情報処理装置及び情報処理方法 | |
WO2009113505A1 (ja) | 映像分割装置、方法及びプログラム | |
US20050125224A1 (en) | Method and apparatus for fusion of recognition results from multiple types of data sources | |
JP3444831B2 (ja) | 編集処理装置、及び編集処理プログラムが記憶された記憶媒体 | |
CN110890095A (zh) | 语音检测方法、推荐方法、装置、存储介质和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071003 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091228 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20100201 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100210 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100216 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100412 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20100630 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100824 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100826 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130903 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |