JPH05334861A - 音声検索装置 - Google Patents

音声検索装置

Info

Publication number
JPH05334861A
JPH05334861A JP4142882A JP14288292A JPH05334861A JP H05334861 A JPH05334861 A JP H05334861A JP 4142882 A JP4142882 A JP 4142882A JP 14288292 A JP14288292 A JP 14288292A JP H05334861 A JPH05334861 A JP H05334861A
Authority
JP
Japan
Prior art keywords
voice
data
recording
keyword
recording medium
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP4142882A
Other languages
English (en)
Inventor
Akio Takakuwa
明夫 高鍬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Radio Co Ltd
Original Assignee
Japan Radio Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Radio Co Ltd filed Critical Japan Radio Co Ltd
Priority to JP4142882A priority Critical patent/JPH05334861A/ja
Publication of JPH05334861A publication Critical patent/JPH05334861A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)

Abstract

(57)【要約】 【目的】 音声記録媒体から、迅速確実に検索する音声
検索装置を提供する。 【構成】 マイクロフォンの音声入力装置4により規定
される音声キーワードと、音声記録再生装置1からの音
声再生信号とが、実質的に一致するか否かを、音声認識
装置2により判定し、検索して、一致した場合は、一致
した音声信号を含む前後の音声再生信号を再生する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、カセットデッキ、光デ
ィスク、光磁気ディスクなどの音声信号を記録する記録
媒体から、所望の音声信号を、ワープロにおける文字と
同様に、検索して再生が可能となる音声検索装置に関す
る。
【0002】
【従来の技術】近年、記録媒体の長時間録音化が進んで
いる。よって、一つの記録媒体に多数の音声情報を録音
することが多くなってきた。従って、使用者にとって
は、必要な箇所だけを抜き出して聞くことは困難な作業
になってきた。
【0003】それを解決する手法として、従来の音声検
索装置では、例えばビデオテープでは、「インデック
ス」と呼ばれる信号を、使用者がテープ中に記録する方
法がとられているし、CDではトラック番号があらかじ
め割り振られている。
【0004】なお、音声認識技術は近年めざましく進展
しており、連続音声認識装置も実用化されつつある。不
特定話者を対象とする認識装置を用いれば、使用者は何
の前処理もなく、それを利用できる。
【0005】
【発明が解決しようとする課題】しかしながら、上述し
た従来の音声検索装置では、これらはいずれも事前に行
われることであって、必要なときに必要な箇所を探した
い時には、結局早送りなどで、使用者がいちいち検索し
なければならない煩わしさがあった。
【0006】そこで、本発明の技術的課題は、上記欠点
に鑑み、音声という目に見えない信号を、音声記録媒体
から、迅速確実に検索する音声検索装置を提供するもの
である。
【0007】
【課題を解決するための手段】本発明によれば、音声信
号を記録した所定の記録媒体から、所望の部分を、所定
の音声キーワードをに基づいて検索する音声検索装置で
あって、音声入力により、前記音声キーワードを規定す
る音声キーワード規定手段と、該音声キーワード規定手
段により規定された音声キーワードと実質的に一致する
音声信号を、前記記録媒体から検索する検索手段とを有
することを特徴とする音声検索装置が得られる。
【0008】また、本発明によれば、前記音声検索装置
において、前記記録媒体のうち、少なくとも前記一致し
た音声信号を含む所定範囲から、音声信号を再生する再
生手段を有することを特徴とする音声検索装置が得られ
る。
【0009】すなわち、本発明によれば、不特定話者音
声認識装置を記録再生装置内に組み込んで、記録媒体中
のデータと検索データとを比較し抽出する。なお、検索
データは、マイクロフォンから音声データとして入力さ
れる音声キーワードである。
【0010】
【作用】上記手段を用いると、音声情報が蓄積された記
録媒体から、使用者が欲する部分を迅速にサーチでき
る。
【0011】
【実施例】次に、本発明の実施例を図面を参照して説明
する。
【0012】図1に示すように、1は音声信号を記録し
た記録媒体であるカセットテープから、音声信号を再生
する音声記録再生装置であり、音声記録再生装置1から
は、音声再生データが、音声符号化装置2に出力され
る。音声符号化装置2は音声再生データを符号化して、
不特定話者音声認識装置3に入力する。
【0013】一方、マイクロフォン等の音声入力装置4
を介して、音声データが、音声キーワードとして、音声
符号化装置2に出力される。音声符号化装置2は音声キ
ーワードを符号化して、音声認識装置3に入力する。
【0014】音声認識装置3は、符号化された音声キー
ワードに基づいて、符号化された音声再生データが実質
的に一致するまで、音声記録再生装置1から音声再生デ
ータを、順次送り出させ、検索を継続する。
【0015】音声認識装置3は、音声再生データが音声
キーワードと実質的に一致した場合には、音声記録再生
装置1に対して、音声再生データの送り出しの中止を指
令し、音声キーワードと実質的に一致した音声再生デー
タの前後の音声再生データを再生を指令する。その結
果、使用者は、音声キーワードにより、所望の箇所の音
声を、カセットテープから、ピックアップすることがで
きる。
【0016】ここで、具体的に、本実施例の音声検索装
置について説明する。まず、音声サンプルとして次のよ
うなものを考える。
【0017】「最近は軽薄短小の時代なのか、なんでも
小型化することが流行っている。
【0018】・・・・・・ところでコンピュータについ
てはどうだろう。小型化の波もあることはあるが、デス
クトップコンピュータとノートコンピュータはそれぞ
れ、異なる思想を持ちだしたといえる。
【0019】デスクトップコンピュータは・・・・・・
ノートコンピュータは・・・・・・・・・・21世紀に
我々は、どんな機械を相手にしていることだろう。
【0020】・・・・・・・・・・・・」この音声情報
が記録媒体のカセットテープ中に含まれているとする。
【0021】このカセットテープから「ノートコンピュ
ータ」について知りたいと思った場合、従来は、早送り
をしたり、最初から全部聴いたりして「ノートコンピュ
ータ」に関する単語を自分で探すしか方法が無かっ
た、。
【0022】本実施例によれば、図1および図2に示し
通り、音声認識装置3を使った音声検索の自動化が行わ
れる。
【0023】まず使用者は、音声記録再生装置1に付帯
されているマイクロフォン等の音声入力装置4から「ノ
ート」と音声で入力する(ステップ100)。この入力
データを目的データ(音声キーワード)と呼ぶことにす
る。
【0024】次に使用者が、検索開始の指令を発する
と、音声記録再生装置1は、早送り再生を開始し、単語
列を出力する(ステップ101)。この言語列を再生デ
ータと呼ぶ。
【0025】音声記録再生装置1では、再生データを、
単語切り出し部(図示せず)において、音素間の時間幅
を測定し(ステップ102)、単語と単語の境界を区別
し単語列を出力する(ステップ103)。この単語列を
区分データと呼ぶことにする。
【0026】次に、音声符号化装置2において、目的デ
ータおよび区分データを符号化する(ステップ10
4)。
【0027】次に、音声認識装置3が、符号化された入
力データと区分データとの類似度を計算するのである
(ステップ105)。なお、類似性が高くパターンが一
致したと判断すべきか、類似性が低くパターンは不一致
であると判断すべきかの境界となる類似度は、あらかじ
め初期設定として与えられていなければならない。この
類似度とは、まったく同一のパターンの時に1で、ホワ
イトノイズとの比較において0となるように正規化され
た値である。
【0028】音声認識装置3では、入力データと区分デ
ータとの2つのデータ間の距離計算を、DPマッチング
手法によって行う。DPマッチングは、時間伸縮に強い
ので、早送りして得られた区分データと、通常の音声で
ある入力データを、そのまま比較できる。
【0029】音声認識装置3は、DPマッチング手法に
より、類似性の有無を判定する(ステップ106)。類
似度が高いと認めた場合、音声記録再生装置1のカセッ
トテープの早送りを止め(ステップ107)、一定時間
巻き戻しをした後(ステップ108)、通常の再生に移
る(ステップ109)。
【0030】
【発明の効果】以上の説明の通り、本発明によれば、音
声情報記録媒体からの必要事項抽出を、自動的に行うこ
とが可能になる。
【図面の簡単な説明】
【図1】本発明の実施例を説明するブロック概念図。
【図2】図1で示した実施例のフローチャート。
【符号の説明】
1 音声記録再生装置 2 音声符号化装置 3 音声認識装置 4 音声入力装置

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 音声信号を記録した記録媒体から、所望
    の部分を、所定の音声キーワードをに基づいて検索する
    音声検索装置であって、 音声入力により、前記音声キーワードを規定する音声キ
    ーワード規定手段と、 該音声キーワード規定手段により規定された音声キーワ
    ードと実質的に一致する音声信号を前記記録媒体から検
    索する検索手段とを有することを特徴とする音声検索装
    置。
  2. 【請求項2】 請求項1記載の音声検索装置において、 前記記録媒体のうち、少なくとも前記一致した音声信号
    を含む所定範囲から、音声信号を再生する再生手段を有
    することを特徴とする音声検索装置。
JP4142882A 1992-06-03 1992-06-03 音声検索装置 Withdrawn JPH05334861A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4142882A JPH05334861A (ja) 1992-06-03 1992-06-03 音声検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4142882A JPH05334861A (ja) 1992-06-03 1992-06-03 音声検索装置

Publications (1)

Publication Number Publication Date
JPH05334861A true JPH05334861A (ja) 1993-12-17

Family

ID=15325793

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4142882A Withdrawn JPH05334861A (ja) 1992-06-03 1992-06-03 音声検索装置

Country Status (1)

Country Link
JP (1) JPH05334861A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001016935A1 (fr) * 1999-08-26 2001-03-08 Sony Corporation Procede et dispositif d'extraction/traitement d'informations, et procede et dispositif de stockage
JP2002091493A (ja) * 2000-09-11 2002-03-27 Sony Corp 音声信号の再生装置
JP2011158856A (ja) * 2010-02-04 2011-08-18 Nakayo Telecommun Inc 録音装置およびインデックス情報付与方法
US8731926B2 (en) 2010-03-04 2014-05-20 Fujitsu Limited Spoken term detection apparatus, method, program, and storage medium

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001016935A1 (fr) * 1999-08-26 2001-03-08 Sony Corporation Procede et dispositif d'extraction/traitement d'informations, et procede et dispositif de stockage
US7260226B1 (en) 1999-08-26 2007-08-21 Sony Corporation Information retrieving method, information retrieving device, information storing method and information storage device
US8165306B2 (en) 1999-08-26 2012-04-24 Sony Corporation Information retrieving method, information retrieving device, information storing method and information storage device
JP2002091493A (ja) * 2000-09-11 2002-03-27 Sony Corp 音声信号の再生装置
JP2011158856A (ja) * 2010-02-04 2011-08-18 Nakayo Telecommun Inc 録音装置およびインデックス情報付与方法
US8731926B2 (en) 2010-03-04 2014-05-20 Fujitsu Limited Spoken term detection apparatus, method, program, and storage medium

Similar Documents

Publication Publication Date Title
US5649060A (en) Automatic indexing and aligning of audio and text using speech recognition
WO2000036833A1 (fr) Procede et appareil permettant de retrouver vocalement des scenes video ou audio
US7010485B1 (en) Method and system of audio file searching
EP1403852B1 (en) Voice activated music playback system
JPH10162508A (ja) 車両用録音再生装置
JP3685733B2 (ja) マルチメディアデータ検索装置、マルチメディアデータ検索方法およびマルチメディアデータ検索プログラム
JPH05334861A (ja) 音声検索装置
US20050229204A1 (en) Signal processing method and arragement
KR20010069858A (ko) 멀티미디어 파일 재생 시스템 및 방법
EP3648106A1 (en) Media content steering
JP2004093729A (ja) 音楽データの記録装置及び再生装置
JP4779954B2 (ja) 音声データ処理装置、方法及びプログラム
JP2003230094A (ja) チャプター作成装置及びデータ再生装置及びその方法並びにプログラム
Foote et al. Enhanced video browsing using automatically extracted audio excerpts
JP2002324071A (ja) コンテンツ検索システム、コンテンツ検索方法
KR100385977B1 (ko) 오디오 데이터가 기록된 기록매체, 그 기록/재생 방법, 그기록장치, 및 재생장치
JP2001357662A (ja) オーディオデータの記録された記録媒体、その記録/再生方法、その記録装置、及び再生装置
CN115209214B (zh) 从视频中识别并移除受限信息
JP2005341138A (ja) 映像要約方法及びプログラム及びそのプログラムを格納した記憶媒体
JPH04264595A (ja) 音声データ再生装置
JPH0444445A (ja) 情報記録検索装置
JP2620242B2 (ja) ランダムプレイ方式
JPH01138600A (ja) 音声ファイル方式
KR20050106246A (ko) 엠펙 플레이어에 있어서 데이터 검색 방법
JPH08212758A (ja) 音声記録再生装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19990803