JPH0333798A - 音声検索装置 - Google Patents

音声検索装置

Info

Publication number
JPH0333798A
JPH0333798A JP1169312A JP16931289A JPH0333798A JP H0333798 A JPH0333798 A JP H0333798A JP 1169312 A JP1169312 A JP 1169312A JP 16931289 A JP16931289 A JP 16931289A JP H0333798 A JPH0333798 A JP H0333798A
Authority
JP
Japan
Prior art keywords
phoneme
syllable
storage means
voice
audio data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1169312A
Other languages
English (en)
Other versions
JPH0769708B2 (ja
Inventor
Hiroyasu Kuwano
裕康 桑野
Seiji Hiraoka
平岡 省二
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP1169312A priority Critical patent/JPH0769708B2/ja
Publication of JPH0333798A publication Critical patent/JPH0333798A/ja
Publication of JPH0769708B2 publication Critical patent/JPH0769708B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、文章音声中から検索したい単語、若しくは語
句を検索する音声検索装置に関するものである。
従来の技術 従来の音声検索においては、音というものが本来連続的
なものであるため、検索を希望する単語、若しくは語句
に注意しながら、その都度、音声を通して聞いて入力す
ることにより検索するようになっている。
以下に従来の音声検索装置について図面を参照しながら
説明する。
第3図は従来の音声検索装置を示すブロック図である。
第3図において、31は文章音声を電気信号に変換する
音声・電気信号変換手段、32は電気信号に変換された
音声データを保管する音声データ保管手段、33は文章
音声を聞きながら手作業により文字列を作成する音声・
文字列変換手段、34は手作業により作成された文字列
データを保管するデータ文字列保管手段、36は音声・
電気信号変換手段31により電気信号に変換された音声
データと音声・文字列変換手段33により手作業で作成
された文字列データとを対応付ける音声データ・文字列
対応付は手段、36は各文字列の音声データの始端を保
管する音声データ始端保管手段、37は検索単語文字列
保管手段、38は検索単語文字列保管手段37の文章文
字列から検索文字列を検索する文字列検索手段、39は
検索した文章文字列中の位置から音声データ保管手段3
2に保管されている音声データの位置を指し示す音声デ
ータ再生始端ポインタ、4oは音声データ再生始端ポイ
ンタ39が指し示す音声データである電気信号を音声に
変換する電気信号・音声変換手段である。
以上のように構成された従来の音声検索装置の動作につ
いて説明する。
まず、文章音声を音声・電気信号変換手段31により電
気信号に変換し、この音声データを音声データ保管手段
32に保管する。また一方で、音声・文字列変換手段3
3、例えばワードブロセノサ等を用い、人が聞いた音声
を文字列に変換し、文章音声の文字列データを作成し、
データ文字列保管手段34に保管する。また一方で、音
声データ・文字列対応付は手段36で音声・電気信号変
換手段31からの音声データと音声・文字列変換手段3
3からの文字列データを音声データ・文字列対応付は手
段36により時間的に対応付け、各文字列の音声データ
の始端位置を始端保管手段36に保管する。データ文字
列保管手段34に保管されている文字列データとキーボ
ード等の入力による検索文字列との文字列検索を文字列
検索手段(ワードプロセノサ等にある検索機能)38に
より行い、データ文字列中に同文字列を検索することが
できる。音声データポインタ39はその検索した文字列
の時間的位置を始端保管手段3eから取り出し、検索文
字列始端位置からの音声データである電気信号を音声デ
ータ保管手段32から取り出し、電気信号・音声変換手
段4oを介して出力する。
発明が解決しようとする課題 しかしながら、上記従来例の構成では、音声に対応付け
られた文字列文章を必要とするため、−度は必ず文章音
声を通して聞き、文字列の文章を作成し、かつ文章音声
と文字列文章の対応付けを行わなければならないという
課題を有していた。
本発明は、上記従来技術の課題を解決するもので、人間
の手作業を加えることなく、文章音声だけから単語、若
しくは語句等の検索を行うことができるようにした音声
検索装置を提供することを目的とするものである。
課題を解決するための手段 上記目的を達成するための本発明の技術的解決手段は、
文章音声を電気信号に変換する音声・電気信号変換手段
と、電気信号に変換された音声データを保管する音声デ
ータ保管手段と、上記電気信号に変換された音声データ
の音素または音節を認識し、かつ認識した各音素または
音節の音声データにおける始端を出力する音素または音
節認識部と、この音素または音節認識部から出力される
各音素または音節の音声データの始端を保管する始端保
管手段と、上記音素または音節認識部から出力される音
素または音節系列を保管する音素または音節系列保管手
段と、検索を希望する単語、若しくは語句の音素または
音節列を保管する検索単語、若しくは語句の音素または
音節列保管手段と、上記音素または音節系列保管手段か
らの音素または音節系列と上記検索単語、若しくは語句
の音素または音節列保管手段からの音素または音節列と
をマツチングさせ、マツチングの尤度を計算するマツチ
ング部と、予め設定した尤度の閾値な保管する尤度閾値
保管手段と、上記マツチング部で計算した尤度値と上記
尤度閾値保管手段の尤度閾値とを比較し、尤度閾値を越
える区間を検出する比較手段と、この比較手段で得た尤
度閾値を越えた文章音声の音素または音節系列の区間か
ら上記始端保管手段の各音素または音節の音声データの
始端位置により上記音声データ保管手段に保管されてい
る音声データ中、尤度閾値を越えた位置を指し示す再生
始端ポインタと、この再生始端ポインタが指し示す音声
データである電気信号を音声に変換する電気信号・音声
変換手段を具備したものである。
作用 本発明は、上記構成により次のような作用を有するO 文章音声を音声・電気信号変換手段により電気信号に変
換し、この音声データを音声データ保管手段に保管する
と共に、音素または音節認識部に入力する。この認識部
で認識した文章音声の音素または音節系列を音素または
音節系列保管手段に保管すると共に、認識した各音素ま
たは音節の音声データの始端位置を音声データ始端保管
手段に保管する。一方、検索を希望する単語、若しくは
語句の音素または音節列を保管手段に保管する。
マツチング部で上記文章音声の音素または音節と検索す
べき単語、若しくは語句の音素または音節列とをマツチ
ングさせ、マツチングの尤度を計算する。比較手段で上
記計算結果に基づき文章音声の音素または音節中で、尤
度閾値保管手段に予め設定しである尤度閾値な越える尤
度の高い部分を抽出し、文章音声中で検索結果の音素ま
たは音節区間を検出する。そして、音声データ再生始端
ポインタは上記検索結果区間の音素または音節と音声デ
ータ始端保管手段に保管しである各音素または音節の音
声データの始端位置から音声データ保管手段中の音声デ
ータの位置を指し示し、この位置からの音声データであ
る電気信号を電気信号・音声変換手段により音声に変換
し、検索した音声を出力することができる。
実施例 以下、本発明の実施例について図面を参照しながら説明
する。
まず、本発明の第1の実施例について説明する。
第1図は本発明の第1の実施例における音声検索装置を
示すブロック図である。
第1図において、11は文章音声を電気信号に変換する
音声・電気信号変換手段、12は電気信号に変換された
音声データを保管する音声データ保管手段、13は上記
電気信号に変換された音声データの音素または音節を認
識し、かつ認識した各音素または音節の音声データにお
ける始端を出力する音素または音節認識部、14は音素
または音節認識部13から出力される各音素または音節
の音声データの始端を保管する音声データ始端保管手段
、16は音素または音節認識部13から出力される音素
または音節系列を保管する音素または音節系列保管手段
、16は検索を希望する単語、若しくは語句の音素また
は音節列を保管する検索単語・語句の音素または音節列
保管手段、17は音素または音節系列保管手段16から
の音素または音節系列と検索単語・語句の音素または音
節列保管手段16からの音素または音節とマツチングさ
せ、マツチングの尤度を計算するマツチング部、1Sは
予め設定した尤度閾値を保管する尤度閾値保管手段、1
9はマツチング部17で計算した尤度値と尤度閾値保管
手段18の尤度閾値とを比較し、尤度閾値を越える区間
を検出する比較手段、20は比較手段19で得た尤度閾
値を越えた文章音声の音素または音節系列の区間から音
声データ始端保管手段14の各音素または音節の音声デ
ータの始端位置により音声データ保管手段12に保管さ
れている音声データ中、尤度閾値を越えた位置を指し示
す音声データ再生始端ポインタ、21は音声データ再生
始端ポインタが指し示す音声データである電気信号を音
声に変換する電気信号・音声変換手段である。
以上のように構成された上記実施例の音声検索装置の動
作について説明する。
まず、文章音声を音声・電気信号変換手段11により電
気信号に変換し、この音声データを音声データ保管手段
12に保管すると共に、音素または音節認識部13に入
力する。音素または音節認識部13はその認識結果であ
る文章音声の音素または音節系列を文章音声音素または
音節系列保管手段16に保管すると共に、認識した各音
素または音節の音声データの始端位置を音素または音節
の音声データ始端保管手段14に保管する。次に、キー
ボード等により文字で入力した検索を希望する単語、若
しくは語句の音素または音節列を検索単語・語句の音素
または音節列保管手段16に保管する。文章音声音素ま
たは音節系列保管手段160文章音声の音素または音節
系列と検索単語・語句の音素または音節列保管手段16
の検索を希望する単語、若し、くは語句の音素または音
節列とをマツチング部17に入力し、文章音声の音素ま
たは音節系列中で検索を希望する単語、若しくは語句の
音素または音節列とのマツチングの尤度を計算する。こ
のマツチング尤度の計算結果と尤度閾値保管手段18に
おける予め設定しである尤度閾値を比較手段19に入力
し、尤度閾値な越える文章音声の音素または音節系列中
の区間を検出し、その区間の位置を出力する。音声デー
タ再生始端ポインタ20は検索結果区間の音素または音
節と音素または音節の音声データ始端保管手段14の音
声データの始端位置の入力により検索区間の文章音声デ
ータ保管手段12の中の文章音声データの位置を指し示
し、この位置からの音声データである電気信号を電気信
号・音声変換手段21に入力させる。これにより電気信
号・音声変換手段21から検索結果を音声として出力r
ることができる。
このように上記実施例によれば、文章音声の認識音素ま
たは音節系列と検索単語、若しくは語句の音素または音
節系列とからマツチングの手法を用いて文章音声中の単
語、若しくは語句を検索することにより、人間の手作業
を加えることなく、文章音声だけから単語、若しくは語
句等の検索を行うことができる。
次に、本発明の第2の実施例について説明する。
第2図は本発明の第2の実施例における音声検索装置を
示し、検索を希望する単語、若しくは語句を音声により
入力する部分のプロソク図である。
上記第1の実施例においては、検索を希望する単語、若
しくは語句の音素または音節列をキーボード等から文字
で入力して検索単語、若しくは語句の音素または音節列
保管手段16に保管するようにしているが、本実施例に
おいては、検索を希望する単語、若しくは語句を音声に
より入力して検索単語、若しくは語句の音素または音節
列保管手段1eに保管するようにしたものである。第2
図において、25は音声を電気信号に変換する音声・電
気信号変換手段、26は音声データの音素または音節を
認識する音素または音節認識部、16は検索単語・語句
の音素または音節列保管手段である。
以上の構成において、以下、その動作について説明する
検索を希望する単語、若しくは語句を音声で音声・電気
信号変換手段26に入力して音声データに変換する。そ
の音声データを音素または音節認識部26に入力し、そ
の認識結果である検索単語、若しくは語句の音素または
音節列を検索単語・語句の音素または音節列保管手段1
6に保管する。
検索単語・語句の音素または音節列保管手段16に保管
された検索を希望する単語、若しくは語句の音素または
音節列を用いて上記第1の実施例と同様の操作により検
索結果を音声として出力することができる。この場合、
キーボードで音素または音節を入力する必要がないので
、より操作性がよく、かつ速く検索単語、若しくは語句
を入力することができる。
なお、文章音声と検索単語、若しくは語句を同時に発声
することはないため、第2図におりる音声・電気信号変
換手段25と音素または音節認識部26は、第1図で示
した音声・電気信号変換手段11と音素または音節認識
部13と同じ機能のものを用いることができる。
発明の効果 以上述べたように本発明によれば、文章音声の認識音素
または音節系列と検索単語、若しくは語句の音素または
音節系列とからパターンマツチングの手法を用いて文章
音声中の単語、若しくは語句を検索するようにしている
ので、手作業を加えろことなく、文章音声だけから検索
を希望する単語、若しくは語句を検索することができる
【図面の簡単な説明】
第1図は本発明の第1の実施例における音声検索装置を
示すブロック図、第2図は本発明の第2の実施例におけ
る音声検索装置を示し、検索を希望する単語、若しくは
語句を音声により入力する部分のブロック図、第3図は
従来の音声検索装置を示すブロック図である。 11・・・音声・電気信号変換手段、12・・・音声デ
ータ保管手段、13・・・音素または音節認識部、14
・・・音声データ始端保管手段、16・・・音素または
音節系列保管手段、16・・・検索単語・語句の音素ま
たは音節列保管手段、17・・・マッチング部、18・
・・尤度閾値保管手段、19・・・比較手段、2Q・・
・音声データ再生始端ポインタ、21・・・電気信号・
音声変換手段、25・・・音声・電気信号変換手段、2
6・・・音素または音節認識部。

Claims (1)

    【特許請求の範囲】
  1. 文章音声を電気信号に変換する音声・電気信号変換手段
    と、電気信号に変換された音声データを保管する音声デ
    ータ保管手段と、上記電気信号に変換された音声データ
    の音素または音節を認識し、かつ認識した各音素または
    音節の音声データにおける始端を出力する音素または音
    節認識部と、この音素または音節認識部から出力される
    各音素または音節の音声データの始端を保管する始端保
    管手段と、上記音素または音節認識部から出力される音
    素または音節系列を保管する音素または音節系列保管手
    段と、検索を希望する単語、若しくは語句の音素または
    音節列を保管する検索単語、若しくは語句の音素または
    音節保管手段と、上記音素または音節系列保管手段から
    の音素または音節系列と上記検索単語、若しくは語句の
    音素または音節列保管手段からの音素または音節列とを
    マッチングさせ、マッチングの尤度を計算するマッチン
    グ部と、予め設定した尤度の閾値を保管する尤度閾値保
    管手段と、上記マッチング部で計算した尤度値と上記尤
    度閾値保管手段の尤度閾値とを比較し、尤度閾値を越え
    る区間を検出する比較手段と、この比較手段で得た尤度
    閾値を越えた文章音声の音素または音節系列の区間から
    上記始端保管手段の各音素または音節の音声データの始
    端位置により上記音声データ保管手段に保管されている
    音声データ中、尤度閾値を越えた位置を指し示す再生始
    端ポインタと、この再生始端ポインタ39が指し示す音
    声データである電気信号を音声に変換する電気信号・音
    声変換手段を具備した音声検索装置。
JP1169312A 1989-06-29 1989-06-29 音声検索装置 Expired - Fee Related JPH0769708B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1169312A JPH0769708B2 (ja) 1989-06-29 1989-06-29 音声検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1169312A JPH0769708B2 (ja) 1989-06-29 1989-06-29 音声検索装置

Publications (2)

Publication Number Publication Date
JPH0333798A true JPH0333798A (ja) 1991-02-14
JPH0769708B2 JPH0769708B2 (ja) 1995-07-31

Family

ID=15884203

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1169312A Expired - Fee Related JPH0769708B2 (ja) 1989-06-29 1989-06-29 音声検索装置

Country Status (1)

Country Link
JP (1) JPH0769708B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112509567A (zh) * 2020-12-25 2021-03-16 北京百度网讯科技有限公司 语音数据处理的方法、装置、设备、存储介质及程序产品

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112509567A (zh) * 2020-12-25 2021-03-16 北京百度网讯科技有限公司 语音数据处理的方法、装置、设备、存储介质及程序产品
CN112509567B (zh) * 2020-12-25 2024-05-10 阿波罗智联(北京)科技有限公司 语音数据处理的方法、装置、设备、存储介质及程序产品

Also Published As

Publication number Publication date
JPH0769708B2 (ja) 1995-07-31

Similar Documents

Publication Publication Date Title
US6067520A (en) System and method of recognizing continuous mandarin speech utilizing chinese hidden markou models
US20020184024A1 (en) Speech recognition for recognizing speaker-independent, continuous speech
US11062711B2 (en) Voice-controlled communication requests and responses
US8423354B2 (en) Speech recognition dictionary creating support device, computer readable medium storing processing program, and processing method
JPH0333798A (ja) 音声検索装置
JP2002278579A (ja) 音声データ検索装置
JPH10173769A (ja) 音声メッセージ検索装置
JPH0774960B2 (ja) テンプレ−ト連鎖モデルを使用するキ−ワ−ド認識方法およびシステム
KR890010791A (ko) 음성 신호 검색용 음성 인식 시스템
JP3727436B2 (ja) 音声原稿最適照合装置および方法
JP2980382B2 (ja) 話者適応音声認識方法および装置
JPH10232693A (ja) 音声認識装置
JP2008107641A (ja) 音声データ検索装置
JPH06338946A (ja) ボイスメール端末
JP3503862B2 (ja) 音声認識方法及び音声認識プログラムを格納した記録媒体
JPH0384600A (ja) 音声認識装置
JPH0313598B2 (ja)
JP3033132B2 (ja) 言語処理装置
JPH09212190A (ja) 音声認識装置及び文認識装置
KR200208810Y1 (ko) 음성 인식 기술을 이용한 지능형 정보 검색 시스템
JPS6240497A (ja) 音声パタ−ン分類方式
JPH0449719B2 (ja)
D'Orta Acoustic discrimination among words based on distance measures.
JPS63173100A (ja) キ−ワ−ド抽出装置
JPS62180461A (ja) 音声入力かな漢字変換装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees