JPH0233200A - データベース検索方式 - Google Patents

データベース検索方式

Info

Publication number
JPH0233200A
JPH0233200A JP63182924A JP18292488A JPH0233200A JP H0233200 A JPH0233200 A JP H0233200A JP 63182924 A JP63182924 A JP 63182924A JP 18292488 A JP18292488 A JP 18292488A JP H0233200 A JPH0233200 A JP H0233200A
Authority
JP
Japan
Prior art keywords
data
word
keyword
section
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63182924A
Other languages
English (en)
Inventor
Hirotoshi Ookawa
大川 裕利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP63182924A priority Critical patent/JPH0233200A/ja
Publication of JPH0233200A publication Critical patent/JPH0233200A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] この発明はデーターベースを検索する検索方式に間し、
特に各データにデータの内容を簡単に表す音声の見出し
が1寸いたデータベースの検索方式%式% [従来の技術] 第7図は、従来のこの種の検索方式を採用したデータベ
ース検索装置の構成を示すブロック図である、この第7
図において、1は音声入力用マイクロフォン、2はマイ
クロフォン1からの音声信号をデジタル信号に変換する
アナログ/デジタル変換部、3及び8は見出しの登録と
キーワードの入力を切り替えるスイッチ、6は見出しを
蓄積する見出しファイル、7はアナログ/デジタル変換
部2からのデジタル信号に基づいて音響を分析する音響
分析部、13は見出しを音響分析した結果の特徴データ
を蓄積する見出し分析ファイル、18は入力したキーワ
ードを音響分析した結果の特徴データを蓄積するキーワ
ード分析ファイル、20は見出し分析ファイル13に含
まれている特徴データ上でキーワード分析ファイル18
の特徴データをマツチングさせるキーワードスボッティ
〉′グ部、21はそのマツチング結果を蓄積する認識結
果ファイル、22は認識結果ファイル21を見て見出し
ファイル6から検索した見出しを引き出す見出し引出部
、24は見出し引出部22からのデジタル信号をアナロ
グ信号に変換するデジタル/アナログ変換部、25は検
索した見出しを出力するスピーカ、26は音声や画像等
様々な形態のデータを含み見出しに対して本文に相当す
るデータを含んだ本データファイル、27はその本デー
タを引き出す本データ引出部、28はスピーカやグラフ
ィックデイスプレィ等に対する音声や画像等の様々な形
態の本データに対応して信号を出力できるいくつかの出
力装置を含んだ各種出力装置部である。
第5図は、第7図のキーワード分析ファイル18に蓄積
されている特徴データのイメージを描いたもので、例え
ば「データショー」というキーワードに対して音響分析
部7が分析方法として例えば音声のスペクトル包絡の時
間変化を用いている場合について示したものである。実
際に1つのデー・夕がとるデータ構造は、第5図で一定
間隔をおいて周波数方向にn個、時間方向にm個のデー
タがサンプリングされ、第6図に示すようにmXnのデ
ータマトリクスとなる。見出し分析ファイル13も第6
図と同じで、第8図のような構成をとるがキーワード分
析ファイル18の対象が単語であるのに対して見出し分
析ファイル13は文章を対象とするため時間方向の1が
mに比べて非常に大きくなる。またキーワード分析ファ
イル18が検索する対象であるキーワードでデータの個
数が1個または多くても数個に限られているのに対して
、見出し分析ファイル13は検索される対象であり、デ
ータの個数は非常に多い。
次に動作について説明する。
スイッチ3.8は、見出しを登録する時はa側に、検索
する時はb側に切り替えられるものとする。まず見出し
を登録する時は、マイクロフォン1を使って連続音声と
して入力された音声はアナログ/デジタル変換部2でア
ナログ信号がデジタル信号に変換され、a側になってい
るスイッチ3を通して見出しファイル6に蓄積される。
また同時に音響分析部7で分析され、ここで抽出された
特徴データは、a側になっているスイッチ8を通して見
出し分析ファイル13に蓄積される。
また見出しを検索する時は、マイクロフォン′1を使っ
て入力されたキーワードの音声はアナログ/デジタル変
換部2で変換され、b側になっているスイッチ3では、
それより先に流れず、音響分析部7で分析されて、ここ
で抽出された特徴データがb側になっているスイッチ8
を通してキーワード分析ファイル18に出力される0次
にキーワードスポツティング部20は、見出し分析ファ
イル13に含まれている特徴データ上でキーワード分析
ファイル18の特徴データをマツチングさせる。すなわ
ち第6図のようなデータを第8図のデータ上で時間方向
に伸縮性をもたせながら、ずらしていき距離的に近い場
所があれば、そこにキーワードがあるとして認識結果フ
ァイル21に出力する。さらに見出し引出部22で認識
結果ファイル21を見て、見出しファイル6から対応す
る見出しを引き出し、デジタル/アナログ変換部24で
デジタル信号をアナログ信号に変換して、スピーカ25
から出力する。またその後本データ引出部27でも、認
識結果ファイル21の認識結果を見て26の本データフ
ァイル26から見出しに対する音声や画像等に本データ
を引き出し、各種出力装置部28へ送り、データの形態
に合った装置で出力する。
[発明が解決しようとする課題] 従来の音声の見出しを使ったデータベース検索方式は以
上のように構成されているので、見出しがアナログ信号
から変換されたデジタル信号のままで蓄積し、また特徴
データをすべて蓄積するため、多くの記憶領域を必要と
し、さらに見出しとキーワードとを分析した特徴データ
同志をマツチングさせるため、演算量が多くなる等の問
題点があった。
この発明は上5記のような問題点を解消するためになさ
れたもので、蓄積される音声の見出し及び特徴データに
必要な記憶領域を少なくでき、かつキーワードの検索の
ために使われる見出しの特徴データとキーワードの特徴
データとのマツチングの演算量を少なくできるデータベ
ース検索方式を提供することを目的とする。
[課題を解決するための手段] この発明に係るデータベース検索方式は、入力された音
声の見出しを音響分析部7で分析して得られた見出しの
特徴を示す特徴データを音韻認識部9に与え、その特徴
データに基づいて見出しの音声に含まれている音韻ラテ
ィスを認識し、単語区間検出部10で見出しから単語ら
しい区間を検出し、その単語区間の音韻ラテ仁スを単語
区間音韻ラティスファイル11に保持し、見出し全体は
圧縮符号化部4で圧縮符号化して見出し圧縮ファイル5
に保持し、データベースの検索では、先ずキーワード仮
説部16において音韻シンボルで入力されたキーワード
と上記単語区間音韻ラティスファイル11に保持された
単語区間の音韻ラティスとを比較してキーワードの存在
の候補をたて。
次にキーワード検定部19でこの候ttliにk・1し
て音声で入力されたキーワードの分析結果と単語らしい
区切りに分けられた特徴データとを比較してキーワード
の存在を検定し、見出し複号fヒ部23でそのキーワー
ドに対応する上記見出し圧縮ファイル5からの音声の見
出しを複号して出力すると共に、本データ引出部27で
付随する音声、画は、文字列等の様々な形態のデータを
取り出して出力することを特徴とするものである。
[作用] この発明のデータベース検索方式において、入力された
音声の見出しは音響分析部7により分析され、特徴デー
タを得る。音韻認識部9は、その特徴データに基づいて
音韻ラティスを認識する。
単語区間検出部10は見出しから単語らしい区間を検出
し、その単語区間の音韻ラティスを単語区間音韻ラティ
スファイル11に保持する。圧縮符号化部4は見出し全
体を圧縮符号化し、見出し圧縮ファイル5に保持する。
このような処理が行われ、データベースの検索を開始す
ると、キーワード仮説部16では音韻シンボルで入力さ
れたキーワードと単語区間音韻ラティスファイル11に
保持された単語区間の音韻ラティスとを比較してキーワ
ードの存在の候補をたてる9次にキーワード検定部19
では、その候補に対して音声で入力されたキーワードの
分析結果と単語らしい区切りに分けられた特徴データと
を比較してキーワードの存在を検定する。その後、見出
し複号化部23ではそのキーワードに対応する見出し圧
縮ファイル5からの音声の見出しを複号して出力し、本
データ引出部27では付随する音声、画像、文字列等の
様々な形態のデータを取り出し、出力する。
[発明の実施例] 第1図はこの発明の一実施例に係るデータベース検索方
式を採用したデータベース検索装置の構成を示すブロッ
ク図である。第1図において、1は音声入力用マイクロ
フォン、2はアナログ/デジタル変換部、3及び8は見
出しの登録とキーワ−4の入力を切り替えるスイッチ、
4は見出しの音声データを圧縮して符号化する圧縮符号
(ヒ部、5は圧縮符号化部4で圧縮符号化された見出し
を蓄積する見出し圧縮ファイル、7は音響分析部、9は
入力された見出しの音声データに含まれている音韻を認
識する音韻認識部、10は同じく見出しの音声データか
ら単語らしい区間を検出する単語区間検出部、11は音
韻認識部9の音韻認識の結果を単語区間検出部10で検
出された単語区間の検出部分に分けて蓄積する単語区間
音韻ラティスファイル、12は音響分析部7の音響分析
の結果を単語区間検出部10で検出された単語区間の検
出部分に分けて蓄積する単語区間分析ファイル。
14はキーワードを音韻シンボルで入力するキーボード
、15は入力された音韻シンボルを格納するキーワード
シンボルファイル、16はキーワードの音韻シンボルを
単語区間音韻ラティスファイルll上でマツチングさせ
キーワードの存在する位置の候補を見つけるキーワード
仮説部、17はキーワード仮説部16の結果を出力する
仮説結果ファイル、18は音声で入力したキーワードを
分析した結果の特徴データを蓄積するキーワード分析フ
ァイル、19は仮説結果ファイル17の仮説結果につい
て特徴データのレベルでキーワードの存在を検定するキ
ーワード検定部、21はその検定結果を格納する認識結
果ファイル、22は認識結果ファイル21を見て見出し
圧縮ファイル5から検索した見出しの圧縮符号化データ
を引き出す見出し引出部、23は見出し引出部22で引
き出した圧縮符号化データを複号化し、アナログ信号に
変換する見出し複号化部、25は検索した見出しを出力
するスピーカ、26は音声、画像等様々な形態のデータ
を含み見出しに対して本文に相当するデータを含んだ本
データファイル、27は本データ引出部、28はスピー
カやグラフィックデイスプレィ等に対する音声や画像等
の様々な形態の本データに対応して出力できるいくつか
の出力装置を含んだ各種出力装置部である。
第2図は第1図の単語区間音韻ラティスファイル11に
含まれている1つのデータのデータ構造を示している0
図で1つの要素axyはく音韻シンボル、音韻スコア)
という組からなっている。
音韻シンボルとは、母音/a/、/i/、・・・子音/
p/、/s/、・・・等の音韻のシンボルであり、音韻
スコアとは音韻認識部9で得られ、認識した音韻の確か
らしさを表わす数値である。第2図はpxqのマトリク
スになっており、ここでpは音韻スコアの高いものp個
、すなわち音韻認識の結果信頼度の高いものから順にp
個選んだことを表し、固定値であり、qは単語区間の時
間幅を表わし、データにより異なる。
第3図は第1図の単語区間分析ファイル12に含まれて
いる1つのデータのデータ構造を示している。図で1つ
の要素b8yは音響分析部7で分析された結果の特徴デ
ータの数値である。第3図は1’l > qのマトリク
スになっており、こ二でl’lは−・定時間長のデータ
を分析した特徴データの個数で固定値であり、qは第2
図と同様に単語区間の時間幅を表わし、データにより異
なる。
第4図は第1図のキーワードシンボルファイル15に含
まれているデータの例を示している。図では例えば「デ
ータショー」 「学会」という単語がキーワードとして
音韻シンボルになって入っている。
第5図は第1図のキーワード分析ファイル18に蓄積さ
れている特徴データのイメージを描いたもので「データ
ショー」というキーワードに対して音響分析部7が分析
方法として例えば音声のスペクトル包絡の時間変化を用
いている場合について示したものである。実際のデータ
構造は第5図で一定間隔をおいて周波数方向にn個、時
間方向に出涸のデータがサンプリングされ、第6図に示
すように、mxnのデータマトリクスが構成される。音
響分析部7が共通であるため、キーワード分析ファイル
18と単語区間分析ファイル1zとに含まれる特徴デー
タは同質のものであり、従って第3図と第6図のマトリ
クスにおける行数11は同一である。
次に動作について説明する。
スイッチ3.8は見出しを登録する時はa側に、検索す
る時はb側に切り替えるものとする。まず見出しを登録
する時はマイクロフォン1を1吏って連続音声として入
力された音声は、a側になっているスイッチ3を通して
圧縮符号化部4に送られる。音響分析を目的とする時、
周波数帯域を5kH,程度までとることが必要で、その
なめには入力音声を1秒間に10に個の割合で標本1ヒ
しなければならない、また取り出したアナログ(8号の
量子化には12ビット程度必要で、アナログ/デジタル
変換部2はこのような条件を満たずようになっている。
従って、アナログ/デジタル変換部2を通した音声デー
タは120kbps (kビット27秒)である、圧縮
符号化部4は、これと異なり認識に影響する音響分析と
は無関係に複号化して、人間が聞いた時に充分な了解性
が得られるADPCM(適応差分PCM)等の手法を用
いて音声データを32kbps程度に圧縮符号化する。
圧縮符号化部4で圧縮符号化された見出しの音声データ
は、見出し圧縮ファイル5に蓄積される。
また、同時に入力された見出しの音声データは、認識用
の音響分析に向けて、まずアナログ/デジタル変換部2
でアナログ信号がデジタル信号に変換され、音響分析部
7で分析される。ここで抽出された特徴データはa側に
なっているスイッチ8を通って音韻認識部9、単語区間
検出部10に送られる。音韻認識部9での音韻認識の結
果の音韻ラティスから単語区間検出部10での単語区間
の検出による区切りの部分を取り出すことで第2図に示
したデータが得られ、単語区間音韻ラティス11に蓄積
される。また音響分析の結果の特徴データから、同じく
単語区間検出部1oでの単語区間の検出による区切りの
部分を取り出すことで、第3図に示したデータが得られ
、;=力単語区間分析ファイル12に蓄積される。
また見出しを検索する時はまずキーボード14からキー
ワードを音韻シンボルで入力し、第4図に示したように
参≠臨キーワードシンボルファイ、ル】5に蓄積する0
次にマイクロフォン1を使ってキーワードを音声で入力
する、入力された音声データは、b側になっているスイ
ッチ3ではそれより先に流れず、アナログ/デジタル変
換部2で変換され、音響分析部7で分析される。ここで
抽出された特徴データはb側になっているスイッチ8を
通して第6図に示したようにキーワード分析ファイル1
8に蓄積される。キーワードのスポツティングはまずキ
ーワード仮説部16で音韻シンボルのレベルでキーワー
ドと単語部分が切り出された音声の見出しとをマツチン
グさせ、キーワードの存在しそうな場所の仮説をたてる
9すなわち第4図のデータと、第2図の各データの内の
音韻シンボルをマツチングさせ、第2図で対応する音韻
スコアの累積値が充分大きければ、キーワードの存在の
候補として仮説結果ファイル17に出力する。次にキー
ワード検定部19では、仮説結果ファイル仮説結果を見
て対応する単語区間分析ファイル12内のデータと、キ
ーワード分析ファイル18のデータとを比較する。すな
わちキーワード検定部19は、仮説結果をもとに、対応
する第3図の形のデータと第6図の形のデータとを比較
し、距離的に充分近ければキーワードがそこに存在した
として、認識結果ファイル21にそのキーワードを出力
する。さらに見出し引出部22で認識結果ファイル21
を見て、見出し圧縮ファイル5から対応する圧縮符号化
された見出しを引き出し、見出し複号化部23で複号化
してアナログ信号に変換して、スピーカ25から出力す
る。また、その後本データ引出部27でも認識結果ファ
イル21の認識結果を見て、本データファイル26から
見出しに対する音声や画像等の本データを引き出し、各
種出力装置部28へ送り、データの形態に合った装置で
出力する。
[発明の効果] 以上にように本発明によれば、音声の見出しを圧縮符号
化して蓄積すると共に、見出しから単語らしい部分を切
り出した区切りの特徴データのみを蓄積し、更に見出し
とキーワードとをそれぞれの特徴データで比較する前に
音韻シンボルでマツチングし、キーワードの存在1項域
の仮説をたてるようにしたので、蓄積される音声の見出
し及び特徴データに必要な記憶領域が少なくなり、また
、キーワードの検索のために使われる見出しの特徴デー
タとキーワードの特徴データとの比較場所が減少し、そ
れらのマツチングの演算景が少なくなり、したがって検
索精度の高いデータベース検索装置を提供できるという
効果が得られる。
【図面の簡単な説明】
第1図はこの発明の一実施例に係るデータベース検索方
式を採用したデータベース検索装置の構成を示すブロッ
ク図、第2図は第1図の単j5区間音韻ラティスファイ
ルのデータ構成を示す図、第3図は第1図の単語区間分
析ファイルのデータ構成を示す図、第4図は第1図のキ
ーワードシンボルファイルに含まれているデータの例を
示す図、第5図は第1図のキーワード分析ファイルに含
まれている特徴データのイメージを表わす図、第6図は
第10のキーワード分析ファイルのデータ構成を示す図
、第7図は従来のデータベース検索方式を採用したデー
タベース検索装置の構成を示すブロック図、第8図は第
7図の見出し分析ファイルのデータ構成を示す図である
。 4・・・・・・圧縮符号化部、7・・・・・・音響分析
部、9・・・・・・音韻認識部、10・・・・・・単語
区間検出部、16・・・・・・キーワード仮説部、19
・・・・・・キーワード検定部、23・・・・・・見出
し複号化部、27・・・・・・本データ引出部。

Claims (1)

    【特許請求の範囲】
  1.  音声、画像、文字列等の様々な形態のデータ含み、各
    データにデータの内容を簡単に表わす音声の見出しが付
    いたデータベースに対してキーワードを入力し、音声の
    見出しの中で入力したキーワードを検索することで処理
    に必要なデータを検索するデータベース検索方式におい
    て、入力された音声の見出しを音響分析部で分析して得
    られた見出しの特徴を示す特徴データを音韻認識部に与
    え、その特徴データに基づいて見出しの音声に含まれて
    いる音韻ラティスを認識し、単語区間検出部で見出しか
    ら単語らしい区間を検出し、その単語区間の音韻ラティ
    スを単語区間音韻ラティスファイルに保持し、見出し全
    体は圧縮符号化部で圧縮符号化して見出し圧縮ファイル
    に保持し、データベースの検索では、先ずキーワード仮
    説部において音韻シンボルで入力されたキーワードと上
    記単語区間音韻ラティスファイルに保持された単語区間
    の音韻ラティスとを比較してキーワードの存在の候補を
    たて、次にキーワード検定部でこの候補に対して音声で
    入力されたキーワードの分析結果と単語らしい区切りに
    分けられた特徴データとを比較してキーワードの存在を
    検定し、見出し複号化部でそのキーワードに対応する上
    記見出し圧縮ファイルからの音声の見出しを複号して出
    力すると共に本データ引出部で付随する音声、画像、文
    字列等の様々な形態のデータを取り出して出力すること
    を特徴とするデータベース検索方式。
JP63182924A 1988-07-22 1988-07-22 データベース検索方式 Pending JPH0233200A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63182924A JPH0233200A (ja) 1988-07-22 1988-07-22 データベース検索方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63182924A JPH0233200A (ja) 1988-07-22 1988-07-22 データベース検索方式

Publications (1)

Publication Number Publication Date
JPH0233200A true JPH0233200A (ja) 1990-02-02

Family

ID=16126757

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63182924A Pending JPH0233200A (ja) 1988-07-22 1988-07-22 データベース検索方式

Country Status (1)

Country Link
JP (1) JPH0233200A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002175304A (ja) * 1998-12-17 2002-06-21 Matsushita Electric Ind Co Ltd 映像検索装置及びその方法
JP2002539528A (ja) * 1999-03-05 2002-11-19 キヤノン株式会社 データベース注釈付け及び検索
JP2007322758A (ja) * 2006-06-01 2007-12-13 Nissan Motor Co Ltd キーワード選択方法、音声認識方法、キーワード選択システム、およびキーワード選択装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002175304A (ja) * 1998-12-17 2002-06-21 Matsushita Electric Ind Co Ltd 映像検索装置及びその方法
JP2002539528A (ja) * 1999-03-05 2002-11-19 キヤノン株式会社 データベース注釈付け及び検索
JP2007322758A (ja) * 2006-06-01 2007-12-13 Nissan Motor Co Ltd キーワード選択方法、音声認識方法、キーワード選択システム、およびキーワード選択装置

Similar Documents

Publication Publication Date Title
US11037553B2 (en) Learning-type interactive device
US8209171B2 (en) Methods and apparatus relating to searching of spoken audio data
JP4906379B2 (ja) 音声認識装置、音声認識方法、及びコンピュータプログラム
TWI427620B (zh) A speech recognition result correction device and a speech recognition result correction method, and a speech recognition result correction system
JPS63259697A (ja) 音声認識方法
JP5824829B2 (ja) 音声認識装置、音声認識方法及び音声認識プログラム
US4769844A (en) Voice recognition system having a check scheme for registration of reference data
CN101415259A (zh) 嵌入式设备上基于双语语音查询的信息检索系统及方法
JP2004133880A (ja) インデックス付き文書のデータベースとで使用される音声認識器のための動的語彙を構成する方法
CN103123644B (zh) 声音数据检索系统及用于该系统的程序
US8423354B2 (en) Speech recognition dictionary creating support device, computer readable medium storing processing program, and processing method
JPH10274996A (ja) 音声認識装置
JPH0233200A (ja) データベース検索方式
KR20040061070A (ko) 음성인식시스템에서의 음성인식장치 및 그 방법
EP0177854B1 (en) Keyword recognition system using template-concatenation model
US4783808A (en) Connected word recognition enrollment method
JP2813209B2 (ja) 大語彙音声認識装置
JP2004309928A (ja) 音声認識装置、電子辞書装置、音声認識方法、検索方法、及びプログラム
JP3033132B2 (ja) 言語処理装置
JP3039453B2 (ja) 音声認識装置
JP2008107641A (ja) 音声データ検索装置
KR100930248B1 (ko) 소리로부터 얻은 정보를 이용하여 인터넷을 검색하는 장치및 그 방법
JPH02124600A (ja) 音声認識装置
EP1856628A2 (en) Methods and arrangements for enhancing machine processable text information
JP2003345383A (ja) 音声認識装置、音声認識方法および音声認識プログラム