JP3903738B2

JP3903738B2 - 情報記録・検索装置、方法、プログラム、および記録媒体

Info

Publication number: JP3903738B2
Application number: JP2001153472A
Authority: JP
Inventors: 聡中澤; 研治佐藤; 明俊奥村
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2001-05-23
Filing date: 2001-05-23
Publication date: 2007-04-11
Anticipated expiration: 2021-05-23
Also published as: JP2002351893A

Description

【０００１】
【発明の属する技術分野】
本発明は、映像データや音声データのようなマルチメディアデータを記録し、必要に応じて検索する装置、方法および記録媒体に係り、特に、複数の音声認識パラメータを用いて、検索用インデックスを多重に作成して検索に利用する情報記録・検索装置、方法、プログラム、および記録媒体に関する。
【０００２】
【従来の技術】
ＴＶ放送のニュース番組や、大学等での講義の映像記録、会議の映像記録などのマルチメディアデータをデータベースに記録し、検索可能とするには、各データから検索用の何らかのインデックスを作成する必要がある。
【０００３】
従来は、こうしたデータに対して、タイトル、日付、出演者、講演者などの情報を人手で付与し、インデックスとする手法が取られてきた。ただし、例えば講義の映像記録などにおいて、ある内容が講義全体のどの部分で話されたかなどを検索するためには、検索したい項目がどのデータに含まれているかという情報だけでなく、どのデータの何分何秒目にあるというマーカ情報もインデックスとして必要となる。こうしたマーカ情報も人手で作成することができるが、それには多くの労力を要する。
【０００４】
例えば、特開２０００−７８５３０号公報には、音声認識技術を用いて、こうしたマーカ情報も自動的に作成する技術が開示されている。特開２０００−７８５３０号公報の技術においては、映像／音声データに含まれているキーワードを音声認識することにより、元の映像／音声データに関連づけされたインデックスが作成され、検索時に利用される（第１の従来技術）。
【０００５】
インデックス作成とは関係なく、単に音声認識率を高めるための技術としては、例えば、特開昭６１−７０５９４号公報に示すようなものがある。特開昭６１−７０５９４号公報に記載の技術では、話者の性別、年齢等の各種特性に応じた音声認識用の標準パターンを用意しておき、最初に、話者に認識率の高い特定語を発話してもらうことによって、その話者がどの標準パターンに適しているか選択し、以後の発話は選択された標準パターンのみを用いて音声認識を行う（第２の従来技術）。
【０００６】
【発明が解決しようとする課題】
前述のように、マルチメディアデータに対して、データの内容に関わる検索まで行う場合には、検索目的を表すキーワード等が、どのデータのどの部分に使われている、といった詳細なインデックスが必要になる。
【０００７】
しかしながら、上記第１の従来技術には以下に掲げる問題点があった。まず第１の問題点は、映像データ等に付随している音声データ、あるいは音声データそのものから、音声認識を用いてインデックスを作成する場合、人間の労力は大きく削減されるが、代わりに音声認識による認識誤りの問題を考慮しなければならないということである。そして第２の問題点は、音声認識誤りから、あるキーワードが使われているマルチメディアデータとそのキーワード出現時間を検索したときに、そのキーワードが全く使用されていないデータが出力されたり、本来目的とするキーワードが含まれているにも拘わらず検索されないといった問題点もあった。
【０００８】
一方、マルチメディアデータは通常その制作現場で同時にデータベースに記録されるとは限らず、ニュース放送や公演の様子等を一旦ビデオテープなどに記録し、後にデータベースに保存することが一般的である。しかしながら、上記第２の従来技術には、マルチメディアデータを記録し、検索用のインデックスを作成する際に、各データ中で発声している話者を呼んできて、認識率の高い特定語を発話してもらうことは現実的ではないという問題点があった。
【０００９】
本発明は斯かる問題点を鑑みてなされたものであり、その目的とするところは、マルチメディアデータを記録し、検索用のインデックスを作成する際に、複数の音声認識用パラメータを用いて音声認識を行うことで、マルチメディアデータを自動的に記録し、精度の良い検索を可能とする情報記録・検索装置、方法、プログラム、および記録媒体を提供する点にある。
【００１０】
本発明の他の目的は、事前に音声認識率の高い音声認識パラメータを選択するのではなく、検索時に複数の音声認識パラメータから得られた多重インデックスに関する情報を優先度付けに利用することで、効率の良い検索を可能とする情報記録・検索装置、方法、プログラム、および記録媒体を提供することである。
【００１１】
【課題を解決するための手段】
この発明の請求項１に記載の発明の要旨は、音声認識処理を複数の異なる条件で実行し検索インデックスを多重に作成する多重音声認識部と、当該作成した多重の検索インデックスを用いて検索を行うデータベース多重検索部とを備えた情報記録・検索装置であって、検索を行う際に、検索条件を充足するために使用された複数の異なる音声認識処理の前記条件の数の多寡に応じて、各検索結果の優先度を調整する音声認識パラメータ優先度付け装置を備えたことを特徴とする情報記録・検索装置に存する。
また、この発明の請求項２に記載の発明の要旨は、音声認識処理を複数の異なる条件で実行し検索インデックスを多重に作成する多重音声認識部と、当該作成した多重の検索インデックスを用いて検索を行うデータベース多重検索部とを備えた情報記録・検索装置であって、検索を行う際に、検索対象となる各データに付随している情報、または、各データの画像解析結果に応じて、各検索結果の優先度を調整する音声認識パラメータ優先度付け装置を備えたことを特徴とする情報記録・検索装置に存する。
また、この発明の請求項３に記載の発明の要旨は、音声認識処理を複数の異なる条件で実行し検索インデックスを多重に作成する多重音声認識ステップと、当該作成した多重の検索インデックスを用いて検索を行うデータベース多重検索ステップとを備えた情報記録・検索方法であって、検索を行う際に、検索条件を充足するために使用された複数の異なる音声認識処理の前記条件の数の多寡に応じて、各検索結果の優先度を調整する音声認識パラメータ優先度付けステップを備えたことを特徴とする情報記録・検索方法に存する。
また、この発明の請求項４に記載の発明の要旨は、音声認識処理を複数の異なる条件で実行し検索インデックスを多重に作成する多重音声認識ステップと、当該作成した多重の検索インデックスを用いて検索を行うデータベース多重検索ステップとを備えた報記録・検索方法であって、検索を行う際に、検索対象となる各データに付随している情報、または、各データの画像解析結果に応じて、各検索結果の優先度を調整する音声認識パラメータ優先度付けステップを備えたことを特徴とする情報記録・検索方法に存する。
また、この発明の請求項５に記載の発明の要旨は、コンピュータを、音声認識処理を複数の異なる条件で実行し検索インデックスを多重に作成する多重音声認識手段と、当該作成した多重の検索インデックスを用いて検索を行うデータベース多重検索手段として機能させる情報記録・検索プログラムであって、検索を行う際に、検索条件を充足するために使用された複数の異なる音声認識処理の前記条件の数の多寡に応じて、各検索結果の優先度を調整する音声認識パラメータ優先度付け手段として、前記コンピュータをさらに機能させることを特徴とする情報記録・検索プログラムに存する。
また、この発明の請求項６に記載の発明の要旨は、コンピュータを、音声認識処理を複数の異なる条件で実行し検索インデックスを多重に作成する多重音声認識手段と、当該作成した多重の検索インデックスを用いて検索を行うデータベース多重検索手段として機能させる情報記録・検索プログラムであって、検索を行う際に、検索対象となる各データに付随している情報、または、各データの画像解析結果に応じて、各検索結果の優先度を調整する音声認識パラメータ優先度付け手段として、前記コンピュータを機能させることを特徴とする情報記録・検索プログラムに存する。
【００１２】
【発明の実施の形態】
この出願の第１の発明は、マルチメディアデータを記録する際のデータの入り口となるマルチメディアデータ入力装置と、入力されたマルチメディアデータから検索用のインデックスを作成し、データベースに記録する制御を行うデータ記録装置と、入力されたマルチメディアデータを実際に蓄積するマルチメディアデータベースと、作成されたインデックスを記録する多重インデックス記録部と、検索の際に利用者の検索要求を入力する検索要求入力装置と、検索要求に従ってデータベースにアクセスし必要なデータと可能ならばデータ中の要求に該当する部分を検索するデータ検索装置と、検索結果を利用者に提示する検索結果出力装置を有する。
【００１３】
上記データ記録装置は、入力されたマルチメディアデータから音声認識をかける音声データを抽出する音声データ抽出部と、抽出された音声データに対して複数の音声認識パラメータを用いて多重に音声認識を実行する多重音声認識部と、多重に実行する音声認識のパラメータを記憶する音声認識パラメータ記憶部と、多重に実行された音声認識結果をパラメータ毎に元のデータと同期をとってインデックスを作成するデータ・インデックス同期処理部とを有する。
【００１４】
上記データ検索装置は、入力された検索要求を実際のデータベースに与える検索要求文に変換する検索要求整形装置と、検索要求文からマルチメディアデータベースおよび多重インデックス記録部をアクセスして、該当するデータを取得するデータベース多重検索部とを有する。
【００１５】
このような構成を採用し、インデックス作成時には多重に音声認識をかけ、検索時にはそれに応じた検索を行うことにより、本発明のマルチメディアデータを記録し、検索用のインデックスを作成する際に、複数の音声認識用パラメータを用いて音声認識を行うことで、マルチメディアデータを自動的に記録し、精度の良い検索を可能とするという目的を達成できる。
【００１６】
この出願の第２の発明は、上記第１の発明の構成に加えて、出演者等の付随情報や、画像情報などから、各データに適した音声認識パラメータを優先度付けし、検索結果の優先度を再計算する音声認識パラメータ優先度付け装置（後述する図７の８）を有する。このような構成を採用し、優先度付けした検索結果を利用者に提示することで、本発明の事前に音声認識率の高い音声認識パラメータを選択するのではなく、検索時に複数の音声認識パラメータから得られた多重インデックスに関する情報を優先度付けに利用することで、効率の良い検索を可能とするような目的を達成することができる。以下、本発明の各種実施の形態を図面に基づいて詳細に説明する。
【００１７】
（第１の実施の形態）
以下、本発明の第１の実施の形態を図面に基づいて詳細に説明する。図１は本発明の第１の実施の形態に係る情報記録・検索装置の構成を示すブロック図である。図１において、１はマルチメディアデータ入力装置、２はデータ記録装置、３はマルチメディアデータベース、４は多重インデックス記録部、５は検索要求入力装置、６はデータ検索装置、７は検索結果出力装置、２１は音声データ抽出部、２２は多重音声認識部、２３はデータ・インデックス同期処理部、２４は音声認識パラメータ記憶部、６１は検索要求整形装置、６２はデータベース多重検索部を示している。
【００１８】
図１を参照すると、本発明の第１の実施の形態に係る情報記録・検索装置は、ビデオテープや音楽テープ、あるいはデジタル情報として記録されたＭＰＥＧファイル等のマルチメディアデータを受け付けるマルチメディアデータ入力装置１と、プログラム制御により動作するデータ記録装置２と、入力されたマルチメディアデータを蓄積するマルチメディアデータベース３と、蓄積されたデータに対応するインデックスを記録する多重インデックス記録部４と、キーボードやネットワーク上から利用者の検索要求を受け付ける検索要求入力装置５と、プログラム制御によりデータベースにアクセスし検索要求に該当するデータを検索するデータ検索装置６と、ディスプレイやネットワークで接続された他の情報検索装置などに検索結果を出力する検索結果出力装置７とからなる。
【００１９】
データ記録装置２は、音声データ抽出部２１と、多重音声認識部２２と、データ・インデックス同期処理部２３と、音声認識パラメータ記憶部２４とを備えている。
【００２０】
音声データ抽出部２１では、マルチメディアデータ入力装置１に入力されたマルチメディアデータ毎に合わせたフィルタ処理を行うことにより、多重音声認識部２２で施される音声認識処理が可能となるよう音声データを抽出・整形する。
【００２１】
多重音声認識部２２では、音声データ抽出部２１で抽出された音声データに対して、音声認識パラメータ記憶部２４で記憶されている音声認識パラメータの数だけ、音声認識処理を実行する。音声認識処理は音声認識パラメータ数だけ繰り返し行っても良いし、認識エンジンを複数個用意し一度に並列に行っても良い。得られた認識結果はどのパラメータを用いたものか分かるようラベル付けする。また各認識結果がデータの先頭を基準にしてどの時点で得られたものなのかという時間情報もラベル付けする。
【００２２】
データ・インデックス同期処理部２３では、多重音声認識部２２で得られた認識結果に対して、形態素解析等の検索インデックスに適した前処理をかけた後、元のマルチメディアデータ名、マルチメディアデータに最初から付随してきた日付などの情報、認識された語句、その語句が認識された時間情報を組にして、使用された音声認識パラメータ毎にまとめ、あとの検索時に利用できるような多重の検索インデックスとする。
【００２３】
音声認識パラメータ記憶部２４では、多重音声認識部２２で実行される音声認識の音声認識パラメータを記憶する。ここでいう音声認識パラメータには、老若男女毎に調整された音響モデル、特定の訛りに合わせて調整された音響モデル、特定の話者毎に調整された話者モデル、さらには認識対象とする音声の特定の分野への偏りに合わせて調整された言語モデルなど、一般の音声認識手法で利用される様々なパラメータが含まれる。また音声認識手法自体も特定のものに固定されている必要がなく、複数の相異なる認識手法を用いて良い。そうした手法自体の違いも含めて、本発明では音声認識パラメータと表現する。
【００２４】
マルチメディアデータベース３と多重インデックス記録部４は、マルチメディアデータ入力装置１で入力されたマルチメディアデータを蓄積するデータベースである。蓄積する１つのデータに対するインデックスを音声認識パラメータ毎に多重に持つ点が通常のデータベースと異なるが、それ以外は、一般のマルチメディアデータベースシステムと変わらない。インデックスに含まれている各項目に対して条件付き検索が可能である。データベース自体に関する技術は、本発明の対象とするところではないので、これ以上の詳細な説明は行わない。
【００２５】
また、データ検索装置６は、検索要求整形装置６１と、データベース多重検索部６２とを備えている。
【００２６】
検索要求整形装置６１は、検索要求入力装置５に入力された検索要求を、マルチメディアデータベース３および多重インデックス記録部４で使用しているデータベースシステムに合わせて整形・変換する。
【００２７】
データベース多重検索部６２は、得られた検索要求に従ってデータベースにアクセスし、検索結果を検索結果出力装置７に渡す。データベースへのアクセス法自体は、マルチメディアデータベース３および多重インデックス記録部４で使用しているデータベースシステムに合わせた通常の手法である。ただし、検索に用いるインデックスの音声認識パラメータを、まず１つずつ固定して検索を行い、次いでインデックスの音声認識パラメータを考慮せずに検索を行う。
【００２８】
例えば、検索要求として「検索キーワードｗ１，ｗ２，ｗ３が全て１０分以上の間をおかずに出現しているデータが欲しい」が与えられたとする。またこのとき、音声認識パラメータ記憶部２４に記憶されている音声認識パラメータはＰ１〜Ｐ６の６通りであったとする。データベース多重検索部６２は、まず多重インデックス記録部４に記録されているインデックスのうち、音声認識パラメータがＰ１のもののみを対象として検索を行う。次いで、音声認識パラメータがＰ２のもののみを対象として検索を行う。さらに、音声認識パラメータがＰ３のもののみを対象として検索を行う。こうして、音声認識パラメータを固定した検索をパラメータの種類の数である６回実行する。次に音声認識パラメータに関わらず全てのインデックスを用いて検索を実行する。この結果、「データＤ１：検索キーワードｗ１，ｗ２，ｗ３ともに音声認識パラメータＰ３の認識結果として出現」「データＤ２：検索キーワードｗ１，ｗ２は音声認識パラメータＰ３の認識結果として、検索キーワードｗ３は音声認識パラメータＰ６の認識結果として出現」「データＤ３：検索キーワードｗ１は音声認識パラメータＰ３、検索キーワードｗ２は音声認識パラメータＰ５、検索キーワードｗ３は音声認識パラメータＰ６の認識結果として出現」のような３つのデータが検索結果で得られたとき、全て同一の音声認識パラメータであるデータＤ１を最優先に、次いで２つの異なる音声認識パラメータを用いたデータＤ２を、最後に３つの異なる音声認識パラメータを用いて検索要求を満たしたデータＤ３を、という順序で重み付けする。実際に検索結果出力装置７に渡される検索結果の順序は、用いた音声認識パラメータの数の他に、使用しているデータベースシステムが出力する重み付けに依る。複数の重み付けをどのように調整するかは、本発明の目的・用途に応じる。また、ここでは説明の都合上、多重の検索を１回ずつ順番に実行するように記したが、これらの検索順序には依存性がなく、どのような順序で検索しても、全ての検索処理を並列して行ってもかまわない。
【００２９】
なお、本実施の形態では、データ記録装置２、マルチメディアデータベース３、多重インデックス記録部４、データ検索装置６は、各部の機能を制御するプログラムとして、ＣＤ−ＲＯＭやフロッピーディスクなどの機械読み取り可能な記録媒体９３に格納して提供され、計算機等に読み込まれて実行されるものとしても良い。その場合の構成を図２に示す。
【００３０】
図２は本発明の第１の実施の形態に係る情報記録・検索方法（情報記録・検索プログラム）を、機械読み取り可能な記録媒体９３に格納して提供され、計算機等に読み込まれて実行されるものとして示すブロック図である。図２において、９はコンピュータ、９１は処理装置、９２はメモリ、９３は記録媒体、９４は外部記憶装置を示している。
【００３１】
記録媒体９３からコンピュータ９に読み込まれたプログラムにより、処理装置９１、メモリ９２、外部記憶装置９４が、データ記録装置２、マルチメディアデータベース３、多重インデックス記録部４、データ検索装置６として機能する。ただし、メモリ９２の容量が本発明の各実施の形態で必要とされる記憶容量よりも大きな場合は、外部記憶装置９４は必ずしも必要ではない。
【００３２】
次に、本実施の形態に係る情報記録・検索装置の動作（情報記録・検索方法）について説明する。本実施の形態は、検索対象となるマルチメディアデータをデータベースに記録するためのデータ記録動作と、利用者の入力する検索要求に対して、記録されているマルチメディアデータの中から要求に該当するデータを出力するデータ検索動作に分けることができる。これら２つの動作は、利用者の必要に応じて任意の時点で独立に起動される。よって、個々の動作について別々に説明していく。
【００３３】
まず、本実施の形態におけるデータ記録動作について説明する。図３は本発明の第１の実施の形態に係る情報記録・検索方法（情報記録・検索プログラム）のデータ記録動作を示すフローチャートである。
【００３４】
データ記録動作では、まず、マルチメディアデータ入力装置１に入力されたマルチメディアデータが、音声データ抽出部２１に渡され、音声認識処理が可能な音声データが抽出される（ステップＡ１）。
【００３５】
次に、こうして抽出された音声データに対して、多重音声認識部２２が音声認識パラメータ記憶部２４に記憶されている音声認識パラメータの数だけ音声認識処理を実行する（ステップＡ２〜Ａ４）。すなわち、未実行の音声認識パラメータを１つ読み込み（ステップＡ２）、読み込んだ音声認識パラメータを用いて音声認識を実行する（ステップＳ３）。
【００３６】
次に、まだ読み込んでいない音声認識パラメータが存在するかの判断を行い、（ステップＳ４）、存在する場合は（ステップＡ４のＹｅｓ）ステップＡ２に戻る。これを音声認識パラメータ記憶部２４に記憶されている音声認識パラメータの数だけ繰り返す。
【００３７】
このとき、音声認識結果には、認識されたテキストの各部分が元のマルチメディアデータの先頭から計って何分何秒目に出現したものなのかを示す時間情報も付与されている。
【００３８】
また図３のフローチャートではステップＡ２〜Ａ４の処理を逐次的に記したが、これらの音声認識処理には順序依存性がなく、音声認識パラメータ数だけ音声認識エンジンを用意して全てを並列に行ってもよい。
【００３９】
音声認識処理が全て終了すると（ステップＡ４のＮｏ）、データ・インデックス同期処理部２３は音声認識パラメータ毎に得られた音声認識結果に対して、データベースの検索インデックスとして使用できるよう形態素解析等の処理を行う（ステップＡ５）。
【００４０】
次いで、音声認識パラメータ毎に、認識された語句と、その語句が認識された時間情報を、元のマルチメディアデータ名、マルチメディアデータに最初から付随してきた日付などの情報とで組にしてまとめ、多重の検索インデックスとする（ステップＡ６）。
【００４１】
最後に、入力されたマルチメディアデータはマルチメディアデータベース３に、作成した多重インデックスは多重インデックス記録部４に記録することで（ステップＡ７）、データ記録動作が終了する。
【００４２】
次に、本実施の形態の情報記録・検索方法におけるデータ検索動作について説明する。図４は本発明の第１の実施の形態に係る情報記録・検索方法（情報記録・検索プログラム）のデータ検索動作を示すフローチャートである。
【００４３】
利用者が検索要求入力装置５に入力した検索要求は、まず検索要求整形装置６１によって、形態素解析等の前処理が行われ、マルチメディアデータベース３および多重インデックス記録部４で使用されているデータベースシステムに合わせた検索要求文に変換される（ステップＢ１）。
【００４４】
次いで、データベース多重検索部６２は、多重インデックス記録部４に記録されているインデックスを調べて、１度に１つずつ音声認識パラメータを固定して、音声認識パラメータの種類の数だけ独立に検索を実行する。このとき得られた検索結果は、音声認識パラメータ毎に一時的に保存しておく（ステップＢ２〜Ｂ５）。
【００４５】
すなわち、まだ検索を行っていない音声認識パラメータのインデックスを選択し（ステップＢ２）、選択したインデックスを用いて検索を実行し、（ステップＢ３）実行した検索結果を一時的に保存する（ステップＢ４）。その後、まだ検索を行っていない音声認識パラメータが存在するかどうかの判断を行い（ステップＢ５）、存在する場合は（ステップＢ５のＹｅｓ）、ステップＢ２に戻る。これを音声認識パラメータの数だけ繰り返す。
【００４６】
なお、図４のフローチャートではステップＢ２〜Ｂ５の処理を逐次的なループとして表現し、さらにその後でステップＢ６の検索処理を行うよう表現したが、音声認識パラメータを１つに固定した検索、および、音声認識パラメータによらず全てのインデックスに対して行う検索共に、順序に依存性はない。よって、これらの検索処理を並列に実行してもかまわない。
【００４７】
次に、データベース多重検索部６２は、多重インデックス記録部４に記録されている多重インデックスのうち、音声認識パラメータの項目を考慮せずに全てを１つのインデックスと見なして、検索を行う（ステップＢ６）。ただし、検索要求中に含まれている検索条件がただ１つの場合は、このステップＢ６はとばされる。
【００４８】
検索条件が複数の場合は、各検索条件がどの音声認識パラメータを用いたインデックスによって満たされたかを記録しておく。次いで、得られた検索結果は順序づけが可能なよう１つのリストにまとめられ（ステップＢ７）、さらに検索条件を満たすために用いられた音声認識パラメータの数に応じて、優先度調整が施される（ステップＢ８）。基本的にはある１つの音声認識パラメータのインデックスだけで、全ての検索条件を満たして検索されたデータを優先し、用いられた音声認識パラメータ数が多くなるにつれて優先度を低くする。この他に、使用しているデータベースシステムが出力する重み付けもあり得るため、実際の出力結果の優先度をどのように調整するかは、本発明の目的・用途に応じる。最後に、得られた検索結果を検索結果出力装置７に出力することで（ステップＢ９）、データ検索動作は終了する。
【００４９】
利用者が、本実施の形態の情報記録・検索装置、方法および記録媒体９３にマルチメディアデータを記録するときは、データ記録動作が、既に記録したデータを検索したいときにはデータ検索動作が起動される。この２つの動作が利用者の必要に応じて起動される処理で、本実施の形態の情報記録・検索装置、方法および記録媒体９３の全動作となる。
【００５０】
以下では、本実施の形態における情報記録・検索装置、方法および記録媒体９３の動作について、具体的な例を用いて説明する。
【００５１】
まず、データ記録動作について説明する。図５は多重音声認識結果の例を示す図である。
【００５２】
この具体例では、記録するマルチメディアデータとして、様々な公演や講義の様子を動画および音声データとして録画（録音）した、ＭＰＥＧ１、ＭＰＥＧ２、ＷＡＶＥ形式のファイルが与えられるとする。これらのファイルは光ディスクやネットワークなどを通して機械読み取り可能な手段でマルチメディアデータ入力装置１に与えられる。また各データには、あらかじめ「題目」「公演日時」「全出演者名」の情報が機械読み取り可能な形で付与されているものとする。
【００５３】
音声認識パラメータとしては、音声認識パラメータ記憶部２４に、「男性／一般」，「女性／一般」，「子供／一般」，「男性／政治経済」，「女性／政治経済」，「男性／医学」，「女性／医学」の７種類が用意されているとする。ここで最初の「男性」，「女性」，「子供」というのは話者の音響的な特性を示したもので、次の「一般」，「政治経済」，「医学」というのは認識に用いられる語彙や言語的な特性を示したものである。よって、「女性／一般」の音声認識パラメータは、音声認識に用いる統計的な情報や認識アルゴリズムなどが、女性の一般発話認識に適するよう調整されたものであり、「男性／政治経済」は男性の政治経済分野における発話認識に適するよう調整された音声認識パラメータである。
【００５４】
最初に例えば「題目：ＩＴ技術の動向、公演日：００年１２月１４日、出演者：田中一郎、山田花子」といった映像ファイルがＭＰＥＧ１形式で、マルチメディアデータ入力装置１に入力されると、音声データ抽出部２１は、そのファイルを読み込み、データ形式を判断して音声認識が可能なように音声データを抽出する（ステップＡ１）。多重音声認識部２２で実行される音声認識がサンプリング周波数２２ＫのＷＡＶＥファイルを入力とするのならば、ＭＰＥＧ１ファイルの音声トラックだけを分離し、ＷＡＶＥ形式に変換した後で、サンプリング周波数変換のフィルタをかけることになる。また、多重音声認識部２２で実行される音声認識が異なる入力形式を要求する場合は、その全ての形式の音声データを作成する。これらの変換は一般的な処理であり、ここでは詳しくは説明しない。今回の例では、元の「ＩＴ技術の動向」ＭＰＥＧ１ファイルと再生時間が等しい、ＷＡＶＥファイルが作成されたことになる。
【００５５】
次いで、作成されたＷＡＶＥファイルに対して用意された７種類の音声認識パラメータを用いた音声認識が実行される（ステップＡ２〜Ａ４）。パラメータ数が７種類であるため、音声認識が実行される回数も７回である。図５に音声認識結果の一部の例を示す。
【００５６】
全ての音声認識処理が終了すると、データ・インデックス同期処理部２３ではまず、音声認識パラメータ毎に得られた音声認識結果に対して、検索インデックスとして使用できるよう形態素解析を行い、検索キーワードとして不要な語句を取り除くといった処理を行う（ステップＡ５）。図４の認識テキストに形態素解析をかけ、名詞だけを取り出して、インデックス用の語句とした例を図６に示す。
【００５７】
こうして得られたインデックス用の語句を、「題目：ＩＴ技術の動向、公演日：００年１２月１４日、出演者：田中一郎、山田花子」といった最初から与えられている情報と合わせて、音声認識パラメータ毎にまとめ、多重の検索インデックスとする（ステップＡ６）。
【００５８】
最後に、入力されたＭＰＥＧ１ファイルはマルチメディアデータベース３に、作成された多重インデックスは多重インデックス記録部４に記録することで（ステップＡ７）、データ記録動作が終了する。データベースシステムの通常の機能として、多重インデックス記録部４に記録されているこのデータのインデックスを読めば、元のＭＰＥＧ１ファイルがマルチメディアデータベース３から容易に呼び出すことができる。
【００５９】
以上のようなデータ記録動作を、利用者の必要に応じて任意回数繰り返すことにより、本実施の形態の情報記録・検索装置にマルチメディアデータが記録されていく。
【００６０】
次に、データ検索動作について具体例を用いて説明する。
【００６１】
利用者が検索要求入力装置５に、「ｉ−ｍｏｄｅ（商標）」，「損」という語句が中で使われているデータを検索したい、のような検索要求を入力した場合、その検索要求は検索要求整形装置６１によって、マルチメディアデータベース３および多重インデックス記録部４で使用されているデータベースシステムに合わせた検索要求文に変換される（ステップＢ１）。この例では既にキーワード「ｉ−ｍｏｄｅ（商標）」，「損」が指定されているため、特別な処理はいらないが、検索要求が「ｉ−ｍｏｄｅ（商標）ビジネスで損害を被った事例について」のような自由入力文で与えられたときには、形態素解析等の処理が行われる。
【００６２】
データベース多重検索部６２は、多重インデックス記録部４に記録されているインデックスを調べて、１度に１つずつ音声認識パラメータを固定して、音声認識パラメータの種類数の７回検索を実行する（ステップＢ２〜Ｂ５）。今回の例では「題目：ＩＴ技術の動向、公演日：００年１２月１４日、出演者：田中一郎、山田花子」のビデオだけ、その中に「ｉ−ｍｏｄｅ（商標）」，「損」という語句が両方とも使われていたが、どの音声認識パラメータを用いた認識結果でも、この２つの語句が２つとも正しく認識されることはなかったため、この段階では何も検索されない。
【００６３】
さらに、データベース多重検索部６２は、多重インデックス記録部４に記録されている７種類の音声認識パラメータ別インデックスを、音声認識パラメータの項目を考慮せずに全て１つのインデックスと見なして、検索を行う（ステップＢ６）。この例では、図６にあるように「題目：ＩＴ技術の動向、公演日：００年１２月１４日、出演者：田中一郎、山田花子」のビデオを「男性／一般」で音声認識したときに語句「損」が、「男性／政治経済」で音声認識したときに語句「ｉ−ｍｏｄｅ（商標）」が正しく認識されている。よって、ステップＢ６で初めて「題目：ＩＴ技術の動向」のビデオが検索結果に挙がってくる。
【００６４】
次いで、得られた検索結果が全て１つのリストにまとめられる（ステップＢ７）。今回の例では、最初の音声認識パラメータを固定した７回の検索では結果なし、音声認識パラメータの種類が同じでなくともかまわず検索した場合に、「題目：ＩＴ技術の動向」のビデオが１つ検索されただけであるから、まとめた検索結果も「題目：ＩＴ技術の動向」のビデオ１つだけである。
【００６５】
本来は、得られた検索結果に対して、各データが検索条件を満たすために用いられた音声認識パラメータの数と、使用しているデータベースシステムが出力する重み付けを考慮した優先度付けが行われるが（ステップＢ８）、検索結果が１つだけの場合は順序が変わらない。よって、１つのビデオデータ「題目：ＩＴ技術の動向」が、検索結果出力装置７に出力され（ステップＢ９）、データ検索動作は終了する。
【００６６】
このように、複数の音声認識パラメータによる検索インデックスを用いることで、単独の音声認識では検索できなかった「題目：ＩＴ技術の動向」のビデオが検索可能となる。一方、複数の音声認識パラメータによる検索インデックスを用いたため、本来該当しないデータが誤って検索されることもあり得る。しかし、音声認識率にもよるが、ある語句が偶然検索キーワードに用いられるような語句に誤認識されることは希である。特に、検索条件に複数の語句が入力された場合、間違って本来条件に該当しないデータが検索されることは、より少なくなる。また認識語彙の問題から、専門用語等が正しく音声認識されるためには、その分野に合わせた音声認識パラメータが必要になるが、一般の音声認識パラメータを用いた認識結果に専門用語が誤認識によって出力されることは少ない。以上のことから、複数の音声認識パラメータによる検索インデックスを用いることで、検索漏れは少なくなるが、間違って余計な検索結果が出力される誤りは、あまり増えないといえる。
【００６７】
以上説明したように第１の実施の形態によれば、以下に掲げる効果を奏する。まず第１の効果は、ビデオデータなどのマルチメディアデータに対して、内容等に関わる詳細な検索インデックスを自動的に作成できることである。その理由は、データ記録時に複数の音声認識パラメータを用いて検索インデックスを多重に作成し、データ検索時にはその多重インデックスを用いた検索を実行するからである。なお、多重インデックスの作成、および多重インデックスの検索とも処理は並列に行うことが可能であり、実行時間も問題とはならない。
【００６８】
そして第２の効果は、検索条件が少なく検索結果が複数得られた場合などでも、利用者は効率よく検索ができることである。その理由は、データ検索時に各データ毎に優先する音声認識パラメータを判定することにより、検索結果も優先度付けして利用者に提示されるからである。
【００６９】
（第２の実施の形態）
以下、本発明の第２の実施の形態を図面に基づいて詳細に説明する。なお、上記実施の形態において既に記述したものと同一の部分については同一符号を付し、重複した説明は省略する。
【００７０】
図７は本発明の第２の実施の形態に係る情報記録・検索装置の構成を示すブロック図である。図７において、８は音声認識パラメータ優先度付け装置を示している。
【００７１】
図７を参照すると、本発明の第２の実施の形態は、上記第１の実施の形態に加えて、音声認識パラメータ優先度付け装置８を有する点に特徴を有している。
【００７２】
上記第１の実施の形態では、音声認識パラメータ記憶部２４に記憶されている音声認識パラメータを全て対等に扱ったが、音声認識パラメータ優先度付け装置８では、音声認識パラメータ記憶部２４、マルチメディアデータベース３、多重インデックス記録部４にアクセスし、音声認識パラメータに優先度付けを行う。あるデータに対して、どの音声認識パラメータを優先すればよいか判断するには、元のデータに付随している出演者等の情報を利用する手法や、映像をパターン認識して話者の性別を判定する手法など、いくつかの手法が考えられる。本発明の目的・用途に応じて適した手法を用いればよい。情報不足などの理由により、音声認識パラメータに優劣が付けられない場合は、本発明の第１の実施の形態と同じく、全ての音声認識パラメータを対等に扱う。
【００７３】
データベース多重検索部６２では、検索結果が全て得られた後で、第１の実施の形態の場合と同じく、検索結果に優先度をつける。このとき検索結果の優先度の基準としては、第１の実施の形態でも利用した、各検索結果が検索条件を満たすために用いた音声認識パラメータ数と、データベースシステムが与える結果の重みとの２つの他に、音声認識パラメータ優先度付け装置８が与える音声認識パラメータの優先度がある。この３つの基準をどのように調整して、検索結果を出力するかは、本発明の目的・用途により異なる。
【００７４】
なお、本実施の形態では、データ記録装置２、マルチメディアデータベース３、多重インデックス記録部４、データ検索装置６、音声認識パラメータ優先度付け装置８は、各部の機能を制御するプログラムとして、ＣＤ−ＲＯＭやフロッピーディスクなどの機械読み取り可能な記録媒体９３に格納して提供され、計算機等に読み込まれて実行されるものとしても良い。
【００７５】
図８は本発明の第２の実施の形態に係る情報記録・検索方法（情報記録・検索プログラム）のデータ検索動作を示すフローチャートであり、図９は多重音声認識結果の別例を示す図である。
【００７６】
本実施の形態は、第１の実施の形態での場合と同じく、検索対象となるマルチメディアデータをデータベースに記録するためのデータ記録動作と、利用者の入力する検索要求に対して、記録されているマルチメディアデータの中から要求に該当するデータを出力するデータ検索動作に分けることができる。このうち、データ記録動作については第１の実施の形態の場合とまったく同じである。よって、ここでは違いのあるデータ検索動作についてのみ説明する。
【００７７】
本実施の形態でのデータ検索動作を示すフローチャートは図８のようになる。利用者が検索要求入力装置５に入力した検索要求は、まず検索要求整形装置６１によって、形態素解析等の前処理が行われ、マルチメディアデータベース３および多重インデックス記録部４で使用されているデータベースシステムに合わせた検索要求文に変換される（ステップＣ１）。
【００７８】
次いで、データベース多重検索部６２は、多重インデックス記録部４に記録されているインデックスを調べて、１つずつ音声認識パラメータを固定して、音声認識パラメータの種類の数だけ独立に検索を実行する。このとき得られた検索結果は、音声認識パラメータ毎に一時的に保存しておく（ステップＣ２〜Ｃ５）。
【００７９】
すなわち、まだ検索を行っていない音声認識パラメータのインデックスを選択し（ステップＣ２）、選択したインデックスを用いて検索を実行し（ステップＣ３）、検索結果を一時的に保存する（ステップＣ４）。その後、まだ検索を行っていない音声認識パラメータが存在するかどうかの判断を行い（ステップＣ５）、存在する場合は（ステップＣ５のＹｅｓ）、ステップＣ２に戻る。これを音声認識パラメータの数だけ繰り返す。
【００８０】
なお、図７のフローチャートではステップＣ２〜Ｃ５の処理を逐次的なループとして表現し、さらにその後でステップＣ６の検索処理を行うよう表現したが、音声認識パラメータを１つに固定した検索、および、音声認識パラメータによらず全てのインデックスに対して行う検索共に、順序に依存性はない。よって、これらの検索処理を並列に実行してもかまわない。
【００８１】
検索を行っていない音声認識パラメータが存在しなくなると（ステップＣ５のＮｏ）、次に、データベース多重検索部６２は、多重インデックス記録部４に記録されている多重インデックスのうち、音声認識パラメータの項目を考慮せずに全てを１つのインデックスと見なして、検索を行う（ステップＣ６）。ただし、検索要求に含まれている検索条件がただ１つの場合は、このステップＣ６はとばされる。検索条件が複数の場合は、各検索条件がどの音声認識パラメータを用いたインデックスによって満たされたかを記録しておく。
【００８２】
次いで、得られた検索結果は順序づけが可能なよう１つのリストにまとめられる（ステップＣ７）。
【００８３】
続いて、音声認識パラメータ優先度付け装置８は、音声認識パラメータ記憶部２４に記憶されている音声認識パラメータを読み込み、検索結果リストに含まれている各データに対して、それらに用いるべき音声認識パラメータの優先度付けを行う（ステップＣ８）。また音声認識パラメータ優先度付け装置８は、その優先度付け手法に応じてマルチメディアデータベース３および多重インデックス記憶部４にアクセスする。得られた各データに対する音声認識パラメータの優先度付け結果は、データベース多重検索部６２に送られる。
【００８４】
続いて、データベース多重検索部６２は、送られた音声認識パラメータの優先度と、各検索結果データが検索条件を満たすために用いられた音声認識パラメータの数、さらに、使用しているデータベースシステムが出力する重み付けの３つの基準に応じて、全検索結果の優先度調整を行う（ステップＣ９）。基本的には、検索条件に該当したデータが、全ての検索条件を満たすために用いられた音声認識パラメータ数が多くなるにつれて優先度を低くする。また用いられた音声認識パラメータ数が同じデータ間では、ステップＣ８で高く優先度付けされた音声認識パラメータを用いて検索されたデータを優先する。実際に出力結果の優先度をどのように細かく調整するかは、本発明の目的・用途に応じる。最後に、得られた検索結果を検索結果出力装置７に出力することで（ステップＣ１０）、データ検索動作は終了する。
【００８５】
利用者が、本実施の形態の情報記録・検索装置、方法および記録媒体９３にマルチメディアデータを記録するときは、データ記録動作が、既に記録したデータを検索したいときにはデータ検索動作が起動される。この２つの動作が利用者の必要に応じて起動されることで、本実施の形態の情報記録・検索装置、方法および記録媒体９３の全動作となる。
【００８６】
以下では、本実施の形態における情報記録・検索装置、方法および記録媒体９３の動作について、具体的な例を用いて説明する。
【００８７】
ただし、データ記録動作に関しては、本発明の第１の実施の形態と同様であるため、データ検索動作についてのみ具体例を挙げる。マルチメディアデータ入力装置１に入力されるデータの種類や形式、音声認識パラメータ記憶部２４に記憶されている音声認識パラメータの種類も、第１の実施の形態での具体例と同じとする。
【００８８】
利用者が検索要求入力装置５に、「加入者」という語句が中で使われているデータを検索したい、のような検索要求を入力した場合、その検索要求は検索要求整形装置６１によって、マルチメディアデータベース３および多重インデックス記録部４で使用されているデータベースシステムに合わせた検索要求文に変換される（ステップＣ１）。この例では検索要求がキーワードの形で入力されているため、特別な処理はいらないが、検索要求が「加入者数の増加について」のような自由入力文で与えられたときには、形態素解析等の処理が行われる。
【００８９】
データベース多重検索部６２は、多重インデックス記録部４に記録されているインデックスを調べて、１度に１つずつ音声認識パラメータを固定して、音声認識パラメータの種類数の７回検索を実行する（ステップＣ２〜Ｃ５）。通常は、さらに７種類の音声認識パラメータ別インデックスを、音声認識パラメータの項目を考慮せずに全て１つのインデックスと見なして、検索を行う動作（ステップＣ６）がこれに伴うが、今回の例のように、入力された検索要求の検索条件がただ１つの場合は、まったく同じ検索結果しか得られないため、ステップＣ６の動作は不要となる。
【００９０】
さて、この例では「題目：ＩＴ技術の動向、公演日：００年１２月１４日、出演者：田中一郎、山田花子」のビデオにだけ、その中に「加入者」という語句が実際に使われていたとする。その多重音声認識結果の例を図５に示す。一方、「題目：医学の発展史、公演日：９８年０３月２４日、講演者：間黒男」というビデオでは、講演者の「この注射の効果は」という発話に対して、図９のような多重音声認識結果が得られていたとする。
【００９１】
よって、ステップＣ７で、得られた検索結果が全て１つのリストにまとめられると、そのリストには「題目：ＩＴ技術の動向」と「題目：医学の発展史」の２つのビデオが挙がっていることになる。ただし、「題目：ＩＴ技術の動向」は「男性／一般」音声認識パラメータによるインデックスと「男性／政治経済」音声認識パラメータによるインデックスの両方で同じ時間に「加入者」が認識されているが、「題名：医学の発展史」では「男性／一般」音声認識パラメータによるインデックスでのみ「加入者」が認識されており、「男性／医学」音声認識パラメータによるインデックスでは同じ時間に「加入者」は認識されていない。
【００９２】
次に、音声認識パラメータ優先度付け装置８では、検索された２つのビデオそれぞれに対して、７つの音声認識パラメータ間の優先度付けを行う（ステップＣ８）。今回の例では、優先度付けの手法として、シソーラスによる分野判定と、映像データからの顔認識による話者性別判定が行われるとする。シソーラスによる分野判定とは、「題目」等の元のデータに始めから付随してきた情報に含まれている語句から、そのデータがどのような分野に属しているものなのか判断する手法である。顔認識による話者性別判定とは、映像データからそのときの話者の画像を切り出し、そこから話者の性別等を判断する手法である。この２つの手法を用いた結果、「題目：ＩＴ技術の動向」のビデオは「男性／政治経済」音声認識パラメータが、「題目：医学の発展史」のビデオは「男性／医学」音声認識パラメータが優先されると判定された。この結果はデータベース多重検索部６２に送られる。
【００９３】
データベース多重検索部６２では、検索された２つのビデオの最終的な順位付けを行う（ステップＣ９）。今回の例では検索条件がただ１つのキーワードなので、それを満たすために使用された音声認識パラメータ数も必ず１つである。ただし、「題目：ＩＴ技術の動向」では優先度の高い「男性／政治経済」（音声認識パラメータ）で検索条件が満たされており、しかも、「男性／一般」（音声認識パラメータ）によるインデックスでも、同じく検索条件が満たされているのに対して、「題名：医学の発展史」の方では優先度が高くない「男性／一般」（音声認識パラメータ）でのみ検索条件が満たされており、しかも、優先度の高い「男性／医学」（音声認識パラメータ）によるインデックスでは、同じ時間に「加入者」は認識されていない。よって、２つの検索結果のうち、「題目：ＩＴ技術の動向」のビデオデータを高く、「題目：医学の発展史」のビデオデータを低く優先度付けして、検索結果出力装置７に出力される（ステップＣ１０）。
【００９４】
このように、利用者が入力した検索要求に含まれている検索条件が少ない場合では、音声認識誤りから本来条件に該当しないデータも結果として出力されることが語句によってはあり得るが、検索時に音声認識パラメータの優先度を考慮することで、優先度の高い検索結果が上位に出力され、利用者は効率よく検索を行うことができる。
【００９５】
なお、本発明が上記各実施の形態に限定されず、本発明の技術思想の範囲内において、各実施の形態は適宜変更され得ることは明らかである。また上記構成部材の数、位置、形状等は上記実施の形態に限定されず、本発明を実施する上で好適な数、位置、形状等にすることができる。また、各図において、同一構成要素には同一符号を付している。
【００９６】
【発明の効果】
本発明は以上のように構成されているので、以下に掲げる効果を奏する。まず第１の効果は、ビデオデータなどのマルチメディアデータに対して、内容等に関わる詳細な検索インデックスを自動的に作成できることである。その理由は、データ記録時に複数の音声認識パラメータを用いて検索インデックスを多重に作成し、データ検索時にはその多重インデックスを用いた検索を実行するからである。なお、多重インデックスの作成、および多重インデックスの検索とも処理は並列に行うことが可能であり、実行時間も問題とはならない。
【００９７】
そして第２の効果は、検索条件が少なく検索結果が複数得られた場合などでも、利用者は効率よく検索ができることである。その理由は、データ検索時に各データ毎に優先する音声認識パラメータを判定することにより、検索結果も優先度付けして利用者に提示されるからである。
【図面の簡単な説明】
【図１】本発明の第１の実施の形態に係る情報記録・検索装置の構成を示すブロック図である。
【図２】本発明の第１の実施の形態に係る情報記録・検索方法（情報記録・検索プログラム）を、機械読み取り可能な記録媒体に格納して提供され、計算機等に読み込まれて実行されるものとして示すブロック図である。
【図３】本発明の第１の実施の形態に係る情報記録・検索方法（情報記録・検索プログラム）のデータ記録動作を示すフローチャートである。
【図４】本発明の第１の実施の形態に係る情報記録・検索方法（情報記録・検索プログラム）のデータ検索動作を示すフローチャートである。
【図５】多重音声認識結果の例を示す図である。
【図６】インデックス作成用の認識テキスト前処理の例を示す図である。
【図７】本発明の第２の実施の形態に係る情報記録・検索装置の構成を示すブロック図である。
【図８】本発明の第２の実施の形態に係る情報記録・検索方法（情報記録・検索プログラム）のデータ検索動作を示すフローチャートである。
【図９】多重音声認識結果の別例を示す図である。
【符号の説明】
１…マルチメディアデータ入力装置
２…データ記録装置
３…マルチメディアデータベース
４…多重インデックス記録部
５…検索要求入力装置
６…データ検索装置
７…検索結果出力装置
８…音声認識パラメータ優先度付け装置
２１…音声データ抽出部
２２…多重音声認識部
２３…データ・インデックス同期処理部
２４…音声認識パラメータ記憶部
６１…検索要求整形装置
６２…データベース多重検索部
９…コンピュータ
９１…処理装置
９２…メモリ
９３…記録媒体
９４…外部記憶装置
ｗ１，ｗ２，ｗ３…検索キーワード
Ｐ１，Ｐ２，Ｐ３，Ｐ４，Ｐ５，Ｐ６…音声認識パラメータ
Ｄ１，Ｄ２，Ｄ３…データ

Claims

音声認識処理を複数の異なる条件で実行し検索インデックスを多重に作成する多重音声認識部と、当該作成した多重の検索インデックスを用いて検索を行うデータベース多重検索部とを備えた情報記録・検索装置であって、
検索を行う際に、検索条件を充足するために使用された複数の異なる音声認識処理の前記条件の数の多寡に応じて、各検索結果の優先度を調整する音声認識パラメータ優先度付け装置を備えたことを特徴とする情報記録・検索装置。
音声認識処理を複数の異なる条件で実行し検索インデックスを多重に作成する多重音声認識部と、当該作成した多重の検索インデックスを用いて検索を行うデータベース多重検索部とを備えた情報記録・検索装置であって、
検索を行う際に、検索対象となる各データに付随している情報、または、各データの画像解析結果に応じて、各検索結果の優先度を調整する音声認識パラメータ優先度付け装置を備えたことを特徴とする情報記録・検索装置。
音声認識処理を複数の異なる条件で実行し検索インデックスを多重に作成する多重音声認識ステップと、当該作成した多重の検索インデックスを用いて検索を行うデータベース多重検索ステップとを備えた情報記録・検索方法であって、
検索を行う際に、検索条件を充足するために使用された複数の異なる音声認識処理の前記条件の数の多寡に応じて、各検索結果の優先度を調整する音声認識パラメータ優先度付けステップを備えたことを特徴とする情報記録・検索方法。
音声認識処理を複数の異なる条件で実行し検索インデックスを多重に作成する多重音声認識ステップと、当該作成した多重の検索インデックスを用いて検索を行うデータベース多重検索ステップとを備えた報記録・検索方法であって、
検索を行う際に、検索対象となる各データに付随している情報、または、各データの画像解析結果に応じて、各検索結果の優先度を調整する音声認識パラメータ優先度付けステップを備えたことを特徴とする情報記録・検索方法。
コンピュータを、音声認識処理を複数の異なる条件で実行し検索インデックスを多重に作成する多重音声認識手段と、当該作成した多重の検索インデックスを用いて検索を行うデータベース多重検索手段として機能させる情報記録・検索プログラムであって、
検索を行う際に、検索条件を充足するために使用された複数の異なる音声認識処理の前記条件の数の多寡に応じて、各検索結果の優先度を調整する音声認識パラメータ優先度付け手段として、前記コンピュータをさらに機能させることを特徴とする情報記録・検索プログラム。
コンピュータを、音声認識処理を複数の異なる条件で実行し検索インデックスを多重に作成する多重音声認識手段と、当該作成した多重の検索インデックスを用いて検索を行うデータベース多重検索手段として機能させる情報記録・検索プログラムであって、
検索を行う際に、検索対象となる各データに付随している情報、または、各データの画像解析結果に応じて、各検索結果の優先度を調整する音声認識パラメータ優先度付け手段として、前記コンピュータをさらに機能させることを特徴とする記載の情報記録・検索プログラム。