JP2002132823A - マルチメディア情報処理装置、マルチメディア情報処理方法およびそのプログラムが記録されたコンピュータ読み取り可能な記録媒体 - Google Patents

マルチメディア情報処理装置、マルチメディア情報処理方法およびそのプログラムが記録されたコンピュータ読み取り可能な記録媒体

Info

Publication number
JP2002132823A
JP2002132823A JP2000319733A JP2000319733A JP2002132823A JP 2002132823 A JP2002132823 A JP 2002132823A JP 2000319733 A JP2000319733 A JP 2000319733A JP 2000319733 A JP2000319733 A JP 2000319733A JP 2002132823 A JP2002132823 A JP 2002132823A
Authority
JP
Japan
Prior art keywords
word
multimedia data
occurrence vector
occurrence
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000319733A
Other languages
English (en)
Inventor
Kaname Kasahara
要 笠原
Kibo Inago
希望 稲子
Tsuneaki Kato
恒昭 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2000319733A priority Critical patent/JP2002132823A/ja
Publication of JP2002132823A publication Critical patent/JP2002132823A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 画像や音声などのマルチメディアデータと単
語の類似度、単語に類似するマルチメディアデータの検
索またはマルチメディアデータに類似する単語検索を行
う。 【解決手段】 単語共起ベクトル生成手段11は、マル
チメディアデータ項目中の単語近くに現れる単語共起語
の出現頻度を要素とする単語共起ベクトルを生成し単語
共起ベクトルDB12に保存する。画像共起ベクトル生
成手段13は、マルチメディアデータ項目中の画像近く
に現れる画像共起語の出現頻度を要素とする画像共起ベ
クトルを生成し画像共起ベクトルDB14に保存する。
類似度演算手段15は、単語および画像が指定されたと
きに単語共起ベクトルDB12に記憶された単語共起ベ
クトルと画像共起ベクトルDB14に記憶された画像共
起ベクトルとを用いて当該指定された単語および画像の
類似度を求め出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、画像や音声などの
マルチメディアデータを含む文章を処理するマルチメデ
ィア情報処理装置、マルチメディア情報処理方法および
そのプログラムが記録されたコンピュータ読み取り可能
な記録媒体に係り、特に、画像と単語の類似度、単語を
基にした画像検索および画像を基にした単語検索に関わ
る。
【0002】
【従来の技術】近年、コンピュータネットワークの社会
への普及にともない、画像やテキストといった従来別々
に利用されていた情報を統合的に利用可能とするマルチ
メディア技術が実現されている。例えば出版分野では、
デジタルカメラやスキャナーによってデジタル化された
画像とテキストをコンピュータで同時に処理して出力す
るデジタル出版技術が利用されている。また、デジタル
ビデオの媒体にテキスト情報を付与し、テキスト情報を
動画情報のインデックスとする技術などが見られる。
【0003】ユーザがマルチメディア情報を効率良く作
成するためには、異なるメディアの情報を関連づけた情
報が必要である。例えば、画像が表わしている内容に対
してそれをよく説明するテキストを同時に表示したり、
ある単語を象徴する画像をアイコンとして単語のかわり
に表示することが行われる。今後情報処理が発展して膨
大なマルチメディア情報が流通するに従って、それらを
統合して利用する技術が重要となることが予想される。
【0004】
【発明が解決しようとする課題】しかしながら、マルチ
メディア情報とテキスト情報同士の関連付けは現在、主
として人手によって行われている。例えば、画像にそれ
を説明するテキストを付与して画像のカタログを作成し
たり、同じ機能を表すアイコンなどの画像にカテゴリー
名を付与した画像ライブラリーがユーザに利用されてい
る。関連付けが人手で行われている理由は、異なるメデ
ィアの情報同士は、たとえデジタル化されていても個々
のデータが表す情報が異なるために単純に比較を行えな
いためである。
【0005】画像とテキストという異なるメディアの情
報を自動的に比較し、一方のメディアのデータに対し
て、別のメディアにおいて関連の高いデータを判別する
ことを行うことが今後必要となる。例えば、ある検索サ
イトでは、HTML検索と同じ手法、すなわち画像を指すタ
グを含むHTMLファイル中の単語をキーワードとした画像
検索サービスを提供しているが、かならずしも画像を説
明する特徴的な単語がHTMLファイルに含まれてはいない
ので、適切な画像検索が行えない。文献(森、高橋、
張、野崎、岡:画像による単語推定を用いたインターネ
ット検索、人工知能学会全国大会、S3−4,P76−
77(2000))のように、未知画像に対応するテキ
ストを付与する方法が提案されているが、これは、あら
かじめ画像を説明するテキストが付与された情報を前提
としているため、最初は人手による画像とテキストの対
応付けをする必要がある。さらに、複数の画像を分割す
ることでテキストによる画像検索を行う方法が提案され
ている(文献:キーワードと画像特徴を利用したWWW
からの画像収集の試み:柳井、AI全大20−01,P
416−419(2000))。この方法でも画像の付
近に画像を表わす単語が含まれていることが前提とな
る。WWWデータ中には画像付近には画像と関連する単
語は含まれる可能性が高いが、画像を表わす単語が含ま
れることは保証されていないため、上記方法では必ず画
像を表わす単語を対応づけることはできない。
【0006】また、ラジオやTVにおけるニュースで
は、アナウンサーが発する音声データを音声認識してテ
キスト抽出することが可能であるが、必ずしも同時に現
れる音楽情報や画像情報を説明しているとは限らないの
で、このようなマルチメディアデータを表す単語を対応
づけることは人手で行われている。
【0007】このような理由から、画像や音声などのマ
ルチメディアデータと単語の類似度を得て、マルチメデ
ィアデータと単語の関連づけに利用したり、単語に類似
するマルチメディアデータの検索またはマルチメディア
データに類似する単語検索を行えるようにして、自由度
の高い情報検索を行いたいという要望が強い。
【0008】そこで本発明は、上記の従来の課題に鑑み
てなされたものであり、その目的とするところは、マル
チメディアデータと単語の類似度、単語に類似するマル
チメディアデータの検索またはマルチメディアデータに
類似する単語検索が行えるマルチメディア情報処理装
置、マルチメディア情報処理方法およびそのプログラム
が記録されたコンピュータ読み取り可能な記録媒体を提
供することにある。
【0009】
【課題を解決するための手段】上記従来の課題を解決す
るために、本発明の請求項1に係るマルチメディア情報
処理装置は、文章中の同一文字列の単語についてその近
くに現れる1または複数の単語の出現頻度を要素とする
単語共起ベクトルが記憶される単語共起ベクトル記憶手
段と、文章中のマルチメディアデータ近くに現れる1ま
たは複数の単語の出現頻度を要素とするマルチメディア
データ共起ベクトルが記憶されるマルチメディアデータ
共起ベクトル記憶手段と、前記文章中の単語およびマル
チメディアデータが指定されたときに前記単語共起ベク
トル記憶手段に記憶された単語共起ベクトルと前記マル
チメディアデータ共起ベクトル記憶手段に記憶されたマ
ルチメディアデータ共起ベクトルとを用いて当該指定さ
れた単語およびマルチメディアデータの類似度を求める
類似度演算手段とを備える。
【0010】本発明の請求項2に係るマルチメディア情
報処理装置は、文章中の同一文字列の単語についてその
近くに現れる1または複数の単語の出現頻度を要素とす
る単語共起ベクトルが記憶される単語共起ベクトル記憶
手段と、文章中のマルチメディアデータ近くに現れる1
または複数の単語の出現頻度を要素とするマルチメディ
アデータ共起ベクトルが蓄積されるマルチメディアデー
タ共起ベクトル記憶手段と、前記文章中の単語が指定さ
れたときに前記単語共起ベクトル記憶手段に記憶された
単語共起ベクトルと前記マルチメディアデータ共起ベク
トル記憶手段に蓄積されたマルチメディアデータ共起ベ
クトルとを用いて当該指定された単語に類似するマルチ
メディアデータを求めるマルチメディアデータ検索手段
とを備える。
【0011】本発明の請求項3に係るマルチメディア情
報処理装置は、文章中の同一文字列の単語についてその
近くに現れる1または複数の単語の出現頻度を要素とす
る単語共起ベクトルが蓄積される単語共起ベクトル記憶
手段と、文章中のマルチメディアデータ近くに現れる1
または複数の単語の出現頻度を要素とするマルチメディ
アデータ共起ベクトルが記憶されるマルチメディアデー
タ共起ベクトル記憶手段と、前記文章中のマルチメディ
アデータが指定されたときに前記単語共起ベクトル記憶
手段に蓄積された単語共起ベクトルと前記マルチメディ
アデータ共起ベクトル記憶手段に記憶されたマルチメデ
ィアデータ共起ベクトルとを用いて当該指定されたマル
チメディアデータに類似する単語を求める単語検索手段
とを備える。
【0012】本発明の請求項4に係るマルチメディア情
報処理装置は、請求項1ないし請求項3のいずれかに記
載のマルチメディア情報処理装置において、前記単語共
起ベクトルを生成する単語共起ベクトル生成手段または
マルチメディアデータ共起ベクトルを生成するマルチメ
ディアデータ共起ベクトル生成手段を備えることを特徴
とする。
【0013】本発明の請求項5に係るマルチメディア情
報処理装置は、請求項1ないし請求項3のいずれかに記
載のマルチメディア情報処理装置において、ネットワー
クを介して受信される前記単語が含まれる文章を基に前
記単語共起ベクトルを生成する単語共起ベクトル生成手
段またはネットワークを介して受信される前記マルチメ
ディアデータを含む文章を基に前記マルチメディアデー
タ共起ベクトルを生成するマルチメディアデータ共起ベ
クトル生成手段を備えることを特徴とする。
【0014】本発明の請求項6に係るマルチメディア情
報処理装置は、請求項1ないし請求項5のいずれかに記
載のマルチメディア情報処理装置において、前記単語、
マルチメディアデータまたは該単語およびマルチメディ
アデータの指定がネットワークを介してなされるときに
当該指定により求められたマルチメディアデータ、単語
または類似度をネットワークを介して供給することを特
徴とする。
【0015】本発明の請求項7に係るマルチメディア情
報処理方法は、文章中の同一文字列の単語についてその
近くに現れる1または複数の単語の出現頻度を要素とす
る単語共起ベクトルを生成する単語共起ベクトル生成手
順と、文章中のマルチメディアデータ近くに現れる1ま
たは複数の単語の出現頻度を要素とするマルチメディア
データ共起ベクトルを生成するマルチメディアデータ共
起ベクトル生成手順と、前記文章中の単語およびマルチ
メディアデータが指定されたときに前記生成された単語
共起ベクトルとマルチメディアデータ共起ベクトルとを
用いて当該指定された単語およびマルチメディアデータ
の類似度を求める類似度演算手順とを備える。
【0016】本発明の請求項8に係るマルチメディア情
報処理方法は、文章中の同一文字列の単語についてその
近くに現れる1または複数の単語の出現頻度を要素とす
る単語共起ベクトルを生成する単語共起ベクトル生成手
順と、文章中のマルチメディアデータ近くに現れる1ま
たは複数の単語の出現頻度を要素とするマルチメディア
データ共起ベクトルを生成蓄積するマルチメディアデー
タ共起ベクトル生成蓄積手順と、前記文章中の単語が指
定されたときに前記生成された単語共起ベクトルと蓄積
されたマルチメディアデータ共起ベクトルとを用いて当
該指定された単語に類似するマルチメディアデータを求
めるマルチメディアデータ検索手順とを備える。
【0017】本発明の請求項9に係るマルチメディア情
報処理方法は、文章中の同一文字列の単語についてその
近くに現れる1または複数の単語の出現頻度を要素とす
る単語共起ベクトルを生成蓄積する単語共起ベクトル生
成蓄積手順と、文章中のマルチメディアデータ近くに現
れる1または複数の単語の出現頻度を要素とするマルチ
メディアデータ共起ベクトルを生成するマルチメディア
データ共起ベクトル生成手順と、前記文章中のマルチメ
ディアデータが指定されたときに前記蓄積された単語共
起ベクトルと前記生成されたマルチメディアデータ共起
ベクトルとを用いて当該指定されたマルチメディアデー
タに類似する単語を求める単語検索手順とを備える。
【0018】本発明の請求項10に係るマルチメディア
情報処理プログラムが記録されたコンピュータ読み取り
可能な記録媒体は、文章中の同一文字列の単語について
その近くに現れる1または複数の単語の出現頻度を要素
とする単語共起ベクトルを生成する単語共起ベクトル生
成手順と、文章中のマルチメディアデータ近くに現れる
1または複数の単語の出現頻度を要素とするマルチメデ
ィアデータ共起ベクトルを生成するマルチメディアデー
タ共起ベクトル生成手順と、前記文章中の単語およびマ
ルチメディアデータが指定されたときに前記生成された
単語共起ベクトルとマルチメディアデータ共起ベクトル
とを用いて当該指定された単語およびマルチメディアデ
ータの類似度を求める類似度演算手順とを備える。
【0019】本発明の請求項11に係るマルチメディア
情報処理プログラムが記録されたコンピュータ読み取り
可能な記録媒体は、文章中の同一文字列の単語について
その近くに現れる1または複数の単語の出現頻度を要素
とする単語共起ベクトルを生成する単語共起ベクトル生
成手順と、文章中のマルチメディアデータ近くに現れる
1または複数の単語の出現頻度を要素とするマルチメデ
ィアデータ共起ベクトルを生成蓄積するマルチメディア
データ共起ベクトル生成蓄積手順と、前記文章中の単語
が指定されたときに前記生成された単語共起ベクトルと
蓄積されたマルチメディアデータ共起ベクトルとを用い
て当該指定された単語に類似するマルチメディアデータ
を求めるマルチメディアデータ検索手順とを備える。
【0020】本発明の請求項12に係るマルチメディア
情報処理プログラムが記録されたコンピュータ読み取り
可能な記録媒体は、文章中の同一文字列の単語について
その近くに現れる1または複数の単語の出現頻度を要素
とする単語共起ベクトルを生成蓄積する単語共起ベクト
ル生成蓄積手順と、文章中のマルチメディアデータ近く
に現れる1または複数の単語の出現頻度を要素とするマ
ルチメディアデータ共起ベクトルを生成するマルチメデ
ィアデータ共起ベクトル生成手順と、前記文章中のマル
チメディアデータが指定されたときに前記蓄積された単
語共起ベクトルと前記生成されたマルチメディアデータ
共起ベクトルとを用いて当該指定されたマルチメディア
データに類似する単語を求める単語検索手順とを備え
る。
【0021】
【発明の実施の形態】以下、本発明の実施の形態を図面
を参照して説明する。以下、マルチメディアデータとし
て画像を例に説明するが、マルチメディアデータは音声
などであってもよい。また、画像は写真などの表現に適
したビットマップ画像でも良いし、デザイン画や図面な
どに適したベクトル画像でもよい。
【0022】[第1の実施の形態]図1は、本発明の第1
の実施の形態に係るコンピュータ1Aの構成図である。
コンピュータ1Aは、単語共起ベクトル生成手段に相当
する単語共起ベクトル生成手段11、単語共起ベクトル
記憶手段に相当する単語共起ベクトルDB12、マルチ
メディアデータ共起ベクトル生成手段に相当する画像共
起ベクトル生成手段13、マルチメディアデータ共起ベ
クトル記憶手段に相当する画像共起ベクトルDB14お
よび、類似度演算手段に相当する類似度演算手段15を
備える。単語共起ベクトルDB12および画像共起ベク
トルDB14はハードディスクなどの記憶装置内に構成
される。単語共起ベクトル生成手段11、画像共起ベク
トル生成手段13および類似度演算手段15は、ハード
ディスクなどの記憶装置内に格納された処理プログラム
をRAMに一旦読み込み、これをCPUが逐次実行する
ことにより実現される。
【0023】単語共起ベクトル生成手段11は、テキス
トデータのみからなるデータや、以下に説明するテキス
トデータと画像データの双方を含んだデータ(「マルチ
メディアデータ項目」という)を入力し、その文章中の
同一文字列の単語についてその近くに現れる所定の単語
(単語共起語という)の出現頻度を要素とする単語共起
ベクトルを生成し、その文章中の単語と、生成された単
語共起ベクトルとを対応づけて単語共起ベクトルDB1
2に格納する。なお、マルチメディアデータ項目やテキ
ストデータのみからなるデータは、本発明の「文章」に
相当する。
【0024】ここで、マルチメディアデータ項目につい
て説明する。図2は、マルチメディアデータ項目の一例
を示す。マルチメディアデータ項目は、HTML(Hyper Tex
t Markup Language)やSGML(Standard Generated Markup
Language)で記述された情報のように、この「馬の画
像」や音声などのマルチメディアデータの前後にあるテ
キストが特定可能であればどのような形式であってもよ
い。また、実際に表示された場合に、位置情報に基づい
て画像近くにあるテキストを特定できれば、どのような
形式であってもよい。なお、複数のマルチメディアデー
タ項目をマルチメディアデータ項目群というが、その一
部に、画像を含まないテキストのみのマルチメディア項
目があってもよい。なお、ここにいう画像には2次元画
像および3次元画像が含まれる。以下、マルチメディア
データを「馬の画像」として説明を行う。
【0025】画像共起ベクトル生成手段13は、マルチ
メディアデータ項目を入力し、その文章中の画像近くに
現れる1または複数の単語(そのそれぞれを画像共起語
という)の出現頻度を要素とする単語共起ベクトルを生
成し、その文章中の単語と生成された単語共起ベクトル
とを対応づけて画像共起ベクトルDB14に格納する。
【0026】類似度演算手段15は、文章中の単語およ
び画像が指定されたときに単語共起ベクトルDB12に
記憶された単語共起ベクトルと、画像共起ベクトルDB
14に記憶された画像共起ベクトルとを用いて、その指
定された単語およびマルチメディアデータの類似度を求
め出力する。
【0027】次に、コンピュータ1Aの動作を図2のマ
ルチメディア項目の例に従って説明する。
【0028】図3は、単語共起ベクトルおよび画像共起
ベクトルの生成、保存を示すフローチャートである。
【0029】先ず、ステップS1でコンピュータ1A
が、ユーザによって予め保存されたマルチメディアデー
タ項目群をハードディスク装置などから読み込むと、ス
テップS2で単語共起ベクトル生成手段11は、以下の
ように単語共起ベクトルを生成し単語共起ベクトルDB
12に保存する。なお、かかる生成手順は単語共起ベク
トル生成手順に相当し、保存までを含めた手順は単語共
起ベクトル生成蓄積手順に相当する。
【0030】例えば、単語「馬」を含む文「この牧場で
飼育されている馬は、鬣が美しい。」の中から、名詞/
動詞/形容詞/形容動詞を選択し、さらに、その中から
「する」、「ある」および代名詞を除いたものを、単語
「馬」と関連する単語共起語として選択する。ここで
は、例えば、「牧場」、「飼育」、「鬣」、「美しい」
が、単語「馬」に対応する単語共起語として選択され
る。
【0031】単語共起ベクトル生成手段11は、これら
単語共起語の出現頻度を求め、この出現頻度を要素とす
る単語共起ベクトルを生成する。なお、文を単語に分割
して品詞を付与する方法としては、奈良先端大学で開発
された形態素解析プログラム「茶筅」のようなプログラ
ムが利用可能である。
【0032】図4は、読み込んだマルチメディアデータ
項目群中の単語「馬」、「電車」および「赤い」にそれ
ぞれ対応する単語共起ベクトルを示す。これら以外の単
語共起語についてもそれぞれ単語共起ベクトルが生成さ
れ記憶される。
【0033】なお、マルチメディアデータ項目群中に同
一単語が複数存在するときは、一旦それぞれの単語共起
ベクトルを求め、その中の同一要素同士を加算し、そし
て、加算された結果を要素とするベクトルを単語共起ベ
クトルとして単語共起ベクトルDB12に保存する。
【0034】次に、ステップS3で画像共起ベクトル生
成手段13は、画像共起ベクトルを生成し画像共起ベク
トルDB14に保存する。かかる生成手順は、マルチメ
ディアデータ共起ベクトル生成手順に相当し、保存まで
を含めた手順はマルチメディアデータ共起ベクトル生成
蓄積手順に相当する。
【0035】例えば、「馬の画像」の前後にある文「高
原の牧場で飼育されている。」と「鬣(たてがみ)が豊
かで栗毛の体毛がある。」の中から、名詞/動詞/形容
詞/形容動詞を選択し、さらに、その中から「する」、
「ある」および代名詞を除いたものを、「馬の画像」と
関連する画像共起語として選択する。このようにして、
「馬の画像」に対する画像共起語「高原」、「牧場」、
「飼育」、「鬣」、「豊か」、「栗毛」および「体毛」
が得られる。
【0036】図5は、読み込んだマルチメディアデータ
項目群中の「馬の画像」、「豚の画像」および「自動車
の画像」にそれぞれ対応する画像共起ベクトルを示す。
これら以外の画像についてもそれぞれ画像共起ベクトル
が生成され記憶される。
【0037】なお、マルチメディアデータ項目群中に同
一画像が複数存在するときは、一旦それぞれの画像共起
ベクトルを求め、その中の同一要素同士を加算し、そし
て、加算された結果を要素とするベクトルを画像共起ベ
クトルとして画像共起ベクトルDB14に保存する。
【0038】なお、この画像共起語としての選択基準
は、単語共起語に用いた基準と同一とするが、画像前後
における所定数の単語に関連性があると定める方法や、
画像が含まれる段落中の全ての単語に関連性があると定
める方法といった、画像の位置情報とその周辺のテキス
トの言語情報を利用したものであればどのようなもので
あってもよい。
【0039】ところで、上記説明において単語共起語お
よび画像共起語は、マルチメディアデータ項目群の中の
単語または画像との関連性を基にマルチメディアデータ
項目群の中から選択したが、予め単語共起語または画像
共起語として適当なものを単語共起ベクトルDB12ま
たは画像共起ベクトルDB14に記憶させておき、マル
チメディアデータ項目群におけるこれら単語の出現頻度
を要素とするベクトルを単語共起ベクトルまたは画像共
起ベクトルとしてもよい。
【0040】図6は、類似度の演算処理を示すフローチ
ャートである。なお、以下の手順は類似度演算手順に相
当する。
【0041】ステップS4で類似度演算手段15は、例
えば、ユーザによってキーボード入力された単語および
画像idを入力する。ここでは、図4の単語共起ベクト
ルDB12中の単語「馬」と、図5の画像共起ベクトル
DB14中の馬の画像に対応する画像id1を入力した
こととする。なお、単語「馬」に替えて単語id2を入
力してもよい。つまり、コンピュータ1Aは単語および
画像の指定が受けらればよい。したがって、パターン認
識などによって画像同士の同一性あるいは類似性判断が
可能な機能を備えていれば、画像自体の入力によって指
定を受けることが可能となる。
【0042】ステップS5で類似度演算手段15は、指
定された単語に対応する単語共起ベクトルを単語共起ベ
クトルDB12から読み込む。つまり、単語共起ベクト
ルDB12より単語id2に対応する単語共起ベクトル
(2,4,3,5,1,3,1,5)を読み込む。ま
た、ステップS6で類似度演算手段15は、指定された
画像に対応する画像共起ベクトルを画像共起ベクトルD
B14から読み込む。つまり画像共起ベクトルDB14
より画像id1に対応する画像共起ベクトル(1,1,
1,1,1,1,0,1)を読み込む。そして、ステッ
プS7で類似度演算手段15は、読み込んだ単語共起ベ
クトルと画像共起ベクトルを用いて類似度を演算する。
【0043】ここでは、2つのベクトルのなす角度の余
弦を類似度とする。類似度は、次式(1)のように、2
つのベクトルの内積を個々のベクトルの長さの積で除算
した値、約0.916となる。
【0044】
【数1】 類似度の計算方法は、共通して値が0ではないベクトル
中の要素数の割合を類似度とする方法や、2つのベクト
ルの距離の逆数といった、ベクトルの要素を基底とする
多次元空間上で2つのベクトルが近いほど値が大きくな
る指数であればどのようなものであってもよい。
【0045】そして、ステップS8で、類似度演算手段
15は、演算により求めた類似度0.916を、画像i
dに対応する「馬の画像」と単語「馬」の類似度とし
て、例えば、ディスプレイ装置やプリンタ、またはユー
ザが指定したファイルなどに出力する。
【0046】したがって、第1の実施の形態に係るコン
ピュータ1Aによれば、単語共起ベクトルと画像共起ベ
クトルを演算することにより類似度を求めるようにして
いるので、ファイル名などによって意味づけされていな
いマルチメディアデータと単語との関連性を判断するこ
とができる。
【0047】したがって、マルチメディアデータと単語
の関係が曖昧なマルチメディアデータ項目群であって
も、これらから一旦単語共起ベクトルおよび画像共起ベ
クトルを生成し記憶しておけば、後からマルチメディア
データが指定された場合であっても、そのマルチメディ
アデータの意味を知ることができるようになる。
【0048】[第2の実施の形態]図7は、第2の実施の
形態に係るコンピュータ1Bの構成図である。
【0049】コンピュータ1Bは、コンピュータ1A
に、マルチメディアデータ検索手段に相当する類似画像
検索手段16を加えて構成される。類似画像検索手段1
6は、単語共起ベクトルDB12に記憶された単語が指
定されたときに該指定された単語に類似する画像を求め
て出力する。なお、単語共起ベクトル生成手段11が単
語共起ベクトルDB12を生成し、画像共起ベクトル生
成手段13が画像共起ベクトルDB14を生成し、そし
て保存蓄積するまでの処理は第1の実施の形態と同一で
あるので説明を省略する。
【0050】次に、コンピュータ1Bの動作を説明す
る。なお、以下の手順はマルチメディアデータ検索手順
に相当する。
【0051】類似画像検索手段16は、単語共起ベクト
ルDB12中の任意の単語(例えば、「馬」)が入力さ
れると、画像共起ベクトルDB14の中から全画像id
を読み出し、その各画像idと入力された単語「馬」と
をそれぞれ組にして、類似度演算手段15に出力する。
類似度演算手段15は上述した演算により類似度を求
め、類似画像検索手段16に出力する。
【0052】具体的に類似度演算手段15は、単語
「馬」と画像共起ベクトルDB14中の画像id=1,
2,3の画像それぞれに対して類似度を演算する。類似
度の演算方法は、第1の実施形態と同一である。すなわ
ち、画像共起ベクトルと単語共起ベクトルのなす角の余
弦とした場合、id=1の「馬の画像」と単語「馬」と
の類似度は、次式(2)に示すように、画像共起ベクト
ル(1,1,1,1,1,1,0,1)と、単語共起ベ
クトル(2,4,3,5,1,3,1,5)のなす角の
余弦であり、その値は約0.916となる。
【0053】
【数2】 また、id=2の「豚の画像」と単語「馬」の類似度
は、次式(3)に示すように、画像共起ベクトル(0,
0,2,0,0,0,1,1)と、単語共起ベクトル
(2,4,3,5,1,3,1,5)のなす角の余弦で
あり、その値は約0.516となる。
【0054】
【数3】 最後に、id=3の「自動車の画像」と単語「馬」の類
似度は、次式(4)に示すように、画像共起ベクトル
(0,0,0,0,1,0,1,0)と、単語共起ベク
トル(2,4,3,5,1,3,1,5)のなす角の余
弦であり、その値は約0.149となる。
【0055】
【数4】 類似画像検索手段16は、これら類似度を入力すると、
その中から最大の類似度を与える画像共起ベクトル
(1,1,1,1,1,1,0,1)に対応するid=
1の「馬の画像」を画像共起ベクトルDB14から読み
込み、入力された単語「馬」に類似する画像として出力
する。なお、複数の候補の中から画像を選択して出力す
る方法としては、最も類似度が高い画像共起ベクトルに
対応する画像を出力する方法、類似度が一定値(例えば
0.7)以上の画像共起ベクトルに対応する画像を出力
する方法というように、類似度に基づく方法ならば、ど
のような方法であってもよい。
【0056】したがって、第2の実施の形態に係るコン
ピュータ1Bによれば、単語共起ベクトルとマルチメデ
ィアデータ共起ベクトルとを用いて、指定された単語に
類似するマルチメディアデータを求めるようにしている
ので、画像などのマルチメディアデータに、その意味を
表すファイル名など逐一付与しなくとも画像検索が出来
るようになる。その結果、インターネットから収集され
る種々雑多な情報を基にしたマルチメディアデータデー
タベースなどを構築しておけば、希望のマルチメディア
データをいつでも呼び出すことができるようになる。
【0057】[第3の実施の形態]図8は、第3の実施の
形態に係るコンピュータ1Cの構成図である。
【0058】コンピュータ1Cは、コンピュータ1A
に、単語検索手段に相当する類似語検索手段17を加え
て構成される。類似語検索手段17は、画像共起ベクト
ルDB14に記憶された画像idが指定されたときに、
該指定された画像idに対応する画像に類似する単語を
求めて出力する。なお、単語共起ベクトルDB12およ
び画像共起ベクトルDB14の作成蓄積までの処理は第
1および第2の実施の形態と同一であるので説明を省略
する。
【0059】次に、コンピュータ1Cの動作を説明す
る。なお、以下の手順は単語検索手順に相当する。
【0060】類似語検索手段17は、画像共起ベクトル
DB14中の任意の画像id(例えば、「馬の画像」に
対応する画像id2)が入力されると、単語共起ベクト
ルDB12の中から全単語idを読み出し、その各単語
idと入力された画像id2とをそれぞれ組にして、類
似度演算手段15に出力する。類似度演算手段15は上
述した演算により類似度を求め、類似画像検索手段16
に出力する。
【0061】具体的には、類似度演算手段15は、画像
id1と単語共起ベクトルDB中の単語「電車」、
「馬」、「赤い」のそれぞれに対して類似度を演算す
る。類似度の演算方法は、第1の実施形態と同一であ
る。すなわち、画像共起ベクトルと単語共起ベクトルの
なす角の余弦とした場合、id=1の「馬の画像」と単
語「電車」の類似度は、次式(5)に示すように、画像
共起ベクトル(1,1,1,1,1,1,0,1)と、
単語共起ベクトル(2,1,0,0,2,0,3,0)
のなす角の余弦であり、その値は約0.445となる。
【0062】
【数5】 また、「馬の画像」と単語「馬」の類似度は、次式
(6)に示すように、画像共起ベクトル(1,1,1,
1,1,1,0,1)と、単語共起ベクトル(2,4,
3,5,1,3,1,5)のなす角の余弦であり、その
値は約0.916となる。
【0063】
【数6】 最後に、「馬の画像」と単語「赤い」の類似度は、次式
(7)に示すように、画像共起ベクトル(1,1,1,
1,1,1,0,1)と、単語共起ベクトル(0,0,
0,0,5,2,1,2)のなす角の余弦であり、その
値は約0.583となる。
【0064】
【数7】 類似語検索手段17は、これら類似度を入力すると、そ
の中から最大の類似度を与える画像共起ベクトル(1,
1,1,1,1,1,0,1)に対応する単語「馬」を
単語共起ベクトルDB12から読み込み、入力された馬
の画像id2に類似する単語として出力する。なお、複
数の候補の中から単語を選択して出力する方法として
は、最も類似度が高い単語共起ベクトルに対応する単語
を出力する方法、類似度が一定値(例えば0.7)以上
の単語共起ベクトルに対応する単語を出力する方法とい
うように、類似度に基づく方法ならば、どのような方法
であってもよい。
【0065】したがって、第3の実施の形態に係るコン
ピュータ1Cによれば、単語共起ベクトルとマルチメデ
ィアデータ共起ベクトルとを用いて、指定されたマルチ
メディアデータに類似する単語を求めるようにしている
ので、逐一画像や音声を見てあるいは聞いて内容確認し
なくとも、そのマルチメディアデータの表す意味が分か
るようになる。その結果、上述したマルチメディアデー
タデータベースなどを構築しておけば、マルチメディア
データに類似する単語をいつでも呼び出すことができる
ようになる。また、求められた単語を音声合成によって
出力すれば、目の不自由な人であっても、画像が表す意
味を知ることが出来るようになる。
【0066】[第4の実施の形態]図9は、第4の実施の
形態に係るクライアントサーバシステムの構成図であ
る。サーバ10は、単語共起ベクトル生成手段11、単
語共起ベクトルDB12、画像共起ベクトル生成手段1
3、画像共起ベクトルDB14、類似度演算手段15、
類似画像検索手段16および類似語検索手段17を備え
る。したがって、上記実施の形態で説明した全ての処理
が可能である。サーバ10は、通信回線を介して接続さ
れた各クライアント20,20からの要求に応じて以下
のように処理を行う。なお、クライアントサーバシステ
ムは、インターネットを介して構成されるものであって
も良い。
【0067】図10および図11は、図9に示すクライ
アントおよびサーバ間の動作などを示すシーケンス図で
ある。
【0068】図10のステップS21でクライアント2
0が、マルチメディアデータ項目群を送信すると、ステ
ップS22でサーバ10は、送信されたマルチメディア
データ項目群から単語共起ベクトルを生成し、単語共起
ベクトルDB12に保存する。また、ステップS23で
サーバ10は、送信されたマルチメディアデータ項目群
から画像共起ベクトルを生成し、画像共起ベクトルDB
14に保存する。
【0069】図11のステップS31でクライアント2
0が、画像idと単語「馬」を送信すると、ステップS
32でサーバ10は、送信された画像idと単語「馬」
から類似度を演算し、ステップS33で、演算された類
似度をクライアント20に送信する。
【0070】また、ステップS41でクライアント20
が、単語「馬」を送信すると、ステップS41でサーバ
10が、送信された単語「馬」を基に画像を検索し、ス
テップS43で、検索された「馬の画像」をクライアン
ト20に送信する。
【0071】また、ステップS51でクライアント20
が、画像id1を送信すると、ステップS51でサーバ
10が、送信された画像id1を基に単語「馬」を検索
し、ステップS43で、検索された単語「馬」をクライ
アント20に送信する。
【0072】したがって、第4の実施の形態に係るサー
バ10によれば、ネットワークを介して受信される文章
を基に単語共起ベクトル、マルチメディアデータ共起ベ
クトルを生成し、指定されたマルチメディアデータに類
似する単語、指定された単語に類似するマルチメディア
データ、あるいは指定されたマルチメディアデータおよ
び単語の類似度を、生成した単語共起ベクトルおよびマ
ルチメディアデータベクトルを用いて求め、そしてクラ
イアントに送信するようにしているので、サーバから離
れた場所においても、マルチメディアデータに類似する
単語、単語に類似するマルチメディアデータ、マルチメ
ディアデータと単語の類似度を知ることが出来る。
【0073】なお、上記説明した処理を行うための、処
理プログラムはマルチメディア情報処理プログラムに相
当するものであり、半導体メモリ、磁気ディスク、光デ
ィスク、光磁気ディスク、磁気テープなどのコンピュー
タ読み取り可能な記録媒体に格納することで流通可能に
なる。従って、任意のコンピュータに、この記録媒体を
セットし、処理プログラムを読み込ませて実行すること
により、本発明と同様の作用が得られ、その結果、その
コンピュータ上で本発明と同様の効果を得ることができ
る。
【0074】
【発明の効果】以上説明したように、本発明によれば、
単語とマルチメディアデータの類似性を得ることができ
る。これにより、ファイル名などによって意味づけされ
ていないマルチメディアデータと単語との関連性を判断
することができる。
【0075】また、本発明によれば、単語に類似するマ
ルチメディアデータを検索することができる。これによ
り、画像などのマルチメディアデータに逐一ファイル名
など付与しなくとも済むようになる。
【0076】また、本発明によれば、マルチメディアデ
ータに類似する単語を検索することができる。これによ
り、逐一画像や音声を見てあるいは聞いて内容確認しな
くとも、そのマルチメディアデータの表す意味が分かる
ようになる。
【0077】また、本発明によれば、サーバから離れた
場所においても、マルチメディアデータに類似する単
語、単語に類似するマルチメディアデータ、マルチメデ
ィアデータと単語の類似度を知ることが出来る。
【図面の簡単な説明】
【図1】図1は、本発明の第1の実施の形態に係るコン
ピュータ1Aの構成図である。
【図2】マルチメディアデータ項目の一例を示す図であ
る。
【図3】単語共起ベクトルおよび画像共起ベクトルの生
成、保存を示すフローチャートである。
【図4】単語共起ベクトルDB12に記憶される単語共
起ベクトルを示す図である。
【図5】画像共起ベクトルDB14に記憶される画像共
起ベクトルを示す図である。
【図6】類似度の演算処理を示すフローチャートであ
る。
【図7】第2の実施の形態に係るコンピュータ1Bの構
成図である。
【図8】第3の実施の形態に係るコンピュータ1Cの構
成図である。
【図9】第4の実施の形態に係るクライアントサーバシ
ステムの構成図である。
【図10】クライアントおよびサーバ間の動作などを示
すシーケンス図である。
【図11】クライアントおよびサーバ間の動作などを示
すシーケンス図である。
【符号の説明】
1A,1B,1C コンピュータ 10 サーバ 11 単語共起ベクトル生成手段 12 単語共起ベクトルDB 13 画像共起ベクトル生成手段 14 画像共起ベクトルDB 15 類似度演算手段 16 類似画像検索手段 17 類似語検索手段 20 クライアント
───────────────────────────────────────────────────── フロントページの続き (72)発明者 加藤 恒昭 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 Fターム(参考) 5B075 ND16 NK35 PQ02 PR04 PR06 QM08

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 文章中の同一文字列の単語についてその
    近くに現れる1または複数の単語の出現頻度を要素とす
    る単語共起ベクトルが記憶される単語共起ベクトル記憶
    手段と、 文章中のマルチメディアデータ近くに現れる1または複
    数の単語の出現頻度を要素とするマルチメディアデータ
    共起ベクトルが記憶されるマルチメディアデータ共起ベ
    クトル記憶手段と、 前記文章中の単語およびマルチメディアデータが指定さ
    れたときに前記単語共起ベクトル記憶手段に記憶された
    単語共起ベクトルと前記マルチメディアデータ共起ベク
    トル記憶手段に記憶されたマルチメディアデータ共起ベ
    クトルとを用いて当該指定された単語およびマルチメデ
    ィアデータの類似度を求める類似度演算手段とを備える
    マルチメディア情報処理装置。
  2. 【請求項2】 文章中の同一文字列の単語についてその
    近くに現れる1または複数の単語の出現頻度を要素とす
    る単語共起ベクトルが記憶される単語共起ベクトル記憶
    手段と、 文章中のマルチメディアデータ近くに現れる1または複
    数の単語の出現頻度を要素とするマルチメディアデータ
    共起ベクトルが蓄積されるマルチメディアデータ共起ベ
    クトル記憶手段と、 前記文章中の単語が指定されたときに前記単語共起ベク
    トル記憶手段に記憶された単語共起ベクトルと前記マル
    チメディアデータ共起ベクトル記憶手段に蓄積されたマ
    ルチメディアデータ共起ベクトルとを用いて当該指定さ
    れた単語に類似するマルチメディアデータを求めるマル
    チメディアデータ検索手段とを備えるマルチメディア情
    報処理装置。
  3. 【請求項3】 文章中の同一文字列の単語についてその
    近くに現れる1または複数の単語の出現頻度を要素とす
    る単語共起ベクトルが蓄積される単語共起ベクトル記憶
    手段と、 文章中のマルチメディアデータ近くに現れる1または複
    数の単語の出現頻度を要素とするマルチメディアデータ
    共起ベクトルが記憶されるマルチメディアデータ共起ベ
    クトル記憶手段と、 前記文章中のマルチメディアデータが指定されたときに
    前記単語共起ベクトル記憶手段に蓄積された単語共起ベ
    クトルと前記マルチメディアデータ共起ベクトル記憶手
    段に記憶されたマルチメディアデータ共起ベクトルとを
    用いて当該指定されたマルチメディアデータに類似する
    単語を求める単語検索手段とを備えるマルチメディア情
    報処理装置。
  4. 【請求項4】 前記単語共起ベクトルを生成する単語共
    起ベクトル生成手段またはマルチメディアデータ共起ベ
    クトルを生成するマルチメディアデータ共起ベクトル生
    成手段を備えることを特徴とする請求項1ないし請求項
    3のいずれかに記載のマルチメディア情報処理装置。
  5. 【請求項5】 ネットワークを介して受信される前記単
    語が含まれる文章を基に前記単語共起ベクトルを生成す
    る単語共起ベクトル生成手段またはネットワークを介し
    て受信される前記マルチメディアデータを含む文章を基
    に前記マルチメディアデータ共起ベクトルを生成するマ
    ルチメディアデータ共起ベクトル生成手段を備えること
    を特徴とする請求項1ないし請求項3のいずれかに記載
    のマルチメディア情報処理装置。
  6. 【請求項6】 前記単語、マルチメディアデータまたは
    該単語およびマルチメディアデータの指定がネットワー
    クを介してなされるときに当該指定により求められたマ
    ルチメディアデータ、単語または類似度をネットワーク
    を介して供給することを特徴とする請求項1ないし請求
    項5のいずれかに記載のマルチメディア情報処理装置。
  7. 【請求項7】 文章中の同一文字列の単語についてその
    近くに現れる1または複数の単語の出現頻度を要素とす
    る単語共起ベクトルを生成する単語共起ベクトル生成手
    順と、 文章中のマルチメディアデータ近くに現れる1または複
    数の単語の出現頻度を要素とするマルチメディアデータ
    共起ベクトルを生成するマルチメディアデータ共起ベク
    トル生成手順と、 前記文章中の単語およびマルチメディアデータが指定さ
    れたときに前記生成された単語共起ベクトルとマルチメ
    ディアデータ共起ベクトルとを用いて当該指定された単
    語およびマルチメディアデータの類似度を求める類似度
    演算手順とを備えるマルチメディア情報処理方法。
  8. 【請求項8】 文章中の同一文字列の単語についてその
    近くに現れる1または複数の単語の出現頻度を要素とす
    る単語共起ベクトルを生成する単語共起ベクトル生成手
    順と、 文章中のマルチメディアデータ近くに現れる1または複
    数の単語の出現頻度を要素とするマルチメディアデータ
    共起ベクトルを生成蓄積するマルチメディアデータ共起
    ベクトル生成蓄積手順と、 前記文章中の単語が指定されたときに前記生成された単
    語共起ベクトルと蓄積されたマルチメディアデータ共起
    ベクトルとを用いて当該指定された単語に類似するマル
    チメディアデータを求めるマルチメディアデータ検索手
    順とを備えるマルチメディア情報処理方法。
  9. 【請求項9】 文章中の同一文字列の単語についてその
    近くに現れる1または複数の単語の出現頻度を要素とす
    る単語共起ベクトルを生成蓄積する単語共起ベクトル生
    成蓄積手順と、 文章中のマルチメディアデータ近くに現れる1または複
    数の単語の出現頻度を要素とするマルチメディアデータ
    共起ベクトルを生成するマルチメディアデータ共起ベク
    トル生成手順と、 前記文章中のマルチメディアデータが指定されたときに
    前記蓄積された単語共起ベクトルと前記生成されたマル
    チメディアデータ共起ベクトルとを用いて当該指定され
    たマルチメディアデータに類似する単語を求める単語検
    索手順とを備えるマルチメディア情報処理方法。
  10. 【請求項10】 文章中の同一文字列の単語についてそ
    の近くに現れる1または複数の単語の出現頻度を要素と
    する単語共起ベクトルを生成する単語共起ベクトル生成
    手順と、 文章中のマルチメディアデータ近くに現れる1または複
    数の単語の出現頻度を要素とするマルチメディアデータ
    共起ベクトルを生成するマルチメディアデータ共起ベク
    トル生成手順と、 前記文章中の単語およびマルチメディアデータが指定さ
    れたときに前記生成された単語共起ベクトルとマルチメ
    ディアデータ共起ベクトルとを用いて当該指定された単
    語およびマルチメディアデータの類似度を求める類似度
    演算手順とを備えるマルチメディア情報処理プログラム
    が記録されたコンピュータ読み取り可能な記録媒体。
  11. 【請求項11】 文章中の同一文字列の単語についてそ
    の近くに現れる1または複数の単語の出現頻度を要素と
    する単語共起ベクトルを生成する単語共起ベクトル生成
    手順と、 文章中のマルチメディアデータ近くに現れる1または複
    数の単語の出現頻度を要素とするマルチメディアデータ
    共起ベクトルを生成蓄積するマルチメディアデータ共起
    ベクトル生成蓄積手順と、 前記文章中の単語が指定されたときに前記生成された単
    語共起ベクトルと蓄積されたマルチメディアデータ共起
    ベクトルとを用いて当該指定された単語に類似するマル
    チメディアデータを求めるマルチメディアデータ検索手
    順とを備えるマルチメディア情報処理プログラムが記録
    されたコンピュータ読み取り可能な記録媒体。
  12. 【請求項12】 文章中の同一文字列の単語についてそ
    の近くに現れる1または複数の単語の出現頻度を要素と
    する単語共起ベクトルを生成蓄積する単語共起ベクトル
    生成蓄積手順と、 文章中のマルチメディアデータ近くに現れる1または複
    数の単語の出現頻度を要素とするマルチメディアデータ
    共起ベクトルを生成するマルチメディアデータ共起ベク
    トル生成手順と、 前記文章中のマルチメディアデータが指定されたときに
    前記蓄積された単語共起ベクトルと前記生成されたマル
    チメディアデータ共起ベクトルとを用いて当該指定され
    たマルチメディアデータに類似する単語を求める単語検
    索手順とを備えるマルチメディア情報処理プログラムが
    記録されたコンピュータ読み取り可能な記録媒体。
JP2000319733A 2000-10-19 2000-10-19 マルチメディア情報処理装置、マルチメディア情報処理方法およびそのプログラムが記録されたコンピュータ読み取り可能な記録媒体 Pending JP2002132823A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000319733A JP2002132823A (ja) 2000-10-19 2000-10-19 マルチメディア情報処理装置、マルチメディア情報処理方法およびそのプログラムが記録されたコンピュータ読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000319733A JP2002132823A (ja) 2000-10-19 2000-10-19 マルチメディア情報処理装置、マルチメディア情報処理方法およびそのプログラムが記録されたコンピュータ読み取り可能な記録媒体

Publications (1)

Publication Number Publication Date
JP2002132823A true JP2002132823A (ja) 2002-05-10

Family

ID=18798140

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000319733A Pending JP2002132823A (ja) 2000-10-19 2000-10-19 マルチメディア情報処理装置、マルチメディア情報処理方法およびそのプログラムが記録されたコンピュータ読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JP2002132823A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011099072A1 (ja) * 2010-02-10 2011-08-18 株式会社 東芝 パターン識別装置
JP2020174338A (ja) * 2019-04-08 2020-10-22 バイドゥ ドットコム タイムス テクノロジー (ベイジン) カンパニー リミテッド 情報を生成するための方法、装置、サーバー、コンピュータ可読記憶媒体およびコンピュータプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011099072A1 (ja) * 2010-02-10 2011-08-18 株式会社 東芝 パターン識別装置
JP5349622B2 (ja) * 2010-02-10 2013-11-20 株式会社東芝 パターン識別装置
JP2020174338A (ja) * 2019-04-08 2020-10-22 バイドゥ ドットコム タイムス テクノロジー (ベイジン) カンパニー リミテッド 情報を生成するための方法、装置、サーバー、コンピュータ可読記憶媒体およびコンピュータプログラム
JP7108259B2 (ja) 2019-04-08 2022-07-28 バイドゥドットコム タイムズ テクノロジー (ベイジン) カンパニー リミテッド 情報を生成するための方法、装置、サーバー、コンピュータ可読記憶媒体およびコンピュータプログラム

Similar Documents

Publication Publication Date Title
JP5671557B2 (ja) クライアント・コンピューティング・デバイスを含むシステム、メディア・オブジェクトにタグ付けする方法、および音声タグ付きメディア・オブジェクトを含むデジタル・データベースをサーチする方法
US6662152B2 (en) Information retrieval apparatus and information retrieval method
US7225128B2 (en) System and method for providing information using spoken dialogue interface
JP5257071B2 (ja) 類似度計算装置及び情報検索装置
JPWO2008114811A1 (ja) 情報検索システム、情報検索方法及び情報検索用プログラム
JP2015525929A (ja) 検索品質を改善するための重みベースのステミング
JP2007241888A (ja) 情報処理装置および方法、並びにプログラム
CN113806588B (zh) 搜索视频的方法和装置
AU2018250372A1 (en) Method to construct content based on a content repository
JP2007018068A (ja) 情報検索装置、情報検索方法および情報検索プログラム
JP2004157931A (ja) 意図文型種別抽出方式
JP4848397B2 (ja) 関連クエリ導出装置、関連クエリ導出方法及びプログラム
JP4120597B2 (ja) 部分コンテンツ作成方法及び装置及びプログラム
JP2002132823A (ja) マルチメディア情報処理装置、マルチメディア情報処理方法およびそのプログラムが記録されたコンピュータ読み取り可能な記録媒体
JP2002288189A (ja) 文書分類方法及び文書分類装置並びに文書分類処理プログラムを記録した記録媒体
JP6687078B2 (ja) 会議支援装置、会議支援装置の制御方法、及びプログラム
JP2018160058A (ja) 話者検索装置、話者検索方法、および話者検索プログラム
JP2005025418A (ja) 質問応答装置、質疑応答方法及びプログラム
JPH10307837A (ja) 検索装置並びに検索プログラムを記録した記録媒体
JP6843689B2 (ja) コンテキストに応じた対話シナリオを生成する装置、プログラム及び方法
JP2002092017A (ja) 概念辞書拡張方法、装置、および概念辞書拡張プログラムを記録した記録媒体
JP2001101184A (ja) 構造化文書生成方法及び装置及び構造化文書生成プログラムを格納した記憶媒体
JP2001022756A (ja) 音声対話型情報検索システムおよび記録媒体
JP2007293602A (ja) 映像検索システム、映像検索方法およびプログラム
JP6114980B2 (ja) 楽曲処理装置および楽曲処理方法