JPH10301953A - 画像管理装置、画像検索装置、画像管理方法、画像検索方法およびそれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents

画像管理装置、画像検索装置、画像管理方法、画像検索方法およびそれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体

Info

Publication number
JPH10301953A
JPH10301953A JP9111504A JP11150497A JPH10301953A JP H10301953 A JPH10301953 A JP H10301953A JP 9111504 A JP9111504 A JP 9111504A JP 11150497 A JP11150497 A JP 11150497A JP H10301953 A JPH10301953 A JP H10301953A
Authority
JP
Japan
Prior art keywords
image
natural language
data
language data
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9111504A
Other languages
English (en)
Inventor
Kazunobu Ukikawa
和宣 浮川
Hatsuko Ukikawa
初子 浮川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JustSystems Corp
Original Assignee
JustSystems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JustSystems Corp filed Critical JustSystems Corp
Priority to JP9111504A priority Critical patent/JPH10301953A/ja
Priority to US09/005,148 priority patent/US6161108A/en
Publication of JPH10301953A publication Critical patent/JPH10301953A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99948Application of database or data structure, e.g. distributed, multimedia, or image

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 所望の画像をより確実に、かつ効率的に検索
できるようにすることを課題とする。 【解決手段】 画像データベース5に画像データとその
画像データに基づいて形成される画像についての視覚的
印象を示す自然言語データとを関連付けて記憶してお
き、検索部6による検索の際に、自然言語入力部2より
検索文を示す自然言語データを入力し、これを画像デー
タベース5上の自然言語データに照合することで、視覚
的印象が共通する自然言語データに関連した画像データ
を画像データベース5から抽出する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、自然言語を用い
て画像を管理する画像管理装置およびその方法、自然言
語を用いて画像を検索する画像検索装置およびその方
法、ならびに、それらの方法をコンピュータに実行させ
るプログラムを記録したコンピュータ読み取り可能な記
録媒体に関する。
【0002】
【従来の技術】従来、自然言語を用いて画像を検索する
技術は、特開平4−180175号公報,同4−264
972号公報,同6−176121号公報,同7−33
4507号公報,同8−138075号公報などにより
提案されている。各公報によれば、入力された自然言語
について形態素解析などの言語解析を行うことでその内
容を解釈し、その内容に適した画像を検索するという技
術が開示されている。
【0003】この技術において、画像にはその画像の輪
郭などの属性情報が予め関連付けて記憶されており、言
語解析の結果を属性情報に照らし合わせることで所望の
画像を取得することができる。
【0004】また、上述した公報による技術に限らず、
一般的に画像に関連付けて記憶する属性情報としては、
ファイリングの日時,オペレータの氏名,画像の種別
(写真,絵,文書など)などがあり、ユーザはこれら属
性情報を検索の手がかりとして利用している。
【0005】
【発明が解決しようとする課題】上記公報のように従来
例による技術は、画像に対して検索キーとなる属性情報
を予め付加しておくので、検索の際に、その属性情報に
関連する自然言語を与えれば、所望の画像を得ることが
できるが、その属性情報がほとんど客観的かつ必要最小
限の情報であることから、ユーザがメモでもしない限り
忘れてしまう虞があった。それゆえ、検索の際に、ユー
ザが検索キーとなる属性情報を忘れてしまったり、記憶
にある属性情報について半信半疑であった場合には、所
望の画像がもつ属性情報から外れた内容の自然言語デー
タを与える可能性が大きくなるので、膨大な画像の中か
ら所望の画像を見つけ出すことは困難であるという問題
があった。
【0006】この発明は、上述した従来例による問題を
解消するため、属性情報に関係なく所望の画像をアクセ
スしやすい画像管理装置,その方法およびその方法をコ
ンピュータに実行させるプログラムを記録したコンピュ
ータ読み取り可能な記録媒体を得ることを目的とする。
【0007】また、この発明は、上述した従来例による
問題を解消するため、所望の画像をより確実に、かつ効
率的に検索することが可能な画像検索装置,その方法お
よびその方法をコンピュータに実行させるプログラムを
記録したコンピュータ読み取り可能な記録媒体を得るこ
とを他の目的とする。
【0008】なお、近似技術として、特開平6−131
403号公報のように、単語(見出し語)に対して自然
言語,画像情報および音声情報を項目として関連付けて
登録した辞書が開示されているものがあるが、画像の検
索に関して自然言語と画像との関連付けは技術的に開示
されていない。
【0009】
【課題を解決するための手段】上述した課題を解決し、
目的を達成するため、請求項1の発明に係る画像管理装
置は、画像データをデータベース化して管理する画像管
理装置において、画像データと該画像データに基づいて
形成される画像についての視覚的印象を示す自然言語デ
ータとを関連付けて記憶したことを特徴とする。
【0010】この請求項1によれば、画像データとその
画像データに基づいて形成される画像の視覚的印象を示
す自然言語データとを関連付けて記憶したので、画像を
視覚的印象がもつ主観的な要素でデータベース化するこ
とが可能である。
【0011】また、請求項2の発明に係る画像管理装置
は、画像データをデータベース化して管理する画像管理
装置において、画像データとその画像データに基づいて
形成される画像についての視覚的印象を示す自然言語デ
ータとを関連付けて記憶する画像データベースを有し、
画像データベースは、ある視覚的印象を用いてアクセス
され、かつ、ある視覚的印象が自データベース上の自然
言語データで示される視覚的印象の一部であった場合、
ある視覚的印象を含む自然言語データに関連する画像デ
ータを応答することを特徴とする。
【0012】この請求項2によれば、画像データベース
に画像データとその画像データに基づいて形成される画
像の視覚的印象を示す自然言語データとを関連付けて記
憶しておき、画像データベース上のある視覚的印象の自
然言語データでアクセスが行われた場合にその自然言語
データに関連する画像データを応答するようにしたの
で、属性情報に関係なく視覚的印象すなわち主観的な印
象でのアクセスが可能となり、これによって、所望の画
像をアクセスすることが容易になる。
【0013】また、請求項3の発明に係る画像管理装置
は、請求項1または2の発明において、さらに、キー操
作,音声認識,画像認識などを通じて自然言語データを
入力する入力手段を有し、入力手段により入力された自
然言語データを画像データに関連付けて記憶することを
特徴とする。
【0014】この請求項3によれば、画像データに関連
付けて記憶するための自然言語データをキー操作,音声
認識,画像認識などを通じて入力するようにしたので、
画像の客観性にとらわれることなく、各画像に主観性の
ある視覚的情報を与えることが可能である。
【0015】また、請求項4の発明に係る画像管理装置
は、請求項1〜3のいずれか一つの発明において、画像
データは静止画データ,動画データなどのデータである
ことを特徴とする。
【0016】この請求項4によれば、画像データを静止
画データ,動画データなどのデータとしたので、画像の
種別に関係なく、各画像に任意の視覚的情報を与えるこ
とが可能である。
【0017】また、請求項5の発明に係る画像検索装置
は、画像データと画像データに基づいて形成される画像
についての視覚的印象を示す自然言語データとを関連付
けて記憶する画像データベースと、検索文を示す自然言
語データを入力する検索文入力手段と、画像データベー
スに記憶された自然言語データに対して検索文入力手段
により入力された自然言語データを照合し、その照合結
果に応じて視覚的印象が共通する自然言語データに関連
した画像データを画像データベースから抽出する検索手
段と、を備えたことを特徴とする。
【0018】この請求項5によれば、画像データベース
に画像データとその画像データに基づいて形成される画
像についての視覚的印象を示す自然言語データとを関連
付けて記憶しておき、検索文を示す自然言語データを入
力して画像データベース上の自然言語データに照合する
ことで、視覚的印象が共通する自然言語データに関連し
た画像データを画像データベースから抽出するようにし
たので、画像の属性情報を知らなくても視覚的印象すな
わち主観的な印象だけで画像が検索され、これによっ
て、所望の画像をより確実に、かつ効率的に検索するこ
とが可能である。
【0019】また、請求項6の発明に係る画像検索装置
は、請求項5の発明において、検索手段は画像データベ
ースに記憶された自然言語データと検索文入力手段によ
り入力された自然言語データとを言語解析してから照合
することを特徴とする。
【0020】この請求項6によれば、検索の際に、画像
データベースに記憶された自然言語データと入力された
自然言語データとを言語解析してから照合するようにし
たので、視覚的印象の意味に適した精度の高い照合が可
能となる。
【0021】また、請求項7の発明に係る画像検索装置
は、請求項5または6の発明において、検索手段は照合
結果に応じて類似度の高い方から昇順で複数の画像デー
タを抽出することを特徴とする。
【0022】この請求項7によれば、検索の際に、照合
結果に応じて類似度の高い方から昇順で複数の画像デー
タを抽出するようにしたので、視覚的印象に近い複数の
画像が候補として挙げられ、これによって、視覚的印象
からでも所望の画像をより効率的に検索することが可能
である。
【0023】また、請求項8の発明に係る画像検索装置
は、複数の視覚的印象から新しい視覚的印象を導き出す
ための推論を支援する知識データベースと、画像データ
と該画像データに基づいて形成される画像についての複
数の視覚的印象を示す自然言語データとを関連付けて記
憶する画像データベースと、検索文を示す自然言語デー
タを入力する検索文入力手段と、画像データベースに記
憶された各自然言語データについて、知識データベース
を参照しながら、複数の視覚的印象から検索文入力手段
により入力された自然言語データの視覚的印象に相当す
る新しい視覚的印象を導き出す推論手段と、記憶手段に
記憶された自然言語データの内で推論手段により新しい
視覚的印象を導き出せた自然言語データがあった場合に
該自然言語データに関連した画像データを画像データベ
ースから抽出する検索手段と、を備えたことを特徴とす
る。
【0024】この請求項8によれば、画像データベース
に画像データとその画像データに基づいて形成される画
像についての複数の視覚的印象を示す自然言語データと
を関連付けて記憶しておき、知識データベースを参照し
ながら、画像データベース上のある自然言語データの複
数の視覚的印象から検索文である自然言語データの視覚
的印象に相当する新しい視覚的印象を導き出せた場合に
は、そのある自然言語データに関連した画像データを画
像データベースから抽出するようにしたので、検索の際
に、画像データベース上の視覚的情報を単独で使用した
場合には見逃すような自然言語データであっても確実に
画像の抽出対象として確保することができ、これによっ
て、所望の画像をより確実に、かつ効率的に検索するこ
とが可能である。
【0025】また、請求項9の発明に係る画像検索装置
は、請求項8の発明において、推論手段は画像データベ
ースに記憶された自然言語データと検索文入力手段によ
り入力された自然言語データとを言語解析してから推論
することを特徴とする。
【0026】この請求項9によれば、推論の際に、画像
データベースに記憶された自然言語データと入力された
自然言語データとを言語解析してから推論するようにし
たので、視覚的印象の意味に適した精度の高い推論が可
能となる。
【0027】また、請求項10の発明に係る画像検索装
置は、請求項5〜9のいずれか一つの発明において、さ
らに、検索手段により抽出された画像データに基づいて
画像表示を行う画像表示手段を有したことを特徴とす
る。
【0028】この請求項10によれば、検索により抽出
された画像データに基づいて画像表示を行うようにした
ので、検索結果が視覚的に提示され、これによって、検
索結果の正誤を容易に確認することが可能である。
【0029】また、請求項11の発明に係る画像管理方
法は、画像データをデータベース化して管理する画像管
理方法において、画像データと該画像データに基づいて
形成される画像についての視覚的印象を示す自然言語デ
ータとを関連付ける第1工程と、第1工程により関連付
けられた画像データおよび自然言語データを記憶する第
2工程と、を含んだことを特徴とする。
【0030】この請求項11によれば、画像データと該
画像データに基づいて形成される画像の視覚的印象を示
す自然言語データとを関連付けてから画像データおよび
自然言語データを記憶する工程にしたので、画像を視覚
的印象がもつ主観的な要素でデータベース化することが
可能である。
【0031】また、請求項12の発明に係る画像検索方
法は、検索文を示す自然言語データを入力する第1工程
と、画像データと該画像データに基づいて形成される画
像についての視覚的印象を示す自然言語データとを関連
付けて記憶した画像データベースに記憶された自然言語
データに対して第1工程により入力された自然言語デー
タを照合する第2工程と、第2工程の照合結果に応じて
視覚的印象が共通する自然言語データに関連した画像デ
ータを画像データベースから抽出する第3工程と、を含
んだことを特徴とする。
【0032】この請求項12によれば、検索文を示す自
然言語データを入力し、画像データとその画像データに
基づいて形成される画像についての視覚的印象を示す自
然言語データとを関連付けて記憶した画像データベース
に記憶された自然言語データに対して入力された自然言
語データを照合し、その照合結果に応じて視覚的印象が
共通する自然言語データに関連した画像データを画像デ
ータベースから抽出する工程にしたので、画像の属性情
報を知らなくても視覚的印象すなわち主観的な印象だけ
で画像が検索され、これによって、所望の画像をより確
実に、かつ効率的に検索することが可能である。
【0033】また、請求項13の発明に係る記録媒体
は、請求項11または12に記載された方法をコンピュ
ータに実行させるプログラムを記録したことで、そのプ
ログラムをコンピュータで読み取り可能となり、これに
よって、請求項11または12の動作をコンピュータに
よって実現することが可能である。
【0034】
【発明の実施の形態】以下に添付図面を参照して、この
発明に係る画像管理装置、画像検索装置、画像管理方
法、画像検索方法およびそれらの方法をコンピュータに
実行させるプログラムを記録したコンピュータ読み取り
可能な記録媒体の、好適な実施の形態を詳細に説明す
る。
【0035】(実施の形態1)まず、原理について説明
する。図1〜図3はこの発明の実施の形態1による原理
を説明する図である。図1には、一見、1脚の丸テーブ
ル上に色(赤色とする)の付いた液体を入れたグラスが
置かれている画像が示されている。この画像に対して人
間が主観的な印象を抱くとしたら、つぎのような印象を
抱くことも例外ではない。すなわち、「グラスの中の液
体がワインだったら高そうだ。」(視覚的情報1とす
る)、「グラスの中には色の付いた液体が入っているよ
うだ。正確ではないがワインのようだ。」(視覚的情報
2とする)、「正確ではないがこの飲み物は冷えている
ようだ。」(視覚的情報3とする)、「液体の入ったグ
ラスはテーブルの上に置いてある。」(視覚的情報4と
する)、のような印象である。
【0036】上記視覚的情報1および2は、図1の画像
中に特別にワインを特定する情報がないにも拘わらず、
液体の色が赤色である点、およびグラスの形状がワイン
グラスの形状に似ている点から得られる印象を表してい
る。上記視覚的情報3は、グラスに入っている液体の色
が赤色であることから、赤色をした飲み物から熱い飲み
物を想像できず、どちらかというとワインやトマトジュ
ースなどのように冷えた飲み物を想像することで浮かん
だ印象を表している。上記視覚的情報4は、単純にテー
ブルとグラスとの位置関係についての印象を表してい
る。
【0037】以上の4種類の視覚的情報1〜4を比較し
てみると、視覚的情報1〜3は、画像から受ける視覚的
な印象(憶測としても意味も含む)をその画像の特徴と
して表現しているので、主観的印象に該当するが、視覚
的情報4は、どちらかというと画像の構図をそのまま表
現しているので、主観的ではあるが、客観的印象に近い
ものである。
【0038】視覚的情報1〜3には、テーブルの上にグ
ラスが置かれているという画像中の部品の位置関係やテ
ーブルが丸テーブルであるなどの形状についての印象は
含まれていないが、後日、図1の画像を見ないで特徴を
挙げようとすれば、人は一般的に断片的な印象で覚えて
いることの方が多いことから、視覚的情報1〜3のよう
な表現が使用されると思われる。
【0039】この発明は、画像に対して視覚的情報1〜
4のような主観的な印象が後日まで残ることを利用し
て、視覚的情報と画像データとを関連付けたものをファ
イルとして定義する。すなわち、図1の画像を例に挙げ
ると、画像のファイルは、図2に示したように、視覚的
情報1〜4を自然言語の形式で画像に関連付けた構成と
なる。したがって、図1の画像を複数の画像から検索す
る場合には、上述した視覚的情報1〜4に近い表現の自
然言語で検索文を与えればよく、その検索文により複数
の画像から所望の画像(図1)を特定することができ
る。
【0040】そこで、検索の前提として、図3に示した
ように、画像a(図1の画像),画像bおよび画像cが
存在しているものとする。画像aには前述の視覚的情報
1〜4が関連付けられ、画像bには「よく冷えたビール
のようだ。」,「正確ではないがジョッキで乾杯してい
るようだ。」などの視覚的情報が関連付けられ、画像c
には「テーブルの上にコーヒーが置いてあるよう
だ。」,「正確ではないが、カップから湯気がでている
ようだ。」などの視覚的情報が関連付けられている。
【0041】以上の複数の画像a,b,cから所望の画
像aを検索するため、検索文「テーブルの上に冷えた飲
み物を置いている画像は?」が与えられた場合には、図
3に示したように、その検索文と各画像a,b,cに関
連付けられた視覚的情報(自然言語)とが照合される。
この照合により、類似度の最も高い視覚的情報をもつ画
像が検索の対象として抽出される。
【0042】検索文は、テーブルと飲み物との位置関係
を示す印象と、その飲み物が冷えているという印象とが
照合のポイントになる。画像aの場合には、検索文のポ
イントに対して、視覚的情報3から“飲み物は冷えてい
る”という印象が対応し、視覚的情報4から“液体の入
ったグラスがテーブルの上に置いてある”という印象が
対応する。
【0043】すなわち、画像aは、テーブルの上に冷え
た飲み物を置いている画像にマッチする。また、画像b
の場合には、検索文のポイントに対してよく冷えた飲み
物(ビール)という印象だけが対応し、画像cの場合に
は、検索文のポイントに対してテーブルの上にカップが
置いてあるという位置関係の印象だけが対応する。
【0044】したがって、図3の例では、類似度の最も
高い視覚的情報をもつ画像aが検索の対象として抽出さ
れ、その他の画像b,cは対象外となる。
【0045】つぎに、具体的な装置を用いて説明する。
図4はこの発明の実施の形態1による画像処理装置を機
能的に示すブロック図である。図4に示した画像処理装
置は、この発明に係る画像管理装置と画像検索装置との
両方の機能を兼ね備えている。
【0046】図4に示した画像処理装置は、例えば、画
像入力部1、自然言語入力部2、画像/自然言語関連付
け部3、表示部4、画像データベース5、検索部6、言
語解析部6、および辞書部7を備えている。画像入力部
1は、画像データベース5に登録すべき画像データを入
力し、自然言語入力部2は、画像データベース5に登録
すべき画像データに関連付けて付加する視覚的情報や検
索時の検索文を自然言語データとして入力する。
【0047】画像/自然言語関連付け部3は、画像入力
部1により入力された画像データと自然言語入力部2に
より入力された自然言語データとを関連付け、その関連
付けられたデータをファイルとして画像データベース5
に出力する。この画像/自然言語関連付け部3は、画像
や視覚的情報を表示させながら関連付けを行うことか
ら、画像データ,自然言語データに基づく表示データを
表示部4に出力する。
【0048】表示部4は、関連付けの際に、画像/自然
言語関連付け部3から表示データを受け取って画像や視
覚的情報を表示するとともに、検索の際に、検索部6か
ら表示データを受け取って検索文や検索結果(画像)を
表示する。画像データベース5は、画像/自然言語関連
付け部3により関連付けされた画像データと自然言語デ
ータとを対応させたファイルを記憶するとともに、検索
部6の検索要求に応じて自然言語データや画像データを
応答(回答)する。
【0049】検索部6は、自然言語入力部2により入力
された検索文(自然言語データ)に従って入力検索文と
画像データベース5上の視覚的情報とを言語解析部7に
より言語解析させてから照合する。この検索部6は、そ
の照合結果に応じて入力検索文に対して類似度の高い視
覚的情報に関連付けられている画像データを画像データ
ベース5から抽出してその検索結果(抽出された画像)
を表示部4に表示させる。
【0050】言語解析部7と辞書部8とによる自然言語
処理部には、一例であるが、すでに公知の自然言語処理
を適用することができる。参考文献として、電子情報通
信学会、1988年「自然言語処理の基礎技術」(野村
浩郷著)がある。
【0051】言語解析部6は、形態素解析部7Aと構文
解析部7Bとにより構成され、辞書部8は形態素解析を
支援する単語辞書8Aと構文解析を支援する文法辞書8
Bとにより構成される。形態素解析部7Aは単語辞書8
Aを参照して入力された自然言語データに基づき形態素
解析を行い、構文解析部7Bは文法辞書8Bを参照して
入力された自然言語データに基づき構文構造を解析す
る。この構文解析部7Bの解析結果は検索部6へ出力さ
れる。
【0052】続いて画像データベース5について説明す
る。図5は実施の形態1による画像データベース5の記
憶内容を概略的に説明する図である。画像データベース
5は、図5に示したように、ファイル名に対応させて関
連付けられた画像データと自然言語データとを記憶して
いる。ここで、ファイル名を挙げているのは、一般的
に、一つのファイルには固有のファイル名が定義される
ためであり、ファイル名そのものは本発明の趣旨とは関
係ない。
【0053】例えば、ファイル名FILEAのファイル
は、画像データIMGAと自然言語データNLDAとが
関連付けられており、ファイル名FILEBのファイル
は、画像データIMGBと自然言語データNLDBとが
関連付けられている。各ファイルに含まれる自然言語デ
ータは視覚的情報をその内容としていることから、例え
ば、自然言語データNLDAのように複数の視覚的情報
を与えることができる。
【0054】ここでいう複数とは、視覚的な印象を表現
する文が複数存在することを示しているのであって、独
立した複数の視覚的情報が存在する意味を示しているの
ではない。すなわち、文脈を解釈すれば複数の視覚的情
報に区分されるが、自然言語データとしては一つの固ま
りである。このように、一つの画像に対して視覚的印象
をあらゆる視点から無制限に与えることが許される。
【0055】つぎに、動作について説明する。まず、メ
イン動作について説明する。図6は実施の形態1のメイ
ン動作を説明するフローチャートであり、図7は実施の
形態1のメイン動作時の表示遷移の一例を示す図であ
る。
【0056】動作としては、まず表示部4の画面上に画
像のファイリングを操作するためのファイリング処理ア
イコン101,画像の検索を操作するための検索処理ア
イコン102および終了操作を行うための終了アイコン
103を選択肢としたメニュー(図7(a)参照)が表
示される(ステップS1)。その後、ファイリング処理
アイコン101,検索処理アイコン102および終了ア
イコン103のいずれのアイコンが選択されるのかセン
スされる。この選択操作は、不図示の操作部により行わ
れるものとする。
【0057】そして、図7(b)に示したように、ファ
イリング処理アイコン101が選択(図中斜線で示す)
された場合には(ステップS2)、処理は図8のファイ
リング処理に移行する(ステップS5)。その後、処理
は再びステップS1のメニュー表示に戻る。また、図7
(c)に示したように、検索処理アイコン102が選択
(図中斜線で示す)された場合には(ステップS3)、
処理は図12の検索処理に移行する(ステップS6)。
その後、処理は再びステップS1のメニュー表示に戻
る。また、終了アイコン103が選択された場合には
(ステップS4)、本処理は終了する。
【0058】続いて画像のファイリング動作について説
明する。図8は実施の形態1のファイリング動作を説明
するフローチャート、図9は実施の形態1のファイリン
グ動作時の表示遷移の一例を示す図、図10は実施の形
態1による画像データベースの記憶例を概略的に説明す
る図、そして、図11は実施の形態1のファイリング動
作時の動画における表示遷移の一例を示す図である。
【0059】処理がファイリング処理に移行すると、ま
ず画像入力部1により画像データが入力され(ステップ
S51)、その入力画像データに基づいて表示部4に画
像が表示される(ステップS52)。具体的には、図9
(a)に示したように、表示部4の画面に、画像表示エ
リア201と自然言語表示エリア202とが表示され
る。ここでは前述の画像a(図3参照)が一例として画
像表示エリア201に表示されている。
【0060】さらに自然言語表示エリア202には、図
9(a)に示したように、画像表示エリア201に表示
されている画像aについての視覚的情報を自然言語で入
力する旨のメッセージ(図の例では「視覚的情報を入力
してください」)203が表示される(ステップS5
3)。なお、このファイリング処理を終了操作するため
に、終了アイコン204が自然言語表示エリア202内
に表示される。
【0061】その後、視覚的情報すなわち自然言語デー
タの入力が受け付けられる(ステップS54)。自然言
語データは自然言語入力部2を通じて入力されるデータ
である。自然言語入力が開始されると、図9(b)に示
したように、自然言語表示エリア202内に「グラスの
中の液体がワインだった」の如く視覚的情報が表示され
る。その際、カーソルCURがつぎの入力位置や修正位
置を示すように表示され、このカーソルCURは図示せ
ぬ操作部により移動操作される。
【0062】そして、図9(c)に示したように、視覚
的情報「グラスの中の液体…テーブルの上に置いてあ
る。」の入力が完了すると、終了アイコン204の選択
操作で入力終了が確認される(ステップS55)。した
がって、この終了アイコン204が選択操作されるまで
は、ステップS54およびステップS55の処理が繰り
返し実行される。
【0063】このように、視覚的情報の入力が終了する
と(ステップS55)、画像表示エリア201に表示さ
れている画像aを形成するための画像データと自然言語
表示エリア202に表示されている視覚的情報を形成す
るための自然言語データとの対応が関連付けられ、一つ
のファイルとして図10に示したように画像データベー
ス5への登録が行われる(ステップS56)。この登録
では、図示せぬ操作部の操作により「写真その1」のよ
うにファイル名を与えることができる。なお、その他の
属性情報も付加することは可能であるが、本発明の趣旨
とは関係ないので、ここでは説明を省略する。
【0064】図9の場合には、画像aのような静止画
(例えば写真)を例に挙げているが、この実施の形態1
においては、連続する画像すなわち動画についても同様
の処理が施される。
【0065】すなわち、図11に示したように、体操の
一連の動作を動画とする場合には、連続するフレームの
変化を見ながら、視覚的情報を与えることができる。例
えば、フレーム1のあたりを見て、「両手を上に上げた
後、肩を回す。」のような視覚的情報を入力し、さらに
フレームm(m>1,mは自然数)のあたりを見て、
「つぎに、両足を開いて…腰を回転させる。」のように
視覚的情報を続けて入力し、さらにフレームn(n>
m,mは自然数)のあたりを見て、「左足首に触れたら
…左足首に触れるようにする。」のように視覚的情報を
続けて入力すれば、動画に対する視覚的情報を主観的に
与えることができる。
【0066】続いて画像の検索動作について説明する。
図12は実施の形態1の検索動作を説明するフローチャ
ート、図13は実施の形態1の検索動作時の表示遷移の
一例を示す図である。ここでは、前述した画像aを画像
データベース5から検索する例を挙げて説明する。
【0067】処理が検索処理に移行すると、図13
(a)に示したように、表示部4の画面に、画像表示エ
リア301と自然言語表示エリア302とが表示され
る。そして、自然言語表示エリア302には、図13
(a)に示したように、検索対象となる画像についての
検索文を自然言語で入力する旨のメッセージ(図の例で
は「検索文を入力してください」)303が表示される
(ステップS61)。
【0068】なお、この検索処理を終了操作するための
終了アイコン304と検索の実行を指示するための実行
アイコン305とが自然言語表示エリア302内に表示
される。
【0069】その後、検索文すなわち自然言語データの
入力が受け付けられる(ステップS62)。自然言語デ
ータは自然言語入力部2を通じて入力されるデータであ
る。自然言語入力が開始されると、図10(b)に示し
たように、自然言語表示エリア302内に「テーブルの
上に冷えた飲み物を置いている画像は?」の如く検索文
が表示される。
【0070】この場合にも図示せぬが、カーソルCUR
がつぎの入力位置や修正位置を示すように表示され、そ
のカーソルCURは図示せぬ操作部により移動操作され
る。なお、検索文の入力が完了するまでは、実行アイコ
ン305による実行指示(ステップS63)や終了アイ
コン304による終了指示(ステップS64)がセンス
される。
【0071】そして、図13(b)に示したように、検
索文の入力が完了して実行アイコン305が選択操作
(図中斜線で示す)されると(ステップS63)、言語
解析部7において、入力検索文の自然言語データに基づ
く言語解析が実行されるとともに(ステップS65)、
画像データベース5の視覚的情報の自然言語データに基
づく言語解析が実行される(ステップS66)。
【0072】このように、入力検索文と視覚的情報の両
者を言語解析することで、ベースを揃えた状態で照合が
行われる(ステップS67)。この照合は、前述の図3
で説明した原理に従うものである。さらに詳述すれば、
この照合は、自然言語の文脈上、視覚的情報の中に、検
索文で表現される情報に共通した印象がどれだけ含まれ
ているかを判断する。ここでは類似度(一致度)による
照合技術であれば、どのような既存技術を適用してもよ
いものとする。
【0073】このようにして照合結果が得られると、類
似度の高いファイルが抽出される。この場合には、画像
aを保有するファイル名「写真その1」のファイルが抽
出される。したがって、画像表示エリア301には、図
13(c)に示したように、そのファイルの画像データ
に基づいて画像aが表示される(ステップS68)。
【0074】ここでは、類似度の高い画像を表示するの
で、複数の候補があれば、昇順に予め決められた数の画
像を表示するようにしてもよく、また、複数の画像が候
補として表示され、その中に所望の画像があれば、その
所望の画像だけを表示させようようにしてもよい。これ
らの技術は公知のため、ここではその説明を省略する。
【0075】ステップS68の後、処理はステップS6
2に戻るので、さらに他の画像を検索するのであれば、
検索文を変更してから実行アイコン305を操作すれば
よい(ステップS62およびステップS63)。また、
終了アイコン304の選択操作で検索処理を終了させる
ことができる(ステップS64)。
【0076】ここで、上述の画像処理装置をハードウェ
アで実現した場合の一例を挙げる。図14はこの発明の
実施の形態1による画像処理装置をハードウェア的に示
すブロック図である。
【0077】図14に示したハードウェア構成において
は、表示部4と画像データベース5とが機能的にもハー
ドウェア的にも共有する他は、スキャナ111、キーボ
ード121、マウス122、CPU131、プログラム
メモリ132、およびRAM133が適用される。これ
ら各ユニットはバスBSに接続され、バスBSを介して
CPU131の制御を受ける。
【0078】CPU131は、プログラムメモリ132
の各種プログラムに従って動作するユニットであり、図
4の機能ブロックにおいて画像/自然言語関連付け部
3、検索部6、および言語解析部7に相当する処理を実
行する。プログラムメモリ132は、CPU131が動
作するためのオペレーティングシステムOS132Aと
アプリケーションプログラム132Bとを格納してい
る。RAM133はCPU131のワークエリアとして
使用される。
【0079】なお、図4の機能ブロックにある辞書部8
は、アプリケーションプログラム132Bの一部に格納
されてもよく、あるいは独立した辞書メモリとしてバス
BSに接続されてもよい。
【0080】スキャナ111は、画像入力部1に相当す
るユニットであり、原稿画像から入力した画像データを
CPU131の制御でRAM133に出力する。キーボ
ード121は、自然言語入力部2に相当するユニットで
あり、文字などを入力して視覚的情報,検索文などのデ
ータを入力する。マウス122は、キーボード121の
入力や前述の各アイコン選択などの操作を支援するポイ
ンティングデバイスである。
【0081】以上説明したように、実施の形態1によれ
ば、画像データとその画像データに基づいて形成される
画像の視覚的印象を示す自然言語データとを関連付けて
画像データベース5に記憶したので、画像を視覚的印象
がもつ主観的な要素でデータベース化することが可能で
ある。
【0082】また、画像データベース5に画像データと
その画像データに基づいて形成される画像の視覚的印象
を示す自然言語データとを関連付けて記憶しておき、画
像データベース5上のある視覚的印象の自然言語データ
でアクセスが行われた場合にその自然言語データに関連
する画像データを応答するようにしたので、ファイリン
グ日時,画像の種別などの属性情報に関係なく視覚的印
象すなわち主観的な印象でのアクセスが可能となり、こ
れによって、所望の画像をアクセスすることが容易にな
る。
【0083】また、画像データを静止画データ,動画デ
ータなどのデータとしたので、画像の種別に関係なく、
各画像に任意の視覚的情報を与えることが可能である。
【0084】また、画像データベース5に画像データと
その画像データに基づいて形成される画像についての視
覚的印象を示す自然言語データとを関連付けて記憶して
おき、検索文を示す自然言語データを入力して画像デー
タベース5上の自然言語データに照合することで、視覚
的印象が共通する自然言語データに関連した画像データ
を画像データベース5から抽出するようにしたので、画
像の属性情報を知らなくても視覚的印象すなわち主観的
な印象だけで画像が検索され、これによって、所望の画
像をより確実に、かつ効率的に検索することが可能であ
る。
【0085】また、検索の際に、画像データベース5に
記憶された自然言語データと入力された自然言語データ
とを言語解析してから照合するようにしたので、視覚的
印象の意味に適した精度の高い照合が可能である。
【0086】また、検索により抽出された画像データに
基づいて画像表示を行うようにしたので、検索結果が視
覚的に提示され、これによって、検索結果の正誤を容易
に確認することが可能である。
【0087】また、画像データに関連付けて記憶するた
めの自然言語データをキー操作を通じて入力するように
したので、画像の客観性にとらわれることなく、各画像
に任意の視覚的情報を与えることが可能である。
【0088】(実施の形態2)さて、前述した実施の形
態1では、検索文である自然言語データと画像データベ
ース5上の自然言語データとをそれぞれ言語解析した後
に照合するようにしていたが、以下に説明する実施の形
態2のように、画像データベース5上の自然言語データ
について視覚的印象を推論してから照合を行うようにし
てもよい。
【0089】この場合、実施の形態2は、全体構成につ
いて前述の実施の形態1による全体構成(図4参照)を
採用するので、共通部分については共通の番号を使用て
その説明を省略する。以下に、相違する構成および機能
について説明し、共通点については省略する。
【0090】まず、構成について説明する。図15はこ
の発明の実施の形態2による画像処理装置を機能的に示
すブロック図である。実施の形態2でも、原理は前述の
実施の形態1と同様となる。この実施の形態2では、画
像処理装置に新たに推論部9と知識データベース10と
が付加される。推論は、実際には言語解析部7において
も実施されるものであるが、ここでは言語解析後の複数
の視覚的情報間での新たな視覚的情報の生成という点で
推論部9および知識データベース10を構成要素とす
る。
【0091】推論部9は、言語解析部7の解析結果を受
け取り、知識データベース10を参照して、検索文の解
析結果に対して複数の視覚的情報から予測できる新たな
視覚的情報をつくり出し、これを推論結果として検索部
6へ出力する。知識データベース10は、推論部9より
解析結果を受け取り、複数の視覚的情報の解析結果をあ
らゆる視点から結合して新たな主観的な印象をつくり出
すための支援を行う。
【0092】なお、ハードウェア構成上、推論部9はC
PU131に相当するものとし、知識データベース10
は辞書部8と同様にアプリケーションプログラムAP1
32Bの一部でも独立したメモリ構成であってもよい。
【0093】つぎに、実施の形態1と相違する検索動作
について説明する。図16は実施の形態2の検索動作の
要部を説明するフローチャートであり、図17は実施の
形態2の検索動作時の表示遷移の一例を示す図である。
図16には、図12と共通するボックスの図示を省略
し、追加されるボックスについてのみ図示する。
【0094】この実施の形態2においても、前述した実
施の形態1と同様に、検索処理に入ると、表示部4に画
像表示エリア401と自然言語表示エリア402とが表
示される(図17(a)参照)。このとき、自然言語表
示エリア402内にメッセージ「検索文を入力してくだ
さい」403が表示されるので、自然言語表示エリア4
02に例えば「飲むと酔う液体の画像は?」という検索
文の入力後に実行アイコン405が選択操作されると、
検索文「飲むと酔う液体の画像は?」に従って検索が実
行される(図17(b)参照)。
【0095】ステップS65において上記検索文の言語
解析が終了した後に、続いてステップS66において画
像データベース5の視覚的情報の言語解析が終了する
と、この実施の形態2では、推論処理が実行される。す
なわち、視覚的情報の解析結果に基づいて入力検索文の
解析結果に近い内容が推論される(ステップS69)。
以下にこの原理を簡単に説明する。
【0096】ここでは前述の画像a,b,cを例に挙げ
る。画像aの場合には、図1に示した如く、“ワイン”
の画像という解析結果が得られ、画像bの場合には、図
3に示した如く、“ビール”の画像という解析結果が得
られ、画像cの場合には、図3に示した如く、“コーヒ
ー”という解析結果が得られる。
【0097】そこで、知識データベース10に「ワイン
はアルコールを含んでいる」,「ビールはアルコールを
含んでいる」,「コーヒーはアルコールを含んでいな
い」,「アルコールを含む飲み物を飲むと酔いが回る」
が登録されているとすれば、画像aに関して“ワイン”
は飲むと酔う液体であるという推論が成立する。同様
に、画像bに関して“ビール”は飲むと酔う液体である
という推論が成立する。これに対し、画像cに関して
“コーヒー”は飲んでも酔わない液体という推論が成立
する。
【0098】その結果、画像aについて新たに「飲むと
酔うワインの画像のようだ」のような内容の視覚的情報
が生成され、画像bについて新たに「飲むと酔うビール
の画像のようだ」のような内容の視覚的情報が生成さ
れ、画像cについて新たに「飲んでも酔わないコーヒー
の画像のようだ」のような内容の視覚的情報が生成され
る。これら新たな視覚的情報は実施の形態1で述べた解
析結果の状態でステップS67の照合のために推論部9
から検索部6へ出力される。
【0099】以降は、前述した実施の形態1と同様に、
入力検索文と視覚的情報との解析結果の状態での照合
(ステップS67)および類似度の高いファイルの抽出
による画像表示(ステップS68)が実行される。その
結果、図17(c)に示したように、画像表示エリア4
01に、画像aと画像bとが検索対象として表示され、
画像cについては対象外となる。
【0100】以上説明したように、実施の形態2によれ
ば、画像データベース5に画像データとその画像データ
に基づいて形成される画像についての複数の視覚的印象
を示す自然言語データとを関連付けて記憶しておき、知
識データベース10を参照しながら、画像データベース
5上のある自然言語データの複数の視覚的印象から検索
文である自然言語データの視覚的印象に相当する新しい
視覚的印象を導き出せた場合には、そのある自然言語デ
ータに関連した画像データを画像データベース5から抽
出するようにしたので、検索の際に、画像データベース
5上の視覚的情報を単独で使用した場合には見逃すよう
な自然言語データであっても確実に画像の抽出対象とし
て確保することができ、これによって、所望の画像をよ
り確実に、かつ効率的に検索することが可能である。
【0101】また、推論の際に、画像データベース5に
記憶された自然言語データと入力された自然言語データ
とを言語解析してから推論するようにしたので、視覚的
印象の意味に適した精度の高い推論が可能である。
【0102】また、検索の際に、照合結果に応じて類似
度の高い方から昇順で複数の画像データを抽出するよう
にしたので、視覚的印象に近い複数の画像が候補として
挙げられ、これによって、視覚的印象からでも所望の画
像をより効率的に検索することが可能である。
【0103】(実施の形態3)さて、前述した実施の形
態1および2では、自然言語入力部2を通じて自然言語
データをマニュアル操作により入力するようにしていた
が、以下に説明する実施の形態3のように、画像(図
形)認識技術を利用して自然言語データの入力を自動化
するようにしてもよい。
【0104】この場合、実施の形態3は、全体構成につ
いて前述の実施の形態1または2による全体構成(図4
または図15参照)を採用するので、共通部分について
は共通の番号を使用てその説明を省略する。以下に、相
違する構成および機能についてのみ説明し、共通点につ
いては省略する。
【0105】まず、実施の形態1,2と相違する構成に
ついて説明する。図18はの発明の実施の形態3による
画像処理装置の要部をハードウェア的に示すブロック図
である。実施の形態3では、バスBSに新たに画像認識
プログラムを格納した画像認識プログラムメモリ125
と画像認識処理を支援する画像認識辞書126とが接続
される。これら追加構成による公知の画像認識技術のた
め詳細な説明は省略する。
【0106】つぎに、実施の形態1,2と相違するファ
イリング動作について説明する。図19は実施の形態3
のファイリング動作を説明するフローチャートである。
前述の実施の形態1および2と同様に、画像入力(ステ
ップS51)、および入力画像表示(ステップS52)
が終了すると、画像認識プログラムに従って、画像認識
辞書126を参照して入力された画像データに基づく画
像の認識が行われる(ステップS57)。その際、各画
像部品の形状,サイズ,色,他の画像部品との位置関係
などが認識する際の要素となる。
【0107】さらに、画像の認識結果から画像の視覚的
情報が抽出される(ステップS58)。この抽出では、
主観的な印象を得るために、色使いや配色が暗いもので
あれば、例えば「暗い感じの画像」という視覚的情報を
抽出し、一方、色使いや配色が明るいものであれば、例
えば「明るい感じの画像」という視覚的情報を抽出すれ
ばよい。このような規則性で視覚的情報を抽出すると、
客観性により画像の印象が制限されることが回避される
ので、キー入力や音声入力と同様に、より主観的な印象
を画像に関連付けることができる。
【0108】この主観的な印象が当てはまるものとし
て、例えば絵画がある。この絵画の場合には、その人固
有の筆のタッチがそのまま絵に表現されることから、力
強い画像とか、繊細な画像とか、いろいろな表現を与え
ることが可能である。このため、画集を管理するという
利用形態への応用が可能である。
【0109】また、画像内に一見して2人の人物と鏡と
が存在する場合には、視覚的情報として、「2人の人物
がいる。」とか、「1人が実際の人物であり、もう一人
は鏡に映っている人物である。」という内容を与えるよ
うにしてもよい。そこで、上記画像に対して後者の
「鏡」を含む視覚的情報を対応付けしておけば、例え
ば、「確か人は1人たっだ」という検索条件が与えられ
たとしても「鏡」によって人が2人になるという推論に
従って、2人の人物が存在する画像についても検索する
ことが可能である。
【0110】以降、前述した実施の形態1,2と同様
に、ステップS58で得られた視覚的情報と画像データ
との対応を関連付けて画像データベース5への登録が行
われる(ステップS56)。
【0111】以上説明したように、実施の形態3によれ
ば、画像データに関連付けて記憶するための自然言語デ
ータを画像認識を通じて入力するようにしたので、画像
の色や画像中の各物体の形状,サイズなどを主観的に表
現する視覚的情報を得るように画像認識辞書126を構
成すれば、画像の客観性にとらわれることなく、各画像
により主観性のある視覚的情報を与えることが可能であ
る。
【0112】(実施の形態4)さて、前述した実施の形
態1〜3では、画像処理装置1台でファイリングと検索
とを行うようにしていたが、以下に説明する実施の形態
4のように、画像処理装置をクライアントとサーバとに
分けて機能を分散させるようにしてもよい。
【0113】ここでは、構成についてのみ説明する。図
20はこの発明の実施の形態4による画像処理装置を機
能的に示すブロック図である。実施の形態4による画像
処理装置は、図20に示したように、クライアント21
とサーバ22とに分離される。前述の各実施の形態で
は、画像データベース5に画像データと自然言語データ
とが関連付けて記憶されていたが、この実施の形態4で
は、クライアント21に視覚的情報である自然言語デー
タが記憶され、サーバ22にその視覚的情報に関連付け
られた画像データが記憶される。
【0114】これら視覚的情報と画像データとは、視覚
的情報に対して画像データをアクセスするための検索キ
ー(アドレス,識別情報など)を付加することで関連付
けられる。すなわち、視覚的情報と画像データとに共通
の検索キーが付加される。
【0115】したがって、検索の際に、まず前述した各
実施の形態と同様に言語解析後の入力検索文と視覚的情
報との照合が行われ、その後、画像抽出の段階になる
と、類似度の高い視覚的情報から検索キーが取り出さ
れ、その検索キーでサーバ22から所望の画像データが
抽出される。検索キーと検索結果である画像データと
は、クライアント21とサーバ22間を伝送路を介して
授受される。
【0116】なお、ファイリングの際には、クライアン
ト21は検索キーを含む関連付けまで行った後、視覚的
情報を自装置に残し、画像データについてはサーバ22
に伝送する。サーバ22は、クライアント21から受信
した画像データを記憶する。
【0117】以上説明したように、実施の形態4によれ
ば、実施の形態1〜3の各効果に加え、機能を分散させ
ることで、クライアント側で画像データを記憶する必要
がなくなることから、クライアント側のデータ量を必要
最小限に抑えることが可能である。
【0118】(実施の形態5)さて、前述した実施の形
態1では、キーボード121による自然言語入力を例に
挙げていたが、以下に説明する実施の形態5のように、
音声入力によって自然言語入力を行うようにしてもよ
い。ここでは、自然言語の入力構成の違いだけなので、
以下にその点についてのみ説明する。
【0119】図21はこの発明の実施の形態5による画
像処理装置の要部をハードウェア的に示すブロック図で
ある。図21において、バスBSには、音声を入力する
マイク123と、そのマイク123から入力された音声
データに基づいて音声認識を行うための音声認識プログ
ラムを格納した音声認識プログラムメモリ124とが接
続されている。
【0120】このマイク123および音声認識プログラ
ムメモリ124は、自然言語入力部2を構成することか
ら、他の自然言語入力部として前述の各実施の形態の構
成に追加されるものである。このマイク123および音
声認識プログラムメモリ124により音声から自然言語
データを入力することができる。
【0121】以上説明したように、実施の形態5によれ
ば、画像データに関連付けて記憶するための自然言語デ
ータを音声認識を通じて入力するようにしたので、前述
の実施の形態1と同様に、画像の客観性にとらわれるこ
となく、各画像に任意の視覚的情報を与えることが可能
である。
【0122】(実施の形態6)さて、前述した実施の形
態1では、スキャナ111による画像入力を例に挙げて
いたが、以下に説明する実施の形態6のように、通信に
よって画像入力を行うようにしてもよい。ここでは、画
像データの入力構成の違いだけなので、以下にその点に
ついてのみ説明する。
【0123】図22はこの発明の実施の形態6による画
像処理装置の要部をハードウェア的に示すブロック図で
ある。図22において、バスBSには、通信回線に接続
される通信I/F112と、その通信I/F112を通
じて送受信するデータを変復調するモデム113とが接
続されている。
【0124】この通信I/F112およびモデム113
は、画像入力部1を構成することから、他の画像入力部
として前述の各実施の形態の構成に追加されるものであ
る。この通信I/F112およびモデム113はにより
外部から画像データを入力することができる。
【0125】以上説明したように、実施の形態6によれ
ば、通信回線を介して画像を取り込む用途でも、前述の
実施の形態1〜5と同様の効果が得られることから、近
年、普及してきているインターネットの利用に際して、
ホームページに対して視覚的情報を与えれば、膨大なホ
ームページを視覚的な印象だけで容易に管理することが
可能になる。
【0126】
【発明の効果】以上説明したように、請求項1の発明に
よれば、画像データとその画像データに基づいて形成さ
れる画像の視覚的印象を示す自然言語データとを関連付
けて記憶したので、画像を視覚的印象がもつ主観的な要
素でデータベース化することが可能な画像管理装置が得
られるという効果を奏する。
【0127】また、請求項2の発明によれば、画像デー
タベースに画像データとその画像データに基づいて形成
される画像の視覚的印象を示す自然言語データとを関連
付けて記憶しておき、画像データベース上のある視覚的
印象の自然言語データでアクセスが行われた場合にその
自然言語データに関連する画像データを応答するように
したので、属性情報に関係なく視覚的印象すなわち主観
的な印象でのアクセスが可能となり、これによって、所
望の画像をアクセスすることが容易になる画像管理装置
が得られるという効果を奏する。
【0128】また、請求項3の発明によれば、請求項1
または2の発明において、画像データに関連付けて記憶
するための自然言語データをキー操作,音声認識,画像
認識などを通じて入力するようにしたので、画像の客観
性にとらわれることなく、各画像に主観性のある視覚的
情報を与えることが可能な画像管理装置が得られるとい
う効果を奏する。
【0129】また、請求項4の発明によれば、請求項1
〜3のいずれか一つの発明において、画像データを静止
画データ,動画データなどのデータとしたので、画像の
種別に関係なく、各画像に任意の視覚的情報を与えるこ
とが可能な画像管理装置が得られるという効果を奏す
る。
【0130】また、請求項5の発明によれば、画像デー
タベースに画像データとその画像データに基づいて形成
される画像についての視覚的印象を示す自然言語データ
とを関連付けて記憶しておき、検索文を示す自然言語デ
ータを入力して画像データベース上の自然言語データに
照合することで、視覚的印象が共通する自然言語データ
に関連した画像データを画像データベースから抽出する
ようにしたので、画像の属性情報を知らなくても視覚的
印象すなわち主観的な印象だけで画像が検索され、これ
によって、所望の画像をより確実に、かつ効率的に検索
することが可能な画像検索装置が得られるという効果を
奏する。
【0131】また、請求項6の発明によれば、請求項5
の発明において、検索の際に、画像データベースに記憶
された自然言語データと入力された自然言語データとを
言語解析してから照合するようにしたので、視覚的印象
の意味に適した精度の高い照合が可能な画像検索装置が
得られるという効果を奏する。
【0132】また、請求項7の発明によれば、請求項5
または6の発明において、検索の際に、照合結果に応じ
て類似度の高い方から昇順で複数の画像データを抽出す
るようにしたので、視覚的印象に近い複数の画像が候補
として挙げられ、これによって、視覚的印象からでも所
望の画像をより効率的に検索することが可能な画像検索
装置が得られるという効果を奏する。
【0133】また、請求項8の発明によれば、画像デー
タベースに画像データとその画像データに基づいて形成
される画像についての複数の視覚的印象を示す自然言語
データとを関連付けて記憶しておき、知識データベース
を参照しながら、画像データベース上のある自然言語デ
ータの複数の視覚的印象から検索文である自然言語デー
タの視覚的印象に相当する新しい視覚的印象を導き出せ
た場合には、そのある自然言語データに関連した画像デ
ータを画像データベースから抽出するようにしたので、
検索の際に、画像データベース上の視覚的情報を単独で
使用した場合には見逃すような自然言語データであって
も確実に画像の抽出対象として確保することができ、こ
れによって、所望の画像をより確実に、かつ効率的に検
索することが可能な画像検索装置が得られるという効果
を奏する。
【0134】また、請求項9の発明によれば、請求項8
の発明において、推論の際に、画像データベースに記憶
された自然言語データと入力された自然言語データとを
言語解析してから推論するようにしたので、視覚的印象
の意味に適した精度の高い推論が可能な画像検索装置が
得られるという効果を奏する。
【0135】また、請求項10の発明によれば、請求項
5〜9のいずれか一つの発明において、検索により抽出
された画像データに基づいて画像表示を行うようにした
ので、検索結果が視覚的に提示され、これによって、検
索結果の正誤を容易に確認することが可能な画像検索装
置が得られるという効果を奏する。
【0136】また、請求項11の発明によれば、画像デ
ータと該画像データに基づいて形成される画像の視覚的
印象を示す自然言語データとを関連付けてから画像デー
タおよび自然言語データを記憶する工程にしたので、画
像を視覚的印象がもつ主観的な要素でデータベース化す
ることが可能な画像管理方法が得られるという効果を奏
する。
【0137】また、請求項12の発明によれば、検索文
を示す自然言語データを入力し、画像データとその画像
データに基づいて形成される画像についての視覚的印象
を示す自然言語データとを関連付けて記憶した画像デー
タベースに記憶された自然言語データに対して入力され
た自然言語データを照合し、その照合結果に応じて視覚
的印象が共通する自然言語データに関連した画像データ
を画像データベースから抽出する工程にしたので、画像
の属性情報を知らなくても視覚的印象すなわち客観的な
印象だけで画像が検索され、これによって、所望の画像
をより確実に、かつ効率的に検索することが可能な画像
検索方法が得られるという効果を奏する。
【0138】また、請求項13の発明によれば、請求項
11または12に記載された方法をコンピュータに実行
させるプログラムを記録したことで、そのプログラムを
コンピュータで読み取り可能となり、これによって、請
求項11または12の動作をコンピュータによって実現
することが可能な記録媒体が得られるという効果を奏す
る。
【図面の簡単な説明】
【図1】この発明の実施の形態1による原理を説明する
図である。
【図2】この発明の実施の形態1による原理を説明する
図である。
【図3】この発明の実施の形態1による原理を説明する
図である。
【図4】この発明の実施の形態1による画像処理装置を
機能的に示すブロック図である。
【図5】実施の形態1による画像データベースの記憶内
容を概略的に説明する図である。
【図6】実施の形態1のメイン動作を説明するフローチ
ャートである。
【図7】実施の形態1のメイン動作時の表示遷移の一例
を示す図である。
【図8】実施の形態1のファイリング動作を説明するフ
ローチャートである。
【図9】実施の形態1のファイリング動作時の表示遷移
の一例を示す図である。
【図10】実施の形態1による画像データベースの記憶
例を概略的に説明する図である。
【図11】実施の形態1のファイリング動作時の動画に
おける表示遷移の一例を示す図である。
【図12】実施の形態1の検索動作を説明するフローチ
ャートである。
【図13】実施の形態1の検索動作時の表示遷移の一例
を示す図である。
【図14】この発明の実施の形態1による画像処理装置
をハードウェア的に示すブロック図である。
【図15】この発明の実施の形態2による画像処理装置
を機能的に示すブロック図である。
【図16】実施の形態2の検索動作の要部を説明するフ
ローチャートである。
【図17】実施の形態2の検索動作時の表示遷移の一例
を示す図である。
【図18】この発明の実施の形態3による画像処理装置
の要部をハードウェア的に示すブロック図である。
【図19】実施の形態3のファイリング動作を説明する
フローチャートである。
【図20】この発明の実施の形態4による画像処理装置
を機能的に示すブロック図である。
【図21】この発明の実施の形態5による画像処理装置
の要部をハードウェア的に示すブロック図である。
【図22】この発明の実施の形態6による画像処理装置
の要部をハードウェア的に示すブロック図である。
【符号の説明】
1 画像入力部 2 自然言語入力部 3 画像/自然言語関連付け部 4 表示部 5 画像データベース 6 検索部 7 言語解析部 8 辞書部 9 推論部 10 知識データベース 21 クライアント 22 サーバ 111 スキャナ 112 通信I/F 113 モデム 121 キーボード 122 マウス 123 マイク 124 音声認識プログラムメモリ 125 画像認識プログラムメモリ 126 画像認識辞書 131 CPU 132 プログラムメモリ 133 RAM
─────────────────────────────────────────────────────
【手続補正書】
【提出日】平成10年6月3日
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】請求項8
【補正方法】変更
【補正内容】
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0023
【補正方法】変更
【補正内容】
【0023】また、請求項8の発明に係る画像検索装置
は、複数の視覚的印象から新しい視覚的印象を導き出す
ための推論を支援する知識データベースと、画像データ
と該画像データに基づいて形成される画像についての複
数の視覚的印象を示す自然言語データとを関連付けて記
憶する画像データベースと、検索文を示す自然言語デー
タを入力する検索文入力手段と、画像データベースに記
憶された各自然言語データについて、知識データベース
を参照しながら、複数の視覚的印象から検索文入力手段
により入力された自然言語データの視覚的印象に相当す
る新しい視覚的印象を導き出す推論手段と、画像データ
ベースに記憶された自然言語データの内で推論手段によ
り新しい視覚的印象を導き出せた自然言語データがあっ
た場合に該自然言語データに関連した画像データを画像
データベースから抽出する検索手段と、を備えたことを
特徴とする。
【手続補正3】
【補正対象書類名】明細書
【補正対象項目名】0037
【補正方法】変更
【補正内容】
【0037】以上の4種類の視覚的情報1〜4を比較し
てみると、視覚的情報1〜3は、画像から受ける視覚的
な印象(憶測として意味も含む)をその画像の特徴と
して表現しているので、主観的印象に該当するが、視覚
的情報4は、どちらかというと画像の構図をそのまま表
現しているので、主観的ではあるが、客観的印象に近い
ものである。
【手続補正4】
【補正対象書類名】明細書
【補正対象項目名】0046
【補正方法】変更
【補正内容】
【0046】図4に示した画像処理装置は、例えば、画
像入力部1、自然言語入力部2、画像/自然言語関連付
け部3、表示部4、画像データベース5、検索部6、言
語解析部、および辞書部を備えている。画像入力部
1は、画像データベース5に登録すべき画像データを入
力し、自然言語入力部2は、画像データベース5に登録
すべき画像データに関連付けて付加する視覚的情報や検
索時の検索文を自然言語データとして入力する。
【手続補正5】
【補正対象書類名】明細書
【補正対象項目名】0069
【補正方法】変更
【補正内容】
【0069】その後、検索文すなわち自然言語データの
入力が受け付けられる(ステップS62)。自然言語デ
ータは自然言語入力部2を通じて入力されるデータであ
る。自然言語入力が開始されると、図13(b)に示し
たように、自然言語表示エリア302内に「テーブルの
上に冷えた飲み物を置いている画像は?」の如く検索文
が表示される。
【手続補正6】
【補正対象書類名】明細書
【補正対象項目名】0124
【補正方法】変更
【補正内容】
【0124】この通信I/F112およびモデム113
は、画像入力部1を構成することから、他の画像入力部
として前述の各実施の形態の構成に追加されるものであ
る。この通信I/F112およびモデム113により外
部から画像データを入力することができる。
【手続補正7】
【補正対象書類名】図面
【補正対象項目名】図11
【補正方法】変更
【補正内容】
【図11】

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】 画像データをデータベース化して管理す
    る画像管理装置において、 画像データと該画像データに基づいて形成される画像に
    ついての視覚的印象を示す自然言語データとを関連付け
    て記憶したことを特徴とする画像管理装置。
  2. 【請求項2】 画像データをデータベース化して管理す
    る画像管理装置において、 画像データと該画像データに基づいて形成される画像に
    ついての視覚的印象を示す自然言語データとを関連付け
    て記憶する画像データベースを有し、 前記画像データベースは、ある視覚的印象を用いてアク
    セスされ、かつ、前記ある視覚的印象が自データベース
    上の自然言語データで示される視覚的印象の一部であっ
    た場合、前記ある視覚的印象を含む自然言語データに関
    連する画像データを応答することを特徴とする画像管理
    装置。
  3. 【請求項3】 さらに、キー操作,音声認識,画像認識
    などを通じて自然言語データを入力する入力手段を有
    し、該入力手段により入力された自然言語データを画像
    データに関連付けて記憶することを特徴とする請求項1
    または2に記載の画像管理装置。
  4. 【請求項4】 前記画像データは静止画データ,動画デ
    ータなどのデータであることを特徴とする請求項1〜3
    のいずれか一つに記載の画像管理装置。
  5. 【請求項5】 画像データと該画像データに基づいて形
    成される画像についての視覚的印象を示す自然言語デー
    タとを関連付けて記憶する画像データベースと、 検索文を示す自然言語データを入力する検索文入力手段
    と、 前記画像データベースに記憶された自然言語データに対
    して前記検索文入力手段により入力された自然言語デー
    タを照合し、その照合結果に応じて視覚的印象が共通す
    る自然言語データに関連した画像データを前記画像デー
    タベースから抽出する検索手段と、 を備えたことを特徴とする画像検索装置。
  6. 【請求項6】 前記検索手段は前記画像データベースに
    記憶された自然言語データと前記検索文入力手段により
    入力された自然言語データとを言語解析してから照合す
    ることを特徴とする請求項5に記載の画像検索装置。
  7. 【請求項7】 前記検索手段は前記照合結果に応じて類
    似度の高い方から昇順で複数の画像データを抽出するこ
    とを特徴とする請求項5または6に記載の画像検索装
    置。
  8. 【請求項8】 複数の視覚的印象から新しい視覚的印象
    を導き出すための推論を支援する知識データベースと、 画像データと該画像データに基づいて形成される画像に
    ついての複数の視覚的印象を示す自然言語データとを関
    連付けて記憶する画像データベースと、 検索文を示す自然言語データを入力する検索文入力手段
    と、 前記画像データベースに記憶された各自然言語データに
    ついて、前記知識データベースを参照しながら、複数の
    視覚的印象から前記検索文入力手段により入力された自
    然言語データの視覚的印象に相当する新しい視覚的印象
    を導き出す推論手段と、 前記記憶手段に記憶された自然言語データの内で前記推
    論手段により前記新しい視覚的印象を導き出せた自然言
    語データがあった場合に該自然言語データに関連した画
    像データを前記画像データベースから抽出する検索手段
    と、 を備えたことを特徴とする画像検索装置。
  9. 【請求項9】 前記推論手段は前記画像データベースに
    記憶された自然言語データと前記検索文入力手段により
    入力された自然言語データとを言語解析してから推論す
    ることを特徴とする請求項8に記載の画像検索装置。
  10. 【請求項10】 さらに、前記検索手段により抽出され
    た画像データに基づいて画像表示を行う画像表示手段を
    有したことを特徴とする請求項5〜9のいずれか一つに
    記載の画像検索装置。
  11. 【請求項11】 画像データをデータベース化して管理
    する画像管理方法において、 画像データと該画像データに基づいて形成される画像に
    ついての視覚的印象を示す自然言語データとを関連付け
    る第1工程と、 前記第1工程により関連付けられた画像データおよび自
    然言語データを記憶する第2工程と、 を含んだことを特徴とする画像管理方法。
  12. 【請求項12】 検索文を示す自然言語データを入力す
    る第1工程と、 画像データと該画像データに基づいて形成される画像に
    ついての視覚的印象を示す自然言語データとを関連付け
    て記憶した画像データベースに記憶された自然言語デー
    タに対して前記第1工程により入力された自然言語デー
    タを照合する第2工程と、 前記第2工程の照合結果に応じて視覚的印象が共通する
    自然言語データに関連した画像データを前記画像データ
    ベースから抽出する第3工程と、 を含んだことを特徴とする画像検索方法。
  13. 【請求項13】 前記請求項11または12に記載され
    た方法をコンピュータに実行させるプログラムを記録し
    たことを特徴とするコンピュータ読み取り可能な記録媒
    体。
JP9111504A 1997-04-28 1997-04-28 画像管理装置、画像検索装置、画像管理方法、画像検索方法およびそれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 Pending JPH10301953A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP9111504A JPH10301953A (ja) 1997-04-28 1997-04-28 画像管理装置、画像検索装置、画像管理方法、画像検索方法およびそれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
US09/005,148 US6161108A (en) 1997-04-28 1998-01-09 Method and apparatus for managing images, a method and apparatus for retrieving images, and a computer-readable recording medium with a program for making a computer execute the methods stored therein

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9111504A JPH10301953A (ja) 1997-04-28 1997-04-28 画像管理装置、画像検索装置、画像管理方法、画像検索方法およびそれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体

Publications (1)

Publication Number Publication Date
JPH10301953A true JPH10301953A (ja) 1998-11-13

Family

ID=14562988

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9111504A Pending JPH10301953A (ja) 1997-04-28 1997-04-28 画像管理装置、画像検索装置、画像管理方法、画像検索方法およびそれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体

Country Status (2)

Country Link
US (1) US6161108A (ja)
JP (1) JPH10301953A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002207749A (ja) * 2000-10-10 2002-07-26 Eastman Kodak Co 画像の統合された注釈及び検索のためのエージェント
WO2004070657A1 (ja) * 2003-02-05 2004-08-19 Seiko Epson Corporation 画像処理装置
JP2008090730A (ja) * 2006-10-04 2008-04-17 Nikon Corp 情報処理プログラム、および情報処理装置
JP2015106203A (ja) * 2013-11-28 2015-06-08 Necパーソナルコンピュータ株式会社 情報処理装置、情報処理方法、及びプログラム
JP2017521794A (ja) * 2014-12-30 2017-08-03 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 検索方法及び装置
WO2019026392A1 (ja) * 2017-07-31 2019-02-07 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6774908B2 (en) * 2000-10-03 2004-08-10 Creative Frontier Inc. System and method for tracking an object in a video and linking information thereto
US6810146B2 (en) 2001-06-01 2004-10-26 Eastman Kodak Company Method and system for segmenting and identifying events in images using spoken annotations
US20030098869A1 (en) * 2001-11-09 2003-05-29 Arnold Glenn Christopher Real time interactive video system
US20080215310A1 (en) * 2005-10-28 2008-09-04 Pascal Audant Method and system for mapping a natural language text into animation
US8078618B2 (en) 2006-01-30 2011-12-13 Eastman Kodak Company Automatic multimode system for organizing and retrieving content data files
US8166418B2 (en) * 2006-05-26 2012-04-24 Zi Corporation Of Canada, Inc. Device and method of conveying meaning
US8341152B1 (en) 2006-09-12 2012-12-25 Creatier Interactive Llc System and method for enabling objects within video to be searched on the internet or intranet
US9075808B2 (en) * 2007-03-29 2015-07-07 Sony Corporation Digital photograph content information service
US8433699B1 (en) * 2007-06-28 2013-04-30 Emc Corporation Object identity and addressability

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04253274A (ja) * 1991-01-30 1992-09-09 Nec Corp 電子ファイリング装置
JPH07200634A (ja) * 1993-12-28 1995-08-04 Toshiba Corp 画像読取装置
JPH0981590A (ja) * 1995-09-13 1997-03-28 Canon Inc マルチメディア情報検索装置

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2878442B2 (ja) * 1990-11-14 1999-04-05 松下電器産業株式会社 画像処理装置
JPH04237377A (ja) * 1991-01-21 1992-08-25 Kokusai Denshin Denwa Co Ltd <Kdd> キーワードの配置および色属性を用いる画像検索方式
JPH04264972A (ja) * 1991-02-20 1992-09-21 Sharp Corp 自然言語処理装置及びそれを利用した動画形成装置
JP3177746B2 (ja) * 1991-03-20 2001-06-18 株式会社日立製作所 デ−タ処理システム及び方法
JP2757645B2 (ja) * 1992-01-14 1998-05-25 松下電器産業株式会社 画像編集装置
JP2903904B2 (ja) * 1992-10-09 1999-06-14 松下電器産業株式会社 画像検索装置
JPH06131403A (ja) * 1992-10-15 1994-05-13 Fujitsu Ltd マルチメディア単語辞書及びその検索装置
JPH06176121A (ja) * 1992-12-01 1994-06-24 Seiko Epson Corp 画像出力装置
JP3067966B2 (ja) * 1993-12-06 2000-07-24 松下電器産業株式会社 画像部品を検索する装置及びその方法
JP2976811B2 (ja) * 1994-06-08 1999-11-10 日本電気株式会社 テキストからの人体動作音声生成システム
US5493677A (en) * 1994-06-08 1996-02-20 Systems Research & Applications Corporation Generation, archiving, and retrieval of digital images with evoked suggestion-set captions and natural language interface
JP3024045B2 (ja) * 1994-06-27 2000-03-21 シャープ株式会社 自然言語に基づくデータ検索装置
JPH08138075A (ja) * 1994-11-08 1996-05-31 Matsushita Electric Ind Co Ltd 画像作成方法と画像作成装置
US5659742A (en) * 1995-09-15 1997-08-19 Infonautics Corporation Method for storing multi-media information in an information retrieval system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04253274A (ja) * 1991-01-30 1992-09-09 Nec Corp 電子ファイリング装置
JPH07200634A (ja) * 1993-12-28 1995-08-04 Toshiba Corp 画像読取装置
JPH0981590A (ja) * 1995-09-13 1997-03-28 Canon Inc マルチメディア情報検索装置

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002207749A (ja) * 2000-10-10 2002-07-26 Eastman Kodak Co 画像の統合された注釈及び検索のためのエージェント
US7028253B1 (en) 2000-10-10 2006-04-11 Eastman Kodak Company Agent for integrated annotation and retrieval of images
WO2004070657A1 (ja) * 2003-02-05 2004-08-19 Seiko Epson Corporation 画像処理装置
CN100349181C (zh) * 2003-02-05 2007-11-14 精工爱普生株式会社 图像处理装置及图像处理方法
JP2008090730A (ja) * 2006-10-04 2008-04-17 Nikon Corp 情報処理プログラム、および情報処理装置
JP2015106203A (ja) * 2013-11-28 2015-06-08 Necパーソナルコンピュータ株式会社 情報処理装置、情報処理方法、及びプログラム
JP2017521794A (ja) * 2014-12-30 2017-08-03 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 検索方法及び装置
US10296541B2 (en) 2014-12-30 2019-05-21 Baidu Online Network Technology (Beijing) Co., Ltd. Searching method and apparatus
WO2019026392A1 (ja) * 2017-07-31 2019-02-07 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
US11386870B2 (en) 2017-07-31 2022-07-12 Sony Corporation Information processing apparatus and information processing method

Also Published As

Publication number Publication date
US6161108A (en) 2000-12-12

Similar Documents

Publication Publication Date Title
CN110209897B (zh) 智能对话方法、装置、存储介质及设备
JPH10301953A (ja) 画像管理装置、画像検索装置、画像管理方法、画像検索方法およびそれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
US20200327327A1 (en) Providing a response in a session
US20240061887A1 (en) Information search method and apparatus, computer device and storage medium
JP7223574B2 (ja) マンガ生成システムおよびマンガ生成方法
CN109800303A (zh) 一种文档信息提取方法、存储介质及终端
CN111506696A (zh) 基于少量训练样本的信息抽取方法及装置
CN111046272A (zh) 一种基于医疗知识图谱的智能问答系统
JP6605410B2 (ja) 感情要因推定支援装置、感情要因推定支援方法及び感情要因推定支援用プログラム
JPWO2018221119A1 (ja) 検索用資料情報記憶装置
JP2014182548A (ja) 商品情報提供システムおよび商品情報提供用プログラム
Dobreski et al. Depicting historical persons and identities: A faceted approach
Kennedy et al. The use of binaries in nationalism studies
WO2019111545A1 (ja) 知的財産システム、知的財産支援方法および知的財産支援プログラム
JP2017117021A (ja) キーワード抽出装置、コンテンツ生成システム、キーワード抽出方法、およびプログラム
CN114528851B (zh) 回复语句确定方法、装置、电子设备和存储介质
CN112651244B (zh) 一种基于论文摘要QA的TopK实体抽取方法与系统
KR20230104492A (ko) 적응적 이미지 텍스트 변환 방법, 장치 및 시스템
KR20190021708A (ko) 전환이미지를 이용한 장기기억 유도 학습장치
JP3526616B2 (ja) データ検索装置
CN112241463A (zh) 一种基于融合文本语义与图片信息的搜索方法
JP2018197927A (ja) 情報処理装置、情報処理システム、情報処理方法およびプログラム
JP2002366018A (ja) 外国語学習システム
Mattana The allure of synthesis: science and the literary in comparative and world literature
Crawford et al. Understanding metaphor in art: Distinguishing literal giants from metaphorical challenges.