JP5115089B2 - キーワード抽出方法 - Google Patents

キーワード抽出方法 Download PDF

Info

Publication number
JP5115089B2
JP5115089B2 JP2007209946A JP2007209946A JP5115089B2 JP 5115089 B2 JP5115089 B2 JP 5115089B2 JP 2007209946 A JP2007209946 A JP 2007209946A JP 2007209946 A JP2007209946 A JP 2007209946A JP 5115089 B2 JP5115089 B2 JP 5115089B2
Authority
JP
Japan
Prior art keywords
search
keyword
image information
pseudo
search field
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007209946A
Other languages
English (en)
Other versions
JP2009044658A (ja
Inventor
広行 駒井
徹 上和田
雅司 漆原
高史 寺崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2007209946A priority Critical patent/JP5115089B2/ja
Priority to US12/175,721 priority patent/US20090043769A1/en
Priority to TW97127613A priority patent/TWI457770B/zh
Priority to EP20080161386 priority patent/EP2026220A1/en
Priority to CN2008101449296A priority patent/CN101364225B/zh
Priority to KR20080077436A priority patent/KR100998532B1/ko
Publication of JP2009044658A publication Critical patent/JP2009044658A/ja
Priority to KR1020100055416A priority patent/KR101058444B1/ko
Application granted granted Critical
Publication of JP5115089B2 publication Critical patent/JP5115089B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7844Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using original textual content or text extracted from visual content or transcript of audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • G06V10/225Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on a marking or identifier characterising the area

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

本発明は、画像中の情報に基づいてウエブサイトへアクセスする技術に関する。
商品の販売促進や、企業イメージの向上等のため、多くの人に情報を発信する手法(広報活動)としては、テレビによるCM(commercial message)放送や、新聞、雑誌への広告掲載が主流であり、効果的である。
また、インターネットの普及に伴い、ウエブサイトによる広報活動も重要になってきている。
テレビCMや新聞広告は、タイムリーに多くの人に届く利点があるものの、放送時間や紙面に限りがあり、多くの情報を伝えられないという問題がある。
一方、ウエブサイトによる広告は、ユーザ(コンシューマ)の望む情報を詳細に伝えられる利点があるものの、ユーザからアクセスする必要があり、そのウエブサイトや情報の存在自体を知らないコンシューマがアクセスできない(即ち広告できない)という問題がある。
このため、テレビや新聞で広告する際に、ウエブサイトの存在も知らせ、広告内容に興味を持った人をウエブサイトへ誘導する試みがある。
例えば、CM中にウエブサイトのURLを表示し、インターネットを介したアクセスを促す。
しかし、URLは、覚え難く、アクセスする際の入力ミスも多いことから、確実にウエブサイトへ誘導できるとは限らなかった。
そこで、図9に示すようにキーワードが入力されたサーチエンジンの検索欄を模した表示を行い、ブラウザから同様にキーワードを検索欄に入力して検索し、ウエブサイトへアクセスするように促す手法もある。この手法であれば、覚え易いキーワードを使い、表示のとおり検索すれば良く、容易にアクセス可能である。
また、本発明に関連する先行技術として、例えば、下記の文献に開示される技術がある。
特開2002−290947号公報 ネット連動型テレビCMへの反応度調査、日経BP社、検索日2007/07/26、http://www.nikkeibp.co.jp/netmarketing/databox/nmdb/061201_crossmedia/
しかし、テレビや新聞で検索キーワードを広告し、インターネットで検索する手法であると、キーワードを広告するメディア(テレビや新聞)と、検索するメディア(インターネット)が異なるので、検索する場合、ユーザが新たにブラウザを起動して検索を行う必要があり、手間がかかるので検索意欲を削ぐという問題があった。
そこで本発明は、サーチエンジンの検索欄を模した画像から検索キーワードを抽出し、
該検索キーワードで検索することにより、広告中の情報(検索キーワード)に基づくウエブアクセスを容易にする技術を提供する。
上記課題を解決するため、本発明は、以下の構成を採用した。
即ち、本発明のキーワード抽出方法は、
画像情報を取得するステップと、
前記画像情報を解析し、検索欄を模した所定パターンに該当する擬似検索欄領域を特定するステップと、
前記擬似検索領域から検索キーワードを抽出するステップと、
をコンピュータが実行する。
また、本発明の検索方法は、
画像情報を取得するステップと、
前記画像情報を解析し、検索欄を模した所定パターンに該当する擬似検索欄領域を特定するステップと、
前記擬似検索領域から検索キーワードを抽出するステップと、
前記検索キーワードを用い、検索処理又は検索の前処理を行うステップと、
をコンピュータが実行する。
また、本発明のキーワード抽出装置は、
画像情報を取得する画像取得部と、
前記画像情報を解析し、検索欄を模した所定パターンに該当する擬似検索欄領域を特定する解析部と、
前記擬似検索領域から検索キーワードを抽出する抽出部と、
を備える。
また、本発明の検索装置は、
画像情報を取得する画像取得部と、
前記画像情報を解析し、検索欄を模した所定パターンに該当する擬似検索欄領域を特定する解析部と、
前記擬似検索領域から検索キーワードを抽出する抽出部と、
前記検索キーワードを用い、検索処理又は検索の前処理を行う検索処理部と、
を備える。
また、本発明は、上記方法をコンピュータに実行させるプログラムであっても良い。更に、本発明は、このプログラムをコンピュータが読み取り可能な記録媒体に記録したものであっても良い。コンピュータに、この記録媒体のプログラムを読み込ませて実行させることにより、その機能を提供させることができる。
ここで、コンピュータが読み取り可能な記録媒体とは、データやプログラム等の情報を電気的、磁気的、光学的、機械的、または化学的作用によって蓄積し、コンピュータから読み取ることができる記録媒体をいう。このような記録媒体の内コンピュータから取り外し可能なものとしては、例えばフレキシブルディスク、光磁気ディスク、CD-ROM、CD-R/W、DVD、DAT、8mmテープ、メモリカード等がある。
また、コンピュータに固定された記録媒体としてハードディスクやROM(リードオンリーメモリ)等がある。
本発明によれば、サーチエンジンの検索欄を模した画像から検索キーワードを抽出し、該検索キーワードで検索することにより、広告中の情報(検索キーワード)に基づくウエブアクセスを容易にする技術を提供できる。
〈装置構成〉
以下、図面を参照して本発明を実施するための最良の形態について説明する。以下の実施の形態の構成は例示であり、本発明は実施の形態の構成に限定されない。
図1は、本実施形態に係る検索システムの概略図である。
本例の検索システム10は、テレビ放送を行う放送局の局側装置101や、局側装置101から放送された動画像を受信するユーザ端末1、インターネット等のネットワークを介して情報を提供するウエブサーバ2、ウエブサーバ2で提供されている情報の検索サービスを提供する検索サーバ(サーチエンジン)3、ランキングサーバ4等を有している。
ユーザ端末1は、本システム10の検索装置或は検索キーワード抽出装置に相当する。
ユーザ端末1は、CPU(central processing unit)やメインメモリ等よりなる演算
処理部12、演算処理の為のデータやソフトウェアを記憶した記憶部(ハードディスク)13、入出力ポート14、通信制御部(CCU:Communication Control Unit)15等を備えた汎用のコンピュータである。
該入出力ポート14には、キーボードやマウス、CD−ROMドライブ、TV(Television)受信部16等の入力デバイス、そして表示装置やプリンター等の出力デバイスが適宜接続される。
TV受信部(チューナ)16は、TVアンテナを介して放送局からの電波を受信し、電気信号(画像情報)に変換して入出力ポート14に入力する。
CCU15は、ネットワークを介して他のコンピュータとの通信を行うものである。
記憶部13には、オペレーティングシステム(OS)やアプリケーションソフト(キーワード抽出プログラム、検索プログラム)がインストールされている。
演算処理部12は、前記OSやアプリケーションプログラムを記憶部13から適宜読み出して実行し、入出力ポート14やCCU15から入力された情報、及び記憶部13から読み出した情報を演算処理することにより、画像取得部、解析部、抽出部、再生部、指示受信部としても機能する。
この画像取得部としては、画像情報を取得する。例えば、前記TV受信部16で受信した画像情報を受信する、或いは、記憶部13に記憶(録画)された画像情報を読み出して取得する。
再生部としては、画像取得部で取得した画像情報に基づいて動画像を再生する。即ち、表示部に動画像を表示させ、該動画の音をスピーカから出力させる。また、再生部は、再生のため、ユーザの操作等に応じてTV受信部16に受信する或いは変換するチャネルを通知する。
指示受信部としては、ユーザの操作による検索指示(指示信号)を受信する。
解析部としては、動画像を構成する画像情報のうち、検索欄を模した所定パターンに該当する部分を擬似検索欄領域として特定する。
抽出部としては、前記擬似検索領域の文字認識を行い、検索キーワードを抽出する。
検索処理部としては、前記検索キーワードを用い、検索処理又は検索の前処理を行う。例えば、前記CCU15を介して検索サーバ3に検索キーワードを含む検索要求を送信し、該検索サーバから返信された検索結果を表示部に表示させる。また、検索処理部は、この表示したコンテンツの要約やハイパーリンク等の検索結果に基づいてウエブサーバにアクセスし、該コンテンツの表示を行う機能も有している。なお、検索処理部は、一般的なウエブブラウザを用いても良い。
一方、検索サーバ3は、ユーザ端末1の検索処理部(ウエブブラウザ)からの検索要求を受信する手段や、ウエブサーバ2の情報を記憶した記憶手段、受信した検索要求のキーワードに基づいて対応するウエブサーバ2の情報を記憶手段から索出する手段、検索結果を要求元のユーザ端末1に送信する手段等を有した一般的なコンピュータ、所謂検索エンジンである。
また、ウエブサーバ2は、インターネット等のネットワークを介してユーザ端末1や検索サーバ3等の他のコンピュータと接続している。ウエブサーバ2は、他のコンピュータからのアクセス要求(URL等)で指定されたコンテンツ(ファイル)を要求元のコンピュータに提供(送信)する。なお、該ウエブサーバ2は、周知の構成であるので、詳しい説明は省略する。
同様に、ランキングサーバ(キーワード提供サーバ)4は、インターネット等のネットワークを介してユーザ端末1や検索サーバ等の他のコンピュータと接続している。ランキングサーバ4は、検索サイトで検索に利用されたキーワードを検索回数の多い順にソートしたランキング情報を記憶部に記憶しており、他のコンピュータからの要求に応じて該キーワード(ランキング情報)を提供する。なお、ランキングサーバ4は、検索サーバ3と兼用しても良い。また、CMで利用されているキーワードをオペレータが記憶部に記憶させておいても良い。該ランキングサーバ4は、一般的なウエブサーバと同一の構成であるので、詳しい説明は省略する。
〈検索方法〉
次に、これら構成のユーザ端末1が検索プログラムに基づいて実行する検索方法(検索キーワードの抽出方法も含む)について、図2を用いて説明する。
図2に示すように、ユーザ端末1は、ユーザの操作によりTVの視聴(再生)が指示されると、再生部が記憶部13から或はTV受信部から受信した画像情報に基づいて動画像を再生する。
このときユーザ端末1の画像取得部は、動画像を構成する一連のフレームのうち、後述の所定条件を満たしたフレームを解析対象のフレーム(画像情報)として特定(取得)する(ステップ1、以下S1のように略記する)。
次に、解析部は、上記特定したフレームを解析して、検索エンジンの検索欄を模した所定パターンに該当する擬似検索欄領域を特定する(S2)。
また、抽出部は、擬似検索欄領域について文字認識を行い、キーワードを抽出する(S3)。
そして、検索部は、ウエブブラウザを起動し、前記抽出部が抽出したキーワードを検索サーバに送信して検索し、検索結果を表示する(S4)。
各ステップの具体的な処理については、以下の具体例を用いて説明する。
〈具体例1〉
図3は、動画像からCMの所定部分(末尾)を自動的に特定して検索する方法の説明図である。
先ず、画像取得部は、動画像中の番組本編以外のCM部分を検出する(S11)。
このCM検出手法としては、以下のような条件を満たした場合にCMと特定する。
1.前後のフレームを比較し、フレーム全域が異なっている(一致度合いが所定値未満)、即ちカットが切換わった場合で、所定以上の無音時間がある。
2.番組本編がモノラルで放送され、CM時にステレオ放送に切換わるので、モノラルがステレオに切換わってからモノラルに戻るまでの期間。
3.所定時間(例えば15秒の倍数)でカットが切換わる場合
4.所定時刻(例えば正時から5分前等)
5.EPGで取得した番組情報に基づき、番組の切換わり時刻の前後5分、及び該番組の切換わり時刻から番組を等分(2分割や4分割)した時刻
なお、CMの検出手法としては、この他公知の手法を用いても良いし、これらを組み合わせて用いても良い。
次に画像取得部は、CMの長さの基準となる時間Lを設定する。本例では、L=15(秒)とした(S12)。
なお、キーワード等を告知するタイミングは、CMの末尾部分である可能性が高いので、上記条件に基づいて検出したCMの先頭から所定時間(L/2、L/3、L−5(秒))後からLまでのフレームを取得する。本例では、L−5からLまでとしている(S13)。
そして、解析部が、前記画像取得部で取得したフレーム(画像情報)を解析して、検索欄を模した所定パターンに該当する部分を擬似検索欄領域として特定し、抽出部が該擬似検索欄領域から文字を抽出する(S14)。
このとき解析部は、図9のように画像中の検索欄を模した領域を特定するため、該画像を水平方向(主走査方向)及び垂直方向(副走査方向)に走査し、画素が水平或は垂直に所定距離以上連続して直線となっている箇所を抽出する。そして、該直線が矩形状となっている領域を擬似検索欄領域としている。
特に本実施形態では、一の矩形61に対し、幅(水平方向)の短い矩形62が隣接し、短い矩形中に「検索」の文字がある、即ち検索ボタンに相当する画像があるといった所定パターンと一致する場合、矩形61の部分を擬似検索欄領域と特定する。
このときキーワードを抽出できた場合には、該キーワードを検索部へ通知し、抽出できなかった場合には、この抽出不可の旨を画像取得部に通知する(S15)。
該抽出不可の通知を受けた画像取得部は、この抽出の対象となったフレームがCMの先頭からL秒後に達したか、否かを判断し(S16)、L秒後のフレームでなければ次のフレームを取得する(S17)。
また、ステップ16でL秒後のフレームであれば、Lが60秒未満であるか否かを判定し(S18)、60秒未満でなければ終了し、60秒以上であればLに15秒加え(S19)、CMの最大値(例えば60秒)を超えていなければステップ13に戻ってフレーム
の取得を行う(S20)。
なお、ステップ13にてフレームを取得する際、L−5からL秒までの全てのフレームを取得しても良いが、MPEG方式の動画像の場合、Iピクチャのみを取得しても良い。このようにIピクチャのみを取得する構成とすれば、処理量を低減できる。
〈具体例2〉
図4は、ユーザの操作に応じてフレームを特定してキーワードを抽出する方法の説明図、図5は、本例の解析順序の説明図である。
先ず、入出力ポート14を介して接続したキーボードやリモコンを用いユーザの入力操作によってキーワード取得の指示が入力されると(S21)、画像取得部は、入力を受けた時点で再生されているフレームを取得する(S22)。
そして、解析部が、前記画像取得部で取得したフレーム(画像情報)を解析して、検索欄を模した所定パターンに該当する部分を擬似検索欄領域として特定し、抽出部が該擬似検索欄領域から文字を抽出する(S23)。
このときキーワードを抽出できた場合には、該キーワードを検索部へ通知し、抽出できなかった場合には、この抽出不可の旨を画像取得部に通知する(S24)。
該抽出不可の通知を受けた画像取得部は、この抽出の対象となったフレームが入力を受けた以前のフレームか否かを判定し(S25)、以前のフレームであれば更に、入力を受けた時点からN秒以前のフレームであるか否かを判定する(S26)。
ステップ26でN秒以前のフレームでなければ、1つ前のフレームを取得し(S27)、N秒以前のフレームであれば、入力を受けた時点の次のフレームを取得する(S28)。
一方、ステップ25で入力を受けた後のフレームと判断した場合、入力を受けた時点からM秒以後のフレームか否かを判定し、M秒以後のフレームでなければ、画像取得部に通知し(S29)、画像取得部が1つ次のフレームを取得する(S30)。なお、ステップ29で、M秒後のフレームと判定した場合、抽出処理を終了する。
このように、ユーザの入力に応じてフレームを特定する場合、ユーザが動画像中のキーワードを見つけてから入力操作する可能性が高いので、入力を受けた時点から順次遡ってフレームを特定し、キーワードが抽出されなければ入力を受けた時点以後のフレームを解析対象として特定することで、速やかに解析処理行うことができる。
〈具体例3〉
図6は、ライブ放送中にキーワードを抽出し、抽出したキーワードをバッファリングする例の説明図である。
まず、画像取得部は、再生している動画像がライブ放送(TV受信部で受信した情報)か否かを判定し(S31)、ライブ放送であれば現時点のフレームを取得する(S32)。
解析部は、取得したフレームから擬似検索欄領域を特定する(S33)。ここで擬似検索欄領域を特定できた場合には、該擬似検索欄領域について抽出部が文字認識を行い(S34−S35)、キーワードを抽出し、擬似検索欄領域を特定できない場合にはステップ
S31に戻る。
ステップ35でキーワードを抽出できた場合、バッファが満杯か否かを判定し(S36−S37)、満杯であればバッファ中最も古いデータを削除して(S38)バッファに抽出したキーワードを追加する(S39)。
バッファリングしたキーワードは、例えば、ユーザの指示があった場合に、抽出部が直近のキーワードをバッファから読み出して検索部に通知し、検索を行う。
なお、本例ではステップ35で抽出したキーワードをバッファに記憶したが、ステップ33で特定した擬似検索欄領域をバッファに記憶し、ステップ34,35を省略しても良い。
また、ステップ32でライブ放送中のフレームを順次取得する場合に、動画像を構成する全てのフレームを取得しても良いが、MPEG方式の動画像であればIピクチャのみを記憶しても良い。これにより記憶容量及び解析の処理量を抑えることができる。
〈具体例4〉
図7は、特定後のフレームを解析し、キーワードを抽出して検索する方法の説明図である。
先ず解析部が解析対象のフレームを解析し、擬似検索欄領域を特定できた場合(S41)、抽出部が該領域の文字認識を行う(S42)。
該擬似検索欄領域からキーワードが抽出できた場合(S43)、該キーワードとランキングサーバ4のデータベース(記憶部)に記憶されているキーワードとを比較し、類似のキーワードがあるか否かを判定する(S44)。
類似のキーワードがあった場合、検索部は、このキーワードをウエブブラウザの検索キーワードに設定して検索サイトにアクセスし、検索を行う(S45,S47)。またステップ44で類似したキーワードがない場合、抽出されたキーワードを検索キーワードに設定して検索を行う(S46,S47)。
検索サイトが該キーワードによる検索を行い、検索結果を返信すると(S48)、ユーザ端末1の検索部がこの検索結果の最上位のコンテンツを表示部に表示させる(S49)。
図8は、検索結果の表示例を示す図である。
該検索結果を示すウインドウのアドレス欄51には検索されたコンテンツのURL、コンテンツ欄52にはウエブサーバから受信したコンテンツを表示している。
また、本例では、このコンテンツと別フレームで、検索結果一覧54及び検索キーワード53も表示している。該検索結果一覧から他のリンクを選べば上記以外のコンテンツも閲覧することができる。
なお、検索結果の表示方法は、上記に限らず、最上位のコンテンツのみ、或は検索結果一覧のみであっても良い。
また、キーワードによる検索まで行わずに、検索前処理として、ウエブブラウザを起動し、検索サーバ2の検索用ページの検索欄に抽出したキーワードを挿入した状態で処理を止め、ユーザの操作を待つようにしても良い。
〈その他〉
本発明は、上述の図示例にのみ限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変更を加え得ることは勿論である。
例えば、上述の例では、画像情報としてTV受信部で受信した動画像或は記憶部から読み出した動画像を用いたが、これに限らず、新聞や、雑誌、チラシ等をデジタルカメラで撮影或はスキャナでスキャンして取得した画像情報であっても良い。
また、以下に付記した構成であっても上述の実施形態と同様の効果が得られる。また、これらの構成要素は可能な限り組み合わせることができる。
(付記1)
画像情報を取得するステップと、
前記画像情報を解析し、検索欄を模した所定パターンに該当する擬似検索欄領域を特定するステップと、
前記擬似検索領域から検索キーワードを抽出するステップと、
をコンピュータが実行するキーワード抽出方法。
(付記2)
動画像を構成する一連のフレームのうち、所定間隔のフレームを前記画像情報として検出する付記1に記載のキーワード抽出方法。
(付記3)
動画像中のフレームを比較し、CMの条件を満たしたフレームを前記画像情報として検出する付記1に記載のキーワード抽出方法。
(付記4)
前記CMの条件を満たした複数のフレームであって時系列的に連続した一群であるフレーム群のうち、所定期間内のフレームを前記解析対象とする付記3に記載のキーワード抽出方法。
(付記5)
前記所定期間が、前記フレーム群のうち、後半部分、最初から所定時間後の部分、又は最後から所定時間前の部分である付記4に記載のキーワード抽出方法。
(付記6)
前記画像情報に基づいて動画像を再生するステップと、
ユーザの操作による指示信号を受信するステップと、を更に実行し、
前記指示信号を受信したときに再生中のフレーム又は該再生中のフレームから所定時間離れたフレームを前記解析の対象とする付記2から5の何れか1項に記載のキーワード抽出方法。
(付記7)
前記指示信号を受信したときに再生中のフレームから所定時間後のフレームを前記解析の対象とし、前記所定パターンに該当する領域が存在しなかった場合に、前記指示信号を受信したときに再生中のフレームより所定時間前のフレームを前記解析の対象とする付記6に記載のキーワード抽出方法。
(付記8)
前記画像情報を記憶部に記憶させ、前記指示信号を受信したときに再生中のフレームよ
り所定時間前のフレームを前記記憶部から読み出して解析の対象とする付記6に記載のキーワード抽出方法。
(付記9)
画像情報を取得するステップと、
前記画像情報を解析し、検索欄を模した所定パターンに該当する擬似検索欄領域を特定するステップと、
前記擬似検索領域から検索キーワードを抽出するステップと、
前記検索キーワードを用い、検索処理又は検索の前処理を行うステップと、
をコンピュータが実行する検索方法。
(付記10)
前記検索の前処理が、ブラウザを起動し、前記検索キーワードを検索サイトの検索パラメータとして入力した状態とする処理である付記9に記載の検索方法。
(付記11)
前記検索処理が、ブラウザを起動し、前記検索キーワードを検索サイトで検索した結果を該ブラウザで表示させた状態とする処理である付記9に記載の検索方法。
(付記12)
画像情報を取得する画像取得部と、
前記画像情報を解析し、検索欄を模した所定パターンに該当する擬似検索欄領域を特定する解析部と、
前記擬似検索領域から検索キーワードを抽出する抽出部と、
を備えた抽出装置。
(付記13)
前記画像取得部が、動画像を構成する一連のフレームのうち、所定間隔のフレームを前記画像情報として検出する付記12に記載のキーワード抽出装置。
(付記14)
前記画像取得部が、動画像中のフレームを比較し、CMの条件を満たしたフレームを前記画像情報として検出する付記12に記載のキーワード抽出装置。
(付記15)
前記解析部が、前記CMの条件を満たした複数のフレームであって時系列的に連続した一群であるフレーム群のうち、所定期間内のフレームを前記解析の対象とする付記14に記載のキーワード抽出装置。
(付記16)
前記所定期間が、前記フレーム群のうち、後半部分、最初から所定時間後の部分、又は最後から所定時間前の部分である付記15に記載のキーワード抽出装置。
(付記17)
前記画像情報に基づいて動画像を再生する再生部と、
ユーザの操作による指示信号を受信する指示受信部と、を更に実行し、
前記指示信号を受信したときに再生中のフレーム又は該再生中のフレームから所定時間離れたフレームを前記解析の対象とする付記13から16の何れか1項に記載のキーワード抽出装置。
(付記18)
前記指示信号を受信したときに再生中のフレームから所定時間後のフレームを前記解析の対象とし、前記所定パターンに該当する領域が存在しなかった場合に、前記指示信号を受信したときに再生中のフレームより所定時間前のフレームを前記解析の対象とする付記17に記載のキーワード抽出装置。
(付記19)
画像情報を取得する画像取得部と、
前記画像情報を解析し、検索欄を模した所定パターンに該当する擬似検索欄領域を特定する解析部と、
前記擬似検索領域から検索キーワードを抽出する抽出部と、
前記検索キーワードを用い、検索処理又は検索の前処理を行う検索処理部と、
を備えた検索装置。
(付記20)
前記検索の前処理が、ブラウザを起動し、前記検索キーワードを検索サイトの検索パラメータとして入力した状態とする処理である付記19に記載の検索装置。
(付記21)
前記検索処理が、ブラウザを起動し、前記検索キーワードを検索サイトで検索した結果を該ブラウザで表示させた状態とする処理である付記19に記載の検索装置。
(付記22)
画像情報を取得するステップと、
前記画像情報を解析し、検索欄を模した所定パターンに該当する擬似検索欄領域を特定するステップと、
前記擬似検索領域から検索キーワードを抽出するステップと、
をコンピュータに実行させるキーワード抽出プログラム。
(付記23)
動画像を構成する一連のフレームのうち、所定間隔のフレームを前記画像情報として検出する付記22に記載のキーワード抽出プログラム。
(付記24)
動画像中のフレームを比較し、CMの条件を満たしたフレームを前記画像情報として検出する付記22に記載のキーワード抽出プログラム。
(付記25)
前記CMの条件を満たした複数のフレームであって時系列的に連続した一群であるフレーム群のうち、所定期間内のフレームを前記解析対象とする付記24に記載のキーワード抽出プログラム。
(付記26)
前記所定期間が、前記フレーム群のうち、後半部分、最初から所定時間後の部分、又は最後から所定時間前の部分である付記25に記載のキーワード抽出プログラム。
(付記27)
前記画像情報に基づいて動画像を再生するステップと、
ユーザの操作による指示信号を受信するステップと、を更に実行し、
前記指示信号を受信したときに再生中のフレーム又は該再生中のフレームから所定時間
離れたフレームを前記解析の対象とする付記23から26の何れか1項に記載のキーワード抽出プログラム。
(付記28)
前記指示信号を受信したときに再生中のフレームから所定時間後のフレームを前記解析の対象とし、前記所定パターンに該当する領域が存在しなかった場合に、前記指示信号を受信したときに再生中のフレームより所定時間前のフレームを前記解析の対象とする付記27に記載のキーワード抽出プログラム。
(付記29)
前記画像情報を記憶部に記憶させ、前記指示信号を受信したときに再生中のフレームより所定時間前のフレームを前記記憶部から読み出して解析の対象とする付記27に記載のキーワード抽出プログラム。
(付記30)
画像情報を取得するステップと、
前記画像情報を解析し、検索欄を模した所定パターンに該当する擬似検索欄領域を特定するステップと、
前記擬似検索領域から検索キーワードを抽出するステップと、
前記検索キーワードを用い、検索処理又は検索の前処理を行うステップと、
をコンピュータに実行させる検索プログラム。
(付記31)
前記検索の前処理が、ブラウザを起動し、前記検索キーワードを検索サイトの検索パラメータとして入力した状態とする処理である付記30に記載の検索プログラム。
(付記32)
前記検索処理が、ブラウザを起動し、前記検索キーワードを検索サイトで検索した結果を該ブラウザで表示させた状態とする処理である付記30に記載の検索プログラム。
検索システムの概略図 検索方法(検索キーワードの抽出方法も含む)の説明図 CMの所定部分(末尾)を自動的に特定して検索する方法の説明図 ユーザの操作に応じてフレームを特定してキーワードを抽出する方法の説明図 解析順序の説明図 ライブ放送中に抽出したキーワードをバッファリングする例の説明図 特定後のフレームを解析し、キーワードを抽出して検索する方法の説明図 検索結果の表示例を示す図 検索欄を模した領域を有する画像の説明図
符号の説明
10 検索システム
1 ユーザ端末
2 ウエブサーバ
3 検索サーバ(サーチエンジン)
4 ランキングサーバ
101 局側装置

Claims (10)

  1. 画像情報を取得するステップと、
    前記画像情報を解析し、検索欄を模した所定パターンに該当する擬似検索欄領域を特定するステップと、
    前記擬似検索領域から検索キーワードを抽出するステップと、
    をコンピュータが実行するキーワード抽出方法。
  2. 前記画像情報を取得するステップにおいて、動画像を構成する一連のフレームのうち、所定間隔のフレームを前記画像情報として検出する請求項1に記載のキーワード抽出方法。
  3. 前記画像情報を取得するステップにおいて、動画像中のフレームを比較し、CMの条件を満たしたフレームを前記画像情報として検出する請求項1に記載のキーワード抽出方法。
  4. 前記画像情報の解析において、前記CMの条件を満たした複数のフレームであって時系列的に連続した一群であるフレーム群のうち、所定期間内のフレームを前記解析対象とする請求項3に記載のキーワード抽出方法。
  5. 前記画像情報の解析において、前記所定期間が、前記フレーム群のうち、後半部分、最初から所定時間後の部分、又は最後から所定時間前の部分である請求項4に記載のキーワード抽出方法。
  6. 画像情報を取得するステップと、
    前記画像情報を解析し、検索欄を模した所定パターンに該当する擬似検索欄領域を特定するステップと、
    前記擬似検索領域から検索キーワードを抽出するステップと、
    前記検索キーワードを用い、検索処理又は検索の前処理を行うステップと、
    をコンピュータが実行する検索方法。
  7. 画像情報を取得する画像取得部と、
    前記画像情報を解析し、検索欄を模した所定パターンに該当する擬似検索欄領域を特定する解析部と、
    前記擬似検索領域から検索キーワードを抽出する抽出部と、
    を備えたキーワード抽出装置。
  8. 画像情報を取得する画像取得部と、
    前記画像情報を解析し、検索欄を模した所定パターンに該当する擬似検索欄領域を特定する解析部と、
    前記擬似検索領域から検索キーワードを抽出する抽出部と、
    前記検索キーワードを用い、検索処理又は検索の前処理を行う検索処理部と、
    を備えた検索装置。
  9. 画像情報を取得するステップと、
    前記画像情報を解析し、検索欄を模した所定パターンに該当する擬似検索欄領域を特定するステップと、
    前記擬似検索領域から検索キーワードを抽出するステップと、
    をコンピュータに実行させるキーワード抽出プログラム。
  10. 画像情報を取得するステップと、
    前記画像情報を解析し、検索欄を模した所定パターンに該当する擬似検索欄領域を特定するステップと、
    前記擬似検索領域から検索キーワードを抽出するステップと、
    前記検索キーワードを用い、検索処理又は検索の前処理を行うステップと、
    をコンピュータに実行させる検索プログラム。
JP2007209946A 2007-08-10 2007-08-10 キーワード抽出方法 Expired - Fee Related JP5115089B2 (ja)

Priority Applications (7)

Application Number Priority Date Filing Date Title
JP2007209946A JP5115089B2 (ja) 2007-08-10 2007-08-10 キーワード抽出方法
US12/175,721 US20090043769A1 (en) 2007-08-10 2008-07-18 Keyword extraction method
TW97127613A TWI457770B (zh) 2007-08-10 2008-07-21 關鍵字擷取方法及裝置、搜尋方法及裝置,以及電腦可讀儲存媒體
EP20080161386 EP2026220A1 (en) 2007-08-10 2008-07-29 Keyword extraction method
CN2008101449296A CN101364225B (zh) 2007-08-10 2008-08-07 关键字提取方法
KR20080077436A KR100998532B1 (ko) 2007-08-10 2008-08-07 키워드 추출 방법
KR1020100055416A KR101058444B1 (ko) 2007-08-10 2010-06-11 키워드 추출 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007209946A JP5115089B2 (ja) 2007-08-10 2007-08-10 キーワード抽出方法

Publications (2)

Publication Number Publication Date
JP2009044658A JP2009044658A (ja) 2009-02-26
JP5115089B2 true JP5115089B2 (ja) 2013-01-09

Family

ID=39816711

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007209946A Expired - Fee Related JP5115089B2 (ja) 2007-08-10 2007-08-10 キーワード抽出方法

Country Status (6)

Country Link
US (1) US20090043769A1 (ja)
EP (1) EP2026220A1 (ja)
JP (1) JP5115089B2 (ja)
KR (2) KR100998532B1 (ja)
CN (1) CN101364225B (ja)
TW (1) TWI457770B (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101406899B1 (ko) * 2010-03-25 2014-06-13 후지쯔 가부시끼가이샤 정보 처리 프로그램, 장치, 및 방법
JP5506507B2 (ja) * 2010-03-31 2014-05-28 Necパーソナルコンピュータ株式会社 Cm検出システム、サーバ、cm検出方法、プログラム及び記録媒体
KR20120021057A (ko) * 2010-08-31 2012-03-08 삼성전자주식회사 특정 영역에서 키워드를 추출하는 검색 서비스 제공방법 및 이를 적용한 디스플레이 장치
JP2012160023A (ja) * 2011-01-31 2012-08-23 Toshiba Corp 文字抽出装置、表示方法及び文字抽出方法
KR101359290B1 (ko) * 2011-12-08 2014-02-11 애드티브이노베이션(주) 검색키워드를 디스플레이하는 인터넷 광고 시스템 및 그 방법
CN103198063A (zh) * 2012-01-04 2013-07-10 联想(北京)有限公司 电子设备及其信息处理方法
JP5906843B2 (ja) 2012-03-14 2016-04-20 オムロン株式会社 キーワード検出装置、その制御方法および制御プログラム、並びに表示機器
CN103577414B (zh) * 2012-07-20 2017-04-12 富士通株式会社 数据处理方法和设备
JP6155740B2 (ja) * 2013-03-22 2017-07-05 富士通株式会社 画像処理装置、画像処理プログラムおよび画像処理方法
CN104427350A (zh) * 2013-08-29 2015-03-18 中兴通讯股份有限公司 关联内容处理方法及系统
CN106156244B (zh) * 2015-04-28 2020-08-28 阿里巴巴集团控股有限公司 一种信息搜索导航方法及装置
TWI608415B (zh) * 2016-11-29 2017-12-11 關貿網路股份有限公司 電子檔案資料擷取系統及其方法
CN108491839A (zh) * 2018-03-27 2018-09-04 北京小米移动软件有限公司 信息获取方法及装置

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4789235A (en) * 1986-04-04 1988-12-06 Applied Science Group, Inc. Method and system for generating a description of the distribution of looking time as people watch television commercials
US7859551B2 (en) * 1993-10-15 2010-12-28 Bulman Richard L Object customization and presentation system
US5819261A (en) * 1995-03-28 1998-10-06 Canon Kabushiki Kaisha Method and apparatus for extracting a keyword from scheduling data using the keyword for searching the schedule data file
US6075885A (en) * 1997-02-28 2000-06-13 Dainippon Screen Mfg. Co., Ltd. Method of and apparatus for extracting cross plane area of gamut and computer program product for carrying out the extraction
JPH10257401A (ja) * 1997-03-14 1998-09-25 Access:Kk インターネットテレビ装置およびurl情報取得方法
US8813137B2 (en) * 1998-05-08 2014-08-19 Qualcomm Incorporated Apparatus and method for decoding digital image and audio signals
US6608930B1 (en) * 1999-08-09 2003-08-19 Koninklijke Philips Electronics N.V. Method and system for analyzing video content using detected text in video frames
US6731788B1 (en) * 1999-01-28 2004-05-04 Koninklijke Philips Electronics N.V. Symbol Classification with shape features applied to neural network
AU2001231070A1 (en) 2000-01-20 2001-07-31 Interactual Technologies, Inc. System, method, and article of manufacture for embedded keywords in video
JP2001229198A (ja) * 2000-02-17 2001-08-24 Takayuki Hongo ウェブページ検索システム
US7680324B2 (en) * 2000-11-06 2010-03-16 Evryx Technologies, Inc. Use of image-derived information as search criteria for internet and other search engines
JP2002290947A (ja) 2001-03-22 2002-10-04 Purantekku:Kk デジタル放送に於ける番組・cmコンテンツ情報提供システム
JP4421134B2 (ja) * 2001-04-18 2010-02-24 富士通株式会社 文書画像検索装置
US20090119717A1 (en) * 2002-12-11 2009-05-07 Koninklijke Philips Electronics N.V. Method and system for utilizing video content to obtain text keywords or phrases for providing content related to links to network-based resources
US20040116183A1 (en) * 2002-12-16 2004-06-17 Prindle Joseph Charles Digital advertisement insertion system and method for video games
US20050086219A1 (en) * 2003-03-25 2005-04-21 Claria Corporation Generation of keywords for searching in a computer network
JP2005084866A (ja) * 2003-09-08 2005-03-31 Kureo:Kk 情報処理装置、サーバ装置及びそのプログラム
WO2006008716A2 (en) * 2004-07-16 2006-01-26 Blu Ventures Llc A method to access and use an integrated web site in a mobile environment
JP2006154976A (ja) * 2004-11-25 2006-06-15 Sharp Corp 動画フレーム解析装置
US7672508B2 (en) * 2006-04-11 2010-03-02 Sony Corporation Image classification based on a mixture of elliptical color models
GB0622863D0 (en) * 2006-11-16 2006-12-27 Ibm Automated generation of form definitions from hard-copy forms
US8204896B2 (en) * 2008-01-08 2012-06-19 Kabushiki Kaisha Toshiba Image processing apparatus and image processing method
JP2009169536A (ja) * 2008-01-11 2009-07-30 Ricoh Co Ltd 情報処理装置、画像形成装置、ドキュメント生成方法、ドキュメント生成プログラム
AU2009260721B2 (en) * 2008-06-06 2013-05-09 Google Llc Annotating images

Also Published As

Publication number Publication date
TW200910128A (en) 2009-03-01
KR100998532B1 (ko) 2010-12-07
TWI457770B (zh) 2014-10-21
EP2026220A1 (en) 2009-02-18
CN101364225B (zh) 2011-11-16
KR20100084491A (ko) 2010-07-26
JP2009044658A (ja) 2009-02-26
KR20090016408A (ko) 2009-02-13
CN101364225A (zh) 2009-02-11
KR101058444B1 (ko) 2011-08-24
US20090043769A1 (en) 2009-02-12

Similar Documents

Publication Publication Date Title
JP5115089B2 (ja) キーワード抽出方法
JP4814849B2 (ja) フレームの特定方法
JP5651231B2 (ja) コンテンツを決定し検索するためのメディアフィンガープリント
JP4388128B1 (ja) 情報提供サーバ、情報提供方法及び情報提供システム
US7949207B2 (en) Video structuring device and method
US8965916B2 (en) Method and apparatus for providing media content
US8301009B2 (en) Detailed information providing method and apparatus of personal video recorder
JP2010098730A (ja) リンク情報の提供装置、表示装置、システム、方法、プログラム、記録媒体及びリンク情報の送受信システム
JP2008129884A (ja) 情報検索システム及びその方法並びにそれに用いる放送受信機
JP5335500B2 (ja) コンテンツ検索装置及びコンピュータプログラム
KR101108584B1 (ko) 멀티미디어 콘텐츠의 내용에 기반하는 광고 제공 시스템 및그 광고 제공 방법
JP2006237879A (ja) Cm検索方法、cm検索結果受給方法、cm検索装置、cm検索結果受給装置及びcm録画予約システム
JP2010157080A (ja) コンテンツ関連情報検索システム、コンテンツ関連情報検索方法、およびコンテンツ関連情報検索プログラム
JP6710926B2 (ja) 録画再生装置、サーバ、および、データベース作成方法
KR101283726B1 (ko) 동영상 관련 정보 제공방법 및 제공 시스템
KR101472430B1 (ko) 컨텐트 데이터에 기초하여 정보를 제공하기 위한 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체
JP2009060368A (ja) 視聴者評価収集装置、視聴者評価収集方法、及び視聴者評価収集プログラム
KR20160117986A (ko) 콘텐츠의 노출 정보 제공 서비스 방법 및 시스템

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100416

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120605

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120612

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120718

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120918

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121001

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5115089

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151026

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees