JP2015138479A - Webサイトを共有する方法、電子機器およびコンピュータ・プログラム - Google Patents

Webサイトを共有する方法、電子機器およびコンピュータ・プログラム Download PDF

Info

Publication number
JP2015138479A
JP2015138479A JP2014010867A JP2014010867A JP2015138479A JP 2015138479 A JP2015138479 A JP 2015138479A JP 2014010867 A JP2014010867 A JP 2014010867A JP 2014010867 A JP2014010867 A JP 2014010867A JP 2015138479 A JP2015138479 A JP 2015138479A
Authority
JP
Japan
Prior art keywords
area
image
site
approximation
degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014010867A
Other languages
English (en)
Other versions
JP5913774B2 (ja
Inventor
伊藤 浩
Hiroshi Ito
浩 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Singapore Pte Ltd
Original Assignee
Lenovo Singapore Pte Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Singapore Pte Ltd filed Critical Lenovo Singapore Pte Ltd
Priority to JP2014010867A priority Critical patent/JP5913774B2/ja
Publication of JP2015138479A publication Critical patent/JP2015138479A/ja
Application granted granted Critical
Publication of JP5913774B2 publication Critical patent/JP5913774B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Position Input By Displaying (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

【課題】Webサイトを直感的な操作で共有する方法を提供する。
【解決手段】電子機器が他の電子機器が表示している所定のWebサイトの画像をカメラで撮影して撮影画像300、301を取得する。撮影画像からOCR技術を利用してキーワードを作成しネットワークを検索する。検索結果は、複数のWebサイトのURLを含む。さらに検索した複数のWebサイトのそれぞれと撮影画像の近似度を評価する。近似度の評価には、ヘッダ領域303、ナビゲーション領域307などのカテゴリー領域のイメージおよびカテゴリー領域が含むキーワードを利用することができる。イメージおよびキーワードを評価した結果、近似度の高いWebサイトを電子機器のディスプレイに表示する。
【選択図】図4

Description

本発明は、電子機器が表示しているWebサイトを他の電子機器に直感的な操作で表示する技術に関する。
ネットワークに接続できる複数の電子機器が近接した場所に同時に存在するときに、ある電子機器で表示する所定のURLのWebサイトを他の電子機器に表示したい場合がある。たとえば、会議の参加者の一人が特定のWebサイトのページを自らの電子機器やプロジェクタに表示して説明する場合に、他の参加者も自らの電子機器に同じページを迅速に表示できれば都合がよい。
特許文献1は、カメラで広告を撮影したユーザ端末が当該広告を掲載している会社のWebサイトにアクセスする発明を開示する。ユーザ端末では、撮影した画像がURLを含む場合は文字認識でURLを特定する。撮影した画像がURLを含まない場合は、当該企業の会社名とURLを関連付けたテーブルを利用してURLを特定する。ユーザ端末では特定したURLをブラウザに設定してWebサイトにアクセスする。
特許文献2は、カメラ付き携帯電話で撮影した画像から、当該画像に関連するWebサイトへ誘導する発明を開示する。携帯電話はWebサイト画像検索サービス提供サーバ(サーバ)とネットワークを通じて接続される。サーバは、画像の特徴量に応じた類似度別にWebサイトのURLを関連付けたデータ・ベースを備えている。サーバは、携帯電話から受け取った画像から特徴量を抽出してデータ・ベースを検索してURLを抽出する。サーバは抽出したURLを携帯電話に送る。非特許文献1は、スマートフォンが撮影した画像から文字を認識して、対象物に関する情報を表示する技術を開示する。ユーザは写真撮影をすれば文字を入力しないでも必要な情報を検索することができる。
特開2002−278857号公報 特開2003−271650号公報
"google goggle"、[online]、[平成26年1月6日検索]、インターネット〈URL:http://en.wikipedia.org/wiki/Google_Goggles〉
URLを共有する1つの方法として、送り手の参加者からその場で当該URLを聞いた受け手の参加者が直接ブラウザに入力することが考えられる。しかし、文字数の長いURLでは送り手と受け手の参加者のいずれも負担が大きく時間もかかる。他の方法として、送り手の参加者が当該URLを電子メールで受け手の参加者に転送する方法がある。しかし、転送の相手が多い場合には特に送り手の参加者の負担が大きくやはり時間もかかる。他の方法としてSNSで送信する方法があるが、必要な相手にだけ送ることができない。
送り手の参加者が当該URLのQR(登録商標)コードを作成して画面に表示し、受け手の参加者がカメラ撮影する方法もあるが、送り手の参加者の負担が大きく時間がかかる。送り手の参加者の負担が大きい場合は特に当該URLを送り難くなり、また、時間がかかることは会議の中断をもたらすために好ましくない。特許文献1の発明では、URLを完全に撮影できれば、簡単に当該Webサイトにアクセスできるが、アドレス・ウィンドウが小さかったり、URLが長かったりして完全にURLを撮影できない場合は適用できない。また、会社名とURLを関連付けたテーブルが必要になるため、共有できる範囲が制約を受ける。
特許文献2の発明では、あらかじめ画像の内容とURLを関連付けたデータ・ベースを提供するサーバが必要となる。しかし、データ・ベースは、特定企業のWebサイトのURLを広告の内容に関連付けることは可能だとしても、その作成および維持には膨大なコストが発生する。しかも、ジャンルを予想できない無数のWebページへのアクセスに適用することはできない。また、非特許文献1の技術では、画像から認識した文字に関連するサイトにアクセスすることはできるが、撮影した画像のWebサイトにアクセスすることはできない。
そこで本発明の目的は、Webサイトをその場で直感的な操作で共有する方法を提供することにある。さらに本発明の目的は、送り手に負担をかけないでWebサイトを共有する方法を提供することにある。さらに本発明の目的は、検索の対象とするWebサイトに関する専用のデータ・ベースを利用しないでWebサイトを共有する方法を提供することにある。さらに本発明の目的は、そのような方法を実現する電子機器およびコンピュータ・プログラムを提供することにある。
本発明の電子機器は、カメラ・モジュールから画像データを取得することができる。カメラ・モジュールは電子機器の筐体に収納しても、有線または無線で電子機器に接続できるようにしてもよい。カメラ・モジュールがネットワーク上のWebサイトのサイト画像を撮影する。撮影画像が含む文字を認識して作成したキーワードでネットワークを検索して複数の検索サイトを取得する。さらに各検索サイトと撮影画像の近似度を評価する。
上記構成では、キーワードで対象となる検索サイトを絞り込み、つづいて、撮影画像と検索サイトの近似度を評価することで対象とするWebサイトの推定の精度を向上させる。受け手はその場でカメラ撮影をするだけで、被写体となっている撮影画像のWebサイトにアクセスすることができる。本発明では、対象とするWebサイトを特徴付ける専用のデータ・ベースを利用する必要がない。撮影画像と検索サイトから文字集合の領域で背景画像から区分したカテゴリー領域を特定し、カテゴリー領域に関する近似度を評価することで、近似度を評価する精度を向上させることができる。
カテゴリー領域は、ヘッダ領域、フッタ領域、ナビゲーション領域、本文領域およびキャプション領域からなるグループから選択したいずれか1つまたは複数の要素を含むことができる。近似度を評価するときは、カテゴリー領域ごとにキーワードの近似度を評価することができる。さらにカテゴリー領域のイメージから抽出した特徴データの近似度を評価することもできる。
このとき特徴データは、カテゴリー領域の座標、サイズ、背景色、文字数、文字サイズ、および文字色からなるグループから選択したいずれか1つの要素または複数の要素を含むようにすることができる。また、撮影画像と検索サイトのそれぞれにおけるカテゴリー領域の配置パターンの近似度を評価することもできる。検索サイトと撮影画像の近似度の評価は、サイト画像における撮影画像の位置に対応する検索サイトの評価領域を画定し、撮影画像と評価領域について評価することができる。
近似度の評価は、撮影画像が含むカテゴリー領域と評価領域が含むカテゴリー領域の配置パターンを比較して行うことができる。撮影画像と評価領域のそれぞれに基準サイズを設定することで、表示倍率やピクセル・サイズが異なってもカテゴリー領域のサイズや文字サイズの差を利用して近似度を評価することができる。
評価領域の位置は、撮影画像が含むヘッダ領域、フッタ領域、またはナビゲーション領域の撮影画像における位置を推定して画定することができる。ヘッダ領域またはフッタ領域を推定する際に縦スクロール・バーの位置を判断し、ナビゲーション領域を推定する際に横スクロール・バーの位置を判断するとソース・デバイスのユーザがURLの共有のためにスクロール・バーの操作する必要がなくなる。本文領域とキャプション領域は、それらが含む文字数を計算して推定することができる。
本発明により、Webサイトをその場で直感的な操作で共有する方法を提供することができた。さらに本発明により、送り手に負担をかけないでWebサイトを共有する方法を提供することができた。さらに本発明により、検索の対象とするWebサイトに関する専用のデータ・ベースを利用しないでWebサイトを共有する方法を提供することができた。さらに本発明により、そのような方法を実現する電子機器およびコンピュータ・プログラムを提供することができた。
本実施の形態にかかるスマートフォン10のハードウェアの概略の構成を説明するための図である。 スマートフォン10が搭載するURL共有システム100の構成を説明するための機能ブロック図である。 URL共有システム100の動作手順を説明するためのフローチャートである。 ソース・デバイスが表示しているWebサイトの画像の一例を説明するための図である。 サイト特徴抽出部103がカテゴリー領域を特定しその名称を推定する手順を説明するためのフローチャートである。 サイト特徴抽出部103が作成したキーワード・リストの一例を示す図である。 サイト特徴抽出部103が作成したイメージ・リストの一例を示す図である。 撮影画像300と検索サイト画像380の関係を説明するための図である。 サイト評価部105が評価領域370aのサイズと位置を画定する手順を説明するためのフローチャートである。 評価領域の同定方法をおよびカテゴリー領域の配置パターンの比較方法を説明するための図である。
[ハードウェア]
図1は、スマートフォン10のハードウェアの概略の構成を説明するための図である。スマートフォン10は、ノートブック型パーソナル・コンピュータ(ノートPC)、デスクトップ型パーソナル・コンピュータ(デスクトップPC)、またはタブレット端末などの本発明が適用できる電子機器の一例である。スマートフォン10は、CPU11、システム・メモリ13、I/Oインターフェース15、SSD17、タッチスクリーン19、無線モジュール21およびカメラ・モジュール23などを含んでいる。
SSD17は、図2に記載するURL共有システム100を構成するソフトウェアを格納する。無線モジュール21は、URL共有システム100がWWWネットワーク150に接続するためのインターフェースを提供する。カメラ・モジュール23は、CMOSイメージ・センサまたはCCDイメージ・センサを備え、所定のフレーム・レートで撮影した画像のイメージ・データをURL共有システム100に出力する。タッチスクリーン19は、タッチ・パネルを組み込んでタッチ操作が可能なディスプレイであるが、本発明の適用に関する限りはタッチ操作ができない通常のディスプレイでもよい。
本発明が適用できる電子機器は、デジタル・カメラが撮影したイメージ・データを処理でき、かつ、Webサイトにアクセスしてタッチスクリーン19のようなディスプレイにWeb画像を表示できるプログラムの実行可能なデバイスであればよい。したがって、必ずしもカメラ・モジュール23およびタッチスクリーン19をURL共有システム100と同じ筐体に搭載する必要はない。ここにWebサイトはそれぞれURL(Uniform Resource Locator)を備える複数のWebページの集合をいう。本明細書では、URLを指定してWWWネットワーク150からWebページのHTTPデータを取得することをWebサイトにアクセスするということにし、WebサイトをWebページと同じ意味で使用する。なお、本発明に関する限りスマートフォン10のハードウェアの構成は周知であるため詳細な説明は省略する。
[URL共有システム]
図2は、スマートフォン10が搭載するURL共有システム100の構成を説明するための機能ブロック図である。図3は、URL共有システム100の動作手順を説明するためのフローチャートである。URL共有システム100は、画像取得部101、サイト特徴抽出部103、サイト評価部105、サイト・アクセス部109、および画像データ出力部107を含んでいる。
URL共有システム100は、他の電子機器(以後、ソース・デバイスという。)のディスプレイが表示するWebサイトを撮影した画像(以後、撮影画像という。)の特徴を分析し、WWWネットワーク150を検索して得たWebサイトの画像(以後、検索サイト画像という。)と撮影画像との近似度を評価して撮影画像のURLを推定し、スマートフォン10のタッチスクリーン19に推定したURLのWebサイトを表示するための処理をする。スマートフォン10のユーザがWebサイトを撮影すれば、URL共有システム100が自動的にタッチスクリーン19に同一のWebサイトを表示する。
WWWネットワーク150は、インターネットまたはイントラネットのようなWWWサービスを提供する複数のWWWサーバ151a〜151cを接続している。WWWサーバ151a〜151cは、スマートフォン10のようなWWWクライアントがリクエストするURLに対応したWebサイトを有するときに、HTML、XHTMLといったようなWWWクライアントのWebブラウザで表示できるマークアップ言語で記述したHTTPデータを含むレスポンスを返送する。
スマートフォン10のWebブラウザは、マークアップ言語を翻訳してタッチスクリーン19に表示するためのイメージ・データを作成する。URL共有システム100は、SSD17が格納するOS、デバイス・ドライバ、Webブラウザ、および本発明のために作成したプログラムなどのソフトウェアと、それを実行するCPU11、システム・メモリ13およびI/Oインターフェース15などのハードウェアとの協働で構成している。
最初に図2に示すURL共有システム100の構成要素の概要を説明する。画像取得部101はソース・デバイスのディスプレイが表示するWebサイトの画像(以後、サイト画像という。)を撮影したカメラ・モジュール23から撮影画像のイメージ・データを受け取って、図3のブロック205の手順を実行する。ここに、Webブラウザのウィンドウ(ブラウザ・ウィンドウ)、ディスプレイおよびWebサイトのピクセル・サイズおよび表示倍率などによりソース・デバイスのディスプレイが表示する画像はサイト画像の一部の場合がある。
サイト特徴抽出部103は、WWWネットワーク150からHTTPデータを取得するための複数のHTTPユーザ・エージェント、およびgoogle(登録商標)、yahoo(登録商標)などの汎用の検索エンジンを含んでいる。サイト特徴抽出部103はブロック207から217の手順を実行して画像取得部101から受け取った撮影画像の特徴を分析してキーワードを作成する。サイト特徴抽出部103は、作成したキーワードでWWWネットワーク150を検索してヒットしたWebサイト(以後、検索サイトという。)のHTTPデータを取得する。
サイト評価部105は、サイト特徴抽出部103から受け取った検索サイトのHTTPデータをレンダリングして。画像データ出力部107がサイト・アクセス部109から受け取るイメージ・データと同じデータ形式のイメージ・データを作成するレンダリング・エンジンを含む。サイト評価部105は、ブロック218から229の手順を実行して撮影画像と検索サイトを比較しソース・デバイスが表示していたWebサイトのURLを推定する。
サイト・アクセス部109はInternet Explorer(登録商標)、Firefox(登録商標)、Safari(登録商標)、Chrome(登録商標)、またはOpera(登録商標)などのWebブラウザを含んでいる。サイト・アクセス部109は、無線モジュール21を通じてWWWネットワーク150にアクセスして取得したWebサイトのHTTPデータをレンダリングして作成したイメージ・データを画像データ出力部107に送る。
サイト・アクセス部109は、サイト評価部105が推定した最も優先度が高いサイト画像のイメージ・データをブロック231の手順を実行して画像データ出力部107に送る。画像データ出力部107は、サイト・アクセス部109から受け取ったイメージ・データをタッチスクリーン19が表示できるデータ形式に変換してタッチスクリーン19に出力する。
つぎに図3の手順にしたがって、URL共有システム100の詳細な動作を説明する。ブロック201で、URLの共有元になるソース・デバイスがWWWネットワーク150にアクセスして、所定のURLに対応するWebサイトを表示している。ソース・デバイスは、ノートPC、デスクトップPC、タブレット端末、またはスマートフォンのように、WWWネットワーク150にアクセスして、ディスプレイにWebサイトを表示できる電子機器またはこれらの電子機器に接続してWebサイトを表示するプロジェクタとすることができる。
HTTPユーザ・エージェントが異なると、アクセスしたWebサイトが同一でも、異なったHTTPデータが返送される場合がある。ブロック203でサイト特徴抽出部103のHTTPユーザ・エージェントをソース・デバイスのHTTPユーザ・エージェントに合致するように設定する。WWWサーバ151a〜151cは、サイト特徴抽出部103のリクエストが含むHTTPユーザ・エージェントの識別子を認識するとそれに適合するHTTPデータを返送する。ここでは、ソース・デバイスのHTTPユーザ・エージェントがノートPCのWebブラウザに適合することを前提にして説明するが、本発明はスマートフォンまたはタブレット端末などのWebブラウザに適合するユーザ・エージェントを使用するソース・デバイスにも適用できる。
ブロック205では、カメラ・モジュール23がソース・デバイスのディスプレイまたはプロジェクタのスクリーンが表示するサイト画像を撮影すると画像取得部101が撮影画像のイメージ・データをサイト特徴抽出部103に送る。ブロック207でサイト特徴抽出部103は、天地方向を修正するために必要に応じて回転させた撮影画像に対して周知のOCR(Optical Character Reader)技術を適用して撮影画像が含むすべての文字を抽出する。
さらにサイト特徴抽出部103は、当該文字が配置されている領域(以後、カテゴリー領域といい、詳細は後述する。)を特定する。文字情報の抽出とカテゴリー領域の特定方法については図4、図5を参照して説明する。図4は、ソース・デバイスのディスプレイが表示していた画像を撮影した撮影画像の一例を説明するための図である。図4(A)の撮影画像300はサイト画像の最上部の近辺領域に相当し、図4(B)の撮影画像301は同一のサイト画像の最下部の近辺領域に相当する。サイト画像は、ソース・デバイスのブラウザ・ウィンドウ内に表示されるが、図4ではブラウザ・ウィンドウの四方の枠のなかで縦スクロール・バー351と横スクロール・バー353だけを示し、通常は上に表示するタイトル・バー、ツール・バー、タブ、アドレス・バーおよびメニュー・バーなどの枠は省略している。
撮影画像300は一例としてヘッダ領域303、タイトル領域305、ナビゲーション領域307、本文領域309a〜309c、およびイメージ領域311を含んでいる。ヘッダ領域303は当該Webサイトのサイト名、企業名、ロゴ、画像などを掲載する領域に相当する。タイトル領域305は、当該Webサイトが含むWebページのタイトルを掲載する領域に相当しWebページごとに存在する。
本文領域309a〜309cは主として文字を掲載する領域に相当する。イメージ領域311は、写真、模様、記号または図形などのイメージを掲載する領域に相当する。本文領域309a〜309cおよびイメージ領域311は当該Webページの主要なコンテンツを掲載する領域に相当する。ナビゲーション領域307は、当該Webサイト内の他のWebページまたは他のWebサイトへリンクした文字や当該Webサイトのメニューなどを掲載する領域に相当する。
先に説明した理由で、撮影画像300、301はサイト画像の一部の領域になっている。撮影画像300は縦スクロール・バー351が最上端に位置し、横スクロール・バー353が最左端に位置しており、左端部および上端部はブラウザ・ウィンドウの内縁に一致しているが右側および下側の一部がブラウザ・ウィンドウから外れている。このときソース・デバイスでは縦スクロール・バー351および横スクロール・バー353を操作して、ブラウザ・ウィンドウ内でサイト画像を移動させて隠れていた領域を表示することができる。
撮影画像301は縦スクロール・バー351が最下端に位置し、横スクロール・バー353が最右端に位置している。撮影画像301は、下端部と右端部がスクロール・バーの内縁に一致しているが、左側および上側の一部がブラウザ・ウィンドウから外れている。撮影画像300は、上端部の近辺にヘッダ領域303を含み、左端部の近辺にナビゲーション領域307を含んでいる。これに対して撮影画像301は、右端部の近辺にキャプション領域313を含み下端部の近辺にフッタ領域315を含んでいる。キャプション領域313は、イメージ領域311の内容を説明する文字を掲載する領域に相当する。フッタ領域315は、著作権表記、会社案内、プライバシー・ポリシーなどを説明する文字や小画像などを掲載する領域に相当する。
通常のWebデザインでは、ヘッダ領域303をサイト画像の最上部の近辺に配置し、フッタ領域315を最下部の近辺に配置し、ナビゲーション領域307を最左端側または最右端の近辺に配置する。本実施の形態では、このような通常のWebデザインが採用している各領域の特徴的な配置に着目してサイト画像のURLを推定する。タイトル領域305、ナビゲーション領域307、本文領域309a〜309c、イメージ領域311、キャプション領域313およびフッタ領域315のコンテンツはWebページに相当する。一例では、Webページのコンテンツに貼り付けられたハイパーリンクにアクセスして同一のWebサイトの他のWebページに移動したときには、Webページの表示は変化するがヘッダ領域303およびナビゲーション領域307の表示は変化しない。
なお、ここに説明したWebサイトのパターン構成はあくまで本発明を説明するための一例にすぎない。たとえばナビゲーション領域307が複数存在する場合や、ナビゲーション領域307がスクロール・バーを備える場合もある。またフッタ領域315、イメージ領域311またはキャプション領域313が存在しなかったりするWebサイトも存在する。さらに本文領域309a〜309c、イメージ領域311およびキャプション領域313の配置もWebサイトのデザインに応じて異なる。
また、ソース・デバイスがタブレット端末またはスマートフォンの場合は、通常スクロール・バーが存在しない代わりにタッチ操作でスクロールすることができる。そして、フリック操作で画面を上下方向にスクロールするとヘッダ領域も同時に動いたり、左右方向にはスクロールできなかったりする場合がある。URL共有システム100は、このようにさまざまな態様でソース・デバイスに表示されるサイト画像を撮影してそのURLを推定する。
撮影画像300、301を構成するヘッダ領域303、タイトル領域305、本文領域309a〜309c、ナビゲーション領域307、キャプション領域313およびフッタ領域315といった領域要素は、撮影画像の中の配置やイメージの特徴で推定することができる。これらの領域要素は、当該Webサイトを特徴付ける情報を含んでおり、先に述べたカテゴリー領域に相当する。カテゴリー領域には、URLの推定に利用可能な、Webブラウザのアドレス・ウィンドウおよび表示しているWebページのタイトルなどを表示するWebブラウザのタブも含めることもできる。
アドレス・ウィンドウが完全なURLを表示する場合には、OCRで撮影画像300、301のURLを認識すれば容易に当該Webサイトにアクセスできるが、本発明は撮影画像300、301が含むアドレス・ウィンドウが小さいために完全なURLを含まない場合、Webブラウザがアドレス・ウィンドウを含まない場合、およびアドレス・ウィンドウがソース・デバイスのディスプレイの表示領域から隠れている場合などに特に有効である。
なお、周知のオブジェクト認識技術を使ってイメージ領域311のイメージが含むオブジェクトを認識して相当する名称を抽出することもできる。この場合は、イメージ領域311もカテゴリー領域に含めることができる。サイト特徴抽出部103は、撮影画像300、301に対応するWebサイトのHTTPデータを取得できないため撮影画像300、301のイメージ・データだけからカテゴリー領域の名称を推定する必要がある。しかも、カメラ・モジュール23が撮影した時点でソース・デバイスのディスプレイが表示している撮影画像のサイト画像における位置は一定していない。
スマートフォン10がWebサイトを撮影する前に、ソース・デバイスにおいて縦スクロール・バー351および横スクロール・バー353を操作して、サイト画像の左上コーナーとブラウザ・ウィンドウの左上のコーナー321が一致するようにすれば、ヘッダ領域303およびナビゲーション領域307の推定が容易になる。また、撮影画像301のように、サイト画像の右下のコーナーとブラウザ・ウィンドウの右下のコーナー323が一致するようにすればフッタ領域315の推定は容易になる。
しかし、本実施の形態では、ソース・デバイスのユーザがディスプレイの表示に対して余分な操作をしないでもURLの共有をすることができる。このことは、ソース・デバイスのユーザが会議でディスプレイにWebサイトの任意の位置を表示して説明しているときに、他の参加者が当該Webサイトを表示するディスプレイを撮影するだけで当該WebサイトのURLを共有できるため討論を中断しなくてもよいという利点がある。
図5は、サイト特徴抽出部103がカテゴリー領域を特定しその名称を推定する手順を説明するためのフローチャートである。カテゴリー領域の外延を画定する境界には視覚で認識できるライン状の枠や背景色で区別した枠がない場合がある。したがって、撮影画像300、301のイメージ・データから境界の枠を探してカテゴリー領域の範囲を特定することができない場合がある。ブロック401でサイト特徴抽出部103は、撮影画像300、301のイメージ・データに対してOCR技術を適用しすべての文字を認識する。
各カテゴリー領域は、文字を含まない背景画像の領域を挟んで相互に区分されたまとまりのある文字の集合を形成している。以後この、文字の集合を文字の島ということにする。ブロック403でサイト特徴抽出部103は、文字の島の範囲を矩形領域として特定し、たとえばブラウザ・ウィンドウの左上のコーナー321に一致する撮影画像300の左上のコーナーを原点として、本文領域309aの左上のコーナー325の座標で撮影画像300における本文領域309aの位置を特定する。このときサイト特徴抽出部103は、文字の島の周囲にラインまたは背景色の境界として矩形状の枠を認識したときは、当該枠の範囲をカテゴリー領域と特定し、枠を認識しないときは文字の集合の外延が形成する矩形状の領域をカテゴリー領域と特定することができる。
ブロック405でサイト特徴抽出部103は、特定した各カテゴリー領域について縦横サイズ、背景色、文字数、文字サイズおよび文字色といったカテゴリー領域のイメージを特徴付ける特徴データを抽出する。縦横サイズおよび文字サイズは、ソース・デバイスのディスプレイの解像度、またはサイト画像を表示しているときの画面の表示倍率などで変化するため、検索サイトとの比較の際にはそのまま利用することはできない。
サイト特徴抽出部103は、撮影画像300、301と検索サイトの同じ部位に基準サイズを設定し、基準サイズに対する相対値として縦横サイズおよび文字サイズを計算することで、それらを後に行う検索サイトとの近似度の評価に利用することができる。通常、本文領域309a〜309cでは文字に同一のポイントを採用し、かつ、カテゴリー領域の中で文字数が最も多い。サイト特徴抽出部103は特定したカテゴリー領域のなかで、たとえば最も多くの文字を含むカテゴリー領域の文字サイズを基準サイズにしてカテゴリー領域の縦横サイズおよび文字サイズの相対値を計算することができる。
また、サイト特徴抽出部103は、ブロック453、455、457で説明するように撮影画像300、301のコーナーがブラウザ・ウィンドウのコーナー321、323に一致すると判断してヘッダ領域303、フッタ領域315、ナビゲーション領域307を認識できる場合がある。この場合はヘッダ領域303、フッタ領域315の上下方向のサイズL1、L2(図10参照)またはナビゲーション領域307の左右方向のサイズL4(図10参照)を基準サイズにして、各カテゴリー領域の縦横サイズおよび文字サイズの相対値を計算することができる。
ヘッダ領域303およびナビゲーション領域307は、文字に複数の色を使用している場合がある。サイト特徴抽出部103は、カテゴリー領域が含む文字の色とその数を特定する。さらにサイト特徴抽出部103は、カテゴリー領域の背景色を特定する。ここまでの手順では、カテゴリー領域の存在および特徴は特定できたがその名称は特定できていない。本発明では、カテゴリー領域の名称を特定しないでも撮影画像300、301のURLを推定できるが、検索サイトについてはHTTPデータからカテゴリー領域の正確な名称を得ることができるため、カテゴリー領域の名称を撮影画像と検索サイトの近似度の評価に利用することができる。したがって、以下の手順でカテゴリー領域の名称を推定して近似度の評価に利用する。
ブロック407でサイト特徴抽出部103は、撮影画像300、301が縦スクロール・バー351または横スクロール・バー353を含むかどうかを判断する。縦スクロール・バー351と横スクロール・バー353の存否は、あらかじめテンプレートとして登録した画像のパターンと比較して判断することができる。撮影画像300がスクロール・バーの画像を含む場合は、ブロック451に移行し、含まない場合はブロック409に移行する。
サイト特徴抽出部103はブロック451で縦スクロール・バー351が最上端に位置するか否かを判断する。縦スクロール・バー351が最上端に位置する場合は、サイト特徴抽出部103はブロック453で撮影画像300の最上端の近辺に位置する文字の島から特定した矩形状の領域をヘッダ領域303と推定することができる。ヘッダ領域303がロゴを含む場合がある。ロゴは通常ヘッダ領域303のロゴ以外の文字または他のカテゴリー領域の文字よりもサイズが大きいので、文字の島が所定値以上のサイズの文字を含むか、あるいはそこに含む文字のサイズのバラツキが大きい場合にだけヘッダ領域303を推定することもできる。
縦スクロール・バー351が最上端に位置しない場合は、ブロック455で縦スクロール・バー351が最下端に位置するか否かを判断する。縦スクロール・バー351が最下端に位置する場合は、サイト特徴抽出部103はブロック457で撮影画像300の最下端の近辺に位置する文字の島から特定した矩形状の領域をフッタ領域315と推定することができる。サイト特徴抽出部103は縦スクロール・バー351が最下端に位置しない場合は、ブロック459で横スクロール・バー353が最左端または最右端に位置するか否かを判断する。
いずれにも位置しない場合はブロック409に移行し、いずれかに位置する場合はブロック461に移行する。ナビゲーション領域307は通常サイト画像の左端および右端またはいずれか一方の近辺に位置する。ブロック461でサイト特徴抽出部103は横スクロール・バー353の位置に応じて、撮影画像300の最左端または最右端の近辺に上下に所定値より長い矩形状の文字の島が存在するか否かを判断する。存在する場合はブロック465に移行し存在しない場合はブロック463に移行する、サイト特徴抽出部103はブロック465で最左端または最右端の近辺に位置する文字の島から特定した矩形状の領域をナビゲーション領域307と推定することができる。
ナビゲーション領域307の背景は、その他の領域と色が異なる場合がある。ブロック463でサイト特徴抽出部103は、最左端または最右端の近辺にある文字の島の背景色と隣接する文字の島の背景色または文字の島以外の領域の色を比較して、一致する場合は識別できないと判断してブロック409に移行し、異なる場合はブロック465に移行する。ブロック465でサイト特徴抽出部103は、最左端または最右端の近辺にある文字の島から特定した矩形状の領域をナビゲーション領域307と推定することができる。
ブロック407からブロック409に移行するのは、撮影画像300、301を表示するWebブラウザがウィンドウ形式で表示されているためにスクロール・バーが画面の表示領域から外れている場合、サイト画像のピクセル・サイズが小さいためにスクロール・バーを利用する必要がない場合、またはWebブラウザがスクロール・バーをサポートしないタイプの場合などである。ブロック409でサイト特徴抽出部103は、いまだ名称を推定していない文字の島の文字数が所定値以上か否かを判断する。所定値以上の場合はブロック411に移行し、所定値未満の場合はブロック413に移行する。
本文領域309a〜309cが含む文字数は、通常他のカテゴリー領域が含む文字数よりも多い。ブロック411でサイト特徴抽出部103は、所定数以上の文字を含む文字の島から特定した矩形状の領域を本文領域309a〜309cと推定することができる。このとき、サイト特徴抽出部103は、文字サイズまたは文字色が均一である場合に限って本文領域309a〜309cを推定するようにしてもよい。
ブロック413でサイト特徴抽出部103は、撮影画像300がイメージ領域311を含むか否かを判断する。イメージ領域311を含む場合はブロック415に移行し含まない場合はカテゴリー領域を特定する処理を終了する。イメージ領域311の近辺には、キャプション領域313の他に本文領域309a〜309cも存在する。しかし、キャプション領域313が含む文字数は、本文領域309a〜309cが含む文字数よりも少ない場合が多い。ブロック415でサイト特徴抽出部103は、イメージ領域311の周囲に隣接する文字の島のなかで最も文字数の少ない文字の島から特定した矩形状の領域をキャプション領域313と推定することができる。
ブロック417までの間に、いずれのカテゴリー領域も推定することができない場合は、サイト特徴抽出部103はブロック401に戻って判定基準を緩和して、最低1個の本文領域を推定するまで手順を繰り返すことができる。図5の手順では、撮影画像のサイト画像における位置が特定できないため、スクロール・バー351、353が存在しないときはヘッダ領域303、フッタ領域315、およびナビゲーション領域307の名称を推定していない。ただし、本実施の形態ではカテゴリー領域の名称が推定できなくても、撮影画像と評価領域(図8参照)の対応するカテゴリー領域同士を比較して近似度を評価することができる。
サイト特徴抽出部103は、カテゴリー領域の名称を推定し、かつカテゴリー領域ごとの特徴データを抽出してブロック207の手順を終えるとブロック209に移行する。ブロック209でサイト特徴抽出部103は、各カテゴリー領域が含む文字から検索エンジンによる検索に適したキーワードを作成して図6に示すキーワード・リスト250を作成する。サイト特徴抽出部103は検索エンジンに入力する検索式をカテゴリー領域と関連付けて作成することができる。
ヘッダ領域303は、一般的に検索エンジンが重要視する情報を含むため、そこに含む文字はすべてキーワードとすることができる。その他のカテゴリー領域が含むキーワードは、普通名詞、固有名詞、または数詞のなかで辞書に掲載している単語を選択することができる。さらにキーワードには、日付、人名、地名などのあらかじめ登録したジャンルに含まれる単語を選択することができる。あるいはキーワードは、単語に加えて文または文を意味がわかる範囲で区切った文節などを選択することができる。
図6は、一例として現存のWebサイトから作成したキーワード・リストの一部を示している。ブロック211でサイト特徴抽出部103は、撮影画像300、301から特定したカテゴリー領域のイメージの特徴を示す特徴データで図7に一例として示すイメージ・リスト260を作成する。イメージ・リスト260は一例として、カテゴリー領域ごとのレコードに対して座標、領域サイズ、背景色、文字数、文字サイズ、および文字色からなる特徴データを記述するフィールドで構成している。イメージ・リスト260は、さらにアルファベット、漢字、ラテン文字などの文字タイプおよび言語の種類を含むようにしてもよい。
一例として、座標は、撮影画像300、301の原点に対するカテゴリー領域の左上コーナーの座標(たとえば325)とし、領域サイズはカテゴリー領域の縦横のサイズとし、背景色はカテゴリー領域を占める最も面積が大きい色とし、文字数はカテゴリー領域が含む文字数とし、文字サイズはカテゴリー領域が含む全文字のサイズの平均値とし、文字色はカテゴリー領域が含む文字に使用するすべての色とすることができる。
ブロック213でサイト特徴抽出部103はキーワード・リスト250に登録したキーワードを利用して周知の検索エンジンに入力する検索式を作成する。検索式は検索エンジンに入力するためのキーワードと論理記号の組み合わせに相当する。ここでは、ソース・デバイスが表示していたWebサイトを確実にヒットさせるために、比較的緩やかな検索式を作成することが望ましい。
OCRでは誤認識の可能性もあるため、検索エンジンが精度の高い部分一致の検索をできる場合を除いて長い文字列をキーワードにすると適切なWebサイトがヒットしない場合がある。たとえばサイト特徴抽出部103は、複数のカテゴリー領域を特定していた場合はカテゴリー領域間をOR論理で結合し、同一のカテゴリー領域の中のキーワード間はAND論理で結合し、キーワードが文または文節の場合はOCRの誤認識を想定してOR論理で他のキーワードに結合した検索式を作成することができる。
サイト特徴抽出部103は他の例として、キーワード・リスト250のカテゴリー領域を考慮しないで、たとえば撮影画像300、301の全体から抽出した出現頻度の多い所定数の名詞をAND論理で結合して検索式を作成することができる。検索エンジンは、検索式の規模を制約する場合もある。サイト特徴抽出部103は、利用する検索エンジンの入力条件を考慮して適切な規模の検索式を作成する。ブロック215でサイト特徴抽出部103は、検索エンジンに検索式を入力してWWWネットワーク150を検索する。
ブロック217で、検索エンジンはヒットした検索サイトのなかで上位から一例として50個の検索サイトのHTTPデータを取得してサイト評価部105に出力する。このときサイト評価部105に出力する複数の検索サイトを1次URLランキングということにする。サイト評価部105は、受け取ったHTTPデータを処理が終了するまでシステム・メモリ13に一時的に記憶する。サイト評価部105は、検索サイトと撮影画像300、301をイメージ同士で比較するために、サイト・アクセス部109のWebブラウザが画像データ出力部107に出力するイメージ・データと同じ形式のイメージ・データを作成することができる。このイメージ・データは検索サイト画像に相当する。
図8は、撮影画像300と検索サイト画像380の関係を説明するための図である。サイト画像360は、ソース・デバイスがWWWネットワークから取得したWebサイトのイメージ・データである。撮影画像300はサイト画像360の一部のイメージ・データである。検索サイト画像380は、1次URLランキングに記述された1つの検索サイトのイメージ・データである。ここでサイト画像360と検索サイト画像380の同一性を評価するためには、撮影画像300を検索サイト画像380が含むか否かを判断する必要があるため、評価領域370a〜370cを設定する。評価領域370a〜370cは検索サイト画像380のさまざまな領域のイメージ・データで、同一性の判断のために撮影画像300と比較対象になる領域である。
仮にサイト画像360と検索サイト画像380のURLが同一だとしたときに、撮影画像300から両者の同一性を推定するためには、対応する評価領域370a〜370cのサイズ、検索サイト画像380における評価領域370a〜370cの位置(座標)、および撮影画像300と評価領域370a〜370cのコンテンツの同一性を評価する必要がある。ここでは、検索サイト画像380における評価領域370aの位置とサイト画像360における撮影画像300の位置が同じとし、評価領域370b、370cは位置が異なるものとして説明する。なお、撮影画像300と評価領域370aのサイズは基準サイズに対して同じ比率にして比較できるようにする。
撮影画像300と評価領域370aはコンテンツを比較する価値があるが、撮影画像300と評価領域370b、370cのコンテンツを比較してもサイト画像360と検索サイト画像380のURLの同一性は評価できない。ブロック218でサイト評価部105は、1次URLランキングの上位の検索サイトから順番に撮影画像300と検索サイト画像380の近似度を評価するために、撮影画像300に対応する評価領域370aの縦横サイズと検索サイト画像380における位置を特定する処理をする。図9は、評価領域370aの縦横サイズと位置を特定する手順を説明するためのフローチャートである。
サイト評価部105は、サイト特徴抽出部103がブロック207で撮影画像300のイメージ・データからカテゴリー領域を特定した方法で、検索サイト画像380の各カテゴリー領域を特定することができる。サイト評価部105は、HTTPデータから直接カテゴリー領域を特定してもよい。サイト画像360と検索サイト画像380は、同一のURLのWebサイトであったしてもブラウザ・ウィンドウの表示倍率およびディスプレイのピクセル・サイズなどが異なれば両者のイメージ・データの画像は相似になるため、イメージで比較するためには両者にそれぞれ基準サイズを設定する。
ブロック501でサイト評価部105は、撮影画像300と検索サイト画像380のいずれかのカテゴリー領域のサイズをそれぞれの基準サイズに設定する。この基準サイズは、図5のブロック405でカテゴリー領域の縦横サイズおよび文字サイズを計算するために設定した基準サイズとすることができる。サイト評価部105は一例として、撮影画像300が含む縦スクロール・バー351が最上端または最下端にあるときに、イメージ・リスト260と検索サイト画像380のそれぞれのヘッダ領域またはフッタ領域の上下方向のサイズL1、L2(図10参照)のいずれかを基準サイズとすることができる。
サイト評価部105は他の例として、撮影画像300が含む横スクロール・バー353が最左端または最右端に位置するときに、イメージ・リスト260と検索サイト画像380のそれぞれのナビゲーション領域の左右方向のサイズL4(図10参照)を基準サイズとすることができる。サイト評価部105は、さらに他の例として、それぞれの本文領域の文字サイズを基準サイズとすることができる。サイト評価部105は、ブラウザ・ウィンドウの枠を基準サイズにしてもよい。
ブロック503でサイト評価部105は、撮影画像300の基準サイズと撮影画像300の縦横サイズの比を使って、検索サイト画像380の基準サイズから評価領域370aの縦横サイズを計算して評価領域370aのサイズを画定する。ブロック505、507では、キーワード・リスト250がヘッダ領域またはフッタ領域を含む場合はブロック551に移行する。サイト評価部105はブロック551で、図10の距離L1、L2で示した位置に対応する検索サイト画像380の位置にヘッダ領域またはフッタ領域の境界を位置付けるように評価領域370aの上下方向の位置を画定する。
ブロック509で、キーワード・リスト250がナビゲーション領域を含む場合は、サイト評価部105はブロック553で、図10の距離L4で示した位置に対応する検索サイト画像380の位置にナビゲーション領域の境界を位置付けるように評価領域370aの左右方向の位置を画定する。ナビゲーション領域が最右端に存在する場合も同様に画定することができる。
ブロック511でサイト評価部105は、検索サイト画像380の中で評価領域370aを所定の短い距離ずつ順番に移動させて、ブロック513で撮影画像300が含むカテゴリー領域のパターンと評価領域370aが含むカテゴリー領域のパターンを比較して、パターンが一致するとみなせる評価領域370aの位置を探索する。このときブロック551で評価領域370aの上下方向の位置が画定していれば、左右方向にだけ移動させることができる。
ブロック553で評価領域370aの左右方向の位置が画定していれば、上下方向にだけ移動させることができる。上下方向と左右方向のいずれの位置も画定していればその時点で評価領域370aの位置は画定していることになるためさらに移動させる必要はないが、念のためパターンを評価してもよい。いずれの方向の位置も画定していない場合は、撮影画像300と評価領域370aのカテゴリー領域のパターンが一致するとみなせるまで移動させる。
カテゴリー領域のパターンは、図10(A)の本文領域309bに代表的に示すように、撮影画像300および評価領域370aの対応するカテゴリー領域の名称、位置、縦横サイズ(X×Y)および他のカテゴリー領域との距離Zなどで評価することができる。ブロック515では、カテゴリー領域のパターンが一致するとみなしたときに評価領域370aの位置を画定する。カテゴリー領域のパターンが一致しない場合は、ブロック557で当該検索サイトを破棄して次の検索サイトを評価する。
つづいて図3のブロック219でサイト評価部105は、図6のキーワード・リストを使って、1次URLランキングの高い順番に並んだ各検索サイトに対してキーワード評価をする。サイト評価部105はキーワード評価を、位置を画定した評価領域370aのレンダリング前のHTTPデータまたはレンダリング後のイメージ・データのいずれかに対して行うことができる。イメージ・データに対してキーワード評価をする場合は、サイト特徴抽出部103と同等のOCR技術を利用して評価領域370aの文字認識を行うことができる。
サイト評価部105は一例として、キーワード・リスト250が含むカテゴリー領域に対応する評価領域370aのカテゴリー領域が、キーワード・リスト250のキーワードを含むか否かを判断してヒットしたキーワード数を加算しキーワードの近似度を計算することができる。このとき、ヘッダ領域303およびフッタ領域315のキーワードには他のカテゴリー領域よりも重み付けしてもよい。
ブロック221でサイト評価部105は、キーワード評価の結果、近似度の高い検索サイトから順番に一例として20個のURLを並べた2次URLランキングを生成する。ブロック223でサイト評価部105は図7のイメージ・リスト260を使って2次URLランキングの順位の高い検索サイトから順番にカテゴリー領域のイメージを評価する。イメージ評価では、イメージ・リスト260が含むカテゴリー領域に対応する評価領域370aのカテゴリー領域が、イメージ・リスト260のフィールドごとの特徴データを含むか否かを判断しヒットした特徴データの数を加算してイメージの近似度を計算することができる。
たとえばサイト評価部105は、イメージ・リスト260の中のヘッダ領域の文字色が、黒、赤、白を含む場合に、対応する評価領域370aが含むヘッダ領域の文字色が黒、赤、白を含む場合に合致すると判定し、1つでも一致しない色がある場合は不一致と判定することができる。座標、領域サイズ、文字サイズについては、所定の誤差の範囲であれば一致すると判定することができる。文字数については、完全に一致する場合だけ一致すると判定することができる。
ブロック225でサイト評価部105は、イメージ評価の結果、近似度の高い順番にたとえば10個の検索サイトを並べた3次URLランキングを作成する。ブロック227でサイト評価部105は、3次URLランキングの順位の高い検索サイトから順番にカテゴリー領域の配置パターンの評価をする。配置パターンの評価では、撮影画像300および評価領域370aにおける各カテゴリー領域の配置の近似度を評価する。サイト評価部105は、撮影画像300と評価領域370aの対応するカテゴリー領域に対して、図10(A)にサイズZとして示した他のカテゴリー領域との間隔の差、各カテゴリー領域のコーナー325の座標の差、撮影画像300または評価領域370aの面積に対するカテゴリー領域の合計面積の割合の差、または各カテゴリー領域の色分布の差などを計算して配置パターンの近似度を数値化することができる。
ブロック229でサイト評価部105は、配置パターン評価の結果、近似度の高い順番にたとえば5個の検索サイトを並べた4次URLランキングを作成してHTTPデータとともにサイト・アクセス部109に送る。ブロック231でサイト・アクセス部109は、4次URLランキングの中の最上位に位置する検索サイトを表示するためのHTTPデータをレンダリングして作成したイメージ・データを画像データ出力部107に送る。さらにサイト・アクセス部109は、4次URLランキングが示す2番目以降の検索サイトに関するページタイトルおよび本文などのURLをリンクした簡単な情報をリスト形式で作成して別のタブに表示するためのイメージ・データを画像データ出力部107に送る。
これまでの処理でURLの推定が正確に行われていれば、タッチスクリーン19にはソース・デバイスが表示していた撮影画像300のWebサイトと同一のURLのWebサイトのサイト画像が表示される。本実施の形態では、撮影画像300から抽出したキーワードで検索して得た検索サイトに対して、さらにキーワード評価、イメージ評価、配置パターン評価をすることでURLの推定精度を高めることができる。推定したURLのWebサイトが撮影画像300のWebサイトに一致しない場合は、Webブラウザのタブを切り換えて2番目以降の検索サイトにアクセスすることができる。
ブロック207〜ブロック231の手順は、すべてが本発明の必須の要素ではなく、さらに、その順番も本発明の思想の範囲内で変更してもよい。たとえば、ブロック219のキーワード評価、ブロック223のイメージ評価、およびブロック227の配置パターン評価は必ずしもすべて実行する必要はなくいずれか1つまたは2つでもよい。また、これらの順番を入れ替えることもできる。また、キーワード評価、イメージ評価および配置パターン評価の方法も一例を説明しただけであり、本明細書に基づいて当業者が容易に想起できる範囲の方法はすべて本発明の範囲に含む。
これまで本発明について図面に示した特定の実施の形態をもって説明してきたが、本発明は図面に示した実施の形態に限定されるものではなく、本発明の効果を奏する限り、これまで知られたいかなる構成であっても採用することができることはいうまでもないことである。
10 スマートフォン
100 URL共有システム
250 キーワード・リスト
260 イメージ・リスト
300、301 撮影画像
303 ヘッダ領域
305 ページタイトル領域
307 ナビゲーション領域
309a〜309c 本文領域
311 イメージ領域
313 キャプション領域
315 フッタ領域
321、323、325 コーナー
351 縦スクロール・バー
353 横スクロール・バー
360 サイト画像
380 検索サイト画像
370a〜370c 評価領域

Claims (20)

  1. ネットワーク上のWebサイトにアクセスするために、カメラ・モジュールから画像データを取得することが可能な電子機器に、
    前記Webサイトのサイト画像を撮影した前記カメラ・モジュールから撮影画像を取得するステップと、
    前記撮影画像が含む文字を認識してキーワードを作成するステップと、
    前記キーワードで前記ネットワークを検索して複数の検索サイトを取得するステップと、
    各検索サイトと前記撮影画像の近似度を評価するステップと
    を有する処理をさせるためのコンピュータ・プログラム。
  2. 前記撮影画像と前記検索サイトのそれぞれから文字集合の領域で区分したカテゴリー領域を特定するステップを有し、
    前記近似度を評価するステップが、前記カテゴリー領域に関する近似度を評価するステップを含む請求項1に記載のコンピュータ・プログラム。
  3. 前記カテゴリー領域が、ヘッダ領域、フッタ領域、ナビゲーション領域、本文領域およびキャプション領域からなるグループから選択したいずれか1つまたは複数の要素を含む請求項2に記載のコンピュータ・プログラム。
  4. 前記近似度を評価するステップが前記カテゴリー領域ごとに前記キーワードの近似度を評価するステップを含む請求項2に記載のコンピュータ・プログラム。
  5. 前記近似度を評価するステップが、前記カテゴリー領域のイメージから抽出した特徴データの近似度を評価するステップを含む請求項2に記載のコンピュータ・プログラム。
  6. 前記特徴データが、前記カテゴリー領域の座標、サイズ、背景色、文字数、文字サイズ、および文字色からなるグループから選択したいずれか1つの要素または複数の要素を含む請求項5に記載のコンピュータ・プログラム。
  7. 前記近似度を評価するステップが、
    前記サイト画像における前記撮影画像の位置に対応する前記検索サイトの評価領域を画定するステップと、
    前記撮影画像と前記評価領域の近似度を評価するステップと
    を含む請求項2に記載のコンピュータ・プログラム。
  8. 前記近似度を評価するステップが、前記撮影画像と前記評価領域におけるそれぞれの前記カテゴリー領域の配置パターンの近似度を評価するステップを含む請求項7に記載のコンピュータ・プログラム。
  9. 前記近似度を評価するステップが、前記撮影画像と前記評価領域のそれぞれに基準サイズを設定するステップを含む請求項7に記載のコンピュータ・プログラム。
  10. 前記評価領域を画定するステップが、
    前記撮影画像が含むヘッダ領域、フッタ領域、またはナビゲーション領域の前記撮影画像における位置を特定するステップと、
    前記特定した位置から前記評価領域の位置を画定するステップと
    を含む請求項7に記載のコンピュータ・プログラム。
  11. 前記ヘッダ領域または前記フッタ領域を特定するステップが、縦スクロール・バーの位置を判断するステップを含む請求項10に記載のコンピュータ・プログラム。
  12. 前記ナビゲーション領域を特定するステップが、横スクロール・バーの位置を判断するステップを含む請求項10に記載のコンピュータ・プログラム。
  13. 前記本文領域を特定するステップが、前記カテゴリー領域が含む文字数を計算するステップを含む請求項10に記載のコンピュータ・プログラム。
  14. 第1の電子機器が表示するネットワーク上のWebサイトを第2の電子機器が表示する方法であって、
    前記Webサイトのサイト画像を撮影したカメラ・モジュールから撮影画像を取得するステップと、
    前記撮影画像が含む文字を認識してキーワードを作成するステップと、
    前記キーワードで前記ネットワークを検索して複数の検索サイト画像を取得するステップと、
    各検索サイト画像と前記撮影画像の近似度を評価するステップと、
    前記近似度の高い検索サイト画像を前記第2の電子機器が表示するステップと
    を有する方法。
  15. 前記近似度を評価するステップが、
    前記検索サイト画像に対して前記撮影画像に対応する評価領域を設定するステップと、
    前記撮影画像と前記評価領域の近似度を評価するステップ
    を含む請求項14に記載の方法。
  16. 前記撮影画像と前記評価領域からそれぞれ文字集合の領域を特定するステップを有し、
    前記近似度を評価するステップが、前記文字集合の領域ごとに前記撮影画像から抽出したキーワードと前記評価領域から抽出したキーワードを比較するステップを有する請求項15に記載の方法。
  17. 前記撮影画像と前記評価領域からそれぞれ文字集合の領域を特定するステップを有し、
    前記近似度を評価するステップが、前記撮影画像と前記評価領域のそれぞれの前記文字集合の領域のイメージを比較するステップを有する請求項15に記載の方法。
  18. 前記撮影画像と前記評価領域からそれぞれ文字集合の領域を特定するステップを有し、
    前記近似度を評価するステップが、前記撮影画像と前記評価領域における前記文字集合の領域の配置パターンを比較するステップを有する請求項15に記載の方法。
  19. 前記表示した近似度の高い検索サイト画像よりも近似度が低い前記検索サイトのリストを前記第2の電子機器が表示するステップを有する請求項14に記載の方法。
  20. 他の電子機器が表示したWebサイトを撮影するカメラ・モジュールから画像データを取得することが可能な電子機器であって、
    ネットワークにアクセスすることが可能なネットワーク・デバイスと、
    前記カメラ・モジュールが撮影した撮影画像から作成したキーワードで前記ネットワークを検索し所定数の検索サイトを取得するサイト特徴抽出部と、
    各検索サイトと前記撮影画像の近似度を評価するサイト評価部と、
    ディスプレイに前記近似度の高いWebサイトのイメージ・データを出力する画像データ出力部と
    を有する電子機器。
JP2014010867A 2014-01-24 2014-01-24 Webサイトを共有する方法、電子機器およびコンピュータ・プログラム Active JP5913774B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014010867A JP5913774B2 (ja) 2014-01-24 2014-01-24 Webサイトを共有する方法、電子機器およびコンピュータ・プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014010867A JP5913774B2 (ja) 2014-01-24 2014-01-24 Webサイトを共有する方法、電子機器およびコンピュータ・プログラム

Publications (2)

Publication Number Publication Date
JP2015138479A true JP2015138479A (ja) 2015-07-30
JP5913774B2 JP5913774B2 (ja) 2016-04-27

Family

ID=53769409

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014010867A Active JP5913774B2 (ja) 2014-01-24 2014-01-24 Webサイトを共有する方法、電子機器およびコンピュータ・プログラム

Country Status (1)

Country Link
JP (1) JP5913774B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113760140A (zh) * 2021-08-31 2021-12-07 Oook(北京)教育科技有限责任公司 一种内容显示方法、装置、介质和电子设备

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02201690A (ja) * 1989-01-31 1990-08-09 Fujitsu Ltd 画像認識装置
JPH0877333A (ja) * 1994-09-09 1996-03-22 Toshiba Corp 電子ファイリング装置
JP2004348706A (ja) * 2003-04-30 2004-12-09 Canon Inc 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム
JP2007220093A (ja) * 2006-01-13 2007-08-30 Ricoh Co Ltd ナビゲーションパスの計算方法
JP2008181460A (ja) * 2007-01-26 2008-08-07 Ricoh Co Ltd 文書画像検索装置および文書画像検索方法
JP2011141598A (ja) * 2010-01-05 2011-07-21 Canon Inc 画像処理装置、画像処理方法、及びプログラム
JP2012054721A (ja) * 2010-08-31 2012-03-15 Brother Ind Ltd 通信端末、通信方法および通信プログラム
WO2012042560A1 (ja) * 2010-09-28 2012-04-05 株式会社野村総合研究所 画像取得装置、画像取得方法およびコンピュータプログラム
JP2012243309A (ja) * 2011-05-13 2012-12-10 Fujitsu Ltd キーワードを取得する方法及び装置
JP2013200775A (ja) * 2012-03-26 2013-10-03 Sony Corp 情報処理装置、情報処理方法およびプログラム

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02201690A (ja) * 1989-01-31 1990-08-09 Fujitsu Ltd 画像認識装置
JPH0877333A (ja) * 1994-09-09 1996-03-22 Toshiba Corp 電子ファイリング装置
JP2004348706A (ja) * 2003-04-30 2004-12-09 Canon Inc 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム
JP2007220093A (ja) * 2006-01-13 2007-08-30 Ricoh Co Ltd ナビゲーションパスの計算方法
JP2008181460A (ja) * 2007-01-26 2008-08-07 Ricoh Co Ltd 文書画像検索装置および文書画像検索方法
JP2011141598A (ja) * 2010-01-05 2011-07-21 Canon Inc 画像処理装置、画像処理方法、及びプログラム
JP2012054721A (ja) * 2010-08-31 2012-03-15 Brother Ind Ltd 通信端末、通信方法および通信プログラム
WO2012042560A1 (ja) * 2010-09-28 2012-04-05 株式会社野村総合研究所 画像取得装置、画像取得方法およびコンピュータプログラム
JP2012243309A (ja) * 2011-05-13 2012-12-10 Fujitsu Ltd キーワードを取得する方法及び装置
JP2013200775A (ja) * 2012-03-26 2013-10-03 Sony Corp 情報処理装置、情報処理方法およびプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
武部 浩明、外4名: "文字認識技術を利用した講義動画のスライド同定", 電子情報通信学会論文誌, vol. 第J91−D巻,第9号, JPN6015048568, 1 September 2008 (2008-09-01), JP, pages 2280 - 2292, ISSN: 0003275825 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113760140A (zh) * 2021-08-31 2021-12-07 Oook(北京)教育科技有限责任公司 一种内容显示方法、装置、介质和电子设备
CN113760140B (zh) * 2021-08-31 2023-12-08 Oook(北京)教育科技有限责任公司 一种内容显示方法、装置、介质和电子设备

Also Published As

Publication number Publication date
JP5913774B2 (ja) 2016-04-27

Similar Documents

Publication Publication Date Title
US9489401B1 (en) Methods and systems for object recognition
US9424668B1 (en) Session-based character recognition for document reconstruction
US11461386B2 (en) Visual recognition using user tap locations
US20160328394A1 (en) Presenting translations of text depicted in images
US8244037B2 (en) Image-based data management method and system
US9268987B2 (en) Method of recognizing QR code in image data and apparatus and method for converting QR code in content data into touchable object
US9934206B2 (en) Method and apparatus for extracting web page content
CN108763244B (zh) 在图像内搜索和注释
US20110142344A1 (en) Browsing system, server, and text extracting method
US10152540B2 (en) Linking thumbnail of image to web page
KR20140023677A (ko) 입력기의 종류를 결정하는 단말기 및 방법
TW201501016A (zh) 資料搜尋方法與其電子裝置
JP6419969B2 (ja) 画像の提示情報を提供するための方法及び機器
JP6253354B2 (ja) 帳票読取装置、プログラムおよび帳票読取システム
US20150212988A1 (en) Information display method and program
JP5484113B2 (ja) 文書画像関連情報提供装置、及び文書画像関連情報取得システム
JP2018205978A (ja) 情報抽出装置及び情報抽出方法
CN113869063A (zh) 数据推荐方法、装置、电子设备及存储介质
JP5913774B2 (ja) Webサイトを共有する方法、電子機器およびコンピュータ・プログラム
CN106557537B (zh) 网页图片标签显示方法和装置
KR101592725B1 (ko) 스마트 기기를 기반으로 하는 이미지 링크 어플리케이션 장치
JP2015072533A (ja) 情報処理装置及び情報処理プログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151111

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151208

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160220

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160315

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160402

R150 Certificate of patent or registration of utility model

Ref document number: 5913774

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250